gpt2-persian-qa / README.md
m3hrdadfi's picture
Update README.md
b7ce36e
metadata
language: fa
datasets:
  - persian_qa
  - parsinlu_reading_comprehension
tags:
  - text-generation
widget:
  - text: >-
      قرارداد کرسنت قراردادی برای فروش روزانه معادل 500 میلیون فوت مکعب، گاز ترش
      میدان سلمان است، که در سال 1381 و در زمان وزارت بیژن نامدار زنگنه در دولت
      هفتم مابین شرکت کرسنت پترولیوم و شرکت ملی نفت ایران منعقد گردید. مذاکرات
      اولیه این قرارداد از سال 1997 آغاز شد و در نهایت، سال 2001 ( 1381 ) به
      امضای این تفاهم نامه مشترک انجامید. بر اساس مفاد این قرارداد، مقرر شده بود
      که از سال 2005 با احداث خط لوله در خلیج فارس، گاز فرآورده نشده میدان سلمان
      (مخزن مشترک با ابوظبی)، به میزان روزانه 500 میلیون فوت مکعب (به قول برخی
      منابع 600 میلیون فوت مکعب) به امارات صادر شود. این قرارداد مطابق قوانین
      داخلی ایران بسته شده‌و تنها قرارداد نفتی ایران است که از طرف مقابل خود،
      تضمین گرفته‌است. اجرای این پروژه در سال 1384 با دلایل ارایه شده از سوی
      دیوان محاسبات ایران از جمله تغییر نیافتن بهای گاز صادراتی و ثابت ماندن آن
      در هفت سال اول اجرای قرارداد متوقف شد. این در حالی است که طبق تعریف حقوقی،
      دیوان محاسبات ایران، حق دخالت در قراردادها، پیش از آنکه قراردادها اجرایی و
      مالی شوند را ندارد. پرسش: طرفین قرار داد کرسنت کیا بودن؟ پاسخ:
  - text: >-
      ناف جایی قرار گرفته که در واقع بندناف در داخل رحم در آنجا به شکم جنین وصل
      بوده‌است. بندناف که جفت را به جنین متصل کرده بعد از تولد از نوزاد جدا
      می‌شود. برای جدا کردن بند ناف از دو پنس استفاده می‌کنند و بین آن دو را
      میبرند. پنس دیگری نزدیک شکم نوزاد قرار داده می‌شود که بعد از دو روز
      برداشته خواهد شد. بندناف باقی‌مانده طی 15 روز خشک شده و می‌افتد و به جای
      آن اسکاری طبیعی به جای میماند. البته بر خلاف تصور عامه مردم شکل ناف در اثر
      بریدن بند ناف به وجود نمی‌آید و پیش از این در شکم مادر حالت ناف شکل
      گرفته‌است. شکل ناف در میان مردم مختلف متفاوت است و اندازه آن بین 1 ٫ 5 تا
      2 سانتی‌متر است. تمام پستانداران جفت‌زیست ناف دارند. ناف در انسان‌ها به
      سادگی قابل مشاهده‌است. پرسش: بند ناف انسان به کجا وصل است؟ پاسخ:
  - text: >-
      بیش از ده هزار سال است که انسان‌ها در قاره آمریکا زندگی می‌کنند. قاره
      آمریکا توسط کریستف کلمب و در سال 1492 کشف شد اما او به اشتباه فکر کرد که
      آنجا هندوستان است اما مدت‌ها بعد آمریگو وسپوچی اعلام کرد که این قاره جدیدی
      است. اما تاریخ آمریکا به عنوان یک کشور مستقل به سال 1783 میلادی بازمی‌گردد
      که در آن آمریکا بر طبق معاهده پاریس به رسمیت شناخته گردید. پرسش: قاره
      آمریکا در چه سالی کشف شد؟ پاسخ:
  - text: >-
      الکترونیک آرتز یا به‌طور مختصر ای‌ای شرکتی آمریکایی است که از بزرگترین
      شرکت‌های تولید و توزیع بازی‌های رایانه‌ای به‌شمار می‌آید. تریپ هاوکینگز
      این شرکت را در سال 1982 ت سیس کرد و هدف اولیه او تولید انواعی از بازی‌های
      رایانه‌ای بود که در خانه می‌توان با آن‌ها بازی کرد. ای‌ای در اواخر دهه 80
      به بهبود و توسعه حوزه کاری خود در زمینه بازی‌های رایانه‌ای پرداخت و با جذب
      چندین چهره مبتکر، موفق به رشد و توسعه بسیار در این زمینه شد. شرکت ای‌ای در
      سال 2007 رتبه هشتم در فهرست بزرگترین شرکت‌های طراحی نرم‌افزار را به خود
      اختصاص داد. درآمد سالانه شرکت ای‌ای در مه 2008 به بیش از 4 ٫ 02 میلیارد
      دلار رسید و این مقدار، رو به افزایش است. موفق‌ترین بازی‌های ای‌ای،
      بازی‌های ورزشی (که توسط بخش ای‌ای اسپورتز، وابسته به این شرکت تولید
      می‌شود)، بازی‌های برگرفته از فیلم‌های محبوب و البته بازی‌های معروفی است که
      این شرکت همواره به ساختن آن‌ها مشغول بوده‌است از جمله این بازی‌ها می‌توان
      به بازی‌هایی مانند نید فور اسپید، مدال افتخار، سیمز، بتل فیلد و برن اوت
      اشاره کرد. یک نکته حایز اهمیت در مورد این شرکت این است که در جمع 5 شرکت
      منفور دنیا قرار دارد. پرسش: بازی‌های سبک ورزشی شرکت الکترونیک آرتز توسط
      کدوم قسمت ساخته می‌شه؟ پاسخ:
  - text: >-
      کویر یا نمک زار منطقه‌ای است که به دلیل موقعیت جغرافیایی (معمولا ختم
      رودخانه‌ها در آن) و حرارت شدید آفتاب به نمک‌زار بدل شده باشد. برخی کویرها
      قبلا دریاچه یا دریاهایی بوده‌اند که در اثر تبخیر آب از آن‌ها به نمک‌زار
      بدل شده‌اند. کویر مرکزی ایران که دشت کویر نامیده می‌شود، درون خود تعداد
      زیادی کویر کوچک‌تر، مانند کویر درانجیر، کویر ساغند، کویر بند ریگ را جا
      داده‌است. با وجود این‌که در بین عامه مردم رایج است که اصطلاح 'کویر' و
      'بیابان' را به‌جای یکدیگر به‌کار می‌برند ولی بین این دو اصطلاح تفاوت اساسی
      وجود دارد. بیابان به بخشی از مناطق خشک گفته می‌شود که بارندگی سالانه آن
      کمتر از 50 میلی‌متر است و ممکن است چند سال در آن باران نبارد و با کم‌آبی و
      تبخیر شدید مواجه است و پوشش گیاهی آن بسیار ضعیف است. اما کویر به زمین‌های
      رسی پف‌کرده، با شوری و نمک بسیار شدید گفته می‌شود که گیاهان نمی‌توانند در
      آن رشد نمایند. در بعضی از کویرها که شوری خاک کمتر است، ممکن است گیاهانی
      مانند گز که دربرابر املاح نمکی مقاوم است، در آن رشد نماید. پرسش: بافت
      گیاهی در کویر چگونه است؟ پاسخ:
  - text: >-
      قطب‌نما وسیله‌ای برای تعیین جهت (جهت‌یابی) است. این وسیله با استفاده از
      میدان مغناطیسی زمین جهت قطب شمال را نشان می‌دهد که در حقیقت شمال مغناطیسی
      زمین است که با شمال حقیقی مقداری فاصله دارد. زاویه بین شمال حقیقی و شمال
      مغناطیسی، میل مغناطیسی نامیده می‌شود. امروزه برای تعیین شمال حقیقی از
      قطب‌نماهای پیشرفته‌تری مانند قطب‌نمای ژیروسکوپی استفاده می‌شود. قطب‌نمایی
      که از یک آهنربا ساخته شده یعنی قطب‌نمای مغناطیسی جهت را نشان می‌دهد زیرا
      زمین چون آهنربای بزرگی عمل می‌کند. نیروی آهنربایی زمین قطب‌نما یا سوزن
      مغناطیسی را به سوی شمال و جنوب می‌کشد. کسی نمی‌داند که چه کسی اول بار
      قطب‌نما را ساخت. برخی گمان می‌کنند که چینیان نخستین بار قطب‌نما را ساختند
      برخی دیگر می‌گویند که قطب‌نما در ایتالیا اختراع شده‌است. بعضی از نخستین
      قطب‌نماها تکه‌های اکسید مغناطیسی آهن بوده‌اند که بر قطعات چوبی یا چوب‌پنبه
      قرار داشتند و در یک ظرف آب شناور بودند. اکسید مغناطیسی آهن نوعی کانی آهن
      است یک نام دیگر آن ماگنتیت است. تکه‌های ماگنتیت آهنرباهای طبیعی هستند. پس
      از آن مردم ساختن آهن‌ربا از فولاد را یادگرفتند و توانستند قطب‌نماهای بهتری
      بسازند. پرسش: اکسید مغناطیسی آهن چیه؟ پاسخ:
  - text: >-
      لاستیک طبیعی که لاستیک هندی یا کایوچو نیز نامیده می‌شود، قدیمی‌ترین
      الاستومر تجاری است که از لاتکس ساخته می‌شود. لاتکس ترشحات داخلی یک درخت
      گرمسیری به نام درخت لاستیک است. لاتکس در شکل خام خود، نوعی چسب بسیار خوب
      است و می‌توان با انحلال آن در حلال‌های مناسب، چسب‌های مختلفی تولید کرد.
      لاتکس در ابتدای تولید، از پلیمرهایی از ترکیب آلی ایزوپرین با ناخالصی‌های
      جزیی از سایر ترکیبات آلی، به علاوه آب تشکل شده‌است. تایلند، مالزی و
      اندونزی کشورهای پیشرو در تولید لاستیک هستند. انواع پلی ایزوپرین که به
      عنوان لاستیک‌های طبیعی استفاده می‌شوند، در دسته الاستومرها طبقه‌بندی
      می‌شوند. اولین استفاده از لاستیک توسط فرهنگ‌های بومی آمریکای میانه انجام
      شد. آنها از این لاستیک برای ساخت توپ بازی استفاده می‌کردند. بعدها لاستیک
      توسط فرهنگ‌های مایا و آزتک مورد استفاده قرار گرفت. آزتک‌ها علاوه بر ساخت
      توپ، از لاستیک برای اهداف دیگری مانند ساخت ظروف و ضدآب ساختن منسوجات از
      طریق اشباع آنها با شیره لاتکس استفاده می‌کردند. پرسش: آمریکای میانه در
      ابتدا از لاستیک برای تولید چی استفاده می‌کرد؟ پاسخ:
  - text: >-
      آتیلا ( 405 453 میلادی) یکی از رهبران قوم هون بود که بزرگ‌ترین امپراتوری
      را در اروپا، از رود اورال تا دانوب تشکیل داد. در زمان فرمانروایی، وی یکی
      از مخوف‌ترین دشمنان امپراتوری‌های روم غربی و شرقی بود. رومیان به او لقب
      تازیانه خداوند داده بودندو به او باج می‌دادند تا کاری به کار رم نداشته
      باشد. آتیلا در آغاز به ایران حمله کرد و با شکست مواجه شد. حمله‌ای که او در
      سال 441 میلادی به امپراتوری بیزانس کرد باعث شد تا تصمیم به حملات بیشتری به
      سوی غرب بگیرد. وی در اروپا شهرهای بسیاری را نابود و غارت کرد.سرانجام، در
      نبرد دشت کاتالانی‌ها، در مقابل فلاویوس آییتیوس شکست خورد. در این جنگ،
      رومی‌ها و آلانی‌ها به مصاف با هون‌ها رفتند.هون‌ها در ناحیه بین رود ولگا و
      دشت‌های مجارستان می‌زیستند، از آغاز سده پنجم به تاخت و تازهای فراوان و
      پرسودی در حوالی رود دانوب دست زدند، بنابراین، در حدود 445 تا 440 میلادی،
      دربار آتیلا به تجمل و زیبایی آراسته بود، شماره اسیرانی که می‌گرفتند بسیار
      بود، هر دو زبان یونانی و لاتین در دربار تکلم می‌شد، و دبیران رومی‌تبار
      رویدادهای خارجی را همواره به آگاهی خان می‌رساندند، آتیلا، زرد رنگتر از
      بیشتر افراد قومش بود، پرسش: رومی‌ها چه لقبی به اتیلا داده بودند؟ پاسخ:
  - text: >-
      ماده سوختنی ماده‌ای است که در اثر تغییرات (معمولا شیمیایی) تولید انرژی
      مفید می‌کند که بعدا می‌تواند تبدیل به انرژی مکانیکی شود. این تغییرات
      معمولا با سوختن (یعنی ترکیب با اکسیژن) همراه است. فرایندهای مورد استفاده
      برای تبدیل سوخت به انرژی عبارتند از: واکنش‌های شیمیایی مختلف و گرمازا،
      واکنش‌های هسته‌ای مانند شکافت هسته‌ای یا گداخت هسته‌ای. هیدروکربن‌ها تا حد
      زیادی شایع‌ترین منبع سوخت مورد استفاده توسط انسان است، اما در بسیاری از
      موارد فلزات رادیو اکتیو نیز استفاده می‌شوند. اولین استفاده از سوخت توسط
      بشر ، احتراق و سوزاندن تکه‌های چوب در حدود 2 میلیون سال پیش توسط انسان
      راست قامت بود . به صورت کلی در طول تاریخ زندگی بشر که تا به حال با آن آشنا
      شده‌ایم ، تنها سوخت هایی که بیشترین استفاده را داشته است از گیاهان و یا
      چربی حیوانات بدست می‌آمده است و مورد استفاده انسان قرار گرفته است .
      انسان‌ها از 6000 سال قبل از میلاد مسیح برای ذوب آهن از زغال چوب و مشتقات
      چوب استفاده میکردند. بعد‌ها این سوخت‌ها جای خودشان را با کک عوض کردند . به
      دلیل اینکه در حوالی قرن 18 جنگل‌های اروپا در حال نابودی بودند. پرسش: سوخت
      چجوری انرژی قابل استفاده تولید می‌کنه؟ پاسخ:
  - text: >-
      ژرمن شپرد یا سگ چوپان آلمانی یکی از نژادهای سگ است. سگ چوپان آلمانی یکی از
      نژادهای اصیل آلمانی است که برای نخستین بار در سال 1899 ثبت گردید. سگی
      باهوش، شجاع و مناسب برای کارهای مختلف از جمله گله داری، نگهبانی، راهنمای
      نابینایان، همراه خانواده، و جستجو و نجات است. قد استاندارد تا جدوگاه در
      نرها 60 تا 65 سانتی‌متر و در ماده‌ها 55 تا 60 سانتی‌متر است. طول عمر از 9
      تا 13 سال است. این نژاد را اکثر افراد به دلیل استفاده در فیلم‌هایی نظیر
      رکس می‌شناسند و همچنین این سگ حضور موثری در صحنه‌های امدادی دارد. در
      خاورمیانه دسته‌هایی از شپردهای پلاس فراوان هستند اما نژاد ژرمن شپرد بیشتر
      در اروپا زندگی دیده شده‌است. مهمترین ویژگی در این نژاد رفتارهای اشرافی،
      شهامت و توانایی آموختن رفتارها و فعالیت‌های اختصاصی است. نخستین ویژگی یک
      جرمن شپرد خوب، قدرت، چالاکی، عضلات مناسب و هوشیاری است. رنگ در سگهای ژرمن
      شپرد متفاوت است و تقریبا اکثر رنگها قابل قبول هستند. با این وجود رنگهای
      خیلی کم رنگ یا سفید یک دست قابل قبول نمی‌باشد. پرسش: عمر سگ ژرمن شپرد چند
      ساله؟ پاسخ:

GPT2 QA - Persian

It is a new approach to using GPT2 in other downstream NLP tasks like QA. The model was trained on PersianQA and evaluated on PersianQA and PersiNLU (Reading Comprehension).

Dataset

Evaluation

The following table summarizes the scores obtained by the model.

Dataset F1 Score (%) Exact Match (%) Total (#)
ParsNLU 46.95 20.39 564
PersianQA 45.93 23.19 651

Demo

Streamlit GPT2 QA - Persian

How to use

TODO (will be filled shortly)...