پژوهشگران زبان شناسی دانشگاه شیراز برای نخستین بار پیکره ای را برای متون فارسی ایجاد کرده اند که هر روز به صورت خودکار و متوازن به روزرسانی می شود.
به گزارش لیزنا، بر اساس اعلام روابط عمومی دانشگاه شیراز، امیرسعید مولودی، عضو هیئت علمی بخش زبان های خارجی و زبان شناسی دانشگاه شیراز و مدیر پروژه پیکره به روزشونده با بیان اینکه در این پیکره استانداردهایی رعایت شده است که پیش از این در تهیه پیکره های زبان فارسی مغفول مانده بود، گفت: این پیکره و جستجوگر آن ابزار پژوهشی مهمی برای تحقیقات زبان شناسی و سایر حوزه های علوم انسانی است و علاوه بر این برای اهداف پردازشی زبان فارسی نیز می تواند مورد استفاده قرار گیرد. وی افزود: ایده اولیه این طرح حدود دو سال پیش شکل گرفت و پس از انجام مراحل مطالعاتی در سال 1395، پیاده سازی فاز نخست آن با تمرکز بر متون خبری آغاز شد که رونمایی از این پیکره، مطابق برنامه ریزی های انجام گرفته، در هفته پژوهش امسال در آذرماه انجام خواهد شد. مدیر پروژه پیکره به روزشونده با اشاره به این نکته که امروزه از پیکره های زبانی تقریباً در تمامی حوزه های علوم انسانی به طور عام و مطالعات زبانی به طور خاص استفاده می شود، گفت: بحث به روز بودن، توازن و نماینده بودن سه ویژگی مهم برای کارآمدی پیکره های زبانی است که در پروژه حاضر مورد توجه قرار گرفته است؛ بنابراین پیکره حاضر از این حیث که تنوعات زبانی را با انتخاب داده از ژانرهای مختلف پوشش می دهد، داده به میزان مساوی از هر ژانر انتخاب می شود و اینکه هر روز داده های آن افزایش می یابد، به ترتیب برخوردار از سه ویژگی نماینده بودن، توازن و به روزشوندگی است. وی ادامه داد: به روزشونده بودن پیکره حاضر به پژوهشگر این امکان را می دهد که بتواند تغییرات زبانی و حتی فرهنگی-جامعه شناختی را با استفاده از آن بررسی و تحلیل کند. مولودی یادآور شد: در فاز نخست این پروژه، هر روز متون خبری به صورت متوازن از 6 حوزه موضوعی و از خبرگزاری های مختلف به پیکره اضافه می شود. همچنین مرتضی رضایی شریف آبادی، دانشجوی دکتری زبان شناسی دانشگاه شیراز و مسئول فنی پروژه با بیان اینکه مراحل اجرایی کار با همکاری تیمی قوی از مهندسان نرم افزار و با بهره گیری از جدیدترین فناوری ها انجام شده است، گفت: علاوه بر امکان دریافت داده پیکره، علاقه مندان می توانند برای کاوش در پیکره از ابزار جستجوی برخط تهیه شده استفاده کنند. وی افزود: تمام متون پیکره به صورت خودکار نرمال سازی و ریشه یابی می شوند و برچسب اجزای کلام به واژه های آن ها اختصاص می یابد و برای توازن متون در سطح موضوع و زیرموضوع و همچنین توازن زمانی نیز از روشی ابتکاری استفاده شده است. رضایی تصریح کرد: هم اکنون پیکره به روزشونده و ابزار جستجوگر آن به صورت آزمایشی و با دسترسی محدود راه اندازی شده است. بر اساس اعلام روابط عمومی دانشگاه شیراز، یکی از مهمترین گام ها در طراحی و ساخت سیستم های بازشناسی گفتار پیوسته با دایره لغات بزرگ (LVCSR)، تعلیم مدل زبانی (Language Model) برای مدل کردن نحوه توالی کلمات در یک زبان خاص است. برای انجام چنین کاری، داشتن مقادیر بسیار زیادی از دادگان متنی (Text) از آن زبان همراه با برچسب های لازم ضروری است. از طرفی در بسیاری از پروژه های تحقیقاتی در زمینه پردازش زبان طبیعی (Natural Language Processing)، چنین دادگانی مورد نیاز است. پیکره مجموعه ای از پاره های زبانی است که انتخاب و بر اساس معیارهای زبانی روشنی مرتب می شوند به نحوی که همچون نمونه ای از زبان به کار گرفته می شوند. پیکره شامل متن های پیوسته طبیعی است که می توان از آن اطلاعاتی درباره عناصر زبانی، هم واژگانی هم غیرواژگانی (مانند سبک، نقطه گذاری، دستور، گونه کاربردی) به دست آورد. کشف واژه هایی خاص یا کاربردهایی خاص از آنها در پیکره ای از متن های معتبر که متخصصان هر زمینه موضوعی آن را نوشته اند، بسیار ارزشمند است زیرا نشان می دهد اگرچه همه واژه ها در فرهنگ های لغت ظاهر می شوند، در بافت هایی خاص نمی توان از آنها استفاده کرد، حتی اگر جمله به لحاظ دستوری درست باشد.
ایجاد نخستین پیکره به روزشونده در زبان فارسی توسط محققان دانشگاهی
ایجاد نخستین پیکره به روزشونده در زبان فارسی توسط محققان دانشگاهی
summary-address :
latest News
On the occasion of the New Year, I extend my sincere greetings and best wishes to all faculty members, students, staff, alumni, and academic partners of Shiraz University. With appreciation for the efforts and achievements of the university community...
The commemoration ceremony and awarding of the first Qotb al-Din Shirazi Scientific reward in the field of astronomy and astrophysics was held on the second day of the National Astronomy and Astrophysics Conference, hosted by Shiraz University. This...
For the first time in the country, the Astronomy Entrepreneurs Exhibition was hosted at Shiraz University. According to the public relations office of Shiraz University, the exhibition coincided with the 18th National Astronomy and Astrophysics...
During the second meeting of the "Iran-Iraq Science Week," cooperation agreements were signed between Shiraz University and various Iraqi universities. According to the public relations office of Shiraz University, during the second "Iran-Iraq...
Dr. Zahra Riahi-Zamin, a Persian Language and Literature professor at Shiraz University, has been awarded the fourth Biennial Book Award of Fars. According to the Public Relations Office of Shiraz University, the awards ceremony took place on...
The National Award for Women in Science of Iran (In Honor of Professor Afsaneh Safavi) has been unveiled. According to the Public Relations Office of Shiraz University, during the closing ceremony of Research and Technology Week, held on the evening...
Launching of the Second International Conference on Artificial Intelligence and Software Engineering
The Second International Conference on Artificial Intelligence and Software Engineering officially commenced on Tuesday, December 25, at Shiraz University. It intends to enhance practical and theoretical knowledge and facilitate information exchange...
Dr. Seyyed Hamed Rastgar, a faculty member in the Telecommunications and Electronics Engineering Department at Shiraz University, was the representative of the Islamic Republic of Iran at the BRICS Young Scientists meeting. According to the Public...
According to the public relations office of Shiraz University, citing the Scientometrics Office of the Research and Technology Department of the university, based on a report by the Institute for Scientific and Technological Research of the Islamic...
Shiraz University has signed cooperation agreements with the University of Zaragoza in Spain and the National Research Council of Italy (CNR IRPI) aimed at enhancing scientific, research, and technological collaboration. According to the Public...
Dr. Mehrdad Niakosari, the professor of the Department of Food Science and Technology at Shiraz University, has been recognized as a national outstanding researcher. According to the public relations office of Shiraz University, at the 25th Festival...
According to the public relations office of Shiraz University, a graduation celebration for 500 international students from across the country was held at Shiraz University. Approximately 500 international students from various academic...