کد خبر: 39679
تاریخ انتشار: یکشنبه, 29 ارديبهشت 1398 - 09:47

داخلی

»

مطالب کتابداری

»

کتابخانه و کتابداری

گزارش بازدید از مرکز مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

منبع : لیزنا
یکشنبه 15 اردیبهشت 1398 گروه علم اطلاعات و دانش­ شناسی دانشگاه قم از مرکز تحقیقات کامپیوتری علوم اسلامی برای درس مقدمات پردازش زبان طبیعی بازدید کرد.
گزارش بازدید از مرکز مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

به گزارش لیزنا، در این بازدید که در محل کنفرانس­های مرکز نور برگزار شد پس از پخش قرآن در قالب کلیپ که کاری از گروه تحقیقات کامپیوتری علوم اسلامی بود؛ مهندس محمد حسن بشری موحد به توضیح کلی کاربرد هوش مصنوعی در پردازش زبان طبیعی در این سازمان پرداخت و در ادامه نیز توضیحاتی در مورد روند کار در سامانه https://ai.inoor.ir/ داده شد.

وی ابتدا  تصریح کرد: مرکز تحقیقات کامپیوتری علوم اسلامی در بیش از بیست سال فعالیت خود، تاکنون توانسته است با دیجیتالی کردن منابع مکتوب، حجم عظیمی از دادگان متنی را فراهم آورد. در مرحله بعد نیز این سازمان به فرآوری و غنی سازی متون پرداخت و سپس با به کارگيری فناوری­هاي رايانه‌ای از قبيل؛ واسط کاربری مطلوب، جستجوی سريع و ديگر قابليت­های لازم، محيط پژوهشی مناسبی را در ارائه محتوای ايجاد کرد. در توضیح بخش­های مختلف در وب سایت گروه پردازش هوشمند نور در ابتدا گفته شده که 2 سرویس "تشخیص موجودیت­های اسمی فارسی و عربی" در بازیابی اطلاعات کمک زیادی کرده است به این صورت که پس از وارد کردن یک متن اسامی مختلف را از نظر اینکه نام شخص است یا سازمان یا مکان با رنگ­های مختلف مشخص می­ کند و حسن آن نیز، این است که اسم­های جدید و ناشناخته را با توجه به سیاق کلمه می­تواند تشخیص دهد.

در این وب سایت سرویس "آیات مرتبط" به گونه ­ای طراحی شده است که با وارد کردن یک عبارت، آیات مرتبط با آن آیه را از بخش­های مختلف قرآن کریم بازیابی می­ کند.

سرویس دیگر "سیستم خلاصه ­ساز" است که جملات و پاراگراف­هایی که نماینده کل متن است را استخراج می ­کند نه اینکه آن را استنتاج کند مثلاً با دادن یک متن طولانی به این بخش می­تواند پاراگرافی را که نماینده کل متن است و در واقع عمده اطلاعات در آن است بازیابی کند.

سرویس دیگر، سرویس "تبدیل تصویر به متن" یا OCR است. این سرویس هم به طور مستقیم و هم، زمانی که کلمه­ ای را در نورمگز جستجو می­ کنیم علاوه بر بازیابی سند، مکان کلمه را هم در آن سند با رنگ زرد نشان می­دهد. به طور معمول تیم­ هایی که در بخش پردازش زبان طبیعی فعالیت می­ کنند از OCR در جهت کاهش هزینه­ ها استفاده می­ کنند.

 در سرویس "تحلیح صرفی کلمات عربی" هنگامی که یک کلمه عربی با اعراب یا حتی بدون اعراب یا با اعراب ناقص به این بخش داده می­شود؛ تمام حالت­هایی که کلمه می ­تواند خوانده و صرف شود را بازیابی می­ کند.

سرویس "برچسب­ گذاری صرفی زبان فارسی" به این صورت است که وقتی متنی را به ماشین دادیم؛ این کلمه را بدون درنظر گرفتن جایگاه آن در جمله صرف می­ کند و اسم و فعل یا حرف بودن آن­را مشخص می ­کند.

در سرویس "ریشه ­یاب کلمات فارسی" با دادن یک کلمه به سیستم،  برنامه قادر است تا ریشه کلمه را مشخص ­کند به عبارتی پیشوند و پسوند کلمه را حذف می­ کند.

سرویس "دسته ­بندی موضوعی متن" به این صورت است که با وارد کردن یک مقاله یا پارگراف موضوع آن را برای فرد مشخص می­کند. در این نسخه سه رده بندی اصلی در زمینه "فقه اسلامی" با 9 کلاس، "متون خبری فارسی" با 7 کلاس و "متون خبری فارسی" با 10 کلاس وجود دارد.

سرویس دیگر سرویس "تصحیص فاصله" است که می­تواند برای غلط­یاب املایی هم کاربرد داشته باشد و در واقع چسبندگی کلمات و نیم فاصله ­ها را اصلاح می­ کند.

سرویس بعد "سرویس آیه یاب در متن" است که با استفاده از آن می توان آیات موجود در یک متن را همراه با ذکر نام سوره و آیه پیدا کرد؛ البته این سرویس بیشتر برای متون عربی کاربرد دارد.

در سرویس "مدل­سازی موضوعی" به کشف ارتباط بین واژه‌ها بر اساس با هم‌آیی در مقالات با هدف ایجاد دسته‌بندی کلمات پرداخته می شود.

در سرویس "مشابه یاب احادیث" می توانید با وارد کردن حدیث مورد نظر، احادیث مشابه آن را دریافت کنید.

"شبکه کلیدواژه ­ها" نیز خروجی آماری از اسناد نورمگز فراهم می‌آورد که کلیدواژه­های دستی و ماشینی را شامل می­شود که اگر شبکه کلیدواژه­ ها کامل باشد منجر به تشکیل دانش جدید می­شود و اگر ناقص باشد نیز در واقع دانشی درباره پیکره حاصل می­ کند.

سرویس دیگر "ابر کلیدواژه ­ها" است که این امکان را فراهم می‌آورد که بر روی دسته‌ای از مقالات که در یک موضوع خاص نوشته شده‌اند؛ تمامی کلیدواژه‌ها را بر اساس تعداد رخداد آن‌ها نمایش داد. همچنین می توان این امکان را به کلیدواژه‌های یک مقاله محدود نمود. این شکل بصری سازی، در یک نگاه سمت و سوی پژوهش در موضوع و یا مجله‌ای خاص را نشان می دهد.

در ادامه بازدید نیز گفت­ وگوهایی در مورد نقش و کاربرد پردازش زبان طبیعی در رشته علم اطلاعات و دانش­ شناسی مطرح شد.

 

گزارش: زهرا نحوی

 

برچسب ها :
خواهشمند است جهت تسهیل ارتباط خود با لیزنا، در هنگام ارسال پیام نکات ذیل را در نظر داشته باشید:
۱. از توهین به افراد، قومیت‌ها و نژاد‌ها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهام‌زنی به دیگران خودداری نمائید.
۲.از آنجا که پیام‌ها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمان‌ها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.
نام:
ایمیل:
* نظر: