داخلی
»مطالب کتابداری
»کتابخانه و کتابداری
گزارش بازدید از مرکز مرکز تحقیقات کامپیوتری علوم اسلامی (نور)
به گزارش لیزنا، در این بازدید که در محل کنفرانسهای مرکز نور برگزار شد پس از پخش قرآن در قالب کلیپ که کاری از گروه تحقیقات کامپیوتری علوم اسلامی بود؛ مهندس محمد حسن بشری موحد به توضیح کلی کاربرد هوش مصنوعی در پردازش زبان طبیعی در این سازمان پرداخت و در ادامه نیز توضیحاتی در مورد روند کار در سامانه https://ai.inoor.ir/ داده شد.
وی ابتدا تصریح کرد: مرکز تحقیقات کامپیوتری علوم اسلامی در بیش از بیست سال فعالیت خود، تاکنون توانسته است با دیجیتالی کردن منابع مکتوب، حجم عظیمی از دادگان متنی را فراهم آورد. در مرحله بعد نیز این سازمان به فرآوری و غنی سازی متون پرداخت و سپس با به کارگيری فناوریهاي رايانهای از قبيل؛ واسط کاربری مطلوب، جستجوی سريع و ديگر قابليتهای لازم، محيط پژوهشی مناسبی را در ارائه محتوای ايجاد کرد. در توضیح بخشهای مختلف در وب سایت گروه پردازش هوشمند نور در ابتدا گفته شده که 2 سرویس "تشخیص موجودیتهای اسمی فارسی و عربی" در بازیابی اطلاعات کمک زیادی کرده است به این صورت که پس از وارد کردن یک متن اسامی مختلف را از نظر اینکه نام شخص است یا سازمان یا مکان با رنگهای مختلف مشخص می کند و حسن آن نیز، این است که اسمهای جدید و ناشناخته را با توجه به سیاق کلمه میتواند تشخیص دهد.
در این وب سایت سرویس "آیات مرتبط" به گونه ای طراحی شده است که با وارد کردن یک عبارت، آیات مرتبط با آن آیه را از بخشهای مختلف قرآن کریم بازیابی می کند.
سرویس دیگر "سیستم خلاصه ساز" است که جملات و پاراگرافهایی که نماینده کل متن است را استخراج می کند نه اینکه آن را استنتاج کند مثلاً با دادن یک متن طولانی به این بخش میتواند پاراگرافی را که نماینده کل متن است و در واقع عمده اطلاعات در آن است بازیابی کند.
سرویس دیگر، سرویس "تبدیل تصویر به متن" یا OCR است. این سرویس هم به طور مستقیم و هم، زمانی که کلمه ای را در نورمگز جستجو می کنیم علاوه بر بازیابی سند، مکان کلمه را هم در آن سند با رنگ زرد نشان میدهد. به طور معمول تیم هایی که در بخش پردازش زبان طبیعی فعالیت می کنند از OCR در جهت کاهش هزینه ها استفاده می کنند.
در سرویس "تحلیح صرفی کلمات عربی" هنگامی که یک کلمه عربی با اعراب یا حتی بدون اعراب یا با اعراب ناقص به این بخش داده میشود؛ تمام حالتهایی که کلمه می تواند خوانده و صرف شود را بازیابی می کند.
سرویس "برچسب گذاری صرفی زبان فارسی" به این صورت است که وقتی متنی را به ماشین دادیم؛ این کلمه را بدون درنظر گرفتن جایگاه آن در جمله صرف می کند و اسم و فعل یا حرف بودن آنرا مشخص می کند.
در سرویس "ریشه یاب کلمات فارسی" با دادن یک کلمه به سیستم، برنامه قادر است تا ریشه کلمه را مشخص کند به عبارتی پیشوند و پسوند کلمه را حذف می کند.
سرویس "دسته بندی موضوعی متن" به این صورت است که با وارد کردن یک مقاله یا پارگراف موضوع آن را برای فرد مشخص میکند. در این نسخه سه رده بندی اصلی در زمینه "فقه اسلامی" با 9 کلاس، "متون خبری فارسی" با 7 کلاس و "متون خبری فارسی" با 10 کلاس وجود دارد.
سرویس دیگر سرویس "تصحیص فاصله" است که میتواند برای غلطیاب املایی هم کاربرد داشته باشد و در واقع چسبندگی کلمات و نیم فاصله ها را اصلاح می کند.
سرویس بعد "سرویس آیه یاب در متن" است که با استفاده از آن می توان آیات موجود در یک متن را همراه با ذکر نام سوره و آیه پیدا کرد؛ البته این سرویس بیشتر برای متون عربی کاربرد دارد.
در سرویس "مدلسازی موضوعی" به کشف ارتباط بین واژهها بر اساس با همآیی در مقالات با هدف ایجاد دستهبندی کلمات پرداخته می شود.
در سرویس "مشابه یاب احادیث" می توانید با وارد کردن حدیث مورد نظر، احادیث مشابه آن را دریافت کنید.
"شبکه کلیدواژه ها" نیز خروجی آماری از اسناد نورمگز فراهم میآورد که کلیدواژههای دستی و ماشینی را شامل میشود که اگر شبکه کلیدواژه ها کامل باشد منجر به تشکیل دانش جدید میشود و اگر ناقص باشد نیز در واقع دانشی درباره پیکره حاصل می کند.
سرویس دیگر "ابر کلیدواژه ها" است که این امکان را فراهم میآورد که بر روی دستهای از مقالات که در یک موضوع خاص نوشته شدهاند؛ تمامی کلیدواژهها را بر اساس تعداد رخداد آنها نمایش داد. همچنین می توان این امکان را به کلیدواژههای یک مقاله محدود نمود. این شکل بصری سازی، در یک نگاه سمت و سوی پژوهش در موضوع و یا مجلهای خاص را نشان می دهد.
در ادامه بازدید نیز گفت وگوهایی در مورد نقش و کاربرد پردازش زبان طبیعی در رشته علم اطلاعات و دانش شناسی مطرح شد.
گزارش: زهرا نحوی
۱. از توهین به افراد، قومیتها و نژادها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهامزنی به دیگران خودداری نمائید.
۲.از آنجا که پیامها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمانها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.