کد خبر: 48249
تاریخ انتشار: سه شنبه, 19 دی 1402 - 09:54

داخلی

»

مقاله های روز

علم داده و علم اطلاعات دو رشته ای هستند که مشترکات زیادی دارند

منبع : لیزنا
علم داده و علم اطلاعات ذاتأ رشته های دوقلو هستند. ماهیت و وظیفه علم داده با علم اطلاعات نه تنها سازگار است، بلکه تا حدود زیادی نیز بایکدیگر همپوشانی دارند.
علم داده و علم اطلاعات دو رشته ای هستند که مشترکات زیادی دارند

دکتر جعفر مهراد استاد پیشکسوت دانشگاه شیراز و موسس ISC در یک گفتگوی اختصاصی با خبرنگار لیزنا گفت: علم داده رشته ای نسبتا جدید است که اخیرا توجه  زیادی را به خود جلب کرده است. این رشته، به طیف گسترده‌ای از دانش و مهارت ها از رشته های مختلف از جمله ریاضیات و آمار، علوم کامپیوتر و علم اطلاعات نیاز دارد.

دکتر مهراد گفت: از این منظر، علم داده و علم اطلاعات دو رشته ای هستند که مشترکات زیادی دارند. علم داده و علم اطلاعات ذاتأ رشته های دوقلو هستند. ماهیت و وظیفه علم داده با علم اطلاعات نه تنها سازگار است، بلکه تا حدود زیادی نیز بایکدیگر همپوشانی دارند.

وی تصریح کرد: علم داده با بهبود مدیریت اطلاعات و خدمات کاربر نقش مهمی در علم اطلاعات و دانش شناسی ایفا می کند. برای روشن شدن بیشتر، به مثال های زیر توجه کنید: 

١- توسعه مجموعه: 

علم داده به تجزبه و تحلیل اولویت های کاربر، الگوهای گردش کار و موضوعات در حال ظهور برای افزایش راهبردهای توسعه مجموعه کمک می کند.

٢- تجزیه و تحلیل رفتار کاربر:

درک چگونگی تعامل کاربران با منابع کتابخانه از طریق تجزیه و تحلیل داده‌ها می تواند به پیشرفت در دسترسی به اطلاعات و تجربه کاربر منجر شود.

٣- تجزیه و تحلیل پیش بینی: 

مدل های پیش بینی، از داده های گذشته برای پیش بینی تقاضا های مربوط به منابع آینده استفاده می کند و کتابخانه ها را قادر می ساد تا تخصیص منابع را بهینه سازی کنند.

۴- فهرست نویسی و رده بندی:

 سیستم های رده بندی خودکار و ابزارهای غنی سازی ابرداده، از علم داده برای بهبود دقت و کارایی فرایند فهرست نویسی استفاده می کنند.

۵- سیستم های توصیه گر:

همانند پلاتفرم های تجاری، کتابخانه ها می توانند از الگوریتم های توصیه گر برای پیشنهاد منابع «مربوط و مناسب»، براساس اولویت های کاربر و داده های تاریخی استفاده کنند.

۶- حفاظت دیجیتال: 

برای اطمینان از دسترسی طولانی مدت و یکپارچگی مجموعه های دیجیتال، علم داده در توسعه راهبردهای حفاظت دیجیتال نقش مهمی ایفا می کند.

٧- تجزیه و تحلیل داده‌ها: تجزیه و تحلیل داده‌ها در مورد استفاده از منابع به کتابخانه ها کمک می کند تا مواد عامه پسند را شناسایی و تاثیر «تهیه و فراهم آوری» را ارزیابی نموده و آنگاه در تخصیص منابع تصمیمات آگاهانه بگیرند.

٨- بازیابی اطلاعات:

الگوریتم های جستجوی پیشرفته و تکنیک های پردازش زبان طبیعی، سیستم های بازیابی اطلاعات را برای پیدا کردن مدارک «مربوط و مناسب»  کاربر ارتقاء می بخشند. 

موسسISC افزود: رابطه علم داده و بازیابی اطلاعات را بیشتر توضیح می دهم، هر چند که ارایه توضیح درباره بقیه موارد بالا نیز امکان پذیر است:

٨-١ الگوریتم های رتبه‌بندی ربط:

علم داده در توسعه و پالایش الگوریتم هایی که «ربط»  مدرک را با پرس و جو های کاربر تعیین می کنند بسیار مهم است. مدلهای یادگیری ماشین مانند الگوریتم های رتبه‌بندی، مجموعه داده های بزرگ تعاملات کاربر را برای یادگیری و بهبود رتبه بندی نتایج جستجو براساس «ربط» تجزیه و تحلیل می‌کند.

٨-٢ گسترش پرس و جو و بهینه سازی:

تکنیک های علم داده از جمله پردازش زبان طبیعی به گسترش و اصلاح پرس و جو های کاربر به منظور بهبود «مانعیت» و «جامعیت» نتایج جستجو کمک می کند. علاوه براین، رفتار اطلاع یابی کاربر و ابزارهای بازخورد نیز  در بهینه سازی درک پرس و جو و پیشنهادات مورد تجزیه و تحلیل قرار می گیرد.

٨-٣ شخصی سازی:

علم داده امکان ایجاد تجربیات جستجوی شخصی سازی شده را با تجزیه و تحلیل اولویت های کاربر و تعاملات تاریخی فراهم می کند. سیستم های توصیه گر شخصی سازی شده، «ربط»  نتایج جستجوی متناسب با کاربران انفرادی را افزایش می دهد.

٨-۴ تجزیه و تحلیل رفتار اطلاع یابی کاربر:

تجزیه و تحلیل تعاملات کاربر با رابط های جستجو بینش هایی را در مورد رفتار کاربر فراهم می آورد و امکان بهبود مستمر در طراحی و عملکرد سیستم های جستجو را عملی می سازد. تجزیه و تحلیل جلسه که روشی قدرتمند برای بهبود فرآیند های فعال سازی است و سیاهه های مربوط به پرس و جو، منبع داده ارزشمندی برای درک اولویت های کاربر بحساب می آید.

٨-۵ جستجوی معنایی: 

پردازش زبان طبیعی و تجزیه و تحلیل معنایی به درک زمینه و معنای پرس و جو کمک می کند و موجبات بازیابی دقیق تر اطلاعات را فراهم می آورد. هدف جستجوی معنایی درک زمینه و نیاز کاربران برای ارابه نتایج مناسب تر است.

٨-۶ معیارهای ارزیابی: 

از علم داده برای تعریف و اصلاح معیارهای مورد استفاده برای ارزیابی عملکرد سیستم های بازیابی اطلاعات استفاده می شود. معیار هایی مانند «مانعیت» و «جامعیت» و نمره F1 برای ارزیابی اثربخشی الگوریتم های جستجو تجزیه و تحلیل می شوند.

٨-٧ نمایه سازی و سازمان اطلاعات:

از تکنیک های علم داده در بهینه سازی فرآیند نمایه سازی و اطمینان از ذخیره سازی کارآمد و بازیابی اطلاعات اثربخش استفاده می شود. روش های نمایه سازی پیشرفته مانند نمایه سازی معنایی پنهان به بهبود سازماندهی و بازیابی اطلاعات کمک می کند.

٨-٨ تضمین کیفیت:

از علم داده برای شناسایی و اصلاح سوگیری ها، خطا ها و تناقضات در نتایج جستجو، اطمینان از کیفیت و اعتبار سیستم های بازیابی اطلاعات استفاده می شود. نظارت مداوم و تجزیه و تحلیل عملکرد سیستم به پیشرفت و بهبود مستمر کمک می کند.

 در پایان، بنیانگذار مرکز سابق منطقه ای اطلاع رسانی علوم و فناوری خاطر نشان ساخت: استفاده از علم داده در بازیابی اطلاعات شامل طیف گسترده‌ای از تکنیک ها و روش ها است که هدف همه آن ها ارایه نتایج دقیق تر، مرتبط تر و شخصی تر به کاربران است. 

وی به این موضوع تاکید کرد و گفت: توجه داشته باشیم که علم داده یکی از بهترین بازار های کار را در تمام رشته ها دارد. تقریبا تمامی بخش های عمومی و خصوصی در ایران و جهان به این حوزه نیاز دارند. علم داده بازار کار بسیار خوبی دارد و گروه های آموزشی علم اطلاعات و دانش شناسی نباید از آن غفلت کنند.