داخلی
»مقاله های روز
علم داده و علم اطلاعات دو رشته ای هستند که مشترکات زیادی دارند
دکتر جعفر مهراد استاد پیشکسوت دانشگاه شیراز و موسس ISC در یک گفتگوی اختصاصی با خبرنگار لیزنا گفت: علم داده رشته ای نسبتا جدید است که اخیرا توجه زیادی را به خود جلب کرده است. این رشته، به طیف گستردهای از دانش و مهارت ها از رشته های مختلف از جمله ریاضیات و آمار، علوم کامپیوتر و علم اطلاعات نیاز دارد.
دکتر مهراد گفت: از این منظر، علم داده و علم اطلاعات دو رشته ای هستند که مشترکات زیادی دارند. علم داده و علم اطلاعات ذاتأ رشته های دوقلو هستند. ماهیت و وظیفه علم داده با علم اطلاعات نه تنها سازگار است، بلکه تا حدود زیادی نیز بایکدیگر همپوشانی دارند.
وی تصریح کرد: علم داده با بهبود مدیریت اطلاعات و خدمات کاربر نقش مهمی در علم اطلاعات و دانش شناسی ایفا می کند. برای روشن شدن بیشتر، به مثال های زیر توجه کنید:
١- توسعه مجموعه:
علم داده به تجزبه و تحلیل اولویت های کاربر، الگوهای گردش کار و موضوعات در حال ظهور برای افزایش راهبردهای توسعه مجموعه کمک می کند.
٢- تجزیه و تحلیل رفتار کاربر:
درک چگونگی تعامل کاربران با منابع کتابخانه از طریق تجزیه و تحلیل دادهها می تواند به پیشرفت در دسترسی به اطلاعات و تجربه کاربر منجر شود.
٣- تجزیه و تحلیل پیش بینی:
مدل های پیش بینی، از داده های گذشته برای پیش بینی تقاضا های مربوط به منابع آینده استفاده می کند و کتابخانه ها را قادر می ساد تا تخصیص منابع را بهینه سازی کنند.
۴- فهرست نویسی و رده بندی:
سیستم های رده بندی خودکار و ابزارهای غنی سازی ابرداده، از علم داده برای بهبود دقت و کارایی فرایند فهرست نویسی استفاده می کنند.
۵- سیستم های توصیه گر:
همانند پلاتفرم های تجاری، کتابخانه ها می توانند از الگوریتم های توصیه گر برای پیشنهاد منابع «مربوط و مناسب»، براساس اولویت های کاربر و داده های تاریخی استفاده کنند.
۶- حفاظت دیجیتال:
برای اطمینان از دسترسی طولانی مدت و یکپارچگی مجموعه های دیجیتال، علم داده در توسعه راهبردهای حفاظت دیجیتال نقش مهمی ایفا می کند.
٧- تجزیه و تحلیل دادهها: تجزیه و تحلیل دادهها در مورد استفاده از منابع به کتابخانه ها کمک می کند تا مواد عامه پسند را شناسایی و تاثیر «تهیه و فراهم آوری» را ارزیابی نموده و آنگاه در تخصیص منابع تصمیمات آگاهانه بگیرند.
٨- بازیابی اطلاعات:
الگوریتم های جستجوی پیشرفته و تکنیک های پردازش زبان طبیعی، سیستم های بازیابی اطلاعات را برای پیدا کردن مدارک «مربوط و مناسب» کاربر ارتقاء می بخشند.
موسسISC افزود: رابطه علم داده و بازیابی اطلاعات را بیشتر توضیح می دهم، هر چند که ارایه توضیح درباره بقیه موارد بالا نیز امکان پذیر است:
٨-١ الگوریتم های رتبهبندی ربط:
علم داده در توسعه و پالایش الگوریتم هایی که «ربط» مدرک را با پرس و جو های کاربر تعیین می کنند بسیار مهم است. مدلهای یادگیری ماشین مانند الگوریتم های رتبهبندی، مجموعه داده های بزرگ تعاملات کاربر را برای یادگیری و بهبود رتبه بندی نتایج جستجو براساس «ربط» تجزیه و تحلیل میکند.
٨-٢ گسترش پرس و جو و بهینه سازی:
تکنیک های علم داده از جمله پردازش زبان طبیعی به گسترش و اصلاح پرس و جو های کاربر به منظور بهبود «مانعیت» و «جامعیت» نتایج جستجو کمک می کند. علاوه براین، رفتار اطلاع یابی کاربر و ابزارهای بازخورد نیز در بهینه سازی درک پرس و جو و پیشنهادات مورد تجزیه و تحلیل قرار می گیرد.
٨-٣ شخصی سازی:
علم داده امکان ایجاد تجربیات جستجوی شخصی سازی شده را با تجزیه و تحلیل اولویت های کاربر و تعاملات تاریخی فراهم می کند. سیستم های توصیه گر شخصی سازی شده، «ربط» نتایج جستجوی متناسب با کاربران انفرادی را افزایش می دهد.
٨-۴ تجزیه و تحلیل رفتار اطلاع یابی کاربر:
تجزیه و تحلیل تعاملات کاربر با رابط های جستجو بینش هایی را در مورد رفتار کاربر فراهم می آورد و امکان بهبود مستمر در طراحی و عملکرد سیستم های جستجو را عملی می سازد. تجزیه و تحلیل جلسه که روشی قدرتمند برای بهبود فرآیند های فعال سازی است و سیاهه های مربوط به پرس و جو، منبع داده ارزشمندی برای درک اولویت های کاربر بحساب می آید.
٨-۵ جستجوی معنایی:
پردازش زبان طبیعی و تجزیه و تحلیل معنایی به درک زمینه و معنای پرس و جو کمک می کند و موجبات بازیابی دقیق تر اطلاعات را فراهم می آورد. هدف جستجوی معنایی درک زمینه و نیاز کاربران برای ارابه نتایج مناسب تر است.
٨-۶ معیارهای ارزیابی:
از علم داده برای تعریف و اصلاح معیارهای مورد استفاده برای ارزیابی عملکرد سیستم های بازیابی اطلاعات استفاده می شود. معیار هایی مانند «مانعیت» و «جامعیت» و نمره F1 برای ارزیابی اثربخشی الگوریتم های جستجو تجزیه و تحلیل می شوند.
٨-٧ نمایه سازی و سازمان اطلاعات:
از تکنیک های علم داده در بهینه سازی فرآیند نمایه سازی و اطمینان از ذخیره سازی کارآمد و بازیابی اطلاعات اثربخش استفاده می شود. روش های نمایه سازی پیشرفته مانند نمایه سازی معنایی پنهان به بهبود سازماندهی و بازیابی اطلاعات کمک می کند.
٨-٨ تضمین کیفیت:
از علم داده برای شناسایی و اصلاح سوگیری ها، خطا ها و تناقضات در نتایج جستجو، اطمینان از کیفیت و اعتبار سیستم های بازیابی اطلاعات استفاده می شود. نظارت مداوم و تجزیه و تحلیل عملکرد سیستم به پیشرفت و بهبود مستمر کمک می کند.
در پایان، بنیانگذار مرکز سابق منطقه ای اطلاع رسانی علوم و فناوری خاطر نشان ساخت: استفاده از علم داده در بازیابی اطلاعات شامل طیف گستردهای از تکنیک ها و روش ها است که هدف همه آن ها ارایه نتایج دقیق تر، مرتبط تر و شخصی تر به کاربران است.
وی به این موضوع تاکید کرد و گفت: توجه داشته باشیم که علم داده یکی از بهترین بازار های کار را در تمام رشته ها دارد. تقریبا تمامی بخش های عمومی و خصوصی در ایران و جهان به این حوزه نیاز دارند. علم داده بازار کار بسیار خوبی دارد و گروه های آموزشی علم اطلاعات و دانش شناسی نباید از آن غفلت کنند.
مطلب بسیار مهم و بجایی را استاد دکتر مهراد مطرح کرده اند. باید منطقا پذیرفت که همه علوم با هم در ارتباط هستند، چه به لحاظ محتوایی و چه از بعد نظریه ها و روشها. دنیای امروز، دنیای فازی است و مرز مشخصی میان علوم و موضوعهای وجود ندارد.
نکته دیگر آنکه کتابداران بیسواد نیستند بلکه فرصت ابراز وجود در برخی سمتها و پستها به آنها داده نمی شود. نمونه بارز آن، مدیریت غیر متخصصان بر مراکز ملی کتابداری است، که پیامدهای آن هم عدم کارآمدی و عدم تاثیرگذاری آن مراکز در سطح ملی است.
بسیار از کتابداران دانش نوینی در حوزه های فناوری اطلاعات، پایگاههای اطلاعاتی، نرم افزارهای کتابخانه ای و آرشیو، هستی شناسی و طراحی آنها، پردازش زبان طبیعی، زبان شناسی و مانند آنها دارند.
این روزها ما به همفکری، همدلی و هم افزایی نیاز داریم تا بر چالشهای تحمیل شده کنونی فائق آییم.
روزگار بر همگان نیکو باد
١- تجزیه و استنادی: مدلهای ریاضی مانند شاخص هرش (شاخصh), تاثیر محققان را براساس تعداد استنادات آنها اندازه گیری می کنند و معیاری برای نفوذ آکادمیک ارایه می دهند.
٢- نگاشت کتابسنجی: روش های آماری برای تجسم و تجزیه و تحلیل روابط بین انتشارات علمی، نویسندگان و زمینه های تحقیقاتی از طریق نقشه ها و شبکه های کتابسنجی استفاده می شود.
٣- روند انتشار: تجزیه و تحلیل سری های زمانی و مدلهای رگرسیون به شناسایی الگوها و روند در نشریات علمی کمک می کند و به پیش بینی ها و برنامه ریزی استراتژیک یاری می رساند.
۴- شبکههای همکاری: تکنیک های تجزیه و تحلیل شبکه از جمله نظریه نمودار، الگو های مشترک بین محققان و موسسات را کشف و به درک جامع علمی کمک می کنند.
۵- محاسبه ضریب تاثیر: روش های آماری برای محاسبه ضریب تاثیر مجلات، ارایه اندازه گیری کمی از نفوذ مجله در جامعه علمی استفاده می شود.
من شب سهشنبه را که روز چهارشنبه شما است وقت گذاشتم و محترمانه به نقد غیرمحترمانه شما در حق همکارانم پاسخ دادم. لطفاً ادامه دهید، بحث جالب توجه و ارزشمندی است.
همینطور، در تجزیه و تحلیل استفاده، از روشهای آماری مانند تجزیه و تحلیل رگرسیون می توان برای ارزیابی الگو های استفاده از کتابخانه، کمک به تخصیص منابع و بهبود خدمات استفاده کرد. یا، در تجزیه و تحلیل شبکه از نظریه گراف و مدل های شبکه برای تجزیه و تحلیل ارتباطات بین کتاب ها، نویسندگان و موضوعات و درک جریان اطلاعات به طور فزاینده استفاده می شود.
این مدل های ریاضی به کارآیی و اثربخشی خدمات کتابخانه و اطلاعات ذکمک می کند. دنباله در صفحه بعد.
و اما پاسخ و ربط موضوع: علم اطلاعات و کتابداری از امار، ریاضی و علوم کامپیوتر برای مدیریت، سازماندهی و دسترسی به اطلاعات استفاده می کند. آمار در ارزیابی استفاده از کتابخانه و رفتار کاربر کمک می کند. ریاضیات در سیستم های رده بندی و سازمان اطلاعات نقش دارد. علوم کامپیوتر به توسعه کتابخانه های دیجیتال، مدیریت پایگاه داده و سیستم های بازیابی اطلاعات کمک می کند. رویکرد بین رشتهای، زمینه را برای انطباق با نیازهای تکنولوژیکی و اطلاعاتی در حال تحول تقویت می کند. دنباله در صفحه بعد.