داخلی
»گزارش
هجدهمین کارگاه پژوهش در محیط وب برگزار شد
به گزارش لیزنا، هجدهمین جلسه از کارگاه پژوهش در محیط وب، از سلسله جلسات دورهمی علمی کتابداران که به همت کتابخانه آیت الله بروجردی و با تدریس دکتر سید مهدی طاهری به صورت مجازی برگزار میشود، در ادامه بحث طراحی و ایجاد موتور کاوش شخصی از طریق سامانه وبینار در پلتفرم آموزش الکترونیکی برگزار شد.
دکتر سید مهدی طاهری در جلسه قبل به معرفی موتورهای کاوش شخصی پرداخت و گفت: موتورهای کاوش شخصی با این رویکرد طراحی شدهاند که برای هر کاربری با نیازهای اطلاعاتی، علایق و سلایق مختلف، رفتار اطلاعیابی متفاوت و حتی حس زیبایی شناختی خاص مناسب باشند. به عبارت دیگر، برای این که این موتورها بتوانند نیاز همه افراد را برطرف کنند و اجازه دهند کاربر از قابلیتهای گوناگون این موتورها متناسب با نیازها و علایق خود استفاده نماید، این قابلیتها را فراهم نمودهاند، البته افزون بر گوگل، موتورهای کاوش دیگر هم مانند موتور کاوش بینگ، چنین امکاناتی را ارائه میدهند.
در جلسه گذشته درباره شیوه ایجاد موتورهای کاوش شخصی توضیحاتی ارائه شد، و در ادامه آن، در این جلسه در خصوص امکانات موتورهای کاوش شخصی بحث شد.
وی گفت: موتورهای کاوش شخصی (personalized search engine) که به آنها موتورهای کاوش سفارشی (custom search engine) یا موتورهای کاوش قابل برنامهریزی (programmable search engine) نیز میگویند، امکانات وسیع و گوناگونی دارند، و این امکانات بهطور مرتب در حال گسترش و روزآمدسازی هستند. گوگل تمام این امکانات را ایجاد نموده تا بتواند نیاز اطلاعاتی کاربر را متناسب با نیاز، دیدگاه و رویکرد، و دیگر ویژگیهای شخصی کاربر فراهم کند.
دکتر سید مهدی طاهری تصریح کرد: این مسئله در درجه اول نشانگر این است که موضوع شخصیسازی در سیستمهای اطلاعاتی بسیار پراهمیت است، و لازم است تمامی سیستمها به سمت رویکرد شخصیسازی حرکت کنند و هر کدام متناسب با نیازها و علایق کاربر خدمات پویا (dynamic services) ارائه نمایند. بهطورمثال، سیستمهای اطلاعاتی از روی تحلیل لاگهای ثبت شده از کاربر و رفتار اطلاعیابی آنها (تجربه کاربری) میتوانند خدمات خود را متناسب با نیاز و سلیقه کاربر ارائه دهند، و منابع مرتبط را بازیابی نمایند. بهعنوانمثال، اگر اولویت جستجوی کاربر منابع دیداری باشد و در کتابخانه دیجیتالی جستجو نماید، ابتدا منابع دیداری برایش بازیابی شده، و در رتبه (Rank) بالاتری قرار میگیرند، و یا در سیستمهای خرید، متناسب با خریدهای پیشین کاربر، به وی پیشنهادهایی ارائه میگردد. نیز، در شبکههای اجتماعی مثل اینستاگرام در قسمت جستجو، متناسب با آن چه از پیش توسط کاربر جستجو شده است، تصاویر را نمایش میدهند. در خدمات ارائه شده در یوتیوب نیز بحث شخصیسازی مورد توجه قرار گرفته است.
وی گفت: نکته قابل توجه، در موتورهای کاوش مثل گوگل این است که بهطور مرتب به این خدمات افزوده شده، و قابلیتهای مختلفی را ارائه میدهد و اینها شواهدی بر اهمیت بحث شخصیسازی هستند.
عضو هیات علمی دانشگاه علامه طباطبایی در ادامه گفت: در جلسه پیش، بخش setup موتور کاوش شخصی بیان شد.تمامی این تنظیمات را پس از اتمام، میتوانیم در قالب فایل مبتنی بر بستر نحوی ایکسامال (XML) بارگذاری کنیم و یک موتورکاوش شخصی با قابلیتهای مختلف متناسب با نیازهایمان داشته باشیم.
دکتر طاهری در خصوص پرسش یکی از کاربران درباره گزینه restrict page using knowledge graph entities توضیح داد: بهعنوانمثال، در گوگل واژه "انیشتین" را جستجو میکنیم، زیر هر کدام از نتایج بازیابی شده یک یا چندین فراپیوند موجود است و در سمت راست صفحه، جعبه دانش (knowledge box) گوگل ارائه میگردد، که به عنوان جدیدترین پروژه بازنمون دانش در دنیا، و یک هستیشناسی از دادههای وب مطرح است. همه موتورهای کاوش در حال حرکت به سمت این فناوریها و خدمات هستند. در آینده تمام نتایج به این شکل ارائه خواهند شد، چرا که این روش هوشمند است و تشخیص میدهد که آلبرت انیشتین یک نظریهپرداز حوزه فیزیک بوده، و تمام دادههای مربوط به انیشتین همانند نقلقولها، توصیفات و کتابهایش را نشان میدهد. جعبه دانش گوگل برگرفته از پروژه نگاره (گراف) دانش (knowledge graph) است که جستجوهای معنایی (semantic search) انجام داده، و بر اساس معیار ربط (relevance)، مرتبطترین نتایج را به صورت معنادار نمایش می دهند.
وی گفت: این گونه خدمات، آینده موتورهای کاوش را تشکیل میدهند که مبتنی بر هوش مصنوعی است و هدف آن بازنمون دانش (knowledge representation) به جای بازنمون اطلاعات ( information representation) است. هنگامی که در گوگل واژه "انیشتین" را جستجو میکنیم، در سمت چپ تنها اطلاعات را بازنمون میکند و صفحات را براساس وجود واژه مورد نظر بازیابی کرده است. در این بخش گوگل نتایج جستجوی نحوی (Syntactic search) را ارائه میدهد. در سمت راست با تشخیص اینکه انیشتین یک نظریهپرداز است، از وبسایتهای مختلف، دادههای مربوط به انیشتین، نقل قولهای مرتبط، کتابهایش، دانشمندان هم رشته و ... را جستجوی معنایی (semantic search) انجام داده و بازیابی نموده است.
وی افزود: افراد حقیقی و حقوقی که دادههای خود را تهیه و در وب منتشر میکنند، اگر صفحات خود را بر اساس معیارهای knowledge graph آماده نمایند، صفحات در knowledge box به نمایش در آمده، و بازیابی معنایی میشوند، و گوگل ساختار این صفحات را بهخوبی تحلیل و شناسایی میکند. یعنی در اصل گوگل ساختاری را طراحی نموده است که اگر مدیران وبسایتها، پایگاههای اطلاعاتی و دیگر خدمات پیوسته، دادههای خود را متناسب با این ساختار طراحی کنند، موتور کاوش، موجودیت توصیف شده در صفحه وب را به صورت معنادار تشخیص میدهد.
دکتر طاهری در ادامه گفت: صفحات بازیابی شده در knowledge box ساختاری را برای بازنمون دانش استخراج میکنند که برای موتور کاوش کاملاً قابل درک است. در واقع موتور کاوش نتایج را به صورت knowledge graph نشان میدهد. مهمترین ابزاری که نگاره دانش و خردههای غنی (دیگر نمایش معنادار) را ایجاد میکند، استاندارد فرادادهای schema.org است. این استاندارد باعث میشود دادهها بهصورت ساختارمند تولید شوند و موتور کاوش دادهها را به صورت معنادار نمایهسازی نموده، و معنادار نیز نمایش دهد. این استاندارد ساختاری طراحی نموده است که به تولیدکنندگان دادههای وب نشان میدهد چگونه دادهها را به شکل ساختارمند تولید نمایند تا موتور کاوش این دادهها را بهصورت معنادار نمایهسازی و بازنمون (semantically indexing and visibility) کند.
عضو هیأت علمی دانشگاه علامه طباطبائی در ادامه افزود: زمانی که در تنظیمات موتور کاوش شخصی خود گزینه using schema.org type را فعال کنیم، میتوانیم نتایج جستجوی خود را به صفحاتی که دارای ساختار مبتنی بر استاندارد Schema.org هستند، محدود نماییم تا موتور کاوش نتایج را بهصورت کاملاً معنادار نمایه و بازیابی کند. در این زمینه باید توجه داشت، همه صفحات دارای این ساختار نیستند و شمار زیادی از صفحات وب براساس این ساختار تنظیم نشدهاند. به همین دلیل وقتی این گزینه را فعال کنید نتایج چندانی بازیابی نخواهد شد. در واقع اگر نتایج را محدود کنیم تا فقط صفحاتی را بازیابی نماید که معنادار و بر اساس استاندارد schema.org و یا بر اساس knowledge graph entitiesایجاد شدهاند، ممکن است صفحهای بازیابی نشود یا تعداد آنها معدود باشد. مسئله دیگر این است که وقتی از موجودیتهای نگاره دانش و schema.org صحبت میشود باید نوع موجودیت جستجوی خود را از full list of entity types انتخاب نماییم.
وی گفت: برای یافتن این فهرست لازم است در قسمت جستجوی گوگل عبارت schema.org را جستجو نماییم، در نتایج بازیابی شده، گزینه full hierarchy را انتخاب میکنیم که انواع موجودیتها را ارائه میدهد و از میان آنها میتوانیم کلیدواژههای خود را انتخاب نماییم. نیز میتوانیم برای یافتن کلیدواژههای خود در گوگل عبارت google knowledge graph entities را جستجو نماییم.
دکتر طاهری در ادامه، به توضیح گزینه دوم موتور کاوش شخصی یعنی look and feel پرداخت، و همه سربرگهای (تب) آن را کاملاً تشریح کرد و گفت: این گزینه دارای چهار سربرگ هست که اعمال تغییرات در هر کدام از این سربرگها، شکل و ظاهر نمایش نتایج را تغییر میدهند.
سربرگ اول(layout) که چگونگی نمایش نتایج بازیابی شده را تنظیم میکند، و نمایش میدهد؛
سربرگ دوم (themes) که پس زمینه صفحه موتور کاوش شخصی را تغییر میدهد؛
سربرگ سوم (customize)، در این سربرگ گزینه (general) مربوط به فونت، رنگ و اندازه واژهها است و همچنین رنگ جعبه جستجو را تغییر میدهد. در قسمت (logo) میتوانیم عکس یا لوگو برای موتور کاوش خود انتخاب کنیم. گزینه (refinement) رنگ متنی را که انتخاب (select) میکنیم، تغییر میدهد؛ گزینه بعدی google branding است که اگر غیرفعال نماییم در قسمت جعبه جستجو عبارت (enhanced by google) حذف میشود، و مشخص نمیگردد که این موتور کاوش شخصی بر اساس گوگل ساخته شده است. توصیه میشود این گزینه فعال باشد تا عبارت (enhanced by google) نمایش داده شود؛
قسمتهای بعدی مربوط به رنگ و فونت نتایج بازیابی شده، عناوین و آدرس URL صفحات بازیابی شده است؛
آخرین سربرگ look and feel، سربرگ thumbnails است که اگر فعال باشد، تصاویر کوچک در گوشه نتایج بازیابی شده نمایش داده میشوند.
قسمت بعدی تنظیمات موتور کاوش شخصی، ویژگیهای جستجو (search features) است که بسیار مهم است و قابلیتهای فنی زیادی دارد.
سربرگ نخست این گزینه (promotions) است که اگر این گزینه فعال باشد، میتوانیم در نحوه نمایش نتایج بازیابی شده تغییرات اعمال نموده، که بهطور دقیق عنوان و یا پیوند مربوط به صفحه را نمایش دهد.
عضو هیأت علمی دانشگاه علامه طباطبایی گفت: در قسمت (look and feel) شکل ظاهری نتایج بازیابی شده را میتوانیم به سلیقه خود تغییر دهیم، ولی در قسمت (search features) میتوانیم محتوای بازیابی شده را تغییر داده، و تعیین کنیم کدام موارد و به چه ترتیبی بازیابی شود. بهطورمثال، ابتدا نشانی وبسایت و سپس توصیفهای آن نمایش گردد. بنابراین، گزینه (promotions) از لحاظ زیباییشناختی نیست بلکه از لحاظ نوع اطلاعاتی است که میخواهیم جستجو و نشان داده شود. حتی میتوانیم تنظیمات زمان برای آن درنظر بگیریم که از چه زمانی تا چه زمانی این تغییرات اعمال شود. نیز میتوانیم تعیین کنیم در زمانهای معین در بازیابی نتایج، آدرس سایتهای تبلیغاتی را که در بالای نتایج بازیابی شده، نشان دهد. بهعنواننمونه، اگر بخواهیم همایشی برگزار کنیم، میتوانیم در موتور کاوش شخصی خود تنظیمات را به گونه ای اعمال نماییم که وقتی کاربر جستجو میکند، عنوان یا پیوند مربوط به همایش در بالای نتایج بازیابی شده مشاهده شود.
رئیس کتابخانه مرکزی دانشگاه علامه طباطبایی در ادامه گفت: سربرگ (تب) یا امکان دیگری که در قسمت search features وجود دارد، گزینه پالایش (refinement) است که بر پایه آن، موتور کاوش به کاربر امکان میدهد، نتایج بازیابی شده را متناسب با دستههای خاص محدود کند. در این زمینه میتوان چهریزه (facet) تعریف نمود. بدین منظور نخست باید گزینه enable facet search را فعال کنیم تا در این صورت بتوانیم نتایج را دستهبندی کنیم. سپس میتوانیم تعیین نماییم کدام سایتها در یک دسته خاص قرار دارند. بهعنوانمثال، از ده نتیجه بازیابی شده، سه نمونه مربوط به یک دسته، چهارنمونه مربوط به دسته دیگر و به همین ترتیب هستند. این نتایج را موتور کاوش به صورت برچسبی (label) بازنمون میکند. قابلیت مورد نظر را نیز میتوان با استفاده از knowledge graph entities تعریف کرد. امکان دیگر auto complete مربوط به جستجو است. در صورت فعال بودن این گزینه، در هنگام جستجو، اصطلاحات پیشنهادی (suggested terms) به جستجوی کاربر نیز نمایش داده میشود تا کاربر از میان اصطلاحات انتخاب نماید. میتوانیم این امکان را نیز شخصیسازی کنیم.
وی گفت:قابلیت کاربردی دیگر، سربرگ synonyms است که یک امکان کاملاً تخصصی است. به عنوان مثال میتوانیم تعریف کنیم که اگر در یک موتور کاوش شخصی عبارت data جستجو شود، با عبارت fact مترادف در نظر گرفته شود و عبارت مترادف نیز بازیابی گردد. به این معنی که اگر fact را جستجو کنیم، data نیز بازیابی شود. خود گوگل از شبکه معنایی Wordnet استفاده میکند و مترادفها را نیز بر اساس واژگان این شبکه معنایی بازیابی مینماید. این تنظیمات در موتورکاوش شخصی با استفاده از سربرگ synonyms قابل اعمال است.
وی در ادامه تصریح کرد: بالاخره در سربرگ پایانی (advanced)، چند گزینه به چشم میخورد، اولین گزینه results sorting است که اگر این گزینه فعال باشد، نتایج بر اساس ربط (relevance) یا بر اساس تاریخ (date) بهصورت صعودی و یا نزولی مرتب میگردد. در همین قسمت امکان دیگری وجود دارد با عنوان web search setting که میتوانیم تنظیم کنیم نتایج بازیابی شده را به صورت سربرگ (تب) و یا پیوند نمایش دهد.
دکتر سید مهدی طاهری در پایان این جلسه گفت: تمامی بخشها و امکانات قسمت تنظیمات search features بهطور کامل ارائه شد. به این ترتیب جلسه هجدهم کارگاه پژوهش در محیط وب به پایان رسید و ادامه تنظیمات موتورهای کاوش شخصی به جلسه آینده موکول شد.
گزارش: بنت الهدا موحدی محب
۱. از توهین به افراد، قومیتها و نژادها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهامزنی به دیگران خودداری نمائید.
۲.از آنجا که پیامها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمانها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.