داخلی
»گزارش
شانزدهمین کارگاه آموزشی «پژوهش در محیط وب» برگزار شد
به گزارش لیزنا، شانزدهمین جلسه کارگاه آموزشی "پژوهش در محیط وب"، از سری جلسات دورهمی علمی کتابداران استان قم که توسط کتابخانه آیتالله العظمی بروجردی برگزار می شود، مانند جلسات گذشته با تدریس دکتر سیدمهدی طاهری عضو هیأت علمی ورئیس کتابخانه مرکزی و مرکز اسناد دانشگاه علامه طباطبائی و با پاسخ به پرسشهای مربوط به مباحث جلسه پیشین آغاز شد.
در ابتدای جلسه دکتر طاهری به انواع گروههای کاربری اشاره کرد و گفت: به طور کلی در خصوص جستجو در موتورهای کاوش با دو گروه از کاربران روبرو هستیم. گروه نخست، کاربران عمومی هستند که به طور معمول وارد موتور کاوش میشوند، به صورت غیر حرفهای یک واژه را جستجو میکنند، و از میان میلیونها رکورد بازیابی شده به یافتن رکودهای مورد نظر خود میپردازند. گاهی اوقات نیز پس از بازبینی ده صفحه نخست، به دلیل پیدا نکردن مطالب مورد نظر خود، مجبور به تغییر واژه یا عبارت جستجو میگردند، و به همین روال ادامه میدهند. در این حالت فرایند جستجو کوتاه، اما زمان بررسی و مرور نتایج جستجو، و انتخاب منبع مناسب و مورد نظر خیلی طولانی خواهد بود. زیرا به دلیل استفده از راهبرد جستجوی نامناسب، معمولاً منابع مناسبی پیدا نمیکنند.
وی افزود: گروه دوم از کاربران، افرادی هستند که مرحله جستجوی نسبتاً طولانیتری دارند، اما نتایج مرتبطتر و مناسبتری را خواهند یافت. همچنین به راحتی میتوانند به منابع مورد نیاز خویش دسترسی پیدا کنند. دراین کارگاه قصد بر این است که گروه دوم از کاربران را آموزش داده، و اصطلاحاً جستجوگر حرفهای (professional researcher) تربیت کنیم.
وی همچنین یادآور شد: در زمان جستجو ممکن است گزینهای مجازی در ذهن شما شکل گیرد که آیا جستجوگر حرفهای هستید یا آماتور و غیرحرفهای؟ که اگر فرایند بازیابی را به دو مرحله تقسیم کنیم، مرحله اول شامل طراحی راهبرد جستجو، و مرحله دوم شامل ارزیابی و انتخاب مرتبطترین منابع از بین نتایج بازیابی شده خواهد بود. همانطور که پیشتر گفته شد، در جستجوگران غیرحرفهای مرحله اول بسیار کوتاه، ولی در جستجوگران حرفهای زمان طراحی راهبرد به نسبت زمان بیشتر به خود اختصاص میدهد، اما در مرحله بازیابی منابع، بهترین و مرتبطترین نتایج بازیابی میشوند.
دکتر طاهری در ادامه افزود: یک ضعف بزرگ که برای جستجوگران غیرحرفهای، بخصوص در تعامل با موتورهای کاوش وجود دارد، آن است که از آنجایی که موتورهای کاوش ماهیت تجاری دارند، معمولاً وقتی با راهبرهای جستجوی ساده از طرف کاربر غیرحرفهای مواجه میشوند، سایتهای تبلیغاتی و تجاری، نیز وبسایتهایی که برای کسب رتبه بالاتر هزینه پرداخت کردهاند را در اولویت قرار میدهند. به عنوان نمونه، موتور کاوش گوگل برای رتبهبندی وبسایتها بیش از هزاران عامل و سیاست را در نظر میگیرد که متناسب با راهبرد جستجو و موارد دیگر، بخشی از آن عوامل را اعمال مینماید. چند دلیل برای اهمیت طراحی راهبرد جستجوی مناسب وجود دارد: نخست این که، با راهبرد جستجوی ساده (نامناسب)، میلیونها رکورد بازیابی میشوند. در حالی که مطالعات مرتبط نشان داده است که کاربران نهایتاً تا 10 صفحه نسخت نتایج هر جستجو را بررسی میکنند، و چنانچه حس کنند منابع مورد نظرشان بازیابی نشده، راهبرد جستجو را تغییر میدهند. البته موتورهای کاوش، و سرآمد آنها یعنی موتور کاوش گوگل هم معمولاً محدودیتهایی دارند و با وجود بازیابی هزاران رکورد، ولی بیش از 1000 رکورد نخست را قابل دسترس نکرده، و به کاربران نشان نمیدهند. دیگر این که، موتورهای کاوش ماهیت تجاری دارند، یعنی از برخی وبسایتها هزینه دریافت میکنند تا رتبه آنها را بالاتر نشان دهند. درحقیقت، درآمد عمده موتورهای کاوش، یکی از این راه (اختصاص رتبه بالا به وبسایتها در برابر دریافت هزینه)، دیگر از راه فروش دادههای تحلیل شده، و دو دیگر، از راه تبلیغات در صفحات نتایج تامین میشود. به خصوص اگر در صفحات نخست نتایج بازیابی باشند. چون کاربران همیشه نخستینها را کلیک میکنند، به ویژه ده رکورد نخست را.
وی پس از این مطالب، به معرفی بهینهسازی موتورهای کاوش (Search Engine Optimization یا SEO) پرداخت و در ادامه گفت: بسیاری از وبسایتها با پرداخت هزینه به متخصصان این حوزه، از مزایا و خدمات سئو استفاده میکنند. صنعت سئو، صنعتی بسیار مهم و پر درآمد است، و شامل ترفندهایی است که در وبسایتها بکار برده میشود. برای مطالعه جدیدترین مقالات و مباحث مرتبط با سئو میتوانید به سایت www.searchenginwatch.com مراجعه کنید که جدیدترین مباحث پیرامون صنعت سئو را در بر میگیرد. به عنوان نمونه، محتوای آن شامل: امکانات و خدمات جدید گوگل و بینگ، و ترفندهای افزایش رتبه وبسایتها در موتورهای کاوش وب است. البته مشابه آن، سایت ClickZ است که دراین سایت نیز راهکارهایی برای بهبود رتبه ارائه میشود، و این اهمیت رتبهبندی (ranking) در نتایج موتورهای کاوش را نشان میدهد.
وی افزود: وبسایتی که بتواند بین 10 رکورد نخست، یا بیشینه 20 الی 30 رکورد نخست قرار گیرد، شانس کلیک بیشتری توسط کاربران خواهد داشت. با توجه به این مهم، از دو جنبه نتایجی که موتورهای کاوش وب از جمله گوگل برای جستجوگر غیرحرفهای بازیابی میکنند، معمولاً مناسب نیستند، و آنها نمیتوانند به طور دقیق به منابع مورد نیاز خویش دسترسی پیدا کنند. دکتر طاهری گفت: نخست این که، عواملی هست که گوگل از آنها استفاده میکند تا وبسایت در رتبههای بالای نتایج نشان دهد. مثل دریافت هزینه از وبسایت برای اختصاص رتبه بالاتر به آن، دیگر این که مدیران این وبسایتها از قابلیتها سئو استفاده کرده، و باعث میشوند که وبسایتهای آنها در نتایج نخستین موتور کاوش بازیابی شوند. البته باید به این نکته مهم توجه داشت که لزوماً نخستین نتایج بهترین، و مرتبطترین نتایج نیستند. بنابراین از دو جهت به نوعی حیلهها و ترفندهایی به کار میروند تا این وبسایتها در نتایج نخستین موتور کاوش قرار گیرند، و رتبه آنها بالا باشد. نیز نشانگر این مسئله است که برای جستجوگر غیرحرفهای به غیر از این که انتخاب از بین انبوه رکوردهای بازیابی شده نه چندان مرتبط، وقتگیر خواهد بود، رتبهبندی هم بیشتر پیرو سیاستهای تجاری موتورهای کاوش، و ترفندهای مدیران وبسایتها خواهد بود. اما زمانی که پژوهشگر یا جستجوگر به صورت حرفهای جستجو انجام میدهد، و در اصل محدودیتهای (limitations) جستجو را افزایش میدهد، یعنی برای جستجوی خود از فیلترهای (filters) بیشتر بهره میبرد، به نتایج مرتبطتری دستیافته، و بر روی سیاستها و فرایند رتبهبندی تاثیر گذاشته و در راستای نیازها و قصد خود آن را کنترل میکند. در واقع، جستجوگر حرفهای با استفاده از راهبردها و طراحی فرمولهای جستجوی مناسب، و اعمال برخی از محدودیتها در نتایج بازیابی و کاهش بازیابی رکوردهای نامرتبط، بر بهبود ربط در بازیابی میافزاید.
عضو هیأت علمی دانشگاه علامه طباطبائی تصریح کرد: با وجود این که برخی از موتورهای کاوش مانند گوگل از بیش از 1000 عامل برای رتبهبندی نتایج استفاده میکنند که به آنها اصطلاحاً سیاستها یا خطمشیهای رتبهبندی (ranking policies) میگویند، با این وجود، به دلیل استفاده از برنامههای ماشینی مبتنی بر هوش مصنوعی، یعنی روباتها یا نرمافزارهای عنکبوت-نمایهساز یا خزنده-نمایهساز برای نمایهسازی محتوای وب، مورد ترفند و مکر مدیران وبسایتها (مبتنی بر هوش واقعی یا انسانی) قرار داده شده، و بسیار تاثیر میپذیرند. افزون بر این مسئله، از سوی کاربران نیز ابزارهایی از جمله طراحی راهبردهای جستجوی ویژه (cheat sheets)، که در زمره راهبردهای هک موتورهای کاوش به شمار میروند، استفاده میشوند، و بر روی بازیابی نتایج مرتبطتر با نیاز اطلاعاتی کاربران، نیز دستیابی به اطلاعاتی خاص برای نیل به اهداف ویژه، کنترلهایی را اعمال خواهند کرد. بنابراین کاربر برای جستجو در موتورهای کاوش و بازیابی نتایج با سه گروه سیاست یا ترفند در رتبهبندی روبرو است:
سیاستها و عوامل رتبهبندی به کار گرفته شده از طرف موتورهای کاوش (ranking policies)؛
ترفندهایی که مدیران وبسایتها به کار میبرند (یا همان سئو) تا رتبه بالاتری را در نتایج به دست آورند؛
ابزارها و ترفندهای مورد استفاده خود کاربران که شامل استفاده از عملگرها (محدودیتها) و شیوه تنظیم آنها در کنار یکدیگر، یا همان طراحی فرمول یا راهبرد جستجو است. طراحی راهبرد و فرمول جستجوی ویژه توسط کاربران برای دسترسی به اطلاعاتی ویژه را هک کردن موتورهای کاوش (search engine hacking) گویند که مثلا اگر در محیط گوگل باشد، هکِ گوگل (google hacking) گفته میشود.
رئیس کتابخانه مرکزی دانشگاه علامه طباطبائی گفت: به همین دلیل است که طراحی فرمولهای جستجوی ویژه توسط کاربر را موتور کاوشی چون گوگل، هک شناسایی نموده، و کاربر را به عنوان یک هکر در نظر میگیرد. زیرا کاربر حرفهای با استفاده از محدودیتهای جستجو و اعمال فیلترهای گوناگون، بر روی سیاستهای رتبهبندی موتورهای کاوش اثر میگذارد، و به عبارتی، به جای آن که موتور کاوش یا مدیران وبسایتها تصمیم بگیرند که چه چیزی بازیابی شود، پژوهشگر، خود، بازیابی نتایج را با طراحی راهبردهای دقیق جستجو کنترل مینماید.
وی گفت: بخشی از استفادههایی که از موتور کاوش میشود، در حیطه هک کردن به حساب میآید. بدین معنی که موتور کاوش، به سبب استخراج همه دادههای یک رسانه وبی (مانند وبسایت) در هنگام نمایهسازی، به منزله ابزاری برای رسانههای وبی دیگر به کار میرود. در این نوع کاربرد، موتور کاوش، برخی از نتایج را که در برابر درخواستهای معمولی (بیشتر از سوی کاربران غیرحرفهای) بازیابی نمیکند، در مقابل راهبردهای جستجوی خاص ارائه میدهد. البته موتورهای کاوش قابلیتهای دیگری چون شخصیسازی (personalization) و یا سفارشیسازی (customization) دارند به تعبیر برخی از متخصصان، مرگ سئو (death of SEO) را در پی خواهد داشت. چرا که راهکارهای سئو بر بهبود رتبهبندی وبسایتها در فهرست نتایج موتورهای کاوش متمرکز است که بدین گونه، سئو دیگر کارآیی خود را از دست میدهد و کاربر با تعیین بخش عمدهای از سیاستهای رتبهبندی، نتایج دلخواه خود را دریافت خواهد نمود. از این رو، موتورهای کاوش دو امکان مناسب برای کاربران را فراهم کردهاند: نخست، امکان طراحی راهبردهای جستجوی ویژه که نتایج کنترل شده با بیشترین ربط متناسب با نیاز اطلاعاتی کاربر را در پی خواهد داشت، و دیگری، امکان شخصیسازی یا سفارشیسازی ویژگیهای و خدمات موتور کاوش را برای کاربر قابل برنامهریزی و بومی سازی میکند (programmable search engine).
رئیس کتابخانه مرکزی و مرکز اسناد دانشگاه علامه طباطبائی، همچنین به چگونگی طراحی فرمولها و راهبردهای جستجو به عنوان جستجوگر حرفهای اشاره کرد و گفت: با طی مراحل هشتگانه جستجو میتوانیم مانند یک پژوهشگر یا جستجوگر حرفهای از موتور کاوش بهره ببریم، و همخوانی نتایج بازیابی شده را با نیازهای اطلاعاتی خود افزایش دهیم.
وی افزود: در جلسات پیشین به معرفی عملگرها پرداخته، و شیوههای استفاده از آنها متناسب با هر کارکرد یا بافتی بیان شد، و تاکید بیشتر مباحث ارائه شده بر روی طراحی راهبردهای جستجوی پژوهش-مدار برای اجرای یک پژوهش خوب و جامع بود.
لازم به ذکر است مراحلی که در ادامه بیان میشود، تنها مربوط به جستجو در موتورهای کاوش وب نیست، و در دیگر ابزارهای پژوهشی و پایگاههای اطلاعاتی وبی نیز کاربرد دارند. در حقیقت هر جستجویی که بخواهیم انجام دهیم، باید این مراحل طی شود تا نتیجه مطلوب حاصل شود.
مراحل هشتگانه جستجو:
شناسایی و تنظیم مفاهیم: تمام موجودیتهای مفهومی، انتزاعی و ذهنی هستند، و تا به مرحله بیان نرسند و در قالب واژه بازنمون نیابند، به فعلیت نخواهند رسید. لذا باید به فعلیت برسند و بروز خارجی پیدا کنند. هر آن چه که کاربر جستجو میکند، ابتدا در ذهن وی شکل میگیرد. به عنوان مثال فرایند جستجوی پایاننامهها در موضوعی خاص که فقط در وبسایتهای دانشگاهی وجود داشته باشد، در ذهن کاربر متشکل از چند مفهوم است. ابتدا باید فکر کنیم که چه چیزی را جستجو کنیم، چرا که از طریق انتقال مفاهیم است که میتوانیم به پاسخ برسیم؛
انتخاب کلیدواژه ها و عبارات کلیدی که نمایندگان مفاهیم باشند: در گام دیگر، باید مفاهیم به واژهها و عبارات تبدیل شوند. انتخاب کلیدواژه یا عبارات کلیدی مناسب بسیار مهم است و همان طور که در مباحث پیشین بیان شد، مفاهیم تخصصی بیشتر در قالب عبارت بیان میشوند، مانند: مدیریت اطلاعات، مدیریت دانش، بانکداری اسلامی و نظیر آن؛
تعیین مترادفها و همنشینها: گام دو دیگر، شامل تعیین مترادفها و همنشینها است که در سیستمهای اطلاعاتی به دو شکل بروز مییابد: نخست آن دسته از سیستمهای اطلاعاتی که از جستجوی معنایی یا مفهومی (conceptual or semantic search) پشتیبانی میکنند، مانند سیستمهای اطلاعاتی (کتابخانههای دیجیتالی، پایگاههای کتابشناختی، و ...) شامل سیستمهای فرعی معنایی از جمله اصطلاحنامهها، مستند نامهای مختلف، فهرست سرعنوانهای موضوعی و جز آن. این گونه از سیستمها، نیازی به اجرای گام سوم از سوی کاربر ندارند و به صورت خودکار از آن حمایت مینمایند. مگر آن که اصطلاح یا عبارت مورد جستجوی کاربر در سیستم معنایی وجود نداشته باشد. دیگر، آن دسته از سیستمهای اطلاعاتی که از جستجوی معنایی پشتیبانی نمیکنند، که در این صورت نیاز به اجرای مرحله سوم هست. به این معنا که اگر بخواهیم به عنوان مثال آموزش و پرورش را جستجو کنیم، باید بدانیم که اصطلاح تعلیم و تربیت با آن مترادف است و برای دستیابی به جامعیت بازیابی، هر دو اصطلاح باید مورد جستجو قرار گیرند (ترکیب شوند). همینطور درباره دموکراسی که به آن مردم سالاری نیز گفته میشود که اگر کاربر این اصطلاحات را در جستجوی خود به کار نگیرد، جامعیت بازیابی از دست میرود و «عدم بازنمون مناسب مفهوم (مفاهیم) موجود در ذهن» را منجر میشود. زیرا این مفهوم (مفاهیم) به دلایل مختلف در قالب واژگان یا عبارات گوناگون بیان میشوند. اما اگر سراغ موتورهای کاوش عمومی میروید، باید توجه داشته باشید که از آنجا که این دامنه موضوعی زیر پوشش این موتورهای عمومی است و به همه موضوعات دانش بشری میپردازند از ابزارهای معنایی زبانی و نه حوزه علمی خاص، استفاده میکنند. یعنی از سیستمهای معنایی مانند اصطلاحنامههای مبتنی بر زبان (language-based thesauri) شبیه شبکه معنایی (یا هستیشناسی واژگانی) Wordnet که برمبنای واژهها زبان انگلیسی و روابط معنایی میان آنها گسترش یافته است و در جلسات پیشین معرفی شد؛
انتخاب و تنظیم عملگرها (طراحی راهبرد جستجو): که متناسب با نیاز اطلاعاتی خود فیلترینگ یا محدودیتهای جستجویی اعمال میکنیم که با ایجاد این محدودیتها، دقت و مانعیت جستجو افزایش مییابد. به طور کلی عملگرهای (محدودیتهای) جستجو به دو شکل در سیستمهای اطلاعاتی به کار میروند: نخست، در قالب حروف، واژهها و نشانهها، و دیگر، به صورت فهرستهای انتخابی (Pick lists). البته باید به این نکته هم توجه نمود که فقط انتخاب عملگرها مهم نیست، و تنظیم آنها نیز از اهمیت فراوانی برخودار است، که به این این فرایند (انتخاب و تنظیم)، طراحی راهبرد یا فرمول جستجو گفته میشود؛
انجام کاوش: که با توجه به مراحل پیشتر گفته شده، فرایند جستجو انجام میشود؛
ارزیابی نتایج: دراین مرحله بررسی میکنیم که نتایج بازیابی شده با توجه به مفاهیم انتخاب شده برای براین نیاز اطلاعاتی، کلیدواژهها و عبارتهای کلیدی، مترادفها و همنشینها (شبه مترادفها)، عملگرها و تنظیم راهبرد جستجو، مناسب و مرتبط با درخواست ما بوده است یا خیر؟. اگر کاربر هم چون یک پژوهشگر حرفهای جستجو کند، زمانی که برای ارزیابی نتایج اختصاص میدهد، کوتاه خواهد بود. چراکه با طراحی فرمولهای جستجوی خوب و دقیق، نتایج مفید و خوبی را دریافت نموده است؛
اصلاح کاوش: در صورت نیاز و نداشتن رضایت کامل از نتایج جستجو، اعمال محدودیتهای جستجوی کمتر یا بیشتر، برای دستیابی به نتایج بهتر تلاش میکنیم؛
جستجو در دیگر سیستمهای اطلاعاتی برای دسترسی به منابع بیشتر.
دکتر طاهری در ادامه گفت : همانطور که پیشتر نیز اشاره شد، 90% از زمانی که کاربران صرف جستجو در وب میکنند، در محیط موتورهای کاوش است، و فقط 10% باقیمانده به دیگر ابزارهای کاوش و پایگاههای اطلاعاتی اختصاص دارد. بنابراین یادگیری چگونگی استفاده از این ابزار محبوب و ارزشمند، برای پژوهشگران از اهمیت بالایی برخوردار است.
دکتر طاهری در ادامه این نشست، به معرفی و چگونگی جستجو در فهرست دسترسپذیر همگانی (اُپک) کتابخانه ملی جمهوری اسلامی ایران به نشانی اینترنتی: http://opac.nlai.ir پرداخت و استفاده از این ابزار را برای پژوهشگران ایرانی و فارسی زبان مفید ارزیابی کرد.
وی اشاره کرد: پایگاههای مستند که به اشتباه "بانک مستندات" ذکر شده است، امکان افزایش جامعیت و مانعیت بازیابی در ابزارهای کاوش از جمله موتورهای کاوش و پایگاههای کتابشناختی را برای کاربران فراهم مینماید. بدین صورت که تمامی شکلهای اصطلاحات به کار رفته برای بازنمون معنای یک مفهوم را نشان داده، و پژوهشگر میتواند از تمام آنها در جستجوی خود بهره گیرد.
وی با ارائه یک مثال نحوه کار و طریقه استفاده از پایگاههای مستند دسترسپذیر در اُپکِ کتابخانه ملی را شرح داد و گفت: در قسمت جستجوی مستند موضوعی این پایگاهها، عبارت "کتابخانه مجازی" را وارد نموده، و به جستجو میپردازیم. چنان که در تصویر مشاهده میشود، شش رکورد نتیجه برای ما بازیابی میشود با عناوین: کتابخانههای الکترونیکی، کتابخانههای کامیپوتری، و جز آن. اما هیچ کدام عبارت "کتابخانه مجازی" را نشان نمیدهد. به این دلیل که کتابخانه مجازی اصطلاح مرجح نیست، بلکه کتابخانه الکترونیکی اصطلاح مرجح است، و در ذیل آن تمام اصطلاحات غیرمرجح مربوط به آن آورده شده که اصطلاح "کتابخانه مجازی" نیز از آن جمله است. به این ترتیب اگر بخواهیم در گوگل عبارت کتابخانه مجازی را به تنهایی و بدون طراحی راهبرد مناسب و شامل مترادفها، جستجو کنیم، نتایج بازیابی شده ناقص خواهند بود، و بسیاری از منابع مرتبط را از دست میدهیم. چرا که اصطلاح کتابخانه مجازی تنهای اصطلاح نماینده مفهوم مرتبط نیست، و ممکن است در برخی منابع از دیگر مترادفهای آن استفاده شده باشد. بنابراین باید تمامی اصطلاحات (مرجح و غیرمرجح) بیانگر مفهوم مرتبط را در طراحی راهبرد جستجو لحاظ کنیم تا نتایج جامع و بیشتری بازیابی شود.
وی افزود: یکی از مهمترین کاربردهای پایگاههای مستند یافتن همین مترادفها، شبه مترادفها و شکلهای دیگر نامها که برای دستیابی به جامعیت بازیابی بسیار مناسب هستند. برای زبان فارسی، پایگاههای مستند کتابخانه ملی ایران، و برای منابع انگلیسی، پایگاههای مستند کتابخانه کنگره آمریکا (https://authorities.loc.gov/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First و https://id.loc.gov/) پیشنهاد میشوند.
در پایان، به برخی از پرسشهای کاربران پاسخ داده شد.
با سپاس از دکتر طاهری برای به اشتراک گذاری تجربه و دانش تخصصی اش با اهل حرفه.
نکته های عملی و علمی بسیار سودمندی را مطرح کرده اند که می تواند به همکاران در آموزش و پژوهش کمک کند.
بدون تردید، بسیاری از همکاران هم تجربه های مشابه دارند. دریغ است که با دیگران به اشتراک نگذارند.