داخلی
»گزارش
بیست و یکمین جلسه کارگاه پژوهش در محیط وب برگزار شد
به گزارش لیزنا، دکتر طاهری در این جلسه به معرفی مکانیاب جهانی منبع (URL) جستجو در موتور کاوش گوگل یعنی google search syntax و یا google search parameters پرداخت که به آن اصطلاحاً search in the fly گفته میشود. نخست، انواع صفحات وب معرفی شدند. برخی از صفحات وب ثابت (static page) و برخی از صفحات پویا (dynamic page) هستند. از طریق نشانی صفحات میتوانیم ماهیت ثابت و پویای آنها را تشخیص دهیم.
وی گفت: در نشانی صفحات پویا، معمولاً پارامترهایی مثل ؟#$%&^ بهکار میروند که بیانگر آن که صفحات از پیش ایجاد نشدهاند. به عنوان مثال، گوگل از قبل صفحهای نساخته است که در آن نتایج مربوط به درخواست ما وجود داشته باشد. ولی در صفحات ثابت پارامترهای اشاره شده، وجود ندارند و این صفحات از پیش ایجاد شده و نشانی ثابتی دارند. این ویژگی، یکی از تفاوتهای اصلی صفحات پویا و صفحات ثابت است.
دکتر طاهری سپس به تفاوت URI و URL اشاره کرد و گفت: URI اصطلاح گستردهتر و شامل URL و URN است. زمانی که در موتور کاوش گوگل جستجو میکنیم، یک URL ایجاد میشود که ماهیتی پویا (dynamic URL) دارد. در واقع گوگل از پیش صفحهای را ایجاد نکرده است که نتایج مربوط به یک درخواست در آن بازیابی شده باشد. زیرا درخواست کاربران از قبل قابل پیشبینی نیست و هزاران درخواست جدید ممکن است طراحی شوند.
سازوکار موتورکاوش گوگل بدین صورت است که درخواست کاربر را با پایگاه داده خود تطبیق میدهد و سپس صفحاتی که با درخواست کاربر مرتبط هستند، در صفحه ایجاد شده (Generated webpage)، نمایش میدهد. در نشانی این صفحات از پارامترهایی همانند #$%&^؟ استفاده میشود. این نوع صفحات اغلب نشانیهای طولانی دارند. البته برخی از نرم افزارهای CMS که وبسایتها را مدیریت میکنند، دارای این قابلیت هستند که نشانی صفحه پویا را بهصورت صفحه ثابت نمایش دهند. بدین صورت که برای صفحات پویا، نشانی ثابتی در نظر میگیرند و فقط آن نشانی را نشان میدهند. دلیل نمایش نشانی ثابت این است که صفحات وب، نشانی طولانی نداشته باشند و همچنین گاهی، کاربران متوجه پویا بودن صفحات نشوند.
رئیس کتابخانه مرکزی دانشگاه علامه طباطبایی در ادامه گفت: گوگل برای ایجاد صفحات پویا تصادفی عمل نمیکند، و از قواعد و الگوریتمهای خاصی پیروی مینماید. موتور کاوش گوگل براساس الگوریتم خاص خود صفحات را ایجاد میکند. هر نشانی وبی با پارامترهای مشخصی آغاز میشود، بهعنوانمثال، درصورت درخواست فایل pdf پارامترهای خاصی نشان داده میشوند. از طریق بستر نحوی (Syntax) این صفحات میتوان اقدامات گوناگونی انجام داد یا ترفندهای مختلفی به کار برد، و در نتایج بازیابی شده، دخل و تصرف کرد. این نوع از بسترهای نحوی، در زمره سینتکسهایی به شمار میآیند که ترتیب را نشان میدهند و arrangement syntax نامیده میشوند. از جمله این اقدامات و ترفندها میتوان به درج درخواست در بستر نحوی URL را نام برد که در بحث برنامهنویسی کاربرد بسزایی دارد.
عضو هیأت علمی دانشگاه علامه طباطبایی در پاسخ به پرسش یکی از شرکتکنندگان در خصوص تفاوت http:// با https:// گفت: در صفحاتی که نشانی آنها با https:// آغاز می شود، پروتکل http با یک لایه امنیتی محافظت میشود (Hypertext Transfer Protocol Secure)، برای این که امنیت یک وبسایت بالا برود و کمتر در معرض هک شدن و آسیب قرار بگیرد از پروتکلhttps:// استفاده میشود. بیشتر صفحات بانکها و فروشگاههای اینترنتی از این لایه امنیتی استفاده میکنند تا امکان هک و شبیهسازی URLاین صفحات وجود نداشته باشد. لذا باید در هنگام پرداختهای اینترنتی دقت داشت نشانی صفحه وبسایت ازhttps:// استفاده کند تا بتوان اطمینان حاصل کرد که صفحه هک نشده، و صفحه اصلی بانک یا فروشگاه مورد نظر است.
دکتر طاهری در ادامه به معرفی بستر نحوی گوگل پرداخت و گفت: تمام جستجوهایی که در گوگل انجام میشوند نخست با عبارت http://www.google.com/search? آغاز میگردند. هر درخواست که در گوگل وارد میکنیم، حتماً با این عبارت شروع میشود. نیز در نشانی صفحه ایجاد شده، جفتهای متغیر/ارزش (variable/value pair) به کار میروند.
وی گفت: متغیرها (Variables) شامل نشانههایی همانند as_q یا as_epq و یا as_sitesearch هستند که هر کدام ارزش یکی از پارامترهای جستجو را نشان میدهند. متناسب با بافتهای خاص اصلاحاتی همانند property، attribute، tag name، element name یا label نیز به جای variable به کار میروند. در کل به این پارامترها جفتهای نام/ارزش (Name/value pair) گفته شده، و در بحث URL از اصطلاح جفتهای متغیر/ارزش استفاده میشود. در این جفتهای متغیر/ارزش همیشه یک متغیر (variable) مدنظر قرار میگیرد و پس از نشانه مساوی (=)، ارزش آن متغیر ثبت میگردد.
دکتر طاهری افزود: ارزشها (Values) نویسههایی هستند که در زمان جستجو به کار میبریم. بهعنوانمثال، زمانیکه از عملگر (" ") برای جستجوی عبارتی استفاده میکنیم، پارامترهای (variables) گوناگونی در نشانی URL درج میگردند. در هر نشانی جدیدی که بر اساس درخواست کاربر برای صفحه نتایج جستجو ایجاد میشود، چندین جفت variable/valueبه کار میرود که هر جفت با نشانه امپرسند (&) از یکدیگر جدا میشوند. اگر از پنج عملگر استفاده کرده باشیم لازم است پنج بار علامت & به کار رود. بهعنوانمثال، اگر بخواهیم واژه astronomy را در سایتهای دولتی آمریکا (.gov) جستجو کنیم، آدرسURL صفحه به این شکل خواهد بود:
http://www.google.com/search?as_q=astronomy&as_sitesearch=.gov
در این نشانی، بخش نخست، مشابه سایر جستجوها است و تمامی نشانیهای ایجاد شده، با این عبارت آغاز میشوند. در ادامه، از متغیر as_q استفاده شده، و پس از نشانه مساوی ارزش آن یعنی واژه astronomy ثبت شده است. سپس علامت امپرسند (&) به کار رفته، و در ادامه آن، متغیر (as_sitesearch) استفاده شده است که نشانگر عملگر site: بوده، و ارزش آن .gov است.
دکتر طاهری در ادامه به دیگر ویژگیهای متغیرها (variables) اشاره کرد و گفت: میتوانید تعداد نتایج بازیابی شده در صفحه نتایج را کاهش یا افزایش دهید. بدین منظور میتوانید از متغیر num استفاده کنید و تعداد نتایجی که میخواهید در صفحه نتایج بازیابی شوند را تغییر دهید.
در مثال پیشین، اگر بخواهیم واژه telescope در نتایج بازیابی نشود، میتوانیم از متغیر as_eq استفاده کنیم. در این صورت، نشانی درخواست ما به شکل زیر خواهد بود:
http://www.google.com/search?as_q=astronomy&as_sitesearch=.gov&as_eq=telescope
این URL معادل راهبرد جستجوی astronomy -telescope site:.gov خواهد بود.
در پایان جلسه، دکتر سید مهدی طاهری افزود: تمامی متغیرهای مورد استفاده در URL syntax موتور کاوش گوگل در نشانی زیر ارائه شده است:
https://moz.com/blog/the-ultimate-guide-to-the-google-search-parameters
بدین ترتیب بیستویکمین جلسه کارگاه آموزشی پژوهش در محیط وب پایان یافت، و ادامه توضیحات مربوط به متغیرها و ارزشهای بستر نحوی صفحات نتایج جستجوهای گوگل به جلسه آینده موکول شد.
۱. از توهین به افراد، قومیتها و نژادها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهامزنی به دیگران خودداری نمائید.
۲.از آنجا که پیامها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمانها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.