کد خبر: 49470
تاریخ انتشار: یکشنبه, 21 بهمن 1403 - 13:26

داخلی

»

گزارش

استاندارد فراداده‌ای موجودیت‌های داده‌ای را با یکدیگر پیوند می‌دهد

منبع : لیزنا
پنجمین جلسه از دوره روابط میان موجودیت‌ها در بافت میراث فرهنگی با موضوع «رویکرد استانداردهای فراداده‌ای به ثبت روابط معنایی» به همت کتابخانه آیت‌الله العظمی بروجردی با تدریس دکتر سید مهدی طاهری برگزار شد.
استاندارد فراداده‌ای موجودیت‌های داده‌ای را با یکدیگر پیوند می‌دهد

به گزارش لیزنا، نشست «رویکرد استانداردهای فراداده‌ای به ثبت روابط معنایی» در تاریخ 4 بهمن 1403 به صورت حضوری و مجازی برگزار شد. دکتر طاهری با اشاره به انواع استانداردهای بافت میراث فرهنگی گفت: استانداردهای فراداده‌ای مانند یک ظرف خالی بوده و در یک بافت خاص توسعه می‌یابند. این نوع از استانداردها متناسب با نیازهایی که در آن بافت وجود دارد، ساختار و شکل خاصی به خود گرفته و صفات توصیف یک یا چندین شیء را تعیین می‌کنند. از آنجایی که استانداردهای فراداده‌ای به تعیین ساختارها می‌پردازند، داده‌ای که توسط آن‌ها ایجاد می‌شود یک داده ساختارمند (Structured data) به شمار می‌آید.  استانداردهای محتوایی به ثبت ارزش‌ها (Value) پرداخته و به دو پرسش چه بنویسیم (What to Write?) و چگونه بنویسیم (How to Write?) پاسخ می‌دهند. بدین ترتیب، ساختار توصیفی که توسط استانداردهای فراداده‌ای ارائه می‌گردد، با استانداردهای محتوایی تکمیل می‌شود. به همین دلیل، این دو استاندارد باید سازگار و مکمل یکدیگر عمل نمایند تا بتوانند به خوبی کار توصیف را انجام دهند. به بحث ثبت روابط در هر دو نوع استاندارد پرداخته شده است و باید از استانداردهای فراداده‌ای و محتوایی را توأمان به‌منظور برقراری پیوند بین موجودیت‌ها به کار برد. در این خصوص لازم به ذکر است روابط در استانداردهای فراداده‌ای درج می‌شوند و چگونگی ثبت روابط و استفاده از واژه‌ها و عبارات (نشانگرهای) مناسب برای برقراری پیوند با استفاده از استاندارد محتوایی تعیین می‌گردد. در اصل، استانداردهای محتوایی واژه‌ها یا عبارت‌هایی را تبیین می‌کنند که براساس دستورالعمل‌هایی خاص نوع رابطه را نشان داده و آن‌ها را در صفات فراداده‌ای ثبت می‌کنند. اما در اصل آن چیزی که موجودیت‌های داده‌ای را با یکدیگر پیوند می‌دهد و ارتباط برقرار می‌کند، استاندارد فراداده‌ای است.

در ادامه، به‌منظور دستیابی به درکی مناسب از رویکردهای برقراری ارتباط بین موجودیت‌ها مروری بر روی استانداردهای فراداده‌ای انجام شد و رویکردهای گوناگون استانداردها تبیین شد. در این خصوص دکتر طاهری افزود: هر موجودیت از ترکیب و ادغام صفات (ویژگی‌ها و روابط) به وجود می‌آید و رویکردی که اکنون در استانداردهای نوین مدنظر است، این است که هر آنچه وجود دارد رابطه است و صفات به صورت ویژگی ثبت نمی‌شوند. در داده‌های پیوندی نیز ما ویژگی نداریم و همه صفات یک شیء به صورت رابطه ثبت می‌شوند. در عالم واقعی نیز به همین گونه است. در سامانه ثبت آردی‌اِی (RDA Registry) نیز که در قالب داده‌های پیوندی پیاده‌ شده است، همه صفات به رابطه تبدیل شده‌اند و صفتی به صورت ویژگی نداریم.

در ادامه، دکتر طاهری با اشاره به شیوه‌های ثبت روابط در استانداردهای گوناگون عنوان کرد: دو شیوه برای ثبت روابط وجود دارد. در استانداردهای سنتی همانند یونی‌مارک بلوک 4 به ثبت روابط بین منابع اختصاص یافته بود؛ اما این بلوک رابطه‌ای فقط روابط بین دو منبع را نشان داده و رابطه سلسله مراتب یک شیء، روابط بین عامل‌ها با منابع و روابط عامل‌ها با یکدیگر را نشان نمی‌داد. دلیل این مسئله رویکرد متفاوت مارک در ثبت روابط بود. به‌طور نمونه، در بلوک 4 یونی‌مارک ارتباط بین فروست‌ها مانند رابطه توالی، نیز رابطه کل/جزء، روابط مربوط به پیایندها، ویرایش‌های مختلف، رابطه اشتقاقی (مثل ترجمه‌ها و اقتباس‌ها)، رابطه هم‌ارز،  بازتولیدها، نقدها و جز آن‌ها با خود منبع تعیین می‌شد. در یونی‌مارک برای بیشتر این روابط فیلد جداگانه‌ای اختصاص یافته بود و در آن فیلد فقط آن نوع رابطه را می‌توانستیم ثبت کنیم. این رویکرد را در برخی دیگر استانداردها هم مشاهده می‌کنیم. به طور مثال، فرانمای تولید داده‌های ساختارمند (schema.org) هر یک از روابط را به صورت صفت مستقل آورده است و صفاتی مثل بخشی است از( isPartOf)، براساس (isBasedOn)، قابل دسترس است از طریق (isAccessibleForFree) و جز آن‌ها صفات رابطه‌ای هستند که هر یک به صورت یک صفت مستقل ثبت می‌شوند.

سپس، دکتر طاهری با اشاره به رویکرد دوم به ثبت روابط در استانداردها گفت: در رویکرد دوم استانداردهایی همانند استاندارد مودس (MODS) را داریم. این استاندارد در ثبت روابط خیلی خوب کار کرده است. مودس بیست عنصر دارد که یکی از آنها به نام مورد مرتبط (relatedItem) است. در توصیف این صفت بیان شده است که  relatedItem شامل داده‌هایی است که دیگر منابع مرتبط با شیء در دست توصیف را شناسایی می‌کند. این صفت 20 عنصر فرعی (Sub-element) نیز دارد. بدین معنا که دقیقاً از طریق 20 عنصری که در خود مودس وجود دارند، می‌توان بین یک پیشینه مودس با دیگر پیشینه‌ها ارتباط برقرار کرد. به عبارتی دیگر، به‌طور دقیق می‌توان مشخص کرد بین دو پیشینه مودس کدام صفات از جمله عنوان (title)، نام (name)، نوع منبع (typeOfResource) و جز آن‌ها با یکدیگر مرتبط هستند. در این زمینه در رویکردی جدیدتر، در بیب‌فِریم با استفاده از سه عنصر relatedTo، relation و relationship روابط بین موجودیت‌ها را برقرار می‌کند. صفت relatedTo نشانگر هر رابطه‌ای بین اثر، نمونه، مورد و رویداد به صورت متقابل و قرینه (reciprocal)  است. با استفاده از این صفت می‌توان دو سطح رابطه اولیه (primary relationship) و رابطه ثانویه (secondary relationship) بین منابع برقرار کرد. رویکرد بیب‌فِریم به این صورت است که یک صفت به نام relatedTo دارد و انواع گوناگون روابط همانند نمونه‌ای دارد (hasInstance)، اشتقاقی دارد (hasDerivative)، هم‌ارزی دارد (hasEquivalent) و جز آن‌ها را بین منابع تعیین می‌کند.

وی افزود: بیب‌فِریم دو صفت دیگر نیز دارد که این‌ها نیز به روابط می‌پردازند. صفت relation به شناسایی منبع همبسته (Associative resource) و نوع ارتباط آن با منبع در دست توصیف می‌پردازد. رابطه فروست (Series) با عنوانی که در آن فروست قرار گرفته است، در این صفت ثبت می‌شود. و دیگر، صفت relationship در بیب‌فِریم مطرح است که همراه با صفت relation استفاده شده و رابطه یک منبع با فروست و یا یک مجموعه‌ها (collections) را مشخص می‌کند. استاندارد هسته دابلین نیز صفت relation را داشت که بیشتر ترجیحش این بود که از رشته ارزش و یا عددی برای برقراری پیوند استفاده کند. این رویکردها را در ثبت روابط داریم و همان طور که پیشتر نیز اشاره گردید، فراداده این روابط را برقرار می‌کند.

سپس، دکتر طاهری با اشاره به چالش‌های رویکردهای پیشین افزود: در رویکرد مارک که یک رویکرد سنتی بود و ما این رویکرد را در Schema.org هم مشاهده می‌کنیم. دو نقص وجود دارد: نخست، روابط بین سطوح سلسله مراتب یک شیء (Hierarchy of object) یعنی اثر، بیان، نمود و مورد (WEMI) که نخستین نوع رابطه است و سطوح سلسله مراتبی یک شیء را نشان می‌دهد، در رویکرد پیشین مدنظر قرار نگرفته است. این در حالی است که این نوع رابطه بسیار مهم است و هر موجودیتی در این چهار بعد با موجودیت‌های دیگر مرتبط است. دیگر ایراد رویکرد سنتی این است که برای هر فیلد یک رابطه اختصاص داده و هر فیلد یک نوع رابطه را نشان می‌دهد. در اسکیما هر رابطه‌ای یک صفت مجزا دارد. حال پرسشی که مطرح می‌شود این است: وقتی تعداد روابط زیاد است چه کار کنیم؟ یعنی همه این‌ها را در صفات جداگانه در پروفایل یا کاربرگه (Worksheet) بیاوریم؟ اکنون که آردی‌اِی حدود 900 رابطه دارد، باید همه آن‌ها تکرار شوند؟ ممکن است این پاسخ به نظر برسد که ما در نظام‌های مدیریت داده امکان worksheet generator را داریم و تنظیم می‌کنیم کدام صفات را بیاوریم. اما شایان توجه است که در خصوص صفات رابطه‌ای خیلی نمی‌توان این شیوه را به کار برد؛ چرا که  ما نمی دانیم یک منبع با دیگر منابع چه نوع رابطه‌ای دارد. منابع به صورت بالقوه می‌توانند هر نوع رابطه‌ای با یکدیگر داشته باشند. پس در عمل باید یک worksheet خیلی مفصلی داشته باشیم.

وی در ادامه گفت: در گسترش bib.schema.org که گسترش کتابشناختی اسکیما است نیز همین چالش‌ها مشاهده می‌شود. در این گسترش تعدادی از موجودیت‌های بافت کتابشناختی مانند اطلس‌ها، کتاب‌های صوتی، فصل‌هایی از کتاب، مجموعه‌ها و جز آن‌ها در نظر گرفته شده‌اند و برای آن‌ها تعدادی صفت مانند خلاصه‌شده (abridged) و یا در پشتیبانی از (inSupportOf)، ترجمه اثر (translationOfWork)، خوانده شده توسط (readBy)، منتشر شده توسط (publishedBy) مطرح شده‌اند. در این گسترش نیز چالش‌هایی که پیشتر اشاره گردید، قابل مشاهده است. نکته حائز اهمیت این است که در این گسترش در کنار رابطه بین منابع (resource to resource) روابط عامل‌ها با منابع (resource to agent) نیز ثبت شده‌اند. با توجه به اینکه در گسترش bib.schema.org روابط بین عامل‌ها و منابع را نیز مورد توجه قرار داده است، افزون بر بیش از 900 نشانگری که در پی‌افزودهای J و M آردی‌اِی وجود دارند، باید بیش از 400 نقش‌دهنده (Relator) را برای ثبت روابط بین عامل‌ها و منابع بیفزاید. بدین ترتیب شمار صفاتی که باید در این گسترش گنجانده شوند حدود 1400 صفت است.

چالش دیگری که در این زمینه مطرح است چگونگی ثبت محتوا و ارزش‌ها در صفات یادشده است؛ چرا که خود نام صفت نشانگر رابطه است و این در ثبت محتوا مشکل آفرین است حتی اگر از روش داده‌های پیوندی استفاده شده باشد. این در حالی است که در مودس صفت relatedItem، در بیب‌فِریم صفت relatedTo و در آردی‌اِی پی‌افزودها را با هدف ثبت روابط ارائه شده‌اند. به‌طور نمونه، درآردی‌اِی که نشانگرهای رابطه‌ای را برای ثبت روابط به کار می‌برد، این مشکل وجود ندارد. در اصل، نشانگر یک صفت است (بیشتر یک صفت فرعی) است که برخلاف رویکرد پیشین، مشکل ثبت ارزش‌ها وجود ندارد و امکان پیونددهی منابع با یکدیگر تسهیل می‌گردد. 

عضو هیأت علمی دانشگاه علامه طباطبایی افزود: ما دقیقا یک سیر تحولی را که براساس نیازهای بافت خاص بوده است را مشاهده می‌کنیم. نخست، اختصاص فیلد یا صفت مجزا البته به صورت ناقص را داشتیم که همه انواع روابط را پوشش نمی‌داد. در رویکرد دوم، استانداردهایی همانند مودس به تعداد تمام عناصر یک عنصر فرعی افزوده‌ شد. در رویکرد پسین همه عناصر فرعی که در استانداردهایی همانند مودس وجود داشتند، به نشانگر تبدیل شده‌اند.

در ادامه، دکتر طاهری با اشاره به بهترین رویکرد و شیوه ثبت روابط گفت: در رویکرد جدید که مبتنی بر آردی‌اِی است، بهترین رویکرد ثبت روابط و مدل تکامل یافته همه رویکردهای پیشین را داریم که افزون بر ایجاد انسجام و یکدستی موجب انعطاف‌پذیری در ثبت روابط می‌شود. حتی در بیب‌فِریم نیز مشکل داشتیم که همانند مودس صفات فرعی دارد و چگونگی ثبت دیگر روابط مشخص نیست. هرچند بیب‌فِریم به جای همه استانداردهای پیشین همانند مودس، متس و غیره آمده و جایگزین همه آن‌ها شده است؛ چراکه از همه کارکردهای حوزه فراداده پشتیبانی می‌کند. اما بیب‌فِریم تا حدود زیادی از لحاظ ثبت روابط باز مشابه مودس عمل کرده است.

در ادامه دکتر طاهری با اشاره به سیر تکامل استانداردهای فراداده‌ای گفت: در سیر تکامل استانداردهای فراداده‌ای ما چندین نسل را داشتیم. یک نسل از استانداردها مبتنی بر پایگاه داده (database-based) بودند مثل مارک که از نظر بستر نحوی، مبتنی بر قالب محلی پایگاه داده بود. نسل دوم استانداردها مبتنی بر بستر نحوی ایکس‌ام‌ال بودند (XML-based) که مارک ایکس‌ام‌ال (MARC/XML)، مودس (MODS)، متس (METS)، مدس (MADS)، و میکس (MIX) در این دسته قرار دارند. نسل پسین، استانداردهای همانند بیب‌فِریم بودند که به جای زبان‌های نشانه‌گذاری ماشین‌خوان به سمت زبان‌های نشانه‌گذاری ماشین‌فهم همانند آردی‌اِف و جی‌سان حرکت کرده‌اند.

وی افزود: در رویکرد نوین پیوست‌های آردی‌اِی و دیگر روابط مورد نیاز، در قالب واژگان (Vocabulary) حتی به صورت جداگانه و تفکیک‌شده در سیستم ثبت شده و به یک منبع اختصاص می‌یابند. این رویکرد امکان انعطاف‌پذیری را فراهم می‌کند. هر رابطه جدیدی هم که لازم باشد، می‌توان در یک نظام مبتنی بر هستی‌شناسی (Ontology-based) بافت‌های گوناگون تعریف کرد. از سوی دیگر، حتی برخی صفات را می‌توان به صورت محلی (Local) به واژگان افزود. ممکن است در یک بافت خاص تعدادی رابطه وجود داشته باشند که در جای دیگر لازم نیستند و به طور ویژه در یک بافت کشف شده‌اند و ثبت آن‌ها ضروری است. استفاده از نشانگرهای رابطه‌ای در سیستم بهترین روش برای طراحی است و کاملا دست ما را باز می‌گذارد که بین موجودیت‌ها انواع گوناگون روابط را برقرار کنیم.

دکتر طاهری به چگونگی ثبت روابط در سیستم‌های مدیریت داده پرداخت و گفت:: روابط اولیه یک منبع که به صورت سلسله مراتب شیء ثبت می‌شوند را سامانه‌های مبتنی بر ال‌آرام (LRMized) به صورت خودکار پشتیبانی می‌کنند. روابط اولیه بین منابع در سیستم مشخص می‌شوند و نیازی نیست مشخص کنیم، نمود یک اثر چیست و یا مورد یک نمود کدام یک است. خود سامانه اگر مبتنی بر ال‌آرام باشد این نوع روابط را پشتیبانی می‌کند. یکی از روش‌هایی که می‌توانیم تشخیص بدهیم یک سامانه LRMized است یا خیر؟ این است که به چگونگی ثبت روابط اولیه توجه کنیم. اگر مبتنی بر ال‌آرام نباشد، به‌طور مثال در یک سامانه‌ای که استاندارد فراداده‌ای آن مارک است، برای اینکه بتوانیم ال‌آرام را پیاده‌سازی کنیم، باید در فیلدهای رابطه‌ای مشخص کنیم که اثر و یا نمود یک شیء چیست؛ چرا که خود سامانه قابلیت بازنمود ساختار سلسله مراتبی شیء را ندارد. سامانه‌ای که مبتنی بر ال‌آرام پیاده‌سازی شده است، نیازی به ثبت این روابط از سوی فهرست‌نویس نیست و خود سامانه این نوع روابط را شامل می‌شود و اگر بخواهیم یک اثر را ثبت کنیم باید نمود آن را هم ثبت کنیم و یا در توصیف یک نمود باید اثر آن را تعیین نماییم. این معیاری بسیار مناسب برای این است که دریابیم یک سامانه مبتنی بر ال‌آرام است یا خیر؟. برای ثبت روابط بین منابع از صفت relatedto استفاده می‌شود. در این صفت می‌توان به دلیل گستردگی تعداد روابط از نشانگرهای آردی‌اِی بهره گرفته و روابط اولیه و ثانویه منابع را مشخص کرد.

سپس، دکتر طاهری در خصوص تعیین صفات رابطه‌ای گفت: ما نشانگرهای رابطه‌ای را در صفاتی که قرار است، رابطه‌ای خاص را پشتیبانی کنند، ثبت می‌کنیم. به‌طور نمونه در صفت پدیدآورنده که می‌خواهیم نقش اختصاص بدهیم، از نشانگرها استفاده می‌کنیم. مارک اصطلاحا به آن‌ها نقش‌دهنده (relator) می‌گوید که نقش‌ها را مشخص می‌کند و این نقش‌ها رابطه عامل (پدیدآورنده، ناشر و جز آن‌ها) را با منبع نشان می‌دهند. به این نقش‌‌دهنده‌ها و نشانگرها گویاسازی روابط گفته می‌شود. این ابزارها نوع روابط را نشان داده، و پایه و اساس توسعه هستی‌شناسی‌ها هستند. هستی‌شناسی‌ها بدین منظور توسعه می‌یابند تا وجود رابطه و نوع روابط را بین موجودیت‌های گوناگون بازنمود کنند. به‌طور مثال، نشان می‌دهند یک شخص عضوی از یک سازمان است و نوع رابطه‌ای که با آن دارد «فارغ‌التحصیلی» است.

وی در ادامه با بیان چگونگی ثبت روابط بین عامل‌ها گفت: در رویکردهای پیشین رابطه بین عامل‌ها و منابع در بایگانی‌های مستند ثبت می‌شدند که تمرکز آنها صرفا بر روی نام‌های موجودیت‌های عامل بود. در حالی که در استانداردهای جدید برای خود موجودیت عامل، و نه فقط نام آنها، یک پروفایل منحصر به فرد ایجاد می‌شود. در روزآمدسازی بیب‌فِریم نیز همین مسئله مدنظر بوده و در بیب‌فِریم 2.0 حذف موجودیت مستندات را شاهد هستیم. ساختار بیب‌فِریم 1.0 بدین گونه بود که موجودیت‌های اثر، نمونه، مستندات و گزاره‌مان را شامل می‌شد. اما در نسخه دوم آن موجودیت مستندات حذف شده و موجودیت‌هایی همانند شخص، سازمان، مکان‌ و هر آن چیزی که دارای نام است، به صورت موجودیت‌های عالم واقعی بازنمود می‌شوند؛ چرا که این موجودیت‌ها فراتر از یک نام هستند. تمرکز مستندات بر روی نام موجودیت است. در حالی که ما خود موجودیت را به صورت جداگانه داریم. یک موجودیت افزون بر نام صفات مهم دیگری نیز دارد که لازم است توصیف شوند. حال وقتی بخواهیم یک شخص را به یک سازمان پیوند بدهیم. باید برای شخص و سازمان پروفایل خاص ایجاد کرده و سپس آن شخص را به سازمان مرتبط پیوند دهیم. بدین ترتیب برای ثبت روابط بین عامل‌های گوناگون برای هر عامل باید پروفایل جداگانه‌ای ایجاد شود و آن پروفایل‌ها را به یکدیگر ربط دهیم. نام سازمان و موجودیت مرتبط نیز بر اساس فرانمای رمزگذاری واژگان (از جمله مستندات) ثبت می‌گردد. افزون بر رویکرد بیب‌فریم در حذف موجودیت مستندات، در آردی‌اِی نیز عامل‌ها به صورت موجودیت‌های مجزا در نظر گرفته می‌شوند و در ال‌آرام نیز موجودیت نام‌نما (Nomen) به نام‌های موجودیت‌ها می‌پردازد و از خود شخص که موجودیتی مستقل است، تفکیک شده است. در سیستم‌های هستی‌شناسانه اگر بخواهیم به‌طور کامل براساس استاندارد عمل کنیم، باید در ثبت صفت پدیدآورنده، پروفایل خود شخص را با همه صفاتی که دارد به منبع پیوند بدهیم. البته که برای ثبت نام شخص از مستندات بهره می‌گیریم و نقشی را که آن شخص در ارتباط با منبع دارد، تعیین می‌کنیم. یک شخص ممکن است نقش‌های متفاوتی در منابع گوناگون داشته باشد و بهتر است در خود منبع تعیین کنیم یک شخص در آن اثر چه نقشی دارد و سپس نوع رابطه را تعیین کنیم.

در بخش پایانی جلسه نیز به پرسش‌های حضار پاسخ داده شد. ششمین جلسه از این دوره به بحث انسجام بین استانداردهای فراداده‌ای و محتوایی در ثبت روابط اختصاص خواهد یافت.

 

گزارش: نگین شکرزاده هشترودی