کد خبر: 49490
تاریخ انتشار: دوشنبه, 29 بهمن 1403 - 09:03

داخلی

»

سخن هفته

فهرست‌نویسی و هوش مصنوعی

منبع : لیزنا
ملیحه درخوش
فهرست‌نویسی و هوش مصنوعی

لیزنا؛ملیحه درخوش[1]،دکتری علم اطلاعات و دانش‌شناسی؛ معاون سیاست‌گذاری منابع علمی کتابخانه مرکزی و مرکز اسناد دانشگاه تهران: کتابخانه‌ها و مراکز اطلاع‌رسانی سال‌هاست که فرایند دقیق و هزینه بر فهرست‌نویسی را انجام می‌دهند. نتیجه این فعالیت رکوردهای فهرست‌نویسی با استفاده از استانداردهای محتوایی مانند انگلوامریکن[2] و در قالب استانداردهای فراداده‌ای مانند مارک[3] است. این رکوردها سرمایه‌های محتوایی و علمی هستند که در تمام کتابخانه‌های دنیا وجود دارند. سرمایه‌هایی که ساعت‌ها وقت متخصصان فهرست‌نویسی و هزینه‌های زیادی برای تولید آنها صرف شده است.

سازماندهی اطلاعات همواره تحت تأثیر تغییرات فناوری بوده است. با ظهور پیاپی فناوری‌های جدید، تفکر، روش و ابزار تغییر کرده و فهرست‌نویسی به عنوان یک فعالیت تخصصی با نوآوری‌های روز هماهنگ شده است.

در عصر هوش مصنوعی که تمامی فعالیت‌ها سعی در استفاده از این فناوری دارند، فهرست‌نویسی و رده‌بندی منابع کتابخانه‌ای نیز در استفاده از فناوری جدید مستثنی نخواهد بود. اما پرسش این است که آیا می‌توان از رکوردهای تولید شده در کتابخانه‌ها در هوش مصنوعی استفاده کرد و راهکاری برای فهرست‌نویسی منابع جدید با کمک هوش مصنوعی به دست آورد؟

این جستار به مسایل استفاده از رکوردهای قدیمی در هوش مصنوعی و به کارگیری آنها برای رویه‌های جدید می‌پردازد و از مقالاتی که تا به حال در زمینه استفاده از رکوردهای قدیمی به عنوان الگو برای هوش مصنوعی و به ویژه ChatGPT به عنوان یک مدل زبانی بزرگ[4] پرطرفدار نگاشته شده و به ارزیابی و مقایسه رکوردهای ایجاد شده توسط انسان و ChatGPT  پرداخته استفاده می‌کند.

نویسندگان این مقالات[5] که از متخصصان و پژوهشگران در زمینه سازماندهی اطلاعات هستند، بر این باورند که از نوامبر 2022 و با انتشار ChatGPT علاقه به استفاده از هوش مصنوعی در فعالیت‌های کتابخانه رشد چشم‌گیری داشته و پتانسیل هوش مصنوعی می‌تواند به بهبود فرایندهای کتابخانه‌ها کمک کند اما باید با آگاهی از محدودیت‌ها این استفاده انجام پذیرد.

آنها به بررسی دقتِ داد‌ه‌های آموزشی ارائه شده به هوش مصنوعی مولد[6] پرداخته‌اند و دقت ChatGPT را مبتنی بر میزان دقت داده‌های آموزشی دانسته‌اند. در واقع کتابداران برای استفاده از هوش مصنوعی، موظف به ارائه داده‌هایی دقیق برای آموزش آن هستند. داده‌های دقیق در فرایند فهرست‌نویسی و رده‌بندی، هم شامل رکوردهای موجود است که هوش مصنوعی از آنها الگوبرداری کرده و رکوردهای جدید را بر اساس آن تولید می‌کند و هم منابع مرجع مورداستفاده برای فعالیت فهرست‌نویسی و رده‌بندی (مانند متن و راهنماهای استفاده از قواعد انگلوامریکن و توصیف و دسترسی به منبع[7] و استانداردهای فراداده‌ای یونی مارک، مارک 21 و دستنامه‌های فهرست‌نویسی) که باید آنها را به هوش مصنوعی آموزش داد تا در فرایند یادگیری استفاده کند.

در بررسی‌هایی که بر روی رکوردهای تولید شده بر مبنای یادگیری از رکوردهای قبلی کتابخانه‌ها توسط ChatGPT انجام شده، رکوردهایی با اطلاعات اشتباه نیز تولید شده که اصطلاحاً به آنها درک نادرست[8] گفته می‌شود و اطلاعات اشتباهی ارائه می‌شود که نیاز به بررسی و اصلاح توسط کتابدار متخصص دارد. به طور حتم با ارائه ویرایش‌های جدید از مدل‌های زبانی بزرگ، این مشکلات نیز کمتر خواهد شد.

در مقالاتی که در زمینه به کارگیری هوش مصنوعی در فهرست‌نویسی و رده‌بندی نوشته شده، به موارد زیر به عنوان کاربردهای هوش مصنوعی اشاره شده است:

  • ایجاد رکوردهای مارک: هوش مصنوعی می‌تواند رکوردهای مارک تولید کند اما اصلاح رکوردها توسط فهرست‌نویسان اجتناب‌ناپذیر است.
  • تخصیص سرعنوان موضوعی: هوش مصنوعی می‌تواند به تخصیص سرعنوان‌های موضوعی کنگره در رکورد فهرست‌نویسی کمک کند اما این فرایند نیاز به تنظیمات دقیق و داده‌های آموزشی مناسب دارد.
  • بهبود کارایی: استفاده از هوش مصنوعی می‌تواند فرایند فهرست‌نویسی و رده‌بندی را سریع‌تر و کارآمدتر کند اما باید مراقب بود که دقت و کیفیت کاهش نیابد.
  • تنوع زبانی و قالب[9] منابع: توانایی هوش مصنوعی در ایجاد رکورد برای منابعی با زبان‌های مختلف مانند آلمانی، چینی، روسی و غیره و در قالب‌های گوناگون مانند کتاب، سند، پایان‌نامه، فایل صوتی، فایل تصویری و غیره می‌تواند به فهرست‌نویسی این منابع کمک کند.
  • ظرفیت هوش مصنوعی در بهبود فرآیندها: هوش مصنوعی می‌تواند وظایف تکراری و پیچیده را خودکار کند، از جمله ایجاد رکوردهای فهرست‌نویسی. با این حال، دقت و تطابق با استانداردهای فهرست‌نویسی نباید به صورت سطحی در نظر گرفته شود.

در مقاله‌ای که تانیگوچی[10] (2024) با هدف ایجاد و ارزیابی رکوردهای کتابشناختی با استفاده از ChatGPT در سال 2024 منتشر کرده، به چالش‌هایی برای تولید نقاط دسترسی مجاز، عناوین مرتبط، اطلاعات ناحیه ویرایش، شناسه‌های افزوده، تشخیص مستند نام اشخاص و فیلدهای ارتباطی در رکوردهای تولیدشده در قالب مارک 21 اشاره می‌کند:

  • فیلدهای 1XX و 7XX: ChatGPT در تشخیص نقاط دسترسی اصلی و شناسه‌های افزوده با مشکلاتی مواجه است. به عنوان مثال، در برخی موارد، فیلد 1XX (سرشناسه) به اشتباه با فیلد 7XX (شناسه‌های افزوده) جایگزین شد.
  • فیلدهای 245 و 246 (عنوان، شرح مسئولیت و عنوان‌های دیگر): ChatGPT در ثبت عنوان‌ها و مسئولیت‌ها با الگوهای پیچیده مشکل داشت. به عنوان مثال، در یک مورد، عنوان اصلی به اشتباه به صورت عنوان فرعی ثبت شد.
  • فیلد 250 (اطلاعات ویرایش): در برخی موارد، اطلاعات ویرایش به اشتباه به صورت بخشی از عنوان اصلی ثبت شدند.
  • فیلد 264 (جزئیات انتشار): ChatGPT در ثبت تاریخ و مکان انتشار با مشکلاتی مواجه بود و گاهی تاریخ انتشار را به جای تاریخ کپی‌رایت ثبت می‌کرد.
  • فیلدهای 490 و 8XX (اطلاعات فروست): در برخی موارد، اطلاعات فروست به اشتباه به صورت سایر اطلاعات عنوان ثبت شدند.
  • فیلدهای 02X (شابک و سایر شناسه‌ها): ChatGPT در ثبت صحیح شابک و سایر شناسه‌ها با مشکلاتی مواجه بود و گاهی چندین شابک را در یک فیلد ثبت می‌کرد.

در این مقالات علاوه بر کاربردها و فواید استفاده از هوش مصنوعی در فهرست‌نویسی، به چالش‌های استفاده از هوش مصنوعی در فهرست‌نویسی نیز اشاره شده است. موارد زیر برخی از این چالش‌ها هستند:

  • کاهش کیفیت: استفاده گسترده از هوش مصنوعی ممکن است منجر به کاهش کیفیت فهرست‌نویسی و ار دست رفتن جزئیات مهم شود.
  • کاهش دقت و اعتمادپذیری: سیستم‌های هوش مصنوعی مانند ChatGPT ممکن است نتایجی تولید کنند که به ظاهر درست به نظر می‌رسند، اما در واقع نادرست باشند. این مسئله به دلیل محدودیت‌های داده‌های آموزشی و الگوریتم‌های مورد استفاده است.
  • پیچیدگی استانداردهای فهرست‌نویسی: فهرست‌نویسی شامل لایه‌های متعددی از استانداردها (مانند توصیف و دسترسی به منبع، مارک و تحلیل موضوعی) است که اعمال هم‌زمان آن‌ها توسط هوش مصنوعی چالش‌برانگیز است.
  • نیاز به نظارت انسانی: حتی با وجود پیشرفت‌های هوش مصنوعی، نظارت و بررسی انسانی برای اطمینان از دقت و کیفیت رکوردهای فهرست‌نویسی ضروری است.
  • انتقال سوگیری: سیستم‌های هوش مصنوعی ممکن است سوگیری‌های موجود در داده‌های آموزشی (طرح‌های رده‌بندی و رکوردهای موجود) را به فهرست کتابخانه‌ها منتقل کنند.
  • وابستگی به فروشندگان: کتابخانه‌ها ممکن است برای استفاده از هوش مصنوعی به سیستم‌های ارائه شده توسط فروشندگان وابسته شوند که می‌تواند محدودیت‌هایی را ایجاد کند.
  • پردازش زبان طبیعی[11]: یکی از زیرشاخه‌های مهم هوش مصنوعی پردازش زبان طبیعی است که به سیستم‌ها امکان می‌دهد زبان انسان را درک و پردازش کنند. این فناوری در ترجمه خودکار، تشخیص موجودیت‌های نام‌دار[12] و تحلیل احساسات[13] کاربرد دارد. این مساله در مورد منابعی با زبان هایی مانند چینی، فارسی، ژاپنی بسیار بااهمیت و چالش‌برانگیز است.

با توجه به مطالب مطرح شده، می‌توان به نکات زیر به عنوان نتایج پژوهش‌های انجام‌شده در این زمینه اشاره کرد:

  • کارایی: ChatGPT می‌تواند زمان و منابع موردنیاز برای فهرست‌نویسی را کاهش دهد و به کتابداران اجازه دهد تا بر وظایف مهم‌تری مانند توسعه مجموعه و خدمات کاربران تمرکز کنند.
  • دقت و سازگاری: رکوردهای ایجاد شده توسط ChatGPT از دقت و سازگاری بالایی برخوردار هستند که می‌توانند تجربه جستجو و کشف منابع را برای کاربران بهبود بخشند.
  • ملاحظات اخلاقی و حقوقی: استفاده از ChatGPT نیاز به بررسی دقیق مسایل مربوط به مالکیت معنوی، سوگیری و حریم خصوصی دارد.
  • ظرفیت هوش مصنوعی: ChatGPT می‌تواند به عنوان ابزار کمکی در فرایند فهرست‌نویسی استفاده شود اما باید در کنار تلاش‌های انسانی به کارگرفته شود تا بالاترین سطح دقت و بی‌طرفی تضمین شود.
  • نیاز به نظارت مداوم: نظارت و ارزیابی مداوم داده‌های آموزشی در رکوردهای ایجاد شده توسط ChatGPT ضروری است تا از دقت و بی‌طرفی آن اطمینان حاصل شود.

فهرست‌نویسان در فرایند استفاده از هوش مصنوعی برای فهرست‌نویسی و رده‌بندی نقش مهمی ایفا می‌کنند. آموزش فهرست‌نویسان برای سازگاری با روش‌های جدید استفاده از هوش مصنوعی، چگونگی آموزش فهرست‌نویسی و رده‌بندی به هوش مصنوعی، نحوه به کارگیری هوش مصنوعی برای فهرست‌نویسی توصیفی و تحلیلی، نظارت و اصلاح اطلاعات فهرست‌نویسی به دست آمده از هوش مصنوعی توسط فهرست‌نویسان از جمله نکاتی است که کتابخانه‌ها در آینده برای استفاده از این فناوری جدید در تغییر فرایندهای سنتی خود باید درنظر بگیرند.

 

درخوش، ملیحه (۱۴۰۳). « فهرست‌نویسی و هوش مصنوعی». سخن هفته لیزنا، شماره 732، 29 بهمن ماه ۱۴۰۳.

 

-----------------------------------------------

منابع و مآخذ

Brzustowicz, Richard. (2023). From ChatGPT to CatGPT The Implications of Artificial Intelligence on Library Cataloging. INFORMATION TECHNOLOGY AND LIBRARIES. DOI: 10.5860/ital.v42i3.16295

 

Moulaison-Sandy , Heather & Coble, Zach. (2024). Leveraging AI in Cataloging: What Works, and Why?, Technical Services Quarterly, 41:4, 375-383, DOI: 10.1080/07317131.2024.2394912

 

Niveditha, B., Harinarayana, N. S., & Balachandran, C. (2024). Error Analysis in ChatGPT’s MARC21 Records: A Study of RDA Conformity. Journal of Information and Knowledge, 61(4), 187–195. https://doi.org/10.17821/srels/2024/v61i4/171481

 

Taniguchi, Shoichi. (2024) Creating and Evaluating MARC 21 Bibliographic Records Using ChatGPT, Cataloging & Classification Quarterly, 62:5, 527-546, DOI: 10.1080/01639374.2024.2394513

 -------------------------------------------------------

[1] این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

[2] Anglo-American Cataloging Rules (AACRII)

[3] MAchine-Readable Cataloging (MARC)

[4] Large Language Models (LLMs)

[5] مقالات ذکرشده در منابع و مآخذ

[6] Generative Artificial Intelligence

[7] Resource Description & Access (RDA)

[8] Hallucinations

[9] Format

[10] Taniguchi, Shoichi

[11] Natural Language Processing (NLP)

[12] Named-entity recognition (NER)

یک فعالیت فرعی در پردازش طبان طبیعی که شامل استخراج اطلاعات است. برای تشخیص موجودیت‌های نام‌دار، به دنبال مکان‌یابی و طبقه‌بندی موجودیت های نام‌گذاری‌شده در متن‌های بدون ساختار هستند تا آنها را به دسته‌های از پیش تعریف‌شده مانند نام افراد، سازمان‌ها، مکان‌ها، کدهای پزشکی، عبارات زمانی، کمیت‌ها، ارزش‌های پولی، درصد و غیره تبدیل کنند.

[13] Sentiment Analysis