داخلی
»سخن هفته
لیزنا؛ملیحه درخوش[1]،دکتری علم اطلاعات و دانششناسی؛ معاون سیاستگذاری منابع علمی کتابخانه مرکزی و مرکز اسناد دانشگاه تهران: کتابخانهها و مراکز اطلاعرسانی سالهاست که فرایند دقیق و هزینه بر فهرستنویسی را انجام میدهند. نتیجه این فعالیت رکوردهای فهرستنویسی با استفاده از استانداردهای محتوایی مانند انگلوامریکن[2] و در قالب استانداردهای فرادادهای مانند مارک[3] است. این رکوردها سرمایههای محتوایی و علمی هستند که در تمام کتابخانههای دنیا وجود دارند. سرمایههایی که ساعتها وقت متخصصان فهرستنویسی و هزینههای زیادی برای تولید آنها صرف شده است.
سازماندهی اطلاعات همواره تحت تأثیر تغییرات فناوری بوده است. با ظهور پیاپی فناوریهای جدید، تفکر، روش و ابزار تغییر کرده و فهرستنویسی به عنوان یک فعالیت تخصصی با نوآوریهای روز هماهنگ شده است.
در عصر هوش مصنوعی که تمامی فعالیتها سعی در استفاده از این فناوری دارند، فهرستنویسی و ردهبندی منابع کتابخانهای نیز در استفاده از فناوری جدید مستثنی نخواهد بود. اما پرسش این است که آیا میتوان از رکوردهای تولید شده در کتابخانهها در هوش مصنوعی استفاده کرد و راهکاری برای فهرستنویسی منابع جدید با کمک هوش مصنوعی به دست آورد؟
این جستار به مسایل استفاده از رکوردهای قدیمی در هوش مصنوعی و به کارگیری آنها برای رویههای جدید میپردازد و از مقالاتی که تا به حال در زمینه استفاده از رکوردهای قدیمی به عنوان الگو برای هوش مصنوعی و به ویژه ChatGPT به عنوان یک مدل زبانی بزرگ[4] پرطرفدار نگاشته شده و به ارزیابی و مقایسه رکوردهای ایجاد شده توسط انسان و ChatGPT پرداخته استفاده میکند.
نویسندگان این مقالات[5] که از متخصصان و پژوهشگران در زمینه سازماندهی اطلاعات هستند، بر این باورند که از نوامبر 2022 و با انتشار ChatGPT علاقه به استفاده از هوش مصنوعی در فعالیتهای کتابخانه رشد چشمگیری داشته و پتانسیل هوش مصنوعی میتواند به بهبود فرایندهای کتابخانهها کمک کند اما باید با آگاهی از محدودیتها این استفاده انجام پذیرد.
آنها به بررسی دقتِ دادههای آموزشی ارائه شده به هوش مصنوعی مولد[6] پرداختهاند و دقت ChatGPT را مبتنی بر میزان دقت دادههای آموزشی دانستهاند. در واقع کتابداران برای استفاده از هوش مصنوعی، موظف به ارائه دادههایی دقیق برای آموزش آن هستند. دادههای دقیق در فرایند فهرستنویسی و ردهبندی، هم شامل رکوردهای موجود است که هوش مصنوعی از آنها الگوبرداری کرده و رکوردهای جدید را بر اساس آن تولید میکند و هم منابع مرجع مورداستفاده برای فعالیت فهرستنویسی و ردهبندی (مانند متن و راهنماهای استفاده از قواعد انگلوامریکن و توصیف و دسترسی به منبع[7] و استانداردهای فرادادهای یونی مارک، مارک 21 و دستنامههای فهرستنویسی) که باید آنها را به هوش مصنوعی آموزش داد تا در فرایند یادگیری استفاده کند.
در بررسیهایی که بر روی رکوردهای تولید شده بر مبنای یادگیری از رکوردهای قبلی کتابخانهها توسط ChatGPT انجام شده، رکوردهایی با اطلاعات اشتباه نیز تولید شده که اصطلاحاً به آنها درک نادرست[8] گفته میشود و اطلاعات اشتباهی ارائه میشود که نیاز به بررسی و اصلاح توسط کتابدار متخصص دارد. به طور حتم با ارائه ویرایشهای جدید از مدلهای زبانی بزرگ، این مشکلات نیز کمتر خواهد شد.
در مقالاتی که در زمینه به کارگیری هوش مصنوعی در فهرستنویسی و ردهبندی نوشته شده، به موارد زیر به عنوان کاربردهای هوش مصنوعی اشاره شده است:
در مقالهای که تانیگوچی[10] (2024) با هدف ایجاد و ارزیابی رکوردهای کتابشناختی با استفاده از ChatGPT در سال 2024 منتشر کرده، به چالشهایی برای تولید نقاط دسترسی مجاز، عناوین مرتبط، اطلاعات ناحیه ویرایش، شناسههای افزوده، تشخیص مستند نام اشخاص و فیلدهای ارتباطی در رکوردهای تولیدشده در قالب مارک 21 اشاره میکند:
در این مقالات علاوه بر کاربردها و فواید استفاده از هوش مصنوعی در فهرستنویسی، به چالشهای استفاده از هوش مصنوعی در فهرستنویسی نیز اشاره شده است. موارد زیر برخی از این چالشها هستند:
با توجه به مطالب مطرح شده، میتوان به نکات زیر به عنوان نتایج پژوهشهای انجامشده در این زمینه اشاره کرد:
فهرستنویسان در فرایند استفاده از هوش مصنوعی برای فهرستنویسی و ردهبندی نقش مهمی ایفا میکنند. آموزش فهرستنویسان برای سازگاری با روشهای جدید استفاده از هوش مصنوعی، چگونگی آموزش فهرستنویسی و ردهبندی به هوش مصنوعی، نحوه به کارگیری هوش مصنوعی برای فهرستنویسی توصیفی و تحلیلی، نظارت و اصلاح اطلاعات فهرستنویسی به دست آمده از هوش مصنوعی توسط فهرستنویسان از جمله نکاتی است که کتابخانهها در آینده برای استفاده از این فناوری جدید در تغییر فرایندهای سنتی خود باید درنظر بگیرند.
درخوش، ملیحه (۱۴۰۳). « فهرستنویسی و هوش مصنوعی». سخن هفته لیزنا، شماره 732، 29 بهمن ماه ۱۴۰۳.
-----------------------------------------------
منابع و مآخذ
Brzustowicz, Richard. (2023). From ChatGPT to CatGPT The Implications of Artificial Intelligence on Library Cataloging. INFORMATION TECHNOLOGY AND LIBRARIES. DOI: 10.5860/ital.v42i3.16295
Moulaison-Sandy , Heather & Coble, Zach. (2024). Leveraging AI in Cataloging: What Works, and Why?, Technical Services Quarterly, 41:4, 375-383, DOI: 10.1080/07317131.2024.2394912
Niveditha, B., Harinarayana, N. S., & Balachandran, C. (2024). Error Analysis in ChatGPT’s MARC21 Records: A Study of RDA Conformity. Journal of Information and Knowledge, 61(4), 187–195. https://doi.org/10.17821/srels/2024/v61i4/171481
Taniguchi, Shoichi. (2024) Creating and Evaluating MARC 21 Bibliographic Records Using ChatGPT, Cataloging & Classification Quarterly, 62:5, 527-546, DOI: 10.1080/01639374.2024.2394513
-------------------------------------------------------
[1] این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید
[2] Anglo-American Cataloging Rules (AACRII)
[3] MAchine-Readable Cataloging (MARC)
[4] Large Language Models (LLMs)
[5] مقالات ذکرشده در منابع و مآخذ
[6] Generative Artificial Intelligence
[7] Resource Description & Access (RDA)
[8] Hallucinations
[9] Format
[10] Taniguchi, Shoichi
[11] Natural Language Processing (NLP)
[12] Named-entity recognition (NER)
یک فعالیت فرعی در پردازش طبان طبیعی که شامل استخراج اطلاعات است. برای تشخیص موجودیتهای نامدار، به دنبال مکانیابی و طبقهبندی موجودیت های نامگذاریشده در متنهای بدون ساختار هستند تا آنها را به دستههای از پیش تعریفشده مانند نام افراد، سازمانها، مکانها، کدهای پزشکی، عبارات زمانی، کمیتها، ارزشهای پولی، درصد و غیره تبدیل کنند.
[13] Sentiment Analysis
۱. از توهین به افراد، قومیتها و نژادها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهامزنی به دیگران خودداری نمائید.
۲.از آنجا که پیامها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمانها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.