کد خبر: 45630
تاریخ انتشار: دوشنبه, 12 ارديبهشت 1401 - 09:19

داخلی

»

سخن هفته

اجبار به اشتراک گذاری داده‌های پژوهشی باز در دو سوی اقیانوس:

پژوهش باز، داده‌های باز

منبع : لیزنا
سیدابراهیم عمرانی
پژوهش باز، داده‌های باز

لیزنا؛ سیدابراهیم عمرانی، سردبیر: در سال 2016، «اصول راهنمای استفاده منصفانه برای مدیریت و سرپرستی داده‌های علمی» توسط نیچر و در Science Data منتشر شد[1] و بحث‌های فراوانی در مورد تعریف داده‌های جستجوپذیر، دسترس‌پذیر، تعامل پذیر و داده هایی که قابلیت استفاده مجدد دارند به دست داده شد. اگرچه هر مؤسسه، ناشر و سرمایه‌گذار ممکن است دقیقاً یک هدف را منظور نداشته باشند، با اینهمه در مقاله یادآور شده است که این حرکت برای توصیف بهتر و در نهایت قابل استفاده کردن خروجی‌های داده به عنوان یک خروجی مستقل، حرکت رو به جلو  و  پیشرانی است. نویسندگان با تاکید بر داده‌های جستجوپذیر، دسترس‌پذیر، تعامل پذیر و داده هایی که قابلیت استفاده مجدد دارند این گونه داده‌ها را اصل قرار می‌دهند،  چرا که باور  دارند مصرف‌کنندگان داده‌های پژوهشی آینده فقط پژوهشگران انسانی نخواهند بود - ما همچنین باید ماشین‌ها را تغذیه کنیم. این بدان معناست که رایانه‌ها نیاز به تفسیر محتوا با دخالت کم یا بدون دخالت انسان دارند. برای اینکه این امکان پذیر باشد، خروجی ها باید در قالب های قابل خواندن ماشین باشند و ابرداده ها باید برای توصیف دقیق داده ها و نحوه تولید داده کافی باشند.

البته باید به یاد داشته باشیم که پیش از این، PLOS از سال 2014 از نویسندگان می‌خواهد که تمام داده‌های لازم برای تکرار یافته‌های مطالعه خود را بدون محدودیت، و در زمان انتشار در دسترس عموم قرار دهند. و در ادامه بیانیه "در دسترس قرارداشتن داده" چنین آمده است: "وقتی محدودیت‌های قانونی یا اخلاقی خاص، اشتراک‌گذاری عمومی مجموعه داده‌ها را ممنوع می‌کند، نویسندگان باید نحوه دسترسی دیگران به داده‌ها را مشخص کنند"[2].

در مورد اعلامیه اخیر خبری Nature از سیاست داده NIH (از ژانویه 2023) به عنوان "زمین‌لرزه" صحبت شده است. به نظر من واقعا همینطوراست. برخی می‌گویند این اجبار خیلی هم جدی نیست، اما برای من، این واقعیت که بزرگترین سرمایه‌گذار عمومی تحقیقات زیست‌پزشکی در جهان به محققان می‌گوید داده‌های خود را به اشتراک بگذارند، نشان می‌دهد که فشار برای داده‌های آکادمیکِ باز با چه سرعتی در حال افزایش است.

 NIH اولین سرمایه‌گذار نیست که به محققانی که سرمایه‌گذاری می‌کنند می‌گوید که باید داده‌های خود را بصورت کامل ، و  همزمان با انتشار مقاله خود در دسترس همه قرار دهند. 52 سرمایه‌گذار فهرست‌شده در شرپا جولیت[3]دریافت داده‌های خام پژوهشی محققان را به عنوان شرط تأمین مالی محققان اعلام کرده‌اند.

اتحادیه اروپا در راستای آزادسازی اطلاعات و داده، همزمان ائتلاف اس[4] رابا پیگیری ادامه می‌دهد و پس از تلاشهای این ائتلاف برای دسترسی به مقالاتی که با هزینه های عمومی/ دولتی تولید می‌شود، اینک باز کردن داده های خام پژوهشی را نیز در دستور جدی خود قرار داده است. اتحادیه اروپا و پارلمان اروپا در اکتبر 2021 قانون حاکمیت داده [5]  (DGA) را به تصویب رساندند که در آن از همه پژوهشگران می‌‌خواهند داده‌های پژوهشی خود را به اشتراک بگذارند. نویسندگان قانون در مقدمه قانون ادعا دارند:" قانون حاکمیت داده" اولین "ابتکار قانونی استراتژی داده اروپا"[6] است که هدف آن تبدیل اتحادیه اروپا به یک رهبر در جامعه مبتنی بر داده است که به داده ها اجازه می دهد آزادانه در اتحادیه اروپا و در سراسر بخش‌ها به نفع شهروندان، مشاغل و ادارات دولتی جریان داشته باشند.

قانون حاکمیت داده اتحادیه اروپا بر این سه مورد تاکید دارد:

ترویج استفاده مجدد از داده های بخش عمومی / دولتی. این قانون اتحادیه اروپا اشتراک‌گذاری ایمن و گسترده داده‌های بخش عمومی را در حوزه‌های خاصی را تسهیل می‌کند و "دستورالعمل "داده های باز" اتحادیه اروپا"[7]  را ,که ویرایش قبلی آن مربوط به 26 ژوئن 2019 بود، تکمیل می‌کند. برای مثال، اسرار تجاری، داده‌های شخصی، و داده‌هایی که توسط حقوق مالکیت معنوی محافظت می‌شوند در قانون جدید مورد مداقه قرار داده شده‌اند. حفاظت از حریم خصوصی و محرمانه بودن اسرار افراد  در اینجا بسیار مهم است، نهادهای بخش عمومی باید از نظر فنی برای مراقبت از ایمنی این داده ها مجهز باشند. کمیسیون همچنین یک “ثبت‌گاه”[8] الکترونیکی قابل جستجو از داده‌های بخش عمومی ایجاد خواهد کرد که از طریق نقطاط دسترسی خاص،  اطلاعات ملی قابل دسترسی باشند.

ایجاد چارچوبی برای میانجیگری بین داده‌ها. شرکت ها و افراد از این محیطِ به اشتراک گذاریِ داده ایمن، به منظور تقویت مدل های کسب و کار جدید سود خواهند برد. به عنوان مثال، این محیط واسط می‌تواند به شکل یک پلتفرم دیجیتال برای جایی باشد که به اشتراک گذاری داده، داوطلبانه یا اجباری در آن انجام می‌شود (که به احتمال زیاد توسط اتحادیه الزام قانونی داشته باشد). این کار برای اعتماد سازی نزد شرکت‌ها مفید است زیرا ترس از سوء استفاده از داده‌های آنها، یا از دست دادن مزیت رقابتی آنها را از بین می‌برد. برای افراد، این خدمات به آن‌ها کمک می‌کند تا کنترل کاملی بر داده‌های خود داشته باشند و انتخاب کنند که داده های پژوهشی خام خود را فقط با شرکتی که به آنها اعتماد دارند از طریق ابزارهای مدیریت اطلاعات شخصی مانند فضاهای داده‌های شخصی یا کیف‌پول‌های داده به اشتراک بگذارند.

تشویق به اشتراک‌گذاری نوع دوستانه داده ها برای منافع عمومی. سازمان‌هایی که داده‌ها را برای منافع عمومی جمع‌آوری می‌کنند، مانند تحقیقات پزشکی، می توانند در فهرستهای ملی سازمان‌های نوع دوستانه شناخته‌شده قرار داده شوند. این کار افراد را تشویق می کند تا داده ها را به این سازمان ها اهدا کنند و استفاده از داده ها را برای سازمان ها برای منافع اجتماعی آسان تر کنند.

بنا براین اتحادیه اروپا، با هماهنگی پارلمان اروپا گامهای اصلی برای اجباری کردن داده های باز را برداشته ‌اند و صحبت از الزام قانونی برای این کار می‌کنند. حال باید در انتظار اجرایی شدن قانون حاکمیت داده اتحادیه باشیم و نتایج آن را ببینیم.

 در آن سوی اقیانوس اطلس، امریکائیها همان برخوردی را که در مواجهه با دسترسی آزاد داشته اند، در مورد داده های پژوهشی نیز پیش گرفته اند.   [9]  PLOSیا "کتابخانه ملی علوم" که از پیشگامان دسترسی آزاد است،‌ در سال 2000 و توسط موسسه ملی بهداشت امریکا NIH در امریکا راه اندازی و اولین مجله کاملا دسترسی آزاد خود، PLOS Biology را در سال 2003منتشر کرد. این موسسه از 2014 داده های باز را برای مجلات خود اجباری کرده است. NIH [10] بزرگترین سرمایه گذار تحقیقات زیست‌پزشکی در جهان است، و از 2500 موسسه تحقیقاتی در دنیا حمایت مالی می‌کند. این موسسه در سالهای 2015 و 2016 دسترسی آزاد به منابع زیست‌پزشکی (مجلات و پایگاهها)، برای کسانی که از کمکهای این موسسه در پژوهشهای خود استفاده کرده‌اند را با شش ماه تاخیر اجباری کرد.

امریکائیها در حوزه های غیر پزشکی هیچ قدم موثری برای دسترسی آزاد برنداشته‌اند و با وجود لابی بسیار قوی ناشران تجاری، فقط با شعار حمایت از جان انسانها مجلات تجاری و غیر تجاری پزشکی را ، آن هم با 6 ماه تاخیر آزاد کرده‌اند. NIH در مورد داده‌های پژوهشی نیز به همین ترتیب و با همین شعار فقط روی مجلات پزشکی انگشت تاکید گذاشته و با داده های پژوهشی سایر مجلات و سایر رشته های غیر پزشکی فعلا کاری یا اجباری ندارند. 

به گزارش مچله نیچر نیوز در ژانویه 2023، مؤسسه ملی بهداشت ایالات متحده (NIH) شروع به اجبار پژوهشگران 2500 مؤسسه‌ای که در حوزه‌های زیست پزشکی تحقیق می‌کنند و سالانه همه یا بخشی از بودجه آنها را تأمین می‌کند، خواهد کرد تا برنامه مدیریت داده را در برنامه‌های کمک مالی خود بگنجانند - و در نهایت داده‌های خود را در دسترس عموم قرار دهند[11]. آقای کوزلف نویسنده این مقاله از این خبر به عنوان زلزله‌ای در جهان ارتباطات علمی نام برده است و می‌نویسد: "محققانی که با نیچر صحبت کردند عمدتاً اصول "علم باز" که زیربنای این سیاست است را پذیرفته وتحسین می کنند. اما برخی نگرانی‌هایی در مورد چالش‌های تدارکاتی (لجستیکی) دارند که محققان و مؤسسات آنها با آن مواجه خواهند شد. به عبارت دیگر، آنها نگرانند که این سیاست ممکن است نابرابری های موجود در چشم انداز تأمین مالی علم را تشدید کند و می‌تواند مشکلات زیادی برای اولین گروه دانشمندان باشد، که سهم اصلی را در ارائه داده‌ها  دارند، دانشمندانی که داده‌های ارزشمند خود را در اختیار دیگران قرار دهند و پلی برای رشد دیگران باشند، ‌در جائی‌ که خود چیزی هنوز دریافت نکرده‌اند. در واقع از قدرت خود به دیگران می‌بخشند ولی گرانتهای پژوهشی به دیگران داده شود.

دلایل NIH‌ چیست و چرا به اجباری کردن به اشتراک گذاری داده های پژوهشی پرداخته است؟ اولین مساله که در همه مقاله ها و خبرها می‌خوانیم “تکرار پذیری در تحقیقات علمی” است که NIH‌ هم بر همین مساله تاکید می‌کند. لیریک یورگنسون، سرپرست معاونت سیاست علمی در NIH می گوید، "مطالعات تکرار نشدنی نه تنها پول مالیات دهندگان را هدر می دهد، بلکه اعتماد عمومی به علم را نیز تضعیف می کند. او می‌گوید: «ما می‌خواهیم مطمئن شویم که سرمایه‌گذاری کشور را ارتقاء می دهیم و شفافیت و مسئولیت‌پذیری در تحقیقات را تقویت می‌کنیم[12]". تکرارپذیری تحقیفات علمی، اشاره به نتایج اعلام شده مقاله‌های علمی است که با وجود ایجاد شرایط مشابه آزمایشها، و تکرار آزمایش، با نتایجی غیر از آنچه در مقاله ذکر شده، روبرو می‌شوند و به همین دلیل از این موضوع با عنوان بحران یاد می‌کنند، و در واقع از ساختگی بودن داده‌ها نگرانند.  " تلاش‌ها برای بهبود تکرارپذیری و یکپارچگی علم معمولاً با روایتی از بحران توجیه می‌شوند که طبق آن اکثر نتایج منتشر شده به دلیل مشکلات فزاینده در تحقیقات و شیوه‌های انتشار غیرقابل اعتماد هستند.[13] "

"بر اساس خط مشی جدید NIH که از 25 ژانویه 2022 اجرایی می شود، همه درخواست های کمک مالیاز این موسسه برای پروژه هایی که داده‌های علمی را جمع آوری می کنند باید شامل یک طرح "مدیریت و اشتراک داده" (DMS) باشد که حاوی جزئیاتی در مورد نرم افزار یا ابزارهای مورد نیاز برای تجزیه و تحلیل داده ها باشد ، شامل زمان و مکان انتشار داده‌های خام و هرگونه ملاحظات ویژه برای دسترسی یا توزیع آن داده‌ها."[14]

چنانکه می بینید،‌ دسترسی به داده های خام پژوهشی، نیز مانند دسترسی آزاد به مقاله ها و نتایج تحقیقات پژوهشی در دستور کار قرار گرفته وچنانکه در قانون حاکمیت داده اتحادیه اروپا و اجبار موسسه ملی تحقیقات پزشکی ایالات متحده ملاحظه می‌شود، به اشتراک گذاشتن داده های خام ظرف سالهای آینده عملی خواهد شد و با وجود اشکالات فراوانی که در حال حاظر به آن وارد است، راه حلهای مناسب و قانونی خود را خواهد یافت و باوجود برخی نکات منفی که از آن نام می‌برند و در هفته های بعد به آن خواهیم پرداخت، یک نکته مثبت و بسیار مهم خواهد داشت و آن هم از داده سازی و ارائة نتایج دروغین بر پایه داد های ساختگی و غلط جلوگیری می کند.

محققین ایرانی نیز که قرار است مقالاتشان در مجلات اروپایی و مجلات زیست‌پزشکی امریکایی منتشر شود، باید از هم اکنون خود را برای ارائه داده های خام خود آماده کنند.

عمرانی، سیدابراهیم.  «اجبار به اشتراک گذاری داده های پژوهشی باز در دو سوی اقیانوس:پژوهش باز، داده‌های باز». سخن هفته لیزنا، شماره 587، 12  اردیبهشت 1401

------------------------------------------

[1] FAIR Guiding Principles for scientific data management and stewardship Science Data. March, 15th, 2016. https://www.nature.com/articles/sdata201618

[2]  Data Availability . PLOS/  https://journals.plos.org/plosone/s/data-availability#:~:text=unless%20otherwise%20noted.-,Introduction,obtain%20access%20to%20the%20data

[3] درباره شرپا جولیت

شرپا جولیت محققان و کتابداران را قادر می سازد تا شرایط سرمایه گذاران را برای انتشار دسترسی آزاد ببینند.

Sherpa Juliet یک پایگاه داده قابل جستجو و تنها نقطه کانونی اطلاعات به روز در مورد سیاست های سرمایه گذاران تحقیقات و الزامات آنها در دسترسی آزاد، انتشار و بایگانی داده ها است

[4] Coalition S

[5] Data Governance Act . Oct.2021

[6] Legislative Initiative of the European data strategy

[7] Directive (EU) 2019/1024 on open data and the re-use of public sector information. https://www.europeansources.info/record/directive-eu-2019-1024-on-open-data-and-the-re-use-of-public-sector-information/

[8] Registry

[9] Public Library Of Science

[10] .   بنگاه  دولتی اصلی  ایالات متحده که مسئولیت سرمایه گذاری و سیاستگزاری در  تحقیقات زیست پزشکی و بهداشت عمومی است.

[11] . Kozlov, Max. NIH issues a seismic mandate: share data publicly

[12] همان.

[13] . Daniele Fanelli: Is science really facing a reproducibility crisis, and do we need it to? https://www.pnas.org/doi/10.1073/pnas.1708272114

[14]. Kozlov, همان