داخلی
»سخن هفته
پژوهش باز، دادههای باز
لیزنا؛ سیدابراهیم عمرانی، سردبیر: در سال 2016، «اصول راهنمای استفاده منصفانه برای مدیریت و سرپرستی دادههای علمی» توسط نیچر و در Science Data منتشر شد[1] و بحثهای فراوانی در مورد تعریف دادههای جستجوپذیر، دسترسپذیر، تعامل پذیر و داده هایی که قابلیت استفاده مجدد دارند به دست داده شد. اگرچه هر مؤسسه، ناشر و سرمایهگذار ممکن است دقیقاً یک هدف را منظور نداشته باشند، با اینهمه در مقاله یادآور شده است که این حرکت برای توصیف بهتر و در نهایت قابل استفاده کردن خروجیهای داده به عنوان یک خروجی مستقل، حرکت رو به جلو و پیشرانی است. نویسندگان با تاکید بر دادههای جستجوپذیر، دسترسپذیر، تعامل پذیر و داده هایی که قابلیت استفاده مجدد دارند این گونه دادهها را اصل قرار میدهند، چرا که باور دارند مصرفکنندگان دادههای پژوهشی آینده فقط پژوهشگران انسانی نخواهند بود - ما همچنین باید ماشینها را تغذیه کنیم. این بدان معناست که رایانهها نیاز به تفسیر محتوا با دخالت کم یا بدون دخالت انسان دارند. برای اینکه این امکان پذیر باشد، خروجی ها باید در قالب های قابل خواندن ماشین باشند و ابرداده ها باید برای توصیف دقیق داده ها و نحوه تولید داده کافی باشند.
البته باید به یاد داشته باشیم که پیش از این، PLOS از سال 2014 از نویسندگان میخواهد که تمام دادههای لازم برای تکرار یافتههای مطالعه خود را بدون محدودیت، و در زمان انتشار در دسترس عموم قرار دهند. و در ادامه بیانیه "در دسترس قرارداشتن داده" چنین آمده است: "وقتی محدودیتهای قانونی یا اخلاقی خاص، اشتراکگذاری عمومی مجموعه دادهها را ممنوع میکند، نویسندگان باید نحوه دسترسی دیگران به دادهها را مشخص کنند"[2].
در مورد اعلامیه اخیر خبری Nature از سیاست داده NIH (از ژانویه 2023) به عنوان "زمینلرزه" صحبت شده است. به نظر من واقعا همینطوراست. برخی میگویند این اجبار خیلی هم جدی نیست، اما برای من، این واقعیت که بزرگترین سرمایهگذار عمومی تحقیقات زیستپزشکی در جهان به محققان میگوید دادههای خود را به اشتراک بگذارند، نشان میدهد که فشار برای دادههای آکادمیکِ باز با چه سرعتی در حال افزایش است.
NIH اولین سرمایهگذار نیست که به محققانی که سرمایهگذاری میکنند میگوید که باید دادههای خود را بصورت کامل ، و همزمان با انتشار مقاله خود در دسترس همه قرار دهند. 52 سرمایهگذار فهرستشده در شرپا جولیت[3]دریافت دادههای خام پژوهشی محققان را به عنوان شرط تأمین مالی محققان اعلام کردهاند.
اتحادیه اروپا در راستای آزادسازی اطلاعات و داده، همزمان ائتلاف اس[4] رابا پیگیری ادامه میدهد و پس از تلاشهای این ائتلاف برای دسترسی به مقالاتی که با هزینه های عمومی/ دولتی تولید میشود، اینک باز کردن داده های خام پژوهشی را نیز در دستور جدی خود قرار داده است. اتحادیه اروپا و پارلمان اروپا در اکتبر 2021 قانون حاکمیت داده [5] (DGA) را به تصویب رساندند که در آن از همه پژوهشگران میخواهند دادههای پژوهشی خود را به اشتراک بگذارند. نویسندگان قانون در مقدمه قانون ادعا دارند:" قانون حاکمیت داده" اولین "ابتکار قانونی استراتژی داده اروپا"[6] است که هدف آن تبدیل اتحادیه اروپا به یک رهبر در جامعه مبتنی بر داده است که به داده ها اجازه می دهد آزادانه در اتحادیه اروپا و در سراسر بخشها به نفع شهروندان، مشاغل و ادارات دولتی جریان داشته باشند.
قانون حاکمیت داده اتحادیه اروپا بر این سه مورد تاکید دارد:
ترویج استفاده مجدد از داده های بخش عمومی / دولتی. این قانون اتحادیه اروپا اشتراکگذاری ایمن و گسترده دادههای بخش عمومی را در حوزههای خاصی را تسهیل میکند و "دستورالعمل "داده های باز" اتحادیه اروپا"[7] را ,که ویرایش قبلی آن مربوط به 26 ژوئن 2019 بود، تکمیل میکند. برای مثال، اسرار تجاری، دادههای شخصی، و دادههایی که توسط حقوق مالکیت معنوی محافظت میشوند در قانون جدید مورد مداقه قرار داده شدهاند. حفاظت از حریم خصوصی و محرمانه بودن اسرار افراد در اینجا بسیار مهم است، نهادهای بخش عمومی باید از نظر فنی برای مراقبت از ایمنی این داده ها مجهز باشند. کمیسیون همچنین یک “ثبتگاه”[8] الکترونیکی قابل جستجو از دادههای بخش عمومی ایجاد خواهد کرد که از طریق نقطاط دسترسی خاص، اطلاعات ملی قابل دسترسی باشند.
ایجاد چارچوبی برای میانجیگری بین دادهها. شرکت ها و افراد از این محیطِ به اشتراک گذاریِ داده ایمن، به منظور تقویت مدل های کسب و کار جدید سود خواهند برد. به عنوان مثال، این محیط واسط میتواند به شکل یک پلتفرم دیجیتال برای جایی باشد که به اشتراک گذاری داده، داوطلبانه یا اجباری در آن انجام میشود (که به احتمال زیاد توسط اتحادیه الزام قانونی داشته باشد). این کار برای اعتماد سازی نزد شرکتها مفید است زیرا ترس از سوء استفاده از دادههای آنها، یا از دست دادن مزیت رقابتی آنها را از بین میبرد. برای افراد، این خدمات به آنها کمک میکند تا کنترل کاملی بر دادههای خود داشته باشند و انتخاب کنند که داده های پژوهشی خام خود را فقط با شرکتی که به آنها اعتماد دارند از طریق ابزارهای مدیریت اطلاعات شخصی مانند فضاهای دادههای شخصی یا کیفپولهای داده به اشتراک بگذارند.
تشویق به اشتراکگذاری نوع دوستانه داده ها برای منافع عمومی. سازمانهایی که دادهها را برای منافع عمومی جمعآوری میکنند، مانند تحقیقات پزشکی، می توانند در فهرستهای ملی سازمانهای نوع دوستانه شناختهشده قرار داده شوند. این کار افراد را تشویق می کند تا داده ها را به این سازمان ها اهدا کنند و استفاده از داده ها را برای سازمان ها برای منافع اجتماعی آسان تر کنند.
بنا براین اتحادیه اروپا، با هماهنگی پارلمان اروپا گامهای اصلی برای اجباری کردن داده های باز را برداشته اند و صحبت از الزام قانونی برای این کار میکنند. حال باید در انتظار اجرایی شدن قانون حاکمیت داده اتحادیه باشیم و نتایج آن را ببینیم.
در آن سوی اقیانوس اطلس، امریکائیها همان برخوردی را که در مواجهه با دسترسی آزاد داشته اند، در مورد داده های پژوهشی نیز پیش گرفته اند. [9] PLOSیا "کتابخانه ملی علوم" که از پیشگامان دسترسی آزاد است، در سال 2000 و توسط موسسه ملی بهداشت امریکا NIH در امریکا راه اندازی و اولین مجله کاملا دسترسی آزاد خود، PLOS Biology را در سال 2003منتشر کرد. این موسسه از 2014 داده های باز را برای مجلات خود اجباری کرده است. NIH [10] بزرگترین سرمایه گذار تحقیقات زیستپزشکی در جهان است، و از 2500 موسسه تحقیقاتی در دنیا حمایت مالی میکند. این موسسه در سالهای 2015 و 2016 دسترسی آزاد به منابع زیستپزشکی (مجلات و پایگاهها)، برای کسانی که از کمکهای این موسسه در پژوهشهای خود استفاده کردهاند را با شش ماه تاخیر اجباری کرد.
امریکائیها در حوزه های غیر پزشکی هیچ قدم موثری برای دسترسی آزاد برنداشتهاند و با وجود لابی بسیار قوی ناشران تجاری، فقط با شعار حمایت از جان انسانها مجلات تجاری و غیر تجاری پزشکی را ، آن هم با 6 ماه تاخیر آزاد کردهاند. NIH در مورد دادههای پژوهشی نیز به همین ترتیب و با همین شعار فقط روی مجلات پزشکی انگشت تاکید گذاشته و با داده های پژوهشی سایر مجلات و سایر رشته های غیر پزشکی فعلا کاری یا اجباری ندارند.
به گزارش مچله نیچر نیوز در ژانویه 2023، مؤسسه ملی بهداشت ایالات متحده (NIH) شروع به اجبار پژوهشگران 2500 مؤسسهای که در حوزههای زیست پزشکی تحقیق میکنند و سالانه همه یا بخشی از بودجه آنها را تأمین میکند، خواهد کرد تا برنامه مدیریت داده را در برنامههای کمک مالی خود بگنجانند - و در نهایت دادههای خود را در دسترس عموم قرار دهند[11]. آقای کوزلف نویسنده این مقاله از این خبر به عنوان زلزلهای در جهان ارتباطات علمی نام برده است و مینویسد: "محققانی که با نیچر صحبت کردند عمدتاً اصول "علم باز" که زیربنای این سیاست است را پذیرفته وتحسین می کنند. اما برخی نگرانیهایی در مورد چالشهای تدارکاتی (لجستیکی) دارند که محققان و مؤسسات آنها با آن مواجه خواهند شد. به عبارت دیگر، آنها نگرانند که این سیاست ممکن است نابرابری های موجود در چشم انداز تأمین مالی علم را تشدید کند و میتواند مشکلات زیادی برای اولین گروه دانشمندان باشد، که سهم اصلی را در ارائه دادهها دارند، دانشمندانی که دادههای ارزشمند خود را در اختیار دیگران قرار دهند و پلی برای رشد دیگران باشند، در جائی که خود چیزی هنوز دریافت نکردهاند. در واقع از قدرت خود به دیگران میبخشند ولی گرانتهای پژوهشی به دیگران داده شود.
دلایل NIH چیست و چرا به اجباری کردن به اشتراک گذاری داده های پژوهشی پرداخته است؟ اولین مساله که در همه مقاله ها و خبرها میخوانیم “تکرار پذیری در تحقیقات علمی” است که NIH هم بر همین مساله تاکید میکند. لیریک یورگنسون، سرپرست معاونت سیاست علمی در NIH می گوید، "مطالعات تکرار نشدنی نه تنها پول مالیات دهندگان را هدر می دهد، بلکه اعتماد عمومی به علم را نیز تضعیف می کند. او میگوید: «ما میخواهیم مطمئن شویم که سرمایهگذاری کشور را ارتقاء می دهیم و شفافیت و مسئولیتپذیری در تحقیقات را تقویت میکنیم[12]". تکرارپذیری تحقیفات علمی، اشاره به نتایج اعلام شده مقالههای علمی است که با وجود ایجاد شرایط مشابه آزمایشها، و تکرار آزمایش، با نتایجی غیر از آنچه در مقاله ذکر شده، روبرو میشوند و به همین دلیل از این موضوع با عنوان بحران یاد میکنند، و در واقع از ساختگی بودن دادهها نگرانند. " تلاشها برای بهبود تکرارپذیری و یکپارچگی علم معمولاً با روایتی از بحران توجیه میشوند که طبق آن اکثر نتایج منتشر شده به دلیل مشکلات فزاینده در تحقیقات و شیوههای انتشار غیرقابل اعتماد هستند.[13] "
"بر اساس خط مشی جدید NIH که از 25 ژانویه 2022 اجرایی می شود، همه درخواست های کمک مالیاز این موسسه برای پروژه هایی که دادههای علمی را جمع آوری می کنند باید شامل یک طرح "مدیریت و اشتراک داده" (DMS) باشد که حاوی جزئیاتی در مورد نرم افزار یا ابزارهای مورد نیاز برای تجزیه و تحلیل داده ها باشد ، شامل زمان و مکان انتشار دادههای خام و هرگونه ملاحظات ویژه برای دسترسی یا توزیع آن دادهها."[14]
چنانکه می بینید، دسترسی به داده های خام پژوهشی، نیز مانند دسترسی آزاد به مقاله ها و نتایج تحقیقات پژوهشی در دستور کار قرار گرفته وچنانکه در قانون حاکمیت داده اتحادیه اروپا و اجبار موسسه ملی تحقیقات پزشکی ایالات متحده ملاحظه میشود، به اشتراک گذاشتن داده های خام ظرف سالهای آینده عملی خواهد شد و با وجود اشکالات فراوانی که در حال حاظر به آن وارد است، راه حلهای مناسب و قانونی خود را خواهد یافت و باوجود برخی نکات منفی که از آن نام میبرند و در هفته های بعد به آن خواهیم پرداخت، یک نکته مثبت و بسیار مهم خواهد داشت و آن هم از داده سازی و ارائة نتایج دروغین بر پایه داد های ساختگی و غلط جلوگیری می کند.
محققین ایرانی نیز که قرار است مقالاتشان در مجلات اروپایی و مجلات زیستپزشکی امریکایی منتشر شود، باید از هم اکنون خود را برای ارائه داده های خام خود آماده کنند.
عمرانی، سیدابراهیم. «اجبار به اشتراک گذاری داده های پژوهشی باز در دو سوی اقیانوس:پژوهش باز، دادههای باز». سخن هفته لیزنا، شماره 587، 12 اردیبهشت 1401
------------------------------------------
[1] FAIR Guiding Principles for scientific data management and stewardship Science Data. March, 15th, 2016. https://www.nature.com/articles/sdata201618
[2] Data Availability . PLOS/ https://journals.plos.org/plosone/s/data-availability#:~:text=unless%20otherwise%20noted.-,Introduction,obtain%20access%20to%20the%20data
[3] درباره شرپا جولیت
شرپا جولیت محققان و کتابداران را قادر می سازد تا شرایط سرمایه گذاران را برای انتشار دسترسی آزاد ببینند.
Sherpa Juliet یک پایگاه داده قابل جستجو و تنها نقطه کانونی اطلاعات به روز در مورد سیاست های سرمایه گذاران تحقیقات و الزامات آنها در دسترسی آزاد، انتشار و بایگانی داده ها است
[4] Coalition S
[5] Data Governance Act . Oct.2021
[6] Legislative Initiative of the European data strategy
[7] Directive (EU) 2019/1024 on open data and the re-use of public sector information. https://www.europeansources.info/record/directive-eu-2019-1024-on-open-data-and-the-re-use-of-public-sector-information/
[8] Registry
[9] Public Library Of Science
[10] . بنگاه دولتی اصلی ایالات متحده که مسئولیت سرمایه گذاری و سیاستگزاری در تحقیقات زیست پزشکی و بهداشت عمومی است.
[11] . Kozlov, Max. NIH issues a seismic mandate: share data publicly
[12] همان.
[13] . Daniele Fanelli: Is science really facing a reproducibility crisis, and do we need it to? https://www.pnas.org/doi/10.1073/pnas.1708272114
[14]. Kozlov, همان
۱. از توهین به افراد، قومیتها و نژادها خودداری کرده و از تمسخر دیگران بپرهیزید و از اتهامزنی به دیگران خودداری نمائید.
۲.از آنجا که پیامها با نام شما منتشر خواهد شد، بهتر است با ارسال نام واقعی و ایمیل خود لیزنا را در شکل دهی بهتر بحث یاری نمایید.
۳. از به کار بردن نام افراد (حقیقی یا حقوقی)، سازمانها، نهادهای عمومی و خصوصی خودداری فرمائید.
۴. از ارسال پیام های تکراری که دیگر مخاطبان آن را ارسال کرده اند خودداری نمائید.
۵. حتی الامکان از ارسال مطالب با زبانی غیر از فارسی خودداری نمائید.