FAIR data, fair data: עקרונות ניהול מידע ובעלות על נתונים במדע אזרחי
בשנים האחרונות נדמה שהנתונים הפכו לגיבורי־העל של המדע: הם נאספים בהמוניהם, נאגרים במסדי ענק, ומופצים בשם אידיאלים של פתיחות, שקיפות ושיתוף. אך מאחורי הסיסמאות של מדע פתוח ו-FAIR data מסתתרת עבודה חברתית מורכבת, רצופה מתחים, אינטרסים ויחסי כוח. מה המשמעות של הוגנות כשמדובר במידע שנאסף בידי הציבור אך מנוהל בידי מדענים ומוסדות? וכיצד עקרונות טכניים לכאורה הופכים לזירה שבה מתנסחות שאלות עמוקות על ידע, אחריות וצדק? במאמר חדש, המבוסס על עבודת התזה שכתב במחלקה לסוציולוגיה ואנתרופולוגיה באוניברסיטת תל אביב, בהנחיית פרופ׳ מיכל קרבאל-טובי, בוחן ערן שוורצפוקס את הפוליטיקה החברתית של ניהול נתונים במדע אזרחי, ומציע לקרוא את עקרונות FAIR לא רק כסטנדרט טכני, אלא כאתגר אנתרופולוגי להבנת יחסי אדם-ידע-תשתית בעידן הדיגיטלי:
בעידן של מדע פתוח ו-Big Data, גוברת הדרישה לשיתוף נתונים מדעיים ופתיחתם לציבור הרחב. גופי מימון מרכזיים כמו הנציבות האירופית ומכוני הבריאות הלאומיים בארה"ב מחייבים כיום תוכניות לניהול נתונים כתנאי למענקי מחקר, ומסדי נתונים גלובליים כמו GBIF (Global Biodiversity Information Facility) מנגישים באופן חינמי מיליוני נתונים אקולוגיים ממקורות מגוונים. אך כיצד דרישות אלו משפיעות בפועל על העשייה המדעית? וכיצד מדענים – שעד לא מזמן נתפסו כ"בעלים" של הנתונים שאספו – מבינים ומנהלים את הציווי לשתף אותם? במאמרי החדש, FAIR data, fair data: data management principles and data ownership in citizen science, שפורסם בכתב העת Information, Communication & Society, אני עוסק בשאלות הללו.
המאמר, שעובד מתוך עבודת המאסטר שלי ומבוסס על מחקר אתנוגרפי שנערך במרכז הישראלי למדע אזרחי בשנים 2022-2023. המרכז, הממוקם במוזיאון שטיינהרדט לטבע באוניברסיטת תל אביב, מנהל פרויקטי ניטור אקולוגי מגוונים בהם הציבור משתתף באיסוף נתונים מדעיים – ספירת ציפורים, סקרי פרפרים ותיעוד מגוון ביולוגי. המחקר כלל תצפית משתתפת בפעילויות המרכז – פגישות תכנון, ישיבות ועדות היגוי, תהליכי טיוב נתונים ואירועי הכשרה – לצד ניתוח מסמכים וראיונות עומק עם עשרה חוקרים ומנהלי פרויקטים. בחלק מהפרויקטים השתתפתי גם כמשתתף במחקר עצמו, מה שאפשר לי להתבונן מנקודות מבט מרובות.
במוקד המאמר עומדים ברוב מסדי הנתונים הפתוחים מקדמים את עקרונות FAIR: סטנדרטים טכניים לניהול נתונים שניתנים למציאה (Findable), נגישים (Accessible), מסוגלים להתממשק עם מערכות אחרות (Interoperable), וניתנים לשימוש חוזר (Reusable). עקרונות אלו הפכו לסטנדרט בינלאומי לניהול מידע מדעי, ומקודמים על ידי מוסדות מחקר מובילים בעולם. המאמר בוחן את המשמעות הכפולה של עקרונות אלו: מצד אחד, הם מהווים סטנדרטים טכניים המאפשרים תיקנון ושימוש חוזר בנתונים. מצד שני, הם נושאים משמעות חברתית של הוגנות (fair), של החזרת המידע לציבור שאסף אותו, ושקיפות מדעית כלפי הציבור הרחב.
המאמר נשען על מספר מסגרות אנליטיות: מושג הביו-כוח של פוקו, המאפשר להבין את הפוליטיקה של ייצור ידע וניהולו; מושגי ה"קופסה השחורה" ו"שרשראות התרגום" של לאטור, המאירים כיצד נתונים מדעיים עוברים טרנספורמציות המסתירות את תהליכי ייצורם; ותובנות ממחקרי תשתיות מידע, הבוחנים כיצד מערכות ארגון ידע משקפות ומכוננות יחסים חברתיים.
ממצאי המחקר חושפים מתחים משמעותיים באופן שבו מדענים מבינים ומנהלים שיתוף נתונים. מצד אחד, חוקרים מסוימים רואים בנתונים "פרי עמלם" ואינם מוכנים לשתף אותם לפני שיפיקו מהם פרסומים – כפי שהתבטאה אחת המרואיינות: "אני לא מוכנה להשקיע את כל הזמן שלי כדי שמישהו אחר ייקח את הנתונים האלה, ינתח אותם, ויפרסם את המאמרים במקומי". מצד שני, חוקרים אחרים טוענים כי מדע הממומן מכספי ציבור חייב לחזור לציבור: "אתה חי מכספי ציבור – משכורות מכספי ציבור, גראנטים מכספי ציבור. המחקר חייב לחזור לציבור בדרך כלשהי, ולא רק כהרצאה שאתה נותן".
המאמר מצביע על פרדוקס מרכזי: המדע שואף לייצר ידע אוניברסלי ו"נקי" מהקשר, אך שימוש חוזר משמעותי בנתונים דורש דווקא הבנה עמוקה של ההקשר המקומי שבו נאספו. כדי לאפשר שימוש חוזר אמיתי, מדענים נדרשים "לפתוח" את הקופסה השחורה – לתעד את תהליכי איסוף הנתונים, ההטיות האפשריות, והנסיבות הספציפיות של המחקר. עבודה זו דורשת משאבים רבים, ורבים מהמדענים אינם מסוגלים או מוכנים להשקיע אותם. מדענים אחרים דווקא מוצאים את העבודה הזו חיונית, ומסבירים שלא מדובר רק באלטרואיזם – אלא גם באינטרס עצמי לעמוד בסטנדרטים הטכניים. כפי שתיאר אחד המרואיינים: ״אם אתה באמת רוצה לדאוג לעצמך כמדען, אתה צריך לחשוב גלובלית, על המשתמש הבא בנתונים. FAIR מכריח אותך להיות מודע לאיך הנתונים שלך בנויים, מה יש בהם ומה לא״.
ממצא נוסף נוגע להיפוך ביחסי הכוח: בעוד שבמדע המסורתי המדענים מפקחים על נבדקיהם ועל המשתתפים במחקר, עקרונות הנגישות והשקיפות מאפשרים גם למשתתפים לפקח על המדענים – לראות מה נעשה עם הנתונים שאספו, האם שאלות המחקר נענו, ואילו שיטות ננקטו. במונחים ביו-פוליטיים, הנגישות אינה רק "אירוח" של הציבור במסדי הנתונים, אלא פתיחת עבודתם של המדענים עצמם למבט ציבורי – באופן שיוצר פנאופטיקון מדעי-חברתי.
דיכוטומיות פשוטות של "פתוח" מול "סגור" או "משותף" מול "פרטי" אינן מצליחות לבטא את המשא ומתן המורכב סביב בעלות על נתונים ונגישות אליהם. עקרונות FAIR אינם ניתנים להבנה רק כסטנדרטים טכניים מבלי להתייחס לערכים שהם מגלמים, אבל גם לא ניתן לנתח אותם כתופעות חברתיות מבלי להתחשב בפרקטיקות הטכניות שיוצרות אותם. תשתיות מידע מעצבות ומעוצבות בו-זמנית על ידי היחסים החברתיים של ייצור ידע מדעי – ומאתגרות אותנו לדמיין מחדש מסגרות הוגנות יותר להערכת תרומות מגוונות להבנה הקולקטיבית שלנו את העולם.
לקריאת המאמר:
https://www.tandfonline.com/doi/full/10.1080/1369118X.2025.2604664
