Nagy adat, kis adat, nincs adat

BORGMAN, Christine L.

Big data, little data, no data : scholarship in the networked world / Christine L. Borgman. – Cam-bridge, MA; London: MIT Press, 2015. XXV, 383 p.

ISBN 978 0 262 02856 1

 

Örvendetesen hamar került a Könyvtártudományi Szakkönyvtárba Christine L. Borgman 2015-ben megjelent könyve, amelyben – többek között – azt olvashatjuk, hogy Galilei 17. századi munkái a Jupiter holdjairól többek között azért is maradhattak a tudomány mérföldkövei, mert az általa összegyűjtött adatok mindenki rendelkezésére állnak.

Ha ma megkérdezünk kutatókat arról, hogy akarják-e megosztani az adataikat, bizonyára igennel válaszolnak. Amikor viszont azt kérdezzük ugyanazoktól a kutatóktól, hogy ők maguk megosztanak-e adatokat, jellemzően nemleges válaszokat kapunk.

Christine Borgmant idehaza néhányan személyesen is ismerhetik, hiszen 1994-ben a felsőoktatási világbanki projekt egyik szakértőjeként járt Budapesten. Ami ennél fontosabb, hogy nyugodtan állítható: a Kaliforniai Egyetem (UCLA, Los Angeles) professzorasszonya világszerte elismert szakember, akire sűrűn hivatkoznak a tudományos kommunikáció kérdéseivel és a könyvtárak jövőjével foglakozó publikációkban. Korábbi könyvei (From Gutenberg to the Global Information Infrastructure, 2000; Scholarship in the Digital Age, 2007) több díjat is nyertek. Az előbbiről magyar nyelven is jelent meg recenzió.1

Most ismertetésre kerülő könyve, amelynek elkészültében valamilyen módon részt vállaló munkatársainak több oldalon köszöni meg a közreműködését, elnyerte az Amerikai Könyvkiadók díját. Angol nyelvű ismertetés erről az új műről már megjelent, méghozzá a szerző és a könyv rangjához illő2, hiszen szerzője, Carol Tenopir (The University of Tennessee, Knoxville) szintén szakmánk „nagyasszonyai” közé tartozik, aki maga is jelentős kutatási és publikációs tevékenységet folytat a kutatási adatokkal kapcsolatban.

Ahogy azt Borgman kifejti, a „nagy adat” elnevezés Derek de Solla Price könyvének címéből (Kis tudomány, nagy tudomány 3) eredeztethető. A „nagy adat” fogalma – amint arra Z. Karvalics László felhívja a figyelmünket – önmagában értelmezhetetlen, hiszen a nagy adat nem az általában vett adattömegből fakad, hanem konkrét „nagy adatok” eredményezik, továbbá megértéséhez a „kis adat”, az „összekapcsolt adat” (linked data) és a „nyílt adat” (open data) együttes természetének ismerete szükséges.4

Mindenestre Borgman megfogalmazza, a kis adatok is alapvetőek a tudományos kutatás számára, mivel az adatok mennyiségének növekedésével fordítottan arányos az a képességünk, hogy az egyes egyedeket megfigyeljük, ráadásul nehezebb megállapítani, hogy ezek a megfigyelések mit jelentenek, mivel nem feltétlenül tudjuk, miként gyűjtötték, hogyan kezelték vagy miként alakították át őket. Ezért van, hogy sok kutató inkább kisebb, közelről is „szemügyre vehető” adatmennyiségekkel szeret dolgozni. Ennek okán is kimondható tehát, hogy a nagy adat nem feltétlenül jó adat. Amikor pedig a kutatók nem tudják feltárni az adatokat vagy azok nem is feltárhatóak, illetve nem hozzák őket nyilvánosságra, akkor lehet, hogy semmilyen adat sem fog rendelkezésükre állni. Ez az egyik magyarázat arra, hogy miért olvashatjuk a könyv címében ezt, az utóbbi helyzetet tömören megfogalmazandó kifejezést: no data. Tegyük viszont hozzá, hogy vannak olyan üzleti, a biztonságot vagy a magánélet titkosságát érintő érdekek, amelyek nem teszik lehetővé egyes adatok nyílttá tételét.5

Borgman mindazonáltal aláhúzza, hogy az elszigetelt adatoknak nincs értelme, hiszen a tudás infrastruktúrájában, tehát az emberek, intézmények, tárgyak és viszonylatok környezetében léteznek. Értékük akkor van, ha használjuk őket, amihez olyan infrastruktúrára van szükség, amely magában foglalja a hatékony hozzáférést, a megőrzést, valamint az adatok használatának és újrahasznosításának eszközeit. A tudás infrastruktúrájának nélkülözhetetlen része volna, hogy azok, akik az adatokat helyes és szakszerű módon kezelik, érdekelve legyenek ebben, hiszen ösztönzés nélkül a kutatók többsége nem érez indíttatást az adatok megosztására.

A fentiekből már kiderült, de erősítsük meg, hogy a címválasztás nem véletlen. Solla Price munkássága Borgmant is inspirálta, így az ő könyvének címe is találó és figyelemfelkeltő, de nem öncélú módon, mert a problémát összetettségében fogja meg.

A könyv hat fő témára koncentrál, amelyeket a szerző provokációknak nevez. A provokáció szó használata nem új a nagy adatokkal kapcsolatban, hiszen ezt használja Danah Boyd és Kate Crawford korábban megjelent, viszonylag nagy figyelmet kapott cikkében. Magyar nyelven is olvasható, bár címének fordításában nincsen ott, magában a szövegben már provokatív megállapítások szerepelnek.6 A kifejezés tehát nem új, de nagyon is helyénvaló. Mivel mindegyik rendkívül összetett, nehéz egy-egy szóban összefoglalni őket, de azért a következőket mondhatjuk róluk:

Az adatok reprodukálhatósága, megosztása és újrafelhasználása;

A tudástranszfer kontextusa és időbelisége;

Az adatok szerepe a tudományban;

A nyitottság (a publikációkhoz való nyílt hozzáférés, a nyílt adatok és a nyílt forrású szoftverek) hatása;

A tudás infrastruktúrájának fejlődési folyamata;

Az infrastruktúra finanszírozása.

Az infrastruktúra kapcsán említsük meg, hogy Borgman nem hagy kétséget afelől, hogy az adatokkal kapcsolatos infrastruktúra kiépítése meg fogja érni azt a rengeteg munkát, amelyet a tudományos világ belefektet.7

Mivel a „provokációk” szorosan kötődnek egymáshoz, a szerző három részben tárgyalja őket. Az adatok és a tudományos kutatás címet viselő rész tartalmazza a kutatási adatok meghatározását, továbbá felvázolja a hozzájuk fűződő kulturális tényezőket. Az esettanulmányokat tárgyaló rész egy-egy fejezetet szentel a természettudományoknak, a társadalomtudományoknak és a humán tudományoknak. A harmadik rész témáját az adatokkal kapcsolatos szakpolitikai irányelvek és gyakorlat adják.

Emeljünk ki néhány figyelemreméltó gondolatot a könyvből! A cím magyarázatául is szolgálhat az a megállapítás, hogy – míg bizonyos tudományágakban (például a genomikában vagy csillagászatban) az adatok nagy és közös tömegével dolgoznak a kutatók – a kutatások túlnyomó többségét végző egyének és kis csoportok helyhez kötött adatokat kezelnek, vagy olyan témákat kutatnak, amelyekben nem állnak rendelkezésre megosztott vagy megosztható adatok. Emellett nem szabad megfeledkeznünk arról az aranyszabályról sem, mely szerint, ami jó a fizikában, nem feltétlenül jó a filológiában, tehát nem mindig van arra lehetőség, hogy közös adatokat találjunk. A sokféleség ráadásul nemcsak tudományterületenként van meg, hanem minden egyes kutatási kérdés a megfigyelés az adatok rögzítésének más és más formáit követeli meg. Mindeközben mégis van közös nevező, amely többnyire a felsőbb szinteken jelenik meg.

Említsük meg, hogy aki netán azt forgatja a fejében, hogy a kutatási adatokról angol nyelven írna bármit, annak feltétlenül el kell olvasnia, amit Borgman az adatok szó egyes és többes számú használatáról ír.

Milyen adatokat tartsunk meg és miért? Ez a kérdés már a könyv zárófejezetének címe. Ebben a fejezetben a szerző újra megvizsgálja a „provokációkat”.

A könyv utolsó oldalán Borgman emlékeztet bennünket arra, hogy nincs általános érvényű válasz arra, hogy mit is értsünk kutatási adat alatt, mivel nehéz és összetett feladat ezt a fogalmat meghatároznunk. Tenopir szerint viszont Borgman könyve arra int bennünket, hogy a problémák összetettsége és diszciplináris különbségek ellenére a legtöbb kutató szeretné, ha jobb eszközök állnának rendelkezésére ahhoz, hogy kezeljék azt, amit adatnak tekintenek.8

Tegyük még hozzá, hogy – ismét Borgman szavaival élve – azok az elköteleződések, amelyeket a kutatási adatok kapcsán ma vállalunk, és azok a döntések, amelyeket meghozunk, nemcsak a jelen, hanem a jövő tudományának fejlődését is mélyreható módon fogják befolyásolni.

Végezetül, ne feledkezzünk meg arról sem, hogy ezen a téren bőven akad feladat a könyvtárak számára is.9

Jegyzetek

1.    KOLTAY Tibor: Gutenbergtől a globális információs rendszerekig: a digitális könyvtárak = Könyvtári Figyelő, 50. évf. 2005. 1. sz. 129–135. p. (http://ki.oszk.hu/kf/kfarchiv/2004/1/gutenberg.html)

2.    TENOPIR, Carol: Big data, little data, no data. Scholarship in the networked world by Christine L. Borgman = Journal of the Association for Information Science and Technology, 67. vol. 2016.  3. no.  751–753. p.

3.    SOLLA PRICE, Derek de: Kis tudomány, nagy tudomány. Budapest, Akadémiai Kiadó, 1979. 251 p.

4.    Z. KARVALICS László: A Nagy-Adat-jelenség társadalomtudományi lehorgonyzásához = Replika, 2015. 92–93. 189–201. p. (http://replika.hu/system/files/archivum/92-93_14_zkl.pdf)

5.    Science as an open enterprice. Final report. London, The Royal Society, 2012. (https://royalsociety.org/topics-policy/projects/science-public-enterprise/report

6.    BOYD, Danah – CRAWFORD, Kate: Critical questions for big data. Provocations for a cultural, technological and scholarly phenomenon = Information, Communication and Society, 15. vol. 2012. 5. no. 662–679. p. (Magyarul: Az adatrengeteg kínos kérdései: Vitaindító egy kulturális, műszaki és tudományos jelenségről = Információs Társadalom, 12. évf. 2012. 2. sz. 7–23. p. http://www.danah.org/papers/2012/BigData-ICS-Hungarian.pdf)

7.    Tenopir i. m. 753. p.

8.    Tenopir uo.

9.    KOLTAY Tibor: A kutatási adatok és a könyvtár = Könyvtári Figyelő, 60. évf. 2014. 2. sz. 223–235. p. http://ki.oszk.hu/kf/2014/06/a-kutatasi-adatok-es-a-konyvtar/

A domumentumok letötltésének ideje: 2016 október 17.

A bejegyzés kategóriája: 2016. 4. szám
Kiemelt szavak: , , , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!