A magyar kutatók adatműveltségi készségeiről

Bevezetés

Egy nemzetközi projekt (European Conference on Information Literacy, ECIL) részeként felmérést végeztünk a magyar kutatók adatműveltségéről.* Az ehhez használt online kérdőívet Serap Kurbanoğlu (Hacettepe Egyetem, Ankara, Törökország) és Joumana Boustany (Descartes Egyetem, Párizs, Franciaország) állította össze 2017-ben. Magyarra Koltay Tibor (Eszterházy Károly Egyetem) fordította le, a fordítást pedig Tóth János (Budapesti Műszaki és Gazdaságtudományi Egyetem) ellenőrizte. Kérésünkre az Egyetemi Könyvtárigazgatók Kollégiuma tagjai saját intézményeikben ösztönözték a válaszadást.

A hazai adatfelvétel esetében nem lehetett megbecsülni, hogy mekkora az egyes kutatók mintába kerülésének esélye, ezért úgynevezett kényelmi mintavételt végeztünk, amiből az is következik, hogy felmérésünk nem reprezentatív. Az összes kérdésre 108 kutató válaszolt. Ennek ellenére indokoltnak láttuk, hogy eredményeinket összevessük néhány külföldön elvégzett felmérés eredményeivel, hiszen ezek mindegyike ugyanazt a kérdőívet használta. Ugyanakkor nem törekedtünk teljességre, különös tekintettel arra, hogy a bemutatásra kerülő felmérésekben alkalmazott adatfelvételi módszerek egymástól, és az általunk alkalmazott megközelítéstől a közös eszköz használata ellenére is különböztek. El kell viszont mondanunk, hogy a kérdőívre két további, európai adatokat bemutató publikáció is alapul.1 Ezek azonban a feldolgozott írásoktól még inkább eltérő módon közelítik meg az eredményeket, ezért figyelmen kívül kellett őket hagynunk. 2019-ben megjelent egy másik, újabb tanulmány is, amely három bolgár egyetem 108 válaszadó kutatójának adatműveltségi jellemzőiről tudósít.2 Mivel ezt a felmérést is a fenti kérdőívvel végezték el, eredményei nyilvánvalóan tovább árnyalnák az adatműveltség európai állapotáról alkotott képünket, viszont nagymértékben hátráltatták volna a magyarországi eredmények közzétételét, ezért ezeknek az elemzésétől el kellett tekintenünk.

Dolgozatunkban tehát a következő országok (és ezen belül intézmények) felmérési eredményeiből válogattunk (zárójelben megadva a kitöltők számát):

  • Horvátország (Zágrábi Egyetem) (515),3
  • Izland (Izlandi Egyetem) (141)4,
  • Spanyolország (Complutense Egyetem, Madrid; János Károly Király Egyetem, Madrid; Burgosi Egyetem), (591),5
  • Szlovénia (Ljubljanai Egyetem, Maribori Egyetem; Primorska Egyetem, Koper). (315).6

Bár – ahogy majd a későbbiekben részletesebben ki fogunk rá térni – ezek a publikációk nem adják meg az összes, a felmérésben feltett kérdésre adott választ, érdemes néhány megállapításukra kitérnünk.

Mielőtt további részleteket mondanánk el a felmérések eredményeiről, tisztáznunk kell, mit is értünk adatműveltség alatt. Bár nem térünk ki a részletekre, elmondhatjuk, hogy az adatműveltség igazán jól a kutatási adatok és a könyvtár új és összetett viszonyának tükrében értelmezhető.7

A felmérés szemlélete mindenesetre egyértelműen az adatműveltségnek (adat-írástudásnak) ahhoz a megközelítéséhez áll legközelebb, amely olyan tevékenységek együtteseként határozható meg, amelyek a kutatási adatokhoz kötődő szolgáltatásokra fókuszálnak. Ez a szemlélet nem áll ellentétben az adatműveltség olyan megközelítéseivel sem, amelyek az adatokra alapozott döntéshozatalra figyelnek, mivel ebben a kontextusban – gyakori értelmezésével szemben – a döntéshozatal szó nem csak az üzleti szférához kötődik.8 Az adatműveltségről mindenesetre elmondhatjuk, hogy közeli rokonságban áll az információs műveltséggel, mivel azoknak a készségeknek és képességeknek az összességét foglalja magában, amelyek a kutatási adatok eléréséhez, megértéséhez, interpretálásához, kezeléséhez (menedzseléséhez), kritikai értékeléséhez, valamint etikus használatához szükségesek.9

Az eredmények bemutatása mellett szólnunk kell arról is, hogy néhány, a felmérési eredményekről tudósító írás a kutatási adatokkal kapcsolatos tudománypolitikai háttérre is kitér. A spanyolországi felmérés eredményeit bemutató dolgozat szerzői ezzel kapcsolatban felhívják a figyelmünket arra, hogy már 2014-ben készültek interjúk 270 kutatóval a kutatási adatokról. Azóta számos egyetem és egyetemi könyvtár hozott létre a kutatási adatok kezelését segítő szolgáltatásokat, és két konzorcium is működik ezen a területen.10 A horvátországi felmérés kapcsán megtudjuk, hogy a Horvát Rektori Konferencia 2015-ben adott ki a kutatási adatok kezelésével kapcsolatos ajánlást.11 Szlovéniában 2015 óta van ebben a témakörben nemzeti stratégia, akcióterv és kísérleti (pilot) program is. Mivel azonban nem empirikus vizsgálatok eredményeire támaszkodnak, nem tartalmaznak pontos iránymutatást és ajánlásokat. Nem foglalkozik a kutatók és más érdekeltek viselkedésével és kompetenciáival sem a stratégia, sem az akcióterv, továbbá nem esik szó bennük adatmenedzsmentről sem.12

A hazai felmérés eredményei

A résztvevők összetételét (demográfiai adatait) vizsgáló 7 kérdés utáni Az adatok kezelésével kapcsolatos ismeretek cím alá sorolt 18 kérdés közül 13 olyan volt, amelynél a lehetőségek közül az összes odaillő, igenlő vagy nemleges válaszlehetőséget meg kellett jelölni, így kijön, hogy adott országban a válaszadók hány százaléka használja ki az adott lehetőséget. A 13 kérdésben összesen 81 ilyen válaszlehetőség volt. A horvátországi felmérés anyagában találhatunk az összes kérdéshez kapcsoló eredményeket, 8 kérdésnél minden lehetőségnél, 5 kérdésnél azonban csak egy-két jellegzetesebb választ emeltek ki (a 24 lehetőség közül 8-at), így a 81 válaszlehetőségből összesen 65-öt. A spanyolországi felmérésről tudósító írás 7 kérdése esetében kapunk meg minden adatot, viszont 6 további kérdés 29 lehetőségével egyáltalán nem foglalkoznak szerzői, így összesen 52 választ ismerhetünk. Az izlandi cikknél összesen 5 kérdés 34 válaszlehetőségét kaptuk meg, a további 8 kérdéssel nem foglalkoztak, ahogyan az összes többivel sem. Így összesen egy olyan kérdéssel találkozhatunk, amelyre vonatkozóan mind a négy országból ismerjük a válaszokat, a 8. kérdés 14 lehetőségénél, viszont csak az izlandiaknál találunk pontos százalékértékeket, a horvát és a spanyol kollégák egy skálán ábrázolják az eredményeket, amelyekről körülbelüli pontossággal lehet csak leolvasni az értékeket. A spanyolországi felmérés 5 legfontosabbnak tartott értékét szöveges formában is megkapjuk, ami segíthet abban, hogy mennyire lehet pontos a becslésünk.

Két olyan kérdés volt, ahol három lehetőség (MB, GB, TB) közül kellett egyet kiválasztani, innen a spanyol és a horvát válaszokat ismerhetjük. Ugyancsak ők adtak meg adatokat annál a kérdésnél, ahol 15 esetben kellett az igen, nem, nem tudom lehetőségek valamelyikét kiválasztani, a horvátok 7, a spanyolok 10 részkérdést elemeztek, 4 olyan volt, amelyet mindketten, és kettő olyan, amelyet egyikük sem.

A jelen tanulmányban legkevésbé feldolgozhatónak azok a kérdések bizonyultak, amelyek megválaszolásához egy ötfokú skálán kínált lehetőségek közül kellett választani. Ezeknél ugyanis a spanyol és a horvát felmérés eredményeinek közzétételekor összevonva kapunk meg adatokat, éppen ezért ezeknek a kérdésnek a 32 részkérdése közül 14 esetben nem tudjuk összehasonlítani a magyar válaszokat semmivel.

A kutatók által használt adatfájlok típusára vonatkozó kérdés az első, amelyre mind a négy országból rendelkezünk válaszokkal.

Adatformák magyar horvát spanyol izlandi
Szabványos irodai dokumentumok (szövegek, táblázatok, prezentációk stb.)

1.

99,07

(92,52)

1.

92

(91)

1.

90,7

(84,3)

1.

88,24

Képfájlok (JPEG, GIF, TIFF, PNG stb.)

2.

85,05

(56,07)

2.

87

(61)

3.

69,5

(47,7)

3.

58,82

Internet- és webalapú adatok (weboldalak, e-mailek, blogbejegyzések, közösségi hálózatok adatai stb.)

3.

76,64

(32,71)

3.

70

(22)

2.

74,8

(28)

2.

64,7

ZIP, RAR stb. alkalmazásával tömörített adat

4.

63,55

(28,04)

4.

62

(37)

4.

57,5

(22)

5.

38,82

Alkalmazói szoftverek (szerkesztő és fordítóprogramok stb.)

5.

42,06

(8,41)

5.

55

(21)

8.

32

(13)

12.

8,24

SPSS, GIS stb. használatával létrehozott, strukturált tudományos és statisztikai adatok

6.

41,12

(40,19)

6.

52

(46)

5.

51,9

(51,3)

4.

52,94

Hangfájlok

7.

34,58

(12,15)

11.

20

(8)

11.

21

(8)

6.

35,3

Forráskód (Java, C, C++ stb.)

8.

26,17

(13,08)

10.

22

(17)

12.

16

(8)

10.

11,76

Nyers (gépi) adat

9.

22,43

(16,82)

9.

28

(20)

10.

21

(14)

9.

25,88

Jelölő nyelvvel (XML, SGML stb.) kódolt szöveg

10.

17,76

(8,41)

13.

14

(12)

13.

11

(6)

11

9,41

Nem-digitális adat (papíron, filmszalagon, tárgyak formájában stb.)

11.

14,95

(27,10)

7.

36

(20)

6.

40

(21)

8.

30,59

Konfigurációs adatok (naplófájlok, könyvtárfájlok stb.)

12.

14,95

(7,48)

14.

12

(8)

9.

21

(9)

14.

3,53

Access, Oracle, MySQL stb. segítségével létrehozott adatbázisok

13.

13,08

(10,26)

8.

34

(15)

8.

33

(15)

7.

32,94

CAD, CAM, VRML stb. alapú strukturált grafika

14.

3,74

(1,87)

12.

16

(14)

14.

7

(7)

13.

4,71

1. táblázat
Az adatok formája

Az összes felmérésben azt látjuk, hogy a válaszadó kutatók 90%  körüli többsége szabványos irodai dokumentumokat (szövegeket, táblázatokat, prezentációkat stb.) használ fel és hoz létre. Kisebb sorrendbeli eltérésekkel, „dobogós helyen végeztek” még a képfájlok (JPEG, GIF, TIFF, PNG stb.), valamint az internet- és webalapú adatok (weboldalak, e-mailek, blogbejegyzések, közösségi hálózatok adatai stb.).

Az izlandi felmérés készítői megjegyzik, hogy a humán tudományok területén – egyébként teljesen érthető okokból – kiemelkedően magas (70,5%) a nem-digitális adatok aránya.

A horvát, izlandi, és a szlovén adatok azt mutatják, hogy az adatok mennyisége gigabájtokban mérhető és ritkán lépi túl az 1 terabájtot. Ha a spanyolországi, részletesebb adatokat nézzük, akkor a következő képet kapjuk: a kutatók által felhasznált adatok 44,8%-a gigabájtokban, 45,2%-a megabájtokban mérhető, és csak 8%-uk használt terabájt léptékű adatokat. A saját maguk által létrehozott adatok megoszlása hasonló volt: GB = 37,9%, MB = 53,3%.

A szlovén, a horvát és a spanyol kutatók többségére (az utóbbiak esetében 98,1, illetve 94,3%-ban) egyaránt jellemző, hogy adataikat saját eszközeiken tárolják. Azok aránya, akik felhőben is tárolnak adatokat Horvátországban 45,8%, Spanyolországban 50,3%. Az intézményi repozitóriumok részesedése 18.4, illetve 17,8%, míg a külső repozitóriumoké 8,3, illetve 10,0% ezekben az országokban.

Az, hogy a keletkezett adatok mennyisége a legtöbbször alacsonyabb egy-egy típusnál, érthető, mivel feltételezhető, hogy a válaszadók többféle anyagot használnak fel egy-egy kutatásnál, de annak eredményei annál kevesebb formában rögzülnek.

Az is érthető, hogy a leggyakrabban a szabványos irodai dokumentumokat használják minden országban, az azonban feltűnő, hogy a magyar válaszadók közül egy kivételével mindenki bejelölte azt. A magyar és a horvát válaszadóknál az első 6 válasz sorrendje teljesen megegyezik, a spanyoloknál és az izlandiaknál az internet- és webalapú adatok használata megelőzi a képfájlokét.

A spanyol válaszadók körében az 5. legfontosabbnak tekintett strukturált tudományos adatok és ugyanígy kisebb arányok mellett az adatbázisok és strukturált grafika, az internet- és webalapú adatok mellett a hagyományosabbnak tekinthető képfájloknál és a nem-digitális adatoknál a legmagasabb a magyar arány.

Egyes válaszok előfordulását az is befolyásolja, hogy a kutatók egy része esetében valószínűsíthető, hogy nincsenek tisztában az egyes formátumok mibenlétével. Az eredmények ezt is tükrözhetik.

Két másik kérdést is összevontan értékeltek horvát és spanyol kollégáink. Ezek közül a 9. kérdés a kutatások során felhasznált, míg a 13. a létrehozott adatok méretére vonatkozott.

A magyaroknál a legmagasabb a választható értékek közül legkisebb, megabájtnyi érték aránya 52,34%, illetve 62,61%. Ez az érték a spanyol kutatóknál is magas (45,2%, 53,3%), viszont a horvátoknál jóval alacsonyabb (26,4%, 37,83%). Ez természetesen megfordul a gigabájt nagyságrendű adatok esetében: A magyar érték 37,38%, 30,84%, a horvát 60,2%, 54,37%, a spanyol pedig 44,8%, 37,9%.

A terabájtnyi nagyságrend esetében kisebbek az értékek és a köztük levő különbségek is: magyar: 9,35%, 5,57%, horvát: 13,4%, 7,8%, spanyol: 8%, 8%. Ezek az eredmények egybecsengenek a 8. és 12. kérdés válaszaival: úgy tűnik, hogy a magyar kutatások hagyományosabbak.

A diszciplináris különbségek, tehát a kutatási témák eltérő volta folytán jelentős különbségek merülhetnek fel a méretekben. Egy orvostudományi cikket, ahol metszetek, vagy egy művészettörténeti írást, ahol képrészletek nagy felbontású ábrázolásai is előfordulhatnak, nem lehet összehasonlítani egy humán tudományterület grafikonjainak, táblázatainak, egyszerűbb illusztrációinak méreteivel. Egy-egy felhasznált, megalkotott kimeneti fájltípus is befolyásolja a méreteket. Ha egy hangfájl, videofájl méretét összehasonlítjuk egy forráskód vagy egy naplófájl méretével, előre tudhatjuk az eredményt.

Adatokhoz való hozzájutás magyar horvát izlandi
Új adatok generálásával.

63,55

83,9

96,47

Saját intézményi kutatócsoport útján.

41,12

43,53

A saját kutatóhálózat (személyes/szakmai) kapcsolatok útján.

55,14

51,3

55,29

Mindig egy ismert forrásból.

4,67

1,18

Mindig több ismert forrásból.

54,21

21,18

Egyéb.

4,67

2. táblázat
A kutatásához szükséges adatokhoz való hozzájutás

Az adatok alapján látszik, hogy mennyivel kevesebben vannak a magyar kutatók között, akik új adatok generálásával jutnak adatokhoz. Bár spanyol adatokkal nem rendelkezünk, az eddigiek alapján feltételezhető, hogy ott is magasabb lenne ez az érték.

Más (külső) források használata magyar horvát izlandi
Abban a formában, ahogy kapom, probléma nélkül tudom használni.

34,58

53

43,53

A tisztításba és változtatásba fektetett némi erőfeszítéssel.

58,88

55

55,29

Az adatokat sok időt felhasználva és nagy erőfeszítéssel használhatóvá téve.

25,23

21,18

Nem használok másoktól/külső forrásból származó adatokat.

8,41

16,47

3. táblázat
A másoktól vagy külső forrásból származó adatok felhasználása

Feltűnő, hogy az izlandiakhoz képest mennyivel kevesebben olyan magyar kutató van, aki nem használ külső forrásokból vett adatokat, továbbá az is, hogy a felhasználók magasabb arányából mennyivel kevesebben jelölték meg azt, hogy probléma nélkül, eredeti formában használnák fel a kapott anyagot. (Mivel több választ is lehetett adni, nincs abban semmi különös, hogy a számok alapján a horvát kutatók között vannak olyanok, akik a kapott anyagok egy részét egy az egyben használják fel, más részét pedig módosítva).

Tárolás magyar horvát spanyol
Saját eszközön (számítógépen, külső merevlemezen stb.).

94,39

98,1

94,3

Felhőben.

35,51

45,8

50,3

Intézménye központi szerverein/repozitóriumában.

39,25

18,4

17,8

Külső repozitóriumokban.

14,02

8,3

10

4. táblázat
Az adatok tárolása

Azt is láthatjuk, hogy mindhárom országban nagy arányban vannak, akik saját eszközeiken tárolják adataikat. A további válaszok alapján az is megállapítható, hogy bár többen vannak azok, akik valahol máshol is tárolnak adatokat, viszonylag sokan lehetnek, akik csak saját eszközeikre támaszkodnak. Az viszont örvendetes, hogy a magyarok sokkal nagyobb arányban tárolhatják (a korábbi válaszok alapján valamivel kisebb mennyiségű) adataikat saját intézményük szerverein és repozitóriumaiban, mint horvát és spanyol kollégáik.

Ehhez a kérdéshez kapcsolták azt a horvát válaszadók, hogy a náluk kimutatott 18,4%-hoz képest sokkal többen vannak azok (69,3%), akik úgy gondolják, hogy az intézmény eszközein lenne a legjobb helye az adatoknak.

Az adatok tartós, egy-egy adott projekt élettartamán túli tárolását a magyar válaszadók 96%-a támogatná, míg a horvát kutatóknak csak 30,1%-a, ráadásul 48,5%-uk a „nagyon nem értek egyet” válaszlehetőséget jelölte meg. Valószínű azonban, hogy a magyarok a tárolás fontosságára figyeltek, a horvátok pedig arra, hogy ne nekik kelljen tárolni.

Milyen kiegészítő információt mellékel magyar horvát spanyol
Adminisztratív információt (a létrehozó nevét, a létrehozás dátumát, a fájl nevét, a hozzáférés feltételeit/korlátait stb.).

49,53

60,6

43,1

Az adatok megtalálását segítő információkat (A létrehozó és a finanszírozó intézmény nevét, a project címét és azonosítóját, kulcsszavakat stb.).

41,12

31,5

41,6

Technikai információkat (a fájl-formátumokról, a fájlok méretéről, a felhasználáshoz szükséges hardverről és szoftverről stb.).

13,08

20,4

23

Az adatfájl leírását (a fájl/adatok szerkezetéről, a mezőkódokról, az alkalmazási szabályokról stb.).

26,17

26,17

24,5

Nem. Kutatási adataimhoz nem csatolok kiegészítő információkat.

23,36

28,9

72,6

5. táblázat
A „Rendes körülmények között, csatol-e Ön kiegészítő információkat kutatási adataihoz?” kérdésre adott válaszok

Ezen a téren nem találunk igazán lényeges különbségeket az egyes országok válaszai között. A tapasztalható kisebb különbségek részben abból adódhatnak, amit az eddigi adatok láttán is feltételezhettünk, nevezetesen azt, hogy Magyarországon nagyobb arányban vannak hagyományos kutatások, ezért lehet magasabb a megtalálást segítő és alacsonyabb a technikai információk aránya. Hogy hogyan jött ki a spanyol válaszok esetében az utolsó kérdés értéke, az nem nagyon magyarázható.

Adatmegosztás magyar horvát izlandi
Nem.

9,35

6,4

Igen. Saját kutatócsoportom tagjaival.

65,42

81,7

61,18

Igen. Saját intézményem kutatóival.

43,93

28,5

56,47

Igen. Más intézmények kutatóival.

51,40

38,8

50,59

6. táblázat
Együttműködés más kutatókkal az adatok megosztása terén

A horvátországi mintában feltűnő a saját kutatócsoportok választásának magas aránya. Ahol ez alacsonyabb, ott feltehetőleg kisebb arányban dolgoznak kutatócsoportokban, s ezért lehet magasabb a saját intézményben máshol és a más intézményekben dolgozókkal való együttműködés aránya.

A kutatási adatok jellemzői magyar horvát izlandi
Adataim mindenki számára nyíltan elérhetőek.

26,17

18,1

14,12

Adataim nyíltan elérhetőek kutatócsoportom tagjai számára.

28,97

49,5

32,94

Adataimat kérésre rendelkezésre bocsátom.

52,34

68,5

28,24

Adataimhoz a hozzáférés korlátozva van (pl. csak egyes adatállományok hozzáférhetőek).

28,97

23,1

30,59

Adataim nem elérhetőek mások számára.

10,28

3,1

16,47

7. táblázat
A felhasznált kutatási adatok legfontosabb jellemzői

Feltűnő, hogy a magyar kutatók között azoknak a száma a legnagyobb, akik nyíltan elérhetővé teszik adataikat (talán a hagyományosabb kutatások miatt), a kutatócsoport számára nyújtott nagyobb arányú elérhetőséget horvát kollégáiknál az magyarázhatja, hogy többen dolgoznak kutatócsoportban. Izlandi kollégáik azok, akik leginkább korlátozzák a hozzáférést, őket ebben a magyarok követik.

Aggodalmak az adatmegosztással kapcsolatban magyar horvát izlandi
Nem.

42,06

36,47

Eltűnhet a kutatásban meglevő versenyképességi előnyöm.

22,43

17,65

Jogi és etikai problémák merülhetnek fel.

28,04

44,71

Visszaélhetnek az adataimmal.

18,69

48,7

23,53

Félreértelmezhetik az adataimat.

24,29

50,5

22,35

Nincsenek meg a technikai, anyagi stb. forrásaim.

6,54

16,47

Nincsenek megfelelő irányelvek és hiányzik a jogvédelem.

11,21

9,41

8. táblázat
Aggodalmak a kutatási adatok más kutatókkal történő megosztása kapcsán

Az előző táblázatból is leolvasható, de érdemes kiemelnünk, hogy a horvát kutatók közül csak kevesen gondolják, hogy nincs szükségük a más kutatókkal való együttműködésre és az adatok megosztására, azonban csupán 18,1%-uk oszt meg másokkal adatokat. Sokan közülük (50,5%) attól félnek, hogy, adataikat félreértelmezik, továbbá – hasonló mértékben, azaz 48,7%-ban – tartanak attól, hogy adataikkal mások visszaélnek. Ez alól nem jelentenek kivételt a szlovén válaszadók sem. Az izlandi kutatók esetében viszont jóval alacsonyabb (23,53 és 22,35%) volt azok aránya, akik ezeket az aggodalmakat osztják.

A horvátországi összeállításban azt a két akadályt adták meg, amelyekkel kapcsolatban a legnagyobb mértékű a félelem (ez a kettő viszont jóval meghaladja a másik két országnál található adatokat), de hozzáteszik, hogy mindegyik probléma jelen van valamennyire: a magyar kutatók aggodalma egyes kérdéseknél kisebb, másoknál valamivel nagyobb az izlandiakénál, de összességében ez látszik a legkisebbnek.

Ki fedezze a tárolás és
a nyilvánossá tétel költségeit
magyar horvát
Önnek/az Ön kutatócsoportjának

16,82

Az Ön intézményének

64,49

71,4

A finanszírozó(k)nak

42,99

Valamilyen nemzeti testületnek

26,17

9. táblázat
A „Kinek kellene fedeznie az Ön által létrehozott adatok tárolásával és nyilvánossá tételével kapcsolatos költségeket?” kérdésre adott válaszok

A horvát kutatók azzal, hogy csak egy választ jelölték meg, nyilvánvalóan azt kívánták kifejezni, hogy többségük szerint intézményüknek kellene fedeznie a költségeket. A magyar válaszadók majdnem kétharmada is ezt a lehetőséget választotta, és a legkevesebben gondolták úgy, hogy nekik vagy kutatócsoportjuknak lenne ez a feladata.

A hosszú távú tárolás helye magyar horvát
Az Ön intézményénél

64,49

69,3

A finanszírozó intézménynél

27,10

Külső, ingyenes tárolóhelyen

37,38

Külső, fizetős tárhelyen

12,15

10. táblázat
Az adatok hosszú távú tárolásának helye

A horvátok itt is csak azoknak a lehetőségnek az adatait adták meg, amelyeket a legtöbben választottak, majdnem olyan arányban, mint az előző kérdésnél, és az ottani válaszhoz igazodva. A magyarok itt ugyanolyan számban jelölték meg a saját intézményt, mint az előző kérdésnél. Egyéb válaszlehetőségként négyen jelöltek meg a saját eszközt, tárolóhelyet, ami a gyakorlatban ennél sokkal nagyobb mértékben érvényesül.

Részvétel tréningeken magyar horvát spanyol
Adatkezelési tervek Részt vett

0,93

3

4,6

Részt venne

36,45

61

61,4

Metaadatok Részt vett

5,61

4

5,1

Részt venne

42,06

53

49,2

Konzisztens fájlelnevezési gyakorlat Részt vett

2,80

2

1,7

Részt venne

27,10

42

42,9

Adatállományok verzióinak kezelése (verziókezelés) Részt vett

2,80

2

2,0

Részt venne

39,25

32

38,9

Az adatokra való hivatkozás stílusai Részt vett

10,28

19

20,1

Részt venne

40,19

34

37,7

Nem vettem részt ilyen tárgyú képzésben

84,11

79

73

11. táblázat
Részvétel formális képzésekben (tréningeken)

Ennek a két kérdésnek fontos részét jelentik az adatkezelési tervek. Ezek készítését a kutatásfinanszírozó szervezetek egy része előírja, azonban jelenleg csak a kutatók kisebb részét érintik az ezekkel kapcsolatos teendők.

A horvát és a spanyol válaszadók 80% körüli arányban úgy gondolják, hogy intézményüknek nincsen adatkezelési terve (Data Management Plan, DMP). Némileg kisebb és egymástól is eltérő arányban (78,4 és 72,6%-ban) sohasem használtak ilyen tervet. Az adatkezelési terveket potenciálisan hasznosnak ítélte a horvát kutatók 35,5%-a, míg ez az arány 31,9% volt spanyol kollégáik körében. Tegyük hozzá, hogy a két országban a válaszadók 59,0, illetve 63,8% nem tudja megmondani, hogy a DMP-k segítik-e a kutatási adatok menedzselését. A szlovén kutatók is csak kis számban használnak DMP-t, bár egyharmaduk hasznosnak gondolja őket.

Feltűnő, hogy milyen sokan nem vettek részt semmilyen képzésben, s ezek között is a magyarok vannak a legnagyobb arányban. Azok között, akik részt vettek valamilyen képzésben, a többség a hivatkozási stílusról tanult. A magyar kutatók között volt a legkevesebb ilyen, viszont erről ők szeretnének a legnagyobb arányban tanulni. Ugyanakkor jól látható az, hogy a többi országhoz képest mennyivel kevesebben igényelnének oktatásokat a magyar válaszadók az adatkezelési tervekről és a konzisztens fájlelnevezési gyakorlatokról.

Az adatkezelési tervekkel, a metaadatokkal, a szab­ványos/ konzisztens fájlelnevezési rendszerekkel, az adatokra való hivatkozás valamelyik szabványos formáival, a DOI (Digital Object Identifier) és ORCID (Open Researcher and Contributor ID) azonosítókkal, valamint a nyílt hozzáféréssel (Open Access) kapcsolatos kérdéssor kapcsán beérkezett magyar válaszok is igen tanulságosak.

Az adatkezelés formái Igen Nem vagyok biztos benne Nem
Van-e az Ön intézményének adatkezelési terve (Data Management Plan, DMP)?

8,41

71,03

20,56

Használt-e Ön valamikor kutatásához adatkezelési tervet?

13,08

9,35

77,57

Van-e (valamelyik) jelenlegi kutatásának adatkezelési terve?

13,08

9,35

77,57

Ön szerint segítik-e az adatkezelési tervek a kutatási adatok kezelését (menedzselését)?

34,58

50,46

14,95

12. táblázat
Az adatkezelési tervek, metaadatok, szabványos fájlelnevezési rendszerek, az adatokra való hivatkozás
szabványos formái, DOI és ORCID azonosítók, nyílt hozzáférés

A tudományos kutatóknak az adatkezelési tervekben megfogalmazottak szerint figyelembe kell venniük a kutatási jogosultságot, a kutatás pontos célját, a kezelendő személyes adatok körét és azok forrásait, az adatkezelés komplex folyamatát, az érintett jogainak érvényesítését biztosító intézkedéseket, valamint az adatvédelmet biztosító technikai és szervezési intézkedéseket. A válaszadók a kutatási terv létezésével kapcsolatban 90%-ban nemleges vagy bizonytalan választ adtak, továbbá a valamikori és jelenlegi használat aránya sem sokkal jobb. A terv fogalmát ismeri és annak szükségességét a válaszadók 34,58%-a fontosnak tartja, viszont ez alig több mint egyharmada azoknak, akik biztosan állították, hogy már használtak, vagy jelenleg is használnak ilyet.

Metaadatok ismerete Igen Nem vagyok biztos benne Nem
Ismeri Ön a metaadat fogalmát?

74,77

11,21

14,01

Gondolja-e, hogy a metaadatok használatával kapcsolatos formális képzés hasznos lesz a kutatási adatok kezelésében?

54,21

39,25

6,54

Van az Ön intézményében előírás arra, hogy az adatoknak repozitóriumokba történő felöltésekor milyen metaadatokat használjon?

21,50

49,53

28,97

13. táblázat
A metaadatok ismerete

A metaadatok fogalmát a válaszadók háromnegyede ismeri, viszont mindössze 14,01% vallotta be, hogy nem tudja, mit jelent ez a kifejezés. Az 50% formális képzések szervezését hasznosnak tartaná. Ezen a téren az előírások meglétéről csupán 21,50% állítja, hogy intézményében van ilyen, és a válaszadók 50%-a nem biztos benne.

Fájlnevek Igen Nem vagyok biztos benne Nem
Használ, vagy ajánl-e az Ön kutatói közössége szabványos fájlelnevezési rendszert?

20,56

23,36

56,07

Van-e az Ön intézményének szabványos/konzisztens fájlelnevezési rendszere?

3,73

37,38

58,88

14. táblázat
Szabványos fájlelnevezési rendszerek

A fájlok szabványos elnevezése első hallásra talán feleslegesnek tűnhet, de nagyobb adatmennyiségnél, több kutató esetén igen hasznos eszköze lehet a visszakeresésnek. A válaszokból az is kitűnik, hogy csekély számú intézményben (3,73%) létezik az elnevezések használatára vonatkozó előírás. Mindkét válasz esetében közel 60%-os a nemleges válasz, ami hosszú távon várhatóan változni fog. A vizsgált országoknál hasonló eredmények születtek.

Hivatkozások használata Igen Nem vagyok biztos benne Nem
Használja-e Ön az adatokra való hivatkozás valamelyik
szabványos formáját?

33,64

16,82

49,53

Ismeri Ön a DOI (Digital Object Identifier) fogalmát?

68,22

9,35

22,43

Ajánl-e az Ön intézménye specifikus irányelvet (APA, Harvard stb.) az adatokra való hivatkozás tekintetében?

23,36

38,31

38,31

Van Önnek egyed kutatói azonosítója (ORCID = Open Researcher and Contributor ID)?

29,91

14,95

55,14

Ösztönzi-e Önt intézménye arra, hogy adatait a nyílt hozzáférés (Open Access) keretében ossza meg?

32,71

27,10

40,19

15. táblázat
A hivatkozási rendszerekkel foglalkozó kérdésekre adott válaszok

A hivatkozási rendszerekkel foglalkozó kérdésekre adott válaszokból az derül ki, hogy a magyar kutatók 33,64%-a használ szabványos formát, és az intézményeknek is csak 23,36%-a ajánlja valamelyik ismert, speci­fikus irányelv használatát. A horvátországi felmérés eredményei viszont azt mutatják, hogy a szabványos formák használatára az intézmények 54%-a tesz közzé irányelveket, és közel 15%-kal kisebb a bizonytalan választ adók aránya. Egyedi ORCID azonosítóval a magyar válaszadók közel egyharmada rendelkezik, viszont meglepő a bizonytalanok 15%-os, viszonylag jelentős aránya. A horvát válaszadóknál az azonosítóval rendelkezők aránya 41,5%, tehát több mint 10%-kal magasabb, míg az azonosítóval nem rendelkezők 37,7%-ot tesznek ki.

A nyílt hozzáférés alkalmazására az intézmények a válaszadók esetében egyharmados arányban kapnak intézményi ösztönzést arra, hogy ezt megtegyék. A 40%-os nemleges válaszarány úgy gondolom lassan, de csökkenni fog az évek során.

Adattárolás Igen Nem vagyok biztos benne Nem
Ismeri Ön intézményének (finanszírozójának) az adatok tárolására vonatkozó előírásait?

19,63

26,17

54,21

16. táblázat
Adattárolási előírások

A válaszadók 54,21%-a nem ismeri saját intézményének adattárolásra vonatkozó előírásait. Ez a magas arány megkérdőjelezi az adattárolási szokásokról szóló válaszok hitelességét, mivel ezeknek az előírásoknak az ismerete, betartása esetén az ott adott válaszok eltérő értékeket mutattak volna.

Záró megjegyzések

Az adatok puszta összevetése mellett már írásunk első részében is megpróbáltuk kiemelni a különbségek és hasonlóságok nyilvánvaló vagy vélhető okait. Ennek megfelelően nem látjuk szükségesnek, hogy ezeket újra leírjuk. Ugyanakkor maradt még néhány, főként az esetleges jövőbeli vizsgálatokra vonatkozó gondolatunk, amelyeket az alábbiakban osztunk meg a kedves olvasóval.

A felmérés tanulságai közül érdemes kiemelnünk, hogy a magyar kutatók nagy számban adnak közre adatokat, írásokat. Azonban az adatok kezelését többségük régen tanulta (közel 80 fő több mint tíz éve publikál). Ez azt is jelenti, hogy kevésbé valószínű, hogy számoltak az adatok esetleges megosztásával.

Érdekes adatokat kaphatnánk annak vizsgálatával, hogy milyen korosztály adta a válaszokat, továbbá van-e jelentős eltérés a kutatók életkora és az általuk használt megoldások között. Nem egyértelmű, hogy aki idősebb, az már több éve publikál is. Vizsgálható lenne a kutatók tudományág szerinti megoszlása. Evvel véleményünk szerint szignifikáns különbségeket tapasztalnánk.

Elgondolkodtató az adatbiztonság kérdése. A fizikai, a logikai és az adminisztratív védelem hármas szempontrendszerének való megfelelést is vizsgálni kellene, amikor tárolásról beszélünk. A többes adattárolás módozatai közül a legkisebb számban a magyar válaszadók a külső, fizetős tárhelyet jelölték meg. Ez több kérdést is felvet. Megbíznak a saját intézményük infrastruktúrájában, szakembergárdájában, vagy a kutatási projektek, pályázatok tervezésénél már a hosszú távú tárolás költségei a fenntarthatóság kidolgozása során már nem kerülnek tervezésre? A csak a saját eszközein és csak egy eszközön tárolók arányát kellene közelíteni a nullához.

A felhő alapú adattárolás és azon belül a térítésmentesen igénybe vehető szolgáltatások száma egyre nő, és használatuk egyszerűbbé vált. Az erre vonatkozó döntések meghozatalában fontos szempont a biztonság megléte, a hálózati infrastruktúra kiépítettsége és a rendelkezésre állás aránya. A felhőben tárolt adatok esetében ugyanakkor kikerül az irányítás a felhasználó kezéből, bármilyen változás a szolgáltató oldaláról befolyásolhatja adataink elérését, ami napi munkára is kihathat. Éppen ezért egyre több intézménynek kellene hibrid felhő alapú szolgáltatásokat nyújtani dolgozóinak, ami azt eredményezné, hogy az adatok egy része a kutatók saját kezében marad, saját irányítás alatt lévő megoldásokat használva létezik, így kerülve el ezeket a problémákat.

Végezetül várhatóan hasznos volna intézményi keretek között, például tanfolyamokon, képzéseken megismertetni a kutatókkal a kutatás témájában az elmúlt időszakban bekövetkezett változásokat. Ezt emeli ki a válaszadók egyike, aki a következőket írja: „A napi használatban lemaradásaim vannak, mert a technológia olyan gyorsan fejlődik, hogy a napi munka mellett nem tudok lépést tartani, hogy felzárkózzak a fejlődésben”.

Irodalom és jegyzetek

1.   Drobíková, B. – Jarolímková, A. – Souček, M. : Data literacy among Charles University PhD students. Are they prepared for their research careers? In: European Conference on Information Literacy. 5th European Conference, ECIL 2017, Saint Malo, France, September 18–21, 2017, Revised Selected Papers, 169–177. p., Springer, Cham. ; Wiorogórska, Z. – Leśniewski, J. – Rozkosz, E.: Data literacy and research data management in two top universities in Poland. Raising awareness. In: European Conference on Information Literacy. 5th European Conference, ECIL 2017, Saint Malo, France, September 18–21, 2017, Revised Selected Papers, 205–214. p. Springer, Cham.

2.   Todorova, T. – Garvanova, M. – Peteva, M. – Avramova, V.: Comparative findings from data literacy survey in three Bulgarian universities. Proceedings of EDULEARN19 Conference 1st-3rd July 2019, Palma, Mallorca, Spain

3.   Špiranec, S. – Kos, D.: Data literacy and research data management. The Croatian State of Affairs. In: European Conference on Information Literacy. 5th European Conference, ECIL 2017, Saint Malo, France, September 18-21, 2017, Revised Selected Papers. 148–157. p. Springer, Cham.

4.   Pálsdóttir, Á.: Data literacy, collaboration and sharing of research data among academics at the University of Iceland. In: European Conference on Information Literacy 5th European Conference, ECIL 2017, Saint Malo, France, September 18-21, 2017, Revised Selected Papers. 178–185. p. Springer, Cham.

5.   Arias-Coello, A. – Simon-Blas, C. – Arranz-Val, P. – Simon-Martin, J.: Research data management in three Spanish universities. In: European Conference on Information Literacy. 5th European Conference, ECIL 2017, Saint Malo, France, September 18–21, 2017, Revised Selected Papers, 195–204. p. Springer, Cham.

6.   Vilar, P. – Zabukovec, V.: Research data management and research data literacy in Slovenian science. Journal of Documentation, 75. vol. 1. no. 2019. 24–43. p.

      Forrás:  https://doi.org/10.1108/JD-03-2018-0042

7.   Erről lásd a következőket: Holl András: Kutatási adatok kezelésének trendjei.= Tudományos és Műszaki Tájékoztatás, 62. évf., 5. sz., 2015. 177–180. p. ; Holl András: A nyílt kutatási adatok kezelésének három oldala. In: NETWORKSHOP 2018. Konferenciakiadvány. Budapest: HUNGARNET Egyesület, 2018. 59–63. p.;

Koltay Tibor: A kutatási adatok és a könyvtár. = Könyvtári Figyelő, 60. évf. 2. sz. 2014. 223–235. p. ; Koltay Tibor: A kutatási adatok megosztása. = Magyar Tudomány, 176. évf., 4. sz. 2015. 488–494. p. ; Kovács László: Adatkezelés. A (kutatási) adatok kezelése a magyar tudományos és memóriaintézményekben. = Magyar Tudomány, 179. évf., 7. sz. 2018. 1001–1016. p.

8.   Khan, H. R. – Kim, J., – Chang, H. C.: Toward an understanding of data literacy. In:  iConference 2018 Proceedings Conference Poster.

      Forrás:  https://www.ideals.illinois.edu/handle/2142/100243 [2019. szeptember 2.]

9.   Koltay, Tibor: Data literacy: In search of a name and identity. = Journal of Documentation, 71. vol. 2. no. 2015. 401–415. p.

10. Arias-Coello, A. et al.: Research data management

11. Špiranec, S. – Kos, D.: Data literacy and research data management

12. Vilar, P. – Zabukovec, V. Research data management

Beérkezett: 2019. szeptember 2.

A bejegyzés kategóriája: 2019. 3. szám
Kiemelt szavak: , , , , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!