Áttekintés a dán könyvtárosok adattudományt érintő kompetenciáiról és gyakorlati tevékenységeiről

Alina Stoicescu: An overview of data science practices and
competencies of Danish Librarian c. írását Német Márton tömörítésében
közöljük.

Bevezetés

A dinamikus gyorsasággal növekvő tudás forgatagában a könyvtárosok maradtak azon kevés társadalmi szereplők egyike, akik megbízható információforrásokat kínálnak felhasználóik számára. Mégis felmerül egy egyre erősebb társadalmi vélemény, hogy az internet idejétmúlttá teszi a könyvtárakat (Galluzzi, 2013). Nem csoda, hogy az utóbbi évtizedekben a könyvtárosoknak újjá kell formálniuk magukat és munkaköreiket, hogy információtudományi szakemberekké válhassanak. Az adatok kezelésében jártas könyvtárosok hatékonyabban tudják a kutatókat támogatni a kutatásaikhoz szükséges adatforrások kezelésében, s hasznos összefüggéseket tárhatnak fel részükre a könyvtári adatforrásokból is.

Ez a tanulmány amellett érvel, hogy a tudományos könyvtárak könyvtárosai ideális szerepkörben vannak az adatok és adattudománnyal kapcsolatos tevékenységek művelése kapcsán. Dán összefüggésekbe helyezve ezt a témakört, felvázolom az adattudományi kompetenciáknak és gyakorlatoknak a dán tudományos könyvtárakban található összképét, hogy minél több könyvtárost ösztönözzek az adattudományi képességekkel való felvérteződésre. Annak érdekében, hogy részletesebb adattudományi körképet kapjunk a dán tudományos könyvtárak kapcsán, az alábbi kutatási kérdés fogalmazódott meg: „Milyen dán tudományos könyvtárosokat érintő irányelvek és kompetenciák vázolhatók fel az adattudomány kapcsán?”

A kérdésre történő válaszhoz szükséges volt információkat szerezni a dán könyvtárosokat célzó adattudományi workshopokról és tanfolyamokról, valamint azokról az adattudományhoz kötődő kompetenciákról, melyekkel rendelkeznek már ezek révén.

Módszerek

A tudományos módszerek háromszöge került alkalmazásra, az adatok teljességét, illetve a félreértések elkerülését szolgálva. Ez a tanulmány alapvetően társadalomtudományi arcéllel bír, fontos volt kvalitatív adatokat szerezni a kutatások tárgyáról, mert így vált lehetővé, hogy elmélyedjünk abban, miért kell voltaképpen e témakörrel foglalkozni.

Először egy több válaszlehetőséget kínáló átfogó, ám egyszerű szerkezetű kérdőív került kiküldésre a Dán Könyvtárosok Uniója Adattudományi Szakmai Munkacsoport tagjai számára. A kérdőív célja a csoport tagjai szakmai hátterének feltárása, adattudományi tapasztalataik felmérése, illetve esetleges további témába vágó készségek elsajátítási igényeinek felmérése volt. A kérdőív kiküldésére 2018 márciusától júniusáig került sor. Másodjára két részben strukturált mélyinterjú szolgált a felsőoktatási és tudományos könyvtárakban tapasztalható kihívások felmérésére az adattudománnyal kapcsolatos tevékenységek kapcsán. A résztvevők szakmai háttere két nézőpontot kínált: egy információs szakemberét, aki a Koppenhágai Egyetem digitális bölcsészeti adatlaborjának (HUMLab), koordinátora, illetve egy vezető adattudósét, aki a Dán Bibliográfiai Központ adat-stratégiájának fejlesztéséért felel.

Adattudomány könyvtárakban

Először is, mi az az adattudomány? Szélesebb összefüggésrendszerből nézve az adattudomány „a tudás adatokon keresztüli megszerzésének művészete és tudománya” (Ozdemir, 2016. p. 4.). Vegyes módszereket használ különféle tudományterületekről, mint a statisztika vagy az informatika. Ezekből merítve az adattudományhoz kötődő szakterületi tudás olyan, gyakorlatban is jól érvényesülő módszerek kimunkálásában ölt testet, melyek új útjait vázolják fel a napjainkban előkerülő adatokkal való foglalkozásnak. Az olcsó és könnyen hozzáférhető adattárolás, kombinálva az adatnak, mint gazdasági értelemben vett közjószágnak az előkerülésével, új problémát vet fel. A nagyobb adattömegek különleges kihívásokat vetnek fel azok tárolása, feldolgozása és elemzése kapcsán. Jogos vélekedések fogalmazódnak meg arról, hogy a tudományos adatok legnagyobb részét helytelenül kezelik, mely tudásvesztéshez vezet. Szerencsére a kutatóintézeteken belül a könyvtárosok már az 1960-as évek óta támogatják a kutatási adatok kezelését (Kim, 2016. p. 162).

Az adattudományi módszereknek különféle tudományterületeken belül történő alkalmazása által az adatok segítségével könnyebben megérthetővé, felfedezhetőbbé válik egy adott kutatási terület, illetve újfajta eredmények válnak megjósolhatóvá. Stanton javaslata szerint az adattudós leginkább négy területhez kötődik, amelyeket négy a-nak hívnak: adatépítészet, adatgyarapítás, adatelemzés és adat archiválás (Stanton, 2012). A nagy mennyiségű adatok miatt, melyekkel az adattudósok dolgoznak, szükségessé válik számukra az egyszerűsítő látásmód, a kritikai attitűdök megléte és az adatelemzéseik eredményeinek hatékony kommunikációja.

Ismerősnek hangzik? Persze. Hiszen ezek azonosak azzal a néhány tevékenységi körrel melyeket a tudományos könyvtárakban dolgozó könyvtárosok is ellátnak napi munkájuk során: nagy mennyiségű információk egyszerűsítése és feldolgozása, a forráskritika alkalmazása, a felhasználókkal történő hatékony kommunikáció képessége.

Az adatkurátori tevékenységek, az adatok gyakorlati kezelése, adatkezelési tervek, adatrepozitóriumi szolgáltatások nem idegen fogalmak a tudományos könyvtárakban: a könyvtárak már jó ideje segítik kutatóikat az adatkezeléseik terén, s a legmegfelelőbb helyen vannak, hogy nyújthassák ezen szolgáltatásokat: „A könyvtárosok gyorsuló ütemben válnak szakemberekké az adatmenedzsment területén, az új adatterjesztési, megosztási szabványokhoz, az információtudományhoz és a szemantikus webhez kötődő kombinált tudásuk révén [...] Az információs műveltség mindig is a tudományos könyvtárak könyvtárosainak szakmai érdeklődési körébe tartozott, természetes, hogy szakmai szerepköreik tovább bővülnek az adatkezelés és hozzáféréshez kötődő témakörök felé.” (Haendel, Vasilevsky, & Wirz, 2012)

Az adattudománnyal történő foglalkozáshoz a könyvtárosoknak az alábbi területeken kell kompetenseknek lenniük: adatépítészet, adatgyarapítás, adatelemzés és adat-archiválás.

Adatkönyvtárosság mint szakma

A fent említettekre tekintettel az adattudomány három területen alkalmazható könyvtári környezetben: oktatási eszközként, a diákok és az oktatók felé. A tudományos munka részeként pl. a kutatástámogatási szolgáltatások keretében, valamint belső értelemben a könyvtári szolgáltatások és gyűjtemények fejlesztésének eszközeként. A könyvtárosok hasznos szövetségesek lehetnek számos különféle adatprojekt megvalósításának során, mivel képesek a saját kutatási és tájékoztatási képességeiket számos területen és tárgykörben alkalmazni. Ebben az értelemben Affelt (Affelt, 2015, p. 191.) úgy véli, hogy mint ahogy „magányos farkas adattudósok” képességeiket számos témakör körülményei közé tudják átplántálni, a könyvtárosok nagyon jól tudnak dolgozni számukra szokatlan témakörökben; szakmai hátterük felvértezi őket kommunikációs illetve csapatmunka képességekkel, s azzal a kíváncsisággal is, mely az igen változatos adattudományi kutatási kérdések felvetéséhez, formálásához szükséges.

Az adatok birtoklásának társadalmi fontosságával, igenis életszerű, hogy a könyvtárosok közössége profitáljon az adatok kezeléséhez kötődő szakmai gyakorlati tudásából. Amíg néhány könyvtáros erre a területre specializálódik, a többiek így vagy úgy szintén kapcsolatba kerülnek adatokkal – ennek felismerése és tudatosítása javíthat az általános kompetenciáikon.

A könyvtárosság az egyre növekvő és összetettebbé váló modern adatvilág mellett nő fel. Ez egy szakma, melynek kompetenciái és készségei folyamatosan frissülnek, hogy lépést tartsanak a technológiai haladással. Emiatt nincs világosan kikövezett útja annak, hogy kiből válhat adatkönyvtáros. Különféle szakmai hátterű emberek képesek magukkal hozni a maguk háttértudását és képességeit a könyvtár keretei közé, ami nagyon érdekes könyvtárosi szakmai arcélek formálódását teszi lehetővé.

Egy tudományos könyvtárban dolgozó könyvtáros számára az adattudományi készségek megszerzése lehetővé teszi a komplex kutatási adatokkal való, naprakész módon történő foglalkozást, mely a kutatókkal való együttműködést is gyümölcsözőbbé teszi: ha valaki adattudományi nézőpontú szakmai hozzáállással bír, felkészítheti és ösztönözheti a többi könyvtárost, új, innovatívabb adatközpontú szolgáltatások formálására kutatók és hallgatók számára egyaránt. Mindezekre tekintettel vessünk egy pillantást arra, hogy a dán tudományos könyvtárakban dolgozó könyvtárosok miként használják az adattudományt intézményeikben.

Adattudomány dán tudományos könyvtárakban

Dániában jelenleg mintegy 39 jelentős tudományos könyvtár található, közülük az egyetemi könyvtárak köteleződnek el a leginkább az adattudomány felé. Jó néhány dán egyetem hozott adatlaborokat létre. Lehetőséget kínál ezáltal hallgatói és kutatói részére, hogy bővíthessék adatműveltségüket, s jobb kutatási adatkezelési módszereket honosítsanak meg egyetemszerte a tanszékeken.

A Koppenhágai Egyetem számos könyvtári adatlabort hozott létre, melyek a hallgatók és kutatók számára az adatkezelési készségek fejlesztéséhez kínálnak eszközöket és szakértelmet, de elősegítik az interdiszciplináris együttműködési formákat is. A három labor a Társadalomtudományi Kar (Digitális Társadalomtudományi Labor), a Természet és Egészségtudományi Kar (KUB Nord Data Lab), valamint a Bölcsészettudományi és Jogi Kar számára (HUMlab) kínál szolgáltatásokat, miközben újabb laborok felállítása is tervbe van véve.

A Dán Műszaki Egyetem könyvtára kutatási adatok menedzseléséről tart workshopokat, valamint támogatja az adattudomány után érdeklődő könyvtárosokat az első két, könyvtárosok számára európai szinten szervezett adattudós tanfolyam „Data Scientist Training for Librarians” (DST4L)” megszervezésével 2015-ben és 2016-ban. Ezek a tanfolyamok három napon át tartottak, melyek keretei között a könyvtárosok gyakorlatközpontű workshopokon vehettek részt számos adattudományi területhez kapcsolódóan, mint az adatgyűjtés, metaadat kezelés, adattisztítás, weboldalak begyűjtése és adatok kinyerése, verzió ellenőrzés és kollaboratív szoftverek, adat-vizualizáció.

Az adatlaborok felállítása, és az adatközpontú szolgáltatások olyan könyvtárosokat igényelnek, akiknek megvan a lehetőségük arra, hogy növeljék kompetenciáikat ezeken a területeken. A Dán Könyvtárosok Uniója szakmai munkacsoportot hozott létre ebből a célból. Az Adattudományi (DS) szakmai munkacsoport tevékenységének középpontjában az adatkönyvtárosi, adattudományi, adatmenedzsment területeken működő szakemberek munkájának támogatása áll. A csoport rendszeresen szervez workshopokat, találkozókat, tanulócsoportokat különféle témakörökben, mint például adatmenedzsment, adatfeltárás (data discovery), szöveg- és adatbányászat, és elemzés, API-k fejlesztése és kezelése, nyílt adatok stb. Gyakorlati jellegű workshopokat is szerveznek különféle szoftverszolgáltatások használata kapcsán pl. GitHub, Jupiter Notebook, NVivo és Voyant tool.

Könyvtárosi kompetenciák

Az adattudományi szakmai munkacsoport tagjai körében 2018-ban zajlott le egy kérdőíves vizsgálat, a különféle személyes szakmai kompetenciák felmérésére. Amikor arra kérdeztek rá, hogy milyen programozási nyelveken bírnak szakértelemmel, a legtöbben a Pythont jelölték meg. A JavaScriptet, a HTML-t és az SQL-t szintén számos válaszadó megemlítette.  Az adattudományi szoftverek vonatkozásában a válaszokat kategorizálták: adattisztító eszközökre (OpenRefine), hálózatelemző és vizualizációs szoftverekre (Gephi, Vos Viewer), forráskód szerkesztőkre (Atom, Oxygen XML Editor), adat vizualizációs szoftverekre (Tableau, Plot.ly), kollaboratív felületekre (GitHub) és webscraper szoftverekre (Netvizz, Ncapture). Néhány válaszadó arról adott számot, hogy az adattudomány iránti érdeklődése merőben elméleti jellegű, s arra a szükségletre megy vissza, hogy megtanulják a kutatók nyelvét, mielőtt az adattevékenységek technikai aspektusa kerül előtérbe.

A fentebb tárgyalt válaszok azt mutatják, hogy a válaszadók már jó néhány adattudomány központú eszközt és témakört tudnak kezelni; megerősítést nyert, hogy a Stanton-féle „Négy A-féle adat” területeihez is erősen kötődnek (adatépítészet, adatgyarapítás, adatelemzés, adat-archiválás). Arra, hogy a dán könyvtárosok hogyan dolgoznak az adattudománnyal, a kérdőívből származó következő idézetek kínálkoznak példaként a különféle megközelítésmódokra:

Én a szakmai munkacsoportot arra használom, hogy tudást gyűjtsek és remélhetőleg tanulok valamit, tehát a kutatóim számára az előtérben lehetek ezen a területen”; Adatok validálásával dolgozom a PURE-szoftver segítségével, valamint kutatásdokumentálást végzek.”

Mi egy oktatási ajánlatot nyújtunk, ami magában foglalja az adatbegyűjtést, elemzést és vizualizációt egyaránt”; „Kollégáknak nyújtok támogatást a SHELL és DOS környezet értelmezéséhez”; „A NVivO szoftver használatát tanítom”.

A fejlesztési projekteken keresztül”; „Különféle feladatokkal próbálkozom, mint adattisztítás, adat export, adatgazdagítás”; „Strukturálatlan adatok menedzselése”.

Mint látható, néhány csoporttag nem dolgozik aktívan az adattudományhoz kötődő tevékenységekkel, de érdekli ez a terület őket, és járatosak szeretnének lenni benne. Egyéb válaszadók gyakorlati példákkal illusztrálták, miként használják az adattudományt akár a kutatók támogatásával, vagy aktív részt vállalva adattudományi munkálatokban és fejlesztésekben a könyvtárakon belül.

Kihívások

Összegezve elmondhatjuk, hogy a kérdőív válaszadói kifejezték kívánalmaikat az adattudomány által nyújtott lehetőségek elsajátítására, néhányan bevallották képességbeli hiányosságaikat az IT-központú adattudományi wokrshopokon való részvételük kapcsán, s könyvtárosokhoz jobban illeszkedő kurzusokat szeretnének. Az okleveles értékelés szintén előkerült, javasolva, hogy a megszerzett készségek formális elismerése hozzájárulna a gondolataik és javaslataik hatékonyabb képviseletére a szervezeti kereteiken belül.

Az adatkönyvtárosi kompetenciák könnyen észrevétlenek maradhatnak a tudományos könyvtárak szolgáltatási forgatagában. A kompetenciáik hangos megfogalmazásától hosszú út vezet az adatkönyvtárosok és szolgáltatásaik láthatóságának növeléséhez.

Egy másik nehézség, amivel a könyvtárosok a képességek elsajátítása kapcsán szembesülnek, hogy nincs olyan egyenes szakmai út, amit követhetnének, különösen kompetencia-követelményi nézőpontból szemlélve. „Meg kell határozni azokat a tételes tudáselemeket és képességeket amelyek az adatszakember számára szükségesek” (Bern, 2005. p. 8), de ez csak a kirakójáték egyik eleme. A kérdőívre adott válaszok azt sugallják önbevallás alapján, hogy a válaszadók nem érték még el a kívánt kompetenciaszintet egyes területeken (pl. Python). De hogyan tudhatják a könyvtárosok azt, hogy elérték-e a szükséges szintet, vagy miben kell még fejlődniük? A Koppenhágai egyetem HumLab csapata egy színkódos rendszer segítségével mérte fel a saját kompetenciáit: piros az elégtelen tudás, sárga a közepes, a zöld pedig az elfogadható szint; ez a modell könnyen alkalmazható egy könyvtári szolgáltatáson belül vagy önellenőrző módszerként az egyes könyvtárosok számára.

Összegzés

A felsőoktatási könyvtárakon belül létező adatlaborok, szakmai csoportok, mint az Adattudományi Csoport, csakúgy mint a növekvő érdeklődés, a könyvtárosoknak szóló Adattudós Tanfolyam mind annak bizonyítékai, hogy egy egyre növekvő közösség jött létre az adat-könyvtárosság körül Dániában.

Több gyakorlati tanulási lehetőség megteremtése segíthet a felsőoktatási könyvtárosok körében az adatkompetenciák fejlesztésében, s támogathatja a könyvtárosokat abban, hogy az adatokat jobban hozzáférhetővé tegyék felhasználóik számára.

Az egyértelmű szakmai út és a megszerzett készségek elismerésének hiánya a munkahelyen belül azt jelenti, hogy a könyvtárosoknak, akik adattudományi kompetenciákkal bírnak, hangosan kell képviselniük szaktudásukat. A növekvő szüksége azon felismerésnek, hogy a könyvtárosoknak kezelniük kell napjaink digitális, nagymennyiségű adatvilágát, segíthet abban, hogy felülkerekedjenek ezeken a kihívásokon.

Úgy hiszem, hogy az adattudomány a könyvtárakat új társadalmi szereppel vértezheti fel. Amennyiben a könyvtárosok fel tudják mutatni értékeiket a széleskörű adattermékek felépítésében és kezelésében, az lökést adhat a könyvtáros mint információs szakember imázsának napjaink társadalmában.

Irodalom

Affelt, A. L. (2015): The accidental data scientist, big data applications and opportunities for librarians and information professionals. Medford, New Jersey, Information Today, Inc.

BERN, P. H. (2005): You’re A What ??? Taking Stock of the Data Profession. Conference Presentation of IASSIST 2005.

GALLUZZI, A. (2013): Libraries and public perceptions: A comparative analysis of the European press. Methodological insights. JLIS.It, – DOI:10.4403/jlis.it-8987

HAENDEL, M. A. – VASILEVSKY, N. A. –WIRZ, J. A. (2012): Dealing with data. A case study on information and data management literacy  = PLoS Biology, 10  (5), e1001339.   – DOI:/10.1371/journal.pbio.1001339

KIM, J. (2016): Who is teaching data: Meeting the demand for data professionals = Journal of Education for Library and Information Science Online, 57 (2), 161–173. DOI:10.12783/issn.2328-2967/57/2/8

Ozdemir, S. (2016): Principles of data science (1. ed.). Birmingham, Packt Publishing.

Stanton, J. (2012): An introduction to data science. Syracuse University, 1–157.

https://doi.org/10.1007/978-3-319-50017-1_1 

Stoicescu, A.M. (2018): Data science competencies in Danish academic libraries. University of Copenhagen. pp. 1-62. [Accessed on 15.03.2019.]

http://pure.iva.dk/files/42865315/Data_Science_Competencies_in_Danish_Academic_Libraries.pdf 

A bejegyzés kategóriája: 2019. 4. szám
Kiemelt szavak: , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!