Gyorsmérleg az OSZK Webarchívum és a KDS-K pályázat nyerteseinek együttműködéséről1

Kategória: 2020/ 7-8

Most, hogy a végéhez értünk a Közgyűjteményi Digitalizálási Stratégia könyvtári ágának (KDS-K) keretében megvalósult együttműködésnek – mely során az Országos Széchényi Könyvtár (OSZK) Webarchívuma és a pályázaton nyertes megyei hatókörű városi könyvtárak elsősorban a nemzeti webtér regionális vonatkozású webhelyeinek feltárásán dolgoztak –, illő rövid összefoglalót adni a közös munka eredményéről.

A háttér

„A Közgyűjteményi Digitalizálási Stratégia (KDS) célja, hogy biztosított legyen a nemzeti kulturális kincseink, a közgyűjteményi tartalmak minél szélesebb körű, akadálytalan hozzáférése a kultúrafogyasztók számára.” – definiálja a Digitális Jólét Program honlapja a projektet, és az abban megfogalmazott célok érdekében feladatokat is meghatároz: „2020-ig a közgyűjtemények digitalizált állományának – a teljes digitalizálandó állományhoz képest – meg kell közelítenie az 50%-ot”, „a digitális tartalmak egy közös kereső felületen legyenek elérhetőek”, és „40%-kal emelkedjen a közgyűjteményi tartalmakra épülő digitális tananyagok száma”2. Azonban a stratégia nemcsak az analóg dokumentumok digitalizálásáról és hozzáférhetőségéről szól, hanem újfajta tevékenységként megjelenik benne az interneten elérhető tartalmak megőrzésének az igénye, a webarchiválás is.

A Közgyűjteményi Digitalizálási Stratégia (2017–2025) című dokumentum3 a magyar digitális örökség megőrzésének eredményeinek elemzésénél még mint egy rendezetlen területtel foglalkozott a webarchiválással, de egyúttal kiemelte az online megjelenő források megőrzésének, visszakereshető webarchívumokban való tárolásának és bárki számára hozzáférhetővé tételének fontosságát4; és célként jelölte meg a KDS első ütemében (2017–2020) az aktív webaratás jogi és technikai feltételeinek megteremtését, valamint a második ütemében (2021–2025) az aktív webaratás fokozatos kiterjesztését5 és szolgáltatásként történő működését Kárpát-medencei hatókörrel.6

Bár a KDS-projekt könyvtári ágazatának aggregátora az OSZK, a könyvtári dokumentumok digitalizálásának összefogása mellett a webarchiválási tevékenységével is érintett: a webarchiválás fontosságának felvetését7 elfogadva, azt már korábban fejlesztési céljai közé emelte a nemzeti könyvtár – és bekerült a 2015-ös gyűjtőköri szabályzatába8 is –, azonban a megvalósulásra csak a 2017-ben indult Országos Könyvtári Rendszer Projekt9 (OKR-projekt) keretében nyílt lehetőség. Azóta az OSZK-ban folyamatosan teremtődik meg a feltételrendszere a webarchiválásnak, a technikai eszközök beszerzése mellett létrejött egy kísérleti munkacsoport10 is, mely az elmúlt években szisztematikusan építkezve kialakította egy üzemszerűen működő webarchívum alapjait.11 2020 májusában az Országgyűlés a kulturális törvény módosításával12 a nemzeti könyvtár feladatává tette a webtartalom megőrzését – a részleteket rendelet fogja szabályozni –, megteremtve ezzel a tevékenység jogi hátterét, júniusban pedig életbe lépett az OSZK új szervezeti és működési szabályzata,13 mely önálló osztályt hozott létre a webarchiválás feladatainak ellátására.

A KDS végrehajtásának keretében 2019-ben a könyvtárak együttműködését segítendő, a megyei hatókörű városi könyvtárak (Pest megye és Budapest területén lévő könyvtárak kivételével), állami egyetemi könyvtárak, illetve azok konzorciumai számára írtak ki pályázatot a könyvtári digitalizálás támogatására, kiemelten helytörténeti vonatkozással.14 A digitalizálás mellett a pályázók feladata volt „az OSZK webarchiválási tevékenységének segítése, elsősorban a helyi vonatkozású oktatási, tudományos és kulturális online tartalmak esetében. Részfeladatok: archiválandó webhelyek válogatása, jogtulajdonosok elérhetőségének kiderítése, a mentett weboldalak minőségének ellenőrzése és metaadatok készítése.”15

A KDS-K pályázat keretében az OSZK webarchiváló munkacsoportja az alábbi célokat tűzte maga elé:16

 • hosszú távú együttműködés megalapozása a pályázatban nyertes könyvtárakkal a webarchívum gyarapításában és egyéb munkafázisokban;
 • írásos anyagok és előadások formájában módszertani segítség nyújtása a partnerintézményeknek az online tartalmak archiválásával kapcsolatosan;
 • szakmai ismeretterjesztéshez a közoktatásban is felhasználható mintaalkalmazás készítése, amellyel illusztrálható, hogy a webarchívum anyaga hogyan tudja kiegészíteni a könyvtárak „hagyományos” digitális gyűjteményeit;17
 • a középiskolás korosztálynak szánt elektronikus tananyag összeállítása az intézményi és a személyes webarchiválásról, a digitális kultúránk megőrzésének fontosságáról és lehetséges módszereiről.

2019 októberében született döntés a nyertesekről,18 de technikai és adminisztratív nehézségek miatt a tényleges munka csak 2020-ban indulhatott meg, és végül az alábbi 11 megyei hatókörű városi könyvtár vehetett részt a projektben:

 • Bács-Kiskun Megyei Katona József Könyvtár, Kecskemét
 • Balassi Bálint Megyei Könyvtár, Salgótarján
 • Békés Megyei Könyvtár, Békéscsaba
 • Berzsenyi Dániel Megyei Hatókörű Városi Könyvtár, Szombathely
 • Bródy Sándor Megyei és Városi Könyvtár, Eger
 • József Attila Megyei és Városi Könyvtár, Tatabánya
 • Méliusz Juhász Péter Könyvtár, Debrecen
 • Móricz Zsigmond Megyei és Városi Könyvtár, Nyíregyháza
 • II. Rákóczi Ferenc Megyei és Városi Könyvtár, Miskolc
 • Somogyi Károly Városi és Megyei Könyvtár, Szeged
 • Vörösmarty Mihály Könyvtár, Székesfehérvár

Persze joggal merül fel a kérdés, miért fontos ez az együttműködés, ha a nem­ze­ti könyvtárban már dolgoznak a magyar vonatkozású webtartalom archiválá­sán, mit tud ehhez hozzátenni egy más erőforrásokkal rendelkező könyvtár? Miért jó ez egy megyei hatókörű intézménynek, vagy miért ne csak egy pályázat kö­telezően letudandó köreként tekintsen rá? Pont azért, amiért szükség van helyi könyv­tárakra vagy más közintézményekre: helyi beágyazottsága előnyt jelent a különböző munkafolyamatokban, például a térség webhelyeinek feltárásában vagy a kapcsolatfelvételben, míg az archivált anyag feldolgozásában a mennyiségi problémákon tud segíteni, „cserébe” az archivált tartalom különböző módokon megjelenhet a helyi vonatkozású gyűjteményében, akár egy helyi webarchívum formájában19 is. Az ilyen jellegű együttműködés fontosságát a kezdetektől hangsúlyozta a Webarchívum, ezért távlati céljai között szerepel egy országos partnerhálózat kiépítése is, melyhez az egyik első konkrét lépést a KDS-projekt keretében történt együttműködés jelentette,20 de ebbe a sorba illeszkednek a különböző képzési lehetőségek is.21

A Webarchívum működésének eddigi három éve alatt fokozatosan kialakultak a munkafolyamatok a különböző webhelyek archiválására, először ebben kellett megtalálni azokat a pontokat, melyekhez hasznosan, sikerrel tudnak kapcsolódni a partnerek úgy, hogy ne kelljen aránytalan terheket vállalniuk, de mégis ízelítőt kapjanak a tevékenységből és rálátásuk legyen az egészre. Szerencsére a munkafolyamatok egy része nem igényel különösebb előképzettséget, elég egy általános informatikai felhasználói készség (például a webhelyek összegyűjtése, az archivált anyagok minőség-ellenőrzése), más esetekben (például webhelyek metaadatolásánál) pedig kifejezetten előny a könyvtárosi képzettség, és mindezen tevékenység hétköznapi informatikai eszközökkel végezhető. Mivel az archiválások technikai műveletei jellemzően eszközigényesek (linuxos szerverek), ezért csak olyan lehetőség került be az opcionális feladatok közé, ami személyi számítógépeken is végezhető. Ugyanakkor célszerű volt kihasználni a helyismeretből fakadó előnyöket, és a könyvtár megyéjére, esetleg tágabb régiójára szűkíteni a címgyűjtést,22 de érvényesülnie kellett a Webarchívum elsődleges gyűjtőkörének is.

Végül ezen szempontok mentén lett meghatározva a feladatkiírás,23 és kezdődhetett el a munka ez év február-március folyamán. 24 Minden partnerünkkel egyenként felvettük a kapcsolatot videobeszélgetés keretében, részletesen ismertettük a feladatokat, az elvárásokat és átbeszéltük a munkafolyamatot is, majd ezek nyomán elkészült egy leírás,25 amit elküldtünk mindenkinek. Jó döntésnek bizonyult, hogy a rendelkezésre álló idő szűkössége miatt – május végéig kellett teljesíteni a feladatokat – kettéválasztottuk a kiírásban szereplő feladatokat mindenképpen teljesítendőkre és opcionálisakra. Elsődleges feladatként azt kértük partnereinktől, hogy a megadott tematika szerint gyűjtsenek olyan helyi vonatkozású webhelyeket, amelyek még nem szerepelnek a Webarchívum gyűjteményében,26 valamint válogassanak olyanokat is, melyeket érdemes lenne felvenni a nyilvánosan elérhető archívumba, és ezeken kívül a rendelkezésre álló idő és kapacitás függvényében kerüljön sor a többi feladatra.27 Külön öröm volt, hogy a projektbe bedolgozó kollégák közül többeket ismerősként üdvözölhettünk, mivel már részt vettek az utóbbi években a Könyvtári Intézet akkreditált webarchiválás tanfolyamain.28

Most következzen számszerűsítve is az elmúlt hónapok munkájának az eredménye.

A kapott tételek darabszáma és százalékos megoszlása

Az OSZK Webarchívum jelenleg 34 ezer élő webhelyet és azok URL-jeit tartja nyilván különböző gyűjteményekben, de bizonyos tematikákhoz tartozók még nem kerültek összegyűjtésre, valamint a közösségi médiával is még éppen csak elkezdtünk foglalkozni.29 Persze maga az összegyűjtés kifejezés is problémás, mert gyakorlatilag teljes körű gyűjtemény nem létezik a webhelyek változékonysága, illetve az ismeretszerzés korlátai miatt.

A pályázatban részt vevő könyvtárak nagyságrendileg ennek az állománynak körülbelül tizedére rúgó webhelyet gyűjtöttek össze30 és ajánlottak a Webarchívum figyelmébe, melyből végül hasznos címként az eddigi gyűjtemény 7%-kal fog gyarapodni, ebből 2% jut a Webarchívum által korábban már feltárt tematikájú gyűjteményekbe és 5% kerül a szisztematikusan még nem feltérképezettekbe.

Június végéig – eltekintve néhány duplumtól – összesen 3411 db új tételt (plusz 31 db alternatív URL-t) kaptunk a 11 partnerünktől, melyeket egyesével ellenőriztünk ismertség, relevancia és formai szempontok (név és címalak) szerint. E munka eredményeként 3491 db besorolásra váró webhely nézett velünk farkasszemet, ugyanis tizenkettedik könyvtárként az OSZK is gyarapította saját gyűjteményét 80 db még ismeretlen tétellel (véletlenszerűen talált, például kapcsolódó címek feltárásával). A 3411 db címből az ellenőrzés során 838 db (24,6%) bizonyult általunk már ismertnek, 219 db (6,4%) érdektelennek és 2354 db (69,0%) hasznos, új címnek, amihez persze még hozzáadódik 80 db OSZK-s gyarapítás is (a bővített darabszám 2,3%-a).

Felmerül a kérdés, miből adódtak az ismert és az érdektelen tételek? Azt minden résztvevő fel tudja mérni, mennyire tartotta magát a kért szempontokhoz (ellenőrzés, gyűjtőkör). Az ismert címek tekintetében azonban az mindenképpen árnyalja a képet, hogy a Webarchívum a projekt teljes ideje alatt nem tudta biztosítani a naprakész címellenőrzést (csak időközben készült el az új kereső)31; illetve a véletlenek összjátéka folytán májusra jött létre az oktatási webhelyekről egy új tematikus gyűjtemény az Oktatási Hivataltól kapott lista alapján, emiatt az adatok feldolgozásakor néhány iskola honlapja már az ismert címek közé került. Az érdektelen tételek esetében az lehetett zavaró tényező, hogy az esetleg helyismereti szempontból fontos és nyilvántartandó aloldal egy, a Webarchívum számára már ismert főoldal része32, ezért nem új számára, és ez nem lett kiszűrve adatfeltöltés előtt. Szerencsére voltak olyan könyvtárak, amelyek már a gyűjtés során megmutatták addigi munkájukat, így azt észrevételezve elkerülhető vagy csökkenthető volt az esetleges hibás gyakorlat folytatása. Mindezek miatt, valamint azért, mert végül is a résztvevők számára új szempontok szerint kellett a gyűjtést végezni, első próbálkozásra nem tekinthető rossznak az eredmény, egy esetleges újabb gyűjtés vagy folyamatos együttműködés esetén várhatóan javulna a hatékonyság.

A gyűjtések nagysága, eloszlása

Nem szeretnénk külön kitérni az együttműködésben részt vevő könyvtárak munkájának értékelésére, se darabszám, se hasznosság tekintetében. Reális értékeléshez sok egyéb szempontot is figyelembe kellene venni, azok nélkül hamis következtetések születnének egy-egy számszerűsített mutatóból – ezekről az előzetes munkamegbeszéléseken is szó volt.33

Számszerűsítve 35, 59, 101, 118, 150, 174, 298, 300, 362, 458 és 1356 tételt kaptunk az egyes könyvtáraktól, összesen 3411 db webhely nevét, címét és esetleg egyéb adatokat. A két szélsőérték között majdnem negyvenszeres a különbség, a gyűjtések zöme a száz és ötszáz közötti darabszámból került ki. Átlagnak a 310 tétel tekinthető, ami a két szélsőérték kivonásával 224 lesz. Csak érdekességként néztük meg, hogy a legnagyobb gyűjtemény hasznosság tekintetében eltér-e az összesített átlagtól, és meglepődve tapasztaltuk, hogy szinte megegyeznek az arányok: a felvett címeknek ugyanúgy 69%-a bizonyult hasznosnak, mint az összesített gyűjtemény esetében, ismert címből viszont kevesebbet, érdektelenből többet kaptunk az összesítés átlagához képest.

A hasznos új címek tematikus megoszlása, besorolása

A projekt keretében – a partnerkönyvtárak és az OSZK révén – összegyűlt és a Webarchívum által még nem ismert hasznos címeket érdemes kettéválasztani aszerint, hogy általunk korábban már szisztematikusan gyűjtött tematikáról van szó, vagy olyanról, mellyel kapcsolatban még nem volt érdemi címfeltárás. (Mindkét esetben az elsődleges tematika alapján került besorolásra az adott tétel és az alapján szerepel az összesítésekben.)

A Webarchívum által korábban már összeválogatott tematikus részgyűjtemények esetében 715 db új címet kaptunk, ez az eddig összegyűjtött 34 ezer webhely mintegy 2%-a, a még nem gyűjtött tematikák esetében kapott 1719 db új cím az eddigi állomány csaknem 5%-a.

Lássuk témakörök szerint a címek megoszlását az eddig ismert és a kapott új tételek szerint.

Érdekes látni, hogy a 12 csoportból hétben az átlag alatt maradt a gyarapodás, háromnál kicsivel, de két csoportban (kulturális intézmények, rendezvényhelyszínek) messze átlag feletti a bővülés. Utóbbiak esetében vélhetően visszaigazolódik az az előzetes feltételezés, hogy a helyismeret előnyt jelent a lokális tartalmak gyűjtésének esetében. Az oktatási webhelyek kiugró aránya tekintetében valószínűleg szerepet játszik az is, hogy ez a legfrissebb gyűjtemény, és még nem sikerült olyan szinten feltárni a vonatkozó tartalmat, mint a régebbi gyűjteményeknél (például a szakképzési centrumok esetében csak a központi intézmény szerepel a kapott nyilvántartásban, a tagiskolák nem).

A Webarchívum által eddig szisztematikusan még nem gyűjtött témakörök vonatkozásában a következő méretű gyűjtések születtek. (Ezeknél a gyűjteményeknél nem vettük figyelembe, hogy esetleg már hány címet tartunk nyilván bennük.)

Nem meglepő módon a legnagyobb csoport a Facebook (bár különböző mértékben lett felvéve a gyűjteményekbe), amit az idegenforgalom-vendéglátás és a sport-testkultúra követ. Érdekesen árnyalja a rangsort, hogy az idegenforgalom-vendéglátás kategória lett a legtöbbször megadva másodlagos besorolásnak, és bár ezt csak indokolt esetben alkalmaztuk, jól mutatja, mely ágazatnak van leginkább kapcsolódása más területekkel.

Az is látszik a számokból, hogy még jócskán vannak fel nem tárt webhelyek, bőven van tere a további munkának, és nem csak a Facebook esetében (az önmagában is hihetetlenül nagy és növekvő súlyú). Az ország lakosságának ugyan kisebbik felét fedik le azok a megyék, melyek könyvtárai most részt vettek ebben a projektben, de bizonyos témák meglepően alulreprezentáltak. Ha arra gondolunk, hogy csak állami fenntartásban 91 kórház van, de ezek mellett számtalan szakrendelő, magánkórház és -rendelő, valamint szociális intézmény van az országban, akkor a kapott 31 cím elég kevésnek tűnik. Láthatóan a sport-testkultúra tematika jobban megmozgatta a gyűjtést végző kollégákat, talán a koronavírus-járvány miatti kényszerű otthonlét okán is. Az idegenforgalom-vendéglátás ugyan nagyobb számmal szerepelt az összesítésben, de ez a tematika önmagában is hatalmas lenne, ahogy a szolgáltatás-kereskedelem-közlekedés-marketing vagy az életmód-szabadidő-hobbi kategória is, amikből viszont megint nagyon kevés címet kaptunk, és sokkal több helytörténettel foglalkozó webhelyet vártunk.

Talán azt külön nem is érdemes kiemelni, hogy a helyismeret előnye visszaköszön a bővülésben, hiszen pont ez volt a cél, azt viszont már igen, hogy ennek köszönhetően kiemelt gyűjtőköri webhelyeket is megismertünk, például mindeddig „rejtőzködő” periodikákat vagy kulturális intézményeket.

Munka után – munka előtt

A projekt során kapott webhelycímeket időközben felvettük tematikus részgyűjteményeinkbe és negyedéves ütemezéssel mentéseket készítünk róluk. Ezenkívül ezek a webcímek is bekerültek a június végén indított magyar webtéraratásba34, mely során a tematikus gyűjteményekben szereplő címeknél nagyságrendileg bővebb körről készítünk pillanatfelvételt.35 Sajnos a közösségi média webhelyei esetében nem ilyen jó a helyzet, mert azok archiválása más jellegű technológiát igényel, és erre jelenleg nincs igazán kiforrott automatikus eljárás, ezért a legfontosabb tételek esetében manuálisan készítünk egyedi mentéseket,36 a többi címet csak nyilvántartjuk.

A nyilvántartott webhelyek gyarapodása mellett, talán mégis az a legfontosabb eredmény, hogy reményeink szerint nem ért véget a közös munka. Nem ért véget, mert három résztvevővel (a kecskeméti Bács-Kiskun Megyei Katona József Könyvtárral, a tatabányai József Attila Megyei és Városi Könyvtárral és az egri Bródy Sándor Megyei és Városi Könyvtárral) már konkrét megbeszéléseket folytattunk a lehetséges további együttműködésről, és más könyvtárak is jelezték, hogy szívesen folytatnák a közös munkát. Az együttműködés szorosabbra fűzése érdekében elkezdtünk előkészíteni egy megállapodástervezetet is a jövőbeli közös munka lehetséges kereteiről, amelyről minden érintettel egyeztetni fogunk. Örömmel láttuk, hogy sokan felismerték az élő és az archivált webtartalom fontosságát, helyét a saját, helyi gyűjteményeikben.

Nem ért véget a közös munka, mert a java még hátra van. Egyrészt a webtartalom változékonysága megköveteli a most létrehozott állomány folyamatos gondozását, hogy a közös eredmény ne enyésszen el idővel, ugyanis hiába gyarapodott most a Webarchívum sok új és értékes webhellyel, hiába kerülnek be ezek a tételek a helyi gyűjteménybe, ha a ma adatai inflálódnak az idő múlásával. Másrészt célszerű kiterjeszteni az együttműködők körét újabb partnerek bevonásával, hogy finomítani és bővíteni lehessen az elért eredményeket a közös feladat, a jelen webes kultúrájának megőrzésének érdekében. Távlatilag szeretnénk a többi megyei hatókörű városi könyvtárral, valamint a szak- és egyetemi könyvtárakkal is felvenni a kapcsolatot és a mostanihoz hasonló együttműködést kialakítani, ahogy más, a webarchiválásra nyitott közgyűjteménnyel is, és persze ne feledkezzünk el a határon túli magyar kulturális intézményekről sem!

Egy frissen lementett Instagram-oldal archivált változatának részlete

A KDS-projekt keretében végzett közös munkáról az immár rendszeres őszi workshopunkon37 is szeretnénk számot adni. A rendezvény tervezett témája az intézményi együttműködés lesz, és az előadások mellett – melyre a mostani partnereink közül is szeretnénk felkérni előadót, aki a saját és intézménye szemszögéből értékelné a közös munkát – nagyobb hangsúlyt kapnának a gyakorlati szempontok.

Sokféle számadat szerepelt ebben az összefoglalóban, azonban ha meg szeretnénk vonni az együttműködés mérlegét, mégsem a Webarchívumban lévő gyűjtemény számszerű gyarapodását emelnénk ki, hanem azt, hogy több nagy, megyei hatókörű városi könyvtár és sok könyvtáros kolléga kapott ízelítőt a webarchiválás feladataiból, nehézségeiből, és láthatóan sokukban alakult ki érdeklődés és elköteleződés az ügy iránt, ami remélhetően majd visszaköszön a napi munka során is.

Köszönjük szépen minden részt vevő könyvtárnak és kollégának az együttműködést, a közös munkát, ami reményeink szerint folytatódni fog a jövőben is.

×××

Partnertükör

A Bródy Sándor Megyei és Városi Könyvtár az 1990-es évek végétől kezdve nagy hangsúlyt fektet a helyismereti anyagok elektronikus tartalomszolgáltatására és a digitális kultúra fejlesztésére, ekkor jött létre a mai napig élő és gyarapodó Heves Megyei Elektronikus Könyvtár.

Kreatív megoldás az ismeretterjesztésre, figyelemfelhívásra

Az Emberi Erőforrások Minisztériuma pályázati kiírására benyújtott HevesTékaDigit pályázatnak köszönhetően helyi témájú könyveket, folyóiratokat, plakátokat, képeslapokat, gyászjelentéseket, iskolai értesítőket, cikkeket, és fotókat digitalizáltunk. A nyertes pályázat azonban a digitalizálás és az oktatástámogatás mellet webarchiválási feladatokat is előírt pályázóinak, ennek értelmében a Bródy Sándor Könyvtár munkatársai is bekapcsolódtak a helyi, regionális vonatkozású webhelyek címeinek a gyűjtésébe.

A 2020. április 27-ei összdolgozói értekezleten – a járványhelyzet miatt a Zoom alkalmazás segítségével – rövid előadás hangzott el az OSZK webarchiválási tevékenységéről, az eddig elért eredményekről, a pályázati kiírásban megfogalmazott feladatokról és annak megvalósításának lehetőségeiről. A tájékoztató után felhívást tettünk közzé a könyvtár közösségi oldalain38 és sajtóközleményben tájékoztattuk a helyi média39 munkatársait a gyűjtésről. Külön levelet küldtünk a Heves megyei városi könyvtárak és a könyvtári szolgáltató helyek munkatársainak is, hiszen ők ismerik leginkább a megyei településeken élő művészeket, alkotókat.