Az OSZK Webarchívum új honlapjának felépítése és szolgáltatásai

Kategória: 2020/ 6

Pilot projektből állandó könyvtári szolgáltatás

Az Országos Széchényi Könyvtár a 2000-es évek elejétől kezdett foglalkozni a digitálisan születő dokumentumok megőrzésével, a legismertebbek ezek közül a könyvekkel foglalkozó Magyar Elektronikus Könyvtár (MEK), majd az időszaki kiadványokat archiváló Elektronikus Periodika Archívum és Adatbázis (EPA) és a képi dokumentumokat gyűjtő Digitális Képarchívum (DKA). Már 2006-ban felmerült, hogy más országokhoz hasonlóan egy webarchívumot is létrehozzon a nemzeti könyvtár, ami 2015-ben a ​gyűjtőköri szabályzatában is rögzítésre került. A szükséges informatikai és személyi feltételek végül 2017-ben, az Országos Könyvtári Rendszer Projektnek köszönhetően valósultak meg a webarchívum munkacsoportjának létrehozásával. A két és fél éves tanulási és tesztidőszak után elkezdődött a magyar webtérben közzétett tartalmak egy részének időszakos lementése és gyűjteménybe szervezése. Az OSZK Webarchívum azzal a céllal jött létre, hogy reprezentatív képet nyújtson egy adott időszakban nyilvánosan elérhető, a magyar közönségnek szánt és a kulturális örökség részét képező online tartalomkínálatról, a hungarikumok körébe tartozó elektronikus dokumentumokról.

Már a kezdetekkor támaszkodhattunk a Drótos László által létrehozott wiki szolgáltatásra, emellé kezdtük építeni a webarchiválás nemzetközi bibliográfiáját, illetve létrehoztuk a kísérleti projekt honlapját, ahol nyomon lehetett követni tevékenységeinket.

A webarchiváló projekt régi honlapja

A projekt előrehaladtával lassan megteremtődtek a webarchiválás mint állandó könyvtári tevékenység körvonalai és annak beillesztésének feltételei az OSZK szakmai kínálatába.  A kísérleti projekt keretein túllépve egy olyan új, már a leendő szolgáltatási kínálat egyes elemeit számba vevő honlapra lett szükségünk, amely keretbe foglalja a különféle célcsoportok számára általunk végzett tevékenységeket. Természetesen mindezt oly módon terveztük meg, hogy a kísérleti projekt keretében szolgáltatott információk se vesszenek el, hanem új szakmai környezetben kiteljesedve találjanak teljesebb otthonra.  Ez a rövid áttekintés számot ad az új honlap koncepcionális felépítéséről, s arról, hogy különféle célcsoportoknak milyenfajta szolgáltatásokat tudunk kínálni.

A honlap felépítése és alapvető szolgáltatásai

Fontos szempont volt az új honlap elkészítésekor, hogy az illeszkedni tudjon majd a még formálódó nemzeti könyvtári tartalomszolgáltatási keretrendszerhez. Éppen ezért, az Információtechnológiai Igazgatóság illetékeseivel konzultálva döntöttünk a WordPress tartalomkezelő rendszer használata mellett. Az Országos Tartalomszolgáltatási Rendszer is erre a platformra épül, emiatt remélhetőleg minimális nehézségek árán lesz majd integrálható a szolgáltatás. A honlap kialakítása számunkra is egy tanulási folyamat volt, hiszen a WordPress-szel azelőtt főként, mint blogszolgáltató platformmal találkoztunk. Ez alkalommal pedig az ezen a szerepkörön túlnyúló általános tartalomkezelő funkciók kezelésének elsajátítására volt szükségünk. Fontos szempont volt az is, hogy a tartalmak jó része magyar és angol nyelven is elérhető legyen.

Az új honlap koncepciójának és szerkezetének megtervezésekor magunk elé képzeltük az általunk kínált jövőbeli szolgáltatásokat és azokat a célcsoportokat, amelyek a webarchívum felhasználói lehetnek.  Ezek a webtartalmak felhasználói, kutatói; a webtartalmak gazdái; a közgyűjteményi szakemberek; illetve az újságírók.

A webarchívum új honlapja

A kezdőlapon az archívumról szóló alapvető információk mellett a jobb oldali hasábban válogatott oldalképek diavetítésével ajánlunk néhány nyilvánosan szolgáltatott webhelyet a felhasználók figyelmébe. Az ismertető alatt közvetlen linket helyeztünk el a honlapajánló űrlapra, mely a gyarapítási javaslatok rögzítésére szolgál. Gyorslinkekkel ugyancsak elérhető közvetlenül a keresőfelület, a demó archívum, a Rákóczi-gyűjtemény, valamint az OSZK-honlapok gyűjteménye is. A kezdőlap alján áttekinthetők legfrissebb híreink, elérhető közvetlenül a hírarchívum is. Az elérhetőségeinek közzététele mellett itt szolgáltatjuk a honlapra vonatkozó jogi információkat, közvetlen hivatkozás mutat anyaintézményünk, az OSZK honlapjára, valamint projektünk régi honlapjára is. A saját honlapunk áttekinthetősége és archiválhatóságának szempontjából fontos funkció a honlaptérkép, a felhasználók tájékozódását pedig a honlap anyagához illesztett szabadszöveges kereső is segíti, mely szintén közvetlen hivatkozással érhető el a kezdőlapról.

A Webarchívum menüpontban felvázoljuk a gyűjteményszervezés kereteit. Emellett böngészési és keresési lehetőséget igyekszünk biztosítani sokféle szempont szerint az archívumban őrzött nyilvánosan, illetve nyilvánosan nem szolgáltatható anyagokhoz is. Utóbbi esetben szerzői jogi okok miatt a lementett webhelyek csak az OSZK épületén belül, illetve zárt könyvtári hálózaton, dedikált terminálon lesznek elérhetők a NAVA-pontok mintájára, de ennek szolgáltatási koncepciója jelenleg még fejlesztés alatt áll. Emellett statisztikai adatokat is kínálunk az archívum összetételéről, illetve annak felhasználásáról.

Ezt követi a webarchiválási projekttel kapcsolatos információkat összefoglaló menüpont. Itt kaptak helyet aktuális híreink, a szervezeti keretek bemutatása, publikációs és ismeretterjesztő tevékenységeink részletezése, együttműködő partnereink bemutatása, valamint innen lehet elérni a kísérleti projekt már nem frissülő régi honlapját.

A harmadik menüpont az általános felhasználási információkat összegezi. Tájékoztatót nyújtunk a honlapról, a gyakran ismétlődő kérdések is itt kaptak helyet, valamint itt lehet gyarapítási javaslattal élni a webarchívum számára.

A következő menüpontban a webes tartalomgazdákat igyekszünk megszólítani. Innen érhető el a keretszerződés szövege, amely szükséges az archívum nyilvános szolgáltatásához. Itt helyeztük el azokat a pecséteket, melyeket a nyilvános szolgáltatásba bekerült partnereinek tehetnek ki a honlapjukra, továbbá technikai információkkal és ajánlásokkal is szolgálunk a webhelytulajdonosok számára, és itt érhető el a vonatkozó jogszabályok listája.

A Szakembereknek menüpont elsősorban a közgyűjteményi szakmai közeget szólítja meg. Itt adunk információt az általunk rendezett korábbi eseményekről, a szakmai együttműködés lehetőségeiről, a különféle szakmai kommunikációs csatornákról és oktatási tevékenységeinkről. Innen érhető el a nemzetközi szakbibliográfiánk, illetve a wiki alapú tudásbázis szolgáltatásunk is. Webhelyeket is ajánlunk, és igyekszünk becsatornázni a webarchiválással foglalkozó legfrissebb híreket a Twitterről.

Az Újságíróknak menüpont a külső kommunikáció során szükséges alapvető tényeket, információkat foglalja össze tevékenységeinkről. Szabadon felhasználható képeket, szórólapokat, plakátokat kínál, valamint áttekintést nyújt médiamegjelenéseinkről.

Az alábbiakban az imént felvázolt szerkezethez illeszkedve nyújtunk rövid áttekintést az egyes szolgáltatási elemekről.

A webarchívum mint gyűjtemény

A webes tartalmak megőrzése több szinten és többféle munkafolyamattal történik, és ahogy a bevezetőben már említettük, a webarchívum hozzáférés szempontjából is kétfelé oszlik: vannak nyilvánosan is szolgáltatott részei és van az egyelőre „sötét archívum”, amely majd a könyvtári hálózatból lesz elérhető, elsősorban kutatóknak. Ezt a kettősséget tükrözi az új honlap első, Webarchívum nevű menüpontja, mely alatt a részgyűjtemények ismertetőinél és a böngészési, illetve keresési funkcióknál is szét lett választva a nyilvános és a zárt gyűjteményrész.

Előbbibe jelenleg három szolgáltatás tartozik: Az egyik korábbi cikkünkben[1] már részletesen bemutatott, a II. Rákóczi Ferenc emlékév alkalmából készített, a webarchívum és másik három digitális gyűjtemény anyagából válogatott önálló honlap, saját böngésző- és keresőfelülettel. A másik kettővel pedig elsősorban a webarchiválás technológiájának lehetőségeit és korlátait szeretnénk demonstrálni. Ezekben az OSZK saját online szolgáltatásainak, illetve más intézmények vagy magánszemélyek honlapjainak, blogjainak, időszaki kiadványainak különféle szoftverekkel készült és megjelenített mentéseit lehet böngészni.

Mivel az általunk mentett példányok mellett az archiválás idején készült oldalképek, továbbá az amerikai Internet Archive mentései, és természetesen az eredeti webhelyek is megnézhetők, ezért össze lehet vetni, hogy milyen különbségek vannak közöttük. A web technológiája ma már olyan bonyolult, hogy nagyon nehéz megőrizni és reprodukálni egy webhely vagy akár csak egy weboldal minden elemét, ezért gyakoriak a hibák és a hiányok az archivált anyagban. Ezeket a problémákat a metaadatokban is rögzítjük. Ilyen, XML-formátumú adatrekordokat egyelőre csak a nem OSZK-s webhelyekhez készítettünk, és éppen e cikk írásakor fejlesztjük hozzájuk a keresőprogramot. A nyilvános gyűjtemény teljes szöveggel is kereshető a dán nemzeti könyvtár által készített SolrWayback programmal.

A zárt archívumban levő, témák vagy műfajok szerint összeválogatott, több mint 27 ezer magyar webhelyhez viszont nincsenek ilyen részletes leírások, ezekről csak a részgyűjtemények szintjén rögzítünk adatokat. Ezért a honlapon mindössze az egyes webhelyek nevének vagy URL-címének részletére lehet rákeresni, és a találati listában csak az látszik, hogy melyik részgyűjteményben tartjuk őket nyilván, és hogy azt mikor arattuk utoljára. Bár a mentett verziókat szolgáltatási engedély hiányában nem tudjuk kitenni, de legalább kis méretben megnézhetők a kezdőlapokról készült oldalképek. Természetesen belinkeltük az Internet Archive nyilvános mentéseit, és az élő weben levő eredeti szolgáltatást is.

A zárt gyűjtemény keresőjének találati listája képgalériával kiegészítve

A tematikus és műfaji válogatások mellett eseményekhez kötődő archiválást is végzünk, ezekről is lehet tájékozódni az új honlapon. Mivel ezek a részgyűjtemények többnyire nem webhelyekből, hanem egyedi weboldalakból, hírekből, blogbejegyzésekből és Wikipédia-szócikkekből állnak, ezért nem volt célszerű közösen kereshetővé tenni őket a fent említett 27 ezres címlistával, úgyhogy csak táblázatos formában böngészhetők.

A magyar webtér egy-egy jelentős részére kiterjedő, pillanatfelvétel-szerű aratásból eddig kettőt csináltunk: 2018 őszén 291 ezer, 2019 végén pedig közel 247 ezer címről indítottuk el a robotot. Ezeknek csak az összesített adatai nézhetők meg a Webarchívum menü Statisztikai adatok pontja alatt. Ugyancsak itt találhatók a többi részgyűjtemény legutóbbi aratásairól készített táblázatok és diagramok, továbbá a honlapunk látogatottságát mutató grafikon.

Végül egy érdekesség a honlapnak ebből a részéből: a Böngészés almenüben található egy Megszűnt webhelyek oldal, ahol mintaként bemutatunk olyan webhelyeket, amelyekről sikerült viszonylag jó mentést készítenünk, mielőtt azok eltűntek volna az internetről. Ilyen például a Lánchíd Rádió honlapja, a CriticalHit videójátékos magazin, a HAMLET nevű erdélyi színházi portál, vagy a Tolna Megyei Levéltár régi weboldala.

Egy tematikus részgyűjtemény aratásáról készült statisztika

A webarchiválási projekt szakmai és szervezeti keretei

Az imént felvázolt, webarchívumi gyűjteményre épülő szolgáltatások mellett nagy szükségét érezzük, hogy azokat a kereteket is bemutassuk, melyek révén a gyűjteményfejlesztési munkánk zajlik. Voltaképpen arról a szervezeti, illetve szakmai bázisról adunk itt számot, melyre alapozva végezzük tevékenységünket. A kezdőoldal mellett itt kapnak helyet a munkánkkal kapcsolatos legfrissebb hírek, illetve a hírarchívum is, melynek segítségével a kísérleti projekt kezdetéig vissza lehet követni, hogy miként formálódtak különféle teendőink. Fontosnak tartjuk, hogy transzparens módon elérhető legyen az eddigi munkásságunk, ezért itt az összes szakmai megjelenésünk (úgymint konferencia-előadások, prezentációk, hazai és nemzetközi publikációk) visszakereshető. Az egyes eseményekről, publikációkról természetesen a hírek rovatban folyamatos tájékoztatást adunk, itt azonban egységes rendszerben áttekinthetővé válik tevékenységünk teljes vertikuma. Ezenfelül a projekttel kapcsolatos nyilvános dokumentációs forrásokat is közzétesszük. Itt lehet az előadások, publikációk témáiról, illetve az egyes szakmai részterületekről mélyebben is tájékozódni, melyek tevékenységeink középpontjában állnak. Természetesen bemutatjuk röviden saját magunkat, illetve együttműködő partnereinket is.

Általános felhasználói információk

Rövidnek tűnik a menüpont kínálata, ám tartalmát tekintve elengedhetetlenek az itt közreadott információk. Minden európai webarchívum biztosítja felhasználói számára a lehetőséget gyarapítási javaslatok megtételére, s ez a funkció már a kísérleti projekt honlapján is rendelkezésre állt.

Az ajánló űrlap részlete

Két irányból is el lehet jutni ide: a menürendszerből, illetve közvetlenül a kezdőlapról. Ez a szolgáltatás adja a felhasználóknak szóló kínálat magvát, amellett persze, hogy általános tájékoztatást nyújtunk a honlapról. A Gyakran Ismételt Kérdések menüpontban pedig olyan kérdéseket igyekszünk megválaszolni, melyek a gyakorlati munka során számos alkalommal előkerültek.

Kínálatunk a tartalomgazdáknak

A honlap tervezésekor igen fontosnak tartottuk egy olyan menüpont megtervezését, ahol a tartalomgazdákat érintő minden információ egységes keretek között megtalálható. A velük kötendő minél szélesebb körű partnerség a webarchiválás sikeressége szempontjából kulcsfontosságú tényező. Egyrészt szeretnénk arra bátorítani minél több, a látókörünkbe került honlaptulajdonost, hogy szerződjenek velünk az archivált webhelyek nyilvános szolgáltatásának céljából. Számukra kész szerződésmintát adunk, amelybe már csak az adott tartalomtulajdonos és webhelye(i) adatait kell beilleszteni. Tájékoztatást nyújtunk továbbá az általunk végzett archiválási és szolgáltatási tevékenység pontos jogi hátteréről is. Másik oldalról a tartalomgazdákkal kötendő szövetség egyik sarokpontja, hogy jól archiválható tartalmakhoz férhessünk hozzá. Ennek előmozdítására különféle szakmai ajánlásokat fogalmaztunk meg, melyeket a webhelyek fejlesztésekor hasznos lenne figyelembe venni. További pozitív motivációnak szánjuk a webarchiválási pecsétek alkalmazását, amelyek segítségével egy webhely tulajdonosa – a pecsét weboldalra való kihelyezésével – nyilvánosan felmutathatja, hogy archiváljuk a webhelyét a jövő számára.

Webhely archiválásának jelzésére használható pecsétek

A közgyűjteményi szakmának ajánlott szolgáltatások

A gyűjteményalapú, illetve a tartalomgazdáknak nyújtott szolgáltatások mellett voltaképpen ez a szolgáltatási kínálat képezi az új honlap harmadik sarokpontját. Könnyen kezelhető, wiki alapú tudásbázist kínálunk, szinte minden összefüggésben a webarchiválással kapcsolatos fogalmakról, munkafolyamatokról.

Az internetes tartalmak megőrzésével foglalkozó wiki

Ezt egészíti ki az immáron harmadik éve épített nemzetközi szakbibliográfia, amit az EBSCO, a ProQuest, illetve az ACM informatikai szakadatbázis által feltárt cikkek és konferencia-előadások alapján állítunk össze, de helyet kapnak benne az EPA által nyilvántartott belföldi anyagok is. A tételeket a Mendeley bibliográfiakezelő rendszerben gondozzuk, onnan végezzük a bibliográfia folyamatos (3-4 havi rendszerességű) gyarapítását szabványos bibliográfiai bemeneten keresztül. Az egyes tételekről részletes információkat tartalmazó nézetet kínálunk. A teljes anyagról a legfontosabb bibliográfiai adatokat nyújtó áttekintési mód is elérhető, valamint exportálhatjuk azt különféle szabványos bibliográfiai formátumokban saját felhasználásra is. A bibliográfia, illetve a tudásbázis mellett elérhetővé tesszük az általunk évente megrendezett workshopok prezentációját, illetve az események felvételeit a Videotorium rendszerén keresztül. Ezeket a felvételeket mi metaadatoljuk és mi is töltjük fel. Nagyon fontos ezenfelül bemutatni azokat az oktatási-ismeretterjesztő tevékenységeket is, melyeket a webarchiválás kapcsán kifejtünk. Információkat kínálunk a Könyvtári Intézetben akkreditált webarchiválás tanfolyamunkról, illetve e-learning alapú tartalomfejlesztéseinkről is. Kifejezett célunk az, hogy a webarchiválás iránt érdeklődő kollégákkal minél intenzívebb szakmai együttműködést alakítsunk ki. Bár az OSZK-nak hamarosan remélhetőleg jogilag is rögzített feladata lesz a webarchiválás, de külső szakmai partnerek nélkül képtelenség feltárni a begyűjtendő tartalomforrások teljes vertikumát. Külön levelezőlistát hoztunk létre az érdeklődő szakmai partnerek tájékoztatására, illetve a honlapon is felvázoljuk az együttműködési lehetőségek fő irányait. A KDS pályázat ígéretes lehetőséget nyújt számos megyei-városi közkönyvtár számára ezen együttműködési formák elmélyítésére. Nagyon reméljük, hogy a közrebocsátott információk katalizátorai lesznek egy széles szakmai együttműködési háló kialakításának. A tájékoztató szolgáltatások mellett ez a legfontosabb célja az itt felvázoltaknak.

A külső kommunikáció keretei

A honlaptervezés során fontosnak tartottuk egy olyan menüpont beillesztését a szolgáltatási kínálatba, amely elsődlegesen a sajtó munkatársait, illetve a webarchiválást széles körben népszerűsíteni kívánó partnereinket célozza meg. Itt tömören összegezzük a tevékenységeinkről szóló alapvető információkat. A szöveges tartalom mellett pedig szabadon felhasználható képeket, szórólapokat, plakátokat kínálunk népszerűsítési célzattal. Az újságírók munkáját jelentősen segítheti az az összeállítás is, melyben a webarchiválási projektről, illetve tágabban a webarchiválásról szóló nyomtatott és elektronikus sajtómegjelenéseinket tartjuk számon, illetve megosztjuk a cikkek teljes szövegét, amennyiben az lehetséges.

Tervek a jövőre nézve

A vonatkozó jogszabályi környezet megteremtése után fontos feladatunk lesz, hogy a magyar illetőséggel bíró honlaptulajdonosok számára előírandó bejelentési kötelezettségnek egy megfelelő űrlap segítségével eleget tudjanak majd tenni.

A könyvtárakkal való együttműködés elmélyítése során szükségessé válhat egy kollaboratív munkafelület kialakítása, amit szintén a honlap keretei közé szeretnénk majd illeszteni.

A megfelelő finanszírozási feltételek biztosításával megnyílna a lehetőség arra, hogy az Internet Archive által begyűjtött magyar webhelyeket is a honlapunkba integrált keresőfelületen tudjuk elérhetővé tenni.  Ez nagyon jelentős hozzáadott értéket jelentene a magyar web múltjának feltárása terén.

A zárt archívum elérhetőségének biztosítása, valamint az Internet Archive által gyűjtött anyag szolgáltatása felértékelheti a kutatástámogató funkciók fejlesztését is. És akár külön menüpont alatt adhatunk majd tájékoztatást a kutatási lehetőségekről a tudományos szakemberek számára, a vonatkozó nemzetközi gyakorlat bemutatásával.

Középtávú terveink közé tartozik a közép-európai webarchívumok Memento protokollon alapuló közép- európai közös keresőfelületének megteremtése, egy közös portál keretében, ahol együtt meg tudnánk jelenni, természetesen megfelelő kapcsolódási pontokkal a nemzeti webarchívumok honlapjaihoz is. A koronavírus-járvány miatt sajnos idén már nem tudjuk elkezdeni ennek a szervezését, de 2021-ben a meglévő személyes kapcsolatainkra építve mindenképp szeretnénk megvalósítani.


[1]  Drótos László – Visky Ákos László: Rákóczi-archívum. Mintaalkalmazás egy webarchívum más digitális gyűjteményekkel való összekapcsolására. = Könyv, Könyvtár, Könyvtáros, 29. évf. 2020. 3. sz. 35-48. p. https://epa.oszk.hu/01300/01367/00326/pdf/EPA01367_3K_2020_03_035-048.pdf (2020.06.27.)

Címkék