Hol tartunk a Humán Szakirodalmi Adatbázis megvalósításában?

51. évfolyam, 2005. 4. szám

Hol tartunk a Humán Szakirodalmi Adatbázis megvalósításában?^*

RÁCZ Ágnes

A hírlap- és folyóiratcikkek, valamint egyéb időszaki kiadványok cikkeinek feltárása a magyar könyvtárügy évtizedeken - sőt, ha Szinnyei József repertóriumát tekintem: évszázadokon - átívelő kérdése. Nem kell e körben a cikkfeldolgozás történetét vázolni, hiszen a Bibliográfiai Szekció tagjai ezt valószínűleg jobban ismerik nálam. Én eddig egy kis szeletét - remélem, hogy a könyvtárosok számára fontos szeletét - ismertem mélyebben, a könyvtártudományi dokumentáció ügyét.

Néhány tény a közelmúltból

A magyar időszaki kiadványokban publikált cikkek online adatbázisának létrehozására irányuló fejlesztési elképzelések az 1990-es évek első felében kerültek napirendre. A Művelődési és Közoktatási Minisztérium megvalósíthatósági tanulmányt készíttetett, amely az OSZK számítógépes rendszerébe illeszkedve javasolta felállítani az adatbázist együttműködő partnerek bevonásával. Idézet Vajda Erik 1994-ben írott tanulmányából "Jelenleg tehát az OSZK-nál létesülő, a munkamegosztás eredményeként létrejövő, egyetlen országos cikkbibliográfiai adatbázist javaslunk, az országos adatbázist a helyi adatbázisok fenntartói által az együttműködés keretében készített és "szállított" rekordok tekintetében duplikáló és egyéb helyi célú adatbázisok mellett."^**

A terv azonban ez idáig csak terv maradt. Az OSZK-nak a 2002-2004. évre szóló stratégiai tervében felbukkant a feladat, de megvalósítására abban a formában nem került sor: "...lehetőség nyílik az időszaki kiadványok válogatott cikkeinek online adatbázisban való továbbépítésére, együttműködve más könyvtárakkal, melyek az egyes szakterületek feldolgozásáért felelnek. Az együttműködés feltétele a megfelelő hálózati összeköttetés és az Amicus kliensek megléte... Eszköz: Egyetlen központi adatbázis, melyet több telephelyről építenek azonos szoftver használatával, azonos elvek alapján." (Az OSZK stratégiai céljai és cselekvési terve, 2002-2004. p. 27.)

2002 őszén a cikkfeldolgozásban érintett osztályok vezetői ( Wolf Magda, Gál Julianna és Rácz Ágnes ) azt a felkérést kapták, hogy készítsenek megvalósíthatósági tanulmányt az OSZK-ban folyó cikkfeldolgozás egységesítésére, vagyis az IKER, a Hungarika bibliográfiai adatbázis, valamint a MANCI könyvtártudományi cikkadatbázis közös keretekben való folytatására, s ezzel együtt az IKER új profiljának, gyűjtőkörének kidolgozására.

A tanulmány Javaslat az egységes folyóiratcikk-feldolgozásra az OSZK-ban címmel 2003 januárjában elkészült, belső anyagként - publikálásra nem került. Ebben a tanulmányban az IKER új gyűjtőkörét - belátva, hogy egy általános tematikájú, humán tudományi cikkadatbázist az OSZK jelenlegi személyzeti ellátottságával egyedül nem tud naprakészen építeni - az OSZK szakkönyvtári feladatainak figyelembevételével a magyar irodalom és a magyar történettudomány területére korlátoztuk. A Hungarika adatbázis változatlan gyűjtőkörrel, a MANCI pedig a könyv- és könyvtártörténettel retrospektív irányban is kibővített gyűjtőkörrel került volna a közös adatbázisba. Az adatbázist az OSZK Amicus-rendszerében képzeltük el, aminek meglett volna az az előnye, hogy a sokféle dokumentumtípus, illetve a részdokumentumok egyetlen rendszerben lettek volna kereshetők és szükség szerint rekordszinten kapcsolatba hozhatók egymással. A szoftverváltás azt eredményezte volna, hogy mindhárom műhely végre megszabadulhat a DOS alapú MikroISIS-től, amelyben adatbázisaink (az IKER-t kivéve) még jelenleg is épülnek.

Ez a terv sem valósult meg. 2002 októberében a Sajtórepertórium szerkesztőségét megszüntette az OSZK főigazgatója, személyzetét megosztotta a Hungarika Bibliográfiai Osztály és a Könyvtártudományi Szakkönyvtár (KSZK) között (a KSZK-ban ekkor tudtunk újonnan kapott feladatunk ellátásának, a magyar könyv- és könyvtártörténeti irodalom retrospektív feltárásának nekifogni). 2003. január 1-jével megszűnt az IKER adatbázis kurrens építése. A Sajtórepertórium korábbi vezetője azt a feladatot kapta, hogy az adatbázist egészítse ki és zárja le a 2002-es tárgyévvel.

Közben a szakmai körökben, egyesületi rendezvényeken nagy vitát váltott ki a repertórium megszüntetése, és publikációk sora jelent meg e tárgyban a Könyv, Könyvtár, Könyvtáros , illetve a Könyvtári Figyelő hasábjain. Mindez oda vezetett, hogy az Országos Széchényi Könyvtár tervbe vette egy "Humán (társadalomtudományi) Szakirodalmi Adatbázis" (HSZA) könyvtárak együttműködésén alapuló létrehozását. Visszatértünk tehát a tíz évvel azelőtti, Vajda Erik-féle koncepcióhoz. 2004 szeptemberében az OSZK főigazgatója felkért egy szakértői bizottságot a megvalósíthatósági tanulmány kidolgozására. Bár a tanulmány végleges változata még nem készült el, a Murányi Péter által vezetett bizottság körvonalazta az adatbázis létrehozásának fő elveit, meghatározta a gyűjtőkörét, számba vette a feldolgozandó magyarországi időszaki kiadvá- nyok körét (erről tételes jegyzék készült), és megfogalmazta elképzeléseit az adatbázis informatikai kialakításáról.

Mindez dióhéjban

Az adatbázis gyűjtőköre

A gyűjtőkör körülhatárolására az OECD és az EU által használt Ortelius Thesaurus -t használtuk fel, amelyet a BME-OMIKK Nemzeti Kutatás-nyilvántartási Rendszere is alkalmaz. Ebbe beletartozik a társadalomtudományok közé sorolt antropológia, földrajz és neveléstudomány is. A gyűjtőkör részletezése:

Művészet

Művészeti menedzsment, Divattanulmányok, Képzőművészet, Műkritika, Műtárgyvédelem, Restaurálás, Rajz, Festészet, Plasztikus művészetek (Szobrászat), Szcenográfia, Kézművesség (Agyagművesség, Metszetek), Textilművészet, Előadóművészetek (Táncművészet, Rendezés), Zene (Zeneművészet, Zenetudomány), Színháztudomány (Színművészet, Dramaturgia), Vizuális művészetek (Filmművészet, Grafikai művészetek, Fényképészet);

Történelem

Egyetemes történet, Egyháztörténet, Filozófiatörténet, A formatervezés története, Gazdaságtörténet, Genealógia, Heraldika, Jogtörténet, Művészettörténet, A mezőgazdaság története, Régészet, Színháztörténet (Tánctörténet), Társadalomtudomány-történet (Helytörténet, Írástörténet, Numizmatika, Pecséttan, Politikatörténet, Társadalomtörténet, Zenetörténet), Tudománytörténet, Technikatörténet (Nyomdászattörténet);

Információs tudományok

Archivisztika, Oklevéltan, Dokumentáció, Információ-menedzsment, Adatkezelés, Információfeldolgozás (Információs rendszerek), Könyvtártudomány (Könyvtudomány, Bibliológia);

Nyelvtudomány

Alkalmazott nyelvészet (Tolmácsolás, Fordítás), Dialektológia, Egyes nyelvek, Filológia, Fonetika, Fonológia, Jelbeszéd, Lexikológia, Neurolingvisztika, Névtudomány, Nyelvészet, Nyelvtan (Szintaxis), Összehasonlító nyelvészet, Pszicholingvisztika, Retorika, Számítógépes nyelvészet, Szemantika, Szociolingvisztika, Történeti nyelvtudomány;

Irodalom, irodalomtudomány

Egyes nyelvek (nemzetek, népek) irodalma, Irodalomkritika, Irodalomtörténet, Irodalomelmélet, Kapcsolattörténet, Irodalomszociológia, Összehasonlító irodalomtudomány, Stilisztika, Fordítások;

Filozófia

Esztétika, Etika, Fenomenológia, Filozófiai antropológia, Ismeretelmélet, Jogfilozófia, Logika, Metafizika, Rendszeres filozófia, Szemiotika, Tudományfilozófia;

Vallástudomány

Bibliakutatás, Egyháztudomány, Keresztény egyházak, Lelkipásztori tanulmányok, Nem keresztény vallások, Összehasonlító vallástudomány, Teológia;

Antropológia

Kommunikációs antropológia, Kulturális antropológia (Folklór), Néprajz (Összehasonlító néprajz, Etnográfia);

Földrajz

Gazdasági földrajz, Humán földrajz, Regionális földrajz, Társadalomföldrajz, Térképészet, Történelmi földrajz;

Neveléstudomány

Oktatás (Alsófokú oktatás, Felnőttoktatás, Felsőoktatás, Folyamatos oktatás, Gyermeknevelési tanulmányok, Kísérleti oktatás, Középfokú oktatás, Nevelési irányelvek, Összehasonlító oktatás, Szociálpedagógia, Testnevelés, Sport), Tanuláselmélet, Kutatásmódszertan, Didaktika (Oktató játékok, Különleges oktatási módszerek, Gyógypedagógia), Számítógéppel támogatott oktatás.

Együttműködésen alapuló feldolgozás

Az adatbázis építését az Országos Széchényi Könyvtár - számos hazai könyvtárral való együttműködésben, illetve egyéb bibliográfiai műhelyek, lapkiadók bevonásával - úgy kívánja megszervezni, hogy a gyűjtőkörbe tartozó szakterületeken ne legyenek feldolgozatlan folyóiratok, fehér foltok, ugyanakkor a lehető legnagyobb mértékben kikü- szöbölje a párhuzamos feldolgozást. Vagyis, ugyanazt a cikket ne dolgozza fel több könyvtár, illetve az egyszer feldolgozott cikket valamennyi könyvtár hasznosíthassa.

A fenti követelménynek úgy lehet megfelelni, ha adott folyóiratnak adott könyvtár (esetleg a folyóirat kiadója vagy egyéb bibliográfiai műhely) a gazdája, amely folyamatosan végzi a folyóirat teljes, lehetőség szerint a megjelenést követő azonnali feldolgozását.

A hungarikumok körébe tartozó cikkek terén nem lehet a feldolgozást előre rögzített folyóiratlistával megszervezni, ugyanis a potenciális források bázisa nagyon széles, tematikailag nem egynemű - vannak persze kizárólagosan hungarikum-lapok is (a határon túli magyar lapokra gondolok). Hasonló a helyzet a könyvtörténeti-könyvtártudományi szakbibliográfia terén is (és feltételezem, hogy hasonló lesz a csatlakozni kívánó szakadatbázisok esetében is): itt ugyanis a határterületi lapoknak, illetve a szórványcikkeknek is nagy jelentőségük van, és be kell kerülniük az adatbázisba. (Példa a MANCI gyakorlatából: Ha az Orvosi Hetilap egy cikke foglalkozik valamelyik kórházi könyvtárral, az az adatbázis gyűjtőkörébe tartozik, bár a cikk forrása nem humán tudományi lap.)

Az együttműködés előnyei főleg abban lesznek-lennének, hogy a már valaki által egyszer rögzített rekordot bármelyik együttműködő partner kiegészítheti (pl. újabb tárgyszavakkal); ha akarja, átveheti saját adatbázisába, szolgáltatásába, termékébe (pl. szak- vagy helyismereti bibliográfiájába).

A feldolgozás szintjei és a gyors hozzáférés biztosítása

A feldolgozást a bizottság két szinten javasolja megvalósítani:

• az első egy egyszerű tartalomjegyzék szintű feldolgozás valamennyi, a kötelezően feldolgozandó forrásdokumentumok körébe tartozó periodikumból (kivéve a napilapokat és a hetilapokat, pontosabban a tartalomjegyzék nélkülieket),

• a második szint az arra érdemes és a tényleges gyűjtőkörbe tartozó közlemények bibliográfiai szintű feldolgozása, ami a tárgy szerinti tájékozódást is biztosítja.

Már az első szinten lehetőség van a tartalomjegyzékben szereplő cikkek teljes szövegéhez való hozzáférésre, ha azok az Interneten elérhetők, még inkább garantált a hozzáférés hosszú távon, ha a feldolgozott periodikumok elektronikus változatát az OSZK, illetve meghatározott esetekben más gyűjtemény archiválja. - Ez persze a második szinten is követelmény. (És itt kívánkozik egy kis kitérő: a könyvtártudományi dokumentáció, amely a külföldi, zömében nem hungarikum cikkekre is kiterjed, teljes egészében az új adatbázisban folytatódna - vagyis nem tervezzük a magyar és a külföldi cikkfeldolgozás szétválasztását. A külföldi cikkekhez tartozó referátumok, amely a MANCI jelenlegi webes változatában a rekordokhoz kapcsolódnak, szintén csatolva lesznek a bibliográfiai rekordokhoz.)

A kétszintű feldolgozás előnye, hogy az első szint nem igényel speciális ismereteket, pusztán jól szervezett, egységes szabályokon alapuló adatrögzítést (a miskolci egyetemi könyvtár által gondozott MATARKA, Magyar folyóiratok tartalomjegyzékének kereshető adatbázisa ), ugyanakkor a megjelenést követően lehetővé válik az azonnali keresés valamennyi, a forrásjegyzékben szereplő kiadvány cikkeinek szerzőire (a szerzők nevére), a cikkek címére, valamint az adott periodikumok egyes részegységeire. A tartalomjegyzékek rögzítésében a gazdakönyvtárakon kívül más könyvtárak, illetve az arra vállalkozó kiadók is részt vesznek/vehetnek. A tartalomjegyzék szinten feldolgozott cikkek rekordjaiból a HSZA gazdakönyvtárai kiválogatják a gyűjtőkörbe tartozókat (a tisztán szakterületiekből természetesen valamennyi cikket, a vegyes tartalmúakból a relevánsakat), és elvégzik a szükséges adatkiegészítést, valamint a tartalmi feldolgozást.

Tartalmi feltárás

A Humán Szakirodalmi Adatbázisba kerülő bibliográfiai rekordok tartalmi jellemzésére természetes nyelvű , szabályozott feltáró eszközt - pontosabban: eszközöket - kívánunk alkalmazni.

A HSZA-ban az egységes tárgyszavazás érdekében célszerű az országos használatra alkalmas és az OSZK-ban és más hazai könyvtárakban már bevezetett, folyamatosan bővülő, bővíthető OSZK Tezaurusz/KÖZTAURUSZ, illetve egy szakcsoportok képzésére megfelelő szakjelzet-jegyzék alkalmazása. Az adatbázisban azonban lehetővé kívánjuk tenni azt is, hogy a résztvevő partnerek saját tezauruszukat, tárgyszójegyzékeiket is használhassák. Megint csak a MANCI példáján: a könyvtári cikkek tartalmi feltárására továbbra is a Könyvtári és tájékoztatási tárgyszójegyzék et fogja használni a KSZK.

Mivel az OSZK Tezaurusz a HSZA gyűjtőkörébe tartozó tudományok, szakterületek fogalomrendszerét jelenleg nem azonos mélységben tartalmazza, gondoskodni kell továbbépítésének lehetőségéről, biztosítva természetesen a tezaurusz egységességét és arányosságát.

Az adatbázis nyilvános keresőfelületén kívánatos lenne, hogy tegyük lehetővé a felhasználók számára a deszkriptorcikkek megtekintését, hogy keresőkérdésüket pontosíthassák, tájékozódhassanak a kiválasztott tárgyszavak fogalmi kapcsolatairól, így lehetőségük legyen kérdésüket tartalmilag tágabban (fölérendelt, egésze), szűkebben (alárendelt, része), vagy árnyaltabban (oksági, okozati, egyéb összefüggés) megfogalmazni. Ennek megvalósítására meg kell vizsgálni az adatbázisnak a MÁTRIKSZ-szal (Magyar Átfogó Tárgyi Információkereső-nyelvi Szótár, www.matriksz.hu) való összekapcsolás lehetőségét, illetve a deszkriptorcikkek authority rekordjának elkészítési lehetőségét.

Alkalmazandó szoftverek

a) A feldolgozás első szintjére a MATARKA (MySQL) rendszerének alkalmazását javasolta a bizottság. A MATARKA tartalomjegyzék-adatbázisából az új cikkek rekordjai meghatározott időközönként automatikusan - később kidolgozandó eljárással - kerülnének át a HSZA adatbázisba, ahol a mélyebb, tartalmi feltárás folyik.

b) A HSZA közös adatbázis létrehozására olyan szoftvert célszerű választani, amellyel az együttműködő könyvtárak számára online feldolgozás oldható meg. Ugyanakkor lehetővé kell tenni, hogy azok a könyvtárak, amelyek erre műszakilag nincsenek felkészülve, rekordjaikat más módon (feltöltéssel vagy fizikai hordozón) juttathassák el az adatbázis üzemeltetőjéhez.

A humán szakirodalmi adatbázishoz azt a multifunkciós szoftvert fogjuk alkalmazni, amelyet pl. a MOKKA - régi könyves adatbázis, a MOKKA szegedi tükör, Lectio - Olvasmánytörténeti források és egyéb szolgáltatások esetében működtet a Szegedi Egyetemi Könyvtár. A keretrendszer neve: Bodza. ¹ Az Országos Széchényi Könyvtár és a Szegedi Tudományegyetem Egyetemi Könyvtár támogatásával készül. (A MOKKA-R elérhető a szegedi egyetemi könyvtár honlapjáról, illetve Hegyi Ádám cikke olvasható róla a Könyvtári Figyelő 2005/2-es számában.)

A szoftver XML szabvány szerint tagg elt (az XML jelölő elemeivel ellátott) szövegekkel dolgozik, ennek következtében bármilyen szöveges objektumként felfogott input tal képes dolgozni, legyen az Word szöveg, MARC21 szegmentálású szöveg, SGML/XML alkalmazás eredménye stb. A szövegek szegmentálása bármikor bővíthető a későbbi igényeknek megfelelően. Az összetettebb szövegek (azaz, ha a szöveg "jelentéséből" következnek a konverziós műveletek) input fájllá való alakítása természetesen nem teljes mértékben automatizálható, de a szoftver és környezete jelentősen segíti ezt a folyamatot. Más esetben (pl. MARC21 esetében) a folyamat tökéletesen automatizálható. Tetszőleges számú/jellegű szövegtípus tölthető ugyanabba az adatbázisba, amelyek ezután együtt kereshetők, szerkeszthetők.

A szoftver az egyes elemeket ( tag eket) indexeli és teszi kereshetővé. Ugyanakkor a teljes szövegű keresés lehetőségét is felajánlja minden egyes alkalmazás esetében. Lehetséges a szoftver által támogatott szolgáltatások kereső felületeinek összekapcsolása is a legkisebb közös nevező elvének alkalmazásával. Szélsőséges esetben a szabadszöveges keresés mindig alkalmazható. (Egy újabb kitérő: ez a tulajdonsága - mármint a szolgáltatások összekapcsolásának lehetősége - nagyon fontos abból a szempontból is, hogy az OSZK-ban a közeljövőben meginduló retrospektív sajtóbibliográfiai munkálatok számára is a Bodza szoftver alkalmazását javasoljuk, s ezzel megoldható lenne a cikkeket feltáró Humán Szakirodalmi Adatbázis és a folyóiratokról készítendő sajtóbibliográfia összekapcsolása.)

A szoftver alkalmazásának két szintje:

1) alapműveletek , mint

a) nagyszámú tétel (eleinte csak katalógusszerű, később a betöltött dokumentumok nagyléptékű struktúráját is megőrző) tárolása szabadon választott szövegelemekre utaló indexekkel;

b) ezek visszakeresése gazdag mintaillesztő készlet segítségével (teljes szövegű, vagy szemantikailag szűkített keresés; kulcsszavas, vagy reguláris kifejezések megfogalmazása; mindezek logikai kombinációi), egyidejűleg több belső és külső (Z39.50) forrás lekérdezése;

c) a találati halmaz jól áttekinthető prezentációja (rendezve, csoportosítva, grafikonon ábrázolva) és navigációja;

d) egy-egy tétel megjelenítése számos formátumban (esetenként igen komplex, heurisztikus konverziós szabályok eredményeként), hipertext kapcsolatok követése;

e) interaktív szerkesztés a keresőrendszerbe szervesen illeszkedő szerkesztő komponenssel (XML vagy MARC nézet szerint);

f) háttérben futó (automatizálható) import/export funkciók, Corvina és Orbis kapcsolódási pontok.

2) összetett (az alapműveletekre épülő) eljárások , mint

a) besorolási adatokra utaló hivatkozások kezelése (authority control);

b) speciális keresőfelületek (térkép, időskála);

c) (akár több forrásból is táplálkozó) böngészőlisták összeállítása;

d) tételek letöltése (bináris MARC, PDF stb. fájlszerkezetben);

e) speciális szerkesztőfelületek (űrlap, külső alkalmazás);

f) az import/export funkciókra támaszkodó adatszinkronizáció különböző források felől/felé.

A felület egyik alapvető célkitűzése az az integrálóképesség, amellyel számos, rendszerint eltérő jellegű (akár témájában, szerkezetében, méretében vagy elérési módjában) adatbázist egyetlen koherens egységként jelenít meg, enged keresni és szerkeszteni. A rendszerbe bekerülő, szemantikai szerepüknek megfelelően összetartozó adatok gyűjteményekben csoportosulnak. Ezek a gyűjtemények a források , melyekből a keresőkifejezések segítségével merítjük a találati halmazokat. E gyűjteményekbe három úton érkezhetnek szövegek:

1. helyben keletkeznek valamilyen szerkesztési művelet eredményeként (online adatbevitel);

2. replikáció (tükrözés) útján bizonyos időközönként külső adatbázisból áttöltésre kerülnek (pl. betöltés a MATARKA-ból);

3. nem tárolódnak helyben, csak a keresés idejére érkeznek távoli adatbázisból.

Minden forrás külön is kereshető, a keresőfelület minden forrásra külön belépési ponttal (URL) rendelkezik: ezen keresztül érkezve az űrlap az adott gyűjtemény szemszögéből ugyan, de mindig a teljes (jogosultságoktól függően nyilvános) rendszert mutatja. Az aktuális forrás neve az űrlap fejlécében olvasható, míg a többi a keresőkifejezések után az Összes kereshető forrás címszó alatt érhető el.

Szerkesztő felület

A keretrendszert szerkesztő felület egészíti ki: ez interneten keresztül elérhető szerkesztő űrlapot jelent, amely hagyományos html űrlap formájában jelenik meg. A futtatásához böngésző és JAVA támogatás szükséges. Minden felhasználó egységesen ugyanazt a felületet látja, bármilyen műveletet végezzen is (új rekord létrehozása, módosítás, külső forrásokkal való kiegészítés). Használata csak azon könyvtárak számára szükséges, amelyek nem rendelkeznek könyvtári szoftverrel, illetve nem kívánnak a saját rendszerükben cikkeket feltárni.

A hozzáférés különböző jogosultságokat nyújtó jelszavakkal történik, amely szabályozza, hogy ki melyik gyűjtemény rekordjait szerkesztheti, illetve milyen típusú feldolgozó munkát végezhet (új rekord létrehozása, módosítás, törlés, hozzáírás stb.) Legalább háromszintű jogosultságot érdemes bevezetni, az ezekhez tartozó jogokat ki kell dolgozni a cikk-adatbázis számára.

A szerkesztő felületen alapállásban lehet az XML kódolású szövegeket (rekordokat) szerkeszteni, illetve adott esetben MARC21 tagg elésű rekordokat.

(A MOKKA-R projekt esetében az üzemeltetés egyik célja a közös katalogizálás megvalósítása, ezért a szerkesztő modulba különböző adatbázisokból [pl.: Hand Press Book Database, HAB, stb.] is be kell tudni rekordokat tölteni. Ez Z39.50 szabvány segítségével valósul meg. Ugyanígy azok a könyvtárak, amelyek saját katalógust építenek, át tudnak emelni bibliográfiai tételeket az adatbázisunkból.)

A szerkesztő felület mind online, mind offline ösz- szeköttetés esetén működik.

Erőforrás-szükséglet

A szoftver platformfüggetlen (hordozható), hálózati környezetbe illeszkedő szerver-kliens architektúra, mely explicit telepítés nélkül web-böngészővel elérhető és teljes értékűen használható. A szerkesztési műveletekhez a böngésző oldalán JAVA futtató környezet (plugin) szükséges, de enélkül a (read-only) keresés/megjelenítés zavartalanul működik.

Hardver igény

A szerver tetszés szerint elhelyezhető. A jelenlegi rendszer az SZTE Egyetemi Könyvtár szerverein működik, de hosszabb távon célszerűnek tartanám a HSZA szerverét az OSZK-ba telepíteni.

Ha valaki kliens oldalról csak az OPAC-ot kívánja használni, annak elegendő egy ADSL vonal és egy átlagos PC (jelenleg: PII, 533 Mhz, 128 MB RAM, 10 GB HDD). Ugyanilyen feltételek kellenek a szerkesztő felület futtatásához is.

Szoftver

Az adatbázis működtetéséhez kevés szoftverre van szükség. Az adatok kezelését egy adatbáziskezelő oldja meg. Az OPAC használható Mozilla 1.3 vagy Internet Explorer 6-os verzióval. A szerkesztő felülethez valamilyen böngésző programon kívül JAVA támogatás is szükséges.

Az adatok egy nagy szöveges fájlban vannak tárolva. Ehhez egy univerzális adattárolási szabványt, az XML-t választották. Ez olyan tárolási forma, amely sokkal könnyebben módosítható, mint bármilyen más integrált könyvtári rendszer. Megjelenítéshez az XHTML és CSS korszerű internetes szabványokat használjuk.

A cikkfeldolgozásban potenciálisan résztvevő könyvtárak és egyéb bibliográfiai műhelyek

Az együttműködésben résztvevő könyvtárak, illetve bibliográfiai műhelyek kiválasztásánál elsősorban az országos szakkönyvtárakra, a köteles példányban részesülő könyvtárakra, a hosszú ideje szakirodalmi adatbázist építő könyvtárakra, valamint a helyismereti, helytörténeti adatbázist építő könyvtárakra számítunk. Reméljük, hogy a megyei könyvtárak rávehetők az adott megyében megjelenő társadalomtudományi (humán) folyóiratok feltárására a projekten belül. A Pest Megyei Könyvtár esetében itt természetesen a Budapesten kívül, Pest megyében megjelenő folyóiratokról lehet szó. Ugyanakkor figyelembe kell venni, hogy ezekben az intézményekben nem általános , hanem speciális, helyismereti célú adatgyűjtésről van szó, részükről tehát igényként merül(het) fel, hogy a Humán Szakirodalmi Adatbázis az írások földrajzi vonatkozásait a teljesség igényével tárják fel.

Az együttműködésbe kívánatos bevonni a feladatra vállalkozó kutatóintézeteket, egyetemeket is. Ezáltal ugyanis biztosítható lenne a kutatóhelyek publikációnak adatbázisba kerülése is.

Idáig jutott el a "Murányi-bizottság".

Jedlik-pályázat

Közben, 2005 tavaszán halvány lehetőség nyílt egy pályázat benyújtására a Nemzeti Kutatási és Technológiai Hivatal Jedlik Ányos Programja keretében. Halványnak azért nevezem, mert első látásra sem láttam sok esélyt témánk kedvező elbírálására: 11 milliárd forint állt rendelkezésére max. 50 pályázónak, főként természettudományi alapkutatások elvégzésére. A Jedlik Program 6. alprogramja tartalmazott csak társadalomtudományi témákat, és azok is inkább elméleti tanulmányok, elemzések készítését tűzték ki célul.

Pályázatunkat az MTA Irodalomtudományi Intézetével és a Szegedi Egyetemi Könyvtárral közösen, konzorciumi formában, "kísérleti fejlesztésnek álcázva" adtuk be. A Murányi-bizottság munkamegbeszéléseinek Berke Barnabásné által összefoglalt nyersanyagát felhasználva, a témát kibővítettük konverziós modellek kidolgozásának, kikísérletezésének feladatával (különböző adatstruktúrájú és adatbázis-kezelőt használó cikkadatbázisok, illetve elektronikus szövegként, valamint nyomtatott formában létező repertóriumok konvertálásának modellkísérletei). Pályázatunk kitért egy olyan keresőszoftver megvásárlására is, amely együttesen lenne képes különböző nagy adatbázisokban keresni: alapvetően a HSZA-t (cikkek), a MOKKA-t (könyvek), illetve az Amicus-t (könyvek részdokumentumai) céloztuk meg. És persze a szükséges hardver (25 db PC) beszerzését is tartalmazta igényünk.

Sajnos, a pályázat eredményességével kapcsolatos "várakozásom" megalapozottnak bizonyult: pályázatunkat elutasították, a következő értékeléssel: " A projektjavaslat céljai nem esnek egybe a prioritásokkal. A projektjavaslat kidolgozottsága közepes, a költségterv és a feladatok bontása nincs összhangban. Helyesebb lett volna ezt a pályázatot az OSZK másik pályaművébe integrálni." Megjegyzem, hogy az OSZK másik pályázata sem nyert. - És mentségemre legyen mondva, egy hét alatt kellett a pályázatot elkészítenünk konzorcium létrehozásával "súlyosbítva".

Nemcsak a pályázatunk volt sikertelen, hanem a kötelező maradványképzés miatt az a szaktörvényi keret is elúszott, amelyből a munkát el lehetett volna indítani ebben az évben.

Mi történt a HSZA ügyében, mégis?

Az OSZK kiindulópontja az, hogy három cikkadatbázisát egységes egészként kívánja működtetni a jövőben, és a humán szakterület cikkanyagának feldolgozásába külső partnereket (könyvtárakat, kiadókat, szerkesztőségeket, a hungarikumok tekintetében még határon túliakat is) kíván bevonni. Ennek érdekében:

• A Hungarika Dokumentációs Osztály és a Sajtórepertórium munkatársaiból létrehozott új osztállyal (Humán Szakirodalmi Bibliográfiai Osztály) megbeszéltük a leendő feladatokat. A tervezés szakaszában két csoportot szeretnénk létrehozni: az egyik az új adatbázis struktúrájának kidolgozásával foglalkozik, a másik pedig a Hungarika bibliográfiában, illetve az IKER-ben alkalmazott tárgyszavazási gyakorlatot veti össze az OSZK tezaurusszal, kigyűjtvén azokat a tárgyszójavaslatokat, amelyekkel bővíteni kell az OSZK-tezauruszt.

• A szegedi programozó - egyelőre "hozomra" - a meglévő három MikroISIS-es adatbázist (IKER, HUNI, MANCI) a Bodza keretrendszerben XML-es formátumúvá átalakítva kereshetővé teszi az év végére. ² Ebből a változatból történik majd az adatbázis megtervezése után a rekordok megfelelő szegmentálása és indexelése.

• Fontos feladat lesz továbbá a három adatbázis egyesítésével keletkező duplumrekordok kiszűrése, illetve egyesítése. Duplumrekordok ugyanis vannak az Hungarika - MANCI, illetve az IKER - MANCI viszonylatban. Nem lehet azonban ezek közül a rekordok körül valamelyiket egyszerűen kidobni, hanem az eltérő tárgyszórendszerből származó tárgyszavakat egyesíteni kell a megmaradó rekordban, valamint biztosítani a rekordoknak a megfelelő "gyűjteményekbe" (szakterületi halmazokba) való bekerülését.

Milyen teendők várnak ránk jövőre?

• Ki kell alakítani az adatbázist az OSZK specifikációja alapján. A kísérleti üzem után elindulhat a kurrens feldolgozás, egyelőre az OSZK két műhelyében (HSZBO és KSZK);

• Ki kell dolgozni a MATARKA és a HSZA közötti adatforgalom mikéntjét;

• Fel kell venni a kapcsolatot a leendő feldolgozó partnerekkel, és velük a LibInfo mintájára konzorciumi szerződést kell kötni. Lehet, hogy némelyiket meg kell győzni a közös adatbázis építéséből fakadó előnyökről, és lehet, hogy a közös adatbázis építése esetleg eddig működő szolgáltatások átalakulásával jár majd;

• Számba kell venni azokat a forrásokat (adatbázisok, repertóriumok, nyomtatott cikkbibliográfiák), amelyek retrospektív konverziójára szükség van;

• És nem utolsó sorban: pénzügyi forrást kell találni az adatbázis fejlesztésére és üzemeltetésére. Erre most az EU keretében látszik némi remény, ugyanis témákat gyűjtenek a bölcsész- és társadalomtudományok területén lévő európai kulturális örökség megőrzése tárgyában kiírandó pályázatokra, és bár a könyvtárakra elvben nem vonatkozik, az adatbázisokra igen. (Ez nem is a jövő év, hanem az idei feladata volt, az előzetes anyagot ugyanis november elején be kellett adni.)

Így állunk tehát a mai napon. Köszönöm a figyelmüket.

Jegyzetek

1. A Bodza leírását dr. Bakonyi Gézának a bizottság számára készített összefoglalója alapján tartalmazza a cikk.

2. Ez megtörtént, a kísérleti jelleggel működő adatbázis - egyelőre még a szükséges egységesítési eljárások nélküli változatban, "első olvasatban" - felkerült a Szegedi Egyetemi Könyvtár honlapjára.

* Elhangzott az MKE Bibliográfiai Szekció 2005. október 19-i rendezvényén a Budapesti Corvinus Egyetem Központi Könyvtárában

** Vajda Erik: Időszaki kiadványok válogatott cikkeinek online adatbázisa kooperációs partnerek együttműködésével. 1994. p. 28.

Országos Széchényi Könyvtár
Észrevételek