Az időszaki kiadványok cikkeinek feldolgozása a magyar és a lett nemzeti bibliográfiai adatbázisokban

 A Lett Nemzeti Könyvtár által 2002. szeptember 12-13-án a lett nemzeti bibliográfia indulásának 75 éves évfordulója alkalmából rendezett, The national bibliography from print to the digital age konferencián elhangzott eloadás cikkesített változata.


Először is szeretném megmagyarázni a témaválasztásom: tanárként és kutatóként gyakran használom a magyar adatbázisokat, s többet alaposabban is elemeztem közülük. Egy évvel ezelőtt volt szerencsém megismerkedni a lett adatbázisokkal is. Sokat tudok a magyar adatbázisokról, de el kell ismernem, hogy a lett rendszer sokkal világosabb számomra. Hogy lehet ez?

Évek óta kutatom, hogy a magyar folyóiratcikkek hogyan szerepelnek magyar és külföldi adatbázisokban. Az elemzésükhöz nagy segítséget jelent, ha össze tudom hasonlítani a helyzetet más országokéval. A külföldi adatbázisokban való szereplést könnyű ugyanazokban a forrásokban (például a Dialog Corporation adatbázisaiban) vizsgálni. A magyar adatbázisokat más országok saját adatbázisaival, például a nemzeti bibliográfiai adatbázisokkal lehet összevetni, így ilyenekre szerettem volna példákat találni.

Voltak országok, ahol azt mondták nekem (például 2001 januárjában Belgiumban), hogy a cikkek feldolgozása nem része nemzeti bibliográfiai rendszerüknek, csak a könyveké és a periodikumoké. Azok a cikkek, amelyek fontosak, megtalálhatóak a nemzetközi adatbázisokban. Úgy tűnt, nem értették meg, vagy nem akarták megérteni a kérdésemet.

Csaknem feladtam a reményt, amikor néhány nappal később, 2001 februárjának elején Rigába utaztam, és az Orvosi Akadémia Könyvtárában alkalmam volt látni a nyomtatott lett nemzeti bibliográfiát (Latvijas Preses Hronika, The Latvian Press Chronicle), s ezen belül a bibliográfia terjedelmének többségét kitevő részt, amelyben a folyóiratok és újságok cikkei találhatók. Azt gondoltam, végre megtaláltam azt, amit már olyan régen kerestem. Majd ezután abban a szerencsében volt részem, hogy ellátogathattam a Lett Nemzeti Könyvtár Bibliográfiai Intézetébe, ahol találkoztam Anita Goldbergával, az intézet vezetőjével, a könyvtár igazgató-helyettesével, s kaptam tőle két füzetet (inkább kötetet) a nemzeti bibliográfiából.

Miután hazatértem, összehasonlítottam a Magyar Nemzeti Bibliográfia megfelelő részeivel (és részben más szakbibliográfiákkal), az észrevételeimről cikket írtam, s mivel az egyik bibliográfiában megtaláltam Anita Goldberga két konferencia-előadását, amelyekből többet lehet megtudni a lett nemzeti bibliográfia helyzetéről és a vele kapcsolatos jövőbeni tervekről, lefordítottam őket egy cikké olvasztva össze, s mindkét írás megjelent a Könyvtári Figyelő 2001. 1. számában. (Szövegük elolvasható a hálózaton is az alábbi címen:

http://ki.oszk.hu/kf/2001/11/nemzeti-bibliografia-lettorszagban-hagyomany-es-valtozas/#more-5070

Anita Goldberga: Nemzeti bibliográfia Lettországban: hagyomány és változás. Szemle.

http://ki.oszk.hu/kf/2001/11/kis-lett-magyar-komparatisztika-a-nemzeti-bibliografiak-foleg-a-cikkanyag-feltarasanak-osszehasonlitasa/#more-5061

Murányi Péter: Kis lett-magyar komparatisztika. A nemzeti bibliográfiák (főleg a cikkanyag feltárásának) összehasonlítása. A lett hallgatóságnak természetesen megmutattam a cikkek angol nyelvű referátumainak elérhetőségét is.)

Később volt alkalmam arra is, hogy a lett adatbázisokkal is megismerkedjem. Most szeretném bemutatni megfigyeléseim eredményeinek egy részét. A lett adatbázissal kezdem, majd összehasonlítom a hazaiakkal.

A lett adatbázisok a http://fikuss.lanet.lv:4505/ ALEPH0/con-lng/eng címen érhetőek el. Az adatbázisok közül a két legfontosabb a könyveket és a periodikumokat tartalmazó Data Base of National Bibliography Monographies and Serials és a Data Base of National Bibliography Analytic, amelyből az időszaki kiadványok cikkei kereshetők vissza. (Az adatbázisok mind lettül, mind angol nyelven kereshetők, de az egyszerűség kedvéért itt az angol nyelvű címekre fogok utalni). Ez az utóbbi adatbázis nemcsak a nyomtatott Lett Nemzeti Bibliográfia említett részét tartalmazza, hanem a külföldi időszaki kiadványokban Lettországgal kapcsolatos anyagot is (lettül Letika), de ez természetesen kisebb részét teszi ki.

A Magyar Nemzeti Bibliográfia esetében a dokumentumok három típusa (monografikus művek, periodikumok és cikkek) három külön adatbázisban található:

  • A könyvek megtalálhatóak az Országos Széchényi Könyvtár on-line olvasói katalógusában a http://nektar.oszk.hu/ cím alatt, korábbi változat pedig a http://w3.oszk.hu/hektor.htm címen, a nyomtatott változat a Magyar Nemzeti Bibliográfia. Könyvek Bibliográfiája, amelyből havonta két füzet jelenik meg.
  • A cikkek adatbázisa az IKER (Magyar Időszaki Kiadványok Repertóriuma Adatbázis), amely 2001 márciusa óta érhető el az interneten a http://w3.oszk.hu/rep.htm címen, a nyomtatott változat a Magyar Nemzeti Bibliográfia, Időszaki Kiadványok Repertóriuma, amely havonta jelenik meg.

A periodikumok az IKB (Időszaki Kiadványok Bibliográfiája) adatbázisban találhatók meg a http://w3.oszk.hu/ikb_h.htm címen.
A három adatbázis együtt jelenik meg az Országos Széchényi Könyvtár által készített Magyar Nemzeti Bibliográfia CD-ROM-on, évente két alkalommal.

A cikkek számának évenkénti megoszlása az adatbázisokban

Ha megnézzük a lett Data Base of National Bibliography Analytic és a magyar IKER adatbázisba 1991 és 2002 között évenként bekerült tételek számát, akkor már azt gondolhatjuk, hogy feladatom nem egyszerűen csak a két adatbázis összehasonlítása lesz (ld. 1. táblázat).

1. táblázat
A rekordok száma a két adatbázisban (ezrekben, kerekítve)

   A 2002-es adatokhoz a Data Base of National Bibliography Analytic használatával jutottam, a korábbi adatok Anita Goldberga információinak köszönhetők.

A helyzet nem olyan rossz (magyar szempontból), mint ahogy az első pillantásra látszik. Az IKER adatbázist 1993 óta építik, ez magyarázza az 1991-es év alacsony adatait. Az 1992-es, viszonylag magas számok a feldolgozás és a megjelenés éve közötti különbségből adódnak.

Másrészt a nyomtatott bibliográfia nem tartalmaz minden szakterületet. 1946 óta jelent meg, az 1980-as évek elejétől nem tartalmazza az alkalmazott tudományok (az ETO 6-os főosztálya) anyagát, ezeknek a szakterületeknek (műszaki tudományok, orvostudomány, mezőgazdaság) saját szakbibliográfiái (most már adatbázisai is) vannak. Az Időszaki Kiadványok Repertóriuma alcíme ekkortól Társadalomtudományok, természettudományok, az említett 6-os kivételével az ETO minden főosztályát tartalmazva.

Az alkalmazott tudományok adatbázisai

  • A Magyar Orvosi Bibliográfia (MOB) adatbázisa

Országos Egészségügyi Információs Intézet és Könyvtár (MEDINFO)

http://sunny.medinfo.hu:8082/cgi-bin/w1.sh

  • A Magyar Mezőgazdasági Bibliográfia adatbázisa (MAB)

Országos Mezőgazdasági Könyvtár és Dokumentációs Központ

http://www.omgk.hu/

- telnet://193.224.162.57 – telnet://atlas.omgk.hu

  • Budapesti Műszaki és Gazdaságtudományi Egyetem, Országos Műszaki Információs Központ és Könyvtár (BME OMIKK)

CIKK adatbázis
http://www.info.omikk.bme.hu/scripts/omikkweb/ cikk.exe
Megjegyzés: az adatbázist 2001 végén lezárták. Folytatása a Magyar Műszaki és Gazdasági Repertórium adatbázisa, (MMR)

http://www.info.omikk.bme.hu/scripts/omikkweb/mmr.exe

A legfontosabb különbség az, hogy a korábbi adatbázis tartalmazott külföldi cikkeket is (és kisebb részben más dokumentumtípusokat), az új adatbázisban csak magyar anyag van, a cikkek mellett konferenciaköteteket is analizálnak, s a korábbinál több időszaki kiadvány feldolgozását tervezik.

Ez már négy adatbázis, s ez még nem minden!

1994-ben Vajda Erik publikált egy érdekes tanulmányt Időszaki kiadványok válogatott cikkeinek online adatbázisa kooperációs partnerek együttműködésével (megvalósíthatósági tanulmány) (Bp. OSzK – KMK, 1994.57.p.) címmel.

A könyv referátuma szerint „az időszaki kiadványok válogatott cikkeinek kooperációs partnerek együttműködésével létrehozott adatbázisa valós használói igényeken alapszik, s mind szervezetileg, mind technikailag megvalósíthatónak látszik.”

A tanulmány 34 általános és szakbibliográfiát sorolt fel, amelyek elsősorban cikkeket tartalmaztak. Abban az időben ezek közül csak egy volt géppel olvasható adatbázis (a PRESSDOK, akkor floppy-újságként). Az összes többi nyomtatott bibliográfia volt, ezekből 9 készült már adatbázisból. A 4 korábban említett adatbázis (IKER és a három alkalmazott tudományi) nyomtatott változata mellett további 8 mai adatbázisé található meg a listán a társadalom- és humán tudományok köréből. Így már 12 (a műszakiakat külön számítva 13) önálló adatbázisunk van.

  • Országos Széchényi Könyvtár, Könyvtári Intézet

MANCI adatbázis (magyar és nemzetközi cikkek a könyvtár- és információtudomány területéről

http://w3.oszk.hu/manci.htm

  • Országos Idegennyelvű Könyvtár

Nemzetiségi adatbázis
Műfordítás adatbázis
A könyvtár on-line katalógusának (Webopacjának) részeként érhetőek el:

http://www.oik.hu/Angolvalt/frame2.htm

(Ez az angol nyelvű változat címe, magyar és német is van.)

  • Országos Pedagógiai Könyvtár és Múzeum

Pedagógiai Adatbázis (PAD), elérhető a könyvtár honlapján a
http://www.opkm.iif.hu címen, majd az Adatbázisok, Pedagógiai Adatbázis menüpontokat választva. CD-ROM-on is megjelenik.

  • Fővárosi Szabó Ervin Könyvtár

A Fővárosi Szabó Ervin Könyvtár adatbázisai (csak CD-ROM-on hozzáférhetők). A lemezen többek között megtalálható az Irodalmi kritikák és tanulmányok bibliográfiája 1961–2000 és a Szociológiai adatbázis 1970–2000. A szociológiai adatbázisról részletesebb információ a  http://www.fszek.hu/kozpont/szociologia/CDROM.htm címen található.

  • Országgyűlési Könyvtár

PRESSDOK adatbázis, amelynek témakörei közé tartozik a társadalom, politika, kultúra, gazdaság stb. napilapokból, hetilapokból, folyóiratokból az 1980-as évek végétől, évente kétszer jelenik meg CD-ROM-on. Ahogy említettem, ez volt az egyetlen géppel olvasható adatbázis, amikor Vajda Erik tanulmánya megjelent. A CD-ROM-on megtalálható egy másik adatbázis, a HUNDOK is, amely külföldi időszaki kiadvá- nyok magyar vonatkozású cikkeinek adatait tartalmazza, így ez kívül esik mostani témámon.

Van azonban egy Jogi adatbázis, amelynek anyagát szintén az Országgyűlési Könyvtár munkatársai állítják össze, de amelynek válogatott anyaga szélesebb körben egy másik CD-ROM-on, a Complex CD Jogtáron férhető hozzá.

Ez így összesen 12 (13) magyar adatbázis, amelyet össze kell és lehet hasonlítani az egyetlen lettel, a Data Base of National Bibliography Analytickel.

2. táblázat
A rekordok száma a magyar adatbázisban 1991– 2002

   Megjegyzések:

MOB: az adatok Szekeres Zsuzsa: A Magyar Orvosi Bibliográfia (MOB) helyzete és jelentősége a hazai szakirodalmi tájékoztatásban c. cikke alapján:

http://www.medinfo.hu/forum/szekeres_MOB.htm, mert az adatbázis nem kereshető a kiadás éve szerint.

CIKK adatbázis: az adatbázist 2001 végén lezárták, ezért nem lehetnek benne 2002-es rekordok.

PAD: 1991 és 1995 között is 2–3000 között lehet évente a magyar cikkeket tartalmazó rekordok száma, de ezek nem kereshetőek.

Irodalmi, szociológiai: A Fővárosi Szabó Ervin Könyvtár adatbázisait 2000-ben négy alkalommal jelentették meg, a 2001-es várhatólag hamarosan megjelenik. A szociológiai adatbázisnak angol nyelvű változata is van.

Jogi adatbázis: Minden 1994-ben és azelőtt megjelent dokumentum úgy kereshető, mintha 1994-ben publikálták volna.

CIKK, MANCI, PAD: az adatbázisokban több rekord található, a táblázatban csak a magyar cikkek rekordjainak száma található.

1. ábra
A rekordok száma a magyar bibliográfiai adatbázisokban 1991–2002

2. ábra
A rekordok száma a PRESSDOK-ban és a többi magyar bibliográfiai adatbázisokban 1991–2002

3. ábra
A rekordok száma a lett adatbázisban (DataBase of National)
Bibliographic Analytic) és a 13 magyar adatbázisban 1991-2002 augusztus

Néhány szempont, amelyet érdemes megfontolni, amikor adatbázisokat akarunk értékelni

A világ leghíresebb on-line szolgáltatója, a Dialog létrejöttének 30. évfordulóján Roger K. Summit összegezte, hogyan határozták meg a rendszer megtervezésének prioritásait 1966-ban. Nagy szerencsémre ezt a részt Roboz Péter is fontosnak tartotta kiemelni a TMT Hírek rovatában a 2002. 11–12. számban, így saját fordításom helyett az ő értő tolmácsolásában idézhetem:

  • „Parancsokkal legyen vezérelhető, úgy, hogy a szolgáltatást használója közvetlenül vehesse igénybe, számítógépi programozók nélkül. Ezek a használók a „közvetítők” (intermediaries).
  • Interaktív legyen, vagyis a kereső jeleníthesse meg a találatokat, és e közbenső eredmények szerint módosíthassa a keresőstratégiát.
  • Rekurzív legyen, vagyis a keresés mélységét, szélességét és pontosságát „menet közben” lehessen változtatni visszacsatolás útján, a keresőstratégia újbóli bevitele nélkül. Legyen mód a bonyolult keresés felbontására egyszerűbbekre.
  • Valamennyi keresőszó alfabetikus listája a kereső rendelkezésére álljon, hogy azokból válogathasson.”

(Eredeti forrása: The birth of online information access, dr. Roger K. Summit remembers how it all began. = Dialog Magazine, June 2002, p. 7., Idézi: Harmincéves a Dialog. = TMT, 2002/10–11. sz. 455.p.)

Bár ezek a követelmények 36 évvel korábbról származnak, nem lehetünk biztosak abban, hogy valamennyi mai adatbázisunk eleget tesz mindegyiknek.

A magyar Jacsó Péternek (a Hawaii Egyetem professzorának, akit ebben az évben választottak be az Internet könyvtárosok hírességek csarnokába (Internet LIBRARIAN Hall of Fame http://www.rlc. dcccd.edu/lrc/jacso.htm) több rovata közül az egyik Savvy searching címmmel az Online Information Review (korábban Online & CD-ROM Review) című folyóiratban jelent meg. Ennek cikkei közül kiválasztottam néhányat, amelyek legszorosabban kapcsolódnak témánkhoz, s megpróbáltam a cikkek referátumából kiválasztott, általam fontosnak tartott mondattal érzékeltetni tartalmukat.

  • A hozzáértő keresés a böngészéssel kezdődik (Savvy searching starts with browsing. In: Online & CD-ROM Review, vol. 23, no. 3. p. 169-172.)
  • „A hozzáértő keresők tudják, milyen fontos az, hogy a keresést az adatbázis indexlistájának böngészésével kezdjék, hogy meg tudják figyelni a keresőkifejezések különböző helyesírási változatait.”
  • A kihagyás hibái

(Errors of omission. In: Online & CD-ROM Review, vol. 23, no. 5, p. 285-287.)
„A hozzáértő információkereső nem feltétlenül hisz el mindent a tartalomszolgáltatóknak és adatbázis kiadóknak, akik azt ígérik, hogy a keresés számos szempont szerint szűkíthető, pl. nyelv, dokumentumtípus, a kiadás éve, a megjelenés helye (országa) stb.”

  • Az adatbázis frissessége

(Database currency. In: Online & CD-ROM Review, vol. 23, no. 6, p. 345-348.)
„A hozzáértő kereső tudja, hogy csak azért, mert az adatbázisok on-line módon elérhetőek, nem feltétlenül kurrensek, s nem feltétlenül aktualizálják őket olyan gyakran, mint ahogy azt az adatbázisok készítői reklámanyagukban megígérik.”

  • Hozzáértő keresés: pontosság

(Savvy searching: accuracy In: Online Information Review, vol. 24, no. 1, p. 90-93.)
„Arra a következtetésre jut, hogy hacsak a használók nem tiltakoznak elég hangosan, kevés a motiváció arra, hogy valami olyat nyújtsanak, ami megközelíti ezen adatbázisok professzionális minőségének minimális szintjét.”

(Már az előadás után sikerült hozzájutnom Jacsó Péter Content evaluation of textual CD-ROM and Web databases című, 2001-ben megjelent könyvéhez. Ha már korábban találkoztam volna vele, ezt idézem Rigában. A magyar adatbázisok készítőinek és használóinak is sokat jelenthetne, ha eredetiben vagy magyarul megismerkedhetnének vele. Addig a http://www.hawaii.edu/~jacso/ cím alatt többek között a könyvre alapozott tantárgy (LIS 694 Evaluating Digital Information Resources) anyagát érdemes tanulmányozni.

Mindaz, amit a hosszú évek kutatómunkájára alapozott, az elemzési szempontokat rendkívül sok gyakorlati példával illusztráló könyv alapján neves nemzetközi adatbázisokról megtudhatunk, némileg megértőbbé teszi az embert a magyar adatbázisok esetleges hibái iránt.)

A Data Base of National Bibliography Analytic és a PRESSDOK összehasonlítása

Az adatbázisok indexlistájában gyakran megtalálhatjuk a feldolgozott források, időszaki kiadványok hosszú listáját. De a rekordok száma nem egyenletesen oszlik meg, gyakran sok olyan periodikumot láthatunk, amelyből csak kevés tétel származik, míg néhány olyan cím van, amelyekhez nagyon sok rekord kapcsolódik. Megpróbáltam ellenőrizni, mennyire igaz ez a lett cikk adatbázisra (Data Base of National Bibliography Analytic) és a legnagyobb magyar adatbázisra, a PRESSDOKra. Az eredmények a 4–7. ábrákról olvashatók le.

4. ábra
A rekordok megoszlása a Data Base of National Bibliography Analytic adatbázisban
(latin betűs periodikumok, 2002 augusztus)

5. ábra
A rekordok megoszlása a Data Base of National Bibliography Analytic adatbázisban
(cirill betűs peridikumok, 2002 augusztus)

6. ábra
A rekordok megoszlása a PRESSDOK adatbázisban 1988 – 2002 I. félév
(a maximum 1000 rekorddal szereplő periodikumok)

7. ábra
A rekordok megoszlása a PRESSDOK adatbázisban 1988 – 2002 I. félév
(az összes rekord)

 

Ahogy a számok mutatják, a PRESSDOK olyan adatbázis, amely méretében és kurrensségében összehasonlítható a lett adatbázissal. CD-ROM-on évente kétszer jelenik meg, de 2002-re az első lemez már megjelent, s egész 2002. június 30-ig tartalmaz rekordokat. Ez a formátum férhető hozzá a legtöbb könyvtárban, de azok, akiknek arra van szükségük, havi aktualizálást is kérhetnek.

A lett adatbázisban elkülönítettem két csoportot, a latin és a cirill betűkkel írt periodikumokat. (Ha meg akarjuk tekinteni a feldolgozott időszaki kiadványok listáját, választanunk kell a két lehetőség közül.) Mindkét esetben néhány időszaki kiadvány adta a rekordoknak több mint felét, míg nagyon sok olyan időszaki kiadvány volt, amelyből csak kevés tétel származott. Feltételezésem szerint ez főleg amiatt van, mert az adatbázisban megtalálható a patriotika anyag is, így sok olyan külföldi időszaki kiadvány, amelyből csak egy vagy néhány, Lettországgal kapcsolatos tétel származott. Meglepő módon hasonló volt azonban a helyzet a PRESSDOK adatbázis esetében. Természetesen az időszaki kiadványok teljes listájával rendelkezem, de most a lett periodikumok közül csak azokat emelem ki, amelyekből több mint 1000 tétel került, a magyar periodikumok esetében ez a szám 10.000. (Ennek a különbségtételnek az az oka, hogy a lett adatbázis esetében csak a kurrens év anyagának ilyen szempontú vizsgálatára volt lehetőségem, míg a PRESSDOK egészét, több mint 10 évet vizsgálhattam.)

A 3. táblázaton a lett közönség számára jól ismert időszaki kiadványok, napilapok szerepeltek, a 4. táblázatban található magyarokról rövid magyarázatot kellett adni számukra.


3. táblázat
8 lett időszaki kiadvány, amelyből 1000-nél több rekord szerepel a Data Base of National Bibliography Analytic
adatbázisban, 2002 augusztus

4. táblázat
14 olyan periodikum, amelyből több mint 10.000 rekord került be a PRESSDOK adatbázisba 2002 I.

Megjegyzések:

1-4.: országos politikai napilap, 5-6.: gazdasági napila- pok, 7-9. és 11-12.: megszűnt napilapok , 10. és 13-14.: hetilapok.
Az 1-6. címhez 502.339 rekord kapcsolódik az adatbázis 772.754 rekordja közül, csaknem a rekordok kétharmad része, míg az 1-14., itt felsorolt címből 638.264 rekord származik, ami már több mint 80%.

Ezeket az eredményeket összehasonlíthatjuk más adatbázisokkal. A nemzeti bibliográfiai cikk-adatbázisban (IKER) ugyanaz a három napilap található a lista élén, mint a PRESSDOK-ban (Magyar Nemzet 4676, Népszabadság 4116, Magyar Hírlap 2472), a műszaki adatbázisokban (CIKK, MMR) azok a hetilapok, amelyekkel a PRESSDOK-nál is találkozhattunk: HVG (7866, 207), Figyelő (7550, 163). Ez arra utalhat, hogy átfedés van az adatbázi- sok forrásai között. A Szociológiai adatbázisban az a társadalomtudományi havi folyóirat van az élen (Valóság, 2386), amely egyedüliként található meg mind a 13 adatbázisban. Másik oldalról azonban azt láthatjuk, hogy a többi, adott szakterületre specializálódott adatbázisban az adott terület reprezentáns folyóiratát találhatjuk a lista élén: MAB: Magyar Mezőgazdaság 7490, Irodalmi adatbázis: Élet és Irodalom 2148, Műfordítás adatbázis: Nagyvilág 4024, Nemzetiségi adatbázis: az első a Magyar Hírlap, tehát egy országos politikai napilap 2542 rekorddal, de ezt a magyarországi nemzetiségek lapjai (Neue Zeitung, Ludové Noviny) a környező országok magyar nemzetiségeinek lapjai (Új Szó, Magyar Szó) követik. PAD: Köznevelés 5293, Iskolakultúra 1553, Tanító 1514, Új Pedagógiai Szemle 1266, Jogi adatbázis: Magyar Közigazgatás 1135, Magyar Jog 1058. Bár nincsenek pontos adataink a az orvosi adatbázisról (MOB) és a könyvtártudományi adatbázisról, biztosak lehetünk abban, hogy az Orvosi Hetilapból, illetve a Könyvtári Figyelőből és a Tudományos és Műszaki Tájékoztatásból származik a legtöbb rekord, éppúgy, mint a megfelelő nemzetközi adatbázisokban (MEDLINE, LISA).

Ha a lett adatbázist képesek lennénk az ETO főosztályai, osztályai szerint felosztani (a nyomtatott bibliográfiának ez a rendszere), biztosan meg lehetne találni az egyes szakterületek legfontosabb szakfolyóiratait, de számomra ez nem lenne könnyű feladat.

Míg a magyar adatbázisban átfedésekkel találkozhatunk (ez a jelenség sokkal részletesebb vizsgálatot igényel), ezért nem adhatjuk egyszerűen össze az egyes adatbázisokban található rekordokat, másrészt viszont nagyobb annak a veszélye is, hogy kimaradnak cikkek, egy egyesített adatbázis esetében ez könnyebben elkerülhető lenne. Feltételezhető az, hogy azok a szakterületek, amelyeknek van saját szakbibliográfiájuk, amely alapján még nem készült adatbázis, kisebb súllyal vannak reprezentálva a létező adatbázisokban. A korábbiakban szó volt már a Műfordítás adatbázisról, ennek segítségével tudhatjuk, milyen versek, elbeszélések stb. jelentek meg az időszaki kiadványokban magyarul a világirodalomból, ugyanakkor nincs arra lehetőség, hogy hasonló módon megtaláljuk a magyar verseket, elbeszéléseket. Hasonló módon problémák vannak a filmkritikákkal és a színházi előadások kritikáival is. Számomra csoda volt, hogy mindezeket együtt megtalálhattam egy bibliográfiában, a Latvijas Preses Hronika-ban. Az az anyag, ami a magyar adatbázisokban található (kivéve a napilapokat), sokkal tudományosabb, kevesebb tétel származik népszerű folyóiratokból, magazinokból. Így például a Cosmopolitannek van magyar változata is, de az ebből származó nem szerepelnek (s várhatólag nem is fognak szerepelni) egyetlen adatbázisban sem (a lett adatbázisban 40 tétel is megtalálható volt a lett változatból, azóta bizonyára már több is), vagy a lett Sievite-hez (magyarul: Nő) hasonló magyar lapokból sem sokat várhatunk.

Az adatbázisok néhány problémája

Emlékezzünk vissza Jacsó Péter szempontjaira: böngészés, kihagyás, aktualitás (kurrens közlés) pontosság.

A lett adatbázissal kezdem. Valamikor tavasszal vált lehetővé a böngészés (és a keresés) a forrás címe alapján. Feltehetőleg a használt szoftver korlátai miatt az a helyzet, hogy ha 50-nél több tétel származik egy lapból, a pontos szám helyett csak azt látjuk, hogy 50+, s ez a keresés elvégzését teszi szükségessé minden olyan esetben, ha tudni akarjuk a pontos számot. (Ugyanez érvényes az ugyancsak ALEPH alapú magyar mezőgazdasági adatbázisra, a MAB-ra is.) Ugyancsak ilyen korlát az, hogy a keresés során néha a Too many hits (túl sok találat) választ kapjuk. Megtudhatom, a Diena című napilapnak a 2001-ből származó tételeit (mivel a 2002-ben feldolgozott tételekre lehet keresni, ez kb. 2001 utolsó hetét jelenti), de nem a 2002-eseket, mert azok száma 5000-nél több lenne. (Ha nem csak az ezévi rekordok lennének elérhetőek, hanem a teljes adatbázis, gyakrabban kaphatnánk ezt a választ.) Másrészt ez nem feltétlenül lehet probléma egy valódi kereső számára, akinek mindenképpen le kellene szűkítenie keresését, csak azoknak, akik elemezni szeretnék az adatbázist.

Nem igazán sikerült kimaradt mezőket találnom az adatbázisban, néha inkább az lehet a probléma, hogy túlságosan sok adat kereshető. Például nemcsak arra kereshetünk, hogy az időszaki kiadványnak hányadik számáról van szó, hanem valamennyi számra, ami az adott mezőben szerepel. De az már a kurrensség kérdéséhez vezet át, hogy a 144. számként 2002. augusztus 28-án több rekord volt megtalálható a Dienas Bizness című napilap augusztus 27-i, tehát előző napi számából. Elképzelhető, hogy esetleg már a megjelenés napján megtalálható volt, de számomra az is csoda lett volna, ha a következő héten, Magyarországon a következő hónapban (egyes esetekben a következő évben) találhatnék meg valamit. Mivel a rekordok pontosságával kapcsolatban nem találtam semmilyen problémát, ha bármilyen további problémát akarok említeni, már a magyar adatbázisokkal kell foglalkoznom. (De nem fogok minden problémáról beszélni, részben az időkorlátok miatt, részben más okokból.)

Az egyik legnagyobb probléma az, hogy ezek az adatbázisok olyan sok különböző programot használnak. Először azonban essen szó egy pozitív példáról. A CD-ROM-on publikált adatbázisok közül az Országos Széchényi Könyvtár (MNB CD-ROM: cikkek, könyvek, periodikumok), az Országgyűlési Könyvtár (PRESSDOK, HUNDOK), a Fővárosi Szabó Ervin Könyvtár (irodalmi, szociológiai adatbázis) adatbázisai ugyanazt a szoftvert használja, az Arcanum Adatbázis (az egyik legfontosabb magyar CD-ROM kiadó) Arctis nevű programját. Ez azt jelenti, hogy a böngészés és a keresés módszerei azonosak mindezekben az adatbázisokban (de a böngészhető és kereshető mezők különbözőek). Bármely mező kombinálható bármelyikkel (és ismételhetőek is) bármely logikai és helyzeti operátort használva. Ha a böngészés során találunk valami érdekeset, azt könnyen beemelhetjük a keresőkérdésbe. A program nagyon gyors, még akkor is, ha több százezer rekord között keresünk. Így ez sokkal rugalmasabb program, mint amit pillanatnyilag a lett adatbázisok használnak.

Ugyanakkor azonban a Jogi adatbázis, amely egy jogszabályokat tartalmazó CD-ROM-on jelenik meg, olyan logikát kell követni használatakor, amely nagyon jó lehet azokra, de szokatlan egy bibliográfiai adatbázis esetében. A Pedagógiai adatbázis (PAD) CD-ROM változata olyan DOS-os szoftvert alkalmaz, amely elég nehezen használható (a képernyő kis részén látható, nagyon kis betűkkel, nem található meg rajta az összes mező, amely az internetes változaton kereshető). Az OPKM-mel ellentétben a OIK csak egyszer jelentette meg Műfordítás és Nemzetiségi adatbázisát CD-ROM-on egy másik DOS-os szoftverrel, de ennek már a telepítése is olyan nehézségekbe ütközik, hogy azóta ebben a formában nem publikálták. A CIKK adatbázist 1995-től éveken évente kétszer kiadták CD-ROM-on MicroIsisre alapozott változatban, de a teljes (már lezárt) adatbázis most az interneten érhető el.

Az internetes változatok közül elsőként az Országos Széchényi Könyvtár adatbázisait érdemes megemlíteni. A periodikumok és cikkek adatbázisa nagyon jól összekapcsolódik, ha csak egy cikket is feldolgoztak az adott időszaki kiadványból, a periodikumok adatbázisából egy kattintással átmehetünk a másik adatbázisba és megtalálhatjuk a cikkek adatait. Ugyanakkor azonban a böngészés és a keresés funkciója nem kapcsolódik össze olyan jól, mint a CD-ROM változat esetében, be kell gépelnünk a keresőkérdésbe, amit a böngészés során találtunk. A könyvtártudományi adatbázis, a MANCI csaknem ugyanazt a szoftvert használja, de az összes kereshető mező együtt, egy indexben böngészhető, a feldolgozott források szerinti böngészés és keresés pillanatnyilag még nem lehetséges.

Az alkalmazott tudományi adatbázisok mind különböző szoftvert használnak, a műszaki adatbázisok (a CIKK adatbázis, és utódja, az MMR) lehetővé teszik a böngészést és az (egyszerű és összetett) keresést, a mezőgazdasági adatbázis, a MAB, ahogy korábban említettem, ALEPH alapú, Telnet segítségével hozzáférhető, sok lehetőség van benne, de nagyon komplikált, gyakoriak technikai hibák. Az orvosi adatbázis, a MOB az OLIB-ot használja, egy sajátos logikát kell követni (amivel más OLIB-os adatbázisokban is találkozhatunk), a mezők nem kombinálhatóak szabadon, számos mező egyáltalán nem kereshető.

A pedagógiai adatbázis internetes változata egyáltalán nem teszi lehetővé a böngészést, ezért ajánlatos a CD-ROM változattal párhuzamosan használni, mivel mindkettőnek vannak előnyei és hátrányai. A Műfordítás és a Nemzetiségi adatbázis az Országos Idegennyelvű Könyvtár Webopacjának része, egy kisebb magyar cég által kifejlesztett szoftver használva. Néha jól működik, máskor viszont több alkalmunk van a hibaüzenetekkel ismerkedni, mint az adatbázis tartalmával.

Ha az adatbázisok ugyanazt a szoftvert használnák (CD-ROM-on a három említett könyvtár adatbázisai által is használt Arctis lehetne jó megoldás, az interneten az OSZK vagy a műszaki adatbázisok által alkalmazott), másik probléma lehetne, hogy az egyes adatbázisok tárgyszavazási gyakorlata annyira különbözik, hogy nehéz elképzelni, hogy az adatbázisok összeolvaszthatóak lennének.

A jövő?

Sajnos, valószínű, hogy az a gondolat, amit Vajda Erik említett tanulmányának címében szerepel – Időszaki kiadványok cikkeinek online adatbázisa kooperációs partnerek együttműködésével (megvalósíthatósági tanulmány) –, most kevésbé tűnik megvalósíthatónak, mint 8 évvel ezelőtt.

De a lett példa mutatja számunkra, hogy nem lehetetlen. Gratulálunk nekik, és köszönjük, hogy némi reményt adnak nekünk. Nagyon szeretném, ha valamikor lehetőségem lenne arra, hogy a lett adatbázist az annak megfelelő, egy magyar adatbázissal hasonlítsam össze. Akkor talán az előadásom is sokkal rövidebb lehetne. Addig jobb lenne, ha önök jönnének el hozzánk megmutatni példájukat.

A jövő után a jelenről, amely rövidesen múlttá válik

Az előző bekezdéssel zárult a rigai előadás. A legtöbb adatbázisról (szerencsére) csak egy pillanatnyi helyzetképet lehetett felvázolni, amely a 2002 augusztus végi állapotokat tükrözi. Ezeket az adatokat nem változtattam meg, mert akkor az előadást hamisítottam volna meg. Két hónap alatt, október végéig azonban sok változás történt a magyar adatbázisokkal kapcsolatban, amelyeket érdemes megemlíteni. Az össztételszám növekedése természetesen egyes lapok feldolgozottságát is növelte, de ennek részleteibe most nem megyünk bele.

Az IKER adatbázis újabb frissítése után jelentősen nőtt a 2001-es tételek száma, 2816-ról 4051-re, s megjelentek az első 2002-es tételek is (245). Végre megjelent a Fővárosi Szabó Ervin Könyvtár adatbázisainak újabb lemeze, mind az irodalmi, mind a szociológia adatbázis tételszáma jelentősen nőtt, az irodalmi a 2000-es anyag jelentős növelése mellett jelentős számban 2001-es és 2002-es cikkeket is felvett, a szociológiai a 2000-es és azt közvetlenül megelőző évek anyag mellett az 1970-1976 közötti időszakot egészítette ki jelentős mértékben. A nemzetiségi és műfordítás adatbázisban is folyamatosan nő a tételek száma, legjelentősebb mértékben a 2002-eseké (977-ről 2368-ra, 76-ról 362-re), a PAD adatbázisban esetében pedig azt lehet meglepetéssel tapasztalni, hogy a CD-ROM-on szereplő anyag sokkal frissebb, a sokkal több 2001-es mellett (901 az interneten, 3746 a CD-ROM-on) 877 2002 is található rajta (ezek többsége magyar cikk lehet). A jogi adatbázisban természetesen csak a 2002-es tételek száma nőtt.

Az alkalmazott tudományi adatbázisok közül a mezőgazdasági sajnos régóta nem érhető el, az orvosiban nem tudunk évre keresni, de azt tapasztalhatjuk, hogy egyes folyóiratok anyagát nagyon frissen feldolgozzák. Az MMR-ben a 2002-es tételek száma megduplázódott, a 4045 tételből 3553 folyóiratcikk. Ugyanakkor az 1028 2001-esből csak 326 az , így a CIKK adatbázissal együtt az erre az évre jutó cikkek száma alig haladja meg a 7000-et, s már nem is várható nagy növekedés, míg a megelőző években mindig 13000 fölött volt, kérdés, mitől volt rosszabb év ebből a szempontból 2001.

Közben persze a lettek sem tétlenkednek, de ezt nem könnyű nyomon követni, mert (szinte) naponta aktualizálják az adatbázist, a Diena tételeinek száma 6686-ról 9140-re nőtt, s hasonlóak az arányok a többi lap esetében is. S mire ezek az adatok megjelennek, már mindez múlttá válik. Reméljük, közben napról napra minden egyre jobbá válik.

Kategória: 2002. 3. szám | A közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!