AZ ETO az Országos Széchényi Könyvtár számítógépes rendszerében

39. évfolyam, 1993. 3. szám

Zöldi Péter

1. Miért az ETO?

Az Országos Széchényi Könyvtárban (OSZK) alkalmazott számítógépes rendszer, a DOBIS/LIBIS a használó számára a dokumentumokhoz való korszerű hozzáférést biztosítja. Ennek eszközei a hozzáférési pontokat jelentő adatok indexei, nevezetesen a név-, cím-, kiadói, tárgyszó, osztályozási stb. indexek. A közvetlen tartalmi visszakeresésre a DOBIS/LIBIS-ben a két utóbbi szolgál. A DOBIS/LIBIS OSZK-beli alkalmazásában, a NEKTÁR-ban (Nemzeti Könyvtári Átfogó Információs Rendszer) a tárgyszó index nem teljes, eredeti értelmében használatos, tartalmi-tárgyi visszakeresésre az osztályozási index maradt. Ennek kialakításánál a DOBIS/LIBIS adaptálása során többféle lehetőség kínálkozott. Elsősorban azt kellett eldönteni, hogy milyen információkereső nyelvet használjunk, továbbá azt is, hogy hogyan szerveződjék az osztályozási index.
A választás az információkereső nyelv tekintetében végül is az ETO-ra esett. Amellett, hogy az ETO Magyarországon még mindig alighanem a legelterjedtebb osztályozási rendszer, a döntés indoklást igényel. Az ETO-t, kezdetben annak Szabó Ervin nevéhez fűződő változatát az OSZK mintegy 60 éve használja. Három, időhatárokhoz kötött szakkatalógus szolgálja az olvasókat: az 1800 előtt, az 1801-től 1944-ig és az 1945 után megjelent könyvek katalógusa. Összességükben milliós nagyságrendű cédulaanyagot tartalmaznak. Egy további szempont az volt, hogy az az adatbázis, amelyik a Magyar nemzeti bibliográfia. Könyvek bibliográfiájának számítógépes előállítása kapcsán több mint 15 éven át épült, szintén ETO jelzeteket tartalmaz. Remélhető a bibliográfiai és a NEKTÁR adatbázis egyesítése, s ez elég súlyos érv az ETO mellett. Ha onnan közelítjük a problémát, hogy mivel válthattuk volna fel az ETO-t, nyilván egy természetes nyelvre épülő visszakereső nyelv jöhetett volna szóba. Tekintve azonban, hogy a kötelespéldányok révén a feldolgozandó anyag nagyobbik része a tudományok és a gyakorlat irodalmának teljes spektrumát tartalmazza, meg kellett volna birkózni egy általános tárgyszójegyzék vagy tezaurusz problémájával. Mindent összevetve az a meggyőződés alakult ki, hogy egy ilyen organizmusnál, mint az OSZK, egy gyökeres változás a használók (a központi szolgáltatások használóit is beleértve) számára talán több hátránnyal, mint előnnyel járt volna. Az ETO tehát maradt. Az adott helyzetben inkább arra törekedtünk; hogy az osztályozási rendszer sajátosságait a számítógépes rendszer lehetőségeivel összeegyeztetve próbáljunk előnyös változást elérni a tartalmi-tárgyi visszakeresés tekintetében.

2. Az ETO a NEKTÁR osztályozási indexében

Közismert, hogy az ETO-nak (és minden hierarchikus osztályozási rendszernek) hagyományos visszakereső rendszerben, katalógusban való alkalmazása nehézkes. Ez abból a körülményből következik, hogy az osztályozási rendszer több dimenziót képviselő struktúráját a katalógus, bibliográfia egydimenziós, lineáris rendjébe kell kényszeríteni. Az ETO jellegzetessége, a közös alosztások rendszere révén az eredendő pofihierarchia a gyakorlati alkalmazások során megsokszorozódik. Hiába tesznek lehetővé a közös alosztások precízebb meghatározásokat, a katalógusban megtestesülő végeredmény ahhoz hasonlítható, mint amikor egy kincstárba több folyosó vezet, de azok egy kivételével (ld. főtáblázati szám) el vannak falazva.
Először is ezeknek a befalazott bejáratoknak a kibontására tettünk kísérletet azzal, hogy megpróbáltuk a jelzeteket visszakereshetővé tenni nemcsak a főtáblázati számok felől, mint a hagyományos katalógusokban általában, hanem az alosztások felől is. Azt a lehetőséget használtuk ki, hogy a DOBIS/LIBIS egyes indexei az adat elemeit permutálva tartalmazzák. A permutált index formailag olyan, mint egy KWIC index. A címindex pl. ezt a permutációt elvégzi a cím minden szavára (bizonyos szavak kivételével). Az összetett jelzeteket tehát az alosztásoknál szóközökkel szavakra bontottuk és permutáltattuk. Egy összetett jelzet permutációja pl. így alakul:

73: 72 .04 .035.5 (439 -2 Bp.)

73: 72 .04 .035.5 (439 -2 8p.)

73: 72 .04 .035.5 (439 -2 Bp.)

A Budapest eklektikus épületszobrászatát jelentő jelzet tehát visszakereshető a -2 (helységek), (439 (Magyarország), .035.5 (eklekticizmus), .04 (ornamentika), 72 (építészet), 73 (szobrászat), Bp.= Budapest "szavak" felől is. (A példában túlzottnak tűnő analitikus elemek értelmét a később ismertetendő keresési technikák adják meg.)
Ami a besorolást illeti, a NEKTÁR osztályozási indexében a permutációs tengelytől kezdve a számok rendezése megfelel az ETO szokásos rendjének. Mivel a rendezést vezérlő ETO számok felépítésükkel a tartalmi, generikus vagy kvázigenerikus összefüggéseket reprezentálják, ezek az összefüggések az index rendjében is megmutatkoznak. Kivételt képez az index azon része, ahol a pont nullás és kötőjeles korlátozottan közös alosztások sorakoznak. Ezek lényegüknél fogva az azonos, vagy hasonló alak ellenére különböző jelentést hordozhatnak, olyanok, mint a természetes nyelvi szavak közt a homonimák. (A példából egyébként látható, hogy a nem alfanumerikus karakterek sorrendje eltér az ETO-beli szabványos rendtől.)

3. Többdimenziós keresés

A NEKTÁR-ban megvalósítható többdimenziós keresés bemutatására röviden ismertetni kell a keresés technikáját a rendszerben.
A kereső a permutációs tengelytől jobbra kezdődő jelzetrésznél léphet be az indexbe egy keresőszóval. A képernyőn az index 14 soros részlete jelenik meg (ld.. a túloldalon az 1. ábrát), a 2. sorban a keresőszóval. Képernyőnként előre-hátra lapozgatva "böngészhetünk".
A dokumentumok (illetve a leírások) a megfelelő baloldali sorszám beírásával választhatók ki és jeleníthetők meg. Az egyes találathalmazok eltárolhatók, és azokon logikai műveletek ("vagy", "és", "de nem") végezhetők. (A keresés hatékonyságát növeli egyébként, hogy az összes indexben végzett keresések találathalmazai kombinálhatók egymással, illetve szűkíthetők pl. megjelenési év stb. szerint.)
A lapozgatással tehát egy összefüggő ismeretmezőn mozgunk, de az indextételek lineáris rendje miatt olymódon, mint egy hagyományos katalógusban. A többdimenziós keresésre azáltal nyílik lehetőség, hogy nemcsak egy indexsor kiválasztásával, vagyis prekoordinált jelzetek alapján képezhetünk és tárolhatunk találathalmazokat, hanem a jelzet bármely permutált elemének ún. csonkolásos megadásával amikor is a találathalmazba bekerül minden, az adott keresőszóval kezdődő jelzetet, jelzetelemet tartalmazó, tehát egy hierarchia szint alá tartozó dokumentum.
A csonkolt szavak rövidítésével vagy meghosszabbításával közlekedhetünk a keresésben a hierarchiai szintek között. (A logikai műveletek mellett ez is egy módja a találathalmaz szűkítésének, illetve bővítésének.) Látható, hogy ily módon a főtáblázati számokkal, illetve alosztásokkal keresve, olyan találati halmazokat hozhatunk létre, amelyek a dokumentumállomány sajátos szempontú metszeteit nyújtják. Hangsúlyozni szeretném, hogy voltaképpen nemcsak az alosztások, de a főtáblázati számok ETO-beli hierarchia szintjei is egy-egy metszetet képviselnek. A metszetek szerinti keresések révén egy fazettás osztályozási rendszemek az ETO-ban korlátozottan ugyan, de benne rejlő lehetőségei érvényesülnek. A többdimenziós keresés végső soron a metszetek szerint kapott találathalmazokon végzett logikai műveletek révén valósul meg.

4. Betűrendes mutató

Minden mesterséges információkereső nyelv, így az ETO használatának is kellemetlen velejárója, hogy "szótár", táblázatok nélkül még csak megérteni sem lehet. E szótár elengedhetetlen része a természetes nyelv felőli megközelítést biztosító betűrendes mutató. A NEKTÁR osztályozási indexe a betűrendes mutatót is tartalmazza. (ld. 2. ábra)
Ez a mutató úgy készül, hogy az osztályozás sarán használt táblázati elemeket (főtáblázati számokat, alosztásokat) az első előforduláskor önálló indextételként a meghatározás szövegével együtt beírjuk az indexbe. (Az indextételhez utaló és megjegyzés kapcsolható.) A tételt a rendszer szabályosan permutálja, természetesen önálló szónak tekintve magát az ETO számot és a meghatározás szavait. Pl. a 001.89 tudományszervezés, tudományos kutatás az indexben a következő helyeken található:

zés tudományos
ományszervezés
001.89

001. 89 tudományszervezeés tudományos kutatás
kutatás
tudományos kutatás
tudományszervezés tudományos kutatás

Nemritkán összetett jelzet is bekerül meghatározással az indexbe, ha fontos önálló fogalmat jelöl, vagy jelentése megegyezésen alapul, pl. 316.63: 316.347 (=00) nemzetiségi identitás tudata. A szöveg megfogalmazásánál igyekszünk tömör, tárgyszószerű alakot alkotni (nem föltétlenül követve az ETO kiadások betűrendes mutatóinak gyakorlatát). Ezen túlmenően is megfogalmaztunk bizonyos szabályokat. A több szóból álló nyelvi szerkezetből pl. letiltjuk - a kötőszavakon, névelőkön, névutókon túl - azon szavak permutálását, amelyek 1. önmagukban; pl. jelző nélkül nem relevánsak, illetve többértelműek (pl. politikai mozgalom); 2. szisztematizálást eredményeznének a természetes nyelvi szavak között, pl. családi erkölcs, foglalkozási erkölcs, közösség és erkölcs, hiszen a 17 erkölcs alatt megtalálható a szisztematikus részben az erkölcs minden vonatkozása. Ezzel szemben, ha a szerkezetben lévő szó olyan fogalmakat, dolgokat stb. "szisztematizálna", amelyek az ETO-ban nem egy szám alatt, egy hierarchiában vannak, akkor permutálni kell, pl. téli napforduló ünnepei 398.332.41, szentek ünnepei 264-045. Meg kell jegyezni, hogy a permutáció megakadályozására szóköz kitöltő karaktert, az aláhúzás karakterét alkalmaztuk, ez viszont néhány esetben befolyásolja a szószerkezetek rendezését.
Az osztályozási index betűrendes része közvetlenül nem használható dokumentumok kiválasztására: az ilyen indextételhez sohasem tartozik dokumentum. Arra szolgálnak, hogy a használó megtalálja a számára kézenfekvő természetes nyelvi kifejezéshez tartozó ETO jelzeteket, jelzetelemeket, amelyekből összeszerkeszthető a tulajdonképpeni keresőprofil.
A betűrendes mutatónak egy mellékes hozadékára is gondoltunk: a kötelespéldány anyag feldolgozása következtében bizonyos idő múlva a valóságos könyvtermés által "kiválasztott" szóanyag gyűlik össze (és szisztematizálódik), amely talán felhasználható lesz a tervezett általános tárgyszójegyzék vagy tezaurusz összeállításánál.
Az OSZK számítógépes rendszerére kíváncsi olvasó bizonyára nem kapott elég tájékoztatást ebből az írásból. A cikk célja azonban inkább az volt, hogy hívja fel a figyelmet az ETO-ban rejlő lehetőségekre. Ezeknek a kibontására most talán több mód kínálkozik, mint eddig gondoltuk. Az általunk alkalmazott eljárás ugyanis nincs a DOBIS/LIBIS-hez kötve. Lényegében ugyanez megvalósítható pl. az ISIS szavas indexelési technikájával és keresési módszereivel. Hogy érdemes-e ezen az úton továbbmenni, arra a felhalmozódó tapasztalatok és az elvégzendő hatékonysági vizsgálatok adhatnak választ.

Országos Széchényi Könyvtár
Észrevételek (2000/04/12)