39. évfolyam, 1993. 3. szám |
Archívum |
AZ ETO az Országos Széchényi Könyvtár számítógépes rendszerében
Zöldi Péter
1. Miért az ETO?
Az Országos Széchényi Könyvtárban (OSZK) alkalmazott
számítógépes rendszer, a DOBIS/LIBIS a használó számára a dokumentumokhoz való
korszerű hozzáférést biztosítja. Ennek eszközei a hozzáférési pontokat jelentő
adatok indexei, nevezetesen a név-, cím-, kiadói, tárgyszó, osztályozási stb.
indexek. A közvetlen tartalmi visszakeresésre a DOBIS/LIBIS-ben a két utóbbi
szolgál. A DOBIS/LIBIS OSZK-beli alkalmazásában, a NEKTÁR-ban (Nemzeti Könyvtári
Átfogó Információs Rendszer) a tárgyszó index nem teljes, eredeti értelmében
használatos, tartalmi-tárgyi visszakeresésre az osztályozási index maradt. Ennek
kialakításánál a DOBIS/LIBIS adaptálása során többféle lehetőség kínálkozott.
Elsősorban azt kellett eldönteni, hogy milyen információkereső nyelvet használjunk,
továbbá azt is, hogy hogyan szerveződjék az osztályozási index.
A választás az információkereső nyelv tekintetében végül is az ETO-ra esett.
Amellett, hogy az ETO Magyarországon még mindig alighanem a legelterjedtebb
osztályozási rendszer, a döntés indoklást igényel. Az ETO-t, kezdetben annak
Szabó Ervin nevéhez fűződő változatát az OSZK mintegy 60 éve használja. Három,
időhatárokhoz kötött szakkatalógus szolgálja az olvasókat: az 1800 előtt, az
1801-től 1944-ig és az 1945 után megjelent könyvek katalógusa. Összességükben
milliós nagyságrendű cédulaanyagot tartalmaznak. Egy további szempont az volt,
hogy az az adatbázis, amelyik a Magyar nemzeti bibliográfia. Könyvek bibliográfiájának
számítógépes előállítása kapcsán több mint 15 éven át épült, szintén ETO
jelzeteket tartalmaz. Remélhető a bibliográfiai és a NEKTÁR adatbázis egyesítése,
s ez elég súlyos érv az ETO mellett. Ha onnan közelítjük a problémát, hogy mivel
válthattuk volna fel az ETO-t, nyilván egy természetes nyelvre épülő visszakereső
nyelv jöhetett volna szóba. Tekintve azonban, hogy a kötelespéldányok révén
a feldolgozandó anyag nagyobbik része a tudományok és a gyakorlat irodalmának
teljes spektrumát tartalmazza, meg kellett volna birkózni egy általános tárgyszójegyzék
vagy tezaurusz problémájával. Mindent összevetve az a meggyőződés alakult ki,
hogy egy ilyen organizmusnál, mint az OSZK, egy gyökeres változás a használók
(a központi szolgáltatások használóit is beleértve) számára talán több hátránnyal,
mint előnnyel járt volna. Az ETO tehát maradt. Az adott helyzetben inkább arra
törekedtünk; hogy az osztályozási rendszer sajátosságait a számítógépes rendszer
lehetőségeivel összeegyeztetve próbáljunk előnyös változást elérni a tartalmi-tárgyi
visszakeresés tekintetében.
2. Az ETO a NEKTÁR osztályozási indexében
Közismert, hogy az ETO-nak (és minden hierarchikus
osztályozási rendszernek) hagyományos visszakereső rendszerben, katalógusban
való alkalmazása nehézkes. Ez abból a körülményből következik, hogy az osztályozási
rendszer több dimenziót képviselő struktúráját a katalógus, bibliográfia egydimenziós,
lineáris rendjébe kell kényszeríteni. Az ETO jellegzetessége, a közös alosztások
rendszere révén az eredendő pofihierarchia a gyakorlati alkalmazások során megsokszorozódik.
Hiába tesznek lehetővé a közös alosztások precízebb meghatározásokat, a katalógusban
megtestesülő végeredmény ahhoz hasonlítható, mint amikor egy kincstárba több
folyosó vezet, de azok egy kivételével (ld. főtáblázati szám) el vannak falazva.
Először is ezeknek a befalazott bejáratoknak a kibontására tettünk kísérletet
azzal, hogy megpróbáltuk a jelzeteket visszakereshetővé tenni nemcsak a főtáblázati
számok felől, mint a hagyományos katalógusokban általában, hanem az alosztások
felől is. Azt a lehetőséget használtuk ki, hogy a DOBIS/LIBIS egyes indexei
az adat elemeit permutálva tartalmazzák. A permutált index formailag olyan,
mint egy KWIC index. A címindex pl. ezt a permutációt elvégzi a cím minden szavára
(bizonyos szavak kivételével). Az összetett jelzeteket tehát az alosztásoknál
szóközökkel szavakra bontottuk és permutáltattuk. Egy összetett jelzet permutációja
pl. így alakul:
73: 72 .04 .035.5 (439 -2 Bp.)
73: 72 .04 .035.5 (439 -2 Bp.)
73: 72 .04 .035.5 (439 -2 8p.)
73: 72 .04 .035.5 (439 -2 Bp.)
73: 72 .04 .035.5 (439 -2 Bp.)
73: 72 .04 .035.5 (439 -2 Bp.)
A Budapest eklektikus épületszobrászatát jelentő
jelzet tehát visszakereshető a -2 (helységek), (439 (Magyarország), .035.5 (eklekticizmus),
.04 (ornamentika), 72 (építészet), 73 (szobrászat), Bp.= Budapest "szavak" felől
is. (A példában túlzottnak tűnő analitikus elemek értelmét a később ismertetendő
keresési technikák adják meg.)
Ami a besorolást illeti, a NEKTÁR osztályozási indexében a permutációs tengelytől
kezdve a számok rendezése megfelel az ETO szokásos rendjének. Mivel a rendezést
vezérlő ETO számok felépítésükkel a tartalmi, generikus vagy kvázigenerikus
összefüggéseket reprezentálják, ezek az összefüggések az index rendjében is
megmutatkoznak. Kivételt képez az index azon része, ahol a pont nullás és kötőjeles
korlátozottan közös alosztások sorakoznak. Ezek lényegüknél fogva az azonos,
vagy hasonló alak ellenére különböző jelentést hordozhatnak, olyanok, mint a
természetes nyelvi szavak közt a homonimák. (A példából egyébként látható, hogy
a nem alfanumerikus karakterek sorrendje eltér az ETO-beli szabványos rendtől.)
3. Többdimenziós keresés
A NEKTÁR-ban megvalósítható többdimenziós keresés
bemutatására röviden ismertetni kell a keresés technikáját a rendszerben.
A kereső a permutációs tengelytől jobbra kezdődő jelzetrésznél léphet be az
indexbe egy keresőszóval. A képernyőn az index 14 soros részlete jelenik meg
(ld.. a túloldalon az 1. ábrát), a 2. sorban a keresőszóval. Képernyőnként
előre-hátra lapozgatva "böngészhetünk".
A dokumentumok (illetve a leírások) a megfelelő baloldali sorszám beírásával
választhatók ki és jeleníthetők meg. Az egyes találathalmazok eltárolhatók,
és azokon logikai műveletek ("vagy", "és", "de nem") végezhetők. (A keresés
hatékonyságát növeli egyébként, hogy az összes indexben végzett keresések találathalmazai
kombinálhatók egymással, illetve szűkíthetők pl. megjelenési év stb. szerint.)
A lapozgatással tehát egy összefüggő ismeretmezőn mozgunk, de az indextételek
lineáris rendje miatt olymódon, mint egy hagyományos katalógusban. A többdimenziós
keresésre azáltal nyílik lehetőség, hogy nemcsak egy indexsor kiválasztásával,
vagyis prekoordinált jelzetek alapján képezhetünk és tárolhatunk találathalmazokat,
hanem a jelzet bármely permutált elemének ún. csonkolásos megadásával amikor
is a találathalmazba bekerül minden, az adott keresőszóval kezdődő jelzetet,
jelzetelemet tartalmazó, tehát egy hierarchia szint alá tartozó dokumentum.
A csonkolt szavak rövidítésével vagy meghosszabbításával közlekedhetünk a keresésben
a hierarchiai szintek között. (A logikai műveletek mellett ez is egy módja a
találathalmaz szűkítésének, illetve bővítésének.) Látható, hogy ily módon a
főtáblázati számokkal, illetve alosztásokkal keresve, olyan találati halmazokat
hozhatunk létre, amelyek a dokumentumállomány sajátos szempontú metszeteit
nyújtják. Hangsúlyozni szeretném, hogy voltaképpen nemcsak az alosztások,
de a főtáblázati számok ETO-beli hierarchia szintjei is egy-egy metszetet képviselnek.
A metszetek szerinti keresések révén egy fazettás osztályozási rendszemek az
ETO-ban korlátozottan ugyan, de benne rejlő lehetőségei érvényesülnek. A többdimenziós
keresés végső soron a metszetek szerint kapott találathalmazokon végzett logikai
műveletek révén valósul meg.
4. Betűrendes mutató
Minden mesterséges információkereső nyelv,
így az ETO használatának is kellemetlen velejárója, hogy "szótár",
táblázatok nélkül még csak megérteni sem lehet. E szótár elengedhetetlen része
a természetes nyelv felőli megközelítést biztosító betűrendes mutató. A NEKTÁR
osztályozási indexe a betűrendes mutatót is tartalmazza. (ld. 2. ábra)
Ez a mutató úgy készül, hogy az osztályozás sarán használt táblázati
elemeket (főtáblázati számokat, alosztásokat) az első előforduláskor önálló
indextételként a meghatározás szövegével együtt beírjuk az indexbe. (Az indextételhez
utaló és megjegyzés kapcsolható.) A tételt a rendszer szabályosan permutálja,
természetesen önálló szónak tekintve magát az ETO számot és a meghatározás szavait.
Pl. a 001.89 tudományszervezés, tudományos kutatás az indexben a következő
helyeken található:
zés tudományos ományszervezés 001.89 |
001. 89 tudományszervezeés tudományos kutatás
kutatás tudományos kutatás tudományszervezés tudományos kutatás |
Nemritkán összetett jelzet is bekerül meghatározással az indexbe, ha fontos
önálló fogalmat jelöl, vagy jelentése megegyezésen alapul, pl. 316.63: 316.347
(=00) nemzetiségi identitás tudata. A szöveg megfogalmazásánál igyekszünk tömör,
tárgyszószerű alakot alkotni (nem föltétlenül követve az ETO kiadások betűrendes
mutatóinak gyakorlatát). Ezen túlmenően is megfogalmaztunk bizonyos szabályokat.
A több szóból álló nyelvi szerkezetből pl. letiltjuk - a kötőszavakon, névelőkön,
névutókon túl - azon szavak permutálását, amelyek 1. önmagukban; pl. jelző nélkül
nem relevánsak, illetve többértelműek (pl. politikai mozgalom); 2. szisztematizálást
eredményeznének a természetes nyelvi szavak között, pl. családi erkölcs,
foglalkozási erkölcs, közösség és erkölcs, hiszen a 17 erkölcs
alatt megtalálható a szisztematikus részben az erkölcs minden vonatkozása. Ezzel
szemben, ha a szerkezetben lévő szó olyan fogalmakat, dolgokat stb. "szisztematizálna",
amelyek az ETO-ban nem egy szám alatt, egy hierarchiában vannak, akkor permutálni
kell, pl. téli napforduló ünnepei 398.332.41, szentek ünnepei 264-045.
Meg kell jegyezni, hogy a permutáció megakadályozására szóköz kitöltő karaktert,
az aláhúzás karakterét alkalmaztuk, ez viszont néhány esetben befolyásolja a
szószerkezetek rendezését.
Az osztályozási index betűrendes része közvetlenül nem használható dokumentumok
kiválasztására: az ilyen indextételhez sohasem tartozik dokumentum. Arra szolgálnak,
hogy a használó megtalálja a számára kézenfekvő természetes nyelvi kifejezéshez
tartozó ETO jelzeteket, jelzetelemeket, amelyekből összeszerkeszthető a tulajdonképpeni
keresőprofil.
A betűrendes mutatónak egy mellékes hozadékára is gondoltunk: a kötelespéldány
anyag feldolgozása következtében bizonyos idő múlva a valóságos könyvtermés
által "kiválasztott" szóanyag gyűlik össze (és szisztematizálódik),
amely talán felhasználható lesz a tervezett általános tárgyszójegyzék vagy tezaurusz
összeállításánál.
Az OSZK számítógépes rendszerére kíváncsi olvasó bizonyára nem kapott elég tájékoztatást
ebből az írásból. A cikk célja azonban inkább az volt, hogy hívja fel a figyelmet
az ETO-ban rejlő lehetőségekre. Ezeknek a kibontására most talán több mód kínálkozik,
mint eddig gondoltuk. Az általunk alkalmazott eljárás ugyanis nincs a DOBIS/LIBIS-hez
kötve. Lényegében ugyanez megvalósítható pl. az ISIS szavas indexelési technikájával
és keresési módszereivel. Hogy érdemes-e ezen az úton továbbmenni, arra a felhalmozódó
tapasztalatok és az elvégzendő hatékonysági vizsgálatok adhatnak választ.
Országos Széchényi Könyvtár Észrevételek (2000/04/12) |