38. évfolyam, 1992. 1. szám
Archívum

A tárgyi besorolási adatok egységesítése egy online cikk-katalógusban és a nyomtatott változatok tárgyszóindexeiben

Tar Katalin - Novák István

1. Bevezetés

Az olvasói online katalógusok közel tízéves fennállásuk során a használati kényelem, a használói barátságosság tekintetében kétségtelenül sokat fejlődtek, ezt azonban elsősorban az információtechnológia fejlődése váltotta ki, s nem a tartalmi feltárás hatékonyabb intellektuális megoldásai eredményezték. Ezért van, hogy ami a tárgy szerinti keresést, a tárgyi hozzáférést illeti, az online katalógusok szépsége és dicsősége pillanatok alatt összeomlik.
1987-88-ban a brit egyetemi és közművelődési könyvtárak online katalógusainak felmérése során például a következők derültek ki. A 73 online katalógus közül az egyetemi könyvtárak katalógusainak (47) csak kétharmada, a közművelődésieknek pedig csak a fele nyújtott lehetőséget a tárgy szerinti keresésre. Ez a legtöbb (56) esetben osztályozási jelzet szerinti keresés volt, ami azt jelenti, hogy ha a jelzet nem ismert, akkor egy különálló betűrendes tárgyszójegyzéket kell átnézni a megfelelő kód kiválasztására. A felmérés szerint a legtöbb OPAC a szabad szöveges keresésre épít: a leggyakrabban a címmező kulcsszavaira lehet keresni. Tárgyszavak szerinti keresési lehetőséget 26 online katalógus nyújtott, de ezek közül csak néhány rendelkezett online elérhető tárgyszójegyzékkel, és egyetlen vizsgált OPAC sem kínált online tezauruszhasználatot.1
A Manchester Polytechnic az online katalógusokban való tárgyi keresés problémáinak megállapítására végzett kutatást, önként jelentkező egyetemi hallgatók bevonásával.2 A hallgatók kereséseit floppy lemezre rögzítették, majd ezeket elemezve kiderült, hogy a problémák egy jelentős része abból adódott, hogy a résztvevők nem tudták, hogy témájukkal kapcsolatban mit írjanak be keresőkifejezésként, kulcsszóként, mert ehhez a rendszer semmilyen segítséget nem nyújtott.
Hasonló módszerrel, a hallgatók keresési viselkedésének elemzésével vizsgálták a North Carolina State University online katalógusában való keresések problémáit is.3 Ami a tárgyi keresést illeti, itt a használóknak a Library of Congress tárgyszójegyzéke alapján kellett, illetve kellett volna a megfelelő tárgyszavakat begépelni. A vizsgált 3707 keresésből 2008 végződött kudarccal (54,25%), azaz 0 találattal, s ezek közül a legtöbbet (29,2%) a nem megfelelő deszkriptorok használata eredményezte.
A. J. Wood, az említett 1987-es brit felmérés készítője megjegyzi, hogy amíg az online katalógusokban való tárgyi keresés ilyen korlátozott lehetőségeket kínál, addig nem csoda, ha a legtöbb próbálkozás ismert művek kikeresésére irányul.

***

Korábbi cikkeinkben beszámoltunk a KMK Könyvtártudományi szakkönyvtárának MANCI nevű online cikk-katalógusáról4, és ismertettük, hogy hogyan készítjük el az adatbázis alapján a nyomtatott referálólapokat és ezek mutatóit5. A fejlesztés következő szakaszának célja az volt, hogy mind az online, mind a nyomtatott változatokban növeljük a tárgyi keresés hatékonyságát, biztosítva emellett természetesen a használati kényelmet, barátságosságot is. A megoldás kulcsa mindkét esetben a szakkönyvtárunkban már 15 éve használt és karbantartott könyvtártudományi tezaurusz, amelynek gépre vitelével a következő célok megvalósítása került elérhető közelségbe:

Mivel cikkünk témáját csak az első két pont érinti, a következőkben csak ezekkel foglalkozunk.

2. Online tezaurusz

Tezauruszunk gépre vitelének ötletét az adta, hogy nem sokkal a Micro-ISIS 2.3 változatának bevezetése után felfedeztük, hogy az alap ISIS-hez mellékelt ISIS-PASCAL mintaprogramok között egy tezauruszkezelő program is van. Ezt megvizsgálva kiderült, hogy a program a szakirodalomból ismert, kereskedelmi forgalomban lévő tezauruszkezelő szoftverekhez képest igen primitív ugyan, de az alapvető tezauruszkezelési funkciókat tartalmazza. Így a tezaurusz invertált fájljában (indexében) böngészve bármelyik keresőelemet kiválaszthatjuk, amire megjelenik az illető kifejezéshez tartozó deszkriptorcikk. Ekkor mód van új relációk hozzáadására, meglévő relációk törlésére, a deszkriptorcikk bármelyik tagjának keresőkifejezéskénti kijelölésére, megjelenítésére, majd - a programból kilépve - a kiválasztott keresőkifejezés(ek) keresőkérdéssé szerkesztésére és a keresésnek a kiindulási adatbázisban való végrehajtására. Az új relációk hozzáadása, illetve törlése nyomán a program automatikusan elvégzi a folyamatok inverzét, tehát pl. egy tágabb kifejezés hozzáadása után a megfelelő szűkebbet, szűkebbnél a tágabbat, rokonnál a rokont beírja a megfelelő helyre.
A szóban lévő THES nevű program egy THES nevű adatbázis meglétét feltételezi, amelynek a következő mezőit képes kezelni:

Mindezek ismeretében úgy döntöttünk, hogy a THES adatbázis definícióit és a programot felhasználjuk saját tezauruszunk építésére és kezelésére, majd - a program csekély mértékű átírásával - alkalmassá tesszük olvasói használatra is.
E cél érdekében eredeti tezauruszunkat át kellett alakítani, mert kezdetben elődeink a relációkat az akkori informatikai divatnak megfelelően nem csupán tágabb, szűkebb és rokon fogalmakként határozták meg, hanem a tágabb kifejezések EGÉSZ és NEM (genus), a szűkebbek pedig RÉSZ és FAJ (species) fogalmakként szerepeltek. Mivel a használat szempontjából e tudományos-elméleti megkülönböztetésnek nincs értelme (az olvasót nem érdekli, hogy egy keresett szűkebb fogalom rész- vagy fajfogalma-e a vonatkozó tágabb kifejezésnek), ezen kívül a deszkriptorcikkek áttekinthetőségét is rontja, nem volt nehéz lemondanunk ezekről a nemzetközi tezauruszkészítési gyakorlatban ismeretlen relációkról. Az említett kétféle szűkebb és tágabb deszkriptorokat ezért összevontuk, majd - saját szükségleteinknek megfelelően - kiegészítettük az eredeti THES adatbázis definícióit. Ez abból állt, hogy néhány plusz mezőt definiáltunk: a deszkriptorok betűrendi kódja (erre hivatkozunk a betűrendes mutatóban), a szakjelzet és a deszkriptor használatba vételének dátuma számára, majd ennek megfelelően módosítottuk az adatbeviteli űrlapot, az FST-t és a megjelenítési formátumot. Ezután megkezdődhetett az adatbázis feltöltése.
A THES nevű tezauruszkezelő programban a következő főbb változtatásokat hajtottuk végre:

Tekintsük át egy egyszerű példán, hogy az online tezauruszhasználat mit nyújt az olvasók számára! Tegyük fel, hogy használónkat a közművelődési könyvtárak építése, berendezése érdekli. A keresési menüben a Z (Tezaurusz) billentyűt lenyomva megjelenik a program kiindulási képernyője, ahol az olvasó beírhatja a keresőelemet, vagy annak részét. Nem tudva, hogy az általános építési kérdésekre használt deszkriptor nálunk a "Könyvtárépítés, berendezés", beírja az "építés" szót, mire a képernyőn e betűrendi ponttól kezdődően megjelenik a tezaurusz indexe (1 ábra).
Kiválasztva az első, a kérdéséhez közel álló "Építési program"-ot, az S billentyűt lenyomva megjelenik a vonatkozó deszkriptorcikk (2 ábra). Itt megjegyezzük, hogy a reláció-rövidítések (H - nem-deszkriptor, F - tágabb, A - szűkebb, X - rokon) az MSZ 3418-87 "Magyar nyelvű információkereső tezauruszok szerkezete, részei és formái" c. szabvány 3.5 pontja szerinti betűjelek. A kiválasztott deszkriptorcikk rávezeti a használót, hogy az "Építési program" helyett a használandó deszkriptor az "Építési terv", és tágabb kifejezésként rendelkezésre áll még a "Könyvtárépítés, berendezés" és - például - rokonként a "Berendezés". Ezeket a Q-val keresőkifejezésekké minősítheti, aminek nyomán a program VAGY (+) kapcsolattal összekötve megőrzi őket.
Ezután az olvasó rátérhet a kérdés második részére. A T opcióval beírhatja például a "Közkönyvtár" terminust, amire a deszkriptorcikkből egyrészt kiderül, hogy nem ezt, hanem a "Közművelődési könyvtár"-t kell használnia, másrészt érdemes szűkebb fogalmakat is (Városi könyvtár, Megyei könyvtár stb.) kijelölni. X-el kilépve, a képernyőn +-al összekötve megjelenik az összes, keresésre kijelölt kifejezés:

Építési terv + Könyvtárépítés, berendezés + Berendezés + Közművelődési könyvtár + Városi könyvtár + Megyei könyvtár

A keresőkérdés most megszerkeszthető (az építéshez, illetve a közkönyvtárhoz tartozó deszkriptorokat zárójelek közé tesszük, és a közöttük lévő VAGY kapcsolatot ÉS-re (*) módosítjuk), és az ENTER leütésével a keresés a MANCI-ban végrehajtható.

3. Utalókészítési program

A MANCI alapján két negyedéves nyomtatott kiadvány: egy bibliográfia, illetve egy referálólap készül, az egyik a magyar (Magyar Könyvtári Szakirodalom Bibliográfiája, MAKSZAB), a másik pedig a külföldi szakirodalmat tárja fel (ez utóbbi 1991-tól a Könyvtári Figyelő egyik rovataként jelenik meg). Mindkettő tárgyszóindexe a MicroISIS-ben definiált nyomtatási, illetve rendezési űrlapok segítségével készül. A végtermék egy nyers mutató, amelyet a Word 5.0, illetve a Ventura Publisher szoftverek használatával alakítunk nyomdakész indexszé, úgy, hogy előzőleg a megfelelő betűrendi helyekre begépeljük a szükséges lásd és lásd még utalókat. Tezauruszunk géprevitelével elérhető közelségbe került az utalók automatikus előállítása is, hiszen a THES adatbázisban mindkét típusú utalók jelen vannak (a lásd-ok a nem-deszkriptorok, a lásd még-ek pedig a tágabb, szűkebb és rokon fogalmak közül kerülnek ki), ezért egy utalólista készítése és ennek összefésülése a tárgyszóindexszel - némi programozással - megvalósíthatónak látszott.
Mindenekelőtt szükségünk volt egy olyan adatbázisra, amelyikben csak a vezérdeszkriptorok és az ezekhez szükséges utalók vannak jelen. A THES erre "egy az egyben" nem alkalmas, mert a lásd még-ek számára értelmetlen lenne mindhárom szóba jöhető kapcsolat összes deszkriptorának a felhasználása. Ezért a THES-t THESL néven lemásoltuk, majd töröltünk belőle minden olyan deszkriptort, amelyet nem kívánunk lásd még-ként használni. Ezzel egy olyan állandó utaló-adatbázishoz jutottunk, amelyhez csak új deszkriptorok bevezetése esetén kell hozzányúlni.
Mind a feladat megfogalmazásában, mind a megvalósításban arra törekedtünk, hogy a rendelkezésre álló szoftverek (ISIS, kiadványszerkesztők) képességeit használjuk feladataink megoldására, igényeinknek megfelelően "körülpárnázva" azokat programokkal.

3.1 Az ISIS-szel közvetlenül nem megoldható probléma

A Micro-ISIS szolgáltatások segítségével könnyen elkészíthetnénk egy listát a THESL-beli összes utalóról; a megoldandó feladat az lenne, hogy ebben csak azok szerepeljenek, amelyek a MANCI-ból aktuálisan kiszerkesztett tárgyszavakhoz tartoznak. Egy tárgyszóhoz (THESL-beli vezérdeszkriptorhoz) ezek a következők: az összes lásd utaló, de csak azok a lásd még utalók, amelyek a MANCI-ból szerkesztett tárgyszavak között is szerepelnek. Így, mivel egy vezérdeszkriptorból nem az összes hozzá tartozó utalót kell kiszerkeszteni, nem elegendő, hogy a THESL adatbázisból leválogassuk a tárgyszó-listában szereplő deszkriptorokat, s a hozzájuk tartozó utalókat kiszerkesszük, hanem a lista szerkesztéskor meg kell tudni állapítani, hogy az egyes lásd még relációk szerepelnek-e az aktuális MANCI tárgyszójegyzékben.

3.2 Milyen megoldást választottunk?

Az ISIS formátumnyelv lehetőséget ad feltételes szerkesztésre (if struktura), valamint arra is, hogy adatokat, feltételeket ISIS-PASCAL program (format exit) határozzon meg, így programmal válaszolhatnánk arra a kérdésre, hogy bizonyos deszkriptorok szerepelnek-e az aktuális tárgyszójegyzékben. Ez azonban hosszadalmas lenne, hiszen közvetlenül a hosszú, szekvenciális indexfájlból keresnénk ki egyenként a deszkriptorokat. Ezért célszerű az indexbeli tárgyszavakat egy véletlen elérésű állományba szervezni. Az ISIS invertált fájlja ilyen, ún. random access adathalmaz, amelyben bármely adat bármikor gyorsan megtalálható. Az invertált fájl a formátumnyelvből közvetlenül elérhető az L függvénnyel, így a format exit program sem szükséges. Ha létrehozunk egy olyan "munka" invertált fájlt, amely az aktuális tárgyszavakat tartalmazza, a feltételes szerkesztés elvégezhető az ISIS formátumnyelvvel: az L függvény segítségével egyrészt megállapítható, hogy a THESL vezérdeszkriptoraira kell-e lásd-dal utalni, másrészt, hogy a lásd még relációk közül melyekre van szükség.

3.3 Az utalókkal ellátott tárgyszóindex létrehozásának lépései

1. A nyers tárgyszóindex előállítása a MANCI aktuális negyedévéből, majd ennek az utalószerkesztés környezetébe helyezése.
2. Az ISIS-hen agyidőben csak egy invertált fájt lehet egy adatbázishoz, ezért az eredeti invertált fájl anyagait és FST-jét el kell menteni, és a munka-invertálás FST-jét kell az adatbázis invertálási FST pozíciójába helyezni. Ezt egy DOS folyamat végzi.
3. A munka invertált fájl létrehozása egy ISIS PASCAL nyelven írt programmal történik, melynek funkciói a következők:

4. Amikor elkészült az invertálás, sor kerülhet a szerkesztő folyamatra. A szerkesztés a teljes THESL adatbázison történik az említett L függvény segítségével. Az utalókat rendezési kulcsként, a feltételes szerkesztést és az L függvényt használva készíttetjük el az ISIS-szel, ellátva azokkal a konstansokkal, amelyeket a kiadványkészítő (Ventura) felhasznál a szöveg megformálására. E folyamat eredményéből a 3. ábra mutat be egy mintát.
5. A rendezett utalólista elkészülte után DOS folyamattal visszacseréljük az eredeti invertálási adatállományokat.
6. A tárgyszóindex és az utalólista összefésülése egy C nyelven írt programmal történik, amely használja az ISIS szerkesztésnek a megfelelő betűrend megállapításához szükséges rendezési tábláját, hogy a program számára is az összefésülendő anyagok rendezettek legyenek, s így egy egyszerű szekvenciális összefésülést kelljen végeznie. A 4. ábra a program végtermékét szemlélteti, természetesen a Ventura formázás és tipografizálás előtti állapotban.

4. Összefoglalás

Az online tezaurusszal kapcsolatos eddigi olvasói visszajelzések igen pozitívak. Az információkeresés jóval egyszerűbb és hatékonyabb, mint a nyomtatott tezaurusszal, s nem megvetendő az az előnye sem, hogy a kiválasztott keresőelemeket nem kell begépelni, ami nemcsak fáradságos, de a gépelési hibák (s az ennek megfelelő 0 találatok) veszélyét is magában rejti.
Ami az utalókészítési programot illeti, ennek hatékonyságát legjobban a megtakarított munkával, illetve idővel lehetne jellemezni. Erre vonatkozó számszerű adatokkal nem rendelkezünk ugyan, de elképzelhető, hogy milyen megtakarítást jelent, ha nem kell a két kiadványhoz évente kb. 1500 utalót kijelölni, egy cédula-nyilvántartásból kiszedni, betűrendezni, megkeresni helyüket a gépi indexfájlban, majd beírni őket.
Reméljük, hogy a gépi utalókészítéshez más bibliográfiaszerkesztő könyvtárosok is kedvet kapnak, s hasznát tudják venni az ismertetett megoldásunknak.

Hivatkozások

1. WOOD, Anthony J. - SLACK, Frances: Subject searching on British OPACS: Problems and progress = Libr.Rev. 39.vo1. 199?. 6.no. 41-48.p.
2. SLACK, F.E.: OPACs: Using enhanced transaction logs to achieve more effective online help facilities for subject searching. PhD Thesis. Manchester Polytechnic.
3. HUNTER, Rhonda: Successes and failures of patrons searching the online catalog at a large academic library: a transaction log analysis = RO, Spring, 1991.395-402.p.
4. NOVÁK István: Kísérlet egy Micro-ISIS adatbázis olvasói online katalógusként való használatára = Könyvtári Figyelő. 35.évf. 1989. 2.sz. 173-182.p.
5. NOVÁK István: Céduláktól hajlékony lemezig: egy referálólap előállításának fejlődése = Könyvtári Figyelő. 36.évf. 1990. 1-2.sz. 81-90.p.

 

1. ábra Részlet a tezaurusz indexéből

_ÉPÍTÉSI PROGRAM
_ÉPÍTÉSI TERV
_ÉPÍTÉSÜGYI ...
_ÉPÍTÉSZETI ...
_ÉPÍTŐIPARI ...
_ÉPÜLET -AKADÉMIAI KÖNYVTÁRÉ
_ÉPÜLET -ÁLTALÁNOS TUDOMÁNYOS
_ÉPÜLET -EGYETEMI KÖNYVTÁRÉ
_ÉPÜLET -EGYETEMI, FŐISKOLAI
_ÉPÜLET -FELSŐOKTATÁSI KÖNYVTÁR
_ÉPÜLET -FŐISKOLAI KÖNYVTÁRÉ
_ÉPÜLET -GYERMEKKÖNYVTÁRÉ
_ÉPÜLET -IFJÚSÁGI KÖNYVTÁRÉ
_ÉPÜLET -ISKOLAI KÖNYVTÁRÉ
_ÉPÜLET -KÖNYVTÁR-
_ÉPÜLET -KÖZMŰVELŐDÉSI KÖNYVTÁR

¿ -következő

B-előző P-lapozás S-kiválasztás
T-keresőelem X-kilépés    

 

2. ábra Az "Építési terv" deszkriptorcikke

ÉPÍTÉSI PROGRAM
MFN 188

_Építési terv
_NB "Forma" váłtozatban is!
_H Berendezési terv
_H Beruházási program
_H Építési program
_H Típusterv
_F Könyvtárépítés, berendezés
_A Flexibilitás
_X Berendezés
_X Könyvtárépület

¿ -következő B-előző F-első P-lapozás S-kiválasztás  
T-keresőelem O-keresőkérdés ?-keresőkérdés mutatás X-kilépés    

3. ábra Részlet az utalókat tartalmazó fájlból

@pu=GÉPI FORMÁTUM
@pl=lásd
Formátum -gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd
Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még
Gépi osztályozás
@pu=GÉPI INFORMÁCIÓKERESÉS
@pl=lásd még
Adatbázis-kezelési útmutató
Ember-gép kapcsolat
Keresőkép
Online információkeresés
@pu=GÉPI INFORMÁCIÓKERESÉSI RENDSZER
@pl=lásd még
Adatbázis
Ember-gép kapcsolat
Gépi katalógus
Információkeresési rendszer értékelése
Hiperszöveg
.
.

4. ábra Az utaló-fájlnak megfelelő részlet a végleges tárgyszóindexből, formázás előtt

@pu=GÉPI FORMÁTUM
@pl=lásd Formátum-gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még Gépi osztályozás
@pt=Gépi szövegelemzés; Információkeresési rendszer értékelése; Kísérlet; Tárgyszó
@pn-91/232 Autoref(eng )-
@pu=GÉPI INFORMACIÓKERESÉS
@pl=lásd még Adatbázis-kezelési útmutató; Ember-gép kapcsolat; Keresőkép; Online információkeresés
@pt=Teljes szövegű adatbázis
@pn =91 /053 Autoref(ger) -
@pt=Ember-gép kapcsolat
@pn =91 /056 Autoref(ger) -
@pt=Hatékonyság; Szoftver
@pn =91 /094 Autoref(cze)CS
@pt= ETO
@pn=91/132 Ref(eng)-
@pt=Használók képzése -felsőoktatásban
@pn=91/158 Ref(eng)GB
@pt=Online katalógus; Tárgyi feltárás

Országos Széchényi Könyvtár
Észrevételek (2000/04/12)