38. évfolyam, 1992. 1. szám |
Archívum |
A tárgyi besorolási adatok egységesítése egy online cikk-katalógusban és a nyomtatott változatok tárgyszóindexeiben
Tar Katalin - Novák István
1. Bevezetés
Az olvasói online katalógusok közel tízéves
fennállásuk során a használati kényelem, a használói barátságosság tekintetében
kétségtelenül sokat fejlődtek, ezt azonban elsősorban az információtechnológia
fejlődése váltotta ki, s nem a tartalmi feltárás hatékonyabb intellektuális
megoldásai eredményezték. Ezért van, hogy ami a tárgy szerinti keresést, a tárgyi
hozzáférést illeti, az online katalógusok szépsége és dicsősége pillanatok alatt
összeomlik.
1987-88-ban a brit egyetemi és közművelődési könyvtárak online katalógusainak
felmérése során például a következők derültek ki. A 73 online katalógus közül
az egyetemi könyvtárak katalógusainak (47) csak kétharmada, a közművelődésieknek
pedig csak a fele nyújtott lehetőséget a tárgy szerinti keresésre. Ez a legtöbb
(56) esetben osztályozási jelzet szerinti keresés volt, ami azt jelenti, hogy
ha a jelzet nem ismert, akkor egy különálló betűrendes tárgyszójegyzéket kell
átnézni a megfelelő kód kiválasztására. A felmérés szerint a legtöbb OPAC a
szabad szöveges keresésre épít: a leggyakrabban a címmező kulcsszavaira lehet
keresni. Tárgyszavak szerinti keresési lehetőséget 26 online katalógus nyújtott,
de ezek közül csak néhány rendelkezett online elérhető tárgyszójegyzékkel, és
egyetlen vizsgált OPAC sem kínált online tezauruszhasználatot.1
A Manchester Polytechnic az online katalógusokban való tárgyi keresés
problémáinak megállapítására végzett kutatást, önként jelentkező egyetemi hallgatók
bevonásával.2 A hallgatók kereséseit floppy lemezre
rögzítették, majd ezeket elemezve kiderült, hogy a problémák egy jelentős része
abból adódott, hogy a résztvevők nem tudták, hogy témájukkal kapcsolatban mit
írjanak be keresőkifejezésként, kulcsszóként, mert ehhez a rendszer semmilyen
segítséget nem nyújtott.
Hasonló módszerrel, a hallgatók keresési viselkedésének elemzésével vizsgálták
a North Carolina State University online katalógusában való keresések
problémáit is.3 Ami a tárgyi keresést illeti, itt
a használóknak a Library of Congress tárgyszójegyzéke alapján kellett,
illetve kellett volna a megfelelő tárgyszavakat begépelni. A vizsgált 3707 keresésből
2008 végződött kudarccal (54,25%), azaz 0 találattal, s ezek közül a legtöbbet
(29,2%) a nem megfelelő deszkriptorok használata eredményezte.
A. J. Wood, az említett 1987-es brit felmérés készítője megjegyzi, hogy
amíg az online katalógusokban való tárgyi keresés ilyen korlátozott lehetőségeket
kínál, addig nem csoda, ha a legtöbb próbálkozás ismert művek kikeresésére irányul.
***
Korábbi cikkeinkben beszámoltunk a KMK Könyvtártudományi
szakkönyvtárának MANCI nevű online cikk-katalógusáról4,
és ismertettük, hogy hogyan készítjük el az adatbázis alapján a nyomtatott referálólapokat
és ezek mutatóit5. A fejlesztés következő szakaszának
célja az volt, hogy mind az online, mind a nyomtatott változatokban növeljük
a tárgyi keresés hatékonyságát, biztosítva emellett természetesen a használati
kényelmet, barátságosságot is. A megoldás kulcsa mindkét esetben a szakkönyvtárunkban
már 15 éve használt és karbantartott könyvtártudományi tezaurusz, amelynek
gépre vitelével a következő célok megvalósítása került elérhető közelségbe:
Mivel cikkünk témáját csak az első két pont érinti, a következőkben csak ezekkel foglalkozunk.
2. Online tezaurusz
Tezauruszunk gépre vitelének ötletét az
adta, hogy nem sokkal a Micro-ISIS 2.3 változatának bevezetése után felfedeztük,
hogy az alap ISIS-hez mellékelt ISIS-PASCAL mintaprogramok között egy tezauruszkezelő
program is van. Ezt megvizsgálva kiderült, hogy a program a szakirodalomból
ismert, kereskedelmi forgalomban lévő tezauruszkezelő szoftverekhez képest igen
primitív ugyan, de az alapvető tezauruszkezelési funkciókat tartalmazza. Így
a tezaurusz invertált fájljában (indexében) böngészve bármelyik keresőelemet
kiválaszthatjuk, amire megjelenik az illető kifejezéshez tartozó deszkriptorcikk.
Ekkor mód van új relációk hozzáadására, meglévő relációk törlésére, a deszkriptorcikk
bármelyik tagjának keresőkifejezéskénti kijelölésére, megjelenítésére, majd
- a programból kilépve - a kiválasztott keresőkifejezés(ek) keresőkérdéssé szerkesztésére
és a keresésnek a kiindulási adatbázisban való végrehajtására. Az új relációk
hozzáadása, illetve törlése nyomán a program automatikusan elvégzi a folyamatok
inverzét, tehát pl. egy tágabb kifejezés hozzáadása után a megfelelő szűkebbet,
szűkebbnél a tágabbat, rokonnál a rokont beírja a megfelelő helyre.
A szóban lévő THES nevű program egy THES nevű adatbázis meglétét feltételezi,
amelynek a következő mezőit képes kezelni:
Mindezek ismeretében úgy döntöttünk, hogy
a THES adatbázis definícióit és a programot felhasználjuk saját tezauruszunk
építésére és kezelésére, majd - a program csekély mértékű átírásával - alkalmassá
tesszük olvasói használatra is.
E cél érdekében eredeti tezauruszunkat át kellett alakítani, mert kezdetben
elődeink a relációkat az akkori informatikai divatnak megfelelően nem csupán
tágabb, szűkebb és rokon fogalmakként határozták meg, hanem a tágabb kifejezések
EGÉSZ és NEM (genus), a szűkebbek pedig RÉSZ és FAJ (species) fogalmakként szerepeltek.
Mivel a használat szempontjából e tudományos-elméleti megkülönböztetésnek nincs
értelme (az olvasót nem érdekli, hogy egy keresett szűkebb fogalom rész- vagy
fajfogalma-e a vonatkozó tágabb kifejezésnek), ezen kívül a deszkriptorcikkek
áttekinthetőségét is rontja, nem volt nehéz lemondanunk ezekről a nemzetközi
tezauruszkészítési gyakorlatban ismeretlen relációkról. Az említett kétféle
szűkebb és tágabb deszkriptorokat ezért összevontuk, majd - saját szükségleteinknek
megfelelően - kiegészítettük az eredeti THES adatbázis definícióit. Ez abból
állt, hogy néhány plusz mezőt definiáltunk: a deszkriptorok betűrendi kódja
(erre hivatkozunk a betűrendes mutatóban), a szakjelzet és a deszkriptor használatba
vételének dátuma számára, majd ennek megfelelően módosítottuk az adatbeviteli
űrlapot, az FST-t és a megjelenítési formátumot. Ezután megkezdődhetett az adatbázis
feltöltése.
A THES nevű tezauruszkezelő programban a következő főbb változtatásokat
hajtottuk végre:
Tekintsük át egy egyszerű példán, hogy az
online tezauruszhasználat mit nyújt az olvasók számára! Tegyük fel, hogy használónkat
a közművelődési könyvtárak építése, berendezése érdekli. A keresési menüben
a Z (Tezaurusz) billentyűt lenyomva megjelenik a program kiindulási képernyője,
ahol az olvasó beírhatja a keresőelemet, vagy annak részét. Nem tudva, hogy
az általános építési kérdésekre használt deszkriptor nálunk a "Könyvtárépítés,
berendezés", beírja az "építés" szót, mire a képernyőn e betűrendi ponttól kezdődően
megjelenik a tezaurusz indexe (1 ábra).
Kiválasztva az első, a kérdéséhez közel álló "Építési program"-ot, az S billentyűt
lenyomva megjelenik a vonatkozó deszkriptorcikk (2 ábra). Itt megjegyezzük,
hogy a reláció-rövidítések (H - nem-deszkriptor, F - tágabb, A - szűkebb, X
- rokon) az MSZ 3418-87 "Magyar nyelvű információkereső tezauruszok szerkezete,
részei és formái" c. szabvány 3.5 pontja szerinti betűjelek. A kiválasztott
deszkriptorcikk rávezeti a használót, hogy az "Építési program" helyett a használandó
deszkriptor az "Építési terv", és tágabb kifejezésként rendelkezésre áll még
a "Könyvtárépítés, berendezés" és - például - rokonként a "Berendezés". Ezeket
a Q-val keresőkifejezésekké minősítheti, aminek nyomán a program VAGY (+) kapcsolattal
összekötve megőrzi őket.
Ezután az olvasó rátérhet a kérdés második részére. A T opcióval beírhatja például
a "Közkönyvtár" terminust, amire a deszkriptorcikkből egyrészt kiderül, hogy
nem ezt, hanem a "Közművelődési könyvtár"-t kell használnia, másrészt érdemes
szűkebb fogalmakat is (Városi könyvtár, Megyei könyvtár stb.) kijelölni. X-el
kilépve, a képernyőn +-al összekötve megjelenik az összes, keresésre kijelölt
kifejezés:
Építési terv + Könyvtárépítés, berendezés + Berendezés + Közművelődési könyvtár + Városi könyvtár + Megyei könyvtár
A keresőkérdés most megszerkeszthető (az építéshez, illetve a közkönyvtárhoz tartozó deszkriptorokat zárójelek közé tesszük, és a közöttük lévő VAGY kapcsolatot ÉS-re (*) módosítjuk), és az ENTER leütésével a keresés a MANCI-ban végrehajtható.
3. Utalókészítési program
A MANCI alapján két negyedéves nyomtatott
kiadvány: egy bibliográfia, illetve egy referálólap készül, az egyik a magyar
(Magyar Könyvtári Szakirodalom Bibliográfiája, MAKSZAB), a másik pedig
a külföldi szakirodalmat tárja fel (ez utóbbi 1991-tól a Könyvtári Figyelő
egyik rovataként jelenik meg). Mindkettő tárgyszóindexe a MicroISIS-ben definiált
nyomtatási, illetve rendezési űrlapok segítségével készül. A végtermék egy nyers
mutató, amelyet a Word 5.0, illetve a Ventura Publisher szoftverek használatával
alakítunk nyomdakész indexszé, úgy, hogy előzőleg a megfelelő betűrendi helyekre
begépeljük a szükséges lásd és lásd még utalókat. Tezauruszunk
géprevitelével elérhető közelségbe került az utalók automatikus előállítása
is, hiszen a THES adatbázisban mindkét típusú utalók jelen vannak (a lásd-ok
a nem-deszkriptorok, a lásd még-ek pedig a tágabb, szűkebb és rokon fogalmak
közül kerülnek ki), ezért egy utalólista készítése és ennek összefésülése a
tárgyszóindexszel - némi programozással - megvalósíthatónak látszott.
Mindenekelőtt szükségünk volt egy olyan adatbázisra, amelyikben csak a vezérdeszkriptorok
és az ezekhez szükséges utalók vannak jelen. A THES erre "egy az egyben" nem
alkalmas, mert a lásd még-ek számára értelmetlen lenne mindhárom szóba
jöhető kapcsolat összes deszkriptorának a felhasználása. Ezért a THES-t THESL
néven lemásoltuk, majd töröltünk belőle minden olyan deszkriptort, amelyet nem
kívánunk lásd még-ként használni. Ezzel egy olyan állandó utaló-adatbázishoz
jutottunk, amelyhez csak új deszkriptorok bevezetése esetén kell hozzányúlni.
Mind a feladat megfogalmazásában, mind a megvalósításban arra törekedtünk, hogy
a rendelkezésre álló szoftverek (ISIS, kiadványszerkesztők) képességeit használjuk
feladataink megoldására, igényeinknek megfelelően "körülpárnázva" azokat programokkal.
3.1 Az ISIS-szel közvetlenül nem megoldható probléma
A Micro-ISIS szolgáltatások segítségével könnyen elkészíthetnénk egy listát a THESL-beli összes utalóról; a megoldandó feladat az lenne, hogy ebben csak azok szerepeljenek, amelyek a MANCI-ból aktuálisan kiszerkesztett tárgyszavakhoz tartoznak. Egy tárgyszóhoz (THESL-beli vezérdeszkriptorhoz) ezek a következők: az összes lásd utaló, de csak azok a lásd még utalók, amelyek a MANCI-ból szerkesztett tárgyszavak között is szerepelnek. Így, mivel egy vezérdeszkriptorból nem az összes hozzá tartozó utalót kell kiszerkeszteni, nem elegendő, hogy a THESL adatbázisból leválogassuk a tárgyszó-listában szereplő deszkriptorokat, s a hozzájuk tartozó utalókat kiszerkesszük, hanem a lista szerkesztéskor meg kell tudni állapítani, hogy az egyes lásd még relációk szerepelnek-e az aktuális MANCI tárgyszójegyzékben.
3.2 Milyen megoldást választottunk?
Az ISIS formátumnyelv lehetőséget ad feltételes szerkesztésre (if struktura), valamint arra is, hogy adatokat, feltételeket ISIS-PASCAL program (format exit) határozzon meg, így programmal válaszolhatnánk arra a kérdésre, hogy bizonyos deszkriptorok szerepelnek-e az aktuális tárgyszójegyzékben. Ez azonban hosszadalmas lenne, hiszen közvetlenül a hosszú, szekvenciális indexfájlból keresnénk ki egyenként a deszkriptorokat. Ezért célszerű az indexbeli tárgyszavakat egy véletlen elérésű állományba szervezni. Az ISIS invertált fájlja ilyen, ún. random access adathalmaz, amelyben bármely adat bármikor gyorsan megtalálható. Az invertált fájl a formátumnyelvből közvetlenül elérhető az L függvénnyel, így a format exit program sem szükséges. Ha létrehozunk egy olyan "munka" invertált fájlt, amely az aktuális tárgyszavakat tartalmazza, a feltételes szerkesztés elvégezhető az ISIS formátumnyelvvel: az L függvény segítségével egyrészt megállapítható, hogy a THESL vezérdeszkriptoraira kell-e lásd-dal utalni, másrészt, hogy a lásd még relációk közül melyekre van szükség.
3.3 Az utalókkal ellátott tárgyszóindex létrehozásának lépései
1. A nyers tárgyszóindex előállítása a MANCI aktuális negyedévéből,
majd ennek az utalószerkesztés környezetébe helyezése.
2. Az ISIS-hen agyidőben csak egy invertált fájt lehet egy adatbázishoz, ezért
az eredeti invertált fájl anyagait és FST-jét el kell menteni, és a munka-invertálás
FST-jét kell az adatbázis invertálási FST pozíciójába helyezni. Ezt egy DOS
folyamat végzi.
3. A munka invertált fájl létrehozása egy ISIS PASCAL nyelven írt programmal
történik, melynek funkciói a következők:
4. Amikor elkészült az invertálás, sor kerülhet
a szerkesztő folyamatra. A szerkesztés a teljes THESL adatbázison történik az
említett L függvény segítségével. Az utalókat rendezési kulcsként, a feltételes
szerkesztést és az L függvényt használva készíttetjük el az ISIS-szel, ellátva
azokkal a konstansokkal, amelyeket a kiadványkészítő (Ventura) felhasznál a
szöveg megformálására. E folyamat eredményéből a 3. ábra mutat be egy
mintát.
5. A rendezett utalólista elkészülte után DOS folyamattal visszacseréljük az
eredeti invertálási adatállományokat.
6. A tárgyszóindex és az utalólista összefésülése egy C nyelven írt programmal
történik, amely használja az ISIS szerkesztésnek a megfelelő betűrend megállapításához
szükséges rendezési tábláját, hogy a program számára is az összefésülendő anyagok
rendezettek legyenek, s így egy egyszerű szekvenciális összefésülést kelljen
végeznie. A 4. ábra a program végtermékét szemlélteti, természetesen
a Ventura formázás és tipografizálás előtti állapotban.
4. Összefoglalás
Az online tezaurusszal kapcsolatos eddigi
olvasói visszajelzések igen pozitívak. Az információkeresés jóval egyszerűbb
és hatékonyabb, mint a nyomtatott tezaurusszal, s nem megvetendő az az előnye
sem, hogy a kiválasztott keresőelemeket nem kell begépelni, ami nemcsak fáradságos,
de a gépelési hibák (s az ennek megfelelő 0 találatok) veszélyét is magában
rejti.
Ami az utalókészítési programot illeti, ennek hatékonyságát legjobban a megtakarított
munkával, illetve idővel lehetne jellemezni. Erre vonatkozó számszerű adatokkal
nem rendelkezünk ugyan, de elképzelhető, hogy milyen megtakarítást jelent, ha
nem kell a két kiadványhoz évente kb. 1500 utalót kijelölni, egy cédula-nyilvántartásból
kiszedni, betűrendezni, megkeresni helyüket a gépi indexfájlban, majd beírni
őket.
Reméljük, hogy a gépi utalókészítéshez más bibliográfiaszerkesztő könyvtárosok
is kedvet kapnak, s hasznát tudják venni az ismertetett megoldásunknak.
Hivatkozások
1. WOOD, Anthony J.
- SLACK, Frances: Subject searching on British OPACS: Problems and progress
= Libr.Rev. 39.vo1. 199?. 6.no. 41-48.p.
2. SLACK, F.E.: OPACs: Using enhanced transaction logs to achieve
more effective online help facilities for subject searching. PhD Thesis. Manchester
Polytechnic.
3. HUNTER, Rhonda: Successes and failures of patrons searching
the online catalog at a large academic library: a transaction log analysis =
RO, Spring, 1991.395-402.p.
4. NOVÁK István: Kísérlet egy Micro-ISIS adatbázis olvasói online
katalógusként való használatára = Könyvtári Figyelő. 35.évf. 1989. 2.sz. 173-182.p.
5. NOVÁK István: Céduláktól hajlékony lemezig: egy referálólap
előállításának fejlődése = Könyvtári Figyelő. 36.évf. 1990. 1-2.sz. 81-90.p.
1. ábra Részlet a tezaurusz indexéből
_ÉPÍTÉSI PROGRAM |
|||
¿ -következő |
B-előző | P-lapozás | S-kiválasztás |
T-keresőelem | X-kilépés |
2. ábra Az "Építési terv" deszkriptorcikke
ÉPÍTÉSI PROGRAM |
MFN 188
|
||||
_Építési terv |
|||||
¿ -következő | B-előző | F-első | P-lapozás | S-kiválasztás | |
T-keresőelem | O-keresőkérdés | ?-keresőkérdés mutatás | X-kilépés |
3. ábra Részlet az utalókat tartalmazó fájlból
@pu=GÉPI FORMÁTUM
@pl=lásd
Formátum -gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd
Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még
Gépi osztályozás
@pu=GÉPI INFORMÁCIÓKERESÉS
@pl=lásd még
Adatbázis-kezelési útmutató
Ember-gép kapcsolat
Keresőkép
Online információkeresés
@pu=GÉPI INFORMÁCIÓKERESÉSI RENDSZER
@pl=lásd még
Adatbázis
Ember-gép kapcsolat
Gépi katalógus
Információkeresési rendszer értékelése
Hiperszöveg
.
.
4. ábra Az utaló-fájlnak megfelelő részlet a végleges tárgyszóindexből, formázás előtt
@pu=GÉPI FORMÁTUM
@pl=lásd Formátum-gépi
@pu=GÉPI HÁLÓZAT -HELYI
@pl=lásd Helyi gépi hálózat
@pu=GÉPI INDEXELÉS
@pl=lásd még Gépi osztályozás
@pt=Gépi szövegelemzés; Információkeresési rendszer értékelése; Kísérlet; Tárgyszó
@pn-91/232 Autoref(eng )-
@pu=GÉPI INFORMACIÓKERESÉS
@pl=lásd még Adatbázis-kezelési útmutató; Ember-gép kapcsolat; Keresőkép; Online
információkeresés
@pt=Teljes szövegű adatbázis
@pn =91 /053 Autoref(ger) -
@pt=Ember-gép kapcsolat
@pn =91 /056 Autoref(ger) -
@pt=Hatékonyság; Szoftver
@pn =91 /094 Autoref(cze)CS
@pt= ETO
@pn=91/132 Ref(eng)-
@pt=Használók képzése -felsőoktatásban
@pn=91/158 Ref(eng)GB
@pt=Online katalógus; Tárgyi feltárás
Országos Széchényi Könyvtár Észrevételek (2000/04/12) |