Kései méltatás

48. évfolyam, 2002. 4. szám

Kései méltatás


UNGVÁRY Rudolf - ORBÁN Éva Osztályozás és információkeresés : kommentált szöveggyűjtemény / Ungváry Rudolf, Orbán Éva ; [közread. az] Országos Széchényi Könyvtár. - Budapest : OSZK, 2001. - 2 db ; 24 cm ISBN 963 200 424 8 1.köt., Az osztályozás és elmélete. - 543 p. ISBN 963 200 425 6 2. köt., Az információkeresés elmélete. - 535 p. ISBN 963 200 426 4

Lenyűgöző olvasókönyvet, szöveggyűjteményt állított össze Ungváry Rudolf és Orbán Éva, amely a szakmai kritikától nem kapott méltó figyelmet. A hatalmas munka a bírálót zavarba ejti, mert mit illessen észrevételeivel? A kötetekben az osztályozás klasszikusainak és élő klasszikusainak alapműveiből kapunk szemelvényeket (a témát nagyon tágan értelmezve, az indexelési folyamatokat és technikákat, az információkeresés stratégiai kérdéseit is ideszámítva), akik már felette állnak a napi kritikákon. Gondolataikat az idő igazolta vagy halványította el azzal, hogy eszméiket az osztályozás ismeretei között mennyire szilárdította meg. A kritika csak arra vonatkozhat, hogy a kötetek két létrehozója a válogatásban milyen nézőpontból végezte feladatát. Itt sem lehet nagyon csapongani, mert érett tudományról van szó, élő kérdésekben pedig senki ne kérje számon saját meggyőződését, netán dogmáját.

Szakmánknak – sokféle névvel illetik, most hívjuk talán információtudománynak – az osztályozáson kívül aligha van még olyan diszciplínája, amely annyira összeszövődne más tudományokkal, az összes tudománnyal. Még inkább: azokból nőtt ki és végzi velük a közös építkezés munkáját. Mert a témának ilyen tág határai vannak. J. Piaget szerint a gondolkodás egyharmada osztályozás. Ez a gondolkodás teremt rendet az irdatlan mennyiségű tapasztalat és tudás rengetegében, adja meg az ismeretek szerkezetét. Még többről van szó, mert a rend és a struktúrák nemcsak az emberi tudatban vannak, hanem kívüle is, a világmindenségben magában. Ne csodálkozzunk tehát, hogy J. A. Sreider (2. köt. 297–298. p.) „külső” és „belső” rendszerekről szól, külső például az elemek periódusos rendszere, ezt nem a tudat teremtette, csak a felismerte. Az első tanulság tehát, hogy mindig az univerzum rendjéről és szerkezetéről van szó, akkor is, ha aktuálisan csak ennek részlete vagy egyik vetülete került szóba. Ne legyünk provinciálisak és igényességünket se adjuk alább, mert minden tudománynak ilyen egzisztenciája van. Olvasom a külföldre szakadt neves fizikus és tudománytörténész Jáki Szaniszló hivatkozását a méltó közmegegyezéses nézőpontról, a hiteles gondolkodás pozíciójáról. Eszerint minden tudomány – ha tudomány – egyben kozmológia is. Az osztályozás tudománya is.

A mi szakmánk eredeténél fogva az egyetemesség, a tudás teljességéhez szilárdítja kötelékeit, a görögök panteizmusától, Gesner első számbavételi és rendszerező humanista eszméin át a mai egyetemes számbavétel és rendszerezés programjáig. Az utóbbi évtizedekben gondolkodásunkból és oktatásunkból kilúgozódott az egyetemesség szakmánkat mindig valódi hivatására emlékeztető eszméje. Már csak Bényei Miklós debreceni tanításában találkoztam vele, más helyeken és írásokban a technikai részletek és kicsinyes eljárási mozzanatok eltakarják a lényeget. Pedig mindennél fontosabb a problémák, a kérdések helyes ismerete: mi a kérdés egyáltalán? Az Ungváry-Orbán szöveggyűjtemény – főleg első kötetében – a problémát valódi szintjére helyezi: Még inkább: méltó rangon veti fel. Ez a megállapítás dicsérheti a választott szerzőket, de alighanem a szerkesztő-páros tudatosságát mutatja.

Mi tehát a probléma? Mi a feladat maga? Először csak annyi, hogy a számba vett (ellenőrzött) emberi tudásnak megadjuk azt a szerkezetét, amely ezt a tudást összefüggő egészként mutatja meg mindenkori legjobb tudásunk szerint. Másodszor, hogy a részeket elhelyezzük ebben a struktúrában akkor is, ha illesztésük némi ficamokkal jár. Az összeillesztés a részek kiemelt és lényegesnek ítélt tulajdonságain nyugszik. Csakhogy minden részletnek, tudásdarabkának számtalan tulajdonsága van: minél többet tudunk róla, annál több. E tulajdonságok változnak is, gazdagodnak is. Le kell írni ezeket az ismeréveket, tartalmi jegyeket. A könyvtárosok kézikönyve logontartalomnak mondta, a szöveggyűjtemény másként pl. meronoknak (csak analógia áll fenn) és máshogyan is. Az említett tudásdarabkákat bármely ismérvük alapján, meg kell találni. Hát, ez okozza a nehézséget.

Igazából a XVI. században (ám, lehet, hogy az elsőként mondott feladat miatt már a Kr. e. 3. században) elindult a szakmai útkeresés. Lehet-e olyan rendszert vagy módszert találni, amely e feladatokat teljesíteni képes? Az útkeresés meghatároz egy folyamatot, amely eszmetörténetként kutatható és írható le. A folyamat ma is tart és tartani fog a jövőben, míg az emberi megismerés életben marad. Ebbe a folyamatba a szöveggyűjtemény készítői a XIX. század második felétől kapcsolódtak be, jogosan Cuttertől indítják a probléma történetét és ismertetését, eredményeit.

A tudás gyarapodása az „információáradat” azzal fokozta a nehézségeket, hogy egyre árnyaltabb, részletezőbb, egyre finomabb különbségeket érzékelő, egyre individuálisabb rendszereket és eljárásokat kíván. Hiszen egy dolgot, vagy gondolatot százféle gondolattól vagy dologtól könnyebb elválasztani és előhívni közülük, mint százezertől vagy milliótól. Az ismérvek megállapítása és szerkezetbe rendezése is más problémákat vet fel száz, mint százmillió dolog, szövegrész, gondolat esetén.

A szakma a kérdésekre különféle nagyon változatos és nagyon gazdag, gyakran szellemes megoldásokkal válaszol, számos esetben akár ellentmondásosan és szélsőségesen. A két kötet ezeket tekinti át kimerítő teljességgel. Vannak ebben a folyamatban határállomások, szemléletváltó gondolatok, nagy hozamú kísérletek és tisztázó elemzések. Észre sem vesszük azonban, hogy a diszciplínát mennyire uralják bizonyos állandóságok. Egy aprócska példával illusztrálom (a kötetekben nem találkoztam ezzel, talán mert magától értetődőnek vélik, mint a levegőt). Minden osztályozási rendszer, tárgyszókészlet, kulcsszó együttes, tezaurusz, szakszótár főnévközpontú, illetve névszóközpontú. Ez kultúránk, egész gondolkodásmódunk sajátossága. Bizonyára azért, mert a görögök (Arisztotelész) nyelvfilozófiájában a világ dolgai, az emberi tudás forrásai, a szavak a dolgok (res) megnevezései, amelyek a dolgok lényeges ismertetőjegyeit sűrítő fogalmak alakjában élnek. Az elsődleges névadás a világ dolgait és fogalmait illeti. A második névadás (secunda impositio) illeti a többi szófajt pl. az igéket. Az első szószedetek, glosszák (a szótárak elődei) névszó, illetve főnévjegyzékek. Latin nevük is ez: nomenclatura, benne a nomen = név elnevezés. (Az első magyar szójegyzékek is ilyenek, közülük azért említeném az ún. Oxfordi Glosszákat 1290 tájáról, mert az áldott emlékű Mezey László fedezte fel és tette közzé: a könyvtári tanszék professzorára is lehet büszkének lenni.) Vannak más nyelvek pl. igeközpontú nyelvek is, ezeken egészen más világkép alakul ki a tudatban. Érthető ezek után, hogy sosem tesszük föl a „miért” kérdést, ha a tezaurusz szabványok előírják a főnevesítést. A „fut” helyett „futás”-t engednek meg. Miért? A könnyebb kezelhetőség (biztos?) mellett inkább harmadfélezer éves hagyományról, beidegződésről, zsigeri reflexről van szó.

Az elemi erejű paradigmák közül kettőt emelek ki. Az egyik a relációk felfedezése és értékeik hangsúlyozása. A relációkat már a XIX. század is ismerte „lásd” és „lásd még” alakban, szinonímiának és valami rokonsági kapcsolatnak a kifejezésére. Hierarchikus rendszerek pedig mindig is alkalmazták az alatta-fölötte vagy része-egésze kapcsolatokat. Hiszen ezek alapján épültek föl, ám nagyon egysíkúan, mert a polihierarchiát nem nagyon lehetett fizikai-technikai okokból megalkotni és ábrázolni.

A kezdetekre tehát már ezek voltak a jellemzőek. A relációk teljes pompával a XX. század második felétől léptek fel, odáig bontakoztatva ki, hogy ugyanolyan fontosak, mint a fogalmak (illetve a fogalmak megnevezései). Azaz a relációk elem-értékűek pl. a tezauruszokban. Egy új világ tárult föl, ráadásul a legtöbb tudomány felfedezte a relációkat a maga számára, az egész gondolkodás alapvető fogalmává bontakozott ki. Csak mást ne mondjak példának, mint hogy ifjú koromban a matematikát a mennyiségi viszonyok és a térformák tudományaként határozták meg, ma pedig a relációk (továbbá struktúrák és elrendezések) tudományának mondja magát.

Ez volt az egyik üdvözítő paradigma, de mégsem váltotta be a reményeket, mert a relációkat a szótárakba, tárgyszó rendszerekbe, tezauruszokba, szóval az eszközökbe építették, mondhatnám gyömöszölték be. Oda pedig nem férhettek be azok a relációk, amelyek a konkrét közlemények szövegeiben álltak, csak az adott szövegre voltak érvényesek. Tezauruszba, szótárba azok a kapcsolatok valók, amelyek használatukat könnyítik. De mi a teendő akkor, ha mondjuk egy tanulmány az aranyat, mint meseelemet visszafejti a kelta kézművességre? Ezért fejlődött tovább a relációkra való gondolkodás és megszületett a szövegfüggő kapcsolatok kifejezésének számos formája. Kolombusz tojása: drága nyelvünk, amelyen beszélünk, grammatikája révén bármely kapcsolatot képes kifejezni, amit csak ember elgondolhat. Ehhez a nagyszerű felfedezéshez azonban kanyargós utat kellett bejárni: Az evidenciák felismerése a leggöröngyösebb utakon át lehetséges. De íme: alakot öltöttek azok az indexelő nyelvek és eljárások, amelyek a nyelvtanok viszonyrendszerének, esetrendszerének utánzását követték, természetesen a nyelvtan rendhagyó rétegeinek kiszűrésével és bizonyos egyszerűsítésekkel.

Vádként állíthatják, hogy ezt a fejlődési utat a jelen bíráló személy vetíti rá a folyamatra. Lehet. Ha valakinek más a véleménye, vetítse rá saját elgondolását. Egyébként az egész emberi gondolkozás azt teszi, hogy ilyen „rávetítésekkel” értelmezi a világot.

Megszületett tehát egy indexelési csúcstechnológia. Mégsem ez erősödött a továbbiakban, több okból. Fő oka a nemzetközi együttműködés előretörése és prioritása volt. Ilyen együttműködésben nem a legfejlettebb eljárásokat lehet bevezetni, hanem a gyengébb országok által is emészthető, egyszerű módszereket. Másik ok az volt, hogy az információ nagytömegű feldolgozását ekkora igényességgel nem lehetett biztosítani egyszerűen azért, mert a legmagasabb szinten képzett indexelő szakemberek nem álltak tömegesen rendelkezésre. Harmadszor azért, mert egy másik, fentebb kiemelésre mondott paradigma nagy reményekkel kecsegtetett, annak ellenére, hogy a relációkkal mit sem törődött. Mondhatnám, fittyet hányt az egész reláció megszállottságnak. Ez pedig az automatikus osztályzás volt.

Az automatikus „osztályozás”, helyesen klaszterálás a feladatoknak csak egyik felét oldotta meg, a hasonlósági csoportok, klaszterek létrehozását. Nagyon szellemes, változatos és rugalmas eljárásokat tett lehetővé, ezekben a tartalmi-tematikai ismérvek mindegyikét egyszerre vette figyelembe. De ezidáig nem oldotta meg maguknak az ismérveknek, tartalmi jegyeknek automatikus meghatározását. A kezdeti lelkesedés ezért lelohadt, a kutatás mára már főként erre a problémára irányul. Meg lehet határozni e jegyeket (kulcsszavakat, szövegszavakat, tárgyszavakat) automatikusan is a szöveget alkotó szavak statisztikai vizsgálatával. De többe kerül a leves, mint a hús. Ki az a bolond, aki mondjuk egy közlemény tartalmát reprezentáló szavainak vagy szószerkezeteinek kiemelését a teljes szöveg összetett statisztikai analízisével oldja meg? Egyszerűbb, olcsóbb ha a szöveget valaki elolvassa és a szignifikáns kifejezéseket meghatározza belőle. A mai kutatás arra irányul mintegy 5–6 helyen, jelesül a „mágikus” G. Salton utódainál is, hogy vagy kisebb (mondjuk mintaként kiemelt) szöveg elemzése legyen e célra elegendő, vagy már elkészült nomenklatúrák (tárgyszójegyzékek, gyakorisági listák, tezauruszok, de az ETO is) kifejezéseit felismertessék az eredeti szövegekben. Mi is történt? Nagy kitérő után magasabb szinten ugyan, de visszakanyarodtunk oda, ahonnan elindultunk: szükség van induló szókészletre, a tárgyi-tartalmi kifejezések gyűjteményére. Kérdezhetnénk: miért baj ez, hiszen csak egyszer kell ezt a szó- és kifejezésgyűjteményt létrehozni, aztán csak karbantartását, napi frissítését kell biztosítani. Először is, azért nem előnyös, mert az újdonságokra, eredeti eredményekre nem nagyon érzékeny és ezzel bizonyos visszahúzó erőt gyakorol az információfeldolgozásra oly módon, hogy az új információt spontán a régihez teszi hasonlóvá. Persze nagyon sok függ a napi karbantartás szervezett garantálásától. Másodszor, azért nem előnyös, mert hol az automatizálás ebben a technológiában? Csak részben az.

Ezen a téren a szöveggyűjtemény nem annyira problémafeltáró, mint inkább eredményeket összegző, ténymegállapító. Elénk tárja a tudományág pillanatnyi helyzetét, de nem ütköztet. Nem is ez a feladata. Korábban ezért kíséreltem meg élezettebben vázolni az osztályozás-indexelés életútját és választásait.

A második kötet a visszakeresés és elméletének szemléje kíván lenni. Célja kevésbé sikerült. Tartalmában eklektikus, csapongó, színvonalában hullámzó egy veretes kötetnyitó kommentár, bevezető ellenére. Közepén kap helyet az adatcsere formátumok terjedelmes része. Nem való ide. Ne legyenek kétségeink: szabványokra, szabályokra nagy szükség van. Nagyon nagy szükség. Csakhogy: a bibliográfiai leírásnak és a rekordformátumoknak semmi köze az információ tartalmi, tematikai kezeléséhez. Hacsak az nem, hogy a rekordban a tartalmat leíró kifejezéseknek is van hely, mező. Ezen az alapon azonban bármely más témához társítani lehetne. (A fejezetcímhez: nem csereszabatosság a helyes szó, hanem csereszavatosság. Elírás?) A visszakereséshez van köze annyiban, hogy keresni a bibliográfiai leírás bármely elemére lehet, ha ezzel a feladattal felruházzuk. Miért van itt? Eszembe jut a hajdani vándorló színtársulatok esete. Bármi volt az előadott darab, az igazgató hervadó feleségének szerepet kellett juttatni. Ha őnagysága hiú is volt, azt hitte, ha akármit csinál, lekvárt főz, vagy kutyát sétáltat, az a színházügyre tartozik.

Szakmánkban a szabályozás státusza, state-of- the-art-ja eléggé kérdőjeles, de ne firtassuk, mert tematikailag nem tartozik a kötethez. A zavarra azonban említek egy példát. Hogyan állt elő, hogy csak az angol nyelvterületen három MARC szabályozás született? Nemtörődömségről vagy linkségről lenne szó? Csak ne akarják megmagyarázni, inkább elhiszem, hogy az elefántok repülni szeretnek. Nem állhatom meg egy intelligens angol heringfüstölő megállapítását idézni a nemzetközi szabályokról, melyet a Spectrum televízióban mondott. A következőt állapította meg: „Az Úr imája 52 szóból áll. A heringfüstölés EU-szabályzata meghaladja a 2500 szót. Pedig hát, kedves felebarátaim, jelentőségében a kettő...” Szóval, ez a romlatlan gondolkodású heringfüstölő felfedezte a törvényt a lényeg és a terjedelem fordított arányosságáról.

Valójában irigylem a heringfüstölőt. Nem kellett szembenéznie egy Brezsnyev stílusú szabályozással, mert ilyen is jön ebben a kötetben, ott van az NTMIR mind a száz tonna papírjával. Ezekre mind írtak ám! Ha nincs nosztalgia, kimaradhatott volna!

E kényszerű kanyar után, térjünk vissza a tulajdonképpeni témához. Mit hoz a közeli és távolabbi jövő? Érezhető-e valami kihívás, ami meghatározza a következő évek évtizedek kutatásait?

Az automatikus osztályozás minden bizonnyal egyike a témáknak, de nem klaszterképzés maga, hiszen ezen a téren már-már tobzódunk a szebbnél szebb lehetőségekben. A gondot az ismérvek automatikus vagy félautomatikus meghatározása jelenti. Hogyan lehet jellemző ismérveket, szavakat szószerkezeteket meghatározni, kulcsmondatokat, tézismondatokat megtalálni egy szövegből, vagy használható tömörítést elvégezni belőle? Csak emlékeztetőül: automatikusan a szociológus Szalay Sándor készített magyar nyelven két referátumot még a 60-as évek elején. Nem volt folytatása ennek a kezdeményezésnek sem.

A másik terület ma még homályosan körvonalazható témáit az adja, hogy egyre nagyobb szerepet kap a szövegek digitalizálása, kialakulnak szövegtároló „depot”-ok vagy helyek. Ezeket akár könyvtáraknak is hívhatják. Lehet, hogy a domináns szerepet ezek kapják meg. Hatásukat ma még nem tudjuk felbecsülni. Hatalmas szövegkorpuszok alakulnak, valószínűleg előzetes szelekcióval, szövegrészek elhagyásával, hiszen a mai információ-, azaz szövegözönben a redundancia és ismétlődés a legelviselhetetlenebb.

Valószínű, hogy a professzionista szövegtárolás leválik a mai parttalan gyakorlatáról és önmagában is differenciálódik pl. szakmák szerint. Az internet kialakulása és világméretű sikere csak felvillantotta az új világ lehetőségeit, sikereit és útvesztőit. De feltárta a megoldandó feladatok sokaságát, a problémákat is, sejteti ezek méretét és természetét. A közvetlen szövegtárolásban a nagy kihívás abban áll, hogy miként lehet egy adott kérdésre a releváns szöveghelyeket megtalálni. Nyilván képesnek kell lennünk bejárni a szövegeket. Induló eredmények is vannak, de az ún. markup language-ek azon alapszanak, hogy jeleket helyezünk el bennük. Ha pedig előzetesen ennyi a munka, akkor ezekben nem sok a remény: más célra valók.

Nem szabad folytatnom. Elnézést is kell kérnem, hogy ez a bírálat – vagy inkább együttgondolkodás a szerkesztőkkel – helyenként didaktikusra sikerült. Befejezésül engedjenek meg egy javaslatot.

A két kötetben nagyon sok a gondolat, legtöbb fejezete minőségi olvasót tételez fel. Kik fogják ezt a szöveggyűjteményt olvasni? A mi szakmánkat mindig foglalkoztatta az olvasás vagy az a mód, ahogyan egy-egy gondolat tudatosul, a közgondolkodás részévé válik. Javasolok erről a könyvről egy hatásvizsgálatot. Elképzelhető, hogy a vizsgálat tágabban az osztályozásra vonatkozó ismeretekre terjed ki, alanyai lehetnének a tantárgy oktatói, néhány könyvtártípus osztályozó munkatársa. Bevonhatók végzős vagy már végzett hallgatók is. Arra kell vigyázni azonban, hogy a vizsgálat ne hasonlítson vizsgáztatásra. A felvétel kudarcra lenne ítélve. Mégis érdemes lenne tisztázni, hogy az osztályozás ismereteiben mekkora a tájékozódottság szórása, egyetlen rendszer, eljárás betanulása van-e mögötte, megrekedtek-e az ismeretek valahol stb.? Érdekes lehet az is, hogy mit tartanak problémának és ezek felismerése szinkronban áll-e a kérdés nemzetközi állásával. Egy ilyen vizsgálatnak még gyakorlati haszna is lenne az oktatásban.

Horváth Tibor

Országos Széchényi Könyvtár
Észrevételek