38. évfolyam, 1992. 1. szám
Archívum

A törzs és az ágak 1.

(Horváth Tibor kandidátusi értekezésének bemutatása)

Darányi Sándor

1. Bevezetés

Az alábbiakban néhány technikai megjegyzéssel szeretném segíteni az olvasót, mielőtt kísérőjéül - talán kalauzául is - elfogad. Dolgozatomba a fejezetcímeket gyakran az értekezés szerzőjétől vettem át, elhagytam viszont a hivatkozásait. A téma iránt érdeklődő ezeket az eredeti munkában úgyis megtalálja.* Ami azonban a szerkesztéssel járó kisebb stilizálásnak indult, az gyakran Horváth Tibor gondolatainak erős tömörítésévé alakult át. Ezenközben gondolatmenetét igyekeztem nem csorbítani. Ha saját szubjektív széljegyzeteimet (a szövegben kurzívval szedve) mondandójától nem mindig sikerült elválasztanom, azért elsősorban tőle kérek elnézést.

2. Az értelem mint függvény

Tökéletes rend álma bizonyára az írásbeliséggel egyidős. A könyvtár mindennapos tevékenysége, az osztályozás megvalósulása révén kerül hol távolabb ettől az eszménytől, hol közelebb hozzá. Ezért a tökélyre való törekvés leginkább az osztályozás fejlődésében érhető tetten.
Horváth Tibor műve méltón képviseli ezt a hagyományt. Mint értekezése alcímében közli, ismeretszervezésről és szintaxisról ír, gondolatmenete azonban ennél jóval többet tartalmaz és igér. Az ismeretszervezésbe ugyanis belehallszik nemcsak az, hogy ma még az ismeret-, azaz az információfeldolgozás korszakát éljük, hanem az is, hogy erről a tudásfeldolgozásra fogunk előbb-utóbb áttérni - márpedig tudáson éppen az igaznak tudott állítások, ismeretek strukturált összességét értjük. Elegendő a "szervezés" szót a strukturálással helyettesítenünk, máris megsejtjük, mekkora, az osztályozástól egész a szakértői rendszerekig nyíló távlatokat hordoz ez a szó.
Mi a szintaxis szerepe az ismeretszervezésben?
Egyelőre elégedjünk meg azzal, hogy bárminemű kulturális termék, így a nyelv is közlésre szolgál, mégpedig értelmes kijelentések közlésére. Az értelem, melyet másképp az adott kód szemantikájának hívunk, nem ugyanolyan független komponense a közlésnek, mint annak szókészlete (lexikája) vagy mondattana (szintaxisa). Utóbbi, mint a nyelvtan (grammatika) megtestesítője felel azért, hogy a szókészlet elemeit külőnféle viszonyegyüttesekbe rendezve, a közlés értelme kibontakozzék. A szemantika tehát a természetes nyelvben e viszonyegyüttesek, tágabban a szintaxis függvénye, ezért a mesterséges nyelvek, ezeken belül az indexelés elméletében is kitüntető hely illeti meg. Az így alkotott indextétel "analógiával élve: "szavak" halmaza, összessége helyett "mondat" szintűvé válik" (Horváth 1978b:10). Az értekezés ezt a gondolatot kíséri kővetkezetesen végig, az elméleti alapvetéstől a gyakorlati alkalmazásig.
Így a mű lényegében egy osztályozástörténeti vonulatra, és ennek a vonulatnak a logikáját megindokló problémafelvetésekre, illetve -megoldásokra tagolható. Ezekhez csatlakozik a PRECIS mélyindexelő nyelv szintaxisának megfeleltetése a magyar nyelvtan követelményeinek.

3. Az értekezés célja

"Értekezésem célja az osztályozáselmélet egy fontos gondolatának kifejtése és igazolása" - Horváth Tibor ezekkel a szavakkal kezdi gondolatmenetét. - "Az indextételnek nemcsak az a feladata, hogy az osztályozandó objektumok változatos ismérveit megadja, hanem az is, hogy az indexelő kifejezéseket olyan magasabb egységben szintetizálja, amely az eredeti közlemény gondolatának, mondandójának tömör reprodukálását is eléri. Oly módon, ahogyan a természetes nyelv szavait a grammatika mondatokká kapcsolja össze. Az osztályozó/indexelő eljárások legtöbbje az általánosan elterjedt és elfogadott modell értelmében az objektumokhoz a kifejezések egy részhalmazát rendeli. Ebből az eljárásból hiányzik a szintaxis, ugyanis a bevezetett relációk érvénye a kifejezéseket tartalmazó szótárra korlátozódik, a relációk ennek folytán nem képesek olyan szintaktikai funkciók betöltésére, amelynek révén a szerző által az eredeti szövegben létrehozott fogalmi kapcsolatok az indextételekben megőrizhetők."

4. Az osztályozás feladata

"Két feladatban szokás megjelölni a könyvtári (beleértve a dokumentációs, információs vagy informatikai) osztályozás célját"- folytatja a szerző. - Az első az egészként vagy egységként tekintett tudománynak, tágabban az emberi ismereteknek részeire vagy specieseire való bontása, felosztása. A második az individuumok, tények, eszmék, elméletek besorolása egy átfogóbb fogalmi osztályba, amelybe valamelyik jellemző tartalmi ismérvük alapján tartoznak. Szigorúan az utóbbit lehet osztályozásnak nevezni, amennyiben az osztályozás nem más, mint osztályba sorolás. Az első feladat szabatosan a felosztás logikai terminusával fejezhető ki. Ennek alapján az információnak (vagy a szakirodalomnak, mint rögzített információnak) osztályozási elmélete a taxonómia általános elméletéből vezethető le. Az utóbbinak egy, a könyvtári-informatikai területre szóló alkalmazásaként határozható meg.
Ez az általánosan elterjedt álláspont nem elegendő a teljes probléma felvetéséhez, mert éppen az utolsó két-három évtized eredményei, elméleti megfontolásai és megállapításai esnek ki abból a keretből, amelyet a fenti megközelítés enged meg. Létezik ugyanis egy harmadik feladat, amely problémaként mindig is fennállt, de az adatbázisok kapcsán különös élességgel bukkant felszínre. Ez pedig az, hogy nemcsak a tudás felosztásáról van szó, nemcsak objektumok, individuumok osztályozásáról, hanem minden olyan megállapítás, ismérv, tulajdonság meghatározásáról és leírásáról, amely valamely objektumról, individuumról, elméletről, eszméről állítható. Ezek az ismérvek, tulajdonságok nevezhetők predikátumoknak.
A klasszikus logikán nyugvó osztályozási elméletektől elszakadni igyekvő osztályozási koncepciók megjelenését - és nyomukban a gyakorlatét - az ötvenes évekre tehetjük. Kibontakozásuk azonban a hatvanas évek eredménye. Az individualizáló "osztályozás" vagy indexelés megjelenése - amely a predikátumok kezelését biztosította - nem tette feleslegessé a klasszikus, felosztás elvű osztályozást sem. Az első két feladat is megmaradt. Nem arról van szó tehát, hogy az indexelő eljárások vagy az információkereső nyelvek felváltották a klasszikus, hagyományos rendszereket, hanem arról, hogy a módosult, vagy új indexelési, osztályozási feladatok új elméletet és gyakorlatot követeltek és hívtak életre, megteremtve az eljárások koegzisztenciáját.
A mai teljes feladatrendszer szolgálatában álló törekvések és elméletek a következő utakat járták, vagy inkább járják.
1. Megmaradtak a hagyományos tudományfelosztáson nyugvó rendszerek, de újak konstruálódtak a régi elveken, keresvén a kor tudományosságát jobban érvényesítő felosztásokat (kidolgozásra került a BSO, Dahlberg optikus rendszere, a legmagasabb szintű rubrikátor). Ezzel párhuzamosan a gyakorlatban korábban bevezetett hagyományos rendszereket minden eddiginél radikálisabb reformmal igyekeztek korszerűsíteni (ETO).
2. A klasszikus logika alapján álló, de a felosztás-osztályozás merevségét oldani kívánó eljárások születtek azzal, hogy a kategóriaelmélet hagyományait elevenítették fel. Eredményként üdvözölhetjük a facettás vagy fazettás osztályozásokat, vagy a facetták beépítését különböző más osztályozások eszköztárába. Ebben az esetben is még mindig osztályozásról van szó a kifejezés szigorú értelmében.
3. A statisztikai elmélet és indexelő eljárások abban kerestek megoldást, hogy az objektumok és a term-ek halmazán értelmezett leképezéssel létesítettek kapcsolatot az objektumok és a term-ek között. Objektumon bármely fizikai létezőt, élőlényt, dokumentumot, szöveget lehet érteni, a term-ek pedig a predikátumok halmazát jelentik (terms, properties, features). Ezt az iskolát G. Salton tökéletesítette a klaszterálásnak (clustering) az információkeresésben megvalósuló bevezetésével.
4. A nyelvészeti iskolák a predikátumot úgy fogták fel, mint olyan állítmányt, amely valamely objektumról elmondható. Egy indextétel valójában mondat, amelyben a term-ek (tárgyszó, vagy bármilyen osztályozási kifejezés) szerepét a nyelvtani esetrendszerrel analóg viszonyokat tükröző ún. operátorok tüntetik fel. Az ebben az eszmében létrehozott minden rendszert egy szintaxis definiál, amely az osztályozási kifejezések bármely gyűjteményére alkalmazható (PRECIS). Ezek a mondatok azonban nemcsak a kifejezé-sek halmazai, dokumentumokhoz rendelt csoportjai, hanem új minőségűek, amennyiben az osztályozási kifejezések szavait olyan mondatokká fogják össze, amelynek jelentése más, mint amit a szavak összessége hordozni képes."

5. Honnan hová

5.1 A tudáspiramis

A következőkben egy igen fontos megkülönböztetésre kerül sor. Előbb a klasszikus rendszerekkel foglalkozván, az osztályozás két lehetséges vezérfonalát határozza meg az értekezés. Eszerint a filozófiai tudományrendszerek az arisztotelészi klasszikus logika felosztáselvén működnek: felosztani annyit tesz, mint az egészet valamely - lényeges-- elv alapján részeire bontani. De mi olyan lényeges, hogy a felosztás alapja lehessen? Az arisztotelészi módszernek ez a gyönge, vitákat provokáló pontja hamar ismeretessé vált.
"Az egyik póluson tehát megjelenik a tárgyi felosztás arisztotelészi elve. A másik pólust a lehetséges felosztási alapok megválasztásához - teljes kifejlettségében - a kibernetika nyújtja, azzal a nevezetes tételével, hogy igen nagy rendszer vagy bonyolult tárgy vizsgálatának eredményei nem függetlenek a megfigyelőtől.
A megfigyelő álláspontja különböző szempontokban jelenik meg felosztási alapként; feltűnik, mint megismerési fokozat, vizsgálati módszer, uralkodó tudományos paradigma, ideológiai nézőpont.
A kibernetika és a rendszerelmélet csupán egzakt szaktudományi igazolását adják annak, hogy a megfigyelő nézőpontja is lehet felosztási alap; azzal nyújtják ezt, hogy cáfolják azt a sokáig uralkodó kartéziánus dichotómiát, amely az anyagi világot, mint kívülállót függetlenítette a megismerő tudattól. Ennek ellenére a megfigyelő nézőpontja jóval korábban megjelenik felosztási alapként. Valószínű, hogy Francis Bacon volt az első, aki ezt érvényesítette. Tudományrendszerét három intellektuális képesség, az emlékezés, képzelet és értelem alakítja."
Bacon egyébként a tudományrendszertannak azt az igényét, hogy a világ a művön keresztül egységes egésznek lássék, így fejezte ki - s innen a disszertáció címe is - : "minden tudomány ága egyazon fa törzsében találkozik" (Horváth 1987:10). A fa törzse tehát, s így a piramis csúcsa a filozófia lett.
Az újkantiánus Rickert óta a tudományokat tárgyuk és módszerük szerint, kétdimenziósan volt szokás felosztani, majd az osztályozás finomítását a felosztási alapok számának növelésével igyekeztek elérni. Mindez már az összetett problémák sok, nem pedig kevés ismérv szerint való kezelése felé mutatott.

5.2 "Nincs világkép"

Jogosult-e azonban a tudáspiramis koncepciója, és ha igen, mennyiben?
"Aki a tudományokat hiererchiába rendezi, eleve feltételezi, hogy a valóság is ilyen szerkezetű." Erre aligha található igazolás.
Lehetséges, hogy mégis a filozófus feladata nehezebb. Az ő vezérelve az, hogy egységes elméletbe foglalja a világ totalitását, elméletébe építve a tudományokat is. Világképet kíván alkotni. És ez az, ami miatt a filozófia mindig is meg fogja kísérelni a tudományokat oly módon rendszerezni, hogy azok világképébe illeszkedjenek.
Az pedig egészen más kérdés, hogy a filozófiának ez az ambíciója hogyan valósul meg, vagy megvalósulhat-e egyáltalán. Pillanatnyilag nincs egységes elmélet, világkép, még egy tudományon belül sincs. Nincs a világról szintézise a fizikának, az élettudományoknak. A kutatás a részeknél tart. A filozófus számára a világkép híján annál inkább szükség van a tudományrendszertanra, mert ezek szerint ez az egyetlen eszköz, ami az emberi tudás egészét keretekbe fogja, megteremtve a részeknek és az egésznek összefüggéseit valamely elv alapján. Talán Jaspersnek van igaza. "Nincs világkép, csak a tudományok rendszere van."

6. Új struktúrák

A második világháborút követően nagy gyorsasággal szaporodtak azok a tudományos eredmények, amelyek nem voltak beilleszthetők a kialakult tudományrendszerek egyikébe sem. Sőt egész diszciplínák születtek, amelyek szintén nem voltak elhelyezhetők. A jelenséget általában az interdiszciplináris területek megjelenéseként, illetve a tudományok integrálódásaként szokták magyarázni. Okának azt tartották, hogy a tudomány a tárgyaként adódó valóságot egyre részletezőbben vizsgálja, a konkrét kutatás egyre kisebb, szűkebb témákat elemez, ezeket azonban teljes komplexitásukban.
A jelenségnek mélyebb okai vannak. Valóban a határterületi diszciplínák sokasodása jelzi ezt a folyamatot. Velük párhuzamosan azonban olyan új tudományok is kialakulnak, amelyek nemcsak azzal minősíthetők, hogy a közös tárgyat, jelenséget több tudomány közelíti, és ebből előbb-utóbb önálló arculatú, új, a tudományhatárok metszetében álló diszciplína keletkezik. Hanem azzal is, hogy ezek az új "tudományközi" diszciplínák a tudományos modellek létrehozásában a kereszteződő tudományok lehetőségeit meghaladó, eltérő, azokéból közvetlenül nem származtatható új eszközökkel mélyítik el a megismerést.
Az a tény, hogy a tudományok az antik kortól a 20. századig a tudományrendszerek tanulsága szerint tárgyukból határozták meg magukat, felfedi e harmadfélezer éves tudomány természetét. A "tárgy" ugyanis az érzékelhető valóság volt akkor is, ha az érzékelhetőség többszörösére tágult a műszerek segítségével. A tudományoknak ez a felállása lehetővé tett egyfajta absztrakciót, amely egyben a megismerés mélységét határozta meg. A lényeg megismerésében addig lehetett elérni, amennyire a tudományos absztrahálás lehetővé tette.
A második világháború után kialakult tudományok jelentós részének - nem előzmények nélkül - olyan tárgya, vizsgálódási területe van, amely nem az érzékelhető valóság feldarabolásából keletkezett. Tárgyuk olyan entitás, amely már emberi absztrakció eredménye. Ez az entitás nem köthető az érzékelhető világ egyik részéhez sem, hanem jelen van a valóság teljességében.
Több olyan új tárgya van a tudománynak, melyekre egyaránt igaz, hogy mintegy "felülről" fedik le az eddigi diszciplínákat, lévén azoknál elvontabbak. Ezek közül is első a rendszerelmélet.
A rendszer olyan, sok komponensű entitás, melyben szükségszerű kölcsönhatások zajlanak le. Vizsgálata új lehetőségeket teremt, mindenekelőtt a tudományok ún. egzaktsági dilemmája tekintetében. Általánosságban az a tudomány egzakt, amely minél több változó viselkedését jósolja meg pontosan. Az eddig megismert természeti törvények két-három komponensűek, ez alól
Einstein híres E=mc2 képlete sem kivétel; ha pedig ennél bonyolultabb, több összetevőjű problémát vizsgáltak, le kellett mondaniuk a pontosságról. "Tehát vagy egzaktság, de kevés változójú törvények, vagy sok változó, de egzaktság nélkül". Bertalanffy ezért tartotta sokváltozós jelenségek egzakt vizsgálatát a rendszerelmélet egyik fő feladatának. Emellett az foglalkozik még a különböző tudományok törvényeinek izomorfiájával is, keresvén bennük azt, ami közös. A szintézishez nem vezethet más út.
Hasonlóan átszervező, másként láttató szerepe van a kibernetikának, a kommunikációnak, a szemiotikának és az információelméletnek is. E diszciplínák tárgya nem a tapasztalható valóság, hanem annak tudati leképezése; karöltve a tudományok fokozódó formalizálásával, rendkívül elvontak, és modellezésre egyaránt alkalmasak. Ami tehát a részterületek integrációjának tűnik, az e harmadik síkba helyezett tudományok visszatüremlése a klasszikus területekbe.
"A fentebb elmondottakat - nem igazolásként, csak példa gyanánt - anekdotikusan is alá lehet támasztani. A Tudomány c. folyóirat érdekes interjút közölt a hazánkban járt B.B. Mandelbrottal, akiről az igen érdekes tulajdonságú Mandelbrot halmazokat elnevezték. Az egyik kérdés úgy szólt, hogyan lehetséges, hogy életének különböző periódusaiban más-más egyetemeken tanított, először nyelvész volt, majd közgazdaságtant oktatott, fizikusként a turbulencia jelenségét kutatta, foglalkozott a Nílus és más folyók viselkedésének szabályszerűségeivel, nevét jegyzik a biológiában, eredményei vannak a matematikában (eredetileg matematikus), jelenleg az IBM-nél kutató. Mandelbrot válaszának lényege az volt, hogy egész életében ugyanazt csinálta. Rátalált egy összefüggésre vagy törvényre, felfedezte a fraktálokat. Nem tehet arról, hogy ezzel a legtávolabbi tudományok problémái magyarázhatók. A válasz annyira frappáns, hogy az itt tárgyalt jelenséget akár Mandelbrot-effektusnak is lehetne hívni."

7. A megfigyelő nézőpontja és a facettás rendszerek

Az osztályozási eljárások másik hagyományos vonulatának a facettás rendszerek tekinthetők. Ezek egyfelől Arisztotelész kategóriaelméletéből, másrészt - Ranganathan kettőspontos osztályozása révén - a hindu filozófiából erednek.
A fogalmi kategáriák olyan állítások, amelyek a mondattól függetlenül mondhatók a szavakról: a lét struktúráiban a létezés legáltalánosabb módjait adják. Céljuk az, hogy a létezőket a legáltalánosabb genusok alá lehessen sorolni. "Ebben mutatkozik meg kapcsolatuk a felosztással. A különbség az, hogy a kategóriák nem eredményeznek a felosztáshoz hasonló hierarchiát, hanem a fogalmak természetét mutatják, hogy mi módon vannak önmagukban" (Horváth 1987:28). Az osztályozáselmélet a létezés legáltalánosabb kategóriáit nevezi vetületeknek (angolul face). Innen az elnevezés.
"Az ötvenes és hatvanas években úgy tűnt, hogy a facettás osztályozás megoldást nyújt számos elméleti kérdésre is. Ennek a két évtizednek erőfeszítései ma már lanyhultak, mert új paradigmák, a statisztikai és nyelvészeti alapozású eljárások tűntek fel. Ezek visszaszorították a facetták gondolatát. Nem mindörökre, mert ebben az eljárásban maradandó elvek is vannak. Maga az alapgondolat, a kategóriák elmélete harmadfélezer éves. A facetták örökös társul szegődtek az osztályozáshoz. Fel-feltűnnek mai rendszerekben is. Sikerüket és maradandóságukat annak köszönhetik, hogy összekötik az eltérő elvü rendszereket. A facetták néha alig különböznek a felosztástól.

Most tehát az eddigiekben többszőr előbukkant vezérgondolat, a jelenségek sokdimenziós, sok változó szerinti osztályozása mellett megjelenik a másik. Egy állandó struktúrán, a facetták változatlan sorrendjén belül a facetták egymáshoz való viszonya testesíti meg a szintaxist, a tetszőleges facettába "tölthető" oszłályozási kifejezések felelnek a szemantikáért. A facetták tehát az arisztotelészi forma, a kifejezések a szubsztancia szerepét játsszák. Horváth Tibor értékelése az, hogy a facettés rendszerek egyfelől a hagyomány rugalmas összegzését eredményezték, másfelől a nyelvészetben gyökerező elméletek kiindulási alapja is lettek. Ennek bizonyítására két rendszert ismertet.
Farradane 1950 és 1955 között pszichológiai alapokon két fogalomnak az ideiglenestől a megszilárdult együttes előfordulásig tartó kapcsolata, valamint e kapcsolat érzékelésének elmélyülése szerint három-három szakaszt, összesen kilenc fokozatot különböztet meg. Így olyan, nyelvtől független operátorokhoz jutott, amelyek alkalmasnak mutatkoztak nemzetközi indexelési eljárások kimunkálására. Ezek az operátorok az értekezésben még visszatérnek.
Jean-Claude Gardin régészeti leletanyag számítógépes feldolgozása során a facettákból indult ki, de a szintaxis következetes alkalmazásával elődeinél jóval tovább jutott. A leletek morfológiai leírása után ugyanis az ornamentikát elemezte, s ekkor döbbent rá, hogy nem az individuális díszítő elemet, hanem a kompozíció egészét kell látni. "Ahogyan a nyelvben az egyes szavak fokozatosan alakulnak át szintagmákká és mondatokká, ugyanúgy alakulnak át az ornamentika elemei a teljes jelentést hordozó kompozícióvá. Ez azonban már nem morfológiai elemzés, hanem szintaktikai" (Horváth 1987a:37). Ezt egészítette ki az ikonográfiai leírás, az alany és a tárgy megkülönböztetésének problémájával. Ha ugyanis egy vázán oroszlánt és embert látunk, egyaránt állítható, hogy "az oroszlán megeszi az embert", illetve hogy "az ember megeszi az oroszlánt", nem mindegy azonban, a "megesz" reláció kire irányul. Gardin a probléma megoldására öt esetet ismerő ragozást vezetett be, végigvíve a nyelvi analógiát.
"Valójában akkor derülhet ki igazán, hogy felosztással vagy fogalmi kategóriákkal van dolgunk, ha a részletek is kibomlanak. A facettás rendszerek nem hoznak létre hierarchiát. Akkor sem, ha egy-két szinten strukturáltak. Arisztotelész gondolata, hogy általános genusok alá rendelje a létezőket, a felosztás gondolatát sugallja.
Másik oldalon a facetták kapcsolatot teremtettek a fogalmi relációkkal. Az ő kibontásuk relációkat - köztük hierarchikus relációkat is - eredményez.
Azok a nehézségek, amelyekkel a klasszikus tudományrendszerek küszködnek, itt nem merülnek fel. Mert a valóságot nem akarják feldarabolni és sémákba erőltetni, hanem a valóság egy-egy arculatát kívánják felmutatni. Ennyi is elég.
Gardin gondolata pedig - szintaxisára gondolva, tehát arra, hogy az osztályozásban, leírásban szerepet kapott tárgyilag összetartozó elemek egy teljes egésszé álljanak össze - már egy nyelvhez vezet el, amelyet információs nyelvnek szokás nevezni.
A facetták joggal tűnnek fel tehát azokban az új próbálkozásokban is, amelyeket a felosztások utolsó mohikánjainak hívhatunk."

8. A jelen alapproblémái

Az osztályozási rendszerek történetében itt rövid kitérőt teszünk. Ennek során az információkereső nyelvek egységeinek megválasztása lesz az egyik fő kérdés, e kifejezések szaknyelvi pontossága, specifikussága a másik. A szintaktikus "alkatrészek" formai és tartalmi meghatározása után kerülhet sor a közöttük lehetséges kapcsolatok, mindazon relációk tárgyalására, melyek a közlés formai-tartalmi oldalát mondat-szintű, nagyobb szemantikai egységgé szervezik.

8.1 Kvantálás

Amit sommásan a tudomány fejlődésének nevezünk, az a valami a formalizálhatóság függvénye. A fejlődés mint műveletsor kitartóan keres egy univerzális függési rendszert, függő és független változókat, a formalizálás pedig nem más, mint ehhez a kiindulási változók meghatározása. Ilyen változókat könnyebb találni a természettudományokban, mint a bölcsészetben, ezért haladnak az előbbiek látványosabban ugyanazon eszköz révén. Ám ettől még a formalizálás első számú problémája egy és ugyanaz marad: hogyan szegmentáljunk? Melyek lesznek azok az egységek, melyekre vonatkozóan aztán a "mi függ mitől" kérdését feltehetjük?
Mielőtt továbbmennénk, ezen a ponton rögzítsünk néhány fogalmat. Mint arra
Horváth Tibor is utal, az információ kvantitatív egysége a bit. Ezzel az egységgel azonban a dokumentumok tartalmának leírásához nem jutunk közelebb. Mivel a tartalom egységevel szeretnénk műveleteket végezni-- Edmund Leach szavaival: holmi szemantikai algebra ismeretleneit keressük--, a tartalmat nem bitekben, hanem nagyobb, ám gondolkodásunk számára még mindig elemien kicsi struktúrákban szeretnénk megtalálni.
A tartalmi információ e kvalitatív egysége lehet pl. néhány, erősen kapcsolódó képzettársítás. Ekkor a neve: kognitívum, és a határát az asszociációs mező, az asszociatív kapcsolatok ereje szabja meg. A kognitívumot legegyszerűbben egy terebélyes, hol ritkább, hol sűrűbb háló bogaiként képzelhetjük el. Ha a bog, vagyis egy sűrűbb hálódarab szögpontjaiban indexkifejezések állnak, melyeket "és"-kapcsolat kőt össze, akkor magunk előtt látjuk az osztályozás kognitívurnát, az osztályozási kifejezések együttes előfordulását. A kifejezések mátrixából ezeket a bogokat a mátrix parcializálásával, feldarabolásával keressük ki, a gyönge kapcsolatokat elválasztva az erősektől, az anyagot mintegy "kicsontozva".
Az információ kvantálásának jelentősége tehát abban áll, hogy a tárolandó anyag természetes egységeit lehet vele meghatározni. Így szakíthatunk az eddigi gyakorlattal, mely egy tárolási egységnek egy formális egységet, azaz egy dokumentumot feleltet meg.

8.2 Heurisztikus információ

A kutató ma már örök tanuló. Ennyiben nem osztom Horváth Tibor optimizmusát, aki szerint "a kutató azért kutató, mert témájáról minden eddigi eredményt ismer. Ha nem így lenne, akkor nem kutatási, hanem tanulási feladatai lennének" (Horváth 1987a:61).
Ám kétségtelen, hogy a kutatói intuíció feltétlenül különbözik abban - például - az anyai ösztöntől, hogy utóbbi tárgya fogható, az előbbié viszont teljességgel foghatatlan. Ráadásul a kutató e foghatatlan felé megtett minden lépését abból a szempontból vizsgálja, vajon érveléséhez a hiányzó láncszemet sikerült-e megtalálnia. Megkaphatná, amit keres, ha tudná, heurisztikusan hol fordult elő hasonló probléma. Vagyis itt viszont a problémák izomorfiájáról van szó. Az információkeresés feladata nem a meglevő ismeretek szaporítása, hanem a meghaladásuk. Vagyis a kutató az információt heurisztikusan keresi, szakmánk viszont a tematikus keresés technikáihoz szokott.
"Egy szakmai példa. Derek de Solla Price törvényszerűséget keresett az információ (dokumentumok) mennyiségi növekedésében. A növekedés tapasztalati tény volt. A probléma tehát úgy merült fel, hogy ez a növekedés mutat-e törvényszerűséget. Van-e valahol már felismert törvény? Valóban, ilyenek adódnak a demográfiából (népességnövekedés), biológiából (sejtszaporodás), közgazdaságtanból (tőkenövekedés) stb. Valamennyi statisztikai összefüggést jelentett, így el lehetett jutni a matematikához, Euler általános növekedési formulájához. A probléma ezek után két részletre volt korlátozható: az adatok illeszkednek-e Euler exponenciális görbéjéhez, illetve meg kellett határozni a görbe meredekségét meghatározó együtthatót.
Számos példa hozható arra is, hogy az egyik tudomány heurisztikusan hogyan termékenyíti meg a másikat. Az előző fejezetek néhány esete is idézhető. Farradane-t a lélektan inspirálja. Gardin a diszciplínák egész sorából építkezik, míg esetrendszerét nyelvészeti megfontolások kísérik. A logika, ismeretelmélet pedig az osztályozási rendszerek fundamentumának bizonyultak."
Mindezt érdemes egybevetnünk a Mandelbrot-hatásról, vagyis a "tudás fölé emelkedésről" mondottakkal. Valószínűleg kibontakozóban van egy olyan irányzat, mely nem elégszik meg a tőrvények Bertalanffy-féle izomorfiájával, hanem a problémák izomorfiája mentén igyekszik előbbre jutni. Ennek egyik előfordulása lehet az az érdekes cikk, mely kimondja: az emlősök élete, a cickánytól az elefántig, lényegében azonos hosszúságú, noha a legnagyobb és a legkisebb ezt az azonos tartamot különböző idő alatt élik át (Gould 1979.). Biológiai és fizikai időt egy koordinátarendszerben ábrázolva, a speciális relativitáselmélet illusztrációjára bukkanunk - az élővilágban.

8.3 A "követő" és a precedens nélküli osztályozás

Hogyan hozzuk le a már ismert, a meglevő tudás szintjére az újat, a még alig-ismertet? Hiányoznak hozzá a megfelelő szavak. A nyelvet tanuló gyerek, a teológia és az osztályozás dilemmája ezen a ponton közös: az "alakját (formáját) kereső tartalom" tipikus esete.
"Az uralkodó osztályozási gyakorlat követő osztályozást produkál. Ezért ellentmondás áll fenn a tudomány folytonos, terminológiájában is megvalósuló változása és az osztályozási rendszerek lehetőségei között. Minél nagyobb az időbeli eltolódás, annál inkább a tudományos újdonságok esnek ennek áldozatul. Ha az osztályozó rendszer nagyon régi, elkendőzi az újdonságot ahelyett, hogy felszínre hozná: az osztályozás saját feladata ellen fordul.
A kutatói információs rendszereknek a nóvumok megtalálása fontos, nem traktálhatnak senkit tudományos közhelyekkel. Ami közismert, azt a kutató már tudja. Az újdonság tulajdonsága pedig az, hogy precedens nélküli. Akkor osztályozásában is érvényesíteni kell a precedens nélküli osztályozás elvét. Azt kell kifejezni, besorolni, ami még nem volt."
Ha végignézünk az eddigieken, mindhárom problémára - a kvantálásra, a heurisztikus információra és a precedens nélküli osztályozásra - az áll, hogy egyedüli orvosságuk as együttes előfordulás, a Luhn szorgalmazta statisztikai kulcsszóelemzés. Ez választja el az összetartozó fogalmakat a nem egymáshoz tartozóaktól, ez bukkan fel az izomorfia mint eszköz használatakor, és ebbe, a fogalmi kapcsolatrendszerbe akaszkodva húzhatjuk le a tegnap még magas ismereteket a magunk szintjére - vagy kapaszkodhatunk fel hozzájuk.

8.4 Specifikusság

Az indexkifejezések specifikusságának elve azt mondja ki, hogy az osztályozásra használt szavak ne legyenek se általánosabbak, se különösebbek a köznyelvben használtnál. Ezt a szegmentálási szintet Luhn alapállása - hogy a keresett ismérvek a dokumentumban vannak, nem kívüle -, valamint az általa ajánlott eljárások jóvoltából képesek vagyunk megtalálni: a keresett szövegszavak és szintagmák számítógéppel meghatározhatók.
"Már Luhn és Meadow is tudták, hogy a szignifikáns kifejezések egy meghatározott gyakorisági intervallumban találhatók, amelyet diszciplínákra jellemzően - tudományonként ugyanis bizonyos eltérések mutatkoznak - tapasztalatilag lehet meghatározni. A generikus fogalmak gyakorisága magasabb, a csökkenő gyakoriság - a szignifikáns kifejezések intervallumán belül - összefügg a specifikusság növekedésével. A specifikus szavak gyakorisága általában alacsony. Másfelől a generikus fogalmak eloszlása egyenletesebb, a specifikusaké általában nem egyenletes; eloszlásuk rokonságot mutat a ritka fémek (pl. wolfram) eloszlásával. Ennek hatása van az elemzésre kiválasztott szövegminták meghatározásában.
A specifikusság növekedik akkor is, ha a szövegből egységszavak (uniterm) helyett szerkezeteket, összetett kifejezéseket határozunk meg."
Horváth Tibor ezután röviden kitér az automatikus indexelés és az automatikus osztályozás viszonyára. Az előbbi az osztályozási kifejezések általánosabb agglomerációit, együttes előfordulásait vizsgálja, és ezzel a szakterületi keresőnyelvek lexikájának, szókészletének meghatározása felé mutat. A másik irány emerre - mondhatni - merőleges: automatikus osztályozáskor a dokumentumhoz a tulajdon szövegéből géppel meghatározott indexértékű kifejezéseket rendeljük hozzá.
Az eddigieket összegezve: mind a jelenlegi gyakorlat, a követő osztályozás, mind pedig az indexkifejezések specifikussága mint követelmény arra ösztönöz, hogy géppel meghatározott szövegszavakat használjunk osztályozásra. Ezzel azonban csak a szókészletet, vagyis a lexikát lehet meghatározni, a szövegszavak közül ugyanis hiányzik a szintaxis.

8.5 Relációmegőrző transzformáció

Az indextétel viszonyrendszere legyen a dokumentum relációinak tükre - erről szól a következő traktátus.
"Az információkereső nyelveknek eddig két tartópillérére derült fény. Az egyiknek az osztályozandó egységek, kvantumok megválasztása, a másiknak a specifikus, az élő szaknyelvvel egybehangzó kulcsszavak bizonyultak. Megvannak tehát az elemek. Bizonyára hiányérzet támad bárkiben, aki látta, hogy ezeket az elemeket értelmes közléssé, összképpé, - Gardint idézve - ikonná, kompozícióvá, mondattá kell összekapcsolni.
A szövegszavas elemzés elemi hiányossága, hogy nem eléggé érzékeny a relációkra. Ez azonban újabb alapprobléma.
Gardin következetesen végiggondolt módszerének ismeretében látható volt, hogy az elemzés harmadik fázisában azt kellett megoldania, hogy az individuális elemek hogyan szerveződnek kompozícióvá. Ez már szintaktikai természetű elemzést kívánt meg, s Gardin nem is habozott nyelvtani esetrendszereket átvenni ahhoz, hogy az individuális elemekből mondatokat generáljon. Azaz: szavakból mondatok állnak elő.
Nyelvet konstruált tehát, és a nyelvnek - formális definíciója értelmében - bizonyos elemeket (szavakat) és viszonyokat kell tartalmaznia. (A formális nyelvek elméletében a jelentés, mint harmadik komponens nem is definíció értékű.) Ha Gardin problémáját az osztályozandó szövegekre, kognitívumokra, dokumentumokra átvisszük, akkor az osztályozáselmélet legmélyebb, legszigorúbb gondolatáig jutunk el. A szövegekben ugyanis a fogalmak bizonyos elrendezésben állnak, rendezettségüket az a viszonyrendszer határozza meg, amelybe a szerző állítja a fogalmakat.
Landry indexelési elméletében az egyik posztulátum erre vonatkozik. A posztulátum azt mondja ki alapelvként, hogy a transzformáció, amely az eredeti szöveget átviszi reprezentációjába (indextételébe), őrizze meg a fogalmak szövegen belüli rendezettségét. Más szóval az a kép, amelyet egy tétel osztályozása nyújt egy szövegről, őrizze meg a fogalmaknak a szövegben egzisztáló viszonyrendszerét. Ez pedig ismét csak szintaktikai probléma."
Mindez persze felveti a maga érdekes kérdéseit. Elsősorban azt, hogy a jelentés függő, a szemantika a szintaxis függvénye. Ennek a függésnek különösen jó példáját ismeri a magyar az ún. mozgó jelentés esetében. A "Jössz-e hozzám feleségül?" és a "Feleségül hozzám jössz-e?" kérdések más értelmi árnyalatait jól halljuk, noha a két mondat egyedül a szavak sorrendjében tér el egymástól. A szavak viszonyrendszerének változása tehát a jelentés változását okozza. Ez még nehezebb feladat elé állítja a fogalomhű, szemantikailag hű szurrogátumok készítőit.

Irodalom:

Gould, S.J. (1979.): One standard lifespan, New Scientist (Feb. 8.]. vol.81, No.1841, 388-389.pp.

Horváth T. (1987a): "Egy törzsnek az ága..." Ismeretszervezés és szintaxis. Kandidátusi értekezés. Budapest.

Horváth Tibor (1987b): "Egy törzsnek az ága..."Ismeretszervezés és szintaxis. Kandidátusi tézisek (OPKM) Budapest.

*Lásd: Horváth Tibor: "Egy törzsnek az ága." Ismeretszervezés és szintaxis. Kanditátusi értekezés. 1987. 164 p. (Megtalálható a KMK Könyvtártudományi Szakkönyvtár állományában.)

A cikk második részét lapunk 3. számában publikáljuk. (A szerk. )

Országos Széchényi Könyvtár
Észrevételek (2000/04/12)