A törzs és az ágak 2.

(Horváth Tibor kandidátusi értekezésének bemutatása)*
9. A szintaxis körül

9.1 Jâtékból komolyan

Kosztolányi ismert évődésével, a fordítás ha szép, nem hű, ha viszont hű, akkor nem szép. Hogyan oldható fel ez az ellentmondás? Az eddigiek ismeretében nem is lehet vitás – a tökéletes indextételtől nem kevesebbet várunk, mint hogy e játékos lehetetlent komolyan valóra váltsa. A mozgó jelentés azért talppontja következő érveinknek, mert a magyarnál kötöttebb szórendű nyelvekben nem, vagy alig fordul elő. Azaz a mi mondataink viszonylag jól tűrik a szórend permutációját A fenti példában – melyhez hasonlókat Horváth Iván idéz, az ófrancia Roland-ének sorainak sorrendi forgatásával is kísérletezve (Horváth 1992:95-96) – a mondat értelme, a házassági ajánlat ugyanaz marad, jelentése azonban aszerint változik, mely szavak kerülnek a nagyobb nyomatékkal bíró pozíciókba, a mondat fókuszába. A nyomatéknak a mondaton végigvonuló, ereszkedő rangsora módosítja a szavak összességének jelentését, ahogyan azok az értelmet megtestesítik.
Mindez egyrészt azért fontos, mert a jelentésnek ez a fajtája ezek után relációnak, nem entitásnak tűnik, másrészt pedig azért, mert e relációnyalábot a szavak sorrendjének forgatása, permutációja által közelítettük meg. Ez a gondolat a magyartól távol, az angol nyelvből dedukált mélyesetgrammatikák táján fog felbukkanni az értekezésben, Derek Austin jóvoltából, a PRECIS egyik fogásaként. Addig azonban még két kitérőt kell tennünk, az egyiket általában a relációk, a másikat pedig a tézauruszok vidékére.
Bevezetésül – egy eszme születésének margójára – Horváth Tibor néhány kérdést tesz fel.

9.2 Ugyanarról másképp

Ismét Gardin gondolata – Kolumbus tojása – idézhető, ha objektumok, eszmék, dokumentumok leírására valamilyen nyelv vehető igénybe, miért ne lehetne ennek a nyelvnek relációit a természetes nyelvből származtatni?
Az információs rendszereknek feltett kérdések is, a rendszer nyújtotta válaszok is természetes nyelvűek. Miért nem lehet közel álló az is a természetes nyelvhez, ami a kérdés és a válasz között van? Kisebb lenne a minden átalakítást, transzformációt kísérő információveszteség.
Már nem vitás, hogy a természetes nyelv produkálja az indexelő kifejezéseket, vagy közvetlenül szövegszavak formájában, vagy közvetve tárgyszójegyzékek, szabályozott szótárak, tézauruszok induló szóanyagaként. Ha a természetes nyelv alkalmas az indexelő terminusok prezentálására, miért ne lenne az a kapcsolatok meghatározására is?
A természetes nyelv abban is mintája az osztályozásnak, hogy benne az elemi egységek (szavak) a gondolatot hordozó mondatokká formálódnak. Vagy sokat citált analógiánkkal fogalmazva: az ornamentikai elemek kompozícióvá állnak össze benne.
Végül, a tájékoztatás helyzete az információ áradatával szemben teljesen reménytelen automatizálás nélkül. Az automatizálás pedig szövegelemzésre épül. Ha a szövegek amúgy is analizálásra kerülnek, akkor miért nem lehet a szó- és kifejezés elemzés eljárásait összekötni a viszonyrendszer elemzésével?
Ez a négy kérdés három feltételt szab meg.
- Minden szövegelemzés konkrét nyelvhez van kötve. (Orosz, angol, magyar, stb.) Az elemzési eljárások csupán analógiaként vihetők át egyik nyelvről a másikra. Az elemzéseket ennek folytán a tájékoztatás forrásdokumentumainak minden nyelvén el kell végezni.
- A tudomány nemzetközi, a szövegek különböző nyelvűek. Azokat a relációkat azonban, amelyeket bármilyen eljárás meghatároz, már nem lehet egyik nyelvhez sem kötni. Valamilyen “metanyelvi”, nyelvek fölötti, minden nyelvben élő, közös viszonyrendszerre lenne szükség. Kérdés, hogy az általános nyelvészetben megvan-e a felkészültség erre?
- Végül, a kapcsolatoknak nemcsak szemantikai relációknak kell lenniök, amelyek tisztába teszik a kifejezések jelentését és bizonyos kontextustól független viszonyok meghatározását engedik meg (pl. hogy a ló patás emlős), hanem szintaktikaiaknak, hogy az adott szövegben érvényes viszonyrendszer transzformációja megőrizze a szövegbéli rendezettséget. Azaz: a csak fogalmaknak a dokumentumokhoz rendelésével végzett osztályozás helyett – ez képes rámutatni a témára – olyan eljárás szülessen, amely a gondolatot, tézist, elméletet, tehát a szöveg mondandóját, állítását képes felmutatni. Az osztályozás számára a természetes nyelvnek fontossága mind lexikai, mind szintaktikai szempontból a fentiekből ered. Ebből még nem következik, hogy az információt leíró nyelvnek szövegszavasnak kelt lennie.
Aligha kell azonban azt kifejteni, hogy a természetes nyelv viszonyrendszere soha nem képezhető le egyértelműen osztályozási kapcsolatokká. Az elemzés nehézsége éppen abban áll, hogy a kapcsolat többértelmű: egy osztályozási viszonynak több grammatikai eset felelhet meg, és viszont.
Az első (alighanem egyetlen) közlemény, amely a magyar nyelv esetrendszere és az osztályozási relációk közt kapcsolatot keresett, 1968-ban látott napvilágot. Ez is csak a magyar határozórendszerrel foglalkozik. Példaként bemutatjuk annak igazolására, hogy a határozók esetrendszere miként alkalmas osztályozási relációk meghatározására. A magyar határozók az alábbiak:

inessivus (valamiben)
elativus (valamiből)
illativus (valamibe)

superessivus (valamin)

delativus (valamiről)

sublativus (valamire)

adessivus (valaminél)

ablativus (valamitől)

allativus (valamihez)

locativus (valahol)
terminatívus (valameddig)

dativus (valami részére)

temporalis (valamikor)

iterativus (ismétlődés, pl. naponta)

essivus (valamiül való lét, pl. kutyául)

factitivus (valamivé)

instrumentalis (valamivel)

comitativus (valamistül)

causalis (valami miatt, okból)

finalis (valamiért, valami célból)

modalis (valami módon)

formalis (valamiképpen, valami alakban)
distributivus (részletekbe vétel, pl. egyenként)
multiplicativus (valahányszor)

E huszonnégy határozóból öt csoport képezhető, amelyek az osztályozásban relációként értékelhetők:
1. csoport: -ben, valamin, -nél, valahol, -kor;
2. csoport: -ből, -ről, -től, valami miatt;
3. csoport: -be, -re, -hez, valameddig, -nek, valamivé, valami célból;
4. csoport: ismétlődés, valamiül, valami módon, -ként, valahányszor,
5. csoport: -vel, -stül.
Az öt kapcsolatfajta azonban csak kontextusban élhet, nem építhető be a tézauruszba, tárgyszógyűjteménybe.

9.3 A relációktól a mélyesetig

Mindjárt adódik tehát az információkereső nyelvek és az osztályozási rendszerek relációinak egyik fontos típuspárja. Léteznek olyanok, amelyek az indextételben élnek és a kifejezések szintaktikai viszonyait fejezik ki. Az indextételt egésszé, mondatértékűvé konstruálják. A másik fajta kapcsolat az osztályozási kifejezések szótárába, tézauruszba, tárgyszójegyzékbe épül be. Független az indextételektől.
E megkülönböztetés megjelenik Gardin rendszerében, a SYNTOL-ban. Ott a priori a kapcsolat akkor, ha előre tudható és a term definíciójától függ. A reláció a posteriori, ha csak a szöveg vizsgálatából határozható meg. Az előbbi szemantikai kapcsolat, az utóbbi szintaktikai. PI. a “szék” alárendelt viszonyban áll a “bútor”-ral, ez a fogalom definíciójából derül ki: a szék olyan bútor, amely… Ez a viszony tehát szemantikai, a priori. A szék azonban lehet pl. artisták eszköze egy mutatványban. Itt a szék a kellékek egyike, de ez a kapcsolat nem ered a definícióból, csak a kontextusból állapítható meg. Csak az adott szövegben keletkezett viszony, a szerző hozta létre, érvényessége is csak az adott szövegre állítható.
Kezd kibontakozni a kapcsolat két fajtájának természete. Az is, hogy miért kell ezeket így elkülöníteni. Hiába épül be ugyanis egy tézauruszba vagy más szótárba a szék-bútor faj-nem reláció, mert ez aligha segít azon, akit a székekkel végrehajtható artistamutatvány után keres. A keresőkérdések sem az egyedi fogalmak szerint, vagy ezek egyszerű halmazata alapján hangzanak el, hanem a mondatok szintjén: a kérdésben az elemek szintaktikai kapcsolatokkal összeforrott kifejezésekké válnak. A példánál maradva: a szék instrumentum, eszköz, a természetes nyelvben eszközhatározó, az osztályozásban instrumentális viszonyban kell megjelenjék. Semmire nem megyünk azzal, hogy a szék bútor.
De honnan származzanak akkor a relációk? Ismét csak kérdezhető, hogy ha az információ leírására szolgáló nyelv elemei a természetes nyelvből valók, akkor eredhetnek-e innen a relációk is?
Derek Austin érdeme, hogy a generatív grammatika mélyesetrendszerét felfedezte erre a célra és inkorporálta az osztályozáselméletbe. Lépése igen merész volt, mert a nyelvészek maguk is bizonyos szkepszissel fogadják ezt az elméletet. Noam Chomsky sem tekinti mélystruktúra koncepcióját megállapodott elméletnek.
A mélyesetrendszer Fillmore nevéhez fűződik, s lényegében azt mondja ki, hogy miként a mondat felszíni struktúrája alatt húzódik a mondatkezdeményeknek az a mélyrétege, melyből – a megfelelő szabályokat betartva – szabatos közleményt generálhatunk, úgy épül a mondat szemantikája is egy mélyebben fekvő, a felszíni jelentést viszonyegyüttesével meghatározó talapzatra. E talapzat moduljai, kockakővel hat, de esetleg több mélyeset: a cselekvő, a cselekvés és a művelet tárgya közötti változó viszonyrendszer stabil nézetei. Austin a PRECIS céljaira Fillmore rendszerének továbbfejlesztett, kilenc mélyesetet tartalmazó változatát vezette be.

Az esetrendszer így alakul:

1. Szenvedő, patientivus (patient)
Dolog, amelyen végbemegy a rajta végrehajtott, az ige által megnevezett cselekvésnek megfelelő feltétel- vagy állapotváltozás. A fa magas. János betörte az ablakot.
2. Komplementum
Kiegészíti, részletezi, specifikálja az igét. János egy himnuszt énekel. János hatvan fontot nyom.
3. Eredmény, factitivus
Az ige által kifejezett cselekvés eredménye, terméke. János épített egy házat.
4. Kedvezményezett (beneficiary)
Rá irányul a cselekvés, anélkül azonban, hogy helyzete, vagy a feltételek megváltoznának. János elveszítette a pénztárcáját.
5. Cselekvő, agentivus (agent)
A cselekvés végrehajtója, ösztönzője. János újságos olvas.
6. Eszköz, instrumentalis
Amit/akit a cselekvő felhasznál a cselekvés végrehajtásához vagy ösztönzéséhez. János egy késsel elvágta a kötelet.
7. Átélő (experiencer)
Képessége az ige által hordozott cselekvés felfogása, de maga nem megy át állapotváltozáson. János szerelembe esett Máriával.
8. Hely, locativus
A térbeli korlátozás esete. Budapesten hideg tél volt.
9. Idő, temporalis
Az időbeli korlátozás esete. Tegnap eset

Az eseteket generáló igéknek négy fajtája van. Kifejezhetnek:
- állapotot (az út széles, a váza törött)
- folyamatot (a ruha beszakadt)
- “tárgyatlan” cselekvést (a madarak elköltöztek)
- “tárgyas” cselekvést (János betörte az ablakot).
Az esetrendszert “univerzális”-nak mondják, mindenesetre a nyelvtől függetlennek. (A néki tulajdonított univerzális grammatika ellen Chomsky tiltakozott, mondván, hogy nincs univerzális grammatika, csak univerzális grammatikai elmélet.)
Ha a mélyesetrendszer bármely természetes nyelvben képes megszerkeszteni a mondatot, akkor az osztályozásban is viszont kell látnunk őket. Mielőtt erre a problémára rátérnénk, a relációk miatt egy viharos gyorsasággal elterjedt irányzatot érdemes megvizsgálni.

Intermezzo: a tézauruszok

A hatvanas és hetvenes években általánossá vált az a felismerés és meggyőződés, hogy a relációk az osztályozásban elem-értékűek. Ez a rendszerelméleti fogalom azt jelezte, hogy a reláció az osztályozó/indexelő rendszereknek ugyanolyan értékű része, mint a szótári egységek, illetve fogalmak.
A tézaurusz relációk azonban kontextustól függetlenek, a kapcsolatokból csak annyit lehet egy tézauruszba beépíteni, amennyit a fogalmakról önmagukban állítani lehet. A már ismert kifejezéssel élve, a priori relációkra koncentrál. Egy tézaurusz nem képes megmondani a felhasználás módját, nem szól semmit arról, hogyan lehet a szöveg kapcsolatait megőrizni. Tehát nem tesz eleget a kapcsolatmegőrző transzformáció követelményének.
Eredményei ellenére a tézaurusz megjelenése azt a fejlődési vonalat szakította meg, amely az osztályozó/indexelő rendszereket egyre erősebben a természetes nyelv szintaxisához kötötte. A tézauruszok kapcsolata a természetes nyelvvel csak abban állt, hogy fogalommeghatározó, fogalomgyűjtő módszerei között előnyben részesítette a természetes nyelv szó- és szerkezet-gyakorisági vizsgálatát.
A tézauruszépítés maga munkaigényes feladat. Hiszen a kifejezések összegyűjtése és szelektálása után fel kellett ismerni minden deszkriptor kapcsolatát minden olyan más deszkriptorral, amelyhez a bevezetett relációk valamelyike érvényes. Az intellektuális ráfordítás igen magas volt, amit nem mindig lehetett biztosítani. Ennek az lett a következménye, hogy a relációk terén újabb és újabb kompromisszumok születtek. Az igényesség lanyhult, a tézauruszok tendáltak a régi tárgyszórendszerek felé. Végül alig maradt több, mint a szinonima, homonima reláció, a genus-species, a totum-pars, és egy “rokon” (related term) kapcsolat.
A tézauruszok elégtelensége nem abban áll, hogy ezeket a relációkat a szótárba bevezették, hanem abban, hogy itt rekedtek meg. Szemantikai megoldást kínálnak olyan problémára, amelyik alapvetően szintaktikai természetű. A tézauruszok relációi nem vesznek részt az indextételek felírásában. Az osztályozás/indexelés ezért a végtermékben, a dokumentum tükörképében nem tudja a tézauruszrelációkat szerephez juttatni. Ezeknek a relációknak a haszna csak annyi, hogy az indexelőt segítik a helyes kifejezések kiválasztásában. (A visszakeresésben e relációk kaphatnak szerepet. Ezzel a témával itt nem foglalkozunk.)
Maga a tézauruszelmélet nem vonja feltétlenül maga után ezt a követelményt. Sem a tézauruszok elszegényítését, sem a szintaxis negligálását. A szintaxisra orientáló nyelvek, így pl. a PRECIS kezelni tud tézauruszból származó kifejezéseket is. Pontosabban: tudna kezelni.
A tézaurusz-kérdést erősen megkeverte a többnyelvűség problémája. Világosan látni kell, hogy a tézaurusz relációk szemantikai kapcsolatot tükröznek, ezek pedig jobbára nyelvhez kötöttek. A többnyelvű tézaurusz feltételezi a kifejezések mellett a kapcsolatok megfeleltetését is. Mivel ez veszteség nélkül nem lehetséges, azért a javasolt megoldások formálisak, tehát nem megoldások. A többnyelvű tézaurusz deszkriptorcikkei feltüntethetik a két (több) nyelv közötti különbségeket. De ez nem szünteti meg a problémát, csak jelzi, hogy létezik. Azzal a jelzéssel, ami nem jár együtt a zajok eltűnésével, nem kezdhető semmi.
A tézauruszok a fentiek miatt egy fejlődésben megrekedt kezdeménynek bizonyultak. Mivel nemzetközi rendszerek pártfogása alatt állnak, a tézaurusz-intermezzo olyan közjátéknak bizonyult a hangversenyben, ami az egész előadás helyére küzdötte fel magát, miközben maga az előadás elmaradt.
Mióta Leibniz feltételezte a nyelvi univerzálék létét, azóta kísért mindenfajta fordítás kísérlete körűt, hogy egyik nyelvről a másikra a közlés értelmét e közös nevező által ültessük át. A természetes nyelvekben azonban nem lehetett az univerzálé nyomára bukkanni. Érthető, hogy megszületett a metanyelv, a nyelv leírására szolgáló, alatta vagy felette húzódó, de mindenképpen rajta túli közlés gondolata. Farradane relációs indexelése vagy Gardin Ieíró nyelve, a SYNTOL erre volt példa.
A mélyesetek a Chomsky-féle generatív grammatikából, egy univerzálisnak tudott nyelvelméletből származnak. Logikus feltételezni, hogy a mondatok ilyen prekurzoraira mint egyetemes alapra támaszkodva a nemzetközi rendszerek terminológiai egyeztetése is megoldható.
Négy-öt szó halmaza még nem mondat. Akkor sem, ha jelentésüket pontosították egy szótárban és relációikat más lexikai egységekhez meghatározták.
Szükségszerű, hogy az információkereső nyelvek elmélete elvezessen ehhez a felismeréshez és keresse azt a grammatikát, amely az indextételekben az elemeket magasabb egységbe szintetizálja. Ennek a grammatikának azt is biztosítania kell, hogy átmentse az eredeti szövegben élő kapcsolatokat az indextételekbe.
Az információkereső nyelvek lexikájában egy fejlődési sor tapasztalható: a fejlődés állomásait a tárgyszavas osztályozás – információs tézaurusz – szintaktikus nyelvek szakaszai mutatják. Mindegyik fejlődési fázis kimunkál egész sor hasznos módszert, megoldást a rákövetkezd számára. A tárgyszavas osztályozás már csírájában hordozza azokat a szemantikai megoldásokat, amelyek majd a tézauruszokban teljes pompával bontakoznak ki. A tézauruszok a relációk szerepének hangsúlyozásával előkészítik a talajt a szintaktikai nyelvek számára.
A szintaktikai információkereső nyelvek is leírnak egy fejlődési sort. Foskett ezt a Farradane-féle indexelés – SYNTOL – PRECIS fejlődésében látja. Ezen az úton a szintaktikai szabályok formalizálódnak. Mindegyik a temészetes nyelv grammatikájára tekint, miközben igyekeznek a konkrét természetes nyelvektől elszakadni. Szintaxisuk mintegy metanyelvi, a viszonyrendszert mélyebben és következetesebben kívánják definiálni bármely nyelv nyelvtanánál. Ezért alkalmasak nemzetközi használatra is. Óhatatlanul felmerül tehát az a gondolat, hogy a nemzetközi rendszereknek ezen az úton kellene a “nyelvi kihívás” nehézségeit leküzdeniük.
A 9.3 fejezet leírta a mélyeseteket, bár létüket nyelvészek is provizórikusnak tekintik. A figyelem mégis feléjük fordult.
A SYNTOL is metanyelvről beszél, amelynek igen egyszerűnek kell lennie, azért, hogy képes legyen az inputok (különböző természetes nyelvek) széles körét befogadni. A SYNTOL bevezeti a kételemű szintagmákat (dyadic string), amelyek két osztályozási kifejezésből és ezek viszonyából állnak. A kapcsolatok négy általánosított nyelvtani esetben jelennek meg. Ezek megfogalmazása még nem árulja el a természetes nyelvi gyökereket, értelmezésük, kibontásuk azonban igen. Minden eset kimunkálja a maga számára azt, hogy grammatikailag hogyan értelmezendő. A négy eset, reláció az alábbi:
1. Predikativ. Rendszerint melléknév + főnév alakú. PI. broader term (tágabb osztályozási kifejezés).
2. Asszociatív. Alakja szerint főnév + főnév. PI. információ, visszakeresés.
3. Egymásra következő (consecutive). A fogalmak függőségét az a sorrend mutatja, amely az eredeti szövegben található. PI. háború (okozta) gazdasági válság.
4. Koordinatív. Feltételezi az összehasonlítás eszméjét, jelenlétét. PI. kórházi ápolás, otthoni ápolás.
Azonnal szembeötlik: e négy reláció arra törekszik, hogy a szövegekből felismerhető legyen. Figyeljük meg, alkalmasak-e arra, hogy segítségükkel létrejöjjön a relációmegőrző transzformáció.
A négy reláció pontos definíciója hiányzik. Részben azért, mert csak kereteket kíván adni. Másfelől a Gardin vezette csoport éppen arra törekedett, hogy a kontextus mutassa világosan a viszony fajtáját. A viszonyok meghatározása nem azt mondja meg pontosan, hogy a reláció mi, hanem inkább azt, hogyan fordul elő a kontextusban.
A SYNTOL Farradane relácionális indexeléséhez képest szemlátomást határozott előrelépés. A fejlődés újabb fázisát egy egészen perfekt szintaktikájú rendszer, a PRECIS (PREserved Context Indexing System) képviseli.

9. 6. A PRECIS

9.6.1. Gardin oroszlánja és a predikátumtranszformáció

A PRECIS olyan szintaxis, amely különböző típusú osztályozási kifejezésekre alkalmazható. Szabad szövegszavak, tárgyszavak, deszkriptorok egytagú kifejezések és szintagmák esetén egyaránt. Célja az, hogy az osztályozási/indexelési elemekből mondatokat állítson össze, a természetes nyelv mondataihoz hasonló indextételt.
Egy PRECIS indextétel annyiban nem hasonIít a természetes nyelvi mondatra, hogy hiányzik belőle az állítmány. Valójában mégis mondat, mert a Gigli Verdit énekel mondat helyett a Gigli Verdi éneklése a transzformációs-generatív grammatika értelmében ugyanannak a magmondatnak a transzformációja. Eszerint egy PRECIS indextétel valódi mondat.
Mivel a PRECIS használatáról néhány éve elég részletes tájékoztató jelent meg (Horváth -Orbán 1987), ehelyütt meg kell elégednünk a legmarkánsabb ötletek említésével. Az indexmondat belső viszonyait ún. operátorok fejezik ki, melyek egyenként több mélyesetnek felelnek meg. Közülük a magoperátorok a cselekvést, a cselekvés tárgyát és végzőjét (ágensét) határozzák meg, valamint annak helyét, térbeli körülhatároltságát. Mindezt a magon kívüli fogalmak – még szintén elsődleges – operátorai egészítik ki. A természetes nyelvi mondat bővítményeinek szerepét az indextételben a másodlagos operátorok látják el, amilyen a “rész/egésze”, az “alá/fölérendelés”, a “kvázigenerikus”, a “mellérendelő” vagy az “asszociatív hasonlítás” kapcsolat.
Emellett Austin kiegészítő kódrendszert vezetett be a ragok (végződések) beillesztésére, több téma szétválasztására, tipográfiai megoldásokra, kifejezések helyettesítésére bizonyos feltételek esetén.
A PRECIS az indextételből – egyszerű permutációs szabállyal – háromféle szóláncot állít elő úgy, hogy minden erre kijelölt tárgyszó megjelenik vezérszóként, a módosító értelmű második, illetve a kiegészítő harmadik pozícióban is. Vagyis a mélyindexelés mellé a mozgó jelentés használata is társul.
E tételszerkezet megfelel a tárgy-állítmányalany szerkezetű, illetve egy angol szenvedő szerkezetű mondatnak. PI. egy népdalt énekelt a kórus; the book was written by John – ezek a mondatok egyaránt (1),(2), (3) operátorsémát kívánnak.
A forgatási szabály ezt fokozatosan (3), (2), (1) alakúvá változtatja: a kórus énekelt egy népdalt, illetve John wrote the book.
Bizonyos szóláncok esetén a tárgyszavak sorrendje nem vezet a tétel egyértelmű jelentéséhez. Filozófus, matematikus és tanítás említéséből a tárgyszavak rotálása folytán az az érzésünk is támadhat, hogy a matematikusok tanítják a filozófusokat, nem fordítva. Gardin oroszlánjának a problémája, a “Ki esz meg kit?” tehát visszatér. Az elegáns megoldás az ún, predikátum- (állítmány-) transzformáció; ez megváltoztatja a tárgyszavak helyét a módosító második, illetve a kiegészítő harmadik láncpozícióban. Ennek hatására ilyen, magyarul is szabatos tételek jönnek létre: “Matematikusok. Filozófusok tanítása”, vagy István. Újság. Olvasás”.
A mélyesetrendszer és a PRECIS rokonsága riasztóan hathat arra, aki a PRECIS gyakorlati alkalmazására gondol. Ám az osztályozónak, aki a PRECIS-t használja, csak az operátor funkcióját kell ismernie, nem szükséges elmélyednie a mélyesetek tanulmányozásában. Tudnia kell továbbá azt, hogy bizonyos operátor-konstellációk hogyan hatnak a bemeneti tételek szerkezetére. Az operátorok eredetét nem kell firtatnia. Az indexelés folyamata úgy zajlik, hogy az indexelő személy megfogalmaz egy természetes nyelvű mondatot, amely az osztályozási egység mondandójának összegzése. A mondathoz csak a szótárban (tézauruszban) felsorolt kifejezéseket használhatja. Ha ilyen eszköze nincs, mondata állhat szabad szövegszavakból is. A mondatot ezután elemeire bontja. Először a cselekvést, majd ennek tárgyát, azután végrehajtóját határozza meg, tehát a magoperátorokat. Erre a keretre építi a továbbiakat, a kifejezésekhez hozzárendelve a megfelelő egyéb elsődleges és másodtagos operátorokat. Az egész folyamat számítógéppel támogatható.
A PRECIS élő, fejlesztés alatt álló szintaxis, de keretei elég szilárdak ahhoz, hogy gyakorlati bevezetésére gondolni lehessen. Jelenlegi fejlesztése már csak kisebb finomításokra irányul. Viszont igen intenzív a kutatás azon a téren, hogy a PRECIS előnyelt az adatbázisok szervezésében is meg lehessen tartani. Kétségtelen, hogy a tárolási-visszakeresési oldalról a PRECIS kevésbé kidolgozott.
A funkcionáló adatbázisok ugyanis még olyan filozófia alapján születtek – nemcsak a szakirodalmi, hanem más adatbázisok is -, amelyek a Jonker-Salton-Soergel modellre épülnek. Mint láttuk, ebben a modellben az információrendszerek objektumok és ismérvek halmazából és a közöttük létrehozott leképezésből álltak. A modellben tehát dokumentumokhoz az ismérvek egy részhalmaza tartozik, különösebb kapcsolatok nélkül. Vagy fordítva: egy indexelő kifejezés a dokumentumok részhalmaza. A keresőprofilban a visszakeresés során az ismérvek között a Boole-algebra operátorai (és, vagy, nem) teremtenek kapcsolatot. Ezek azonban mások, mint a PRECIS relációi, az utóbbiak finomságait nem lehet a szokványos keresőprofilokban érvényesíteni.
Bár a kutatás ezen a téren a kezdeteknél tart, előzetesen az alábbiak megfontolása szükséges.
A PRECIS indextételekből előállított láncok {mondatok) tárolhatók, elérésüket a vezető pozícióban álló kifejezés biztosítja.
A keresőprofilok konstruálása során a Boole-algebrai operátorok helyett a PRECIS szerepoperátorok adhatják a profil szerkezetét. A logikai operátorokra szükség van ugyan bizonyos részletekben, de nem azok adják a profil vázát.
A PRECIS-operátorokkal felírt keresőprofil a mag-, illetve főoperátorokra koncentrál, a többi csupán ennek variációiban kap szerepet. A profil írása a (2) operátor, a cselekvés, hatás meghatározásával indul, majd másodikként ha van tárgya, akkor az (1) operátorral jelölt kifejezés határozható meg; ha viszont nincs, akkor az ágenst kell leírni. A harmadik lépés a másodiktól függetlenül az ágens leírásából áll, ha az létezik.
Ez a profil redundáns az indextételekhez képest. A keresés pontosítása további operátorok (“része”, “tulajdonsága”, “csoportja” stb.) fokozatos beépítésével lehetséges, mindig vigyázva, hogy a profil redundáns volta megmaradjon.
A PRECIS indexelését is magában hordozó adatbázis lekérdező nyelve lényegesen bonyolultabb, mint az egyszerűségüknél fogva a felhasználó által is kezelhető jelenlegiek. Lényegesen több ugyanis a PRECIS operátorok száma, a logikai operátorokénak ötszöröse. Valószínű tehát, hogy intelligens profilszerkesztőkre lesz szükség, a lekérdezés pedig kevésbé lesz a felhasználó dolga.

9.6.2 A PRECIS magyar alkalmazása

A PRECIS-t az Országos Pedagógiai Információs Rendszer (OPIR) építésére adaptálták Horváth Tibor és munkatársai. A rendszer szervezési elvei nem tartoznak szorosan vett tárgyunkhoz, a lekérdezés praktikus mikéntje pedig még jelenleg is kutatás tárgya. A magyar változat néhány sajátosságát az alábbiakban foglalja össze a szerző:
A PRECIS eredetileg angol nyelvre készült, de fentebb látható volt, hogy eleve egy “metanyelvi” szintet is tekintetbe vett, mint bármely komoly indexelési/osztályozási eljárás Farradane óta.
A legszembetűnőbb különbség az angol és magyar változat között kézenfekvően az, hogy az angol prepozíciók helyét a magyarban ragok vagy más toldalékok foglalják el. Ragozott szerkezeteknek adott esetben a sorrendje is változik pl. birtokos jelzős szintagmákban.
További feladatként az jelentkezett, hogy a magyarban a toldalék megváltoztathatja a tőalakot is. Az átalakítás kezdeteinél úgy tűnt, hogy a legtöbb feladat a predikátumtranszformációval és a hozzá hasonló ún. invertált formával lesz. Mindkettő az indexfogalmak helyes sorrendjének kialakítását szolgálja. Az angol kedvelt szenvedő szerkezeteitől tartottunk, amit az (1) (2) (3) operátorséma is mutat. (Mária van szeretve/szeretett János által.) Csakhogy a rotálási szabály értelmében a láncok fordított olvasat szerint alakulnak ki, így a szenvedő szerkezetek az angolban is cselekvővé válnak. (János szereti Máriát.) Megengedhető az (1) (2) (3) séma is, ami megfelel Máriát János szereti mondatnak. Mivel egy ún. “üres hely” beiktatásával a program leállítja a predikátumtranszformációt vagy az invertálós műveletét, elég rugalmasan lehet a magyar tételek és láncok sorrendjét alakítani. A felvonultatott eszköztár a magyar szórend meghatározásához elegendő, amelyhez az is könnyítésként társul, hogy a magyar nyelv kevésbé érzékeny a szórendre.
Végül feltétlenül szót érdemel az egyes szám-többes szám szabályozása. Az eddigi példákból feltűnhetett, hogy váltogatva, elég szabadon jelennek meg mind az egyes, mind a többes számú főnevek. A magyar változat közel áll az angoléhoz. A szabályozás keret jellegű, csupán útmutatásul szolgál.

10.Összefoglalás helyett

Az értekezés gondolatmenetének megismétlése helyett búcsúzóul két adalékkal szeretnék szolgálni. Az egyik: éppen az automatikus osztályozás irányából támadhat vetélytársa az Austin-féle mélyindexelésnek. Mint Lochbaum és Streeter kutatásaiból kiderül, a látens szemantikai indexelésnek nevezett eljárás a faktoranalízis osztályába tartozó megoldás, mely a kulcsszavak terét kísérletűkben mintegy százdimenziósra zsugorítja. A dokumentumokat ezzel a száz mesterséges kulcsszóval indexelik, melyek elvont, egyébként nem létező fogalmaknak felelnek meg, de a dokumentumok eredeti viszonyrendszerét híven megőrzik (Lochbaum – Streeter 1989). Hasonló, magasabb fokú morfológiákkal folyó kísérletekről nemrégiben magam is tudósítottam (Darányi 1991). A törzs és az ágak tehát nőnek tovább, az osztályozástörténet nem zárul le egyhamar.
A másik: a jelentés többrétegű nyelvszemiotikai fogalom. Értjük alatta azt a dolgot, amire a jel utal, azt a tudattartalmat, amit a jel felidéz, a jel által a befogadóban kiváltott hatást, de a jel információt közlő, érzelmi, felszólító funkcióját is. Többnyire entitásnak szokás tartani, de viselkedhet relációszerűen is. Kettős természetét Paul Ricceur a magfizika részecske/hullám kettőséhez hasonlította (Johnson 1988:168). Talán már nincs messze az a nap, mikor képesek leszünk megmutatni, hogy akár a kovalens vagy a poláris kötés a kémiai kötések alesetei, a felsorolt négy jelentés-definíció is ugyanannak az általános szemantikának az állandósult nézetei. S ha ez konklúziónak szokatlan is, úgy érzem, illik ide: Horváth Tibor munkájának érdemét ugyanis éppen abban látom, hogy rendhagyó kérdésfeltevéseivel a kutató intellektuális kíváncsiságát a végletekig csigázza.

* A tanulmány első részét lapunk 1992. 1. számában publikáltuk. Emlékeztetjük olvasóinkat arra is, hogy Darányi Sándor szubjektív “széljegyzeteit” a szövegben kurzívval szedtük. (A szerk.)

Irodalom:

Darányi Sándor (1991): Az automatikus osztâlyozástól a magasabb fokú morfológiákig. Könyvtári Figyelő 37.évf. 1.sz. 418-422.p.
Horváth Iván (1992): A három verselmélet. In: Szili József (szerk.): A strukturalizmus után. Érték, vers, hatás, történet, nyelv az irodalomelméletben. Budapest, Akadémiai Kiadó, 1992. 57-107.p.
Horváth Tibor – Orbán Éva (1987): PRECIS. TMT 34.évf. 7. sz. 311-323.p.
Johnson, M.L. (1988): Mind, Language, Machine. Artificial Intelligence in the Poststructuralist Age. New York, St. Martin’s Press.
Lochbaum, K.E. – Streeter, L.A. (1989): Comparing and Combining the Effectiveness of Latent Semantic Indexing and the Ordinary Vector Space Model for Information Retrieval, Information Processing and Management. Vol. 25. no.6. 665-676.p.

A bejegyzés kategóriája: 1992. 3. szám
Kiemelt szavak: , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!