38. évfolyam, 1992. 3. szám |
Archívum |
A törzs és az ágak 2.
(Horváth Tibor kandidátusi értekezésének bemutatása)*
Darányi Sándor
9. A szintaxis körül
9.1 Jâtékból komolyan
Kosztolányi ismert évődésével, a
fordítás ha szép, nem hű, ha viszont hű, akkor nem szép. Hogyan oldható
fel ez az ellentmondás? Az eddigiek ismeretében nem is lehet vitás - a tökéletes
indextételtől nem kevesebbet várunk, mint hogy e játékos lehetetlent komolyan
valóra váltsa. A mozgó jelentés azért talppontja következő érveinknek,
mert a magyarnál kötöttebb szórendű nyelvekben nem, vagy alig fordul elő.
Azaz a mi mondataink viszonylag jól tűrik a szórend permutációját A fenti
példában - melyhez hasonlókat Horváth Iván idéz, az ófrancia Roland-ének
sorainak sorrendi forgatásával is kísérletezve (Horváth 1992:95-96) -
a mondat értelme, a házassági ajánlat ugyanaz marad, jelentése azonban aszerint
változik, mely szavak kerülnek a nagyobb nyomatékkal bíró pozíciókba, a mondat
fókuszába. A nyomatéknak a mondaton végigvonuló, ereszkedő rangsora módosítja
a szavak összességének jelentését, ahogyan azok az értelmet megtestesítik.
Mindez egyrészt azért fontos, mert a jelentésnek ez a fajtája ezek után relációnak,
nem entitásnak tűnik, másrészt pedig azért, mert e relációnyalábot a szavak
sorrendjének forgatása, permutációja által közelítettük meg. Ez a gondolat a
magyartól távol, az angol nyelvből dedukált mélyesetgrammatikák táján fog
felbukkanni az értekezésben, Derek Austin jóvoltából, a PRECIS egyik
fogásaként. Addig azonban még két kitérőt kell tennünk, az egyiket általában
a relációk, a másikat pedig a tézauruszok vidékére.
Bevezetésül - egy eszme születésének margójára - Horváth Tibor néhány
kérdést tesz fel.
9.2 Ugyanarról másképp
Ismét Gardin gondolata - Kolumbus
tojása - idézhető, ha objektumok, eszmék, dokumentumok leírására valamilyen
nyelv vehető igénybe, miért ne lehetne ennek a nyelvnek relációit a természetes
nyelvből származtatni?
Az információs rendszereknek feltett kérdések is, a rendszer nyújtotta válaszok
is természetes nyelvűek. Miért nem lehet közel álló az is a természetes
nyelvhez, ami a kérdés és a válasz között van? Kisebb lenne a minden átalakítást,
transzformációt kísérő információveszteség.
Már nem vitás, hogy a természetes nyelv produkálja az indexelő kifejezéseket,
vagy közvetlenül szövegszavak formájában, vagy közvetve tárgyszójegyzékek, szabályozott
szótárak, tézauruszok induló szóanyagaként. Ha a természetes nyelv alkalmas
az indexelő terminusok prezentálására, miért ne lenne az a kapcsolatok
meghatározására is?
A természetes nyelv abban is mintája az osztályozásnak, hogy benne az elemi
egységek (szavak) a gondolatot hordozó mondatokká formálódnak. Vagy sokat citált
analógiánkkal fogalmazva: az ornamentikai elemek kompozícióvá állnak össze benne.
Végül, a tájékoztatás helyzete az információ áradatával szemben teljesen reménytelen
automatizálás nélkül. Az automatizálás pedig szövegelemzésre épül. Ha a szövegek
amúgy is analizálásra kerülnek, akkor miért nem lehet a szó- és kifejezés elemzés
eljárásait összekötni a viszonyrendszer elemzésével?
Ez a négy kérdés három feltételt szab meg.
- Minden szövegelemzés konkrét nyelvhez van kötve. (Orosz, angol, magyar, stb.)
Az elemzési eljárások csupán analógiaként vihetők át egyik nyelvről
a másikra. Az elemzéseket ennek folytán a tájékoztatás forrásdokumentumainak
minden nyelvén el kell végezni.
- A tudomány nemzetközi, a szövegek különböző nyelvűek. Azokat a relációkat
azonban, amelyeket bármilyen eljárás meghatároz, már nem lehet egyik nyelvhez
sem kötni. Valamilyen "metanyelvi", nyelvek fölötti, minden nyelvben élő,
közös viszonyrendszerre lenne szükség. Kérdés, hogy az általános nyelvészetben
megvan-e a felkészültség erre?
- Végül, a kapcsolatoknak nemcsak szemantikai relációknak kell lenniök, amelyek
tisztába teszik a kifejezések jelentését és bizonyos kontextustól független
viszonyok meghatározását engedik meg (pl. hogy a ló patás emlős), hanem
szintaktikaiaknak, hogy az adott szövegben érvényes viszonyrendszer transzformációja
megőrizze a szövegbéli rendezettséget. Azaz: a csak fogalmaknak a dokumentumokhoz
rendelésével végzett osztályozás helyett - ez képes rámutatni a témára - olyan
eljárás szülessen, amely a gondolatot, tézist, elméletet, tehát a szöveg mondandóját,
állítását képes felmutatni. Az osztályozás számára a természetes nyelvnek fontossága
mind lexikai, mind szintaktikai szempontból a fentiekből ered. Ebből
még nem következik, hogy az információt leíró nyelvnek szövegszavasnak kelt
lennie.
Aligha kell azonban azt kifejteni, hogy a természetes nyelv viszonyrendszere
soha nem képezhető le egyértelműen osztályozási kapcsolatokká. Az
elemzés nehézsége éppen abban áll, hogy a kapcsolat többértelmű: egy osztályozási
viszonynak több grammatikai eset felelhet meg, és viszont.
Az első (alighanem egyetlen) közlemény, amely a magyar nyelv esetrendszere
és az osztályozási relációk közt kapcsolatot keresett, 1968-ban látott napvilágot.
Ez is csak a magyar határozórendszerrel foglalkozik. Példaként bemutatjuk annak
igazolására, hogy a határozók esetrendszere miként alkalmas osztályozási relációk
meghatározására. A magyar határozók az alábbiak:
inessivus | (valamiben) |
elativus | (valamiből) |
illativus |
(valamibe) |
superessivus |
(valamin) |
delativus |
(valamiről) |
sublativus |
(valamire) |
adessivus |
(valaminél) |
ablativus |
(valamitől) |
allativus |
(valamihez) |
locativus | (valahol) |
terminatívus |
(valameddig) |
dativus |
(valami részére) |
temporalis |
(valamikor) |
iterativus |
(ismétlődés, pl. naponta) |
essivus |
(valamiül való lét, pl. kutyául) |
factitivus |
(valamivé) |
instrumentalis |
(valamivel) |
comitativus |
(valamistül) |
causalis |
(valami miatt, okból) |
finalis |
(valamiért, valami célból) |
modalis |
(valami módon) |
formalis | (valamiképpen, valami alakban) |
distributivus | (részletekbe vétel, pl. egyenként) |
multiplicativus |
(valahányszor) |
E huszonnégy határozóból öt csoport képezhető,
amelyek az osztályozásban relációként értékelhetők:
1. csoport: -ben, valamin, -nél, valahol, -kor;
2. csoport: -ből, -ről, -től, valami miatt;
3. csoport: -be, -re, -hez, valameddig, -nek, valamivé, valami célból;
4. csoport: ismétlődés, valamiül, valami módon, -ként, valahányszor,
5. csoport: -vel, -stül.
Az öt kapcsolatfajta azonban csak kontextusban élhet, nem építhető be a
tézauruszba, tárgyszógyűjteménybe.
9.3 A relációktól a mélyesetig
Mindjárt adódik tehát az információkereső
nyelvek és az osztályozási rendszerek relációinak egyik fontos típuspárja. Léteznek
olyanok, amelyek az indextételben élnek és a kifejezések szintaktikai viszonyait
fejezik ki. Az indextételt egésszé, mondatértékűvé konstruálják. A másik
fajta kapcsolat az osztályozási kifejezések szótárába, tézauruszba, tárgyszójegyzékbe
épül be. Független az indextételektől.
E megkülönböztetés megjelenik Gardin rendszerében, a SYNTOL-ban. Ott
a priori a kapcsolat akkor, ha előre tudható és a term definíciójától
függ. A reláció a posteriori, ha csak a szöveg vizsgálatából határozható
meg. Az előbbi szemantikai kapcsolat, az utóbbi szintaktikai. PI. a "szék"
alárendelt viszonyban áll a "bútor"-ral, ez a fogalom definíciójából derül ki:
a szék olyan bútor, amely... Ez a viszony tehát szemantikai, a priori.
A szék azonban lehet pl. artisták eszköze egy mutatványban. Itt a szék a kellékek
egyike, de ez a kapcsolat nem ered a definícióból, csak a kontextusból állapítható
meg. Csak az adott szövegben keletkezett viszony, a szerző hozta létre,
érvényessége is csak az adott szövegre állítható.
Kezd kibontakozni a kapcsolat két fajtájának természete. Az is, hogy miért kell
ezeket így elkülöníteni. Hiába épül be ugyanis egy tézauruszba vagy más szótárba
a szék-bútor faj-nem reláció, mert ez aligha segít azon, akit a székekkel végrehajtható
artistamutatvány után keres. A keresőkérdések sem az egyedi fogalmak szerint,
vagy ezek egyszerű halmazata alapján hangzanak el, hanem a mondatok szintjén:
a kérdésben az elemek szintaktikai kapcsolatokkal összeforrott kifejezésekké
válnak. A példánál maradva: a szék instrumentum, eszköz, a természetes nyelvben
eszközhatározó, az osztályozásban instrumentális viszonyban kell megjelenjék.
Semmire nem megyünk azzal, hogy a szék bútor.
De honnan származzanak akkor a relációk? Ismét csak kérdezhető, hogy ha
az információ leírására szolgáló nyelv elemei a természetes nyelvből valók,
akkor eredhetnek-e innen a relációk is?
Derek Austin érdeme, hogy a generatív grammatika mélyesetrendszerét felfedezte
erre a célra és inkorporálta az osztályozáselméletbe. Lépése igen merész volt,
mert a nyelvészek maguk is bizonyos szkepszissel fogadják ezt az elméletet.
Noam Chomsky sem tekinti mélystruktúra koncepcióját megállapodott elméletnek.
A mélyesetrendszer Fillmore nevéhez fűződik, s lényegében
azt mondja ki, hogy miként a mondat felszíni struktúrája alatt húzódik a mondatkezdeményeknek
az a mélyrétege, melyből - a megfelelő szabályokat betartva - szabatos
közleményt generálhatunk, úgy épül a mondat szemantikája is egy mélyebben fekvő,
a felszíni jelentést viszonyegyüttesével meghatározó talapzatra. E talapzat
moduljai, kockakővel hat, de esetleg több mélyeset: a cselekvő, a
cselekvés és a művelet tárgya közötti változó viszonyrendszer stabil nézetei.
Austin a PRECIS céljaira Fillmore rendszerének továbbfejlesztett,
kilenc mélyesetet tartalmazó változatát vezette be.
Az esetrendszer így alakul:
1. Szenvedő, patientivus (patient)
Dolog, amelyen végbemegy a rajta végrehajtott, az ige által megnevezett
cselekvésnek megfelelő feltétel- vagy állapotváltozás. A fa magas. János
betörte az ablakot.
2. Komplementum
Kiegészíti, részletezi, specifikálja az igét. János egy himnuszt énekel.
János hatvan fontot nyom.
3. Eredmény, factitivus
Az ige által kifejezett cselekvés eredménye, terméke. János épített egy
házat.
4. Kedvezményezett (beneficiary)
Rá irányul a cselekvés, anélkül azonban, hogy helyzete, vagy a feltételek
megváltoznának. János elveszítette a pénztárcáját.
5. Cselekvő, agentivus (agent)
A cselekvés végrehajtója, ösztönzője. János újságos olvas.
6. Eszköz, instrumentalis
Amit/akit a cselekvő felhasznál a cselekvés végrehajtásához vagy ösztönzéséhez.
János egy késsel elvágta a kötelet.
7. Átélő (experiencer)
Képessége az ige által hordozott cselekvés felfogása, de maga nem megy át
állapotváltozáson. János szerelembe esett Máriával.
8. Hely, locativus
A térbeli korlátozás esete. Budapesten hideg tél volt.
9. Idő, temporalis
Az időbeli korlátozás esete. Tegnap esett az eső.
Az eseteket generáló igéknek négy fajtája
van. Kifejezhetnek:
- állapotot (az út széles, a váza törött)
- folyamatot (a ruha beszakadt)
- "tárgyatlan" cselekvést (a madarak elköltöztek)
- "tárgyas" cselekvést (János betörte az ablakot).
Az esetrendszert "univerzális"-nak mondják, mindenesetre a nyelvtől függetlennek.
(A néki tulajdonított univerzális grammatika ellen Chomsky tiltakozott,
mondván, hogy nincs univerzális grammatika, csak univerzális grammatikai elmélet.)
Ha a mélyesetrendszer bármely természetes nyelvben képes megszerkeszteni a mondatot,
akkor az osztályozásban is viszont kell látnunk őket. Mielőtt erre
a problémára rátérnénk, a relációk miatt egy viharos gyorsasággal elterjedt
irányzatot érdemes megvizsgálni.
Intermezzo: a tézauruszok
A hatvanas és hetvenes években általánossá
vált az a felismerés és meggyőződés, hogy a relációk az osztályozásban
elem-értékűek. Ez a rendszerelméleti fogalom azt jelezte, hogy a reláció
az osztályozó/indexelő rendszereknek ugyanolyan értékű része, mint
a szótári egységek, illetve fogalmak.
A tézaurusz relációk azonban kontextustól függetlenek, a kapcsolatokból csak
annyit lehet egy tézauruszba beépíteni, amennyit a fogalmakról önmagukban állítani
lehet. A már ismert kifejezéssel élve, a priori relációkra koncentrál.
Egy tézaurusz nem képes megmondani a felhasználás módját, nem szól semmit arról,
hogyan lehet a szöveg kapcsolatait megőrizni. Tehát nem tesz eleget a kapcsolatmegőrző
transzformáció követelményének.
Eredményei ellenére a tézaurusz megjelenése azt a fejlődési vonalat szakította
meg, amely az osztályozó/indexelő rendszereket egyre erősebben a természetes
nyelv szintaxisához kötötte. A tézauruszok kapcsolata a természetes nyelvvel
csak abban állt, hogy fogalommeghatározó, fogalomgyűjtő módszerei
között előnyben részesítette a természetes nyelv szó- és szerkezet-gyakorisági
vizsgálatát.
A tézauruszépítés maga munkaigényes feladat. Hiszen a kifejezések összegyűjtése
és szelektálása után fel kellett ismerni minden deszkriptor kapcsolatát minden
olyan más deszkriptorral, amelyhez a bevezetett relációk valamelyike érvényes.
Az intellektuális ráfordítás igen magas volt, amit nem mindig lehetett biztosítani.
Ennek az lett a következménye, hogy a relációk terén újabb és újabb kompromisszumok
születtek. Az igényesség lanyhult, a tézauruszok tendáltak a régi tárgyszórendszerek
felé. Végül alig maradt több, mint a szinonima, homonima reláció, a genus-species,
a totum-pars, és egy "rokon" (related term) kapcsolat.
A tézauruszok elégtelensége nem abban áll, hogy ezeket a relációkat a szótárba
bevezették, hanem abban, hogy itt rekedtek meg. Szemantikai megoldást kínálnak
olyan problémára, amelyik alapvetően szintaktikai természetű. A tézauruszok
relációi nem vesznek részt az indextételek felírásában. Az osztályozás/indexelés
ezért a végtermékben, a dokumentum tükörképében nem tudja a tézauruszrelációkat
szerephez juttatni. Ezeknek a relációknak a haszna csak annyi, hogy az indexelőt
segítik a helyes kifejezések kiválasztásában. (A visszakeresésben e relációk
kaphatnak szerepet. Ezzel a témával itt nem foglalkozunk.)
Maga a tézauruszelmélet nem vonja feltétlenül maga után ezt a követelményt.
Sem a tézauruszok elszegényítését, sem a szintaxis negligálását. A szintaxisra
orientáló nyelvek, így pl. a PRECIS kezelni tud tézauruszból származó kifejezéseket
is. Pontosabban: tudna kezelni.
A tézaurusz-kérdést erősen megkeverte a többnyelvűség problémája.
Világosan látni kell, hogy a tézaurusz relációk szemantikai kapcsolatot tükröznek,
ezek pedig jobbára nyelvhez kötöttek. A többnyelvű tézaurusz feltételezi
a kifejezések mellett a kapcsolatok megfeleltetését is. Mivel ez veszteség nélkül
nem lehetséges, azért a javasolt megoldások formálisak, tehát nem megoldások.
A többnyelvű tézaurusz deszkriptorcikkei feltüntethetik a két (több) nyelv
közötti különbségeket. De ez nem szünteti meg a problémát, csak jelzi, hogy
létezik. Azzal a jelzéssel, ami nem jár együtt a zajok eltűnésével, nem
kezdhető semmi.
A tézauruszok a fentiek miatt egy fejlődésben megrekedt kezdeménynek bizonyultak.
Mivel nemzetközi rendszerek pártfogása alatt állnak, a tézaurusz-intermezzo
olyan közjátéknak bizonyult a hangversenyben, ami az egész előadás helyére
küzdötte fel magát, miközben maga az előadás elmaradt.
Mióta Leibniz feltételezte a nyelvi univerzálék létét, azóta kísért
mindenfajta fordítás kísérlete körűt, hogy egyik nyelvről a másikra
a közlés értelmét e közös nevező által ültessük át. A természetes nyelvekben
azonban nem lehetett az univerzálé nyomára bukkanni. Érthető, hogy megszületett
a metanyelv, a nyelv leírására szolgáló, alatta vagy felette húzódó, de mindenképpen
rajta túli közlés gondolata. Farradane relációs indexelése vagy Gardin
Ieíró nyelve, a SYNTOL erre volt példa.
A mélyesetek a Chomsky-féle generatív grammatikából, egy univerzálisnak
tudott nyelvelméletből származnak. Logikus feltételezni, hogy a mondatok
ilyen prekurzoraira mint egyetemes alapra támaszkodva a nemzetközi rendszerek
terminológiai egyeztetése is megoldható.
Négy-öt szó halmaza még nem mondat. Akkor sem, ha jelentésüket pontosították
egy szótárban és relációikat más lexikai egységekhez meghatározták.
Szükségszerű, hogy az információkereső nyelvek elmélete elvezessen
ehhez a felismeréshez és keresse azt a grammatikát, amely az indextételekben
az elemeket magasabb egységbe szintetizálja. Ennek a grammatikának azt is biztosítania
kell, hogy átmentse az eredeti szövegben élő kapcsolatokat az indextételekbe.
Az információkereső nyelvek lexikájában egy fejlődési sor tapasztalható:
a fejlődés állomásait a tárgyszavas osztályozás - információs tézaurusz
- szintaktikus nyelvek szakaszai mutatják. Mindegyik fejlődési fázis kimunkál
egész sor hasznos módszert, megoldást a rákövetkezd számára. A tárgyszavas osztályozás
már csírájában hordozza azokat a szemantikai megoldásokat, amelyek majd a tézauruszokban
teljes pompával bontakoznak ki. A tézauruszok a relációk szerepének hangsúlyozásával
előkészítik a talajt a szintaktikai nyelvek számára.
A szintaktikai információkereső nyelvek is leírnak egy fejlődési sort.
Foskett ezt a Farradane-féle indexelés - SYNTOL - PRECIS fejlődésében
látja. Ezen az úton a szintaktikai szabályok formalizálódnak. Mindegyik a temészetes
nyelv grammatikájára tekint, miközben igyekeznek a konkrét természetes nyelvektől
elszakadni. Szintaxisuk mintegy metanyelvi, a viszonyrendszert mélyebben és
következetesebben kívánják definiálni bármely nyelv nyelvtanánál. Ezért alkalmasak
nemzetközi használatra is. Óhatatlanul felmerül tehát az a gondolat, hogy a
nemzetközi rendszereknek ezen az úton kellene a "nyelvi kihívás" nehézségeit
leküzdeniük.
A 9.3 fejezet leírta a mélyeseteket, bár létüket nyelvészek is provizórikusnak
tekintik. A figyelem mégis feléjük fordult.
A SYNTOL is metanyelvről beszél, amelynek igen egyszerűnek kell lennie,
azért, hogy képes legyen az inputok (különböző természetes nyelvek) széles
körét befogadni. A SYNTOL bevezeti a kételemű szintagmákat (dyadic string),
amelyek két osztályozási kifejezésből és ezek viszonyából állnak. A kapcsolatok
négy általánosított nyelvtani esetben jelennek meg. Ezek megfogalmazása még
nem árulja el a természetes nyelvi gyökereket, értelmezésük, kibontásuk azonban
igen. Minden eset kimunkálja a maga számára azt, hogy grammatikailag hogyan
értelmezendő. A négy eset, reláció az alábbi:
1. Predikativ. Rendszerint melléknév + főnév alakú. PI. broader
term (tágabb osztályozási kifejezés).
2. Asszociatív. Alakja szerint főnév + főnév. PI. információ,
visszakeresés.
3. Egymásra következő (consecutive). A fogalmak függőségét
az a sorrend mutatja, amely az eredeti szövegben található. PI. háború (okozta)
gazdasági válság.
4. Koordinatív. Feltételezi az összehasonlítás eszméjét, jelenlétét.
PI. kórházi ápolás, otthoni ápolás.
Azonnal szembeötlik: e négy reláció arra törekszik, hogy a szövegekből
felismerhető legyen. Figyeljük meg, alkalmasak-e arra, hogy segítségükkel
létrejöjjön a relációmegőrző transzformáció.
A négy reláció pontos definíciója hiányzik. Részben azért, mert csak kereteket
kíván adni. Másfelől a Gardin vezette csoport éppen arra törekedett,
hogy a kontextus mutassa világosan a viszony fajtáját. A viszonyok meghatározása
nem azt mondja meg pontosan, hogy a reláció mi, hanem inkább azt, hogyan fordul
elő a kontextusban.
A SYNTOL Farradane relácionális indexeléséhez képest szemlátomást határozott
előrelépés. A fejlődés újabb fázisát egy egészen perfekt szintaktikájú
rendszer, a PRECIS (PREserved Context Indexing System) képviseli.
9. 6. A PRECIS
9.6.1. Gardin oroszlánja és a predikátumtranszformáció
A PRECIS olyan szintaxis, amely különböző típusú osztályozási kifejezésekre
alkalmazható. Szabad szövegszavak, tárgyszavak, deszkriptorok egytagú kifejezések
és szintagmák esetén egyaránt. Célja az, hogy az osztályozási/indexelési elemekből
mondatokat állítson össze, a természetes nyelv mondataihoz hasonló indextételt.
Egy PRECIS indextétel annyiban nem hasonIít a természetes nyelvi mondatra, hogy
hiányzik belőle az állítmány. Valójában mégis mondat, mert a Gigli Verdit
énekel mondat helyett a Gigli Verdi éneklése a transzformációs-generatív
grammatika értelmében ugyanannak a magmondatnak a transzformációja. Eszerint
egy PRECIS indextétel valódi mondat.
Mivel a PRECIS használatáról néhány éve elég részletes tájékoztató jelent
meg (Horváth -Orbán 1987), ehelyütt meg kell elégednünk a legmarkánsabb
ötletek említésével. Az indexmondat belső viszonyait ún. operátorok fejezik
ki, melyek egyenként több mélyesetnek felelnek meg. Közülük a magoperátorok
a cselekvést, a cselekvés tárgyát és végzőjét (ágensét) határozzák meg,
valamint annak helyét, térbeli körülhatároltságát. Mindezt a magon kívüli fogalmak
- még szintén elsődleges - operátorai egészítik ki. A természetes nyelvi
mondat bővítményeinek szerepét az indextételben a másodlagos operátorok
látják el, amilyen a "rész/egésze", az "alá/fölérendelés", a "kvázigenerikus",
a "mellérendelő" vagy az "asszociatív hasonlítás" kapcsolat.
Emellett Austin kiegészítő kódrendszert vezetett be a ragok (végződések)
beillesztésére, több téma szétválasztására, tipográfiai megoldásokra, kifejezések
helyettesítésére bizonyos feltételek esetén.
A PRECIS az indextételből - egyszerű permutációs szabállyal -
háromféle szóláncot állít elő úgy, hogy minden erre kijelölt tárgyszó megjelenik
vezérszóként, a módosító értelmű második, illetve a kiegészítő harmadik
pozícióban is. Vagyis a mélyindexelés mellé a mozgó jelentés használata is társul.
E tételszerkezet megfelel a tárgy-állítmányalany szerkezetű, illetve egy
angol szenvedő szerkezetű mondatnak. PI. egy népdalt énekelt a
kórus; the book was written by John - ezek a mondatok egyaránt (1),(2),
(3) operátorsémát kívánnak.
A forgatási szabály ezt fokozatosan (3), (2), (1) alakúvá változtatja: a
kórus énekelt egy népdalt, illetve John wrote the book.
Bizonyos szóláncok esetén a tárgyszavak sorrendje nem vezet a tétel egyértelmű
jelentéséhez. Filozófus, matematikus és tanítás említéséből a tárgyszavak
rotálása folytán az az érzésünk is támadhat, hogy a matematikusok tanítják a
filozófusokat, nem fordítva. Gardin oroszlánjának a problémája, a "Ki
esz meg kit?" tehát visszatér. Az elegáns megoldás az ún, predikátum- (állítmány-)
transzformáció; ez megváltoztatja a tárgyszavak helyét a módosító második, illetve
a kiegészítő harmadik láncpozícióban. Ennek hatására ilyen, magyarul is
szabatos tételek jönnek létre: "Matematikusok. Filozófusok tanítása", vagy István.
Újság. Olvasás".
A mélyesetrendszer és a PRECIS rokonsága riasztóan hathat arra, aki a PRECIS
gyakorlati alkalmazására gondol. Ám az osztályozónak, aki a PRECIS-t használja,
csak az operátor funkcióját kell ismernie, nem szükséges elmélyednie a mélyesetek
tanulmányozásában. Tudnia kell továbbá azt, hogy bizonyos operátor-konstellációk
hogyan hatnak a bemeneti tételek szerkezetére. Az operátorok eredetét nem kell
firtatnia. Az indexelés folyamata úgy zajlik, hogy az indexelő személy
megfogalmaz egy természetes nyelvű mondatot, amely az osztályozási egység
mondandójának összegzése. A mondathoz csak a szótárban (tézauruszban) felsorolt
kifejezéseket használhatja. Ha ilyen eszköze nincs, mondata állhat szabad szövegszavakból
is. A mondatot ezután elemeire bontja. Először a cselekvést, majd ennek
tárgyát, azután végrehajtóját határozza meg, tehát a magoperátorokat. Erre a
keretre építi a továbbiakat, a kifejezésekhez hozzárendelve a megfelelő
egyéb elsődleges és másodtagos operátorokat. Az egész folyamat számítógéppel
támogatható.
A PRECIS élő, fejlesztés alatt álló szintaxis, de keretei elég szilárdak
ahhoz, hogy gyakorlati bevezetésére gondolni lehessen. Jelenlegi fejlesztése
már csak kisebb finomításokra irányul. Viszont igen intenzív a kutatás azon
a téren, hogy a PRECIS előnyelt az adatbázisok szervezésében is meg lehessen
tartani. Kétségtelen, hogy a tárolási-visszakeresési oldalról a PRECIS kevésbé
kidolgozott.
A funkcionáló adatbázisok ugyanis még olyan filozófia alapján születtek - nemcsak
a szakirodalmi, hanem más adatbázisok is -, amelyek a Jonker-Salton-Soergel
modellre épülnek. Mint láttuk, ebben a modellben az információrendszerek objektumok
és ismérvek halmazából és a közöttük létrehozott leképezésből álltak. A
modellben tehát dokumentumokhoz az ismérvek egy részhalmaza tartozik, különösebb
kapcsolatok nélkül. Vagy fordítva: egy indexelő kifejezés a dokumentumok
részhalmaza. A keresőprofilban a visszakeresés során az ismérvek között
a Boole-algebra operátorai (és, vagy, nem) teremtenek kapcsolatot. Ezek azonban
mások, mint a PRECIS relációi, az utóbbiak finomságait nem lehet a szokványos
keresőprofilokban érvényesíteni.
Bár a kutatás ezen a téren a kezdeteknél tart, előzetesen az alábbiak megfontolása
szükséges.
A PRECIS indextételekből előállított láncok {mondatok) tárolhatók,
elérésüket a vezető pozícióban álló kifejezés biztosítja.
A keresőprofilok konstruálása során a Boole-algebrai operátorok helyett
a PRECIS szerepoperátorok adhatják a profil szerkezetét. A logikai operátorokra
szükség van ugyan bizonyos részletekben, de nem azok adják a profil vázát.
A PRECIS-operátorokkal felírt keresőprofil a mag-, illetve főoperátorokra
koncentrál, a többi csupán ennek variációiban kap szerepet. A profil írása a
(2) operátor, a cselekvés, hatás meghatározásával indul, majd másodikként ha
van tárgya, akkor az (1) operátorral jelölt kifejezés határozható meg; ha viszont
nincs, akkor az ágenst kell leírni. A harmadik lépés a másodiktól függetlenül
az ágens leírásából áll, ha az létezik.
Ez a profil redundáns az indextételekhez képest. A keresés pontosítása további
operátorok ("része", "tulajdonsága", "csoportja" stb.) fokozatos beépítésével
lehetséges, mindig vigyázva, hogy a profil redundáns volta megmaradjon.
A PRECIS indexelését is magában hordozó adatbázis lekérdező nyelve lényegesen
bonyolultabb, mint az egyszerűségüknél fogva a felhasználó által is kezelhető
jelenlegiek. Lényegesen több ugyanis a PRECIS operátorok száma, a logikai operátorokénak
ötszöröse. Valószínű tehát, hogy intelligens profilszerkesztőkre lesz
szükség, a lekérdezés pedig kevésbé lesz a felhasználó dolga.
9.6.2 A PRECIS magyar alkalmazása
A PRECIS-t az Országos
Pedagógiai Információs Rendszer (OPIR) építésére adaptálták Horváth Tibor
és munkatársai. A rendszer szervezési elvei nem tartoznak szorosan vett tárgyunkhoz,
a lekérdezés praktikus mikéntje pedig még jelenleg is kutatás tárgya. A magyar
változat néhány sajátosságát az alábbiakban foglalja össze a szerző:
A PRECIS eredetileg angol nyelvre készült, de fentebb látható volt, hogy
eleve egy "metanyelvi" szintet is tekintetbe vett, mint bármely komoly indexelési/osztályozási
eljárás Farradane óta.
A legszembetűnőbb különbség az angol és magyar változat között kézenfekvően
az, hogy az angol prepozíciók helyét a magyarban ragok vagy más toldalékok foglalják
el. Ragozott szerkezeteknek adott esetben a sorrendje is változik pl. birtokos
jelzős szintagmákban.
További feladatként az jelentkezett, hogy a magyarban a toldalék megváltoztathatja
a tőalakot is. Az átalakítás kezdeteinél úgy tűnt, hogy a legtöbb
feladat a predikátumtranszformációval és a hozzá hasonló ún. invertált formával
lesz. Mindkettő az indexfogalmak helyes sorrendjének kialakítását szolgálja.
Az angol kedvelt szenvedő szerkezeteitől tartottunk, amit az (1) (2)
(3) operátorséma is mutat. (Mária van szeretve/szeretett János által.)
Csakhogy a rotálási szabály értelmében a láncok fordított olvasat szerint alakulnak
ki, így a szenvedő szerkezetek az angolban is cselekvővé válnak. (János
szereti Máriát.) Megengedhető az (1) (2) (3) séma is, ami megfelel
Máriát János szereti mondatnak. Mivel egy ún. "üres hely" beiktatásával
a program leállítja a predikátumtranszformációt vagy az invertálós műveletét,
elég rugalmasan lehet a magyar tételek és láncok sorrendjét alakítani. A felvonultatott
eszköztár a magyar szórend meghatározásához elegendő, amelyhez az is könnyítésként
társul, hogy a magyar nyelv kevésbé érzékeny a szórendre.
Végül feltétlenül szót érdemel az egyes szám-többes szám szabályozása. Az eddigi
példákból feltűnhetett, hogy váltogatva, elég szabadon jelennek meg mind
az egyes, mind a többes számú főnevek. A magyar változat közel áll az angoléhoz.
A szabályozás keret jellegű, csupán útmutatásul szolgál.
10.Összefoglalás helyett
Az értekezés gondolatmenetének
megismétlése helyett búcsúzóul két adalékkal szeretnék szolgálni. Az egyik:
éppen az automatikus osztályozás irányából támadhat vetélytársa az Austin-féle
mélyindexelésnek. Mint Lochbaum és Streeter
kutatásaiból kiderül, a látens szemantikai indexelésnek nevezett eljárás a faktoranalízis
osztályába tartozó megoldás, mely a kulcsszavak terét kísérletűkben mintegy
százdimenziósra zsugorítja. A dokumentumokat ezzel a száz mesterséges kulcsszóval
indexelik, melyek elvont, egyébként nem létező fogalmaknak felelnek meg,
de a dokumentumok eredeti viszonyrendszerét híven megőrzik (Lochbaum
- Streeter 1989). Hasonló, magasabb fokú morfológiákkal folyó kísérletekről
nemrégiben magam is tudósítottam (Darányi 1991). A törzs és az ágak tehát
nőnek tovább, az osztályozástörténet nem zárul le egyhamar.
A másik: a jelentés többrétegű nyelvszemiotikai fogalom. Értjük alatta
azt a dolgot, amire a jel utal, azt a tudattartalmat, amit a jel felidéz, a
jel által a befogadóban kiváltott hatást, de a jel információt közlő, érzelmi,
felszólító funkcióját is. Többnyire entitásnak szokás tartani, de viselkedhet
relációszerűen is. Kettős természetét Paul Ricceur a magfizika
részecske/hullám kettőséhez hasonlította (Johnson 1988:168). Talán
már nincs messze az a nap, mikor képesek leszünk megmutatni, hogy akár a kovalens
vagy a poláris kötés a kémiai kötések alesetei, a felsorolt négy jelentés-definíció
is ugyanannak az általános szemantikának az állandósult nézetei. S ha ez konklúziónak
szokatlan is, úgy érzem, illik ide: Horváth Tibor munkájának érdemét
ugyanis éppen abban látom, hogy rendhagyó kérdésfeltevéseivel a kutató intellektuális
kíváncsiságát a végletekig csigázza.
* A tanulmány első részét lapunk 1992. 1. számában publikáltuk. Emlékeztetjük olvasóinkat arra is, hogy Darányi Sándor szubjektív "széljegyzeteit" a szövegben kurzívval szedtük. (A szerk.)
Irodalom:
Darányi
Sándor (1991): Az automatikus osztâlyozástól a magasabb fokú morfológiákig.
Könyvtári Figyelő 37.évf. 1.sz. 418-422.p.
Horváth Iván (1992): A három verselmélet. In: Szili József (szerk.):
A strukturalizmus után. Érték, vers, hatás, történet, nyelv az irodalomelméletben.
Budapest, Akadémiai Kiadó, 1992. 57-107.p.
Horváth Tibor - Orbán Éva (1987): PRECIS. TMT 34.évf. 7. sz. 311-323.p.
Johnson, M.L. (1988): Mind, Language, Machine. Artificial Intelligence
in the Poststructuralist Age. New York, St. Martin's Press.
Lochbaum, K.E. - Streeter, L.A. (1989): Comparing and Combining
the Effectiveness of Latent Semantic Indexing and the Ordinary Vector Space
Model for Information Retrieval, Information Processing and Management. Vol.
25. no.6. 665-676.p.
Országos Széchényi Könyvtár Észrevételek (2000/04/12) |