A többnyelvű tezauruszok kialakítási lehetőségei

A 21. században a többnyelvű eszközök egyre nagyobb teret nyernek és egyre szélesebb körű  felhasználói csoporthoz jutnak el, ezen belül olyanokhoz, akik eltérő kulturális és nyelvi háttérrel rendelkeznek, és az ismeretek hasonlóan változatos területei iránt érdeklődnek. Tény, hogy a tezauruszalapú keresőrendszerek rendelkeznek a legjobb pontossági aránnyal, jelenleg azonban nincs a többnyelvű tezauruszok kialakítására vonatkozó magyar szabványunk. Így alapvető hiányt pótolunk azzal, ha vizsgáljuk ezen eszközök létrehozásának lehetőségeit, a klasszikus és modern módszerek előnyeit és hátrányait. A fenti indíttatás tükrében a szakirodalom tanulmányozásával két kérdésre kerestem a választ:
1) milyen tulajdonságok jellemeznek egy jól kivitelezett többnyelvű tezauruszt,
2) hogyan lehet kialakítani egy ilyen rendszer hatékony és felhasználóbarát verzióját.1

1.     A többnyelvű tezauruszok kialakításának kezdeti lépései

A többnyelvű tezauruszok kialakításának kezdeti lépései az egynyelvű változatokéhoz nagyban hasonlóak. Az előkészítő munka során meg kell határozni a célokat, a tezaurusz fő témaköreit és rögzíteni kell a továbbfejleszthetőség lehetőségeit. A következő lépés az induló szóanyag gyűjtése, majd a szókészlet elemzésének során a szakemberek kiválasztják a legfontosabb deszkriptorokat, illetve elkészítik a betűrendes mutatót.2  A többnyelvű szótárák esetében a munkálatok kiegészülnek a célstruktúra megválasztásának feladatával.

1.1. A nem-szimmetrikus célstruktúra
Az egyik alternatíva egy nem azonos, nem-szimmetrikus tezauruszszerkezet kialakítása, ahol a deszkriptorok száma és a kapcsolódás típusai nem szükségszerűen egyeznek meg az egyes nyelveken. Ebben a szerkezetben forrásnyelvi deszkriptor állhat önállóan egyenértékű célnyelvi kifejezés nélkül. Michael Hudon3 szerint helyesebb, ha elfogadjuk ezt a nem-szimmetrikus struktúrát és a deszkriptorok számát változtathatóvá tesszük az egyes nyelvi változatokban. Indoklásának alapja az, hogy adott kultúrában létező fogalomnak, amely egy bizonyos nyelven képviselteti magát, egyáltalán nem biztos, hogy létezik ekvivalense egy másik kultúrában és az sem, hogy a megfelelő verbális alak áll majd rendelkezésünkre.
A gyakorlatban, tehát az indexelő szótár kialakítása során nem lehet megegyező szerkezetet kialakítani, mivel gyakran előfordul, hogy két csúcsdeszkriptor vagy fölérendelt kifejezés, pontatlan vagy részleges nyelvi megfelelést mutat – vagyis, bizonyos mértékben eltérő jelentésűek –, aminek következtében eltérő lesz az alárendelt kifejezés is. Erre példa az angol „education” kifejezés, amelynek jelentése tágabb, mint a francia „éducation” kifejezésé, vagy másképpen kifejezve az „education” és a „teaching” fogalmak világosabban különülnek el az angolban, mint az „éducation” és az „enseignement” francia kifejezések (1. táblázat). Hudon4 véleménye szerint azok a többnyelvű tezauruszok, amelyekben a szerkezet nem egyforma, nagyobb valószínűség szerint tükrözik hitelesen a világegyetem fogalmainak képviseletét minden kultúrában és nyelven.

1. táblázat
A relációs hálózat bonyolultsága (Hudon, 2001):

1.2. A szimmetrikus célstruktúra
A leggyakoribb nézet azonban az, hogy a többnyelvű tezaurusz minden egyes nyelvi változatának azonosnak kell lennie. Amennyiben adott tezauruszban a deszkriptoroknak minden nyelven kizárólag egy egyenértékű megfelelője van, valamint az egyes deszkriptorpárok kapcsolódási típusai megegyeznek, szimmetrikus tezauruszról beszélünk. Ez a struktúra annyiban rugalmas, hogy a deszkriptorok közötti kapcsolat alapulhat teljes vagy részleges egyenértékűségen, illetve a nem-deszkriptorok száma eltérő lehet. A szimmetrikus tezaurusz kialakítóinak célja a tökéletes egyezés létrehozása a deszkriptorok és a nem-deszkriptorok között, valamint az egyes nyelvi ekvivalensek között. Ennek következményeként azonban gyakran előfordul, hogy a nyelvek közötti egyenértékűséget kényszeríteni kell, még ott is, ahol a valóságban nincsenek meg ezek az egyezések, így megkérdőjelezhető kapcsolati szerkezetek alakulhatnak ki.
A szimmetrikus tezauruszban a kifejezések jelentését gyakran szűkíteni, vagy tágítani kell ahhoz képest, amilyen az adott kifejezés a természetes nyelvi használatban, de még így sem lehet elkerülni a mesterségesen „megalkotott” kifejezéseket, neologizmusokat. Ennél a szerkezetnél elfogadhatatlan, ha nincs ekvivalens a célnyelven, így ebben az esetben a tezaurusz alkotói általában eltávolítják a rendszerből a „gazdátlan” forrásnyelvi kifejezéseket.

2.    Többnyelvű tezaurusz kialakítása alulról-felfelé építkezve

Az IFLA irányelvében5 a többnyelvű tezauruszok három kialakítási módszerét határozzák meg. Az első lehetőség, hogy alulról-felfelé építkezve alakítsunk ki egy tezauruszt. Ezen belül további két variáció közül választhatunk: kezdhetjük a munkát egy nyelvvel, majd hozzá adhatunk egy másik nyelvet vagy nyelveket, illetve a másik opció, ha egyszerre több nyelvvel kezdjük meg a struktúra kialakítását.
A szakirodalom a hetvenes évek közepétől azt hirdeti, hogy ez a párhuzamos (ab initio) tezauruszkészítési módszer a legjobb. Ezek a tezauruszok nemzetközi intézményeknél és világcégeknél készülnek, mivel nehéz és költséges feladat hosszú időn át olyan szakértői csoportot összefogni és együtt tartani, amelynek tagjai értenek mind az adott szakterülethez, mind az adott (idegen és anya)nyelvhez, valamint a dokumentáció szakterületéhez is. Erre a módszerre jellemző a legtakarékosabb szógyűjtés, aminek következtében kevesebb homonima és pontatlan kifejezés is keletkezik, ami nagy pozitívum. Különböző nyelvi változatok együttes fejlesztése egyenértékűséget biztosít minden nyelven, azonban a célnyelvek és a forrásnyelvek váltakozásával, gyakran mesterkélt kifejezések keletkeznek. Ennek orvoslására a kulturális sajátosságokból adódó különbözőségeket az alkotók úgy kezelik, hogy a kifejezéseket összehangolják, amit a terminológia harmonizációjának neveznek.6

2.1. A tulajdonnevek megjelenítése a párhuzamos szerkezetben
Minden egyes deszkriptor, ami a tezauruszban szerepel, egyedi fogalmat jelenít meg. A deszkriptor lehet egyszavas kifejezés vagy többszavas összetett kifejezés is, a lényeg az, hogy természetes nyelvi formájú legyen.7 Abban az esetben, ha adott deszkriptorunk tulajdonnév a tazuruszban, a következő három alkalmazási lehetőség közül választhatunk:
1)     kiemelhetjük a tulajdonnév egyik nyelvi változatát, és azt használhatjuk minden nyelven;
2)     használhatunk egy tulajdonnevet az adott nyelveknek megfelelő alakban (abban a nyelvi környezetben viszont, ahol a kifejezés hiányzik, ott az eredeti nyelvű tulajdonnevet alkalmazzuk);
3)     alkalmazhatunk fordításokat, amennyiben ez ésszerű és lehetséges.
Minden esetben a kiválasztott forma megfelelő nem-deszkriptorokkal egészül ki, amelyekhez ajánlatos az egyes nyelvek engedélyezett neveinek listáját használni (ld. 2. táblázat). Az angol és a francia deszkriptorok az adott nyelvnek megfelelő hivatalos formában szerepelnek, a harmadik oszlopban azonban a holland deszkriptor kiegészül az angol és a francia kifejezésekkel, amelyek nem-deszkriptorként szerepelnek.

2. táblázat
Tulajdonnevek a többnyelvű tezauruszban (IFLA, 2009)

2.2. A homonimák kérdése
A homonimák (azonos alakú szavak) nemcsak az egyes nyelveken belül, hanem a nyelvek között is előfordulhatnak. Így ha ilyen kifejezéseket kell alkalmaznunk a többnyelvű környezetben, célszerű magyarázattal kiegészíteni őket, vagy a jelentések értelmét tisztázni egy zárójeles minősítő hozzáadásával.
Példa a minősítők alkalmazására a „Cranes” angol kifejezés, amely a magyar nyelvben is teljesen egyező homonimapárt alkot, mivel a „Cranes” (birds) vagy a „Cranes” (lifting equipment) magyarul „Daruk” (madarak) és a „Daruk” (emelő berendezések) teljes egyenértékűi egymásnak. Azonban a holland nyelvben az itt megfeleltetett kifejezéspár már nem mutat ilyen alaki hasonlóságot, ezért szükséges a magyarázat hozzákapcsolása (3. táblázat).

3. táblázat
Homonimák a többnyelvű tezauruszban (IFLA, 2009)

A tezaurusz megjelenítésének vannak olyan lehetőségei, amikor nem tüntetik fel a megjegyzéseket, ahogy ez jellemző az alfabetikusan rendezett soroknál. Azonban a szerkezet átláthatóságát tekintve jóval előnyösebb, ha az egyes nyelvek kifejezései külön listában kapnak helyet. Amennyiben mégis az előbbi opciót használjuk, a kifejezés mellett zárójelben elhelyezett nyelvmegjelölés alkalmazása ajánlott. A 4. táblázat felső részében a nyelvek közötti ekvivalencia esetét és párhuzamait, míg az alsó cellában a kifejezések betűrendes megjelenítését láthatjuk.

4. táblázat
Homonimák az alfabetikus többnyelvű megjelenítésben (s.k.)

2.3. Az összetett kifejezések kérdése
Az összetett kifejezés több mint egy szóból vagy összetett szóból áll. Az összetett szavak olyan szavak, amelyek több mint egy szóból (általában főnévből) állnak, illetve egy vagy több betűből álló kötőszó kapcsolhatja össze őket. Az összetett kifejezések általában prekoordináltak, vagyis előzetesen egyesítenek két vagy több egyszerű fogalmat egy összetett fogalommá. Ezen kifejezések használata a tezauruszban és a tárgyszólistákban növeli a specifikusság szintjét. A specifikussággal párhuzamban nő a pontosság is, ami az adott fogalom precíz képviseletét eredményezi. Ezzel egyetemben pedig nő az eszköz hatékonysága is, mivel a rendszer a nem kívánatos, tárgykörbe nem tartozó dokumentumokat ki tudja zárni. Éppen ez a hiányosság jelentett problémát Mortimer Taube, Unitermjénél is, mivel a rendszer nem volt képes összetett kifejezésekkel jellemezni az adott tartalmat, így bizonyos speciális jelentések kiszorultak vagy torzultak a struktúrán belül.
Az összetett kifejezések egyes elemeit a következő elvek szerint lehet megkülönböztetni. A középpont, vagyis a főnév az az összetevő, amely azonosítja a fogalmak általános osztályát, amelyre a kifejezés egésze vonatkozik. A „Printed indexes” kifejezés főnévi komponense az „indexes”. A „Hospitals for children” kifejezésben a „hospitals” ugyanezt a szerepet tölti be, míg a „Broadband” esetében a főnévi rész a „band”. Az összetett kifejezések másik része, a minősítő, amely az az egy vagy több komponens, ami arra szolgál, hogy szűkítse a kiterjeszthetőség középpontját, és így megadja az alosztályokat. Ilyen például a „Printed” melléknév a „Printed indexes” kifejezésben. Az előljáró-kötőszó-főnév összetételben, vagyis a „Hospitals for children” kifejezésben a „for children”, míg a „Broadband” kifejezésben a „Broad” tölti be ezt a szerepet. Általában, ha egy összetett kifejezés két vagy több kifejezésből áll, valószínűleg a vele egyenértékű idegen nyelvű kifejezés is ilyen formában lesz fellelhető.
A különböző nyelvű deszkriptorok formája a gyakorlatban azonban nem mindig egyezik, mert pl. az angol „Rail safety” kifejezés holland megfelelője, az elöljárószavas „Veiligheid bij spoorwegen” összetétel. Egy nem-szimmetrikus tezauruszban lehetőség van a USE indikátor, mögötte pedig az összetevő deszkriptorok plusz jeles kapcsolására (5. táblázat). Ennek az eshetőségnek viszont komoly következményei vannak a tezaurusz szerkezetére.

 5. táblázat
Megoldás az összetett kifejezések alaki eltérésére a nem-szimmetrikus struktúrában (IFLA, 2009)

Az összetett kifejezések előfordulásuknak két formája van, a jelzős és az elöljárószavas kifejezések. Az utóbbiak jelenlétét lehetőleg kerülni kell a tezauruszban. Éppen ezért lehetőség szerint az angol „Carbohydrate metabolism” (szénhidrát anyagcsere) kifejezést kell előnyben részesítenünk, a megegyező jelentésű „Metabolism of carbohydrates” kifejezéssel szemben. A jelzős kifejezések felépítése az angol és a magyar nyelvben azonos, vagyis a jelző a főnév előtt helyezkedik el. A szavak elhelyezkedése a hollandban is ezzel megegyező, azonban a két szó egybeolvad. Az olasz nyelvben a jelző a főnév mögött kap helyet, közéjük pedig egy kötőszó ékelődik be (6. táblázat).

 6. táblázat
A jelzős kifejezések formai különbségei az egyes nyelveken (IFLA, 2009)

Az is előfordulhat, hogy az elöljárószavas kifejezésnek még sincs közvetlen egyenértékűje a másik nyelven. Ebben az esetben eltérő indikátorhasználat lesz jellemző a szimmetrikus és a nem-szimmetrikus tezauruszokban (7. táblázat).
Megoldás a szimmetrikus tezauruszban

 7. táblázat
Pontatlan ekvivalencia a szimmetrikus és a nemszimmetrikus tezauruszban (s. k.)

2.4. Az ekvivalenciák
A nyelvek közötti ekvivalenciának három megközelítése van: szemantikai, kulturális és strukturális. Az előbbi két szempont a kifejezések jelentésére és arra vonatkozik, ahogyan ezeket az egyenértékű alakokat egy adott nyelven vagy kultúrában használják. Így ezek a megközelítésések csak a deszkriptorokkal kapcsolatban lesznek relevánsak, a legtöbb többnyelvű tezauruszban ugyanis nem tesznek kísérletet arra, hogy egyenértékű kifejezéseket rendeljenek minden nem-deszkriptorhoz. Ez a gyakorlat a neologizmusok elkerülése miatt használatos.
A deszkirptorok közötti interlinguális ekvivalenciának öt különböző fokát lehet megkülönböztetni az alulról-felfelé kialakított tezauruszokban: a pontos, a pontatlan, a részleges, az egy a többhöz egyenértékűséget, illetve azt az esetet, amikor nem létezik ekvivalens a másik nyelven.
1)  A pontos egyenértékűség, más néven nyelvek közötti szinonima, abban az esetben áll fenn, amikor X és Y nyelven a deszkriptorok szemantikai és nyelvi egyenértékűséget egyaránt mutatnak (8. táblázat).

8. ábra
Pontos egyenértékűség az EuroVoc-ban (s. k.)

2)  A következő típus a pontatlan vagy közeli egyenértékűség, amely a nyelvek közötti kvázi-szinonimák, vagyis adott szakterület azonosnak tekinthető kifejezéseinek nézőpontbeli különbségeinél merülnek fel. Ebben az értelemben, a deszkriptorok X és Y nyelven ugyanazt az általános fogalmat fejezik ki, de a kifejezések jelentése X és Y nyelven nem teljesen azonosak. Ezek a differenciák gyakran inkább kulturális jellegűek, mint szemantikaiak, azaz jelentésárnyalatbeli vagy felfogásbeli különbségről beszélhetünk. Így például: A „Strong-willed” és a „Pig-headed” angol kifejezések jelentése egyaránt „Stubborn” vagyis magyarul makacs, de míg az első kifejezés pozitív jelentéssel bír, addig a második negatívval. Az IFLA irányelvei alapján a pontatlan egyenértékűség esetében a kifejezéseket úgy kell kezelni, mintha pontos egyenértékűség állna fönn a kifejezések között (9. táblázat).

9. ábra
Pontatlan egyenértékűség

3)  Az egyenértékűség következő megkülönböztetési fokán a részleges ekvivalenciák helyezkednek el, amelyek a nyelvek közötti kvázi-szinonimák között specifikusságbeli differenciát mutatnak. Ebben az esetben a deszkriptor, a nyelvek egyikén egy kissé tágabb vagy szűkebb értelmű, mint ugyanaz a deszkriptor egy másik nyelven. A részleges ekvivalencia esetében az IFLA irányelv három lehetőséget kínál. Az egyik a már fentebb is használt megoldás, vagyis az, hogy kezeljük úgy a kifejezéseket, mintha egymás egyenértékűi lennének. A második az, hogy minden egyes nyelvi változatot tüntessünk fel a tezauruszban, és rendezzük ezeket hierarchikusan, vagyis a tágabb értelmű kifejezést fölérendeltként, míg a szűkebb értelmű kifejezést alárendeltként adjuk meg (10. táblázat). Kezelhetjük úgy is az esetet, mintha egy a többhöz egyenértékűség lenne.

 10. táblázat
Részleges ekvivalencia (ISO 5964,1985)

4)  Hudon szerint az egy a többhöz ekvivalencia, abban az esetben áll fenn, ha túl sok vagy túl kevés egyenértékű kifejezés áll a rendelkezésünkre. Ennek az ekvivalenciának tehát két altípusa van, az egyik, amikor a forrásnyelvi kifejezésnek több mint egy egyenértékű kifejezése van a célnyelven. A másik pedig ennek az ellentéte, vagyis ha nincs elég célnyelvi kifejezés. Túl sok célnyelvi kifejezés esetén három lehetséges megoldás létezik:
a)  Létrehozhatunk egy előre összevont célnyelvi deszkriptort (11. táblázat).

 11. táblázat
Egy a többhöz ekvivalencia, összevont célnyelvi deszkriptor létrehozása.  (HEREIN tezaurusz)

b)  Módosíthatjuk vagy specifikálhatjuk a forrásnyelvi kifejezést például egy minősítő hozzáadásával (12. táblázat).

 12. táblázat
Egy a többhöz ekvivalencia, specifikáció minősítővel (Schott, 2006)

c) Létrehozhatunk egy vagy több célnyelvi nem-deszkriptort a deszkriptorhoz kapcsolódóan (13. táblázat). Az utóbbi megoldás a leginkább elfogadható a nyelvi ekvivalencia szempontjából, mivel így nem keletkeznek mesterségesen létrehozott kifejezések.

 13. táblázat
Egy a többhöz ekvivalencia, célnyelvi nemdeszkriptorral (Schott, 2006)

Az egy a többhöz ekvivalencia másik altípusa abban az esetben áll fenn, ha a célnyelvi kifejezés csak forráskifejezések kombinációja révén képviselheti a fogalmat, vagyis nincs megfelelő célnyelvi kifejezés.
Erre a problémára a következő négy megoldást alkalmazhatjuk:
a) Létrehozunk egy összevont célnyelvi kifejezést (14. táblázat).

 14. táblázat
Egy a többhöz ekvivalencia, összevont célnyelvi kifejezésekkel (Schott, 2006)

b) Produkálhatunk egy általunk megalkotott kifejezést, ún. neologizmust (15. táblázat).

 15. táblázat
Egy a többhöz ekvivalencia, neologizmus (Schott, 2006)

c)     Használhatunk fölérendelt célnyelvi kifejezést, minősítővel együtt (16. táblázat).

 16. táblázat
Egy a többhöz ekvivalencia fölérendelt kifejezés minősítővel (Schott, 2006)

d)     Kialakíthatunk egy vagy több forrásnyelvi nem-deszkriptort, amely(ek) kapcsolatban áll(nak) a deszkriptorral (17. táblázat).

 17. táblázat
Egy a többhöz ekvivalencia forrásnyelvi nemdeszkriptorokkal (Schott, 2006)

5)     A nyelvek közötti ekvivalencia utolsó típusa abban a helyzetben áll fenn, ha nem létezik a forrásnyelvével egyenértékű kifejezés, amely azonos jelentéssel bírna a célnyelven. Hudon szerint (1997) ebben az esetben a szimmetrikus struktúra érdekében, a legegyszerűbb megoldás az, ha eltávolítjuk a „gazdátlan” forrásnyelvi kifejezést, különösen akkor, ha nagyon speciális fogalmat képvisel. Ha azonban az eltávolítás kivitelezhetetlen, további három lehetőség áll rendelkezésünkre:
a)     Átalakíthatjuk a „gazdátlan” kifejezést nem-deszkriptorrá és ezt összekapcsolhatjuk egy olyan deszkriptorral amellyel számos tulajdonságban osztozik (18. táblázat). Ez a megoldás nincs különösebb hatással a szerkezetre, így ez lehet az ideális választás, feltéve, ha a „gazdátlan” kifejezés valójában közeli rokona az adott deszkriptornak.

 18. táblázat
Ha nincs ekvivalencia, átalakítjuk a kifejezést nem-deszkriptorrá (Canadian literacy thesaurus, 1996)

b)     Importálhatjuk a forráskifejezést a célnyelvre (19. táblázat). Ennek a lehetőségnek a hátulütője, hogy a felhasználók így olyan információhoz juthatnak, amelyek csak egy másik társadalomban léteznek, a sajátjukra nem érvényesek.

 19. táblázat
Ha nincs ekvivalencia, importálhatjuk a forrás kifejezést a célnyelvre. (Schott, 2006)

c)     Létrehozhatunk egy egyenértékű új szót vagy kifejezést (20. táblázat). A neologizmusok alkalmazása azonban soha nem a legjobb megoldás. A tezaurusz nem egy terminológiai kifejezésbank, a tezaurusz önmagában nem idéz elő lényeges változásokat a nyelvben, hanem inkább tükröznie kell a nyelvek specializált használatát a társadalom bizonyos szegmensei­ben.

 20. táblázat
Ha nincs ekvivalencia, neologizmust alkalmazhatunk (Schott, 2006)

3.     Már kialakított tezauruszok összeolvasztása, összekapcsolása

Arra is lehetőség van, hogy ötvözzünk két vagy több már kialakított tezauruszt egyetlen új többnyelvű változatba, illetve már kialakított tezauruszok és tárgyszójegyzékek összekapcsolásával is létrehozhatunk többnyelvű struktúrát. A cél az, hogy felhasználjuk a meglévő szótárak szókincsét, amennyire csak lehetséges. Az ötlet mögött az az elképzelés áll, hogy a használók továbbra is azzal az ismert szókinccsel dolgozhatnak, amivel már korábban is találkoztak, így egy ismerős szókészlethez egy új funkciót rendelhetünk.
Az összekapcsolás különböző formákban lehetséges. Az első esetben két vagy több megegyező nyelvű szótárat kapcsolhatunk össze, erre példát találunk az orosz nyelvterület gyakorlatában, vagy különböző nyelvű, egynyelvű szótárak összekapcsolását is elvégezhetjük, például német és francia szótárak kombinálását. Egynyelvű és többnyelvű szótár összevonásával is megvalósítható a többnyelvű tezaurusz kialakítása. Az összekapcsolás általában a tezauruszok kifejezéseinek és a tárgyszójegyzékek szavainak feltérképezésével kezdődik, innen ered a „mapping” kifejezés. A találatokat sokféleképpen jeleníthetik meg, például egy táblázatban, amely annyi oszlopot tartalmaz, amennyi a felhasznált szótárak száma. A táblázat minden egyes sorában a különböző szótárak adott egyenértékű kifejezései helyezkednek el, melyben egy-egy cella nulla, vagy annál több kifejezést is tartalmazhat.
Hudon az alábbiakat írja az összekapcsolásról. Bár már jóval elfogadhatóbb ez a módszer, mint a fordítás, de nagyon komoly gyakorlati problémákkal jár együtt. Ezt az eljárást a legnehezebb intellektuálisan kezelni, mivel minden egyes tezaurusz eltér egymástól bizonyos mértékben, lefedettségi mélységben, a prekordináció fokában, a specifikusság szintjén stb. Emellett valószínű, hogy a legnagyobb és legfejlettebb tezaurusz nyelve és struktúrája lesz a domináns, és az is, hogy a többi tezaurusz struktúráját fogják igazítani/egyeztetni ehhez az egyetlen dominánshoz.

3.1. Az ekvivalenciák
Az összekapcsolással kialakított többnyelvű tezauruszokban három ekvivalencia típust különböztetünk meg egymástól: a teljes és a hiányos ekvivalenciát, valamint azt az esetet, amikor nincs ekvivalense a keresett kifejezésnek. Az utóbbi helyzetben tájékoztatni kell róla a felhasználót, hogy az általa keresett kifejezésnek nincs ekvivalense a másik nyelv(ek)en.
1)     A teljes ekvivalenciánál, minden szókészletben adott kifejezésre az ekvivalensek keresése során egy és csak egy deszkriptor létezik (21. táblázat). Az összekapcsolás azonban lehet hozzávetőleges. Az egyenértékűség nem azt jelenti, hogy itt a kifejezések azonos nyelvi jelentésűek, hanem azt, hogy várhatóan az eltérő szókészletekből származó kifejezések megegyező témájú forrásokhoz vezetnek.

 21. táblázat
Teljes ekvivalencia, az összekapcsolás eljárásánál (MACS, 2004)

2)     Hiányos ekvivalencia esetében legalább az egyik szókészletben két vagy több kifejezést kell kombinálnunk, amelyek egymás egyenértékű kifejezéseiként használhatóak. Ez a kombináció alapulhat a Boole-algebra ÉS, illetve VAGY operátorain. A VAGY összekapcsolás akkor szükséges, ha a forrásnyelvi deszkriptor a másik nyelven két kifejezést jelöl (22. táblázat).

 22. táblázat
Hiányos ekvivalencia, VAGY operátorral (MACS,2004)

Az ÉS operátorra akkor van szükség, amikor az egyik szókészlet kifejezése hierarchikusan alacsonyabb szinten áll, mint a releváns kifejezés legalább egy felhasznált másik szókészletben (23. táblázat).

 23. táblázat
Hiányos ekvivalencia, ÉS operátorral (MACS, 2004)

4.    A tezauruszok fordítása

4.1. A fordítás elmélete
A fordítási eljárás igen vitatott, éppen ezért ezt a megközelítést a szabványok és irányelvek nem is tartalmazzák, noha a meglévő tezaurusz egy vagy több új nyelvre fordítása igen népszerű, főleg gazdasági okokból. Ez a módszer nem teszi lehetővé az összes érintett nyelv közötti egyenlő kezelés lehetőségét, így mindig a forrásnyelv lesz a domináns. Az így előállított eszköz nem tükrözi megfelelően a célkultúrákat, kulturálisan mindig elfogult lesz, mivel az egyenes fordítás egyfajta kulturális imperializmushoz vezet.
A szakirodalomban vannak, akik azt állítják, hogy lehetetlen fordítás útján tezauruszt készíteni, azonban a gyakorlatban a két- és többnyelvű tezauruszok többnyire úgy keletkeznek, hogy egy forrástezauruszt a célnyelvre fordítanak. Fordítás esetében is ugyanolyan szakembergárdára van szükség, mint a párhuzamos eljárásnál, legfeljebb a specialisták térben és időben el vannak választva egymástól. Emellett a fordítási eljárás számos nehézség forrása lehet. Ennél a módszernél alapvetően nagyobb kifejezéshalmaz keletkezik, ezzel egyetemben pedig rendkívül megnő a homonimák és a pontatlan szakkifejezések száma. Így több egyeztetésre van szükség az egyes munkafolyamatok között, megnő az ellenőrzés szerepe, ami még több munkát generál.
Hudon a következő három problematikus elemre hívja fel a figyelmünket, amelyek hagyományosan kapcsolódnak a többnyelvű tezauruszok fordításához. Az első probléma az, hogy a kifejezések szó szerinti fordítása a forrásnyelvről semmitmondó kifejezéseket eredményezhet a célnyelven. A második kérdéses pont az, ha egy adott nyelvet tágítunk annak érdekében, hogy illeszkedjen egy idegen fogalmi struktúra azonos pontjaihoz. Ez azt eredményezheti, hogy a nyelv alig felismerhetővé válik beszélői számára. Az utolsó intés a fordítással kapcsolatban az, hogy mielőtt áthelyeznénk egy teljes fogalmi struktúrát az egyik kultúrából a másikba, jól gondoljuk meg egyáltalán ez mennyire célszerű.
Martin Doerr8 szerint a terminológiai források szemantikai különbözőségére gyakran hivatkoznak a szakirodalomban alapvető problémaként. Ezt azonban a szerkezetek szisztematikus elemzésével nem lehet kiküszöbölni. Véleménye szerint a fordított tezaurusz is tezaurusz, ahol minden fogalmat optimálisan értelmeztek több nyelven, ezek a fordítások azonban nem minden esetben megalapozottak.
Bár úgy tűnhet, hogy általános megegyezés van abban, hogy nincs értelme a tükör-fordításnak, a fordítást nem tekinthetjük egyszerű műveletnek. Eugene Nida9 szemlélete a fordítót a saját kultúrája „foglyának” tartja, mivel a fordító általában a saját nyelvi-kulturális kontextusában érti meg az üzenetet, majd megpróbálja megoldani a problémát idegen eredetű kifejezések használatával. Ez a folyamat független attól, hogy egy forrásnyelvi fogalom szemantikailag nem mindig egyenértékű a célnyelv megegyező fogalmával. Ezért egy másik kultúrába ágyazásnál a magyarázó kifejezések használata sokkal jobb, mint ha egy lefordított idegen nyelvű kifejezést használnánk. Ez az elv tükröződik a párhuzamosan szerkesztett tezauruszkészítési szabványokban és irányelvekben is, mivel a jövevényszavak, kölcsönzött kifejezések, neologizmusok használata sehol sem ajánlott. Az egyenértékűség típusainak felosztása is ebből a felismerésből fakad. A funkcionális, kommunikatív fordítási elméletek közé tartozik többek között a dinamikus ekvivalencia elmélete, a funkcionális ekvivalencia elmélete és a SKOPOS elmélet.10
A dinamikus ekvivalencia elméletét Nida fejlesztette ki 1969-ben, ez volt az első kommunikatív fordítási elmélet. A dinamikus szó arra az elképzelésre utal, hogy a fordításnak nem kell ugyanazt a hatást eredményeznie, mint a forrásszövegnek az eredeti kontextusban. Nida fordítási meghatározása szerint a fordítás újraalkotja a célnyelvben a forrásnyelv legközelebbi természetes ekvivalensét, először a kifejezések értelmében, másodszor a kifejezések stílusában.
A rendeltetési vagy funkcionális ekvivalencia teóriájának az az elképzelés az alapja, hogy a forrásszöveg rendeltetése megegyezik, vagy hasonló a célszöveg rendeltetésével. Más szavakkal a fordítás rendeltetése hozzáigazodik a forrásszöveg rendeltetéséhez.11
A SKOPOS elmélet a fordítási műveletet hangsúlyozza, tehát a fordítás cselekvési folyamatát. Vermeer12 szerint a fordítási művelet, olyan, mint egy bizonyos viselkedéstípus, ezt a viselkedést a cselekmény szempontjából cselekedetnek nevezhetjük, mivel az azt végző személynek kell potenciálisan képesnek lennie arra, hogy megmagyarázza, miért járt el úgy ahogy, bár más módon is eljárhatott volna. Továbbá a cselekedet valódi okai mindig kifejezhetőek a célok szándékainak vagy állításainak segítségével a kifejezésekben, mint egy jó okkal elkövetett cselekvés. 13
Vehmas-Lehto gondos meghatározást adott a fordítás meghatározására: fordításkor valaki kifejez valamit a célnyelv eszközeivel, amit korábban már kifejeztek a forrásnyelv eszközeivel. A definíció jelzi, hogy leginkább a fordítás tartalma a fontos, a jelentés megtartása és nem maga a nyelv.

4.2. A fordítást kiegészítô statisztikai eljárások
Susanna Keränen a fordítási eljárást statisztikai módszerekkel is támogatná, hogy a megfelelő szókészlet feltérképezésén túl, az adott nyelv kifejezései közötti kapcsolatok is átláthatóbbá váljanak a fordító számára. Az általa javasolt eljárások: a társszó analízis, a szó társítási módszer és a szemantikus alkotórész analízis.
A társszó elemzés
A társszó elemzés nagyon hasonlít az együtt idézés elemzésére, a kifejezések együttes előfordulását elemzi a dokumentumokban. A társszó analízist úgy lehet jellemezni, mint egy kétdimenziós térképet. A térképen a relatív kör mérete összefügg az előfordulások számával, ez alatt azt érthetjük, hogy minél nagyobb a deszkriptorok száma, értelemszerűen annál nagyobb lesz a körünk, viszont ha kisebb a kör, akkor több kapcsolat lesz az egymással relációban álló deszkriptorok között. A társszó analízis eredménye kétdimenziós térképen is bemutatható.
A szótársítási módszer
A szótársítási módszert már korábban is alkalmazták a tezauruszkészítés keretein belül. Marianne Nielsen14 szerint a szótársítási módszer egy használható és működőképes tezauruszt eredményezhet, amely jobban teljesít, mint a hagyományos tezauruszkészítési módszerekkel kialakított társaik. A szótársítási módszer előnye az, hogy gazdagíthatja a tezauruszépítést az aktuális, releváns és területspecifikus információk biztosításával.
A szemantikai komponens analízis
A szemantikai komponens analízist gyakran említik jelentés analízisként is. Az eljárás a szó jelentésváltozatait osztja kisebb elemekre, szemantikai jellemzőkre. Az összetevők elemzése különösen hasznos a poliszémiák esetében.

5.    A többnyelvűség kezelésének nehézségei a modern igényeknek megfelelően
A többnyelvű információkeresés biztosítására nincs egyszerű és kézenfekvő megoldás. Kerstin Jorna15 úgy véli, hogy a többnyelvű tezauruszok leggyakoribb formái jelenleg nem igazán megfelelőek erre a szerepre. Véleménye szerint a többnyelvű eszközök ezen típusának új formájára van szükség. E célból kezdte el kialakítani az InfoDEFT nevű kísérleti tezauruszát, amit az online tezauruszok lehetséges új modelljének tart. Az InfoDEFT egy szemantikailag strukturált, enciklopédikus jellegű és többnyelvű tezaurusz, amely felhasználható a mesterséges tanulást segítő programok esetében is, ezzel csökkentve az eszköz manuális előállításának költséges mivoltát.
A többnyelvű tezauruszok összetett kialakítási problémáira Hahn és Angelova16 szerint ideális opció lehet, egy független nyelvi tudásbázis bevezetése, amely közös fogalmi struktúrát alkothatna minden egyes nyelven. Jorna szerint egy ilyen tudásbázis kiépítése azonban rendkívül költséges lenne, és nagy erejű nemzetközi összefogást kívánna meg. Éppen ezért a problémára inkább a háromnyelvű kísérleti tezauruszában az InfoDEFT-ben látja a választ, mely rendkívül hasznosan alkalmazható az információ visszakeresésénél és a felhasználók számára is a tények, kifejezések megértéséhez. Erre a modern értelmezésre Schmitz-Esser17 EXPO 2000 tezaurusza is rávilágított, azonban utóbbi esetében nem hívják fel a használó figyelmét az egyes nyelvek közötti kulturális különbségekre. Jorna verziójában azonban az egyes kifejezések szoros ellenőrzése nagy figyelmet kap. Erre az InfoDEFT-et kialakító csoport facetták alkalmazását találta a legideálisabbnak, vagyis egy olyan szerkezet létrehozását, amely eltér az egyes nyelvektől, ezzel is felhívva a figyelmet a különbségekre, nem csupán a szókészletben, hanem a fogalmi kontextusban is.
Jorna három fő sarokpontot határoz meg, amelyek egy jó tezaurusz alapkövei kell, hogy legyenek. Először is a tezaurusznak többnyelvűnek kell lennie, hogy támogassa az információhoz való hozzáférést az egyre inkább globálissá váló információs társadalomban. Másodszor ezeknek a rendszereknek az alfabetikus forma helyett szemantikailag strukturáltaknak kell lenniük, ez a szempont részben lehetővé teszi a felhasznált nyelvek egyenlő képviseletét. Harmadszor segíteniük kell a felhasználók számára a megértést, a felidézést és a precíz információ-visszakeresést a definíciók és a megjegyzések használatával.
Míg a modern információs és kommunikációs technológia megkönnyíti a globális adatok transzferét, ugyanez nem segít a globális kommunikáció megvalósulásában. Jelenleg mind az internet és a nemzetközi vállalkozások is nagyrészt az angol nyelvet használják a nemzetközi kommunikációban, amely problémákat vet fel a kultúrák közötti kommunikációban az angol anyanyelvűek és a más ajkúak között. A legújabb kutatások szerint az angol nyelv hamarosan megszűnik uralni a globális kommunikációt, helyét Ázsia és Latin-Amerika egyes nyelvcsoportjai fogják átvenni. 18
Az említett előrejelzések tükrében új többnyelvű tezauruszokra lesz szükség, hogy támogassák a későbbi uralkodói státuszt nyerő nyelvcsoportok közötti kommunikációt, illetve a nyugat-európai nyelvekhez kapcsolódó diskurzust. Manapság sok úgynevezett többnyelvű eszközhöz férhetünk hozzá az interneten vagy a könyvtárak OPAC-jában, valójában azonban ezek egynyelvű tezauruszok, amelyek két- vagy többnyelvű szótárakkal együtt működnek. A többnyelvű információ visszakereső rendszerek ezen formái gyakran csődöt mondanak, amit igazolni lehet a LISA (Library and Information Science Abstracts) részletes vizsgálatával. A LISA tezaurusza a címkéző kifejezések legnagyobb csoportját angol nyelven tartalmazza, annak ellenére, hogy több mint 60 ország szakterméséből tartalmaz absztraktokat és teljes szövegű hozzáférést. A LISA-nál minden absztraktot angol nyelvre fordítanak, ami súlyosan ellentmondásos keresési eredményekhez vezet abban az esetben, ha nem adottak a pontos ekvivalensek a nyelvek között. A francia „documentalistes” a német „Dokumentar” és az angol „documentalists” egymás egyenértékű kifejezéseiként vannak feltüntetve a tezauruszban, de különböző keresési eredményekhez vezetnek, a különböző nyelvi változatokra keresve 55, 4, vagy 110 rekordot kapunk. Amennyiben az „information professionals” kifejezéssel keresünk, akkor pedig 3372 rekordot kapunk, de ha a kifejezés nem-deszkriptorával a „documentalists” fogalommal ugyanezt végrehajtjuk csak 590 rekordot kapunk. Az ilyen következetlenségek legyőzhetőek abban az esetben, ha egyenlő hozzáférést nyújtunk minden nyelven ahelyett, hogy az angol nyelvet részesítenénk előnyben. Ez nem csak a kultúrák és így az emberek közötti egyenlő bánásmódot jelenti, hanem lehetővé teszi a tezaurusz tárgyainak elfogulatlan kezelését is.
Sajnos nem könnyű feladat minden nyelv egyenlő kezelése a rendszeren belül. Valaha még voltak fizikai korlátai a többnyelvű megjelenítésnek, de mára ezeket le lehet küzdeni az elektronika segítségével. A technológia azonban nem tud győzedelmeskedni a szemantikai egyenértékűség intellektuális problémái fölött. A természetes nyelvek komplexitása, amely minden terminológia része, ritkán engedi pontos ekvivalenciák kialakítását a nyelvek között, ami igen sok gondot okoz a szemantikailag strukturált tezauruszokban. Ugyanez a hiba kevésbé okoz fejtőrést az alfabetikus tezauruszok esetében, de a szakemberek szerint ez az elrendezés nem is lehet alapja egy jó tezaurusznak, csak egyfajta kiindulóponként kell szolgálnia.19

5.1. Az EXPO 2000 és az InfoDEFT újszerû megoldásai
Újszerű megoldás, ha facetták vagy más szemantikai struktúrák segítik a felhasználót a kifejezések megértésében, és annak az átlátásában, hogyan viszonyulnak egymáshoz a mögöttes fogalmi kapcsolatok. A Schmitz-Esser és csapata által Hannoverben kialakított EXPO 2000 többnyelvű tezaurusz általános ismeretkört ölel fel öt nyelven. A Jorna nevéhez fűződő InfoDEFT pedig háromnyelvű, csak az információ-visszakeresés kifejezéseit feltáró tezaurusz. Mindkettő elektronikus formájú. A két terminológiai szótár azért érdekes számunkra, mert a saját területükön legyőzik a fogalomtárak leggyakoribb nehézségeit.
A legnagyobb különbség ezen példányok és a korábbi tezauruszok között az, hogy túlmutatnak az alapvető szemantikai viszonyokon, a tágabb, a szűkebb és a kapcsolódó kifejezések szempontjából. Az InfoDEFT facettás alapú, míg a  Schmitz-Esser-féle tezaurusz a hierarchikus kapcsolatokban 13 alosztást különböztet meg (24. táblázat).

  1. Nem-faj kapcsolat:

növény – kókuszdió

      7. Ok-okozati kapcsolat:erdőirtás- elsivatagosodás
  1. Fizikai és elméleti felosztás:

gazdaság – versenyszféra

      8. Előnyös kapcsolat:alfabetizáció – magasabb életszínvonal
  1. Jog és joghatósági kapcsolat:

Európai Unió – Franciaország

      9. Hátrányos kapcsolat:túlhalászás – tengeri élővilág pusztulása
  1. Földrajzi és helyrajzi felosztás:

Latin-Amerika – Dél-Amerika

    10. Anyagi kapcsolatfutószalag – gumi
  1. Származási kapcsolat:

nagyapa – apa

    11. Forma és megjelenés kapcsolat:kettős spirál – kromoszóma
  1. Műszeres kapcsolat:

hegesztőpáka – hegesztés

    12. Folyamat kapcsolat:futószalag – gyártás
      13. Állapot kapcsolatvíz – jég

24. táblázat
Az EXPO 2000 alosztásai: (s. k.)

Schmitz-Esser bevezetett egy alapvető szemantikai referencia szerkezetet a bizonytalan asszociatív kapcsolatok helyett, amely hat fő kategóriát tartalmaz: a fogalom, a név, az esemény, a hely, a szempont és az idő megkülönbözetéseit. Ez a rendszerezés részben megegyezik az InfoDEFT öt fő kategóriájával, mely a következő kifejezések alapján válogat: dolgok, emberek, tevékenységek, helyek és környezet. Mindkét tezaurusz tehát azt mutatja be, milyen értelemben kapcsolódnak egymáshoz a kifejezések.
Jorna ugyan egyetért Schmitz-Esser besorolási rendszerével az általános tárgykörű tezauruszban, azzal azonban nem, hogy az EXPO 2000-ben a lexikális hézagokat parafrázisokkal töltik ki. Mivel Jorna szerint a lexikai hiányosságokra inkább fel kell hívni a figyelmet, mint azokat elrejteni. A felhasználói tudatosság fokozásával ugyanis, nő a fogalmi megértés és javul a kommunikáció.
Az InfoDEFT azonban, egy második és lényegesebb tekintetben is különbözik az EXPO 2000-től. Utóbbiban ugyanis minden deszkriptor egy kétdimenziós rácsszerkezetben kerül elhelyezésre, melynek egyik dimenziójában a tizenhárom hierarchia típus, a másikban pedig a hat alapvető szemantikai referencia található. Ezzel szemben az InfoDEFT-ben facetták vannak, amelyek a gráfok felépítését követik, vagyis számos horizontális kapcsolatot tartalmaznak, melyek a fák ágainak felelnek meg. A Schmitz-Esser-féle táblázatos megjelenítésnek az az előnye, hogy átláthatóbb és következetesebb a felhasználók számára, vagyis inkább enciklopédikus áttekintést nyújt, amely gyakran megy a nyelvi pontosság rovására. Az InfoDEFT-re ezzel ellentétben az intuítiv megközelítés a jellemző, a cél a kifejezések jelentésének jobb megértése a különböző nyelveken, amely az enciklopédikus áttekintés helyett. Végeredményben megállapítható, hogy a tezauruszok különböző funkciói indokolják ezeket az eltérő modern módszereket.

5.2.  Az interoperabilitás a jövô tezauruszaiban
Az interoperabilitás a kulcsa az egyidejű keresés és visszakeresés képességének két vagy több adatbázisban egy vagy több nyelven. Az interoperabilitás a különböző rendszerek és szervezetek képessége az együttműködésre.  A kifejezést általában technikai rendszerekben mérnöki értelemben használják, vagy alternatív módon, tágabb értelemben véve a társadalmi, politikai és szervezeti tényezők figyelembevételével. Kezdetben az interoperabilitást informatikai rendszerek definiálták, a rendszerek közti korlátozott információcserére. A szemantikus interoperabilitás a rendszer azon képessége, hogy értelmesen és pontosan feldolgozza a kicserélt információt a rendszer végfelhasználóinak érdekében. Alapfeltétele, hogy mind az átadó és a befogadó oldalnak is alkalmaznia kell a referenciamodellt, vagyis azt, hogy amit elküldünk, egyezzen meg azzal, amit megértünk belőle.20
A rendszerek interoperabilitása, egy másik modern megközelítése annak, hogy az eszköz használata egyszerűbbé váljon a felhasználó számára. Régen, miután megnéztünk egy nyomtatott tezauruszt, továbbhaladtunk a kiválasztott kifejezések nyomán az indexelő rendszerben, vagy a kereső felületeken. Manapság a kifejezéseket csak át kell másolni az elektronikus tezauruszba, vagy gyakrabban csak rájuk kattintani. A kereső rendszer csak akkor lesz képes kapcsolatba lépni a tezaurusz adatbázisával, ha az interoperabilitás fennáll. Vagyis a felhasználók böngészhetnek és miközben keresnek, kiválaszthatják a tágabb kifejezéseket, egy általánosabb keresésre és így tovább. Ezek az átvitelek nem bonyolultak, feltéve, ha alkalmazzuk a szabványos adatcsere formátumokat és protokollokat.
A tezauruszok vagy más információkereső rendszerek interoperabilitása, több létfontosságú folyamatot tesz lehetővé. Az egyik az, hogy biztosítja az adatok szabványos formában való behozatalát és használatát más rendszerekben. A másik az, hogy lehetővé teszi a rendszerek között a kifejezések leképezését, valamint biztosítja a bármilyen más típusú információcserét a rendszerek között.21
Az interoperabilitást elérni, azonban nem olyan könnyű. A szemantikus weben az ontológiák esetében szintén ilyenfajta együttműködésre van szükség. Hamarosan arra is igény lesz, hogy a tezauruszokat összekapcsolják az ontológiákkal és/vagy a taxonómiákkal. Jelenleg ennek megoldásával foglalkozik az ISO 25964 szabvány22 második „Interoperabilitás más szótárakkal” c. részen dolgozó munkacsoport is. Így ez lehet a többnyelvű tezauruszok jövője.

6.     Következtetések

A tezaurusz teljes fogalmi és terminológiai készletet kínál minden képviselt nyelven, a többnyelvűség hozzáadásával pedig biztosíthatjuk az információhoz való hozzáférés széles skáláját. Ezen eszközök tekintetében is rendkívül fontos azonban, hogy a struktúrában a relációk és a fogalmak azonos értékűek legyenek, illetve hogy a fogalmi értelmezés középpontjában a válogatás helyett a terminológiai ellenőrzés álljon. Egy jó tezaurusznak alapvetően szemantikailag strukturáltnak kell lennie, persze, magában foglalhat egy betűrendes részt is, de fontos, hogy ne ez legyen benne a fő rendezési elv.
A többnyelvű tezauruszok kialakítási eljárásai közül az ab initio nyelvpárokkal dolgozó eljárását preferálják a szakirodalomban, a szabványok alapvetően ehhez a folyamathoz nyújtanak iránymutatást. Ez a módszer szimmetrikus tezauruszstruktúrára törekszik és a takarékos szógyűjtés jellemzi. Az alulról-felfelé építkezés során sorolják az ekvivalenciákat a legtöbb kategóriába, vagyis a legjobban kidolgozott az egyenértékűségek megkülönböztetése is. Éppen azért egyértelmű, hogy az így kapott tezauruszok lesznek a legjobbak minden szempontból. Azonban az eljárás legnagyobb kritikája az, hogy komoly szakembergárdát és költségbeli ráfordításokat kíván.
A már kialakított tezauruszok és/vagy tárgyszólisták összekapcsolásának előnye az, hogy a felhasználók továbbra is azzal az ismert szókinccsel dolgozhatnak, amivel már korábban is találkoztak, vagyis egy ismerős szókészlethez egy új funkciót rendelnek hozzá. A kialakítás ezen típusa kevesebb ekvivalencia típust használ, mivel a szókészletek „összefésülése” során alapvetően egy létező struktúrához kell alkalmazkodni, így nincs meg az a szabadság, mint az alulról-felfelé történő építkezés során. Hátránya, hogy sokkal több kifejezés gyűlik össze és aszimmetrikus szerkezetet eredményez.  Ez a módszer – a párhuzamos szerkesztéshez hasonlóan − megfelelő szakembergárdát és költségbeli ráfordításokat követel, azonban nem jár akkora pontossággal.
A fordítás mind közül a legvitatottabb eljárás, egyes vélemények szerint nem is lehet ilyen formában jó tezauruszt kialakítani.  A szabványok szerzői sem preferálják ezt az eljárást, a gyakorlat azonban ennek ellentmond, mivel számos esetben így pl. az EuroVocnál is kezdetben ugyan követték az alulról-felfelé építkezést, később azonban az egyes tagországok csatlakozásával már fordítást használtak. Az eljáráson belül megkülönbözetjük a szakemberek által kialakított és a mechanikus eszközökkel létrehozott szótárakat (utóbbi nagy minőségbeli hiányosságokat eredményezhet szigorúbb emberi ellenőrzés nélkül). Azonban ezt az eljárást is lehet jól kivitelezni, amennyiben emberi erőforrás végzi a munka nagy részét, illetve ha párosítjuk a Keränen által is javasolt módszerekkel (a társszó analízissel, a szótársítási módszerrel vagy a szemantikus alkotórész analízissel). Ezekre azért van szükség, hogy a megfelelő szókészlet feltérképezésén túl, az adott nyelv kifejezései közötti kapcsolatok is átláthatóbbá váljanak a fordító számára.
A tezauruszokat bírálók kritikája általában az, hogy ezen eszközök előállítása költséges és nehéz a bővítés. Azonban egy jól kialakított tezauruszban már a kidolgozás előtt biztosítanak arra módszereket, hogy a frissítés folyamatos legyen. Tény az is, hogy a tezauruszalapú keresőrendszerek rendelkeznek a legjobb pontossági aránnyal, így hiba volna nem használni őket. A véleményem az, hogy a kialakítási eljárást olyan alternatívákkal kell kiegészíteni, amelyek áthidalják a kulturális és nyelvi különbségekből adódó problémákat. Ezek lehetnek statisztikai módszerek, egy egyedi facettás struktúra alkalmazása, illetve az elektronikus rendszerek átjárhatóságát biztosító lehetőségek. A lényeg az, hogy a befektetett idő és energia megtérül, így bátran kombináljuk a klasszikus eljárásokat más újszerű lehetőségekkel!
Irodalom
1.    A téma kutatása során hatalmas segítséget jelentett Barátné dr. habil. Hajdu Ágnes, tanszékvezető egyetemi docens (ELTE BTK, Könyvtár- és Információtudományi Intézet) bíztatása és szakmai útmutatása, amiért ezúton is szeretném hálás köszönetemet kifejezni.
2    BARÁTNÉ HAJDU Ágnes – BABICZKY Béla: Bevezetés az információkereső nyelvek elméletébe és gyakorlatába. Budapest, Universitas, 1998. 224 p.
3.    HUDON, Michele: Multilingual thesaurus construction: integrating the views of different cultures in one gateway to knowledge and concepts = Information Services & Use, 17. vol. 1997. 2–3. no. 111–123. p.
4.    HUDON, Michele: Relationships in multilingual thesauri. In: Relationships in the organization of knowledge. Ed. Carol A. Bean, Rebecca Green. Dordrecht, Kluwer Academic Publishers, 2001. 67–80. p.
5.    Guidelines for multilingual thesauri. Hagues, Working Group on Guidelines for Multilingual Thesauri, IFLA Classification and Indexing Section, 2009. 30 p. http://www.ifla.org/files/assets/hq/publications/professional-report/115.pdf
(Az utolsó megtekintés ideje: 2015. október 8.)
6.    UNGVÁRY Rudolf: A két- és többnyelvű tezauruszok irodalma. Kritikai szemle és annotált bibliográfia. Szerk. Ungváry Rudolf, Orbán Éva, Budapest, OSZK KMK, 1981. 123 p.
7.    DAHLBERG, Ingetraut: Concept and definition theory.  In: Classification theory in the computer age. Conversations across disciplines. New York. Rockefeller College Press, University at Albany, State University of New York, 1989. 12–24. p.
8.    DOERR, Martin: Semantic problems of thesaurus mapping = Journal of Digital Information, 1. vol. 2001. 8. no. https://journals.tdl.org/jodi/index.php/jodi/article/view/31/32 (Az utolsó megtekintés ideje: 2015. október 8.)
9.    NIDA, Eugene Albert – REYBURN, William: Meaning across cultures. New York, Orbis Books, 1981. 90 p.
10.    KERÄNEN, Susanna: Multilingual thesaurus construction. Homemakers in Finnish and British discourses. Barcelona, ISKO, Capítulo Espanol, Barcelona, 2005. 357–379 p. http://bd.ub.edu/isko2005/keranen.pdf (Az utolsó megtekintés ideje: 2015. október 8.)
11.    VEHMAS-LEHTO, Inkeri: Kopiointia vai kommunikointia. Johdatus käännösteoriaan = Helsingin sanomat, 9. vol. 1999. 7. no. 122–232  p.
12.   VERMEER, Hans, J.: Skopos and commission in translational action. In: Readings in translation theory. Ed. Chesterman, Andrew, Loimaa: Oy, Finn Lectura Ab, 1989. 173–187. p.
13.    REISS, Katharina − VERMEER, Hans J.: Mitä kääntäminen on. Helsinki, Gaudeamus, 1986. 132. p.
14.    NIELSEN, Marianne Lykke. The word association method. A gateway to work-task based retrieval. Doctoral dissertation. Åbo, Åbo Akademi University Press, 2002. 342. p.
15.    JORNA, Kerstin – DAVIES, Sylvie: „Multilingual thesauri for the modern world. „No ideal solution?” = Journal of Documentation, 57. évf. 2001. 2. sz. 284-295. p.
16.    VON HAHN, Walther − ANGELOVA, Galia. Combining terminology, lexical semantics and knowledge representation in Machine Aided Translation. In: TKE’96, Terminology and Knowledge Engineering. Frankfurt, INDEKS-Verlag, 1996. 304–331 p.
17.    SCMITZ-ESSER, Winfried: Thesaurus and beyond. An advanced formula for linguistic engineering and information retrieval = Knowledge Organization, 26. vol. 1999. 1. no. 10–22. p.
18.    GRADDOL, David. Will English be enough? In: Where are we going with languages? Ed. Moys, A. London, Nuffield Foundation, 1998. 24–33. p.
19.    CABRÉ, Maria Teresa: A hypermedia project on terminology. In: TKE’96, Terminology and Knowledge Engineering. Frankfurt, INDEKS-Verlag, 1996. 424–430. p.
20.    NEELAMEGHAN, Arashanipalai. – LALITHA, S. K.: Multi­lingual thesaurus and interoperability = Journal of Library & Information Technology, 33. vol. 2013. 4. no. 289–294 p.
21.    AITCHISON, Jean – CLARKE, Stella J. Dextre: The thesaurus. A historical viewpoint, with a look to the future = Cataloging & Classification Quarterly, 37. vol. 2004. 3–4. no. 5–21. p.
22.    ISO 25964: The international standard for thesauri and interoperability with other vocabularies. International Organization for Standardization. 2011. http://www.niso.org/schemas/iso25964/#summary (Az utolsó megtekintés ideje: 2015. október 8.)
Beérkezett: 2015. október 19.

A bejegyzés kategóriája: 2015. 4. szám
Kiemelt szavak: , , , .
Közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!