Az OSZK tezaurusza és a KÖZTAURUSZ. A tezaurusz leírása

2. A tezaurusz leírása
2.1 Általános kérdések
2.1.1 Rendeltetés és kezelés

Az Országos Széchényi Könyvtár és a Közművelődési könyvtárak tezaurusza (az OSZK-tezaurusz és a KÖZTAURUSZ) jelenleg megegyeznek egymással. Az OSZK-tezaurusz használatát a Nemzeti Könyvtárban tervezik, a KÖZTAURUSZ-t 1999 vége óta három közművelődési könyvtárban használják, és 2001-ben várhatóan további közművelődési könyvtárak is csatlakoznak a használói körhöz. A két tezauruszt a továbbiakban min t Tezaurusz említjük.

A Tezauruszt a RELEX tezauruszkezelő programmal kezelik és tartják karban. [8] [12] Az integrált könyvtári adatbázisrendszerek többségében még semmiféle tezauruszt nem lehet online kezelni. Ennek oka, hogy a szoftvereket még nem készítették föl az egységesített besorolási adatok, köztük a tárgyi kifejezések adatcseréjére, és ezért nem képesek – formában a RELEX által exportált állományt importálni. A helyzet azonban belátható időn belül megváltozik.7

A RELEX WORD szövegállomány formájában is tudja exportálni a Tezauruszt. Ezt az állományt makró programokkal formázva készül el a nyomtatott tezaurusz. Az osztályozáshoz jelenleg csak ezt a nyomtatott tezauruszt használják. Mivel a nyomtatott formának több gyakorlati előnye is van, használata valószínűleg akkor is megmarad, amikor a tezaurusz on-line változata megjelenik.

Praktikus, főleg terjedelmi okokból a Tezaurusz nyomtatott változata a következő részekből áll:

  • Társadalomtudományi rész
  • Természettudományi rész
  • TAXAURUSZ (a taxonómiai tezaurusz), mely az élőlények, szervek és szövetek fogalmainak tezauruszcikkeit tartalmazza.
  • GEOTAURUSZ ÉS GEOHISTAURUSZ a földrajzi és történelem-földrajzi kifejezések tezauruszcikkeit tartalmazza.

Ezek a részek a szerkesztés, karbantartás és szám ítógépes kezelés és tárolás szempontjából egyetlen, azonos elvek és módszerek szerint strukturált állományt alkotnak. A társadalomtudományi és természettudományi részek szókincse nem különíthető el kizáró módon, ezért a két rész szókincse átfedi egymást.

2.1.2 Használat

A Tezaurusz a dokumentumok átfogó tartalmi feltárásához és kereséséhez használható. Valójában általános tárgyszójegyzéket is képvisel, a RELEX segítségével akár a tárgyszójegyzékek leegyszerűsített formájában is megjeleníthető.

A Tezauruszban szereplő összefüggések részletesebbek, mint azok a „lásd” és „lásd még” utalások, melyek a hagyományos tárgyszójegyzékekben találhatók. Egyrészt pontosabban megállapítható belőlük az összefüggés fajtája, tartalma (például az, hogy generikus, partitív, oksági vagy egyéb rokonsági kapcsolatról van szó, arról tehát, hogy a kapcsolódó kifejezés általánosabb vagy speciálisabb, hogy valaminek a részét jelöli-e vagy valaminek az okát, stb.). Másrészt minden összefüggésnek a fordítottja is szerepel a tezauruszban (az összefüggéseket részletesen „A tezaurusz szerkezete ” című fejezetben ismertetjük).

A Tezaurusz a monografikus művek, poligráfiák, időszaki kiadványok, aprónyomtatványok plakátok, mozgókép-dokumentumok, zeneművek, színházi dokumentumok, régi nyomtatványok, kéziratok, használati (vállalati és egyéb) kiadványok osztályozására (indexelésére) használható.

A helytörténeti dokumentumok feldolgozása esetén további speciális kifejezésekkel egészíthető ki a Tezaurusz. Ezeknek a várható kifejezéseknek az átfogóbb kifejezése a tezauruszban többnyire már szerepel, és a további kiadásokban az együttműködő karbantartás jóvoltából egyre kevesebb hiányra lehet számítani.

A Tezaurusz használatának tudnivalóit az „OSZK TEZAURUSZ alkalmazási és karbantartási szabályzat”, a gyakorlására alkalmas példákat az „Osztályozási példatár” című dokumentum tartalmazza.

2.2 A tezaurusz szerkezete
2.2.1 A tezauruszba fölvett kifejezések

2.2.1.1 KIFEJEZÉSTÍPUSOK

A tezauruszba a teljesség igénye nélkül felvettük mindazokat a fontosabb kifejezéseket, melyekre az OSZK-ban, ill. a közművelődési könyvtárakban a dokumentumok átfogó osztályozása és a tartalmukra vonatkozó keresőkérdések megfogalmazása érdekében szükség lehet.

A kifejezéseket – néhány kivételtől eltekintve – névszói formában és egyes számban vettük fel.

A tezaurusz szavai (a lexikai egységek)

  • szakkifejezések (például Anarchizmus, Adatátvitel, Árvíz, Államigazgatás, Együttműködés, Érték, Függvényegyenlet, Gazdaság, Hagyomány, Hőerőgép, Jövedelemadó, Kötvény, Nemzetiségi kérdés, Spam, Terrorizmus, Weblap);
  • ismeretterületek, tudományok (például Adóügy, Algebra, Egészségügy, Elektrotechnika, Eszkatológia, Gépgyártás-technológia, Hőtechnika, Hűtőipar, Mezőgazdaság, Nagykereskedelem, Tartalomszolgáltatás);
  • tevékenységek (például Ablaktisztítás, Bevásárlás, Közlekedés, Kukkolás, Rablás);
  • termékek, áruk, anyagok, tárgyak, gépek, berendezések (például Acéláru, Csomagolóeszköz, Darugép, Élelmiszer, Gipsz, Jármű, Ruházat, Vas-műszaki cikk);
  • növények, állatok (például Baktérium, Daru, Élvezeti növény, Embrió, Gyümölcs, Kutya, Szarvas, Utód, Szőlő, Zöldégféle) [ezek a kifejezések a TAXAURUSZ-ban szerepelnek];
  • szervek, szervrendszerek (például Agyhártya, Bél, Gyomor, Emésztőrendszer, Izom, Szív, Testrész, Vese) [ezek a kifejezések a TAXAURUSZ-ban szerepelnek];
  • intézmények, testületek (például Alkoholelvonó, Bíróság, Egyéni vállalkozás, Egyházi hivatal, Gimnázium, Javítóintézet, Kisvállalkozás, Külképviselet, Országgyűlés, Önkormányzat, Rendőrség, Ügyészség, Vásárcsarnok);
  • üzletek, boltok, vendéglátóipari egységek (például Autósbolt, Éttermek, Kaszinó, Vaskereskedés);
  • országnevek, földrajzi nevek, történelmi földrajzi nevek (például Ausztria, Békéscsaba, Európa, Fejlődő ország, Küküllő vármegye, Szász szék, Szörényi bánság) [ezek a kifejezések a GEOTAURUSZ ÉS GEOHISTAURUSZ-ban szerepelnek];
  • nép- és népcsoport (nemzetiség-) nevek (például Magyar, Székely, Német, Sváb, Zipszer, Zsidóság) [ezek a kifejezések a GEOTAURUSZ ÉS GEOHISTAURUSZ-ban szerepelnek];
  • időt, kort, korszakot jelentő kifejezések (Kiegyezés kora, Legújabbkor, Mohácsi vész, Reneszánsz, Világháború (1939-1945)) ;
  • formai kifejezések (Bélyeg, Dokumentumfilm, Grafika, Himnusz, Kabaré, Katonanóta, Mozijegy, Regény, Színlap, Vicc, Zenemű).

A Tezauruszban a könyvtári betűrendbe sorolás szabályait követtük. Az ékezetes betűk a nekik megfelelő nem ékezetes betűkkel azonos besorolásúak (kivéve az o és ö, valamint u és ü betűket), a kis és a nagy betűk besorolása ugyancsak nem különbözik. A besoroláskor az üres helynek (szóköznek) is szerepe van és minden más jelet megelőz. A gy, ly, ny, sz, ty és zs betűknek nincs önálló értéke (ezért például a Szénvegyület a betűrendben a Szennyvíz, a Vízzáró réteg a Vizsgálat után következik). A karaktersorrend a következő:

köz, (, ), 0, 1, 2, 3, 5, 6, 7, 8, 9, a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, ö, p, q, r, s, t, u, ü, v, x, y, z.

2.2.1.2 A KIFEJEZÉSEK SZEREPE A TEZAURUSZBAN

2.2.1.2.1 Deszkriptorok és nemdeszkriptorok

A tezauruszba felvett kifejezés lehet deszkriptor vagy nemdeszkriptor.

A deszkriptorok a tezaurusznak az osztályozásra közvetlenül felhasználható kifejezései, melyek között feltüntettük a legfontosabb fogalmi, olykor egyéb összefüggéseket.

A nemdeszkriptorok egyrészt olyan kifejezések, melyek valamelyik deszkriptor szinonimái, vagy szinonimnak tekintett kifejezései. A nemdeszkriptorokat mindig összekapcsoltuk a helyettük használandó kifejezésekkel.

A nemdeszkriptorok másrészt olyan speciális kifejezések, melyekről feltételezhető, hogy az átfogó osztályozás esetén nincs szükség a velük való finomabb osztályozásra, s ezért ezeket egyelőre szintén összekapcsoltunk a helyettük használandó, többnyire általánosabb kifejezéssel. Ezeket mintegy szinonim kifejezéseknek (kváziszinonimáknak) tekintjük.

2.2.1.2.2 Fogalmi és „nem fogalmi” összefüggések

Fogalmi összefüggésnek elsősorban a generikus (nem-faj) relációk tekinthető (pl. Kutya-Állat). Ezek valóban fogalmak között állnak fenn.

A partitív (rész-egész) relációk valójában a fogalmakkal reprezentált dolgok között állnak fenn (pl. a falkának, és nem a Falka fogalmának részei a kutyák).

A különféle oksági (ok-okozat, eszköz-rendeltetés, tevékenység-cél stb.) és egyéb, asszociatív relációk (tulajdonsága, ellentéte stb.) esetében sem állítható egyértelműen, hogy alapvetően fogalmi kapcsolatokról van szó. Például nem az Eső fogalma, hanem a tényleges eső okozza a sarat.

Kétségtelen, hogy az említett „nem fogalmi” esetekben is jelen van a fogalompárok mindegyikében valamilyen ismertetőjegy, amely a másikra vonatkozik. A Falka fogalmának ismertetőjegye például, hogy „részei a kutyák”, a Kutya fogalmának ismertetőjegye, hogy „ösztöneit követve falkába tömörül”, de ez már eleve csak a kapcsolat tényét fejezi ki, azaz nem közös ismertetőjegyekről van szó, melyek alapján a szóban forgó fogalompárok tartalma átfedné egymást, és az átfedés alapján keletkeznék fogalmi kapcsolat.

Az említett esetekben tehát inkább arról van szó, hogy a fogalmak asszociatíve tartalmaznak utalásokat más fogalmakkal való összefüggéseikről. Az „igazi” kapcsolat inkább csak maguk között a dolgok között létezik, melyeket a fogalmak reprezentálnak.

A homonimák esetében már egyáltalán nincs fogalmi összefüggés. A kapcsolat csak a megnevezések szintjén áll fenn annak következtében, hogy két fogalomnak azonos a megnevezése [pl. a „bárd” esetében a Bárd (népi énekes) vagy a Bárd (vágószerszám)].

Nemdeszkriptorok esetében gyakorlati értelemben semmiféle fogalmi összefüggés nem áll fenn információkereső tezauruszokban. Az „eb” és a „kutya” kifejezések esetében például egyetlen fogalom eltérő megnevezéséről van szó. Ilyenkor beszélünk szinonimákról. Szigorú értelemben persze ezek is két, rendkívül kis mértékben eltérő fogalmat neveznek meg (nem mondható, hogy „kutya ura a fakó”), de ennek legfeljebb nyelvészeti vagy terminológiai tezauruszokban lehet jelentősége.

Információkereső tezauruszokban a nemdeszkriptor-deszkriptor kapcsolatoknak éppen az a szerepe, hogy a szinonimnak vagy annak tekintett – tehát az azonosnak tekintett fogalmat jelölő – megnevezéseket rendeljék oda egyetlen deszkriptorhoz. Ha egy tezauruszban a Vadászkutya L Kutya kapcsolatot határozták m eg, akkor ez azt jelenti, hogy a két kifejezést azt adott tezauruszban egyetlen fogalom megnevezésének tekintették, melyet esetünkben szabványosítva a Kutya deszkriptor képvisel.

Egyes automatizált információkereső rendszerekben ráadásul az is lehetséges, hogy a nemdeszkriptorok esetén eleve mindig a nemdeszkriptort és nem a helyette L vagy L& kapcsolatban álló deszkriptor, ill. deszkriptorokat használják az osztályozáskor. A kereséskor ugyancsak megadható a nemdeszkriptor, és a kereső kérheti, hogy a talál atokat a rendszer úgy keresse ki, hogy figyelembe veszi a nemdeszkriptor-deszkriptor kapcsolatokat, vagy úgy, hogy ne vegye figyelembe, azaz csak azokat a dokumentációs egységeket jelenítse meg találatként, melyeket a nemdeszkriptorral osztályoztak.

Ezekben a rendszerekben tehát az a helyzet, hogy ha kérik, akkor csak a Vadászkutya nemdeszkriptorral osztályozott találatok jelennek meg, vagy ha nem kérik, akkor a Vadászkutyával végzett keresés esetében megjelennek mind a Vadászkutya nemdeszkriptorral, mind pedig a Kutya deszkriptorral osztályozott találatok.

Az ilyen rendszerekben tehát nem lehet teljes egyértelműséggel arról beszélni, hogy egységesen és pontosan mi a deszkriptorok közötti, ill. a nemdeszkriptorok és deszkriptorok közötti kapcsolatok szemantikai/fogalmi alapja.

A szabvány [7] szerint ugyan a tezauruszokban „feltüntetik a legfontosabb fogalmi összefüggéseket”, de mint láttuk, ezt a deszkriptorok közötti kapcsolatok esetében meglehetősen lazán kell értelmezni. Annál is inkább, mert információkereső tezauruszokról van szó, nem pedig nyelvészeti tezauruszokról. A nemdeszkriptor-deszkriptor kapcsolatokat pedig a gyakorlati osztályozás igényeit figyelembe véve, tehát praktikus okok alapján állapítják meg, ezek esetében végképp nem beszélhetünk általánosságban fogalmi összefüggésekről.

2.2.1.3 A KIFEJEZÉSEK FORMÁJA

A deszkriptorok és nem deszkriptorok egy vagy többtagú – összetett – kifejezések lehetnek. Az egybeírás szabályait az „OSZK tezaurusz alkalmazási és karbantartási szabályzat” függeléke tartalmazza.

2.2.1.4 A MEGJEGYZÉSEK

A szavakhoz magyarázó szövegként megjegyzések is kapcsolódhatnak A megjegyzés nem része a lexikai egységnek.

Egyik fajtájuk a lexikai egység megállapodásszerű jelentésére utal és az M betű jelöli. Ez a megjegyzéstípus megfelel a HUNMARC formátum „680 Nyilvános általános megjegyzés” adatelemének.

A meghatározások elsődleges forrása a Magyar Nyelv Értelmező Kéziszótára vagy az Idegen Szavak Szótára volt. Ilyen esetben nem adtuk meg külön a forrás rövid jelét. Ha más forrásból (is) szükség volt pontosabb meghatározásra, a forrás rövid jelét szögletes zárójelben adtuk meg a szöveg után.

Például:

ÁRPÁD-KOR

M: 896-1301

BOSZORKÁNY

M: Az ördöggel való cimborálása miatt természetfölötti hatalmúnak (és ártó szándékúnak) képzelt nő

Gesta

M: Az európai középkori latin történetírás műfaja, nép, ország történetét összefoglalóan elmondó munka

A másik fajtájuk a lexikai egység használatára utal és a H: betű jelöli. Ez a megjegyzéstípus megfelel a HUNMARC formátum „687 Megjegyzés a besorolási adat használatáról” adatelemének.

BOSZNIA ÉS HERCEGOVINA

H: 1994 előtt lásd Jugoszlávia

ORSZÁGTÖRTÉNELEM

H: Magyarország történelme esetén a „Magyarország történelme” deszkriptor használandó
Az egyes országok, tájak történelme az  „országtörténelem” deszkriptorral és az adott ország, táj deszkriptorával osztályozandó

A kétfajta magyarázat együtt is előfordulhat.

KÖLTÉSZET

M: A szépirodalom költői műfaja, melyet intenzitásnövelő formaszerkezet, a kifejezésekre eső gazdagabb jelentés (tartalom) jellemez [VILIRLEX]
Több értelemben használt kifejezés. Jelentheti elsősorban a líra egészét, esetleg csak a verses műfajt, tágabb értelemben a szépirodalmat emelkedettebb szempontból

H: Osztályozáskor eldöntendő, hogy helyette esetleg a „líra”, a „vers” vagy a „költői nyelv” használandó

A GEOTAURUSZ ÉS GEOHISTAURUSZ-ban használatos még a forrásra vonatkozó, önállóan megadott megjegyzés. Ez a megjegyzéstípus megfelel a HUNMARC formátum „670 Megjegyzés a besorolási adat forrásáról” adatelemének.

ABOSFALVA

FORRÁS: KSzN(8-9)kf(137-138)

Nem minden lexikai egységhez szükséges megjegyzés, és nem minden szükséges megjegyzés ismerhető fel a tezaurusz készítésekor. A gyakorlat problémái igazítanak majd el abban, hol és milyen típusú és szövegű megjegyzésre lesz még szükség.

A formai deszkriptorokat (a dokumentumtípusok fogalmainak megnevezéseit) például a korábban ugyancsak az OSZK-ban készült DOKTAURUSZ-ból vettük át. A DOKTAURUSZ-ban a formai deszkriptorokkal összefüggő problémák miatt minden lexikai egységhez kapcsolódott megjegyzés, ezért a mostani Tezauruszban is megjegyzést találunk a vezérszóként álló formai deszkriptorok alatt.

Számos bizonytalan alkalmazású társadalomtudományi (népnévi, történelmi stb.) kifejezés esetében már a tezaurusz készítése során szükségesnek látszott megjegyzés megszövegezése.

Esetenként az ismeretlen, vagy nagyon speciális, ugyanakkor az adott szakma szempontjából nem triviális szakkifejezések esetében is adtunk meg meghatározást.

A jövő mutatja majd meg, hogy szükség van-e további megjegyzéstípusokra.

A HUNMARC formátum számos további megjegyzéstípust is tartalmaz, melyeket az alábbi táblázatban foglaltunk össze.

2.2.1.5 A HOMONIMÁK KEZELÉSE

2.2.1.5.1 Az alkalmazott megoldás

A lexikai egységek között előfordulhatnak többjelentésű kifejezések. Ezek a homonimák, poliszémák. A két kifejezés közötti megkülönböztetés nem egységes.

Elvileg ugyanazt jelentik, csak más-más nézőpontból, tehát szinonimák. Az első megnevezés az azonos alakúságból indul ki, a második a különböző jelentésből. Mindkettő az azonos alakú, de különböző jelentésű fogalmat nevezi meg.

A gyakorlatban olykor homonimának csak azt az esetet tekintik, amikor semmiféle asszociatív összefüggés nem áll fenn [ár (érték), ár (szúrószerszám), ár (áradat)], poliszémának pedig azt az esetet, amikor felismerhető némi összefüggés (madártoll-írótoll). Információkereső tezauruszokban nincs jelentősége a megkülönböztetésnek.

A homonimák egy részét a Tezauruszba nemdeszkriptorként vettük föl, és róluk VAGY-kapcsolatban utaltunk a releváns deszkriptorokra. Ezt a megoldást akkor választottuk, ha

a homonim kifejezéssel jelölt különböző fogalmakat jól megkülönböztethető más-más kifejezéssel is megadhattuk;
nagyjából egyformán fontosak, gyakoriak és elterjedtek voltak.


 

 

 
Ha volt elfogadott vagy még a köznapi nyelvhasználat számára éppen elfogadhatónak tekinthető összetett szó, akkor azokra utaltunk. Például:

 

 

 

 

 

 

 

 

 

 

Ha nem volt, de a szakmai nyelvhasználatban létezett idegen eredetű, elsősorban latin szakkifejezés, akkor arra utaltunk. Például:

 

 

 

 

 

 

 
Előfordul, hogy valamelyik homonimát az általánosabb, fölérendelt fogalmának megnevezésével helyettesítjük. Például:

 

 

 

Számos esetben a teljes szókincs alapján további homonimák léteznek, de ezek túlzott finomítást jelentenének. Például:

Kiválás
(csoportból, közösségből, pl. kiválik a kormányból)

Kiválás
(vegyületből, keverékből elkülönül, szegregáció)

Kiválás
(tárgy, anyag, hang, szín a környezetén belül külön is érzékelhető)

Kiválás
(képességeivel kitűnik)

Az ilyen esetekben csak egyetlen, szakmai-tudományos szempontból fontos jelentéssel azonosítottuk a kifejezést (a példában a Szegregációval). Ha később szükség lenne megkülönböztetésre, a megoldás:

 

 

 

 

 

A homonimák más részénél valamelyik fogalom esetén meg kellett őrizni a homonim kifejezést, mert erőltetés nélkül nem lehetett a fogalmat másként megnevezni. Ebben az esetben az = jelű („lásd még más értelemben”) relációval jelöltük a homonim kifejezés és a más kifejezéssel megadott fogalmak közötti kapcsolatot. Az esetek egy részében magyarázat ot is kapcsoltunk a vezérszóhoz.

A „lásd még más értelemben” ( = ) relációval a következő esetekben szabályozzuk a homonímiát:

Legalább az egyik homonimához nem lehet találni se összetett, se bármilyen más alakú kifejezést. Ilyenkor általában magyarázat, meghatározás is kapcsolódik a vezérszóhoz.
Például:

 

 

 

 

 

Összetett kifejezés hiányában nem lehet találni valamilyen átfogóbb kifejezést, amelyre utalhatnánk vagylagosan. Például

 


Ha a

 

 

 

 

 

 

 

„lásd más értelemben” ( = ) relációt használtak, az egyik kifejezés alatt olykor szerepel rövid értelmező magyarázza.

Például:

Olykor elég nehéz volt megoldani a megkülönböztetést természetesen hangzó módon:

 

 

 

 

 

 

 

 

 

 

 

2.2.1.5.2 A szabványtól való eltérés okai

A szabvány szerint [7] a homonimákat hátravetett értelmező kkel kell megkülönböztetni [pl. Asszociáció (képzettársítás), Asszociáció (társulás); Rend (állapot), Rend (szervezet)].

Ha a Tezauruszt a jövőben automatikus indexeléshez vagy osztályozáshoz is használni kell, ez a megoldás akadálya az ilyen célú használatnak. A program a hátravetett értelmezővel semmit sem kezdhet, hiszen magukban a szövegekben az „asszociáció” vagy a „rend” kifejezés mindig hátravetett értelmező nélkül fordul elő, és csak a szövegkörnyezet alapján állapítható meg, melyik fogalomról van szó.

Ahhoz, hogy az automatikusan osztályozó program például az „asszociáció” kifejezés esetében a szövegkörnyezetet értelmezni tudja, egyrészt ismernie kell azokat a kifejezéseket, melyek alapján a szövegkörnyezetet vizsgálja (példánkban a Képzettársítás é s a Társulás deszkripotorokat), másrészt e deszkriptorok kapcsolódó deszkriptorait. Ha ugyanis a szövegkörnyezetben az egyik vagy a másik deszkriptor (a gyakorlatban egymást kizáró) kapcsolatai fordulnak elő nagyobb valószínűséggel, akkor a program képes dönteni a homonima jelentéséről.

Ennek érdekében volt szükség arra, hogy a homonimákat ne hátravetett értelmezőkkel, hanem vagy az LV jelű „lásd vagy”, vagy az = jelű „lásd még más értelemben” relációkkal kezeljük.

Ezáltal olyan szerkezetű Tezauruszt alakítottunk ki, melyet a jövőben különösebb szerkezeti átalakítás nélkül lehet az automatikus indexelésbe vagy automatikus osztályozásba (a kettő nem ugyanaz) bevonni. Ennek realitása van, többek között azért, mert egyre nagyobb az elektronikus (tehát digitalizált vagy eleve digitális) dokumentumok száma, másrészt egyre jelentősebbek a hálózaton elérhető, tehát ugyancsak digitális dokumentumok. Mindezek egyrészt kiválóan alkalmasak az automatikus tartalmi feltárásra, másrészt – különösen, ami a webdokumentumokat illeti – előbb-utóbb nem is lehet másként feldolgozásukkal megbirkózni.

A szabványtól való eltérés okai a szabvány készítése óta eltelt időben gyökeredznek.

A szabvány egyébként a LV jel használatát csak annyiban köti meg, hogy „a jelet követő lexikai egységeket (deszkriptorokat) a megadott logikai kifejezés szerint vagylagosan kell használni.” Tehát rendjén való, ha a LV jelet akár homonimák, akár kváziszinonimák, akár egyéb deszkriptorok követik. A lényeg nem az, hogy ezek nyelvészetileg milyen jelenségek, hanem az, hogy a vezérszóként álló nemdeszkriptor helyett vagylagosan használandók.

A LV jel láttán a felhasználónak tehát elsősorban nem arról kell döntenie, hogy a LV jel után nyelvészetileg homonimák, poliszémák, szinonimák vagy szinonimának tekintett kváziszinonimák állnak.

Neki arról kell dönteni, hogy a LV jel után felsorolt deszkriptorok közül az osztályozás és információkeresés érdekében melyiket használja a dokumentum tartalmának leírására/besorolására.

A Tezauruszban alkalmazott LV reláció homonimák esetében nemcsak az automatikus eljárásokhoz való fölhasználást készíti elő, hanem a felhasználó dolgát is megkönnyíti, és terjedelemcsökkentő.

Az Asszociáció nemdeszkriptor példájánál maradva a LV kapcsolat alkalmazása esetén a felhasználó egyben, egyetlen tezauruszcikkbe foglalva, egyetlen relációtípushoz kapcsolva látja a jelentésváltozatokat.

Sokkal körülményesebb megoldás volna, ha az Asszociáció keresése esetén a következő két nemdeszkriptorcikk jelenjék meg:

Asszociáció (képzettársítás)

L     Képzettársítás

Asszociáció (társulás)

L     Társulás

Hasonló okok indokolták az = jelű „lásd még más értelemben” reláció alkalmazását is homonimák esetében (ezt a relációtípust természetesen más esetekre, pl. az „ellentéte” összefüggés esetére is alkalmazzuk).

A szabvány egyébként kifejezetten megengedi további, a szabványban nem feltüntetett reláció alkalmazását: „A rokonsági kapcsolatok a szakterülettől és a tezaurusz rendeltetésétől függően tovább finomíthatók…”

A fejlődéssel való lépéstartás szükségessége láthatóan nemcsak a megjegyzések, hanem a homonimakezelés, s vele a LV kapcsolat alkalmazásának kérdésében is szembeszökő. Az automatikus osztályozás kérdése mind a magyar, mind a nemzetközi tezaurusz-szabvány megszületésének idején még gyerekcipőben járt, a szabvány készítői az automatikus feldolgozás kérdését még nem mérlegelhették. A homonimák megkülönböztetésének a Tezauruszban alkalmazott, hátravetett értelmező nélküli módja a fejlődéssel való lépéstartás követelményéből fakadt, mellyel előbb-utóbb a szabványok is számolni fognak.

2.2.2 A tezauruszcikk

2.2.2.1 DESZKRIPTOR- ÉS NEMDESZKRIPTOR-CIKK

A Tezauruszban vezérszói helyzetben – azaz a tezauruszcikk élén – minden szó a betűrendnek megfelelő helyen jelenik meg. Az alábbiakban néhány tezauruszcikk látható a vezérszavak betűrendjében:

 

 

 

 

 

 

 

 

 

 

 

 

 

 
A tezauruszcikk betűrendi helyét a cikk élén álló, balra kiugró vezérszó határozza meg.

A vezérszó lehet deszkriptor vagy nemdeszkriptor. A deszkriptorok a tezauruszcikkek élén (vezérszói helyzetben) NAGYBETŰKKEL, a nemdeszkriptorok a tezauruszcikkek élén (vezérszói helyzetben) nagy kezdőbetűvel és kisbetűkkel íródtak.

A nemdeszkriptorok a deszkriptorok szinonimái vagy szinonímiának tekintett (ún. kváziszinonim) kifejezései.

Például a Nyelvhasználat nemdeszkriptor helyett vagy a KISEBBSÉGI KÉRDÉS , vagy a NYELVÉSZET deszkriptor használandó.

A Kulturális autonómia nemdeszkriptor helyett az AUTONÓMIA és a KULTÚRA deszkriptorok használandók együttesen.

Minden vezérszóhoz kapcsolódó kifejezés egyszer vezérszóként is előfordul a Tezaurusz megfelelő betűrendi helyén.

Például a KISEBBSÉGI KÉRDÉS tezauruszcikkében kapcsolódó kifejezésként szereplő Autonómia vezérszóként az alábbi tezauruszcikk élén szerepel:

AUTONÓMIA

H         Területi autonómia

H&      Kulturális autonómia

X         Határontúli magyarság

Kisebbségi kérdés

Kollektív jogok

Nemzetiségi kérdés

Szeparatizmus

2.2.2.2 A KAPCSOLATOK

A vezérszó kapcsolatait a kapcsolat fajtájától függően különféle jelek (relációjelek) jelölik. Ezek a következők:

2.2.2.2.1 Nemdeszkriptor-deszkriptor kapcsolatok

A nemdeszkriptorok olyan kifejezések, melyek helyett a hozzájuk kapcsolt deszkriptort, ill. deszkriptorokat (a kitüntetett szinonimáikat vagy kváziszinonimáikat) kell osztályozásra használni.

Lásd/Helyett kapcsolat

L
A jelet követő deszkriptor a vezérszó kitüntetett szinonimája vagy kváziszinonimája (szinonimának tekintett k ifejezése). A vezérszó ilyenkor mindig nemdeszkriptor, azaz nem kitüntetett szinonima vagy kváziszinonima.

Például:

Alkotmányosság

L
 Jogállam
Azaz az „Alkotmányosság” kitüntetett szinonim kifejezése a „Jogállam”.

H
Az előbbi kapcsolat fordítottja: a jelet követő nemdeszkriptornak a vezérszó a kitüntetett szinonimája vagy kváziszinonimája.

Például:

JOGÁLLAM

H
Alkotmányosság
Azaz a „Jogállam” az „Alkotmányosság” kitüntetett szinonimája.

Lásd ÉS-/Helyett ÉS-kapcsolat

L& A jelet követő deszkriptorok együttesen a vezérszó kitüntetett kváziszinonimái (és-kapcsolat). Egy nemdeszkriptort legfeljebb három deszkriptor helyettesíthet

Például:

Erkölcsi kopás

L&     Értékcsökkenés

Kopás

Azaz az „Erkölcsi kopás” kitüntetett kváziszinonim kifejezései az „Értékcsökkenés” és a „Kopás”.

H&
Az előbbi kapcsolat fordítottja: a jelet követő nemdeszkriptornak a vezérszó az egyik kitüntetett szinonim kifejezése (együtt más kitüntetett szinonim kifejezésekkel és-kapcsolatban).

Például:

ÉRTÉKCSÖKKENÉS

H&
Erkölcsi kopás

Azaz az „Értékcsökkenés” az „Erkölcsi kopás” egyik kitüntetett kváziszinonim kifejezése.

Lásd-VAGY/Helyett VAGY

LV
A jelet követő deszkriptorok valamelyike a vezérszó kitüntetett szinonimája vagy kváziszinonimája (vagy-kapcsolat). (A kváziszinonima, mint ahogy azt a 2.15 fejezetben láttuk, lehet homonima is.)

Például:

Folklór

LV
Folklorisztika
Népművészet
Néprajz
Azaz a „Folklór” kitüntetett kváziszinonim kifejezése vagy a „Folklorisztika”, vagy a „Népművészet”, vagy a „Néprajz”.

HV  Az előbbi kapcsolat fordítottja: a jelet követő nemdeszkriptor a vezérszó az egyik lehetséges (vagylagosan választható) kitüntetett szinonimája vagy kváziszinonimája.

Például:

NÉPMŰVÉSZET

HV
Folklór
Azaz a „Népművészet” a „Folklór” egyik kitüntetett kváziszinonim kifejezése, ugyanakkor van vagylagosan választható másik kitüntetett nem szinonim kifejezése is.

2.2.2.2.2 Deszkriptorok közötti kapcsolat

A deszkriptorok között feltüntetett kapcsolatok a tezaurusz használóját támogatják abban, hogy megtalá lja mindazokat a kifejezéseket, melyeket a tárgykör jellemzésére esetleg felhasználhat. A kapcsolatok alapján tágabb vagy szűkebb tárgykör választható, rokon értelmű tárgykör választható, vagy egyéb értelemben finomítható a tárgykör leírása.

Generikus (nem-faj) kapcsolat

F
A jelet követő deszkriptor jelentése a vezérszóénál általánosabb.

Például:

BARLANGÁSZAT

F
Természetjárás
Azaz a „Természetjárás” általánosabb jelentésű, mint a „Barlangászat” (generikus fölérendeltje).

Az A jelet követő deszkriptor jelentése a vezérszóénál speciálisabb.

Például:

TERMÉSZETJÁRÁS

A
 Barlangászat
Azaz a „Barlangászat” fajtája (generikus alárendeltje) a „Természetjárásnak”.

Partitív (egész-rész) kapcsolat

T A T az egészet jelöli (a vezérszóval szemben, mely a részt jelöli).

Például:

DÁNIA

T
Skandinávia
Azaz „Dánia” „Skandinávia” része.

PSZICHIKUM

T
Lélektan
A „Lélektan” tárgya, eleme a „Pszichikum”, azaz a „Lélektan” ismeretterületének része a „stressz”.

OKTATÁS

T
Oktatásügy
Az „Oktatásügy” tárgya, eleme az „Oktatás”.

P A P a részt jelöli (a vezérszóval szemben, mely az egészet jelöli)

Például:

SKANDINÁVIA

T
Európa
P  Dánia
Norvégia
Svédország

LÉLEKTAN

P
Pszichikum

OKTATÁSÜGY

P
Oktatás

Megjegyzés : A tezauruszban a tudományok, ismeret- és szakterületek, iparok, tevékenységi körök (pl. Lélektan, Jog, Építőipar, Oktatásügy) tárgyait, elemeit, mindazt tehát, amikre e területek vonatkoznak, az egész-rész kapcsolattal jelölik.

Előfeltétel/kiindulás – rezultáns/következés kapcso lat

R Az R a következést, valami által meghatározottat (okozatot, következményt, célt, hatást, eredményt, terméket, továbbá rendeltetést, illetve tevékenység vagy hatás tárgyát) jelöli (a vezérszóval szemben, mely az okot, indítékot, eredetet, továbbá eszközt, illetve a valamire irányuló tevékenységet, hatás előidézőjét jelöli).

Például:

DEVIANCIA

R
Bűnözés

A deviancia következménye (lehet) a Bűnözés, a kettő között ok-okozati összefüggés van [oka-okozata kapcsolat].

JUGOSZLÁVIA

R   Bosznia és Hercegovina
Horvátország
Macedónia
Szerbia
Szlovénia

„Jugoszlávia” megszűntével keletkezett Bosznia és Hercegovina, stb. [eredetet-eredménye kapcsolat]

SZAKSZERVEZET

R
Érdekvédelem

A „Szakszervezet” rendeltetése/feladata az „Érdekvédelem”. Azaz az „Érdekvédelem” (egyik) eszköze a „Szakszervezet” [eszköz-rendeltetés kapcsolat dolog (szervezet, gép, szerszám) és tevékenység között].

KULTURÁLIS CSERE

R
Szakképzés

A Szakképzés (egyik lehetséges) eszköze a Kulturális csere [eszköz-rendeltetés kapcsolat tevékenység és tevékenység között].

ORVOSTUDOMÁNY

R
Gyógyítás

A „Gyógyítás” során az „Orvostudományt” [eszköz-rendeltetés kapcsolat tudomány és tevékenységi kör között].

KERTÉPÍTÉS

R
Park

A „Kertépítés” tárgya (többek között) a „Park” [tevékenység-tevékenység tárgya kapcsolat].

E Az E az előfeltételt, ami valamit meghatároz (okot, indítékot, eredetet, továbbá eszközt, illetve a valamire irányuló tevékenységet, hatás előidézőjét) jelöli (a vezérszóval szemben, mely az okozatot, következmény t, célt, hatást, eredményt, terméket, továbbá rendeltetést, illetve tevékenység vagy hatás tárgyát jelöli).

Például:

BŰNÖZÉS

E
Deviancia

BOSZNIA ÉS HERCEGOVINA

E
Jugoszlávia

ÉRDEKVÉDELEM

E
Szakszervezet

KULTURÁLIS CSERE

E
Szakképzés

GYÓGYÍTÁS

E
Orvostudomány

PARK

E
Kertépítés

Megjegyzés : A tezauruszban az oka-okozata, feltétele-következménye, eredete-eredménye, dolog-hatása, eszköze-rendeltetése, tevékenység-tárgya folyamat/tevékenység-terméke és tevékenység-célja összefüggéseket az R/E kapcsolattal jelölik.

Rokonsági (egyéb) kapcsolat

X
A jelet követő deszkriptor a vezérszóval egyéb, a tezauruszban lényegesnek tekintett kapcsolatban áll.

Például:

SZOCIALIZÁCIÓ DEVIANCIA

X
Deviancia   X   Szocializáció

SZAKSZERVEZET SZTRÁJK

X
Sztrájk   X   Szakszervezet

ÉHÍNSÉG SZEGÉNYSÉG

X    Szegénység   X   Éhínség

Megjegyzés : A tezauruszban a dolog-tulajdonsága, dolog-folyamata, dolog-állapota, dolog-kapcsolódó dolog, továbbá a hasonlósága és az ellentéte összefüggéseket az X/X kapcsolattal jelölik.

„Lásd még más értelemben” kapcsolat

SZEM     látószerv értelemben
M:   Látószerv
H:   Termés szeme esetén a „mag” használandó

=   Mag

Megjegyzés : Ezzel a relációval a „Homonimák és poliszémák megkülönböztetése” című fejezetben is foglalkozunk.

A „lásd még más értelemben” relációt a Tezaurusz 1.0 kiadásában technikai okokból egyelőre az = (és nem a ?) jellel jelöltük. A későbbi kiadásokban kerül sor a ? relációjel alkalmazására.

2.2.2.3 A KAPCSOLATOK (A RELÁCIÓJELEK) SORRENDJE:

H/L, H&/L&, HV/LV, F, A, T, P, R, E, X, =/=

A kapcsolattípuson belül a kapcsolódó lexikai egységek betűrendben következnek.

Ismétlődő kapcsolatok esetén csak az első kapcsolódó lexikai egység előtt szerepel a relációjel.

2.2.2.4 A KAPCSOLATOK MEGFELELŐI FELHASZNÁLÓI SZINTEN

A kereső rendszer felületén a relációjeleknek az alábbi felhasználóbarát megjelenítése is lehetséges:

Szabványos jelölés

Felhasználóbarát jelölés

L
=
Lásd szinonimáját

L&
=
Lásd még

LV
=
Lásd vagy

F
=
Lásd még általánosabban:

A
=
Lásd még speciálisabban

T
=
Lásd még átfogóbban:

P
=
Lásd még részletesebben:

R
=
Lásd még oksági összefüggésben

E
=
Lásd még okozati összefüggésben

X
=
Lásd még egyéb összefüggésben:

H
=
Lásd szinonimáját

H&
=
Lásd még

HV
=
Lásd vagylagosan

=
=
Lásd még más értelemben

2.3 A szógyűjtés és a szókincs kérdése
2.3.1 A szavak fölvételének feltételei

Minden kifejezést igyekeztünk fölvenni, amely a hazai böngészési és információkeresési, továbbá osztályozási és tárgyszavazási gyakorlatban használatos.

Több esetben olyan kifejezést is fölvettünk, mely vagy rendkívül általános, és ezért a kereséskor valószínűtlen a használata, vagy rendkívül meghatározatlan. A felvétel mellett ilyenkor vagy azért döntöttünk, mert

  • a kifejezésnek összefoglaló szerepe van, számos olyan speciális kifejezés kapcsolódik hozzá, melyeket az osztályozáshoz és kereséshez használnak;
  • a kifejezés több jelentésű, és róla LV („lásd vagy”) kapcsolattal utaltunk a szóba jöhető deszkriptorokra.

HA ÖSSZEFOGLALÓ FÖLÉRENDELT, PL .:

INDOGERMÁN NYELV

F
Nyelvcsalád
A   Albán
Angol
Balti nyelv
Germán nyelv
Kelta nyelv
Latin
Ógörög
Szláv nyelv
Újlatin nyelv
T  Indo-európai kultúrák filológiája
X   Indogermánok

HA HOMONÍMIA MIATT LV UTALÁST ALKALMAZTUNK ÉS MEG KELLETT KÜLÖNBÖZTETNI A HOMONIMÁKAT, ÉS LÉTEZETT SZAKMAILAG ELFOGADOTT ÖSSZETETT KIFEJEZÉS, PL.:

Levél

LV
Irodalmi levél

Kéziratos levél

Körlevél

Levelezés

Levélküldemény

Növényi levél

Nyílt levél

Szállítólevél

2.3.3 Hátravetett értelmezők a lexikai egységek végén

A tezauruszban a 2.1.5 fejezetben elmondottak értelmében igyekeztünk elkerülni a homonimák és poliszémák megkülönböztetésére egyébként alkalmazott hátravett értelmezőket.

A kerek zárójelbe tett hátravetett értelmező k használatára csak a legritkább esetben került sor

Például:

ARGUMENTUM (ISKOLAI SZÍNHÁZI MŰSOR)

M:   Az iskolai színjátszás keretében tartott előadás műsora
F   Színházi műsor

Néha a hátravetett értelmezőt látszólag feloldottuk (a zárójelet megszüntettük)

ANYAG TULAJDONSÁG SZERINT

F  Anyag
A   Agresszív anyag

Élettani hatású anyag

Fényérzékeny anyag

Gyúlékony anyag

Halmazállapot

Hatóanyag

Hőálló anyag

Idegen anyag

Illóanyag

Korróziós közeg

Nagykeménységű anyag

Optikai anyag

Radioaktív anyag

Robbanóanyag

Szennyezőanyag

Szerves anyag

Szervetlen anyag

Természetes anyag

Tűzálló anyag

Veszélyes anyag

Ilyen esetekben a viszonylag sok kapcsolatnak az az oka, hogy a tezaurusz teljesen átfogó, ugyanakkor rendkívül speciális kifejezéseket is tartalmaz. Ezért eleve sok fogalom válik gyűjtőfogalommá, másrészt ezek a gyűjtőfogalmak sok fogalomra vonatkoznak.

2.3.4 A Tezaurusz HUNMARC formátuma

A RELEX segítségével a Tezaurusz HUNMARC formátumban exportálható (ez a formátum megegyezik a USMARC formátumával). E formátum alapján vehető át az egyes könyvtári adatbázisrendszerekbe, ha azokat felkészítik a besorolási adatok adatcsere-formátumára.

Példaként az alábbi tezauruszcikk HUNMARC exportját mutatjuk be.

ÁLLAMIGAZGATÁS

M:   Az államhatalom felsőfokú rendelkező, végrehajtó szervező, irányító tevékenysége
H:   Az „-igazgatás” és „Államigazgatás” összetételek egy része a „Közigazgatás-” kezdetű lexikai egységeknél található
Forrás:  UMLEX
Forrás:  KözigLex
KAT:  T
H  Felsőfokú igazgatás
HV  Igazgatás
F   Irányító tevékenység
A   Felügyelet
Hadügy
Közigazgatás
Külügy
Rendészet
T  Államjog
Civilizáció
P  Ügyvitel
R   Közjó
E   Hatóság
X   Államigazgatási eljárás

Az alábbi példában illusztrációképpen a fenti tezauruszcikk HUNMARC szerkezetű formátumát mutatjuk be.

A szerkezeti formátumban az almezőhatárjelet (hex 1F) $ jellel, a mezőhatárjelet (hex 1E) @ jellel, a rekordhatárjelet (hex 1D) | jellel, és a szóközt a # jellel helyettesítjük (a mezőértékként szereplő szövegek szóközeit azonban csak a szokásos üres hellyel jelöljük).

A formátum ellenőrzésével keletkező megjelenítés, melyben az értékeket a mezőhívójelek és almezőjelek stb. azonosítják (az ellenőrzést a RELEX-től független kicsomagoló programmal [5] végeztük):

A formátum értelmezése:

Mutató

 

 

Kategória: 2001. 1. szám | A közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!