49. évfolyam, 2003. 1. szám
Archívum

Új ISO-szabvány a nyelvek nevének azonosítására

Kuruc Imréné
 

A világ nyelveinek azonosítására egyedi, nemzetközi kódot megállapító nemzetközi szabványtól azt várják, hogy könyvtárak, tájékoztató központok, indexelő és kivonatokat készítő szolgálatok, levéltárak és kiadók számára legyen hasznos.

Az új ISO 639-1:2002 A nyelvek nevének kódjai. 1. rész: Kétjegyű betűkódok szabvány hatékony eszköz a világ leggyakoribb nyelveinek azonosítására, amely lehetővé teszi, hogy a tájékoztatásban, a kommunikációban és az oktatásban idegen nyelvet használók számára színvonalas szolgáltatást nyújtsanak.

Az ISO 639-1-et az ISO/TC 37 Terminológia és más nyelvi források műszaki bizottság SC2 Terminológia és lexikográfia albizottsága készítette. Ez az albizottság készítette az ISO 639-2:1998 Nyelvek nevének kódjai. 2. rész: Háromjegyű betűkódok nemzetközi szabványt is.

Az ISO 639-1 szerinti nyelvkódokat bibliográfiákban, terminológiai dokumentumokban, szótárakban, többnyelvű betűrendes jegyzékekben vagy bármilyen más alkalmazásban fogják használni, ahol kétbetűs kódokra van szükség (például számítógépes rendszerekben az interneten).

Az internet az ISO 639-1 alkalmazásának egyik fő területe. Amikor egy keresőprogramban nyelvet határozunk meg, valójában az ISO 639-1-et használjuk.

Az új ISO 639-1 szabvány 182 nyelvnév kétjegyű betűkódját tartalmazza. Minden egyes kód a latin ábécé 26 betűjéből vett – ékezetes betűket nem tartalmazó – két betű kombinációjából áll. Kialakításuk alapja a nyelv neve a saját nyelvén, illetve angolul, valamint a nyelvnév adott nyelven belüli használata, vagy a nyelvet használó közösségek gyakorlata. Például a magyar nyelv kétbetűs kódja az ISO 639-1-ben az angol nyelvű „Hungarian” elnevezésből „hu”, a kínai nyelv kódja „zh”, amely a kínai nyelvben használt „zhongwen” néven alapszik.

A nyelvnevek azonosításán kívül az ISO 639-1 összekapcsolható az EN ISO 3166-1:1997 Országok és igazgatási egységek neveinek kódja. Országnevek kódjai szabvánnyal is, amikor annak a területnek (országnak vagy igazgatási egységnek) a megjelölése szükséges, amelyben egy szót, szakkifejezést vagy nyelvet használják. Például az Egyesült Államokban használt „elevator” szó jelölése „elevator (US)”, illetve a Nagy-Britanniában használt „lift” jelölése „lift (GB)” lehet.

A hivatkozott EN ISO 3166-1 a fenti címen MSZ EN ISO 3166-1:2000 azonosító jelzettel magyar szabványként is megjelent.

AZ ISO 639-1-gyel összhangban a Nemzetközi Terminológiai Központ (Infoterm, International Information Centre for Terminology) jelölte ki a karbantartó szervezetet (Registration Authorityt), az ISO 639-1/RA-t. Az Infoterm általánosan felelős az új nyelvkódokra vonatkozó javaslatok átvételéért, az új kódok megállapításáért, illetve a meglévő kódok bármilyen megváltoztatásáért a szabványban közölt feltételek szerint.

Az ISO 639-1/RA a nyelvkódokkal kapcsolatos adatokról naprakész nyilvántartást vezet, feldolgozza a nyilvántartásba vett nyelvkódokat, ezeket az előfizetők és más érdekelt felek részére rendszeresen megküldi.

A 182 nyelv, amit a szabvány tartalmaz, nem látszik soknak, ha figyelembe vesszük, hogy a nyelvek száma 5000 és 7000 között van. Ennek ellenére a karbantartó szervezet csak korlátozott számú nyelvvel foglalkozhatott, mert a kétjegyű betűkódok száma nem lehet nagyobb, mint amit a latin ábécé betűinek száma lehetővé tesz (26x26 = 676 lehetséges kód). Ezért az ISO 639-1 a világnak csak azokat a nagy nyelveit tartalmazza, amelyek a leggyakrabban jelennek meg a világirodalom teljes anyagában.

Megjegyzés: Az ISO 639-1/RA karbantartó szervezetre vonatkozó részletesebb tájékoztatás az Infoterm weboldalán is megtalálható (linux.infoterm.org/infoterm-e/i-infoterm.htm?raiso639-1_start.htm)

A háromjegyű betűkódokat tartalmazó, 1998-ban megjelent ISO 639-2 nemzetközi szabványt MSZ 3400:2000 A nyelvek háromjegyű betűkódjai címmel részben honosítottuk. Az ISO 639-2 jelenleg 400-nál több nyelvet tartalmaz: a magyar szabvány ezeknek csak egy részét 140-et. A válogatás szempontja az volt, hogy a magyar szabvány csak azokat a nyelveket tartalmazza, amelyeken írott (rögzített) dokumentumok gyakran előfordulnak a magyar könyvtári gyakorlatban.

Hasonló módon célszerű lenne az új ISO 639-1 magyar szabványként való bevezetése is, de erre jelenleg nincs meg a megfelelő anyagi fedezet.

Reméljük, hogy mind a két nyelvkód-szabvány nagymértékben elősegíti a hazai és a nemzetközi gyakorlatban a gyors és hatékony információcserét.

Országos Széchényi Könyvtár
Észrevételek