Thomas Hyde, az oxfordi Bodleiana Könyvtár katalógusának szerzője az 1674-ben megjelent katalógusa előszavában azt írja: „Úgy látszik, mindenki úgy gondolja, hogy a legkönnyebb dolog a világon a könyvek címének leírása, de milyen körültekintő vizsgálatot kíván a pamphletek gondos vizsgálata (ami önmagában kimerítő munka), mennyit a hasonló nevű szerzők és művek megkülönböztetése, anagrammatikus nevek megfejtése, a helynévből és hasonlókból származóké, a szegény ember kijelenti, hogy a legnagyobb agytornát és a legértékesebb idő feláldozását jelenti.”1

A probléma forrása

A Bodleiana Könyvtár katalógusának megjelenése óta több mint 300 év telt el. Ez idő alatt a szerzők azonosításának, a személynevek egységesítésének kérdése egyáltalán nem veszített a jelentőségéből, sőt napjainkban a tudományos közösségek tagjai, az egyetemek oktatói és hallgatói publikációs tevékenységét összegyűjtő, archiváló és szolgáltató intézményi repozitóriumok megjelenésével újra központi kérdéssé vált. A „nyílt hozzáférés” (Open Access) mozgalom elveit követő dokumentumszerverek és intézményi publikációs adattárak személynév kezelési gyakorlata, a formai és tartalmi szempontokat egyaránt vizsgálva, jelentősen eltér a könyvtári feldolgozómunkában alkalmazott megoldásoktól. Az adattárak kezelésére kifejlesztett, zömmel nyílt forráskódú szoftverek feldolgozó moduljai nem követik azt a szabályos adatmodellt, amely a személynév típusú besorolási rekordokat az integrált könyvtárgépesítési rendszerek legtöbbjében jellemzik. A személynévrekordok géppel olvasható formátumban (Machine-Readable Cataloging – MARC) történő tárolása nélkül, az egyes személyek azonosítását lehetővé tevő részletes struktúrák hiányában a repozitóriumokba feltöltött publikációk visszakeresésében komoly nehézségek és pontatlanságok jelentkezhetnek. Bizonytalanná válhat az egy szerzőhöz tartozó publikációk száma, a rendszer alkalmatlanná válik megbízható, minőségi információk szolgáltatására az adott intézmény vagy kutatói közösség tudományos eredményeit illetően. Jelen tanulmányban a probléma bemutatására és a lehetséges megoldások összegyűjtésére teszek kísérletet, hazai és nemzetközi példák felvonultatásával.

Intézményi publikációs adattárak, a tudományos kommunikáció új eszközei

A digitális repozitóriumok a hozzáférés, a tudományos kommunikáció új eszközei, a kutatási eredmények széleskörű megismertetését, a digitális publikálást és az intézményeken átnyúló közös munkát támogató rendszerek, az egyetemi oktatók és hallgatók munkájának, tudományos eredményeinek bemutatását és elismertetését szolgáló rendszerek. Segítségükkel a felsőoktatási intézményekben keletkező digitális tartalmak, cikkek, könyvek, oktatási anyagok, szakdolgozatok, doktori disszertációk hosszú távon megőrizhetők és megoszthatók.2

1. ábra
Magyarországi repozitóriumok az OpenDOAR nyilvántartásában4

A repozitóriumok pár év alatt gyorsan elterjedtek az egyetemi és akadémiai szférában a világ minden részén. A Nyílt Hozzáférésű Repozitóriumok Jegyzékének (Directory of Open Access Repositories – OpenDOAR, http://www.opendoar.org/index.html) nyilvántartása szerint 2012 áprilisának első napjaiban a számuk megközelítette a 2200-at. A nottinghami egyetemen működő Centre for Research Commu¬nications3 által épített adatbázisban lehetőség van a repozitóriumok több szempontú visszakeresésére a feldolgozott tudományterület, a dokumentumtípusok, a jelleg, a földrajzi elhelyezkedés, a nyelv és az alkalmazott szoftver szerint is. A nyilvántartásban hazánkat összesen 6 szervezet 12 repozitóriuma képviseli, azonban meg kell jegyezni, hogy ha a repozitóriumokra úgy tekintünk, mint adott intézmény publikációs adattárára, akkor a felsorolásban megtévesztő a Magyar Elektronikus Könyvtár szerepeltetése. A magyarországi adattárak sorát a Közép-európai Egyetem archívuma nyitja és a Debreceni Egyetemé zárja. A teljes listát az 1. ábra tartalmazza.

1. táblázat
Magyarország szomszédos országaiban működő publikációs adattárak száma 

A következő táblázat adatai alapján5, a szomszédos országokban működő repozitóriumok számával összehasonlítva megállapítható, hogy hazánk az élvonalban foglal helyet, egyedül Ukrajna előzi meg (1. táblázat). Az adattárak gazdái jellemzően a felsőoktatási intézmények és akadémiák körébe tartoznak, de képviseltetik magukat a nemzeti könyvtárak, ahogy hazánk esetében az Országos Széchényi Könyvtár is.
Az OpenDOAR nyilvántartásához hasonló, viszont jóval több keresési lehetőséget biztosít az angliai University of Southampton által szolgáltatott Nyílt Hozzáférésű Repozitóriumok Nyilvántartása (Registry of Open Access Repositories – ROAR, http://roar.eprints.org/), mely 2012 áprilisában, a bekerült adatok alapján a világ 2311 repozitóriumában összesen 33 914 611 tételt tartott nyilván.7 Óriási adatmennyiségről van szó, amely professzionális megoldásokat kíván a formai és tartalmi feltárás vonatkozásában.

A repozitórium motorja, a szoftver

Az intézményi repozitóriumokat jellemzően könyvtári és informatikai szakemberek tervezik meg és üzemelik be. A költségek csökkentése érdekében elsősorban nyílt forráskódú repozitórium-kezelő szoftvereket alkalmaznak. A fent említett két nyilvántartás összesen 86 különböző szoftvert regisztrál, melyek többségét csak egy-egy adattár használja.

Az OpenDOAR adatai szerint a repozitóriumok kezelésére alkalmazott szoftverek közül az első helyen 39,2%-kal és 859 telepítéssel a DSpace elnevezésű szoftver áll, a második helyen – az adatok hiánya miatt – az ismeretlen szoftverek csoportja 18,2%-kal és 398 telepítéssel, a harmadik helyen pedig az EPrints nevű rendszer áll, 15,3%-kal és 336 telepítéssel. Emellett igen jelentős (17,9%) az „egyéb” kategóriába tartozó szoftverek csoportja (2. ábra). Mindebből arra következtethetünk, hogy döntően egyedi fejlesztésű, a helyi igényekre tervezett rendszerekről van szó, azok minden előnyével és hátrányával.
Nagyságrendileg az itt látott arányokat támasztják alá a ROAR adatai is. A kínálat zavarba ejtően gazdag, nem könnyű a választás egy új intézményi repozitórium létrehozásakor. A döntés óriási felelősséggel jár, mely nem nélkülözheti egy stabil, minden érintett érdekét figyelembe vevő értékelési szempontrendszer felállítását.

2. ábra
Repozitóriumok szoftverek szerinti megoszlása az OpenDOAR nyilvántartásában8

Ebben nyújt segítséget a Nyílt Társadalom Alapítvány (Open Society Institute – OSI) által 2004-ben kiadott Guide to Institutional Repository Software című dokumentum, mely 9 nyílt forráskódú szoftver (Archimede, ARNO, CDSware, DSpace, EPrints, Fedora, i-Tor, MyCoRe, OPUS) összehasonlító elemzését tartalmazza. Az egyes rendszerek bemutatása két részből tevődik össze. Az első fejezet összefoglaló jellegű leírásokat közöl, melyek egy rövid ismertetőt követően tartalmazzák a szoftver fejlesztőinek elérhetőségeit és linkeket a további információk eléréséhez. Az útmutató második fejezetében a rendszerek jellegzetességeit és működését áttekintő részletes táblázatok kaptak helyet, amelyek a szoftver speciális funkcióit is bemutatják. A táblázatokban megjelenő szempontrendszer felépítését tekintve 6 témakörön belül – technikai specifikáció, repozitórium és rendszeradminisztráció, tartalommenedzsment, megjelenés és keresési lehetőségek, archiválás, rendszerkarbantartás – 20 kérdést és számtalan további alkérdést vizsgál.9

A szoftver kiválasztásának szempontjai közül kiemelten fontos, hogy az adott szoftverben milyen lehetőségeket biztosítanak a feltöltött publikációk szerzőségi közlésében megjelenő személynevek kezelésére. Létrehozható-e az adattárban olyan rekord, amely a különböző szerzőségi funkciókban eljáró személyek egységesített nevét tartalmazza, azt az elsődleges hozzáférési pontként, besorolási adatként kiválasztott nevet, amelyen az adott személy a működését kifejtette, illetve amelyen a nemzeti hovatartozásának megfelelő bibliográfiai gyakorlat a személyt számon tartja? Van-e lehetőség az egyes személyek névváltozatainak összekapcsolására és a közöttük fennálló utalások megadására a keresés megkönnyítése érdekében? Az előzőekben említett útmutató részletessége ellenére sem ad választ az itt feltett kérdésekre, a közlemények formai feltárására vonatkozóan csupán a rendszerekben alkalmazott metaadat sémákat sorolja fel. A 9 szoftver közül három a Dublin Core-t, négy a Qualified Dublin Core-t használja, „egyéb” kategóriába tartozó sémát adtak meg az i-Tor szoftver esetében, és mindössze egy rendszer alkalmazza a MARC21 adatcsere-formátumot.

Személynevek kezelése a könyvtári rendszerekben

A személyek pontos azonosítása a könyvtári feldolgozó munkában kiemelt jelentőségű feladat. A könyvtári katalógusokban a személynév az egyik leggyakrabban előforduló besorolási adat és egyben keresési szempont, amelyen keresztül az olvasók eljutnak az általuk keresett dokumentumhoz. Az eredményes keresés alapfeltétele, hogy a személynév – formáját tekintve – mindig ugyanabban az egységes, szabványos alakban tárolódjon a katalógusban. A dokumentumok formai és tartalmi feltárásakor keletkező bibliográfiai leírások számtalan olyan adatelemet (metaadatot) tartalmaznak, amelyek közvetlenül – a forráson szereplő alakjukban – nem alkalmasak a dokumentum visszakeresésére. A formai feltárásra vonatkozó hazai és nemzetközi előírások értelmében ezeket az adatokat – bár a forráson szereplő alakban kell felvenni a leírás meghatározott adatcsoportjaiba, de besorolási adatként – egységesíteni kell. Ha a dokumentum leírásakor a szerző kilétét vagy nevének egységesített alakját és a kapcsolódó névváltozatokat pontatlanul vagy hiányosan állapítják meg, illetve a létező névvariánsokat nem kapcsolják össze a kitüntetett névalakkal, a hozzá tartozó információ nem kereshető vissza, lényeges tételek maradnak ki a rá vonatkozó keresés eredményeként kapott találati listából. A szerzőket azonosító besorolási adatok és gépi rekordjaik létrehozása, rendszerbe foglalása, a már meglévő névállományok folyamatos revideálása, a változások követése jelentős költségráfordítást igényel. Napjainkban a tapasztalatok és a különböző empirikus kutatások eredményei azt mutatják, hogy a munka minőségét, összetettségét, időtartamát és költségeit tekintve ez a munkafolyamat, az autorizálás munkafolyamata, az eredeti katalogizálás legdrágább összetevője.10 Kétség kívül drága és időigényes folyamat, viszont nélkülözhetetlen. Egységesített besorolási adatok nélkül, valamint kitüntetett névalakok hiányában a katalógus – legyen az hagyományos cédula vagy modern gépi katalógus – nem tud választ adni olyan alapvető kérdésekre, mint például egy szerzőnek milyen művei vannak meg a könyvtárban, illetve egy bizonyos személyről milyen dokumentumok találhatók a gyűjteményben.

Szabványok és szabályzatok az egységesítés szolgálatában

A könyvtári katalógusokban a személynevek egységesített besorolási adatait szigorú szabályok előírásai szerint választják ki és tüntetik fel. A szabványosítás az 1960-as években kezdődött el, ekkor alakultak ki – sok egyéb könyvtári szabvány mellett – a név típusú besorolási adatokra vonatkozó besorolási szabványok is. Az IFLA (International Federation of Library Associations and Institutions) speciális munkacsoportjai munkája nyomán számtalan program indult a nemzetközi autorizálási rendszer kiépítése érdekében. Útmutatókat és ajánlásokat jelentettek meg, valamint a szakértők számára több nemzetközi konferenciát szerveztek a témában. A Guidelines for Authority and Reference Entries (GARE) alapjain 1991-ben kidolgozták a besorolási adatok nemzetközi adatcsere-formátumát, a UNIMARC/Authorities: Universal Format for Authoritiest, melynek jelenleg érvényben lévő, harmadik kiadása 2009-ben jelent meg UNIMARC Manual: Authorities Format11 címmel. Az idők során újabbnál újabb személyazonosítási sémák kidolgozására tettek kísérletet. Az alábbi felsorolás az IFLA ez irányú tevékenységének legmeghatározóbb állomásait foglalja össze az elmúlt közel fél évszázadban (3. ábra).

3. ábra
Az IFLA besorolási adatokkal kapcsolatos tevékenységei 

A nemzetközi előírások rendszeréhez kapcsolódva, a szabványosítás hazai eredményeit tükrözik azok az MSZ, illetve KSZ jelzésű magyar könyvtári szabványok és szabályzatok, amelyek szintén a besorolási adatok egységesítésének irányelveit hivatottak rögzíteni. A könyvtári munkával összefüggő hazai szabványok megalkotásában és kiadásában jelentős szerepet tölt be a Magyar Szabványügyi Testület (MSZT) keretében működő Könyvtár és dokumentáció Műszaki Bizottság. „Az 508-as számjelű Könyvtár és dokumentáció Műszaki Bizottság adta és adja ki a legtöbb, a könyvtári munkával összefüggő, dokumentumazonosítókra vonatkozó magyar szabványt MSZ jelöléssel, magyar szabványként közzétett (honosított) nemzetközi és Európa-szabványt MSZ ISO, MSZ EN, illetve MSZ ISO EN jelöléssel.”12 A besorolási adatokra vonatkozó, jelenleg hatályos előírásokat a következő felsorolás tartalmazza:

  • MSZ 3440-1:1983 A bibliográfiai leírás besorolási adatai. Fogalommeghatározások. 5 p. (Utolsó helyesbítése megjelent: 1988.)
  • MSZ 3440-2:1979 A bibliográfiai leírás besorolási adatai. Személyek nevei. 32 p. (Helyesbítése megjelent: 1988.
  • MSZ 3440-3:1983 A bibliográfiai leírás besorolási adatai. Testületek neve. 28 p. (Helyesbítése megjelent: 1988.)
  • MSZ 3440-4:1986 A bibliográfiai leírás besorolási adatai. Címek. 13 p.
  • KSZ/5:2005 Földrajzi nevek, mint adatbázisrekordok tárgyi hozzáférési pontjai. 32 p.13

A fentiek közül a személynevek egységesített besorolási adatként való kezelésével az MSZ 3440/2-1979 A bibliográfiai leírás besorolási adatai. Személyek nevei című dokumentum foglalkozik. A szabvány mindenekelőtt alapelvként rögzíti, hogy a besorolási adatként megjelenő személyeket mindig ugyanazon a néven kell megnevezni és nevüket mindig ugyanabban a névalakban, a személy egységesített nevén kell leírni. A besorolási adatokon belül rendelkezik a különböző besorolási elemekről, a rendszó, az egyéb elemek és a kiegészítő adatok megválasztásának és feltüntetésének szabályairól, részletesen kidolgozva a történelmi koronként és nyelvterületenként jelentkező egyéb speciális szabályokat (modern névhasználat, történelmi névhasználat, uralkodók és uralkodóházak tagjainak nevei, vallási nevek, írói nevek, művésznevek és álnevek, pótnevek). Figyelemre méltó a szabvány 8. fejezete, melyben az azonos nevű személyek megkülönböztetésének lehetőségeit tárgyalja, felsorolva azokat az eseteket, amikor a személy azonosíthatóságának érdekében kötelező, illetve a bibliográfia szempontjától függően lehet kiegészítő adato(ka)t közölni. Kötelező kiegészítő adatot közölni:

  • ha a személynek nincs sem családneve, sem pedig állandósult mellékneve, és az egységesített besorolási adatának rendszava a személy egyéni neve;
  • uralkodók és királynék esetében a birodalom neve a földrajzi nevekre vonatkozó szabályok figyelembe vételével;
  • a vallási nevek sorában a „pápa” vagy „ellenpápa” kifejezés feltüntetése;
    pátriárkák és metropoliták egységesített nevének részeként a méltóságuk megnevezése a bibliográfia nyelvén;
  • bibliai személyek nevét követően a vallási cím megadása;
  • a pótnéven ismert személyek esetében az azonosíthatóságot leginkább biztosító adatok közlése.

A kiegészítő adatként feltüntethető elemek típusait a fejezet további szakaszai veszik számba, úgymint az id. vagy ifj. jelző, illetve ezek változatai, a születési és/vagy halálozási dátum, a személy foglalkozásának, működési területének megnevezése, az általa betöltött méltóságok, vallási címek, származási vagy működési helyének megnevezése.14
Az említett szabvány megjelenése óta eltelt 30 év olyan változásokat hozott a nemzetközi tendenciákban az elméleti és gyakorlati megfontolások terén, valamint az informatikai megoldások tekintetében, amelyek indokolttá teszik a megújítását és a mai kor követelményeihez való alakítását. A besorolási adatokra és a csere-formátumukra vonatkozó előírások szabályzatként való megjelentetésének folyamata jelenleg is tart. Az Országos Széchényi Könyvtár 2010. évi munkatervében a „Kiemelt országos feladatok” elnevezésű fejezetben szerepelt „A HUNMARC Besorolási rekordok adatcsere formátuma című szabályzat elkészítése a központi katalógusok szakértőinek bevonásával”15, viszont megjelenésére anyagi okok miatt mindezidáig még nem volt lehetőség.

A besorolási adatok adatcsere-formátumai

A könyvtári munkafolyamatok gépesítésével és a szabványok megjelenésével párhuzamosan alakultak ki a besorolási adatok gépi adatcsere-formátumai. A besorolási adatok MARC típusú, tehát géppel olvasható adatcsere-formátumának adatelem-választéka rendkívül gazdag, a MARC formátum első, 1968-as kiadása óta eltelt közel 50 év alatt fokozatosan bővült. A besorolási rekordok a személynevek gépi kezeléséhez szükséges valamennyi adatot tartalmazzák, biztosítva a leírt személy lehető legpontosabb azonosítását. Rögzítik a személynév típusú besorolási adat egységesített alakját, a hozzá kapcsolódó, az egyértelműségét biztosító kiegészítő adatokat, például személyek esetében a születési és/vagy halálozási évszámot, esetleg a foglalkozásra utaló kifejezést. Tartalmazzák továbbá ugyanazon besorolási adat egyéb alakjait, a hagyományos katalógusból jól ismert „lásd” típusú utalókat, valamint az egységesített besorolási adatnak az idők folyamán végbement változásai esetén a „lásd még”, a „lásd előbb” vagy a „lásd utóbb” értelmű utalóit, és egyéb tájékoztató, illetve technikai adatokat.16 A számítógépes megoldások esetében a személynevek kezelésére vonatkozó előírások betartását a besorolási adatok adatcsere-formátumban történő tárolása és cseréje jelenti. A hazai adatcsere-formátum, a HUNMARC mint a bibliográfiai rekordok adatcsere-formátuma a nemzeti MARC formátumok rendszeréhez csatlakozva jött létre. Első, 1994-ben kiadott változatát 2002-ben követte a második, jelenleg is érvényben lévő KSZ/4.1 jelű szabályzat. A besorolási adatok HUNMARC alapú adatcsere-formátumának első tervezete 1999-ben készült el, de sajnos nem jelent meg. 2009-ben a MARC21 teljes változata alapján elkészült a besorolási adatcsere-formátum teljes magyar adaptációja is 17, a kiadásra váró szabályzatról bővebben Ungváry Rudolfnak a Könyvtári Figyelő 2010-es 1. számában megjelent tanulmányában olvashatunk.

Személynevek a HUNMARC és a MARC21 besorolási adatcsere-formátumban

A személynév típusú besorolási adatok szerkezeti elemeit a HUNMARC formátumban, a többi adatcsere-formátumhoz hasonlóan almező azonosítókkal (kódokkal) ellátott almezőkbe kell írni. A különböző adatcsere-formátumok eltérő részletességgel tárják fel a személyek nevének elemeit. A 2. táblázatban látható, hogy az OSZK által jelenleg is használt 1999-es HUNMARC besorolási adatcsere-formátum tervezet személynevekre vonatkozó részében a gépi adatfeldolgozást segítő rekordfejet és mutatót követő hívójelekhez tartozó adatmezők és almezők köre igen gazdag. Jelkészletét tekintve alapesetben 13 adatmezőhöz 38 almező kapcsolódik, melyek száma a besorolási adathoz tartozó információk mennyiségének és részletezettségének megfelelően, az egyes adatmezők és almezők ismételhetőségét kihasználva, a szükséges mértékben csökkenthető vagy még tovább bővíthető.18

2. táblázat
A HUNMARC alapú besorolási adatcsere-formátum 1999-es tervezetének elemei

Hívójel  Adatmező tartalma  Almező
001 Rekordazonosító nincs
005 A rekorddal való utolsó művelet dátuma és ideje nincs
008 Meghatározott jellemzők és információs adatok nincs
035 Rendszerellenőrző szám $a = ellenőrző szám
040 A besorolási rekord forrása $a = az eredeti leíró intézmény neve/betűjele/bejelentő kódja
$b = a leírás/katalógus nyelve (nyelvkóddal)
$c = (géppel olvasható formába) átíró intézmény neve/betűjele/bejelentő kódja
$d = a módosító intézmény neve/betűjele/bejelentő kódja
$e = katalogizálási szabvány/leírási megegyezések
$f = tárgyszó típusú besorolási adatnak fenntartott
100 Személynév $a = rendszó
$b = uralkodói sorszám (egyéb elem)
$c = méltóság, foglalkozás stb. kiegészítő
$d = kronologikus kiegészítő
$g = állandósult melléknév stb. (egyéb elem)
$j = egyéni név stb. (egyéb elem)
$m = rokonsági kiegészítő
400 Személy névváltozata – „lásd” utaló $a = rendszó
$b = uralkodói sorszám (egyéb elem)
$c = méltóság, foglalkozás stb. kiegészítő
$d = kronologikus kiegészítő
$g = állandósult melléknév stb. (egyéb elem)
$j = egyéni név, stb. (egyéb elem)
$m = rokonsági kiegészítő
500 Személy névváltozása – „lásd még” utaló $j = egyéni név stb. (egyéb elem)
$b = uralkodói sorszám (egyéb elem)
$c = méltóság, foglalkozás stb. kiegészítő
$g = állandósult melléknév stb. (egyéb elem)
$d = kronologikus kiegészítő
$m = rokonsági kiegészítő
667 Megjegyzés belső használatra $a = a megjegyzés szövege
$c = a forrást alkalmazó betűjele/kódja
670 Megjegyzés a besorolási adat forrásáról $a = hivatkozás a forrásra
$b = az információ helye a forráson belül
$c = a forrást alkalmazó betűjele/kódja
675 Megjegyzés egyéb adatforrásról $a = hivatkozás a forrásra
$c = a forrást alkalmazó betűjele/kódja
678 Megjegyzés – a forrásban talált adatok összegzése $a = a megjegyzés szövege
$b = a megjegyzés szövegének részletezése
680 Nyilvános általános megjegyzés $a = a besorolási adat megnevezése
$i = a megjegyzés szövegének részletezése

A személynév típusú besorolási adatok tárolására a HUNMARC formátum 2009-ben, a MARC21-re alapozva kidolgozott tervezete a korábbinál még részletesebb almezőrendszert kínál, minként a MARC21 nemzetközi adatcsere formátum (MARC21 Format for Authority Data), melynek legutóbbi, 13. módosítása 2011 szeptemberében jelent meg. Mivel a tanulmány terjedelme nem teszi lehetővé a két besorolási adatcsere-formátum hívójelenkénti összehasonlítását, ezért a 3. táblázatban mindkét formátumból csupán egy, a 100-as hívójellel azonosított rendszó értékű elemhez tartozó almezők bemutatásával szeretném érzékeltetni a két formátumban rejlő lehetőségeket.

3. táblázat
A 100-as adatmező almezői egy személynév besorolási rekordjában

HUNMARC
személynév besorolási rekord19 MARC21
Format for Authority Data20
100
$a = rendszó
$b = uralkodói sorszám (egyéb elem)
$c = méltóság, foglalkozás stb. kiegészítő
$d = kronologikus kiegészítő
$g = állandósult melléknév stb. (egyéb elem)
$j = egyéni név stb. (egyéb elem)
$m = rokonsági kiegészítő
$t = címreláció
$1 = címrelációként beágyazott egységesített címre való hivatkozás
$v = formai altárgyszó
$x = általános altárgyszó
$y = kronologikus altárgyszó
$z = földrajzi altárgyszó
100
$a = személynév
$b = személynév számeleme
$c = a névhez kapcsolódó titulusok, egyéb szavak
$d = a névhez kapcsolódó dátumok
$e = relációs kifejezés
$f = kiadás ideje (leírt műhöz tartozó)
$g = egyéb információk
$h = hordozó
$j = szerzőségi minőséget jelölő adat
$k = formai alcím
$l = a (leírt) mű nyelve
$m = a zeneműben szereplő hangszerek
$n = a mű részének számozása
$o = a zenemű átdolgozása
$p = a mű részének címe
$q = a név teljesebb formája
$r = a zenemű hangneme
$s = verzió
$t = a mű címe
$v = formai alosztás
$x = általános alosztás
$y = kronológiai alosztás
$z = földrajzi alosztás
$6 = kapcsolatok
$8 = mezőkapcsoló és sorozatszám

A személyek azonosíthatósága érdekében minden információ feltüntetése, amely az alapadatok pontosítását szolgálja, nélkülözhetetlen.

Személynevek az intézményi repozitóriumokban

A könyvtári szabványok, szabályzatok, valamint a besorolási adatcsere-formátumok példáján keresztül láthattuk, hogy a könyvtári rendszerekben az egységesítés szigorú szabályai szerint kell eljárni a személynevek besorolási rekordjainak elkészítésekor. Ezzel szemben a nyílt forráskódú repozitórium-kezelő szoftverek nagy részében semmiféle szabályozás nincs a szerzői nevek bevitelére, a könyvtári szabványoknak megfelelő rögzítésére és a bibliográfiai tételekhez való hozzárendelés módjára vonatkozóan. A szoftvereknek nincs kész, kidolgozott modulja a szerzőségi adatok kezelésére.21 Bizonyos szoftverek esetében nem megoldott az azonos személyt jelölő névvariánsok utalókkal történő összekapcsolása sem, így a szerzők betűrendes listájába szétszóródva kerülhetnek be az ugyanazt a személyt jelölő különféle névformák. Ezen kívül rendezetlen az azonos alakú személynevek helyzete is. Az adattárakban ily módon rögzített nevekkel végső soron nem lehet megkülönböztetni az egyes személyeket. A szerzők pontos azonosításának lehetőségei igen szűkre szabottak, pedig csak az egységesített alakok és a hozzájuk kapcsolódó utalók rendszere garantálja a keresés pontosságát, a rendszer minőségét.
A repozitóriumok hálózatba kapcsolásához, a közös keresőfelületek működtetéséhez szintén nélkülözhetetlenek az egységes feltárási elvek. Ennek megvalósítása érdekében a Német Kezdeményezés az Információk Hálózatba Foglalásáért szervezet (Deutsche Initiative für Netzwerkinformationen – DINI) Elektronikus Publikálás munkacsoportja (Elektronisches Publizieren – E-Pub) 2011 májusában ajánlást adott ki, „Zertifikat Dokumenten- und Publikationsservice 2010” címmel, melynek segítségével szabványos értékelés készíthető a dokumentumszerverekről és szolgáltatásaikról, megvalósítva ezzel a dokumentációs és publikációs szolgáltatások minőségellenőrzését.22
Személynevek az EPrints repozitórium-kezelő szoftverben
A következőkben az Open Access repo¬zi¬tó­riumokban működő nyílt forráskódú rendszerek közül a harmadik leggyakoribb repozitórium-kezelő szoftver, az EPrints példáján keresztül mutatom be, milyen lehetőségek vannak egy természetes személy azonosítására és nevének rögzítésére, illetve a különböző szerzőségi funkciók megkülönböztetésére a rendszerben. A southamptoni egyetemen (University of Southampton – School of Electronics & Computer Science) dolgozó fejlesztői gárda által létrehozott rendszer adatbeviteli felületére belépve az új tételek felvitelekor 18 dokumentumtípus űrlapja közül választhatunk (4. táblázat). Az űrlapok összehasonlítását követően megállapítható, hogy a rendszer a természetes személyekhez kötődő szerzőségi adatok hét típusát különbözteti meg:

  1. Creators = alkotók
  2. Editors = szerkesztők
  3. Exhibitors = kiállítók
  4. Producers = producerek
  5. Conductors = karmesterek
  6. Accompaniment = kíséret
  7. Lyricists = dalszövegírók

Valamennyi dokumentumtípus űrlapján megtalálható az alkotók (Creators) kategória, viszont a szerkesztők (Editors) feltüntetésére kizárólag a könyvrészletek és a könyvek adatlapján van lehetőség. A további dokumentumtípusokhoz kapcsolódó speciális szerzői minőségek az alábbi táblázatban láthatók.
Az EPrints szoftver beviteli felületén megjelenő adatmezőkbe a természetes személyekről mindössze három adatelem rögzíthető: a vezetéknév (Family Name), a keresztnév, illetve annak kezdőbetűi (Given Name / Initials) és e-mail cím (Email). Három adat, ami bibliográfiai szempontból csak részben vagy egyáltalán nem elegendő a személy azonosítására (4. ábra).

4. táblázat
Szerzőségi funkciók az EPrints repozitórium-kezelő szoftverben, dokumentumtípusok szerint

4. ábra
Személynév típusú adatok rögzítése az EPrints szoftverben

Az itt látott mezőszerkezet és adatelem struktúra ismétlődik mind a hét szerzői minőség megadásakor, ami azon túl, hogy nem felel meg a könyvtári szabványokban és szabályzatokban előírt követelményeknek, egyáltalán nem ad lehetőséget a különböző szerzőségi funkciók jelölésére sem. A dokumentum szellemi tartalmát megalkotó szerzőket és közreadókat, valamint a szellemi tartalom összeállításáért felelős szerkesztőket (főszerkesztő, felelős szerkesztő, szerkesztő, összeállító), továbbá a közreműködői funkcióban eljáró személyeket, akik a dokumentum szellemi (szakmai, tudományos, irodalmi, művészi stb.) tartalmának létrehozásában vesznek részt, és a szerzőhöz, a közreadóhoz vagy a szerkesztőhöz képest alárendelt, illetve járulékos szerepet töltenek be, nem lehet elkülöníteni.23 Megfelelően részletes rekordszerkezet és utalók hiányában a besorolási adatok nem tudják ellátni a keresés során betöltött funkciójukat.
A keresés nehézségei
Az egyes szerzőségi funkciókban megjelenő természetes személyek pontos azonosítása lényeges követelmény a publikációs adattárakban történő keresés eredményessége érdekében. Ha ugyanis a rendszer alapját jelentő szoftver nem ad lehetőséget a személynevek önálló – egységesített és nem egységesített – besorolási rekordokként való tárolására, valamint nincs felkészítve a rekordok közötti utalói kapcsolatok kezelésére, továbbá hiányos vagy nem következetes a feltárás, és nem fordítunk kellő figyelmet a kezdetektől a repozitóriumba kerülő nevek egységesítésére, a szerzők és közreműködők minden kétséget kizáró azonosítására kontrolálatlan névterek alakulnak ki az adatbázisban. A keresés bizonytalanságát a következő gyakorlati példák bemutatásával szeretném érzékeltetni.

Az első, „A” jelű példában (5. ábra) egy hazai DSpace szoftvert alkalmazó intézményi repozitórium24 keresőfelületének szerzők szerinti betűrendes listája látható. A listában a személyek neve mellett nincs feltünteve az a szám, hogy az intézményi publikációs adattárában hány közlemény tartozik az adott szerzőhöz, így minden névalakot egyenként kell megvizsgálni és a címeket összehasonlítani. Kérdés továbbá, hogy az Antal K. névalaknál megjelenő publikációk is Antal Károly írásai, vagy esetleg egy másik szerző műveiről van-e szó, akinek a keresztneve szinén „K” betűvel kezdődik? A hét névalakhoz tartozó találati halmaz részletes vizsgálata nélkül, lehetetlen válaszolni a kérdésre. 

5. ábra
Bizonytalan személynevek a szerzők betűrendes listájában – “A” példa

A találati halmazokat megvizsgálva kiderül, hogy a 2. Antal Károly névalakhoz tartozó mindkét dokumentum előfordul más-más névalakoknál is. A 2.1-es publikáció címe megegyezik a 4. Antal Károly (1956-) (biológus) névformához tartozó 4.1-es címmel. Ugyan ez a jelenség tapasztalható a 2.2-es cikk esetében is, amely megismétlődik az 5. Antal Károly (1956-) (okl. biológus) névalaknál, és címe megegyzik az 5.1-es címmel. A publikációk címe alapján továbbá valószínűsíthető, hogy az Antal K. alakhoz felvett cikk szintén Antal Károly publikációinak számát gyarapítja. Tehát a hét különböző, de valójában egy személyt jelölő névalakhoz összesen nem kilenc, hanem hét közlemény tartozik.

5. táblázat
Névalakok és a publikáció címeinek egyeztetése – “A” példa

A következő „B jelű példa” (6. ábra) az angliai University of Kent repozitóriumából (Kent Academic Repository – KAR) származik25, mely az EPrints 3 szoftvert alkalmazza a digitális gyűjtemény kezelésére. A multidiszciplináris adatbázisban közel 17 000 publikáció található, melyek az egyetemen folytatott kutatások eredményeit mutatják be.

6. ábra
Bizonytalan személynevek a szerzők betűrendes listájában – “B” példa

A “B” jelű példában öt olyan névalak található a szerzők betűrendes listájában, amelyek alapján nem lehet egyértelműen eldönteni, hogy ugyanazon személy írásairól van-e szó vagy sem. Ha igen, akkor az első névalak minden bizonnyal elgépelésből, betűtévesztésből adódik. Az öt névformához tartozó találati halmazt megvizsgálva kiderül, hogy címegyezés nem áll fenn, hét különböző publikáció adatai olvashatók. Az egyes tételekhez tartozó rövid tartalmi összefoglalók és tárgyszavak segítségével megállapítható, hogy mind a hét tétel a QA 76 Software programozásának kérdését tárgyalja. Ez alapján nagy biztonsággal kijelenthető, hogy az öt különböző névalak valójában egy személyhez tartozik (6. táblázat).

6. táblázat
Névalakok és a publikáció címeinek egyeztetése – “B” példa

Fontos megjegyezni, hogy az itt bemutatott jelenség nyelvterülettől, tudományterülettől és intézménytől független, a DSpace és az EPrints 3 szoftvereken kívül más nyílt forráskódú repozitórium-kezelő rendszerek esetében is jelentkezhet.
Az előbbi példák alapján megállapítható, hogy azokban az adattárakban, ahol nincs lehetőség a személyek nevének szabványos MARC alapú egységesített besorolási rekordként való tárolására, kihasználva a könyvtári szabványok és szabályzatok nyújtotta névegységesítési kereteket, az egyes névvariánsok kontrollálatlan formában jelennek meg az adatbázisban, jelentős mértékben megnehezítve ezzel a pontos keresést. Az egységesített besorolási adatok hiánya mellett további problémát jelenthet a személyek kilétének egyértelmű azonosítása is.

Az azonosítás problematikája

A személyek azonosítása különösen nehéz feladat, ha gyakori vezeték-, illetve keresztnévvel állunk szemben. Az Eötvös Loránd Tudományegyetemen (ELTE) az Egységes Tanulmányi Rendszer Személykereső funkcióját használva hat Nagy István nevű oktatót találunk. A Magyar Folyóiratok Tartalomjegyzékének Kereshető Adatbázisában, a MATARKÁ-ban ugyanerre a névre keresve 18 névvariánst kapunk. Ezek közül bizonytalan, hogy hány publikációt tudhat magáénak az a Nagy István, aki az ELTE Természettudományi Karának Genetika Tanszékének oktatatója és hányat az a Nagy István, aki a Bölcsészettudományi Kar Orosz Nyelvi és Irodalmi Tanszékének oktatója. Nem beszélve arról a 24 Nagy Istvánról, akiket a nemzeti könyvtár, az Országos Széchényi Könyvtár katalógusa regisztrál.
Látható, hogy két vagy több személy névalakjának véletlen egybeesésekor, amikor írásképük (és többnyire hangalakjuk is) azonos, de a jelentésük, a „tartalmuk”, a jelölt személy különbözik, még inkább szükséges lenne egy olyan egyedi azonosító használatára, amelynek segítségével egyértelműen meg lehetne különböztetni az egyes szerzőket és a hozzájuk tartozó publikációkat. Hosszan sorolhatók lennének az intézményi publikációs adattárakból vett példák, de a látottak alapján érzékelhető, hogy a probléma sürgős megoldást igényel, még mielőtt az esetek száma kezelhetetlenné válik, illetve mielőtt a javítást igénylő tételek esetleg bekerülnek más keresőszolgáltatások adatbázisába.

Az ellenőrzés szerepe a repozitóriumok minőségének javításában

A repozitóriumokba bekerülő dokumentumokról felvehető adatok mennyisége és típusa változó. Léteznek olyan rendszerek, ahol elegendőek az alapadatok, de a feltárás mélységének növelésével, a beviteli adatmező típusok bővítésével jóval részletesebb leírások születnek. A dokumentumok feldolgozásának meggyorsítása érdekében a folyamat bizonyos szakaszai automatizálhatók. Az intézményi repozitóriumoknál jellemző gyakorlat alapján a publikációk szerzői által elektronikus űrlapokon beküldött metaadatok könnyen hozzárendelhetők a tételek bibliográfiai leírásaihoz. Egy teljes szövegű elektronikus dokumentumból a megfelelő technikai paraméterek beállítását követően automatikusan, szinte emberi beavatkozás nélkül kinyerhetők a leírás számára szükséges alapadatok. Elmaradhatatlan lépés viszont az így bekerült adatok ellenőrzése, kiegészítése, az esetleges hibák javítása, valamint a besorolási adatok, egységesített névalakok létrehozása. Az ellenőrzés fontosságát támasztja alá az a felmérés, amelyet Ohióban, az amerikai Kent State University (KSU) munkatársai végeztek. Az egyetem repozitóriumába 2005 és 2008 között feltöltött 95 elektronikus disszertáció és tézis absztraktját elemezték. A vizsgálat során kiderült, hogy a beküldött írásművek 13%-ában a dokumentum visszakereshetőségét jelentősen befolyásoló helyesírási hibák vannak. A szerzők által szolgáltatott metaadatokat összehasonlítva a teljes szövegű dolgozatokkal kiderült, hogy két szerző kifelejtette a metaadatok közül a cím kulcsszavakat, valamint két másik szerző pedig rosszul írta le azokat.26 A hiányosan kitöltött adatlapok és a pontatlanságok elkerülése érdekében további eszközöket kell bevonni a publikációs adattárak építőinek munkájába.
Az integrált könyvtár-gépesítési rendszerek képesek rá, hogy egyeztessék a dokumentumok formai feltárása során beírt személynévalakokat a saját egységesített névállományukkal (authority adatbázis), és az esetleges eltérésekre figyelmeztessék a feldolgozást végző személyt, aki kiválaszthatja, hogy az általa rögzített nem egységesített névalak melyik, az adatbázisban tárolt egységesített alaknak feleltethető meg. A szerkesztett rekordok végső, adatbázisba történő mentésekor lefutó automatikus ellenőrző eljárások szintén azt a célt szolgálják, hogy a katalógusokba ne kerülhessenek be olyan rekordok, amelyek nem egységesített névalakokat tartalmaznak. Fontos megjegyezni, hogy az ellenőrzés köre általában nem terjed ki a könyvtári szabványok valamennyi területére, a rendszer egyedi beállításától függően létrehozhatók egyszerűbb és részletesebb ellenőrzési szabályok is.
A hazai intézményi repozitóriumok esetében, a Magyar Tudományos Akadémia Könyvtárának repozitóriumát (REAL) bemutató cikkében Holl András szintén az ellenőrzés és a metaadatok fontosságára hívja fel a figyelmet. Utal rá, hogy „a tapasztalatok azt mutatják, hogy nagy gondot kell fordítani a digitális gyűjteményben elhelyezett dokumentumok minőségbiztosítására, amelyben a repozitóriumot gondozó könyvtárnak kompetenciája van, a megfelelő metaadatokra, a hitelességre, a formátumra. Továbbá alapvető, hogy a szükséges metaadatok minden esetben rendelkezésre álljanak, s minél kevesebb hibát tartalmazzanak. Fontos továbbá az esetlegesen meglévő egyedi azonosítók tárolása is.”27

Névadattárak mint külső források

A szerzők kilétének és nevük teljes, egységesített besorolási adatának megállapításához, pontosításához több külső forrás, névjegyzék is használható, bár a módszer az intézményi publikációs adattárak gyakorlatában még nem terjedt el. A csatlakoztatható adattárak közül említésre méltó a Virtuális Azonosító Adattár (Virtual International Authority File – VIAF), amely a Német Nemzeti Könyvtár (Die Deutsche Bibliothek – DDB), a Francia Nemzeti Könyvtár (Bibliothèque nationale de France – BnF) és a Kongresszusi Könyvtár (Library of Congress – LC) egyesített projektje. A több nemzeti könyvtár közös vállalkozásaként létrejött projektet az Online Computer Library Center (OCLC) működteti, melyhez adatokat szolgáltat a magyar nemzeti könyvtár, az Országos Széchényi Könyvtár is. A virtuális gyűjtemény célja, hogy az egyes nemzeti besorolási adatállományokat egyetlen, egységes besorolási adatállományként szolgáltassa. A VIAF tervei között szerepel a személynév típusú besorolási adatok mellett a testületek és a konferenciák nevének összegyűjtése is. 2011 végén a szolgáltatás megvalósításában 19 könyvtár vesz részt, és további három könyvtár bekapcsolásának tesztelése zajlik. Az egységesített személynévállományok a rendszerhez való csatlakozást követően továbbra is az egyes könyvtárakban tárolódnak. Ennek megfelelően amellett, hogy minden besorolási adat egységes nemzetközi besorolásiadat-azonosítót, VIAF ID-t kap, megőrzi a forráskönyvtárban kapott azonosítóját is. Az azonosító kód átvehető minden könyvtár besorolási adatállományába, az adatcsere-formátum megfelelő mezőjébe.28
További jelentős adatállománnyal segíti a nevek egységesítését az amerikai Library of Congress Authorities29 szolgáltatása. Az adatbázis körülbelül 3,8 millió személy, 900 000 testület, 120 000 konferencia és 90 000 földrajzi név rekordját tartalmazza, összesen 5,3 millió egységesített besorolási adatot. Az ingyenes szolgáltatás rekordjai MARC és címkés formátumban jeleníthetők meg, a találatok egyenként menthetők, kinyomtathatók, és e-mailben saját címre is továbbíthatók. Lehetséges adatforrásként meg kell említeni a nemzeti névadattárak sorába tartozó, 1995 óta épülő német, Personennamendatei (PND) nemzeti névadattárat is, mely jelenleg 3,6 millió tételt tartalmaz. Az adatbázis folyamatosan bővül. A német nyelvterülethez tartozó személynevek egységesítésének kiváló forrása. Hazai vonatkozásban szintén jelentős adatállománnyal rendelkezik az Országos Széchényi Könyvtár honlapján elérhető „Név besorolási rekordok” elnevezésű adatbázis mely személynevek, testületi nevek és konferenciák egységesített besorolási rekordjait tartalmazza.
Felhasználhatók lennének a repozitóriumokat létrehozó intézmények helyi névállományai is, amelyeket egy egyetem esetében például a hallgatói és oktatói nyilvántartásokból lehetne átemelni. Ez önmagában azonban nem jelent teljes körű megoldást, hiszen az intézményközi együttműködések során született cikkeknek külső szerzői is lehetnek, a külső szerzőkre viszont nem terjed ki az adott intézmény azonosítási rendszere.30 A felsőoktatási intézmények esetében további nehézséget jelenthet, hogy a hallgató első publikációjának adatbázisba történő feltöltésekor, előzmények hiányában a leírás készítője nem tudja behasonlítani a szerző nevét a repozitórium belső névállományába. Ennek megoldására az amerikai egyesült államokbeli Mississippi State University (MSU) Könyvtárának Feldolgozó Osztálya együttműködési programot dolgozott ki a könyvtár Szakdolgozatok és Disszertációk Osztályával. Az egyetemen készített dolgozatok formai követelményeinek teljesítéséhez segítséget nyújtó iroda szerzői kapcsolattartási adatlapját31 minden végzős hallgatónak kötelező beküldeni a dolgozatával együtt, ezért úgy döntöttek, hogy ehhez az űrlaphoz fűzik hozzá további, az egységesített névállományok pontosításához szükséges kérdéseiket. Az űrlap kötelező adatai: a szerző teljes neve, elsődleges és egy további telefonszáma, állandó lakcíme, e-mail címe, a dolgozat benyújtási és formátum információi. A kötelező adatok után, önálló „Név autorizálási információ” alcímmel ellátott részében kaptak helyet az önkéntesen megadható adatok rovatai, melyek a következők:

  • rövid ismertetés az egységesített személynév rekordokról és használatukról;
  • nyilatkozat arról, hogy a kiegészítő információk megadása nem kötelező;
  • az MSU Könyvtára autorizálással foglalkozó munkatársának neve és elérhetősége, amennyiben a szerzőnek kérdései merülnek fel az adatlap kitöltésével kapcsolatban;
  • az előnyben részesített névalak, ha az eltér az űrlap kötelezően kitöltendő részében feltüntetettől;
  • korábbi nevek, pl. leánykori név, stb.;
  • születési dátum.

A kitöltött adatlapok feldolgozásához kifejlesztett szoftver segítségével az adatok közvetlenül a nevek egységesítésért felelős könyvtáros számítógépére továbbíthatók, ahonnan egyetlen mozdulattal átvihetők az egységesített személyneveket tartalmazó adatbázisba. 2004 decemberében a kibővített adatlapot először kézbe vevő 88 hallgató közül 39-en (44%) töltötték ki az adatlap nem kötelező, a névazonosításhoz szükséges, kiegészítő információkat kérő részét.32

International Standard Name Identifier (ISNI), Nemzetközi Név Azonosító Szabvány

A különböző azonosító számok és kódrendszerek a könyvtári feldolgozómunka alapvető eszközei. Szabványos nemzetközi azonosítóval rendelkeznek a könyvek (ISBN – International Standard Book Number33), az időszaki kiadványok (ISSN – International Standard Serial Number34), viszont ezekhez hasonló, nemzetközileg elfogadott és széles körben elterjedt szabványos azonosítóval nem rendelkezünk a személyek és testületek azonosításának vonatkozásában.35
A személyeket, testületeket azonosító szabványos kódrendszer létrehozását tűzte ki célul a Nemzetközi Szabványügyi Szervezet (International Organization for Standardization – ISO) TC 46 Információ és Dokumentáció Műszaki Bizottsága. A könyvtári területet érintő nemzetközi szabványok kidolgozásáért felelős testület 9-es számú Azonosítás és Leírás Albizottságának (SC 9 Identification and description) 6. munkacsoportja (WG 6) dolgozta ki az International Standard Name Identifier (ISNI) Draft ISO 27729 szabványtervezet36, amely 2012. március 6-án hivatalos ISO szabványként jelent meg (ISO 27729:2012 Information and documentation – International standard name identifier, ISNI). A munkacsoport olyan azonosítási rendszert hozott létre, amely hatályba lépését követően világszerte alkalmazható a média és tartalomipar minden szereplője számára. A globálisan egyedi ISNI azonosító célja, hogy a jelölt entitások metaadatainak részletes felsorolása helyett egy egyszerű, rövid, egyedi kódot biztosítson, egyértelműen megkülönböztetve őket a hasonló személyektől, testületektől vagy más entitásoktól a különböző weben elérhető adatbázisokban. A jelölt alany lehet természetes személy, mint például egy könyv szerzője vagy jogi személy, akár egy lemezkiadó vagy kitalált személy, például Pán Péter.37

ISNI azonosító igénylése

ISNI számot igényelhet a Regisztrációs Ügynökségeken (Registration Agencies – RAG) keresztül minden ún. közismert identitás (Public Identity), amely részt vesz a kulturális javak előállításában, menedzselésében vagy terjesztésében a digitális környezetben, legyen az akár egy író, zeneszerző, térképész, kutató vagy kiadó. A közismert identitás az a név, amelyen az azonosított alany ismertté vált, mint ahogy az Alice Csodaországban című meseregény szerzőjének írói álneve Lewis Carroll, eredeti nevén Charles Lutwidge Dodgson. Mindkét közismert identitás önálló, egyedi ISNI azonosítóval rendelkezik (Carroll, Lewis: ISNI 0000 0001 2137 136X ; Dodgson, Charles Lutwidge: ISNI 0000 0001 0830 3354 ), melyek között az összetartozás jelölhető. Az azonosító igénylésekor legalább a következő metaadatokat kell megadni:

  • a közismert identitás neve,
  • születési és/vagy halálozási idő és hely (vagy jogi személy bejegyzése és megszűnése),
  • a Regisztrációs Hatóság (Registration Authority – RA) által definiált osztály és szerepek megadása. Az osztályok lehetnek zenei, audio¬vizuális, irodalmi stb., a szerepek lehetnek szerző, előadóművész, kiadó stb.
  • az alkotás címe vagy hivatkozás az alkotásra,
  • URI (vagy URL) biztosítása, amely további részletes információkat ad a jelölt alanyról.

Az azonosító iránti igények feldolgozását a Regisztrációs Ügynökségek végzik. Előfordulhat, hogy a kért közismert identitás már szerepel az ISNI adatbázisban. Ebben az esetben a létező ISNI szám lesz visszaküldve az igénylőnek. Ha nem, akkor létrejön az új azonosító, és bekerül az adatbázisba.38 Az ISNI azonosító felépítését tekintve 16 karakteres kód, amelynek utolsó számjegye ellenőrző karakter funkcióját tölti be.

Az ISNI kód kiosztásának néhány alapvető szabálya

Az azonosított alany minden közismert identitásának önálló ISNI száma van. Például a korábban már említett Lewis Carroll álnevet jelöli egy kód, és egy másik ISNI számot kap a személy valódi neve, Charles Lutwidge Dodgson. Ugyanannak a közismert identitásnak a karakterkészletből (pl. Günter Graß, Guenter Grass és Guenter Graß), transzliterálásból (pl. Ciaikovsky, Pjotr Iljc és Пётр Ильич Чайковский) eredő vagy nyelvi (Pyotr Tchaikovsky és Peter Tchaikovsky) és alternatív helyesírású névvariánsai (Shakespeare – Shakespear) egy ISNI számot kapnak. A további speciális jelölési szabályokat a Regisztrációs Hatóság a megfelelő időben publikálni fogja.39

7. ábra
Az ISNI adatbázisok feletti jellege

Az ISNI rendszert úgy tervezték meg, mint egy hidat, az adatgazdák már létező saját azonosító rendszerei felett álló nyílt réteget (7. ábra). Összekapcsolja, többek között olyan óriási, többmilliós adategyüttesek birtokosait, mint a VIAF (Virtual International Authority File), az IPI (Interested Party Identifier) vagy az IPDA (International Performer Database) adatbázis, eredményesebbé téve a keresést a globális egyedi azonosító által.
Az ISNI rendszere lehetővé teszi a különböző partnerek számára, hogy a jelölt identitásokra vonatkozó információk cseréjét anélkül valósítsák meg, hogy bizalmas információkat kellene közzétenniük.
Az ISNI csak a legszükségesebb metaadatokat kezeli, amelyek elengedhetetlenek két identitás egyértelmű megkülönböztetéséhez. Minden egyéb releváns információ megmarad a forrás adatbázisban.40

Az ISNI szervezete

Az ISNI szabvány fejlesztésére megalakult konzorcium41 2010 decemberében non profit szervezetként megalapította a Nemzetközi ISNI Ügynökséget (ISNI International Agency – ISNI-IA) Londonban, amely a későbbiekben a rendszerrel kapcsolatos feladatokat és adminisztrációt végzi majd. Az ISNI teljes szervezete három különböző részre osztható:
az ISNI-IA által működtetett Regisztrációs Hatóság (Registration Authority – RA),
a Regisztrációs Ügynökségek (Registration Agencies – RAG), amelyek az ISNI rendszer minden szolgáltatását biztosítják a felhasználóknak,
az Igazoló Ügynökségek (Verification Agen¬cies), amelyek a speciális adategyeztetési szolgáltatásokat nyújtják az ISNI Regisztrációs Hatóságnak (8. ábra).

8. ábra
Az ISNI szervezeti felépítése42

 

A Regisztrációs Hatóság

A Regisztrációs Hatóságot az Igazgatóság és a Stratégiai Tanácsadó Testület irányítja. Az ISO által kijelölt Regisztrációs Hatóság (RA) felelős az ISNI központi referencia adatbázis létrehozásáért és fenntartásáért, a közismert identitások beérkező metaadatainak ellenőrzéséért. Az RA felelős továbbá az ISNI szabvány teljes adminisztrációjáért és irányításáért is. A Regisztrációs Hatóság nem nyújt közvetlen szolgáltatásokat a felhasználók számára, a lehetséges felhasználókat a Regisztrációs Ügynökségekhez irányítja át. A Regisztrációs Hatóság folyamatosan bővíti és szélesíti az ISNI központi adatbázisát, kizárólagos tulajdonosa az ISNI-hez kapcsolódó metaadatoknak.

A Regisztrációs Ügynökségek

Az ISNI Regisztrációs Ügynökségeket (ISNI RAG) az ISNI Nemzetközi Ügynökség (ISNI IA) jelöli ki (9. ábra). A Regisztrációs Ügynökségek közvetítő szerepet töltenek be a felhasználók és a Regisztrációs Hatóság (ISNI RA) között. Minden szervezet, amely igazolhatóan érdeklődést mutat az ISNI tevékenysége iránt, Regisztrációs Ügynökséggé válhat. Nincs kizárólagosság sem területi alapon, sem a piaci szegmens alapján, mint például a kiadói ágazat vagy a zeneipar. A Regisztrációs Ügynökségeknek csak olvasásra korlátozott hozzáférése lesz az ISNI teljes adatbázisához. Az ügynökségek az egyedüli ISNI számok kiadására jogosult szervezetek. A felhasználók minden ISNI azonosítóra vonatkozó kérelmét egy Regisztrációs Ügynökséghez irányítják át, melyek központi feladata az ISNI hivatkozások kikeresése az ISNI Nemzetközi Ügynökség által fenntartott központi adatbázisból, valamint az ISNI azonosítók kiosztása a közismert identitások számára.43
Az adatbázis létrehozásának első fázisában (2010. december – 2011. április) a működési környezet kialakítását követően, a VIAF adatainak betöltésével megkezdődött a rendszer tesztelése. Az ISNI nyilvánosan hozzáférhető induló adatbázisa a konzorciumban részt vevő alapító tagok és egyéb csatlakozó szervezetek adatállományával 2011 novemberétől érhető el a http://isni.oclc.nl/DB=1.2/ url címen. Az új azonosító számrendszer alkalmazása a MARC21 nemzetközi besorolási adatcsere-formátumban is lehetséges, 2010 októberében az ISNI kód bekerült a MARC 21 besorolási adatcsere-formátum „A” jelű függelékébe, a $0 azonosítóval ellátott almezőben tüntethető fel.45

Összegzés

Az intézményi publikációs adattárak elterjedésével a szerzők azonosításának fontossága még inkább előtérbe került. A kutatási eredmények archiválásának és a hozzáférhetőségének biztosításán túl a hiteles adatokat szolgáltató adatbázisok jelentős segítséget nyújthatnak az adott intézményben oktató kutatók fokozatszerzésre irányuló, illetve akkreditációs eljárásokhoz szükséges dokumentumainak és igazolásainak kiállításához. A kutatók tudományos munkásságát regisztráló repozitóriumok névkezelési stratégiája jelentősen eltér a könyvtárakban évtizedek óta alkalmazott, szabványokra, szabályzatokra épülő módszerektől. A cikkben szereplő példák bizonyítják, hogy milyen nehézségeket és bizonytalanságokat okoz a publikációk visszakeresésében, ha a rendszerek nem képesek a személynevek egységesített besorolási rekordként való tárolására, a különböző névvariánsok közötti kapcsolatok rendezésére. Láthattuk, hogy az integrált könyvtári rendszerekben működő MARC típusú besorolási adatcsere-formátumokban, a MARC21 és a HUNMARC formátumban egyaránt számtalan lehetőség kínálkozik a speciális adatmezők és almezők rendszerén keresztül, melyek használatával a személyek és besorolási adataik egyértelműen megkülönböztethetők egymástól. Az intézményi publikációs adattárakban megjelenő ellenőrizetlen személynév állományok tömege a szabványos MARC típusú besorolási adatcsere-formátum használatával számottevően csökkenthető lenne.46 A besorolási adatokat egyértelmű és megbízható módon kezelő, megfelelően felkészített szoftver kiválasztásával nagy lépést tehetnénk az intézményi publikációs adattárak minőségének javítása felé. A szerzők megkülönböztetése érdekében további előrelépést jelentene, ha az adatbázisokban alkalmazott szoftverek lehetőséget nyújtanának az intézményen kívüli, külső névadattárakkal való összekapcsolódásra, továbbá alkalmasak lennének az ISNI kódrendszeréből származó egyedi azonosítószámok rögzítésére is.

 9.ábra
A Regisztrációs Ügynökség tevékenysége

Köszönetnyilvánítás

Tanulmányom elkészítésében nyújtott segítségéért és rendkívül értékes tanácsaiért ezúton szeretném kifejezni köszönetemet Rácz Ágnesnek, az Országos Széchényi Könyvtár munkatársának.

Irodalom

SZELLE Béla: Bevezetés a katalogizálás elméletébe. Budapest : Tankönyvkiadó, 1967. 42. p.
SEAMAN, David: Discovering the information needs of humanists when planning an institutional repository. = D-Lib Magazine, Vol. 17. 2011. No. 3–4. URL: http://www.dlib.org/dlib/march11/seaman/03seaman.html Ref.: DRÓTOS László: Bölcsészek információs igényeinek megismerése egy intézményi repozitórium tervezésekor. = Tudományos és Műszaki Tájékoztatás, 58. évf. 2011. 7. sz. 308–311. p.
 További információk a központ honlapján. Elérhetősége: http://crc.nottingham.ac.uk/index.php (Letöltés: 2012. április 4.)
 Az adatok forrása az OpenDOAR nyilvántartás. Elérhetősége: http://www.opendoar.org/countrylist.php?cContinent=Europe (Letöltés: 2012. április 4.)
 Az adatok forrása az OpenDOAR nyilvántartás. Elérhetősége: http://www.opendoar.org/countrylist.php?cContinent=Europe (Letöltés: 2012. április 4.)
 Az OpenDOAR ügyfélszolgálata az írásbeli megkeresést követően azt a tájékoztatást adta, hogy Szlovákiáról nem rendelkeznek adatokkal.
 Az adatok forrása a Registry of Open Access Repositories. Elérhetősége: http://maps.repository66.org/ (Letöltés: 2012. április 4.)
 Az ábra forrása az OpenDOAR honlapja. Elérhetősége: http://opendoar.org/find.php?format=charts (Letöltés: 2012. április 4.)
 Open Society Institute: A Guide to Institutional Repository Software. 3rd. ed. New York : Open Society Institute, 2004. 28 p. Elérhetősége: http://www.soros.org/openaccess/pdf/OSI_Guide_to_IR_Software_v3.pdf (Letöltés: 2012. április 4.)
 DUDÁS Anikó: A besorolási adatok egységesítésének problémái a dokumentumleírásban. (Doktori disszertáció) 2005. 43. p.
 WILLER, Mirna (ed.): UNIMARC manual : Authorities format. 3rd. ed. München : Saur, 2009. 309 p.
 BERKE Barnabásné: Könyvtári és szakirodalmi tájékoztatási (dokumentációs) szabványok, szabályzatok. In: Könyvtárosok kézikönyve 5. Segédletek. Szerk. HORVÁTH Tibor, PAPP István. Budapest : Osiris, 2003. 86. p.
 A KSZ/5:2005 jelű szabályzat az MSZ 3440/5-79 A bibliográfiai leírás besorolási adatai. Földrajzi nevek című szabványt váltotta fel. Előírásai a leírásban tárgyi besorolási adatként megjelenő földrajzi nevekre érvényesek, az egyéb funkcióban előforduló földrajzi nevek (megjelenés helye, más besorolási adatok földrajzi kiegészítő adata) formájára más szabályok vonatkoznak.
 MSZ 3440/2-79 A bibliográfiai leírás besorolási adatai. Személyek nevei. 26–27. p.
 Az Országos Széchényi Könyvtár feladatokra orientált szakmai munkaterve 2010. 4. p. Elérhetősége: http://www.oszk.hu/sites/default/files/szakmai_munkaterv_2010.pdf (Letöltés: 2012. április 4.)
 UNGVÁRY Rudolf – VAJDA Erik: Könyvtári információkeresés. 2. jav. kiad. Budapest : Typotex, 2002. 126. p.
 UNGVÁRY Rudolf: MARC21/HUNMARC: a besorolási adatok metaadat-formátuma – Főbb jellemzők, fejlődés és problémák. = Könyvtári Figyelő, 56. évf. 2010. 1. sz. 9–70. p.
 Az adatok forrása a Magyar Országos Közös Katalógus (MOKKA) honlapja. Elérhetősége: http://www.mokka.hu/documents/10156/7af08493-cd3d-45c4-aa91-1c5e88abef43 (Letöltés: 2012. április 4.)
 A MARC21 adaptációjaként létrehozott HUNMARC besorolási adatcsere-formátum szabályzattervezethez képest a következő almezőket a MOKKA személynév típusú besorolási rekordjai nem alkalmazzák: $t, $l, $v, $x, $y, $z.
 Az adatok forrása a Library of Congress honlapja. Elérhetősége: http://www.loc.gov/marc/authority/adx00.html (Letöltés: 2012. április 4.)
 SALO, Dorothea: Name authority control in institutional repositories. = Cataloging & Classification Quarterly, Vol. 47. 2009. No. 364. 249–261. p. Ref.: DUDÁS Anikó: Névkezelés (authority control) az intézményi repozitóriumoknál. = Tudományos és Műszaki Tájékoztatás, 57. évf. 2010. 8. sz. 345–350. p.
 DINI Deutsche Initiative für Netzwerkinformation e.V. Arbeitsgruppe “Elektronisches Publizieren”: DINI-Zertifikat Dokumenten- und Publikationsservice 2010. Göttingen : DINI, Geschäftsstelle c/o Niedersächsische Staats- und Universitätsbibliothek, 2011. 68 p. Elérhetősége: http://edoc.hu-berlin.de/series/dini-schriften/2010-3-en/PDF/dini-zertifikat-2010-3-en.pdf (Letöltés: 2012. április 4.)
 Könyvtári és Szakirodalmi Tájékoztatási Bizottság (közread.): KSZ/2 Könyvtári és szakirodalmi tájékoztatási szabályzat. Bibliográfiai leírás. Elektronikus dokumentumok. Budapest : OSZK, 2000. 17. p.
 Az ábrák a Debreceni Egyetem Egyetemi és Nemzeti Könyvtár Debreceni Egyetem Elektronikus Archívumából származnak. Elérhetősége: http://dea.unideb.hu/dea/ (Letöltés: 2012. április 4.)
 Az adatok forrása a Kent Academic Repository. Elérhetősége: http://kar.kent.ac.uk/view/people/ (Letöltés: 2012. április 4.)
 MCCUTCHEON, S.: Basic, fuller, fullest: Treatment options for electronic theses and dissertations. = Library Collections, Acquisitions, and Technical Services, Vol. 35. 2011. No. 2–3. 64–68. p.
 HOLL András: REAL – az MTA Könyvtárának repozitóriuma. = Tudományos és Műszaki Tájékoztatás, 57. évf. 2010. 6. sz. 245–249. p.
 UNGVÁRY Rudolf: A besorolási adatcsere-formátum bővülése. A legutóbbi két évtized fejleménye. = Tudományos és Műszaki Tájékoztatás, 58. évf. 2011. 9. sz. 371–386. p.
 Az adatok forrása a Library of Congress Authorities honlapja. Elérhetősége: http://authorities.loc.gov/ (Letöltés: 2012. április 4.)
 SALO, Dorothea: Name authority control in institutional repositories. = Cataloging & Classification Quarterly, Vol. 47. 2009. No. 3-4. 249–261. p. Ref.: DUDÁS Anikó: Névkezelés (authority control) az intézményi repozitóriumoknál. = Tudományos és Műszaki Tájékoztatás, 57. évf. 2010. 8. sz. 345–350. p.
 MSU Szerzői kapcsolattartási adatlap. Elérhetősége: http://library.msstate.edu/content/templates/level2-dept-otd/docs/Author%20Contact%20Form.pdf (Letöltés: 2012. április 4.)
 WOLVERTON Jr., Robert E. – HOOVER, Lona – HALL, Susan – FOWLER, Robert: Chapter 5. Issues of name authority control in the cataloging of theses and dissertations. = Technical Services Quarterly, Supplement 1. Vol. 25. 2008. 75–94. p.
 Bővebb információk találhatók a Nemzetközi ISBN Iroda (International ISBN Agency) honlapján. Elérhetősége: http://www.isbn-international.org/ (Letöltés: 2012. április 4.)
 Bővebb információk találhatók a Nemzetközi ISSN Központ (ISSN International Centre) honlapján. Elérhetősége: http://www.issn.org/ (Letöltés: 2012. április 4.)
 HENDERSON, Helen: From the Guest Content Editor. = Information Standards Quarterly, Vol. 23. 2011. No. 3. 3. p.
 A szabványtervezet első megjelenésekor, 2006-ban az International Standard Party Identifier (ISPI) nevet viselte. Forrás: az ISO 46 Információ és Dokumentáció Műszaki Bizottság 9-es számú albizottságának dokumentum archívuma. Az N429, N, 440, N446 és N449 számjelű dokumentumok alapján. Elérhetősége: http://www.collectionscanada.gc.ca/iso/tc46sc9/registr.htm (Letöltés: 2012. április 4.)
 GATENBY, Janifer – MACEWAN, Andrew: Hello, My Name is ISNI : A new system for name identification. = Information Standards Quarterly, Vol. 23. 2011. No. 3. 4-9. p.
 DERIDDER, Jody: I2 and ISNI : Improving the Information Supply Chain with Standard Institutional Identifiers. = Information Standards Quarterly, Vol. 23. 2011. No. 3. 26–29. p.
 International Standard Name Identifier (ISNI) honlapja. Elérhetősége: http://www.isni.org/ (Letöltés: 2012. április 4.)
 ISNI FAQ. Elérhetősége: http://www.isni.org/docs/isni_faq.pdf (Letöltés: 2012. április 4.)
 A Nemzetközi Ügynökséget megalapító konzorcium tagjai: International Confederation of Societies of Authors and Composers (CISAC) ; International Federation of Reproduction Rights Organisations (IFRRO) ; International Performers Database Association (IPDA) ; ProQuest ; Online Computer Library Center (OCLC) ; valamint a Conference of European National Librarians képviseletében a Bibliothèque Nationale de France (BnF) és a The British Library (BL)
 Az ábra forrása az ISNI honlapja. Elérhetősége: http://www.isni.org/docs/isni_operations.pdf (Letöltés: 2012. április 4.)
 The ISNI Organization. Elérhetősége: http://isni.org/ (Letöltés: 2012. április 4.)
 Az ábra forrása: DERIDDER, Jody: I2 and ISNI : Improving the Information Supply Chain with Standard Institutional Identifiers. = Information Standards Quarterly, Vol. 23. 2011. No. 3. 27. p.
 További információk a Library of Congress, MARC21 formátum honlapján. Elérhetősége: http://www.loc.gov/marc/authority/ecadcntf.html (Letöltés: 2012. április 4.)
 UNGVÁRY Rudolf: A besorolási adatcsere-formátum bővülése. A legutóbbi két évtized fejleménye. = Tudományos és Műszaki Tájékoztatás, 58. évf. 2011. 9. sz. 371–386. p.