Az autorizálás (authority control) az információszervezés és -hozzáférés feladatkörében – definiálás és nemzetközi tapasztalatok

Authority control in organizing and
accessing information: definition and international experience / guest editors Arlene G. Taylor, Barbara B. Tillett with the assistance of  Mauro Guerrini, Murtha Baca = Cataloging & Classification  Quarterly.
Part 1, Vol. 38 no. 3–4 (2004).  Part 2, vol.
39 no. 1–2  (2004). – 619 p.
alapján az összeállítást készítette
Dudás Anikó

A bibliográfusok és katalogizálók évszázados gyakorlata során kialakult rendezési és rendszerezési technika – a „péczeszóval”, vezérszavakkal, rendszavakkal, a „prominens szerzők” megkülönböztetésével, (egységesített) címfejjel, (egységesített) besorolási adatokkal, (kitüntetett) hozzáférési pontokkal és a hozzájuk kapcsolt utalórendszerrel – korunkban, az eszeveszett fejlődésnek indult infokommunikációs technológiák bűvkörében, új dimenziókat nyer.E dimenziók tárulkoztak fel egy, a Firenzében, 2003. február 10–12-e között megrendezett konferencián. A tanácskozás anyagát a Haworth Information Press katalogizálási és osztályozási kérdésekkel foglalkozó negyedéves folyóirata, a Cataloging & Classification Quarterly (CCQ) két füzetben jelentette meg. Az előadások zöme olasz és angol nyelven fölkerült a rendezvény weboldalára1.A konferenciakötet olasz változata 2003-ban, nyomtatott és elektronikus formában is megjelent, a Firenzei Egyetem és az Olasz Könyvtári Szövetség kiadásában2. Az angol nyelvű verzió egy évvel későbbi impresszumú3, ennek bővített változatát képezi a CCQ 38/3–4. és 39/1–2. füzete. A folyóirat szerkesztői ugyanis további szakértőktől kértek be néhány lényegbevágó, és valóban jelentős tanulmányt. A jelenlegi ismertető e bővített változat alapján készült.

A konferencia szervezőgárdája, amelynek élén a téma szakavatott kutatója, a Firenzei Egyetem professzora, Mauro Guerrini állt, rendkívül nagy szponzori kört mozgatott meg. Az olasz egyetemeken, szakmai szervezeteken és kormányzati szerveken kívül a támogatók között volt az IFLA, számos non-profit kulturális intézmény és profitorientált cég vagy kiadó.
A tanácskozás céljai a meghirdetett téma komplexitásával vetekednek. Legfőképp az olaszországi szakemberek figyelmét kívánták ráirányítani a nemzetközi színtereken erőteljesen felizzó törekvésekre és a katalogizálási folyamat „egyik kritikus aspektusára”, az autorizálásra (authority control), továbbá alkalmat adni az elméleti gondolatok és a tapasztalatok cseréjére, újragondolni a nagy vitákat kiváltó kérdéseket, ismertetni a főbb nemzetközi és olasz projektek állását, értekezni a nemzeti autorizálási adattörzsek: jegyzékek és fájlok létrejöttéről, módszertanáról, végül, elősegíteni az aktuálissá vált nemzeti katalogizálási szabályzatok összehangolásának folyamatát.
A téma nagy érdeklődést váltott ki, ezt a regisztráltak száma is bizonyítja: 502 résztvevő személyt jegyeztek be, legtöbbjüket természetesen Olaszországból, de szép számban képviseltették magukat európai, amerikai és ázsiai országok is, eminens nemzetközi szakértőkkel. (Az országok listájában nem találtuk Magyarországot.)
A szekciók tematikája a következő volt, ezt a szerkezetet követi a CCQ-kiadás is:
I.    Korszerű megoldások és új elméleti perspektívák
II.   Szabványok, adatcsere-formátumok, meta-adatok
III. Nevek autorizálása (névkezelés)
IV. Tárgyszavak autorizálása (tárgyszókezelés)
V.   Tapasztalatok, beszámolók a folyamatban lévő projektekről.
A CCQ folyóiratszámokban az I. rész a konferencia bevezető fölszólalásait, az I–III. szekció előadásait és további négy tanulmányt tartalmaz. A II. részben kapott helyet a IV–V. szekció anyaga és egy utólagosan bekért tanulmány.

Az autorizálás lényegét Guerrini úgy határozza meg a résztvevőket köszöntő előadásában, mint
·     azt a folyamatot, amellyel a katalógus hozzáférési pontjainak homogenitását fenn lehet tartani, amely során a katalógus architektúrája harmonikus egységben tartható úgy, hogy nem szakad el a konceptuális alapoktól,
·     olyan eljárást, amellyel azonosíthatók a valós használatban előforduló névváltozatok, és hozzákapcsolhatók a közösen használt szabályok szerint kialakított alapformához (alapértelmezett, autorizált, kitüntetett formához), biztosítva ezzel a keresőeszköz stabilitását, a keresés pontosságát, teljességét, az indexek és a teljes keresőrendszer minőségét, megbízhatóságát.

Hangsúlyoznunk kell azonban, hogy e meghatározás ennek a folyamatnak és eljárásnak valóban csak a leglényegesebb elemét tartja szem előtt: csak a hozzáférési pontokra összpontosít. A tanácskozás anyaga viszont együttesen is prezentálja azt, hogy az autorizálás komplex kommunikációs és adatkapcsolati rendszer kiépítését, fenntartását is jelenti egyben, amely a teljes információs rendszer funkcionálásának lényeges előfeltétele, intelligens működésének záloga. Guerrini sem feledkezik meg erről, későbbi mondataiban erre egy ószövetségi bibliai képpel utal: „Autorizálás nélkül a katalógus össszekapcsoló és kapcsolatfeltáró struktúrája «agyaglábakon» áll”. [6. old.] Az apokaliptikus bibliai történetben ti. Nabukodonozor (Nebukadnezár) babilóniai király álmában óriási szobrot lát, amelynek feje színaranyból, teste ezüstből és bronzból, lábszára vasból, lábujjai pedig „részint vasból, részint  cserépből valának”4 (Dániel 2, 31-43), vagyis, a szobor lábujjai olyan anyagokból voltak, amelyek nem vegyülnek össze és nem is válhatnak kötőanyaggá: az építmény így – még akkor is, ha a bibliai történet további vonatkozásaitól el is tekintünk – menthetetlenül összeomlásra van ítélve.
Az információszervezés feladata nem egyszerű, és nem is egyszerűsíthető le a szabatos, pontos, szigorú szabályok/szabványok bevezetésére – mint ahogyan azt a hatvanas–hetvenes években az univerzálisan használandó, egységesített besorolási adat koncepciója hirdette. Arlene G. Taylor és Barbara B. Tillett szerkesztői előszavában külön is kitér arra, hogy a világszerte egységes nyelvi formára hozott rendszó elvét a 2001-ben közreadott GARR (Guidelines for Authority Records and References) is elvetette, ezzel az Egyetemes Bibliográfiai Számbavétel (UBC, Universal Bibliographic Control) programban is szemléletváltozást hozva: a besorolási adatok ekvivalenciájára alapozó adatrendezés elvét a hivatkozási metódusok váltják fel, az információs rendszer kapcsolati hálója, szündetikus (vagy szindetikus, az angol syndetic jelző, a görög  > szündó ige alapján, az eredeti szó jelentése: valamit valamivel összekapcsolni, (összekötni) struktúrája révén.
Az autorizálás garantálja a keresés pontosságát, a kollokációt, a bibliográfiai rekordok csoportosítását, szerző, mű vagy tárgy/téma szerint. Az újabb törekvések a felhasználót helyezik középpontba. A felhasználók eltérő kulturális kompetenciáit szem előtt tartva már nem beszélhetünk egyetlen „helyes” adatformálásról: helyette a variánsok és más információk összefűzése kap nagyobb jelentőséget. Az autorizálást végző katalogizáló, a kiépített adatállomány, a rendszer adatösszefűző mechanizmusa együttesen amolyan „interpretáló” szerepkörrel segíti a felhasználót: tolmácsolja a feltett kérdést a rendszer felé, „lefordítja” a katalógusnak. Épp az autorizálás biztosíthatja azt, hogy a keresőeszközök a jobb megértést segíthessék, biztosíthassák ehhez a megfelelő környezetet a nyelv, az írásrendszer, a kulturális konvenciók függvényében.
A felhasználói igények felé történő hangsúlyeltolódások tovább szélesítik azoknak a tényezőknek a körét, amelyeket az integrált adatkezeléskor figyelembe kell vennünk. Guerrini – a Paul Ricouer-i pluralizmus szellemében fogant – álláspontja szerint a katalogizálási konvencióknak igazodniuk kell a felhasználói közösségek kulturális hagyományaihoz, idomulniuk kell a folyamatos változásokhoz. Szabatos, pontos, szigorú szabályok alkalmazására szükség van, de azok nem lehetnek idegenek a célzott közösségtől és a kulturális környezettől. A kézenfekvőnek tűnő megoldás: a katalógusba implementálható többnyelvűség, gazdagítja ugyan a katalógust, de nem lehet egy újabb bábeli zűrzavar kiváltója. Olyan biztos támpontokat nyújtó homogén, ám nem monolitikus katalogizálási projektekre van szükség, amelyek között a rendezettség fönntartható, és amelyek között a kisebb kulturális közösségek igényei is érvényesülhetnek.
Fölvezető előadásában Michael Gorman a könyvtári szolgáltatások egésze felől szemléli a hozzáférési pontok köré kiépített bibliográfiai rendszert: „Katalogizálás nem létezhet egységesített hozzáférési pontok nélkül. Az autorizálás az a mechanizmus, amellyel a szabványosság megfelelő szintje elérhető” [12. old.], fontos hatékonyságnövelő eljárás. A katalógustétel alapegységei a katalógusrekord három részét képezik, ezek:
•    a hozzáférési pont,
•    a bibliográfiai leírás,
•    a lelőhely, illetve (manapság) a dokumentum maga.
Katalogizálással a bibliográfiai adatok alkalmasakká válnak arra, hogy azok visszakereshetők, rendezhetők lehessenek, ezzel egyúttal a könyvtárak küldetésének megvalósulását is segítik. Az autorizálás tárgya tulajdonképpen a hozzáférési pontok funkcionálissá tétele. A hozzáférési pontok két alapvető feladata pedig az, hogy
•    segítse a felhasználót a dokumentum rekordjának megtalálásában,
•    összegyűjtse az ugyanolyan adatokkal rendelkező rekordokat.
E funkciók teljesüléséhez elengedhetetlen a keresőtárat vezérlő szótár gondozása (vocabulary control): a nevek, az egységesített címek, a sorozatcímek, a tárgyszavak szabványos regisztrálása és a denotációjukat segítő leírások megadása. A szótár gondozása viszont csak az első, legfontosabb összetevő az autorizálási gépezetben. A besorolási rekord egy sor feladat elvégzését segíti elő adattartalmával:
•    tartalmazza a kitüntetett hozzáférési pontokat,
•    összegyűjt valamennyi, ugyanolyan hozzáférési ponttal rendelkező rekordot,
•    a hozzáférési pontot hozzákapcsolja a katalógustételhez,
•    dokumentálja a katalogizálás során hozott döntéseket,
•    rögzíti a névvariánsokat,
•    tartalmazza a precedens előfordulások listáját és a más katalogizálási szabályzatok szerint képzett formákat.
Az autorizálás a humán erőforrást tekintve összetett, kumulált szakmai és műveltségbeli tudást aktivizáló cselekvés, a szakember értelmező, értékelő gondolkodására támaszkodó döntési folyamat. Három nélkülözhetetlen alkotóeleme
·   a megfelelő készségek és szakértelem,
·   ítélőképesség és
·   tapasztalati tudás.
Gorman éles bírálattal figyelmeztet: az internet dokumentumok webes keresését célzó, leegyszerűsített és sok tekintetben naív metaadat-struktúrák, mint pl. a Dublin Core (DC), nem foglalkoznak a kontrollált szótárak fogalmával, és az autorizálási funkciók ellátására sincsenek felkészítve. A metaadatolás is tulajdonképpen katalogizálás, viszont elterjedt az a felfogás, hogy a katalogizálást hozzá nem értők is elvégezhetik, elégséges és elegendő precízséget nyújt a dokumentumok visszakereséséhez néhány egyszerűsített „metaadat” megadása, és nem szükséges a szabványokra alapozott, időigényes, „komplikált” és drága katalogizálás. Ám az igazi próbatételt a milliós nagyságrendű rendszerek jelentik: az egyszerűsítés térnyerésével és az adatbázis növekedésével egyre csökken az adatkezelés összhangja, a szemantikai mezők kezdetlegesek maradnak, és nő a következetlenség mértéke. Az eredmény egy idő után nem fog sokban különbözni a gyors, olcsó és ineffektív szabadszavas keresésnél. A MARC-formátum nem a katalogizálók „szeszélye” és „barokkos” hóbortja, hanem az a célja, hogy meg tudja ragadni az összes dokumentufajta komplex jellemzőjét. Gorman a nyelvi–kulturális különbségek áthidalását a globális rendszerekben a semleges azonosítókódok bevezetésében látja. „Bibliográfiai architektúra nélkül nincs valódi könyvtári szolgáltatás, bibliográfiai architektúra viszont nem létezik autorizálás nélkül” [21. old.] – e szentencia mottóként is hirdetheti Gorman konok érvelését a szabványos adatformálás mellett, meggyőződését arról, hogy az autorizálás „egyike azon aktivitásoknak, amelyek a könyvtárakat képessé teszik arra, hogy szolgáltatásaik központi feladatát teljesíthessék, szabad és nyílt hozzáférést biztosíthassanak a rögzített tudáshoz és információkhoz.” [21. old.]
Barbara Tillett a Library of Congress (LC), a Die Deutsche Bibliothek (DDB) és az OCLC virtuális autorizálási korpuszának projektjét (Virtual International Authority File, VIAF) vázolva egyben azt is bizonyítja, hogy a különböző adatformálási szabályokkal építkező, eredetileg más-más felhasználói közösség használatára szánt adatállományok összekapcsolása valóban lehetséges. A virtuális fájl, a hatalmas adatmennyiséget tartalmazó korpusz, több szempontból nyerhet jelentőséget:
•    a szemantikus web építőkockájává válhat,
•    lehetővé válik az entitás reprezentálása a besorolási rekorddal,
•    az osztott rendszer, a közös adatkezelés költségtakarékos és a konzekvens adatkezelés fontos eszköze,
•    lehetséges a bibliográfiai identitások megkülönböztetése (pl. Lewis Caroll, az Alíz a csodaországban szerzője egyben Charles Lutwidge Dodgson matematikus írói neve is: ugyanazon személyről, de két különböző bibliográfiai identitásról van szó),
•    alkalmazást nyernek az alapozó dokumentumokban megfogalmazott irányelvek, modellek (IFLA, MLAR – Minimal Level Authority Records, GARR – Guidelines for Authority Records and References, FRBR – Functional Requirements for Bibliographic Record, FRANAR – Functional Requirements and Numbering for Authority Records)
•    az országonként, konvenciónként különböző kitüntetett névalakkal autorizált nyelvi formák összekapcsolására kerül a hangsúly, az „output” a felhasználói beállítás függvényében más és más lehet (attól függően, mi a preferált nyelv, írásrendszer, helyesírási változat, de akár Braille-, illetve hangos megjelenítésre is lehetőség nyílik),
• „az én OPAC-om”, „az én webem” kialakítási lehetősége.
Megtarthatók tehát az eredeti írásrendszerek, a nyelvi változatok pedig autonóm módon használhatók. A transzliterációnak már nem az egységesített besorolási adat megformálásánál lesz jelentősége, hanem az eredeti írásrendszert nem ismerők számára tehet jó szolgálatot az adatok kiolvasásához.
A tanácskozáson ismertetett nemzeti, helyi, specifikus szakterületi projektek, folyamatosan épülő adatfájlok hosszú és fáradságos évek munkájának eredményeiről tesznek tanúbizonyságot. Az előzmények az IFLA kezdeményezéseihez, a nemzetközi autorizálási rendszer kiépítésének gondolatához vezetnek vissza. Marie-France Plassard az elmúlt harminc éves időszak elképzeléseiről, céljairól, eredményeiről ad áttekintést. Az első jelentős lépés az UBC-programban meghirdetett koncepció volt a nemzeti besorolási adatállományokról: eszerint a nemzeti bibliográfiák hatáskörébe tartozik megállapítani és kijelölni az adott országban élő, vagy az adott nemzet kulturális örökségeként számon tartott írók, személyek egységesített névformáját, amelyet azután, ezekről a „hiteleshelyekről” egységesen, a többi ország katalógusai is átvesznek, és szabványos formaként használnak. Ennek elősegítésére az 1970-es évektől, az IFLA különféle segédleteket adott ki, közöttük több névjegyzéket, a GARE (Guidelines for Authority and Reference Entries, később GARR) módszertani útmutatót a besorolási adatok szerkezetére vonatkozóan, és kidolgozta a besorolási rekord adatcsere-formátumát (UNIMARC/Authorities) –  a kötelező minimális és a részletezőbb adattartalmi elemekkel bővített ajánlásokkal. A semleges kód, az ISADN (International Standard Authority Data Number) bevezetésének gondolata, végül a FRANAR-munkacsoport megalakulása a kiinduló, egyetlen egységesített névformára alapozó szemléletet más filozófiai alapokra, az entitás-központú információszervezés elvére helyezi. Glenn Patton ismertetője a FRANAR-ról annak egyben 2002-es fejlődési stádiumát is dokumentálja a szélesebb publikum előtt. A koncepcionális modell első változata (FRAR, Functional Requirements forAuthority Records) azóta elkészült, jelen ismertető írásának időpontjában a szakmai közvélemény észrevételeinek feldolgozása van folyamatban.
Más szempontból nyújt történeti áttekintést a besorolási adatok vonatkozásában Pino Buizza, a Párizsi Alapelvektől (1961) a mai napig terjedő időszakot szemügyre véve. Leszögezi, hogy az egységesített tételfejekről a hangsúly átkerül a hozzáférési pontok széleskörű számbavételi törekvésére. Érdekes meglátást fejt ki a Párizsi Alapelvek modelljének sikertelenségéről. Észrevétele szerint abban ugyanis nem sikerült összeegyeztetni
•    az alkalmazott eszközt: az egységesített besorolási adatot és
•    a választott metódust: az eredeti névalakokra, illetve a nemzeti gyakorlatra hivatkozó szerkesztési eljárást,
hogy megvalósulhasson
•    a kitűzött cél: a nemzetközi adatcsere.
Az új technológiai feltételek között más perspektíva tárulkozik fel a különféle kulturkörökben ismert névformák együttes kezelésére. Buizza a hozzáférési pontok számbavételével (autorizálásával) már összeegyeztethetőnek tartja
•    az alkalmazott eszközt: a besorolási rekordot és
•    a választott metódust: a megfelelő rekordok összekapcsolását az autorizálási tömbben,
hogy megvalósulhasson
•    a kitűzött cél: az összes szerző nevének értelmezhetősége világszerte, az összes olvasó előtt. [128. old.]

A UNIMARC besorolási-rekord adatcsere-formátumának 2001-es új kiadását értékelve Mirna Willer is a kapcsolati és viszonystruktúrát kifejező elemekre hívja fel a figyelmet. A formátum szerkezeti módosulásai is jelzik, hogy a hangsúly áthelyeződik a névvariánsok közötti viszony kifejezésének metódusaira, a különféle nyelvek, írásrendszerek kódolására. A megadandó információk körébe kerül a formák, formátumok és a revízióhoz szükséges források dokumentálása is. Az UBC-paradigma megváltozása során a bilaterális adatcsere helyett magának az osztott környezetnek van jelentősége. Lehetővé vált a közös adatépítés az authority file-ok esetében is, és jelentős ebben a fejlődési folyamatban az is, hogy elterjedtek az olyan szoftverek, amelyek makroszerkezetében külön áll a bibliográfiai és autorizálási fájlt az információk kinyerését a fájlok összefonódó rendszerére építik. A formátumot fejlesztő csoport a FRANAR entitás–kapcsolat modellje szerint végzi a további munkát.
A „barokkos” MARC adatcsere-formátummal szembeállított, sok vitát kiváltó metaadatok téves értelmezésének elterjedésére hívja fel a figyelmet José Borbinha. A metaadatok a „virtuális könyvtár”, azaz „a digitális könyvtár” problémájával a mindennapok szóhasználatába is bekerültek. Többféle értelemben használatos maga a kifejezés: (1) „adat az adatról” értelemben, amely a digitális dokumentum ismérveit rögzíti, de ez csupán egyféle adat az adatbázison belül; (2) az adatbázistervezők értelmezésében metaadat az az információ, amely szükséges ahhoz, hogy az adatbázis szerkezetét leírjuk; (3) sokszor összemosódik a szó használata azzal a technológiával, amelyik működteti az információs rendszert, vagy (4) azokkal a fogalmi mezőkkel, amelyek az információelemek szemantikai értékét a rendszer számára kezelhetővé teszik. A metaadat nem más, mint a specifikus sémák kódolásához szükséges információ. Ilyen értelemben a MARCXML, DCMES nem metaadat, hanem metaadat-séma, az XML pedig egy általános nyelv, nem metaadat, de még csak nem is metaadat-séma. Az autoritatív információs terek, mint az indexelő nyelvek, osztályozási rendszerek stb. elemei önmagukban nem metaadatok, hanem adatértékek vagy szabályok, amelyek arra valók, hogy megtaláljuk a releváns értékű adatokat (vagyis az információkat).
Az adatértékeket megfelelő szemantikai mezőkben a besorolási rekordok tárolják. Maga a besorolási rekord Alberto Petrucciani szerint a leginnovatívabb elem a számítógépes katalógusokban, mivel magáról az entitásról tartalmaz információkat. Ezek közül az információk közül egyesek magukra az entitásokra vonatkoznak, ilyenek pl. a nem, nemzetiség, nyelv, különféle dátumok, biobibliográfiai adatok. Az információs rendszerben viszont másról is folyik adatrögzítés, manuális vagy automatizált formában, mint pl. a feldolgozás módját, menetét archiváló adatok az adatgazda intézetről, a rekord születéséről, az alkalmazott katalogizálási szabályzatról, a felhasznált forrásokról. Innovatív annak a szemléletnek az elterjedése is, hogy a különféle nyelvi, nemzeti kontextusok szerint az eredeti névformát és a lefordított, adaptált formákat egyenrangú változatoknak tekintik. Petruccini – pragmatikai szempontból – az új veszélyekre is figyelmeztet: a bővített adatfelvétel, a változások követése, egyes adatcsoportok elemei, amelyek nem bibliográfiai jellegűek, és nem a feltárandó források kapcsán kerülnek be az adatbázisba, – kívül esnek a könyvtári alapfeladatokon. Olyan terheket jelentenek, amelyeket a könyvtárak már nem vállalhatnak fel. Az autorizálás óriási erőfeszítés a könyvtári alapfeladatokon: információigényes, szakmai kompetenciát feltételez, jelentős időráfordítással jár. Visszafogja a feladatok kibővítését az intézmények erőforrásainak szorosra szabott kerete, míg más oldalról, evidens az autorizálási információk potenciálisan széleskörű felhasználhatósága, hasznosíthatósága. Petrucciani leszögezi: márcsak ezért sincs többé létjogosultsága a „light” bibliográfiai rekordoknak.
A névkorpuszok közös kezelésében a levéltárak is érdekeltek. Az iratanyagok létrehozói, egyes tevékenységek folytatói emberek, szervezetek, intézmények. Daniel V. Pitti az Encoded Archival Context (EAC) – a nemzetközi levéltári közösség kezdeményezését részletezi egy osztott rendszer létrehozására. A könyvtári gyakorlatban használatos besorolási rekordok ebben a közegben az iratok létrehozóinak leírásával feleltethető meg. A levéltári gyakorlatban nemcsak regisztrálják a neveket, hanem az iratanyag részletes leírását is megadják életrajzi, történeti vonatkozásokkal. A leírások kiterjednek mind a jogi mind a történeti adatokra, mind az akták keletkezésének részleteire. A kutathatóság szempontjából alapvetően fontos ugyanis a dokumentumok keletkezési körülményeinek ismerete. A levéltári anyagok tulajdonképpen a könyvtári dokumentumegységek elsődleges forrásai, regisztrumuk elsődleges alapja  a későbbi életrajzi és történeti leírásoknak.
Az EAC XML-jelölőnyelvre tervezett szemantikai struktúrájában további, a könyvtári alkalmazásoknál is használatos, bővített adatelemkészlettel találkozunk, ilyenek a nyelvi kód, az írásrendszer kódja, az alkalmazott leírási szabályzat, források, az ország kódja, a tulajdonos kódja, vagy az attribútumok relációértékeinek megadása (fölérendelt, alárendelt, korábbi, későbbi, szülő, gyermek, társ, azonos) stb. Az EAC osztott rendszerben részt vevő intézmények autonóm adatformálási technikájának megőrzésére törekedve, a hagyományos besorolásiadat-egységesítéssel ellentétben, az „egységesített forma” és a „névváltozat” itt nem jelenti explicite azt, hogy melyik elemnek van kitüntetett szerepe az entitás megnevezésénél. Helyette az AUTHORIZED attribútum áll, amely az adott intézmény kódját is tartalmazza. Az indexeléshez, rendezéshez, megjelenítéshez a felhasználó kiválaszthatja azt a kódot, amelyhez egy-egy intézmény vagy tárolóhely rendezési eljárása kapcsolódik. A rendszeren belül előfordulhat akár több mint egy kitüntethető forma más szempontból is. További hozzáadott attribútumokat lehet használni: a RULE-kód pl. a névalak szerkezetét meghatározó szabályzatra utal; a LANGUAGECODE a név nyelvi alakjára; a SCRIPTCODE az írásrendszerre. Például: Ontario levéltár kontextusában párhuzamos francia és angol alapformákat (kitüntethető névalakokat) tartalmaz a rendszer két, párhuzamos AUTHORIZED attribútumú <corphead> mezőben. A két különböző alapformát a LANGUAGECODE értéke szerint lehet aztán priorizálni a felhasználói nézetből.
Több előadás foglalkozik az FRBR-modell kapcsán felmerülő értelmezési problémákkal és a gyakorlati megvalósítási kísérletekkel. Lorenzo Baldacchini a régi nyomtatványok besorolási rekordjainak komplexitását taglalva jut el arra a megállapításra, hogy a kézisajtó korából ismert kiadók, nyomdászok és könyvkereskedők az FRBR-modell szerint felépülő bibliográfiai leírásban érdekes szerepet kapnak: névformáik a mű megjelenésének (manifestation) leírási szintjén válnak az információk hozzáférési pontjaivá. Baldacchini javaslata szerint, a nemzeti bibliográfiai intézeteknek, illetékességi körükbe tartozóan, a régi könyvek nyomdai, kiadói, kereskedői névadatairól is létre kellene hozniuk a megfelelő törzsadatbankot. Baldacchini e törekvések előzményeit is áttekinti, rövid bibliográfiai történetet is felvázol, külön megemlítve Borsa Gedeon „briliáns” művét – Clavis typographorum librarioumque Italiae, 1465-1600 –, amely szervesen beépült az EDIT 16 – a XVI. századi itáliai nyomtatványokat összeíró – adatbázis alapjaiba. [274. old.]
Az FRBR-modellben explicite megjelenő „mű”-entitás kérdését járja körül Richard Smiraglia, aki saját vizsgálatainak eredményeire hivatkozva állapítja meg, hogy mű-szintű autorizálásról nem beszélhetünk, ez teljességgel hiányzik a gyakorlatból. Katalógusaink az egységesített besorolási adatokra (headings), azaz a besorolási adatok egységesítésére építenek. A hozzáférési pontokat elsősorban a szerzői nevek besorolási adatai képezik, amelyeknek különféle alakjai pókhálóként összeszövődhetnek, de itt meg is feneklik ez a dimenzionálás, annak ellenére, hogy a bibliográfiai entitásoknak potenciálisan ennél sokkal gazdagabb mélyrétegei vannak. Smiraglia felrója: Cutter eredeti céljait „irodalmiasan” értelmeztük, és a művek katalógusa helyett a dokumentumok katalógusait építjük. A művek hatékony autorizálása a katalógusban olyan értéktöbbletet teremthet, amely során a keresési kapacitás jelentősen megnövekedhet. Smiraglia a vizsgált mintákban minden ősműhöz instanciációs (példányosulási) hálózatot (instantiation network), azaz bibliográfiai családfát állít fel. Az autorizálás során a művek egyes realizációi között, azok egymáshoz való viszonyának mibenlétéről részletes elemzés végezhető el. A minőségi információszervezéshez ennek az összefüggésrendszernek a fölállítására –  képletesen: a családfa, a rokoni szálak és ágak felfedésére – van szükség. Smiraglia újabb vizsgálatában, a Library of Congress adatbázisában a művek besorolási rekordjaiból vett mintán tekinti át és elemzi a mű-feldolgozottságot: a 410 művet reprezentáló mintában a műveknek csak 5,6 százalékához kapcsolódott külön rekord. Ezzel szemben a mintában szereplő művek közel felének volt valójában további instanciációs elágazása, de csak 23 mű esetében talált implicitnek mondható autorizálást a katalógusban. További problémát jelent az, hogy sok instanciációra  jellemező a szukcesszív deriváció (időben egymást követő megjelenés), amelyek, a jelenlegi domináns tételrendezési eljárásokkal csak implicite kapcsolódhatnak össze a kollokáción keresztül. Az instanciációk explicit linkelésének bonyolult munkája a címváltozásokkal, fordításokkal és a rokon tartalmú művek megjelenésével, a művek tartalmi genealógiájának feltárásával válik szükségessé. Konklúziójában Smiraglia megállapítja, hogy a mű-kifejeződések (expression) explicit számbavétele jobban átláthatóvá tehetné az instanciációk hálóját, de még nem világos, hogyan is valósítható meg igazából ez a szündetikus, mélységi-perspektívikus látásmód.
A konferenciakiadvány második kötetének első fele a tartalmi feltárás – a „szemantikai autorizálás” (semantic authority control) aktuális kérdéseit tárgyaló előadásokat foglalja magában, másik fele gyakorlati megvalósulásokat, tapasztalatokat ismertető előadások sorát tartalmazza.
A tárgyszóindexek fejlesztési tendenciái között találjuk a keresési segédapparátusban épülő szótárak könyvtári rendszereken kívüli alkalmazásának kérdéseit, az osztott rendszerek strukturálásának, szabályozásának egyeztetési kísérleteit, a többnyelvűségre való törekvést. A SACO közös katalogizálási programot Ana L. Cristán a tematikus kapuszolgáltatások kontextusában elemzi: amíg a program az LC tárgyszórendszeréhez tulajdonképpen kaput nyit, addig a SACO nem tematikus kapu olyan értelemben, ahogyan az online szolgáltatások állítanak elő böngészhető témakatalógust az internetforrásokról, s ahogyan azok betöltik az információbróker szerepét az információkeresők előtt egy meghatározott diszciplínában. Genevieve Clavel-Merrin a többnyelvű MACS (Multilingual Access to Subjects) tezauruszról, a francia, német és angol tárgyszavakat összekapcsoló program fejlesztéséről számol be. Széles angolszász felhasználói kört érint az OCLC FAST (Faceted Application of Subject Terminology) projektje, amely az LC rendkívül gazdag tárgyszókészletét képezi le egyszerűsített használati célokra. Egy másik OCLC beszámoló, Lihong Zhutól, vállalkozási, azaz a kiszervezett szolgáltatást nyújtók szempontjából részletezi a MARS (MARC Record Service) besorolási rekordokhoz kötődő, úgynevezett háromfazettás autorizálási szolgáltatást.
(1) Egy meglévő bibliográfiai adatbázis átdolgozása, a kérő (vevő) intézmény profilja szerinti átalakítás, kurrens autorizálási szabványok szerinti felújítással. Az „átmosott” bibliográfiai adatbázissal együtt a felújított autorizálási fájlt is visszakapja a megrendelő intézmény. Megtörténhet az is, hogy a régi besorolási tömböket teljesen kiiktatják, a felújított adatbázis vadonatúj autorizálási adattörzset kap.
(2) Az új bibliográfiai tételekhez kapcsolódó besorolási adatok autorizálása, karbantartása a MARS szolgáltatáson keresztül. Az időszakosan a MARS-hoz felküldött új tételeket a rendszer átvilágítja, és elkészíti a pótlásokat, hibajelentéseket. Hasznos funkció az „Először előforduló tételfejek”, „Hibás tételfejek” kiszűrése és listázása.
(3) Az új autorizálási adatbázisok folyamatos frissítése, karbantartása. Erre szolgál a MARS figyelmeztető-értesítő rendszere a frissített, felülírt vagy törölt besorolási rekordokról, és a különféle, Millennium márkajelzésű, automatizáltan futtatható tevékenységek: autorizálásiadat-feldolgozás (új rekord letöltésekor a kapcsolódó besorolási rekordok hozzáadása, átvilágítása, karbantartása a helyi rendszerben, az elvégzett műveletek naplózása, kontrollálás céljából jelentés küldése), a globális frissítés, rendszerjelentések kérése.
Sherry L. Vellucci a másik oldalról, a megrendelő nézőpontjából elemzi az autorizálási szolgáltatásokat. A kiszervezhető feladatok: (1) a bibliográfiai és authority file-ok retrospektív felülvizsgálata, (2) a folyamatos autorizálás biztosítása, (3) periodikus reautorizáció, a régi és új bevitelből eredő adatok egységesítése, karbantartása. A munkafolyamatnak három fázisát különbözteti meg: előkészítés, gépi egyeztetés, kézi revideálás. Az okok, amiért a könyvtárak egy külső cég bevonását választják (az Egyesült Államokban hat ilyen szolgáltató van):
·   az autorizálás drága és munkaigényes;
·   a személyzet munkája más területen jobban hasznosítható;
·   ellenőrizhető a költség;
·   növekedik a hatékonyság;
·   szakértőket nem alkalmazhatnak a katalo-gizáláshoz;
·   más rendszerekkel való konzisztencia biztosítása, az adatbázis minőségének jobbítása.

A szemantikai információkereső nyelvek teoretikus aspektusairól kevés szó hangzott el a tanácskozáson, a tárgyszórendszerek témájáról jobbára projektismertetőket találunk a konferenciakötetekben is. Kivételt képez Stefano Tartaglia értekezése a tárgyi indexelő nyelvekről. Tartaglia nem különíti el az indexelő nyelveket a katalogizálásban használatos más nyelvektől, meglátása szerint nincs szükség a tárgyi entitásokat kezelő elkülönített rendszerre. Az autorizálásnak az entitások valamennyi kategóriájára ki kell terjednie, továbbá nemcsak a kifejezések nyelvi formájára, hanem a jelentésre és a szemantikai kapcsolatokra is. A tárgyi indexelő nyelvekben pedig nem helyes az autorizálást kiterjeszteni a szintaktikai szerkezetekre is, mert ez akár a használhatatlanságig redukálja a kontrollon alapuló folyamatok (beleértve a keresés folyamatát is) precízségét és hatékonyságát. Tartaglia egyik példája: az a kifejezés, hogy „Etruszk keramika” – lehet egy tárgy a múzeumban, és lehet témája egy könyvnek. A terminusnak sem formája sem jelentése nem határozhatja meg előre, milyen funkciója lesz a kifejezésnek a katalógus rekordjában és következésképp az egyes index-ekben, éppen ezért nem indokolt ugyanazon entitásról több fájlban is rekordot létrehozni, sem szétválasztani a tárgyi autorizálást a szótár gondozásának általános tevékenységétől. A szemantikai autorizálásnak három összetevőjét sorakoztatja fel és tárgyalja részletesebben, ezek a (1) referenciális, (2) relációs és (3) kategoriális szempontok szerint különülnek el.
A konferenciakiadvány utolsó része számos jelentős, folyamatban lévő projekt, meglévő adatbázis tapasztalatáról nyújt körképet. Ismertetést találunk ebben a részben az EDIT16 adatbázisról, a zeneművek besorolási adatainak UNIMARC alapú cseréjéről, a CERL (Consortium of European Research Libraries) tezauruszáról, amely a legkorábbi nyomtatott források összesített regisztrumához, a HPB (Hand Press Book, 1450 – ca. 1830) adatbázishoz kapcsolódik, keresést segítő apparátusként. A nemzeti irodák gondozásában nagyfokú szakértelemmel és részletességgel elkészített rekordok a HPB adatbázisba ömlesztetten kerülnek be, és meg is maradnak eredeti formájukban. Az adatelemeket semmilyen preskriptív szabállyal nem egységesítik, így az eljárás az adatok visszakeresésében nagy nehézséget okoz, különösen a homonímák, a homonímikus névvariánsok, a nem valós helynevek esetében. A CERL–tezaurusz különálló adatbázisának feladata az, hogy a különféle kapcsolódó adatelemeket, a névváltozatokat linkelje. A névkezeléshez, a történeti névhasználat problémáinak megoldására Claudia Fabian elkerülhetetlennek látja az ISADN vagy más, hasonló azonosítók bevezetését. További ismertetők olvashatók a német nemzeti névadattár (Personennamendatei, PND) implementálásáról a bavariai könyvtári hálózati rendszerbe; az InterParty elnevezésű sokrétű, többféle domének között közösen használt azonosítórendszerről, amelyet a könyvkiadók, könyvkereskedők, a szerzőijog-kezelők, könyvtárak és egyes azonosító és technológiai rendszerek használhatnak; a társas álnevekről, amelyekről megfeledkeztek az FRBR attribútumkészletének kidolgozásakor; a kínai könyvtári névírásról Ázsiában; a Progetto Lombardo Archivi in INternet (PLAIN) regionális, történelmi archívumok elektronikusan szolgáltatott információinak közzétételi programjáról, a helytörténeti vonatkozású névadatokkal együtt; az Association française de normalisation (AFNOR) törekvéseiről, a francia könyvtárak, múzeumok, levéltárak céljaira kialakított adatmodellről. A történeti, vallástörténeti vonatkozású kezdeményezések körébe tartozik a katolikus egyház kétezer éves történetéhez kapcsolódó intézményi, szerzetes-közösségi, személynevek és liturgikus művek címeinek jegyzéke (ACOLIT, Autori cattolici e opere liturgiche); a Bibliothek national de France adattárában az egyházi testületekről vezetett névgyűjtemény (CORELI, Collectivités Religieuses) és a francia államigazgatási szervek, történelmi hivatali testületek névanyagát regisztráló korpusz (COFAR, Collectivités Officielles Françaises d’Ancien Régime), mindkettő a BnF authority állományába integrálódóan. Több speciális olasz vállalkozás ismertetésére is sor került, ilyen pl. az ókori államnév-féleségek jegyzéke, az 500 és 1500 között alkotó latin írók és műveik név- és címtára a Biblioteca di Cultura Medievale gondozásában valamint a középkori szerzőket összeíró BISALM (Bibliotheca Scriptorum Latinorum Medii Recentiorisque Aevi) projekt. A középkori irodalomhoz kapcsolódó névtárak jelentőségét könnyű belátni, ha a hosszú, ezer évet átfogó időszakra, a kéziratosság korában nem megállapodott nyelvi tényezőkre, a kiadatlan források sokaságára, a már feldolgozott adattárakban a változatos adatformákra, a pszeudonim szerzők gyakoriságára gondolunk. A középkori filológia erőteljes fejlődése a nyomtatott korábbi segédkönyvek gyors elavulását idézi elő, ezzel szemben az adatbázisok naprakészségét könnyebb fenntartani.
A tanácskozás zárószavában, az autorizálásról az elhangzott előadások nyomán feltárulkozó képet Luigi Crocetti, az Olasz Könyvtári Szövetség elnöke, egy nagy mozaikhoz hasonlítja, amelyben minden egyes kocka nélkülözhetetlen és megvan a saját funkciója a végső eredmény kimenetelében: a kulturális javak hozzáférési lehetőségeinek megteremtésében. Összefoglalómban lehetetlen minden mozaikkockáról, az összes ismertetett adatbázisról, elveikről, metodológiájukról, technológiájukról szólni. Mindegyik érdes a maga nemében, és értékes adalékokkal szolgál a helytörténeti adatfeldolgozási tapasztalatoktól a széles együttműködés keretében végzett kísérletekig, specifikus projektekig, a mai és a múlt történelmi korszakaiból származó névanyag többfunkciós, multidiszciplináris területekre kiterjeszthető, integrált hasznosításáig. A CCQ két számába foglalt konferenciaelőadások a hozzáadott tanulmányokkal együtt, teoretikus mélységekbe engednek bepillantani, és megmutatják azokat a deltatronikus alkalmazási területeket, amelyek a kérdéskör jelentőségét a jövőben minden bizonnyal csak növelni fogják. Azt is sejtetik, hogy rövidesen talán tényleg véget ér a bibliográfiák, katalógusok és „péczeszók” „light” korszaka.

Jegyzetek

1     URL: http://www.sba.unifi.it/ac/
2     Authority control, definizione ed esperienze internazionali: atti del Convegno internazionale, Firenze, 10-12 febbraio 2003 / a cura di Mauro Guerrini, Barbara B. Tillett ; con la collaborazione di Lucia Sardo. – Firenze : Firenze University Press ; Roma : Associazione italiana biblioteche, 2003.
ISBN: 888453111X (FUP print); 8878121355 (AIB print); 8884531101 (FUP online); 9788884531117 (FUP); 9788878121355 (AIB)
3     Authority control in organizing and accessing information: definition and international experience / Arlene G. Taylor, Barbara B. Tillett, editors ; with the assistance of Mauro Guerrini, Murtha Baca. – Binghamton, NY : Haworth Information Press, c2004. ISBN:  0789027151 (kemény kötés);  078902716X (puha kötés)
4     Károlinál „cserép”, az újabb katolikus  Biblia-fordításban (Szt. István Társ., 1972. és későbbi kiadások)  „agyag” szerepel

Kategória: 2006. 4. szám | A közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!