EAD (DTD) Encoded Archival Description (Documentum Type Definition) alkalmazásának lehetőségei

Kategória: 2009/12

Az Amerikai Magyar Alapítvány gyűjteményének feltárása Fulbright-ösztöndíjjal

A New Yorktól mindössze 70 kilométerre, New Jersey államban, New Brunswickban található Amerikai Magyar Alapítvány – American Hungarian Foundation (www.ahfoundation.org) könyvtára, archívuma és múzeuma az Amerikai Egyesült Államok területén az egyik legjelentősebb hungarika gyűjtemény. Az intézmény korszerű adathordozókból (DVD, CD, video stb.), több mint 50 000 kötetnyi könyv és periodikumból álló könyvtára és 60-nál több személyes hagyatékot és egy különösen értékes letéti levéltári anyagot, a Bethlen Gyűjteményt őrző archívuma révén fontos kutatási és tájékoztatási központ.
E jelentős könyvtári és archivális gyűjtemény feltárása és széles körű hozzáférésének biztosítsa érdekében a magyar Fulbright Bizottság az Amerikai Magyar Alapítvány anyagi, az Országos Széchényi Könyvtár szakmai támogatásával 1997-ben ösztöndíjat alapított.1 Az ösztöndíjas időszak számos területen rendkívüli lehetőség a két ország szakmai és kulturális kapcsolatainak építésében, új kutatási eredmények felmutatásában és a résztvevők szakmai és emberi fejlődésében. Az Amerikai Magyar Alapítványban töltött időszak speciálisan kettős eredménnyel jár, egyrészt halad a gyűjtemény feldolgozása, másrészt az ösztöndíjasoknak alkalmat nyújt új szakmai irányzatok és módszerek megismerésére.

A Bethlen Gyűjtemény feldolgozása

Első lépésben a Fulbright-ösztöndíj keretében a Bethlen Gyűjtemény feldolgozására került sor amely a legnagyobb irattári egység az Amerikai Magyar Alapítvány archívumában. A Bethlen Gyűjtemény az amerikai magyar reformátusok levéltára és könyvtára. Az amerikai magyarság történetének, a magyar egyháztörténetnek és a magyar emigráció történetének kiemelkedően fontos forrása.
A gyűjtemény terjedelme mintegy 300 folyóméter. (60-70%: kb. 1600 doboz, illetve kötet archivális anyag, 30% önállóan felállított nyomtatvány anyag, de az archivális egységek is tartalmaznak nyomtatványokat.) Így tehát a Bethlen Gyűjtemény archivális és nyomtatott állományra oszlik.
A gyűjtemény archívumában találhatók az amerikai magyar református egyházak primer dokumentumai 1895-től a legutóbbi időkig, zömmel 1990-ig, illetve egyes állományokban 2000-ig. Az egyházi iratokon kívül jelentős mennyiséget tesznek ki az amerikai magyar szervezetek és személyiségek iratai, főként a második világháborút követő időszakból. A dokumentumok típusa zömmel kézirat, gépirat, aprónyomtatvány, nyomtatvány, de tartalmaz fényképeket, hangzó- és videoanyagot, helyenként tárgyakat (jelvényeket, plaketteket, bélyegzőket stb.) is.
Az Amerikai Magyar Alapítvány és a gyűjteményt kezelő Bethlen Museum and Archive Inc. között létrejött szerződés2 alapján a Bethlen Gyűjtemény 1999-ben érkezett letétként korábbi tárolási helyéről a pennsylvaniai Ligonier-ből New Brunswickba, az alapítvány könyvtárába, ahol korszerű és szakszerű elhelyezést nyert. A szerződés keretében az Amerikai Magyar Alapítvány a gyűjtemény szakszerű feldolgozását vállalta.
A gyűjtemény fogadását és az új helyszínen történő felállítását Csillag András Fulbright-ösztöndíjas végezte, aki a gyűjtemény áttekintése és az ott fellelhető források alapján annak történetét is megírta.3 A gyűjtemény feldolgozása a következő ösztöndíjasokra várt.
2001-ben, odaérkezésemkor első lépésben a cél a gyűjtemény tartalmának, szerkezetének áttekintése és a feldolgozás korszerű módszerének kiválasztása volt. Ezt követően lehetett a munkát megkezdeni. Ez hármas feladatot jelentett:
1. Mindenekelőtt kutatói megközelítést, ennek során a gyűjtemény tartalmi összefüggéseinek feltárását kellett elvégezni. Többek között az amerikai református egyház szervezeti és történeti változásait, a Magyarországi Református Egyházzal és az amerikai protestáns felekezetekkel kialakított kapcsolatait kellett tisztázni. Rögzíteni kellett szervezetének, korszakonkénti felépítését, meg kellett állapítani jelentősebb iratképzési eseményeit. Az egyházi és világi intézményekhez, illetve személyekhez tartozó irategységek leírásához életrajzi és intézménytörténeti kutatásokat kellett végezni.
2. Szakmai módszertani tájékozódást végezve, fel kellett mérni és meg kellett ismerni az archivális anyag feldolgozásának amerikai módszereit és felhasználói követelményeit, ennek eredményeként dönteni kellett az alkalmazandó módszert illetően.
3. Végül el kellett végezni a gyűjtemény feldolgozását a kiválasztott módszer szerint, folyamatosan megtartva a feldolgozás szintje és a megadott időkeret (15 hónap) egyensúlyát. Azaz minden anyagrésznél megfelelő tartalmi döntéseket hozva a feldolgozás részletességét úgy kellett megállapítani, hogy a teljes feldolgozás a megfelelő szerkezeti keretben a megadott idő alatt elkészüljön.

A feldolgozás módszere szem előtt tartotta, hogy a lehető legtöbb információt nyújtsa, a legfontosabb történeti forrásokat kiemelje, a visszakereséshez a megfelelő fogódzókat biztosítva nevek, dátumok, földrajzi elnevezések, tárgyfogalmak, dokumentum- és kiadványcímek megadásával. A feldolgozás tiszteletben tartotta az irategységeken belül az iratok történetileg kialakult eredeti rendjét. A gyűjtemény tartalmi elemzése azonban szükségessé tette az egyes irategységek sorában a tartalom belső logikájának megfelelő felállítási rend kialakítását és ennek megfelelően az anyag átrendezését, egyúttal az anyag védelme miatt savmentes dobozokba történő áthelyezését, és az alapinformációkat tartalmazó címkék készítését és felragasztását. Megtörtént a nyomtatványok különválasztása: évkönyvek, egyéb periodikumok, könyvek csoportosításban, azon belül betűrend szerinti felállításban.
Az átrendezést az indokolta, hogy az archívum elemzése során nyilvánvalóvá vált, hogy az archívum főbb irategységei a következők: (1) egyházi iratok, azaz a korai egyházmegyék esperesi levéltára, majd a későbbi zsinati és egyházkerületi iratanyagok és az egyházközségek iratai; (2) egyházi és világi egyesületek és szervezetek iratai; (3) egyházi és világi személyek hagyatékai; (4) tematikus irategységek, valamint (5) vegyes iratok.
Egyértelművé vált, hogy az archivális anyagot a fenti szerkezetben kell leírni. Az archívum kb. 140 egyházközség, 14 szervezet és 71 személy iratait tartalmazza, ehhez csatlakozik a négy tematikus irategység (Művelődés; Magyar történelem; Emberi jogok: Erdély, Csehszlovákia; Teológia) és egy vegyes gyűjtemény (sajtókivágatok, szórványos bevándorlástörténeti iratok, kordokumentumok: közemberek magánlevelei, útlevelek, bizonyítványok, állampolgársági iratok, banki betétkönyvek stb.). Bár a dokumentumok nyelve vegyesen magyar és angol – elvétve előfordul kevés német, francia vagy más idegen nyelv is -, az amerikai kutatói környezet számára a feldolgozást angol nyelven kellett elvégezni.

A feldolgozás módszere – EAD (DTD) perspektíva

Széles körű tájékozódást követően megismertem az amerikai levéltárosok, kutatók által kidolgozott és szabványként ajánlott módszert, az ún. EAD (DTD) azaz Encoded Archival Description (Documentum Type Definition) elnevezésű előírásokat. A módszer ismertetését és gondozását a szakma egyesülete a Society of American Archivists végezte és végzi. A módszer bevezető dokumentációját ők tették közzé szakmai lapjukban4. Az EAD alkalmazását több könyvtár megkezdte. Ezek közé tartoznak a Library of Congress, a New York Public Library, a Rutgers University Library, a Minnesota Historical Society, a Harvard University, a Yale University, a University of Virginia stb. Az EAD alkalmazására ezeknek a könyvtáraknak a honlapján találhatunk utalásokat. A Society of American Archivists az EAD 1.0 verzióját követően a 2.0 verziót 2002-ben tette közzé. Bővebb információk és a karbantartás, valamint a fejlesztés eredményei a Library of Congress honlapján folyamatosan olvashatók5.
Az EAD (DTD) szellemében készült leírás eredménye az ún. Finding Aid, azaz fondjegyzék. Mivel számítógépen készül, ez megkönnyíti a karbantartást, a többszörözést és lehetővé teszi a digitalizálást.

A munkafolyamat
A leírás és kódolás elkészíthető egy folyamatban, amennyiben az EAD kódkészletéből (Tag Library) előre megszerkesztett űrlap (Template) áll a feldolgozó rendelkezésére. Ez a kézikönyvbe foglalt kódkészlet alapján kívánság szerint definiálható.
Elkészíthető azonban két lépcsőben is. Először a leírás a kívánt szerkezetben felépített szövegként (word file), majd az SGML alapú kódolási elv szerint utólag bekódolható. Az EAD (DTD) az SGML alkalmazásának egy speciális, továbbfejlesztett változata. A következő lépés ennek a kódolt szövegnek HTML vagy XML formára konvertálása. Ehhez a szükséges programok elkészültek és beszerezhetők.
A továbbiakban a megfelelő szerver és keresőprogram, esetleg további indexprogram szükséges, amely a keresés lehetőségét biztosítja, illetve bővíti.
A módszer bizonyos struktúra megőrzését javasolja, mivel csupán struktúra és tartalmi előírásokat nem tartalmaz, meglehetősen szabad kezet ad az értelmezésben, így a korábban készült fondjegyzékek bekódolására is tág lehetőséget nyújt. Az előzetes kísérletek éppen abból indultak ki a University of California, Berkley kezdeményezésére, Daniel Pitti6 vezetésével, hogy olyan módszert fogadjanak el, amely nem kötelezi a kézirattárakat és levéltárakat teljesen új leírások elkészítésére. Azok megfelelő értelmezésével az EAD szerkezetbe beilleszthetők.
Általában az EAD típusú fondjegyzékek a könyvtárak kéziratgyűjteményeit, levéltárait vagy archívumait reprezentáló honlapon, illetve elérési pontján találhatók meg. A felhasználó tájékoztatása szempontjából azonban igen előnyös, hogy a digitalizált fondjegyzék és a MARC alapú online katalógusok összekapcsolása is megoldott, ha a fondjegyzékről katalógustétel készül, és annak megfelelő mezőjébe a fondjegyzék internet címét (website) bejegyzik. Ezzel a megoldással a fondjegyzék nemcsak az adott archívum vagy kéziratgyűjtemény honlapjáról, hanem a könyvtár online katalógusából is teljes egészében behívható, olvasható és adatai kereshetők.
A 2001/2003-as periódusban az Amerikai Magyar Alapítvány nem rendelkezett EAD (DTD) kódolás végrehajtásához és az indexeléshez szükséges programmal, de a Rutgers Egyetem szervere és keresőmotorja (Dynaweb) a működtetéshez távlatilag rendelkezésre állt. Így megnyílt a lehetőség arra, hogy a kétlépcsős alkalmazás eredményeként egy word dokumentumként elkészüljön a Bethlen Gyűjtemény fondjegyzéke, a Finding Aid, éspedig olyan szerkezetben, amely az EAD (DTD) szerinti kódolást egy későbbi időpontban lehetővé teszi.
Ez a szerkezet a következő felépítést kívánta meg:

A leírás struktúrája
Az EAD (DTD) a legfontosabb adatok sorrendjét a következő szerkezetben javasolta:

ÖSSZEFOGLALÓ SZINTEN:
- Címlap (Title Page)
- Összefoglaló leírás (Descriptive Summary)
  – A gyűjtemény címe (Title)
  – Létrehozó/k (Creator/s)
  – Terjedelem (Quantity)
  – Őrzőhely (Repository)
- Adminisztrációs információk (Administrative Information)
  – Proveniencia (Provenance)
  – Használati előírások (Access)
  – Elérhetőségek (Contact Information)
- A teljes gyűjtemény története (History)
- A teljes gyűjtemény áttekintő leírása: tartalom – terjedelem (Scope and Content Description)
- Szerkezeti séma (Series Description)

RÉSZLETEZŐ SZINTEN:
Az összefoglaló leírást követően a hierarchikus szerkezetben a gyűjtemény irategységei mindegyikének leírását a következő struktúrában kellett elkészíteni:
- Történeti vagy életrajzi összefoglaló (History – Biography)
- Az irategység áttekintő leírása: tartalom – terjedelem (Scope and Content Description)
- Az irategység szerkezetének leírása (Arrangement) – nem kötelező
- Az iratcsomók, egységek listája (Container List)
  – sorszám, megnevezés, időhatár és/esetleg tartalmi összefoglaló vagy dokumentumlista (no, box, date, content summary or list of documents)

Az EAD (DTD) által meghatározott módszer egészében megfelelt azoknak az elvárásoknak, amely a 2000-es években a döntéshozatal során meghatározó szerepet kellett, hogy játszanak. Vagyis korunk technikai lehetőségeinek és követelményeinek figyelembevételével, távlatilag az internet-hozzáférést biztosító és a könyvtári feldolgozás szabványos világába illeszkedő feldolgozási metódust kellett választani. A megvalósítás során pedig biztosítania kellett a következő alapvető szempontok érvényesítését: (1) építsen a múltra, lehetőleg hasznosítson minden előzetes munkabefektetést; (2) biztosítsa a jövőt, tegye lehetővé a korszerű továbbhaladás lehetőségét; (3) tegye lehetővé a feldolgozás szintjének (mélységének, részletességének) rugalmas kezelésével a rendelkezésre álló időkeretben a munka elvégzését.
E szempontokat egyesítő, a könyvtári feldolgozási szabványok világába beilleszkedő feldolgozási módszerként bontakozott ki tehát a ’90-es években az EAD (DTD), és öltött alkalmazható formát 2000-re. Így alkalmas volt arra, hogy biztosítsa az Amerikai Magyar Alapítványban elhelyezett Bethlen Gyűjtemény korszerű feldolgozását. A gyűjtemény tartalmi feltárásának és leírásának eredménye a 250 oldalnyi terjedelmű fondjegyzék, azaz Fiding Aid olyan feltáró eszközt ad a kutatás kezébe, amely a kódolás alkalmazásával távlatilag az internet-hozzáférést is biztosíthatja.
A következő évek során a kódolást segítő programok változatai születtek, egy részük kereskedelmi forgalmazásban, más részük szabad hozzáférésű szakmai intézmények munkájának eredményeként. Az Amerikai Magyar Alapítvány egy ilyen program hasznosítását választotta, amelynek alkalmazását és a kódolás elvégzését a következő Fulbright-ösztöndíjas, Deák Nóra végezte. A módszerre vonatkozó információkat a következő cikkben olvashatjuk. A szükséges adaptációt és a programot kifejlesztő intézménnyel a kapcsolatot fenntartja, és a kommunikációt Margaret Papai, az Amerikai Magyar Alapítvány könyvtárosa végzi.
Reményeink szerint a nem túl távoli jövőben a Bethlen Gyűjtemény hozzáférését és ismertetését biztosító legfontosabb információk mind az amerikai, mind a magyarországi felhasználók számára hozzáférhetővé válnak a világhálón.

JEGYZETEK

1 OSZK Irattár 976/1997.
2 American Hungarian Foundation Archive 1998.
3 Csillag András: The Bethlen Collection. Manuscript Collection. Archives of the American Hungarian Foundation In: Vasváry Collection Newsletter (Szeged), no. 24 = no. 2 (2000).
4 American Archivist vol. 60 no 3 és no 4 (Summer és Fall 1997).
5 http://www.loc.gov/ead/eaddev.html
6 Pitti, Daniel: Encoded Archival Description: An Introduction and Overview = D-Lib Magazine (Washington: CNRI), vol. 5, no. 11, Nov. 1999: http://www.dlib.org/dlib/november99/11pitti.html
Pitti, Daniel-Duff, Wendey. Encoded Archival Description ont he Internet = Journal of Internet Cataloguing, vol. 4 no  (2001), 1-225. p.
Digital projects and descriptive standards = J. Arch. Org vol. 1 no 3 (2002), 1-86. p.

Címkék

(1) (1) (1) (12) (2) (2) (3) (3) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (10) (3) (2) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (3) (2) (1) (1) (19) (1) (12) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (7) (1) (1) (1) (1) (1) (1) (1) (1) (3) (3) (1) (1) (5) (1) (3) (2) (1) (1) (1) (3) (2) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (2) (2) (5) (1) (2) (1) (2) (1) (2) (2) (1) (1) (1) (1) (1) (1) (6) (28) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (7) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (3) (1) (1) (1) (1) (1) (1) (1) (10) (1) (3) (1) (1) (2) (1) (1) (4) (1) (1) (5) (1) (1) (1) (1) (16) (4) (6) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (27) (3) (10) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (8) (3) (4) (1) (1) (1) (1) (1) (9) (2) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (12) (3) (1) (2) (1) (1) (1) (1) (1) (1) (2) (7) (11) (1) (1) (1) (1) (1) (1) (1) (2) (4) (2) (10) (1) (1) (1) (2) (1) (1) (2) (1) (2) (1) (1) (1) (1) (1) (1) (4) (4) (2) (10) (1) (2) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (2) (1) (1) (1) (30) (3) (1) (1) (1) (1) (1) (1) (2) (33) (1) (1) (2) (1) (1) (2) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (9) (1) (1) (1) (4) (3) (1) (1) (1) (2) (2) (2) (1) (1) (1) (2) (2) (1) (1) (1) (1) (1) (1) (1) (1) (3) (1) (2) (1) (1) (1) (1) (6) (3) (1) (19) (1) (1) (1) (1) (1) (1) (3) (4) (1) (9) (2) (1) (1) (1) (2) (1) (1) (3) (6) (15) (1) (3) (1) (1) (1) (1) (1) (1) (2) (2) (1) (1) (2) (1) (1) (3) (1) (1) (1) (2) (1) (1) (1) (1) (10) (2) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (4) (1) (1) (1) (1) (7) (5) (1) (2) (1) (1) (1) (2) (6) (1) (2) (1) (2) (1) (1) (2) (1) (1) (1) (13) (1) (1) (2) (4) (3) (1) (1) (1) (3) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (3) (1) (38) (1) (1) (1) (1) (1) (1) (1) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (3) (1) (6) (1) (6) (17) (1) (1) (1) (1) (6) (1) (2) (1) (3) (1) (1) (1) (1) (19) (1) (1) (1) (1) (1) (1) (3) (1) (1) (4) (1) (3) (1) (1) (2) (9) (1) (1) (1) (4) (1) (1) (2) (1) (21) (6) (5) (1) (2) (1) (1) (1) (2) (3) (1) (1) (1) (1) (3) (1) (1) (1) (8) (1) (25) (1) (1) (1) (1) (2) (6) (1) (1) (1) (1) (1) (1) (18) (3) (1) (1) (1) (2) (1) (1) (1) (4) (14) (1) (2) (1) (1) (1) (2) (2) (14) (7) (2) (4) (2) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (3) (1) (1) (1) (1) (2) (1) (2) (1) (1) (1) (1) (2) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (2) (5) (1) (1) (1) (1) (2) (22) (1) (1) (1) (1) (1) (2) (2) (1) (2) (1) (1) (2) (1) (1) (3) (1) (1) (1) (6) (1) (4) (1) (1) (1) (10) (1) (1) (1) (1) (1) (1) (1) (1) (4) (1) (1) (3) (12) (1) (4) (1) (1) (3) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (17) (3) (1) (1) (1) (1) (3) (1) (2) (1) (1) (2) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (6) (1) (1) (1) (1) (1) (5) (2) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (9) (1) (2) (1) (4) (1) (1) (1) (1) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (2) (1) (1) (3) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (60) (1) (1) (1) (3) (3) (1) (3) (1) (11) (5) (3) (1) (1) (3) (1) (1) (2) (2) (2) (1) (4) (1) (6) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (7) (9) (1) (1) (7) (6) (1) (1) (1) (1) (1) (1) (7) (42) (3) (1) (1) (1) (1) (1) (1) (1) (2) (9) (1) (2) (1) (1) (1) (2) (2) (1) (1) (1) (2) (2) (1) (1) (1) (1) (2) (1) (1) (1) (2) (2) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (2) (6) (1) (1) (1) (1) (2) (1) (4) (1) (1) (4) (6) (1) (1) (1) (2) (1) (1) (2) (1) (4) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (4) (1) (2) (1) (1) (1) (1) (1) (1) (1) (2) (4) (1) (1) (1) (1) (4) (4) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (7) (1) (4) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (5) (1) (2) (2) (8) (1) (7) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (3) (1) (1) (1) (1) (2) (1) (2) (1) (1) (1) (2) (1) (1) (2) (1) (1) (2) (2) (1) (1) (1) (1) (1) (1) (5) (1) (1) (2) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (2) (2) (8) (1) (1) (1) (4) (2) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1)