A hiteles digitális másolatról és a másolati példányok bibliográfiai kezeléséről – 2. rész: Metaadatok

Kategória: 2017/12

Míg cikkem első részében a digitális másolatok hitelességéről, a hitelesség ellenőrzésének fontosságáról, illetve lehetséges eszközeiről írtam1, addig jelen írás mindenekelőtt a digitalizált tartalmak metaadatainak kezeléséről, bibliográfiai feldolgozásáról szól. Részben arra az előadásomra építettem, amelyet a pozsonyi CDA 2017 konferencián tartottam a tárgyban ez év novemberében.2

Néhány szó a németországi jó gyakorlatról

Még mielőtt a digitális másolati példányok leírására szolgáló metaadatokkal tüzetesebben foglalkoznánk, érdemes szólnunk egy jó gyakorlatról. Németországban a DFG (Deutsche Forschungsgemeinschaft = Német Kutatási Alapítvány) fektette le azokat a digitalizálási irányelveket3, amelyek alapján az egyes tudományos intézményeknek ki kell dolgozniuk a saját digitalizálási szabályzataikat. A dokumentum jelentős része szól a metaadatokról, amelyek sémáinak definiálása fontos eleme egy digitalizálási szabályzatnak.

Az irányelvek értelmében a metaadatokat szoftversemleges, szabványos formában szolgáltatjuk, általában XML-ben kódolva. Az optimális, egyben fenntartható felhasználás érdekében a leíró adatok esetében az adott terület szabványait és referenciamodelljeit szükséges mérvadónak tekinteni, valamint, ahol lehetséges, kapcsolatot szükséges létrehozni a már publikált szabványos adatokkal. Személynevek, életrajzi vagy földrajzi adatok esetén elvárás a Deutsche Nationalbibliothek Integrált katalógustárának (Gemeinsame Normdatei, GND) használata. Ezen felül is lehetőséget kell teremteni további – nemzeti vagy nemzetközi – kontrollált szótárak illesztésére.4 A metaadatokra vonatkozó legfontosabb irányelvek a következők:

  • A leíró metaadatokat kötelezően a megfelelő dokumentum-specifikus szabvány szerint kell megadni:

-Szöveges dokumentumok, levéltári anyagok esetén: Metadata Encoding and Transmission Standard / Metadata Object Description Schema (METS / MODS)

-Kéziratok esetén: Metadata Encoding and Transmission Standard / Text Encoding Initiative (METS / TEI)

-(Egyedi) vizuális és háromdimenziós objektumok esetén: Lightweight Infor­mation Describing Objects (LIDO)
A megadott metaadatokat a vonatkozó XML-séma szerint validálni szükséges, valamint szemantikai hibaellenőrzést kell rajtuk lefolytatni.

  • A leíró metaadatokat kötelező Open Archives Initiative (OAI) interfészen keresztül szolgáltatni (akár saját rendszeren belül, akár egy erre alkalmas portálon keresztül).
  • A digitális adatok és metaadatok összekapcsolására perzisztens azonosítókat szükséges alkalmazni a nyilvántartórendszerekben (katalógusokban, online keresőrendszerekben). A digitalizált anyagokat professzionális céleszközökkel online hozzáférhetővé kell tenni, valamint el kell helyezni a Német Digitális Könyvtárban (Deutsche Digitale Bibliothek, DDB) és – közvetett módon – az Europeanában.
  • A projektgazdának kell gondoskodnia arról, hogy az egyes digitalizálási egységek egyértelmű módon legyenek azonosíthatóak, valamint a rendszerben jelen lévő többi egységtől elkülönülten lehessen őket visszakeresni.
  • Az említett portálokhoz szabványos formátumban, OAI-n keresztül kell eljuttatni a tartalmakat.
  • Strukturált metaadatok használata esetén a DFG Viewer weboldalán5 található jelölők listájából szükséges kiindulni. Ajánlott a METS vagy a TEI használata, mindenesetre a DFG-Viewert támogató formátum az elvárás. (A DFG-Viewer egy hivatkozási implementáció a DFG által elvárt szabványokhoz. Ilyenek a METS / MODS, METS / TEI és az OAI-PMH adatcsere-interfész.)
  • Az egyes projektekhez köthető gyűjteményleírásokat szintén szabványos formában szükséges megadni, lehetőség szerint egyúttal angol nyelven is. Megadhatóak a következők szerint: Dublin Core Collections Application Profile, METS, MODS vagy TEI headers, Encoded Archival Description (EAD) és LIDO.
  • A dokumentum 34 oldalon át közli a konkrét metaadatsémákat (Anhang A-B-C-D-G).

Digitális másolatok kezelése: RDA-perspektíva

Az anglo-amerikai katalogizálási hagyományban (ld. AACR2) a távoli elérésű elektronikus információforrások kiadottnak (published) tekintendők. Ezt a tradíciót viszi tovább az új forrásleírási szabályzat, a Resource Description and Access (RDA). A reprodukció minden esetben egy kiadás (FRBR-i terminológiával: Megjelenési Forma) egy adott példányáról készül, ez alapján feltételezhető az alábbi kapcsolat az eredeti információforrás (mint Példány) és a digitális másolat (mint Megjelenési Forma) között:

A könyvtárostól elvárható filológiai hitelesség tehát azt kívánja, hogy a másolati példány leírását az eredeti példányéval kapcsoljuk össze, méghozzá úgy, hogy egyben az alkalmazott hitelesítési eljárásra is referálunk:

A (filológiai) hitelesség megfelelő bizonyítása tehát olyan kívánalom, amely levezethető a könyvtárosi felelősségvállalásból, ami a megbízható információk átadását, a felhasználók félretájékoztatásának elkerülését illeti. A nem elégséges módon kifejezett kapcsolat a másolati példány és eredetije között, avagy kapcsolat feltételezése ott, ahol nem indokolt, a dezinformálás esetkörébe tartozik.

A digitális szurrogátumok és forrásdokumentumaik leírásának jól kijelölt helye van a metaadat-szabványok világában. Dappert és Enders négyféle kategóriába sorolja a digitális megőrzéshez szükséges metaadatokat6:

Leíró metaadat: az intellektuális entitást ismérvekkel írja le, mint amilyen a szerző és cím; részét képezhetik a történeti kontextusra (provenienciára) vonatkozó adatok, pl. annak leírása, hogy mely nyomtatott példányon alapul a származtatott digitális változat.

Strukturális metaadat: a fizikai strukturális relációk leírására szolgál, meghatározhatja pl., hogy mely kép mely weboldal része, vagy hogy az oldalak hogyan követik egymást egy digitalizált könyvben.

Technikai metaadatok: az egyes fájltípusokra vonatkoztatható műszaki információk, pl. a szoftver- és hardverigény, de idetartoznak az olyan tartalomtípus-specifikus adatok, mint a szélesség egy képfájl, vagy az időtartam egy zenei fájl esetén.

Adminisztratív metaadatok: a digitális objektum proveniencia-adatai abban az értelemben, hogy ki fért hozzá, milyen megőrzési tevékenységet folytattak rajta, illetve a hozzáférési jogok és engedélyek is ebbe a kategóriába tartoznak.

Első ránézésre tehát úgy gondolhatnók, hogy az eredeti példányra vonatkozó (bibliográfiai) adatok a leíró metaadatok részét képezik. Ahogy utóbb látni fogjuk, ez nem mindenképpen van így.

A megőrzési célú digitalizálás kapcsán két alapvető – XML-alapú – metaadat-szabványt kell megemlítenünk. A PREMIS Data Dictionary for Preservation Metadata szorosan kapcsolódik a hosszútávú-megőrzés szabványához, az OAIS-hoz7, és az adminisztratív és technikai adatokra fókuszál. A PREMIS általános modellje öt entitást határoz meg, illetve ezek tulajdonságaiként – hierarchikusan reprezentálható – szemantikai egységeket definiál.

A cselekvők (‘Agent’) entitás tulajdonságai:

3.1     agentIdentifier (M, R)

3.1.1  agentIdentifierType (M, NR)

3.1.2  agentIdentifierValue (M, NR)

3.2     agentName (O, R)

3.3     agentType (O, NR)

3.4     agentVersion (O, NR)

3.5     agentNote (O, R)

3.6     agentExtension (O, R)

3.7     linkingEventIdentifier (O, R)

3.7.1  linkingEventIdentifierType (M, NR)

3.7.2  linkingEventIdentifierValue (M, NR)

3.8     linkingRightsStatementIdentifier (O, R)

3.8.1  linkingRightsStatementIdentifierType (M, NR)

3.8.2  linkingRightsStatementIdentifierValue (M, NR)

3.9     linkingEnvironmentIdentifier (O, R)

3.9.1  linkingEnvironmentIdentifierType (M, NR)

3.9.2  linkingEnvironmentIdentifierValue (M, NR)

3.9.3  linkingEnvironmentRole (O, R)

A PREMIS, bár nincs teljes átfedésben – például a leíró információk tekintetében – az OAIS-ban megfogalmazott metaadat-követelményekkel8, jelentős forrásként épít a bibliográfiai adatokra – ezt támasztja alá a Kongresszusi Könyvtár oldalán publikált táblázat9, amely a MARC 21 Bibliográfiai Formátum és a PREMIS adatszótára közötti megfeleltetéseket tartalmazza.

A másik fontos szabvány a Kongresszusi Könyvtár által fejlesztett METS (Metadata Encoding and Transmission Standard), amely a digitális objektumok és metaadataik információs csomaggá való alakítására szolgál. A csomagok funkciójuk szerint különfélék lehetnek (Submission Information Package – adatfeltöltésre; Archival Information Package – a hosszú távú megőrzéshez; Dissemination Information Package – a felhasználónak való információtovábbításra). A METS-en kívül léteznek más megoldások is (BagIt, Fedora Object XML), de ez a leginkább elterjedt, és ez köthető általánosságban az OAIS modelljéhez. Felépítése:

  • METS Header <metsHdr> – a METS-dokumentumra vonatkozó metaadatok, mint például a létrehozó;
  • Descriptive Metadata <dmdSec> – magára a digitális objektumra vonatkozó leíró adatok: (1) kimutathat egy külső forrásra (<mdRef>), például meghivatkozhat egy MARC-formátumú bibliográfiai rekordot; vagy (2) tartalmazhat beágyazott metaadatokat (<mdWrap>); (3) illetve alkalmazhatja egyszerre mindkét eljárást;
  • Administrative Metadata <amdSec> – az adminisztratív metaadatok közé tartoznak a hozzáférési jogosultságokra vonatkozó adatok, a jogi és műszaki adatok, illetve a fájltörténet: származtatott fájl/mesterfájl; konverzióra, migrációra vonatkozó adatok, illetve a proveniencia: az eredeti (analóg) forrásobjektum metaadatai;
  • File Section <fileSec> – az adatállomány-szegmens a digitális objektumot alkotó fájlok listáját tartalmazza;
  • Structural Map <structMap> – a digitális objektumhoz tartozó hierarchikus struktúra;
  • Structural Links <structLink> – a struktúratérkép elemei közötti kapcsolatok listája;
  • Behavior <behaviorSec> – az ebben foglalt információk szükségesek a digitális objektum egyes összetevőinek megjelenítéséhez, lehetnek például konkrét szoftvercsomagokra vonatkozó információk.

Külső leíró metaadat (External Descriptive Metadata) használata esetén az mdRef elemben határozzuk meg azt az azonosítót (URN, URL, PURL, HANDLE, DOI), amely a digitális objektumra vonatkozó metaadatok lekérdezéséhez szükséges:

     <dmdSec ID=”dmd01”>

<mdRef LOCTYPE=”URN” MIMETYPE=”application/xml” MDTYPE=”DC”

LABEL=” Kraus, Milan [et al.]: A kétfejű macska”>urn:nbn:hu-5955</mdRef>

     </dmdSec>

Fenti esetben a lekérdezett metaadatot Dublin Core-ban fejezték ki, de természetesen más értéket is definiálhatunk (pl. MARC, MODS, EAD, DC).

Belső leíró metaadatok (Internal Descriptive Metadata) megadásához az mdWrap elemet használjuk:

<dmdSec ID=”dmd002”>

<mdWrap MIMETYPE=”text/xml” MDTYPE=”DC” LABEL=”Dublin Core Metadata”>

<xmlData>

<dc:title>A kétfejű macska</dc:title>

<dc:creator>Milan Kraus</dc:creator>

<dc:creator>Ján Ondruš</dc:creator>

<dc:creator>Štefan Strážay</dc:creator>

<dc:publisher>NAP Kiadó</dc:publisher>

<dc:type>text</dc:type>

</xmlData>

</mdWrap>

</dmdSec>

(A <dmdSec> ID attribútuma szolgál arra a struktúratérképen belül, hogy a dokumentumhierarchia egy adott szakaszát egy adott <dmdSec> elemmel összekapcsolja.)

Azt látjuk tehát, hogy a leíró metaadat a METS-ben a digitális objektum leírására szolgál, amely FRBR/RDA-értelemben egy Megjelenési Forma entitás, amely kapcsolódik egy Példány entitáshoz, konkrétan az eredeti objektumhoz. A kapcsolatjelölő (Relationship Designator) abban az esetben, ha a hitelesítés megtörtént: ‘hitelesített másolata’. Az eredeti Példányhoz kapcsolódó rekord az adminisztratív metaadat részét képezi, illetve akként hivatkozható meg.

Az adminisztratív metaadaton belül az eredeti (analóg) objektumra vonatkozó információkat a forrásmetaadat (Source Metadata), <sourceMD> elemben rögzítjük:

<sourceMD ID=»source01»>

<mdRef LOCTYPE=»URL» MIMETYPE=»application/xml» MDTYPE=»MARC»

LABEL=» Kraus, Milan [et al.]: A kétfejű macska»> http://193.225.149.6/opac ?infile=details.glu&loid=150820677</mdRef>

</sourceMD>

Digitális másolatok bibliográfiai kezelése RDA-alapokon, MARC 21-környezetben

Az RDA az alábbi módon nyilatkozik a hasonmás kiadások és reprodukciók adatainak rögzítéséről (RDA 1.11):

„Hasonmás kiadás (fakszimile) vagy reprodukció leírásakor a hasonmás kiadásra (fakszimilére) vagy reprodukcióra vonatkozó adatokat a megfelelő adatelem részeként rögzítjük. Az eredeti megjelenési formára vonatkozó adatokat a kapcsolódó mű vagy megjelenési forma adatelemeként rögzítjük, ahol ez lehetséges.”

Az elvárt filológiai pontosság és hitelesség érdekében a digitális változat és az eredeti Példány közötti kapcsolat definiálandó a katalogizálás során. A Példány lehetséges kapcsolatait a 28.1.1 fejezet tárgyalja. Egy példa a szabályzatból (28.1.1.3):

A következő reprodukciója: ADM 55/40”

A MARC 21-ben a bibliográfiai rekord 776-os adatmezője (‘Egyéb fizikai forma’) alkalmazható erre a célra:

776 08$ielektronikus másolata a következő példánynak:$aSzerb Antal (1901-1945)$tA Pendragon-legenda$dBudapest : Franklin, 1934$h280 p. ; 18 cm$o170.020$w000002965227

Esetünkben az alábbi indikátorok és almezők tekinthetők relevánsnak:

776 – Egyéb fizikai forma
Első indikátor Második indikátor
0 – megjegyzést képez # – egyéb formában elérhető
1 – nem képez megjegyzést 8 – jelenítse meg a felhasználói értelmezést könnyítő jeleket
almező kódja almező neve
$a főtétel besorolási adata
$d megjelenési hely, kiadó, megjelenés időpontja
$g kapcsolódó részek
$h fizikai jellemzők
$i kapcsolati információ
$n megjegyzés
$o egyéb azonosító
$t cím
$w rekordazonosító

Az ‘i’ almező kapcsolatjelölőt tartalmaz, amelyet a szabályzat ‘J’ függelékében található jegyzékből választhatunk ki. Ezúttal az alábbit használtuk (J.5.2):

„a következő példány elektronikus másolata: egy analóg formátumú példány, amelyről digitális formátumú változat készült”

A vonatkozó Példányt az ‘o’ (‘Egyéb példányazonosító’) almező tartalmával azonosítottuk, jóllehet megjegyzést is tehettünk volna (‘Az eredeti példány raktári jelzete: 170.020’), vagy használhattuk volna a ‘w’ (‘Rekordazonosító’) almezőt, amennyiben a Példány entitásnak külön rekordja van a rendszerünkben. (A fenti példában a Megjelenési Forma rekordazonosítóját adtuk meg.)

A digitális szurrogátumokról az alábbi adatmezők használatával adhatunk meg további lényegi információkat:

  • Tartalom típusa (336)
  • Médiumtípus (337)
  • Hordozó típusa (338)
  • Fizikai médium (340) – itt rögzíthetünk esetlegesen információkat az eredetről, pl.: ‘eredeti’, ‘mesterfájl’, ‘származtatott mester’ (RDA 3.10.1.3)
  • Digitális állomány jellemzői (347)
  • Elektronikus hely és hozzáférés (856)

Egy példa a digitális másolatok leírása során alkalmazandó mezőkre és értékekre:

336 ##$aszöveg$2rdacontent

337 ##$aszámítógépes$2rdamedia

338 ##$aonline forrás$2rdacarrier

340  ##$jszármaztatott mester$2rdagen

347 ##$aszöveges állomány$bPDF$2rda

776 08$iA következő példány elektronikus másolata:$aSzerb Antal (1901-1945)$tA Pendragon-legenda$dBudapest : Franklin, 1934$h280 p. ; 18 cm$o170.020$w000002965227

856 40 $3OSZK – Digitális Könyvtár$uhttp://nbn.urn.hu/N2L?urn:nbn:hu-136665

A következő példa egy több dokumentum digitalizálásával létrehozott virtuális példány (Reprodukált Megjelenési Forma) RDA/MARC 21-alapú leírását szemlélteti:

776 08$iA következő példány elektronikus másolata:$aSzerb Antal (1901-1945)$tA Pendragon-legenda$dBudapest : Franklin, 1934$h280 p. ; 18 cm$o170.020$w000002965227$gp. 1-72.

776 08$iA következő példány elektronikus másolata:$aSzerb Antal (1901-1945)$tA Pendragon-legenda$dBudapest : Franklin, 1934$h280 p. ; 18 cm$oPTEVISz72$w MOKKAZ0004940112$gp. 73-280.

Ebben az esetben a ‘g’ (‘Vonatkozó részek’) almezőt használtuk annak kifejezésére, hogy a digitális másolat mely részei készültek a hivatkozott példány digitalizálásával.

Fontos itt megjegyeznünk, hogy amikor MARC 21-környezetben a digitális másolat és az eredeti forrás kapcsolatának kifejezésére a bibliográfiai rekord 776-os mezőjét alkalmazzuk, módunkban áll többféle kapcsolatjelölőt használni attól függően, hogy a leírt forrásnak egy FRBR-i értelemben vett Megjelenési Formával vagy Példánnyal való kapcsolatát szeretnénk-e kifejezni. Mi az ‘a következő példány elektronikus másolata’ kapcsolatjelölőt használtuk, hiszen alapvető elképzelésünk szerint ezt kívánja az elvárható filológiai pontosság, hiszen a digitális szurrogátum mindig egy (vagy több) konkrét analóg példányról készül. Miután azonban a hagyományos bibliográfiai rekord az FRBR-modell első entitáscsoportjának (Mű, Kifejezési Forma, Megjelenési Forma, Példány) minden eleme vonatkozásában tartalmaz(hat) adatokat, nem mondhatjuk ki egyértelműen, hogy Megjelenési Forma-Példány vagy Példány-Példány viszonyt fejeztünk-e ki a kapcsolatjelölő használatával, másfelől – másfajta megközelítést, illetve kapcsolatjelölőt alkalmazva – lehetőségünk lett volna ugyane mező használatával pl. egy Megjelenési Forma-Megjelenési Forma kapcsolat kifejezésére is, sőt a teljes pontosság, illetve RDA-hűség azt kívánja, hogy a 776-os mező duplikálásával ezt a kapcsolatot is definiáljuk. Az RDA szabályait megfelelő rigorózussággal leképező, az FRBR-modell szerinti entitásrekordokkal operáló RIMMF alkalmazásban nem is tehetünk mást: itt az ‘a következő példány elektronikus másolata’ kapcsolatjelölő csak Példány-Példány viszonylatban fejezhető ki (MARC 21-alapú példányrekordban ilyen kapcsolat jelenleg nem definiálható), valamint a Megjelenési Forma-Megjelenési Forma kapcsolatot is szükséges meghatároznunk:

A téma némiképp problematikus voltát mindamellett jól jelzi, hogy az IFLA által ez év augusztusában kiadott könyvtári referenciamodell10, amely alapján az RDA átalakítása jelenleg zajlik, külön kitér az online hozzáférhető digitális példányok kérdésére. A dokumentum 5.3 fejezetében kifejtett álláspont szerint a digitális példány valahol a Megjelenési Forma és a Példány között foglal helyet.

Konklúzió

Ahogy láttuk, mind az RDA, mind az RDA-képességekkel felruházott MARC 21 alkalmas keretet és kifinomult megközelítést nyújt a digitális másolatok katalogizálásához. A digitális szurrogátumok MARC-alapú bibliográfiai leírásában közvetlen utalhatunk a másolatok forráspéldányaira, natív környezetben pedig a Megjelenési Forma és Példány kapcsolata – a kapcsolt adatok hálóján át – tranzitíven érvényesül. Ami a hitelességet illeti, ennek rögzítésére javasolható egy új kapcsolatjelölő (’hitelesített másolata’) bevezetése, valamint – továbbra is MARC 21-ben gondolkodva – egy új almező definiálása a 776-os adatmező alatt, a hitelesítési eljárást magában foglaló dokumentum (pl. digitalizálási szabályzat) meghivatkozhatóvá tétele érdekében. Jó hír, hogy 2017-től Magyarország is tagja annak a fórumnak, amely az európai szakmai érdekeket hivatott képviselni és érvényesíteni az RDA fejlesztése során.11

Jegyzetek

1.  Dancs Szabolcs: A hiteles digitális másolatról és a másolati példányok bibliográfiai kezeléséről – 1. rész: Hitelesség szabványos alapokon. Könyv, Könyvtár, Könyvtáros, 2017 (26) 10. sz. 7–15.

2.  Az előadásom alapján írt angol nyelvű tanulmány elérhető a rendezvény weboldalán: Dancs Szabolcs: Descriptive metadata for long-term preservation and the bibliographic management of digital surrogates. CDA 2017: Výmena skúseností z prevádzky a budovania LTP archívov. Univerzitná knižnica v Bratislave, Bratislava, 2017. 96–107. Elektronikusan letölthető: https://cloud.ulib.sk/index.php/s/AxqUW9vJXlcUwS7 (Utolsó megtekintés: 2017. november 17.)

3.  Deutsche Forschungsgemeinschaft: DFG-Praxisregeln: „Digitalisierung”. Elektronikusan letölthető: http://www.dfg.de/formulare/12_151/12_151_de.pdf (Utolsó megtekintés: 2017. november 17.)

4.  Pl. Iconclass: http://www.iconclass.nl/home

5.  http://dfg-viewer.de/

6.  Dappert, A. – Enders, M.: Digital preservation: metadata standards. Information Standards Quarterly, 2010 (2) 2. sz. 4–13. Elektronikusan letölthető: https://www.loc.gov/standards/premis/FE_Dappert_Enders_MetadataStds_isqv22no2.pdf (Utolsó megtekintés: 2017. no­vem­ber 20.)

7.  Reference Model for an Open Archival Information System (OAIS), Magenta Book, June 2012. Elektronikusan letölthető: https://public.ccsds.org/pubs/650x0m2.pdf (Utolsó megtekintés: 2017. november 20.)

8.  Lavoie, B.: The Open Archival Information System (OAIS) Reference Model: introductory guide (2014, 2nd Edition). Elektronikusan letölthető: http://www.dpconline.org/docs/technology-watch-reports/1359-dpctw14-02/file (Utolsó megtekintés: 2017. november 20.)

9.  https://www.loc.gov/marc/bibliographic/mapping/MARC21vsPREMIStable.html (Utolsó meg­te­kintés: 2017. november 20.)

10. IFLA Library Reference Model (LRM) – https://www.ifla.org/publications/node/11412 (Utolsó megtekintés: 2017. november 23.)

11. European RDA Interest Group (EURIG) – http://www.rda-rsc.org/europe (Utolsó megtekintés: 2017. november 22.)

Címkék