Digitális szurrogátumok RDA-alapú feldolgozása költséghatékonyan – az edinburghi módszer1

Kategória: 2018/ 2

Az Edinburghi Egyetemi Könyvtár 2016-ban csatlakozott az IIIF konzorciumhoz. Az International Image Interoperability Framework (IIIF)2 kezdeményezés célja műszaki megoldások definiálása annak érdekében, hogy a weben elérhető képalapú digitális gyűjteményekhez a kutatói szféra elvárásainak megfelelő szintű hozzáférést lehessen nyújtani, elősegítve egyben a rendszerek közötti átjárhatóságot. A megoldások megfogalmazásakor mindenekelőtt a kapcsoltadat-technológiát veszik alapul, illetve a szabványos protokollok alkalmazását. Az interfészek (API-k) specifikálásán túl konkrét fejlesztésekkel, nyílt forráskódú eszközökkel, például képnézegető szoftverekkel is támogatják a felhasználói közösséget.3 A kezdeményezés hátterében elsősorban közgyűjtemények és fejlesztőcégek találhatók. Az edinburghi kollégák kísérleti projektjének egyik kimondott célja az volt, hogy minél gazdagabb és pontosabb metaadat-tartalommal ellátott képeket tegyenek elérhetővé az IIIF végpontokat lekérdező (humán vagy gépi) felhasználó számára. Az elsődlegesen bevitt adatok minőségéért a művészettörténetben otthonos feldolgozó munkatárs felelt, a rekordok RIMMF-ben való adatgazdagítását, a leírások RDA-sítását könyvtáros gyakornokok végezték.

 

1. ábra
Példa egy digitalizált objektum és metadaatai megjelenítésére a LUNA rendszerben (részlet)

A kiindulási alap tehát a LUNA képnézegető szoftverben online közzétett, metaadatolt 255 digitalizált objektum volt. A kiválasztott gyűjtemény 16-19. századi nyomtatott források másolatait tartalmazza, főként a korban élt orvosok portréit. A LUNA alkalmazás maga is kreál ún. IIIF Manifesztációkat, vagyis az IIIF-kompatibilis rendszerek számára elérhető, lekérdezhető leírásokat az egyes digitalizált források – tudományos igényű – megjelenítéséhez. (A JSON-LD-dokumentumként definiált Manifesztációk a digitális reprezentáció struktúrája és tulajdonságai mellett leíró adatokat tartalmaznak a digitális objektumról magáról vagy a benne foglalt szellemi alkotásról.) A skót könyvtáros kollégák azonban tartalmasabb Manifesztációk létrehozását célozták meg. A már említetten kívül további célkitűzésük volt a discovery-eszközben (DiscoverEd4) elérhető tartalomtípusok tárházának bővítése.

A választott eszköz: a RIMMF

A vázolt célok megvalósítására az edinburghi könyvtárosok egy ingyenesen letölthető alkalmazást, a RIMMF-et5 választották. Jóllehet a szoftver alapvetően az RDA-oktatás támogatására, az FRBR-alapú feldolgozás demonstrálására készült, illetve az eljövendő könyvtári metaadatoló rendszerek egyfajta prototípusaként szolgál, kiválóan alkalmazható az RDA elemkészletére és szótáraira épülő, eltérő formátumokra konvertálható leírások gyártására. A program emellett a feldolgozás során lehetővé teszi egyéb külső névterek, így pl. a VIAF alkalmazását.

A 15 pár tesztrekord elkészítése megfelelő kutatómunkát és szakértelmet igényelt. A kiindulási alapot a LUNA-ban található metaadatok jelentették. Ezek felhasználásával és kiegészítésével, gazdagításával készültek el az entitásrekordok: az eredeti (analóg) és a digitális változathoz külön Megjelenési Forma-rekord készült, ezek a megfelelő kapcsolatjelölővel („electronic reproduction (manifestation)” és „electronic reproduction of (manifestation)”) mutatnak egymásra. Az – immáron a RIMMF jóvoltából az RDA-elemek URI-azonosítóit is tartalmazó – rekordokat MARC 21 formátumra hozták és feltöltötték a saját forráskezelő rendszerükbe (Alma), ahol még tovább bővítették – például – a kongresszusi könyvtár tárgyszókészletéből. A konverzió során szintén egy térítésmentes alkalmazást, a MarcEditet6 vették igénybe. A projekt végső fázisát az adatok szemantikus publikálása jelenti majd, ennek előkészítése jelenleg zajlik.

A munkamenetet az alábbiakban a projekt során keletkezett rekordtípusok bemutatásával illusztráljuk.

 2. ábra
A Mű-rekord a rekordkapcsolatokkal

A leírása a RIMMF-ben kapcsolódik az eredeti információforrás mint Megjelenési Forma és a digitális másolat mint Megjelenési Forma leírásához, valamint a Kifejezési Forma rekordjához.

A Kifejezési Forma leírása – a éhez való „inverz” kapcsolódáson kívül – természetesen szintén tartalmazza a két Megjelenési Formához való kapcsolatot:

 

3. ábra
A Kifejezési Forma-rekord a rekordkapcsolatokkal

Az analóg forrás leírását magában foglaló Megjelenési Forma-rekord kizárólag az eredeti objektumról közöl információkat, a – már említett – „elektronikus másolata” („electronic reproduction (manifestation)”) kapcsolatjelölővel irányítva el a felhasználót a digitális szurrogátum adataihoz:

 4. ábra
Az analóg forrásra vonatkozó Megjelenési Forma-leírás

 A RIMMF lehetőséget ad az adatok MARC-formátumú megjelenítésére és exportjára:

5. ábra
MARC-formátumú megjelenítés RIMMF-ben

A vonatkozó MARC-rekord a könyvtár discovery rendszerében már adatgazdagodva, így például a -rekordból származó szerzői adattal, illetve tárgyszóval kiegészülve jelenik meg:

 

6. ábra
A discovery rendszerben megjelenített adatgazdagított rekord

A digitális objektum leírásában a digitalizálást végző szervezeti egység jelenik meg előállítóként („Producer”) és a könyvtár kiadóként. A rekordban rögzített információk tehát az elektronikus változatról hivatottak tájékoztatást nyújtani, nem elegyítve az eltérő – analóg és digitális – változatok adatait:

 7. ábra
A digitális másolat mint Megjelenési Forma a RIMMF-ben

Érdemes erre is vetni egy pillantást a dyscoveryben:

 

8. ábra
Elektronikus másolat MARC-rekordja a discoveryben

Összegzésképp tehát elmondható, hogy a projekt során digitalizált objektumonként egy -, egy Kifejezési Forma- és két Megjelenési Forma-leírás született. A szemléltetésre használt forrásokra keresve az Edinburghi Egyetemi Könyvtár keresőrendszerében (DiscoverEd) mindkét rekordra rábukkanhatunk, és a két leírás – természetesen – utal is egymásra:

 

9. ábra
Az eredeti forráshoz tartozó leírás fejléce a discoveryben

Egy költséghatékony (és nyílt forráskódú) megoldás

Tapasztalhatjuk, hogy egyre több ingyenes, sok esetben nyílt forráskódú fejlesztés áll rendelkezésünkre a digitalizálás, feldolgozás és szolgáltatásra bocsátás feladatainak elvégzésére. Jóllehet az egyes alkalmazások implementálása, a rendszerek üzemeltetése továbbra is erőforrás-igényes, a mi felelősségünk, hogy amikor arra mód van, a leginkább költséghatékony lehetőséget válasszuk. A források RDA-alapú, szabványos metaadatatolására kézenfekvő megoldás a RIMMF, amelynek előnyei:

  • ingyenes;
  • az RDA elemkészletére/értékszótáraira épülő, testre szabható beviteli felülettel szolgál, entitásonként és forrástípusonként előredefiniált űrlapokkal;
  • kapcsolódik az RDA Toolkithez; elemkészlete az RDA-éval együtt frissül;
  • besorolási rekordok külső névterekből átemelhetők;
  • az adatok különböző formátumokban (pl. MARC 21, RDF) kinyerhetők, egyéb, saját rendszerekben (pl. discovery) hasznosíthatók.

A RIMMF, kiegészülve egyéb térítésmentesen igénybe vehető, nem mellesleg nyílt forráskódú megoldásokkal (VUFIND7, DSpace8, Mirador9, Koha10 stb.) a feladatok jelentős részét lefedő szoftverapparátussal szolgálhat minden az edinburghi kollégákéhoz hasonló projekt megvalósítása során.

Jegyzetek

1.   A projekt ismertetéséhez az Edinburghi Egyetemi Könyvtár munkatársai, Alasdair McDonald, Ruby Wilkins és Claire Knowles szolgáltattak információkat. Készséges hozzáállásukért köszönettel tartozom.

2.   http://iiif.io/ (Utolsó megtekintés: 2018. március 27.)

3.   http://iiif.io/apps-demos/#image-viewing-clients (Utolsó megtekintés: 2018. március 27.)

4.   https://discovered.ed.ac.uk/primo-explore/search?vid=44UOE_VU2&sortby=rank (Utolsó megtekintés : 2018. március 27.)

5.   Az alkalmazásról bővebben magyarul: Dancs Sz.: Hogyan fogunk katalogizálni a jövőben? – FRBR-alapú bibliográfiai feldolgozás a gyakorlatban. Könyv, könyvtár, könyvtáros, 26(2). 2017. pp. 10-16., elektronikus elérése: http://epa.oszk.hu/01300/01367/00287/pdf/EPA01367_3K_2017_02_010-016.pdf (Utolsó megtekintés : 2018. március 28.)

6.   http://marcedit.reeset.net/ (Utolsó megtekintés : 2018. március 28.)

7.   https://vufind.org/vufind/ (Utolsó megtekintés : 2018. március 28.)

8.   http://www.dspace.org/ (Utolsó megtekintés : 2018. március 28.)

9.   http://projectmirador.org/ (Utolsó megtekintés : 2018. március 28.)

10.        http://www.koha.org/ (Utolsó megtekintés : 2018. március 28.)

Címkék