USMARC – UseMARCON –HUNMARC. A bibliográfiai rekordok adatcsere formátuma és a konverzió

Terveink szerint évente több alkalommal jelentkezünk majd új „mini-rovatunkkal”, hogy az adatcsere formátummal és a konverzióval kapcsolatos aktuális kérdésekről beszámoljunk. A rovatot Sipos Márta (OSZK) és kollégái állítják össze a Fejlesztési Osztályhoz érkező vélemények, hozzászólások alapján. (A szerk.)

 

Történeti összefoglalás

A világon ma körülbelül 50 különböző MARC-formátum létezik, az Európai Közösség országainak nemzeti könyvtáraiban 10-féle MARC-formátum használatos.1   Valamennyiük közös eredete, alapja a Library of Congress 1962-ben indult, géppel olvasható katalogizálási (Machine Readable Cataloguing, MARC) projectje.

A könyvek feldolgozására készült MARC-formátumot hamarosan továbbfejlesztették, hogy a többi dokumentumtípus feldolgozására is alkalmas legyen. A többes szám itt az amerikai és az angol közös erőfeszítéseket jelenti, az eredményeket tükröző első, később nemzetivé terebélyesedő MARC-formátumok a már kezdetektől meglévő elérések miatt külön-külön jelentek meg, a Library of Congress (LCMARC) és a British National Bibliography (BNBMARC) formátuma is 1968-ban. A mindkét országban sokasodó .(és eltérő) számítógépes fejlesztések vezettek a későbbiekben a USMARC és a UKMARC-formátumot leíró dokumentumok, illetve, kézikönyvek megjelentetéséhez, hogy az eltérő hazai gyakorlatokat éppen a kommunikáció érdekében közös mederbe tereljék. Közben természetesen a 70-es években is folytatódtak a Library of Congress és a British Library között a kompatibilitás és a harmonizáció megteremtésére irányuló erőfeszítések.

A UNIMARC megjelenése előtt kifejlesztett (főleg nemzeti) MARC-formátumok mind az LC/US vagy a BNB/UK MARC-formátumon alapulnak, egyesek az eredeti formátumot szinte szóról szóra átvették, másokon mind a két formátum hatásai fellelhetők, néhol a helyi gyakorlat vagy szolgáltatási cél, máshol az adott számítógépes rendszer határozta meg az eredetitől való eltérést. (US és/vagy UK alapú például a német MAB, a dán DANMARC, a spanyol IBERMARC, az ausztrál AUSMARC, vagy az olasz ANNAMARC 1985-ig.)

A különböző MARC-formátumok elterjedéséből adódó problémák részben megoldódtak az ISO 2709 (=MSZ 193 Mágnesszalagos bibliográfiai adatcsere-formátuma. A rekordok szerkezete) szabvány elfogadásával. A nemzeti könyvtárak által kifejlesztett, saját nemzeti formátumok szinte egyetlen közös vonása az azonos rekordszerkezet, az ISO 2709 nemzetközi szabvány alkalmazása. Az ISO szerkezet mind a mai napig az alapja az olyan belső vagy nemzeti formátumoknak, valamint a könyvtárakon kívüli, leggyakrabban kereskedelmi formátumoknak, amelyek igényt tartanak valamilyen fokú kompatibilitásra más rendszerekkel vagy formátumokkal. Az országonként, de talán helyesebben: nyelvterületenként eltérő katalogizálási szokásokat és gyakorlatot tükröző, eredetük vagy időrendbeli megjelenésük miatt különböző ISO 2709 rekordszerkezetű adatcsere-formátumok MARC betűszavában a C már nem Cataloguing-ot, hanem Communication-t jelent. (Mint ahogy az 1982-ben kiadott USMARC Alapelvek kimondja: bibliográfiai rendszerek közötti rekordcsere szabályait előíró kommunikációs formátum.)

Az IFLA a 70-es évek közepén olyan csereformátum kifejlesztését határozta el, amelynek elsődleges célja nem egyetlen) formátum nemzetközi adaptációja volt, hanem olyan formátum kialakítása, amely kiküszöböli két-két nemzeti formátum közötti konverziós programok sokaságának szükségességét. Az IFLA Állandó UNIMARC Bizottsága (Permanent UNIMARC Committee, PUC) úgy foglalt állást, hogy minden országnak legyen saját nemzeti adatcsere-formátuma, ugyanakkor pedig mindenütt a nemzeti központ legyen felelős a rekordoknak a nemzeti formátumról a nemzetközi formátumra fordításáért. Ez a nemzetközi csereformátum az először 1977ben publikált UNIMARC. Néhány ország egyszerűen honosította a UNIMARC-ot, mások a UNIMARC-on alapuló saját nemzeti MARC-formátumot hoztak létre. (UNIMARC alapú például Horvátország, Portugália, Görögország formátuma, a dél-afrikai SAMARC, a szlovén COMARC, vagy az olasz ANNAMARC 1985-től.)2

A felsorolásban nem szabad megfeledkeznünk az elsősorban a referáló és indexelő szolgáltatások szempontjait (is) figyelembe vevő, e téren kizárólagos szerepre szánt, 1984-ben publikált Common Communication Format-ról (Közös Adatcsere Formátum, CCF) sem, amely főleg nemzetközi szervezetekben használatos, számos fejlődő ország adatcsere-formátumának az alapja, sőt rugalmassága miatt belső formátumok alapjává is vált.3

Jellemzők

A MARC-formátumok összetevői (rekordszerkezet, tartalomjelölők, adattartalom) közül a tartalomjelölők azok, amelyek az érvényes könyvtári szabványokban előírt adatelemeket a gépi feldolgozás és az adatcsere érdekében egyértelműen azonosítják. Meghatározzák az adatmezők hívójelét, az egy-egy mező egészéről további információt hordozó indikátorokat, az egyes adatelemeket azonosító almező azonosítókat, illetve ezek értékeit. Nagy általánosságban azt mondhatjuk, hogy a MARC-formátumú bibliográfiai rekordok hierarchikus szerkezetűek: a rekord mezőkből áll, a mező almezőkből.

A MARC-formátumokat leíró dokumentumokban minden hívójelről és minden almezőről külön-külön előírják, hogy ismétlődhet-e vagy sem, kötelező-e, felvétele csak valamely feltételtől függően kötelező, vagy csak megengedett. Megadnak bennük továbbá bizonyos, a számítógépes feldolgozáshoz elengedhetetlen, illetve ott használatos információt, vagy hivatkoznak az ott érvényes szabványokra (pl. rekordhatárjel, karakterkészlet, vagy rekordszolgáltatásnál a rekordméret). Bizonyos alapvető kérdésekben teljes az egyezés a különböző formátumokban . Például az almező azonosító mind a USMARC, mind a UNIMARC, mind a HUNMARC esetében két karakter, amit mindhárom adatcsere-formátum rekordfejében a 11. pozíción jeleznek. Az első karakter az almező határjel, amelynek az MSZ 193 szerint „Az almező azonosító első vagy egyetlen karakterének az MSZ KGST 359 szerinti elemhatárjelnek kell lennie.” (Az MSZ KGST 359 `Az adatfeldolgozás alfanumerikus karaktereinek osztályozása, megnevezése és jelölése’ szabvány.) Ennek értéke hex 1F. A második karakter, az almezőjel a HUNMARC esetében a latin abc kis- vagy nagybetűje vagy szám. Az almező határjel `1F’ kérdésében valamennyi adatcsere-formátum azonos értéket ír elő, a grafikai jelölés pedig konvenció kérdése, amelyet minden formátumot leíró dokumentum bevezetésében jeleznek.

Egységesítési törekvések

A közös indulás, azonos könyvtári katalogizálási szabályzat (Anglo-American Cataloguing Rules, AACR), némileg eltérő fejlődés, de legfőképpen a párhuzamosság okozta helyzet indította arra a Library of Congress-t és a British Library-t, hogy az adatcsere érdekében nemzeti formátumaikat közelítsék egymáshoz, megvizsgálják, melyek azok az alapvető sajátosságai a UKMARC-nak, amelyek nem szerepelnek a USMARC-ban, mint ahogy ilyen felmérés a USMARC és a kanadai CANMARC között már évekkel ezelőtt elkészült. A besorolási adatok területén meglévő problémák és az ennek kiküszöbölésére indított program (Name Authority Cooperative Programm, NACO) keretében végzett több évi egyeztetés vezettek oda, hogy a közelmúltban a két könyvtár megállapodást írt alá katalogizálási politikájuk közelítéséről, valamint közös angol-amerikai besorolási adatok állománya (Anglo-American Authority File, AAAF) építéséről.4   MARC-formátumaik harmonizációjának eredményeképpen különösen a tárgyszavak egységes kezelésének területén várható ugrásszerű változás. Újabb MARC-formátumot nem szándékoznak létrehozni, de a fenti közös erőfeszítések után sokkal eredményesebben vehetnek át egymástól rekordokat.

A szabványok általában – ha könyvtári szabvány, akkor szinte természetszerűen – alternatívákat tartalmazna k, amelyek között választani lehet; a választást „házi” szabályzatban rögzítik, hogy legalább egy-egy alkalmazáson belül következetesség legyen (lehessen). Minél több könyvtári alkalmazás „házi” szabályzata egyezik, annál könnyebb köztük az adatcsere.

A konverzióról általában

Az országonként eltérő könyvtári szabványok követelményeinek és a „helyi” működési környezet talaján szükségszerűen (és jogosan) létrejött MARC-formátumok sokasága és az adatcsere iránti rohamosan növekvő igény miatt az egyik rendszerről a másikra való konverzió lett napjaink egyik legnagyobb problémája, eltekintve most a nyelvi nehézségektől. A számos kifejlesztett konverziós program hátránya, hogy mindegyik csak egy speciális MARC-formátumról egy másik speciális MARC-formátumra (pl. OCLCMARC-ról HUNMARC-ra) konvertál, komoly programozási gyakorlatot igényel a legapróbb módosítás vagy kiegészítés beépítése, és a fordított irányú adatcserénél (pl. HUNMARC-ról OCLC-MARC-ra) pedig megint kezdődik az egész elölről, új programot kell készíteni.

A gazdaságilag hatékonynak egyáltalán nem nevezhető helyzet késztetett arra, hogy az Európai Unió Könyvtári Programján belül kifejlesszék a UseMARCON-t .5 A felhasználó irányította általános MARC átalakító (User Controlled Generic MARC Converter) egy eszköz, egy olyan programrendszer, amely bármely MARG-formátumról bármely MARC-formátumra konvertálja a bibliográfiai rekordokat. Mind az input, mind az output formátumnak természetesen ISO 2709 kompatibilisnek kell lennie. A program az UNIMARC-formátumot használja mintegy belső kapcsolóként. Táblavezérelt, az átalakítás szabályát mind az input, mind az output oldal minden egyes adatelemének minden egyes jellemzőjéről (ismétlődés, kötelezőség) külön-külön meghatározza. Magában foglalja a kódolt adatok (pl. országkód, intellektuális szint) megfeleltetésének táblázatait. Mivel a különböző MARC-formátumok különböző karakterkészletek alkalmazását teszik lehetővé, a UseMARCON szoftver része az input rendszerben használatos egyes karakterkódoknak az output rendszerben létrehozandó megfelelőjét tartalmazó táblázat is. Szintaktikai ellenőrző programok felügyelik az adatszerkezet, a tartalomjelölők és átalakítási szabályaik, a kódolt adatok, a karakterek érvényességét.

A UseMARCON-t mind MS Windows (3.1 x és `95), mind Unix Motif környezetre kifejlesztették. Működhet lépésről-lépésre, párbeszédes vagy batch üzemmódban. Nem kíván programozói ismereteket. A könyvtáros maga ellenőrizheti, illetve irányíthatja a rekordkonverziót, szükség esetén a helyi igényeknek megfelelően szerkesztheti a konverziós táblázatokat. Természetesen a konverziós táblázatok felhasználói paraméterezése maximális hozzáértést kívánó, nehéz és időigényes munka lesz még a várhatóan nagyon felhasználóbarát környezetben is, megköveteli a forrás és a cél MARC-formátum igen alapos, apró részletekbe menő ismeretét.

A UseMARCON project 1994 februárjában kezdődött, a kifejlesztett szoftver tesztelése napjainkban fejeződik be, terjesztéséről 1997 elején lehet bővebbet megtudni.6

HUNMARC– USMARC összevetés

Az érvényes magyar könyvtári szabványok előírásainak figyelembevételével készült „HUNMARC : a bibliográfiai rekordok adatcsere formátuma” c. kiadvány 1994-ben jelent meg. Az Országos Széchényi Könyvtár a hazai impresszum számítógépes rekordjainak szolgáltatását ezzel egyidejűleg kezdte meg HUNMARC-formátumban („Magyar Nemzeti Bibliográfia Könyvek CDROM adatbázisa”, majd 1996-tól „Magyar nemzeti bibliográfia. Könyvek bibliográfiája” félhavi füzetei hajlékony mágneslemezen). A nemzeti könyvtár mindig teljességre törekedett az adatfelvétel szintjén, a részletes szerkezetből könnyen alakítható a felhasználó, a rekordot fogadó, letöltő igényeinek, illetve adottságainak megfelelő szerkezet.* Az előző fejezetben említett konverziós táblázat kitöltéséhez is elengedhetetlen, hogy az adott két formátumot módszeresen összehasonlítsuk, számba vegyük az egyezőségeket és a különbözőségeket. A továbbiakban a HUNMARC és a USMARC-formátum között tesszük meg ezt nagy vonalakba n, egyáltalán nem modellértékűként, inkább a HUNMARC-formátum használatával kapcsolatban felmerült felhasználói kérdések alapján.

1. Néhány, a HUNMARC-ban nem alkalmazott USMARC-mező:

A nem alkalmazott USMARC-mezőket illetően a következőket bocsátjuk előre: a HUNMARC előkészítés alatt álló második kiadása további adatelemeket és egyéb dokumentumtípusra jellemző adatelemeket is fog tartalmazni. Az állományi adatokra vonatkozóak kivételével az alábbiak már csak ezért sem különösebben jelentősek és csak a tájékoztatás érdekében említünk néhányat a felhasználói észrevételek közül:

066 Character Sets Present – Ez a mező eleve nem kötelező, feladata, hogy figyelmeztessen, ha más karakterkészletet alkalmaznának, mint az ASCII , az ANSEL stb. szerinti. A hazai gyakorlat szempontjából felesleges, és erre vonatkozóan a HUNMARC előszavában található útmutatás: „… az alkalmazott karakterkészletet illetően a cserében résztvevő felek megállapodása szükséges”.

654 Subject Added Entry– Faceted Topical Terms – a kihagyás indoka: Magyarországon nincs fazettás osztályozási rendszer

850 Holding Institution – A 850-es mező állományi adatot tartalmazna. Ilyent eleve nem tartalmaz a HUNMARC első kiadása, és az előszóban ez pontosan szerepel is: „Nem terjed ki az állományi adatok közlésére.” Mindenesetre amennyiben fölvesszük a 850-es mezőt, feltétlenül fel kell vennünk az adatcsere-formátumba a „852 Location” mezőt is, de akkor már nem árt gondoskodni a többi, a bibliográfiai rekordba ágyazható állományi adatra vonatkozó mező formátumba illesztéséről sem (853, 854, 855, 863, … 866 … stb.). Nem feltétlenül jelent megoldást egy-két újabb mező felvétele. Minden esetben az esetleg láncszerű következményekkel is számolni kell.

Természetesen a 856 Electronic Location and Access és főleg a 886 Foreign MARC Information Field mezők feltétlenül szerepelni fognak a következő kiadásban.

2. Néhány, a USMARC-ban nem szereplő HUNMARC-mező:

Az 588 Megjegyzés a fizikai jellemzőkről azért került bele a HUNMARC-ba, mert a bibliográfiai leírás adatcsoportjaira tehető megjegyzések közül ez az egy– különös módon– hiányzik a USMARC-ból. (Lásd még MSZ 3424/1 „Bibliográfiai leírás. Könyvek” szabvány 4.6.2. A leírás adatcsoportjaival illetve adatelemeivel kapcsolatos megjegyzések )

741 Párhuzamos cím, 742 Egyéb címváltozat, 743 Borítócím, 744 Előzménycím/Korábbi cím, 745 Folytatáscím – Ezek, az információkeresésben különösen fontos adatok a USMARC 246-os mezőjében szerepelnek. A USMARC 1991-es (kiegészítőkkel ellátott) kiadása szerint azonban csak időszaki kiadványok leírása esetén alkalmazhatták, noha könyvnek is lehet például párhuzamos címe, hát még borítócíme, ami igazán inkább erre a dokumentumtípusra jellemző. Nagyobb probléma az, hogy a 246-os mezőben nincs lehetőség rendezésből kihagyandó karakterek számának jelölésére, ugyanis az indikátorpozíció a különböző típusú címek jelölésére szolgál. Nyilvánvaló, hogy mindegyik említett címtípusban előfordulhat címkezdő névelő. A probléma szempontjából tehát hiába szűnt meg a USMARC legújabb kiadása szerint a dokumentumtípusonkénti alkalmazás. Logikailag is a 740 További cím „közelében” van a helyük a felsorolt címtípusoknak, szerkezetük (indikátoraik, almezőik) ezzel analóg.

3. A USMARC egy, a HUNMARC két (vagy több) adatelemben tartalmazza ugyanazt

Itt a HUNMARC egyik legjellemzőbb tulajdonságával, az adatelemek szintjén a hazai szabványoknak és a nemzetközi előírásoknak megfelelő, elengedhetetlen részletezettségével találkozunk. A részletes szerkezetből mindig kialakítható az egyszerűbb, de semmilyen adatcsere-formátummal sem lehet automatizáltan megoldani az adatcserét, ha a küldő adatai összevontabbak, mint a fogadóé. Vagyis HUNMARC-ból USMARC-ba való konvertáláskor nincs probléma, összevonjuk az adatelemeket, de a fordított irányú konverziónál mindenképpen szabványellenes adatot kapunk.

Legjellemzőbb, s a mindennapi gyakorlatban lépten-nyomon előforduló példa erre a 100, 600, 700, 870 hívójelű személynév mezőkben a vezetéknév – egyéni név szerkezetű besorolási adat, ami a USMARC-ban egyetlen $a almezőbe, a HUNMARC-ban pedig $a és $j almezőkbe kerül.

Nézzük meg Robert Burns nevének kódolását (eltekintve most a további adatelemektől):

 

Rendkívül fontosnak tartjuk a besorolási adat rendszó, egyéb elem, kiegészítő részének egyértelmű jelölését, aminek igazolásául egy kicsit hosszabban idézünk az MSZ 3440/2 „A bibliográfiai leírás besorolási adatai. Személyek nevei” szabványból: „1.5. Az egységesített név elemeit mindig azonos sorrendben kell leírni. A név rendszónak minősülő elemét (elemeinek együttesét) a besorolási adat első elemeként (elemeiként) kell leírni. A rendszónak minősített elemet (elemeket) a név további elemeitől tipográfiailag vagy más módon (például: aláhúzással) meg kell különbőztetni. … Ha az egységesített névben a névelemek sorrendje a személy névhasználatától eltér, a sorrendcserét jelölni kell (Id. 1.11.).”  „ 1.11. A besorolási adatban a személynevet az alábbi írásjelekkel kell kiegészíteni:

– ha a besorolási adatban a névelemek sorrendje a személy névhasználatától eltér (ld. 1.5.), a sorrendcserét a hátravetett névelemet (a hátravetett névelemek közül az első névelemet) megelőző vesszővel (,) kell jelölni;

– többszörös sorrendcsere esetén minden egyes sorrendcserét az előírt módon jelölni kell;”

A USMARC-ban a fenti szerkezetű besorolási adat esetében nincs lehetőség a rendszó és az egyéb elem megkülönböztetésére. A leggyakoribb előfordulást figyelembe véve feltételezhetjük, hogy a USMARC-ban minden rendszó értékű részt vesszővel zárnak le, s a konvertáló programba ezt beépítve az esetek többségében szabványos eredményt kapunk. Arany János esetében azonban már nem ez a helyzet.

 

Ha a címleíró, legyen az akár amerikai, akár holland (ők használnak például csereformátumként USMARC-ot) helyesen, szabványosan veszi fel az adatot, akkor például a magyar és a japán személynevek esetében a rendszó értékű részt nem zárja le vesszővel (lásd Names of persons: national usages for entry in catalogues) . A formátum nem írja, nem írhatja át a könyvtári szabályokat!

Megjegyezzük, hogy a UKMARC-formátumban is két, $a és $h almezőbe kerülnek a tárgyalt adatelemek ($aBurns$hRobert és $aArany$hJános), ennélfogva a minősítés nem szenved csorbát, a rendszót megkülönbözteti az egyéb névelemtől, „csak” az automatikus központozás eredményez Arany János esetében nem szabványos névformát.

További példaként említendő a 245 Cím és szerzőségi közlés mező szerzőségi közlés adatelemének részletezettsége a HUNMARC-ban, ahol a USMARC egyetlen $c almezőjének $c (első elsődleges szerzőségi közlés), $e (második és minden további elsődleges …), $i (első másodlagos …), $I (második és minden további másodlagos …), $H (párhuzamos első elsődleges …), $E (párhuzamos második …), $I és $L almezőkre való bontásával a teljesen automatikus központozás oldódott meg, valamint annak a lehetősége, hogy a közművelődési központi katalóguscédulákon ne szerepeljen másodlagos szerzőségi közlés.

4. Indikátorok eltérő értelmezése, illetve használata

A USMARC-ban a 100-as hívójelű mező (Személynév– főtétel) második indikátorá nak lehet 1-es értéke is. Erről már az 1989-es USMARC kézikönyvben szerepelt, hogy elavult, a kurrens rekordok nem tartalmazzák ezt az indikátorértéket, amely azt fejezi ki, hogy a főtétel (első besorolási adata) egyben a mű tárgya is, ennélfogva a tárgyi melléktételt elhagyják. A tárgyi melléktétel elhagyásának gyakorlatát, ha az azonos volt a főtétellel, általában nem alkalmazták, mint azt a USMARC kézikönyv megjegyzésben közli. A hazai gyakorlatban is független a tárgyi melléktételek felvétele, az említett indikátorérték HUNMARC-ból való kimaradásának oka nyilvánvaló.

A 245-ös mező (Cím és szerzőségi közlés) első indikátorának értékeiről sem fordítva rendelkezi k a HUNMARC, mint a USMARC– mint azt sokan hozzászólásukban kifogásolják -, hanem pozitív megfogalmazásban. Nem azt mondja, hogy nem melléktétel, hanem kimondja, hogy főtétel; szabatosan fogalmazva: a főtétel első besorolási adata a 245-ös mező megfelelő almezője, almezői (v.ö. MSZ 3423 `Leíró katalógusok bibliográfiai tételeinek szerkesztése’ szabványcsalád) .

A 110, 610 és 710-es mezőkben (Testületi név) az első indikátor 1-es értéké nek értelmezése nem eltérő: a „jurisdiction name” megfelelője a magyar szabvány szerint (MSZ 3440/383 A bibliográfiai leírás besorolási adatai. Testületek neve 3. szakasz): „államhatalmi és államigazgatási szervek egységesített neve”.

5. Központozási eltérés

A két – USMARC és HUNMARC – formátum közötti konverzió egyik legtöbb nehézséget okozó, de számunkra égetően fontos kérdése, hogy az USMARC-formátumban az adattartalom részének tekintik a központozási jeleket, ráadásul a rekord bibliográfiai leírás részében az ISBD-k előírásaitól (MSZ 3424 szabványcsalád) eltérően az adatelemet megelőző adatelem tartalmának végén helyezik el a következő adatelemet a szabványok szerint megelőző központozási jelet, ami így erősen előfordulás függővé teszi a központozási jel bevitelét, ráadásul megfosztja a rekordot fogadó, felhasználó intézményt annak a lehetőségétől, hogy bizonyos adatelemeket ne vegyen át a saját adatbázisába (v.ö. például egyszerűsített leírás).

Nézzük az alábbi két példát a USMARC kézikönyvből:

 

 Az első példába n a $b almezőben lévő alcímet megelőző szóköz kettőspont, míg a másodikban a $c almezőben lévő (első) szerzőségi közlést megelőző szóköz dőltvonal szerepel az $a almezőben lévő főcím végén. (HUNMARC-ban egyik esetben sem tartalmazna központozási jelet a mező: 245 10$aPrivate eyeballs$ba golden treasury és 245 04$aThe plays of Oscar Wilde$cAlain Bird.)

A 020-as (ISBN) mező „a” almezőjé nek központozásához a következőket szeretnénk megjegyezni: A régi ISBN szabvány** szerint: „Az ISBN számcsoportjait szóközzel kell elválasztani”. Az új ISBN szabvány*** szerint pedig: „A részeket szóközzel vagy kötőjellel kell elkülöníteni (elválasztani)”. A USMARC kézikönyv az input megállapodások között ismerteti, hogy jóllehet a szabvány szerint kötőjellel vagy szóközzel kell megjeleníteni az ISBN-t, az USMARC rekordban ezek egyike sem szerepel, az adott rendszertől függ, hogy melyiket generálja a számcsoportok közé. Azt az algoritmust pedig, amely megszabja, hogy hova kell betenni a kötőjelet vagy a szóközt, az Egyesült Államok ISBN központjától (Standard Book Numbering Agency, New York …) lehet beszerezni. A HUNMARC leírásban erre vonatkozóan nem szerepel külön előírás, az érvényes szabványt követve mindenképpen helyes ISBN szám kerül a rekordba.

6. Ugyanazon hívójel/almező eltérő tartalommal:

630-as $z almező (egységesített cím – tárgyi melléktétel USMARC-ban hely alosztás almező, HUNMARC-ban pedig generikus címhez járuló, a műre/időszaki kiadványra legjellemzőbb személy vagy közreadó testület neve kiegészítő almező) – A HUNMARC 2. kiadásában javításra kerül, hogy a „z” almező ne az egységesített címeknél (130, 240, 730-as mezők) használt almezőkkel harmonizáljon, hanem a tárgyszavak almezőivel.

A 700, 710, 711-es mező k (Személy-, Testületi, Rendezvénynév– további) „x” almező jét a USMARC kézikönyv szerint a Library of Congress sem alkalmazza, ugyanis ez az almező a név/cím mező címrészében felvett sorozatcím ISSN-jét tartalmazza. Ezt a nagyon zavaros fogalmat szerencsére nálunk már jó 20 éve sikerült tisztázni, mármint az ISBN/ISSN adás és a feldolgozás szempontjából. Ezért bátran alkalmaztuk a MAMARC**** -ban 1978 óta használt almezőazonosítót a közreműköd és jellege felvételére, ráadásul a UNIMARC-ban is „x” almezőbe került annak idején a közreműködés jellege (most a „4” -es almezőben van, ugyanis a kapcsolatjelölő almezők számazonosítójúak a UNIMARC-ban).

Befejezésül: konverziókor csak akkor szabad az egyik MARC adott hívójelű mezőjéből a másik MARC adott hívójelű mezőjébe áttenni az adatot, ha a megfelelő hívójellel ellátott mezők jelentéstartalma teljes egészében megfelel egymásnak. A HUNMARC – USMARC konverziókor felmerül a probléma, hogy mit kezdjünk pl. a HUNMARC 742-es mezőjével, amelynek nincs adekvát megfelelője a USMARC-formátumban. A lehetséges megoldások közül (nem konvertáljuk az adatot, betesszük valami olyan mezőbe, amibe „minden belefér”, például az 500-as hívójelű Általános megjegyzések mezőbe) mindig az adott alkalmazás igényeinek megfelelően ajánlatos választani.

Irodalom

ISO 2709-1981 Format for bibliographic information interchange on magnetic tape
MSZ 1993/1-1983 A mágnesszalagos bibliográfiai adatcsere formátuma. A rekordok szerkezete
UNIMARC manual : bibliographic format / International Federation of Library Associations and Institutions, IFLA Universal Bibliographic Control and International MARC Programme, Deutsche Bibliothek.– 2. ed.– München [etc.J : Saur, 1994.– (UBCIM publications ; N.s., Vol. 14.).– Cserélhető lapokkal
USMARC format for bibliographic data : including guidelines for content designation / prep. by Network Development and MARC Standards Office.– Washington Library of Congress Cataloging Distribution Service, 1988.– Kiegészítőkkel.– Cserélhető lapokkal
USMARC format for bibliographic data : including guidelines for content designation / prep. by Network Development and MARC Standards Office.– Update No. 2. 1996.– Washington : Library of Congress Cataloging Distribution Service, 1994.– Cserélhető lapokkal
USMARC format for holdings data : including guidelines for content designation / prep. by Network Development and MARC Standards Office.– Update No. 2. July
1994.– Washington : Cataloging Distribution Service Library of Congress, 1989.– Cserélhető lapokkal HUNMARC : a bibliográfiai rekordok adatcsere formátuma I [összeáll. Sipos Márta] ; [kész. az Országos Széchényi Könyvtár Fejlesztési Osztályán].– Budapest OSZK, 1994.– 129 p.
CAMPOS, Fernanda M.– LOPES, M. Ines– GALVAO, Rosa M.: MARC formats and their use : an overview. In: Program, vol. 29. no. 4. October 1995, pp. 445-459.

WILLER, Mirna: A szabványosítás szükségessége a géppel olvasható katalogizálásban. In: Könyvtári Figyelő, 4. (40. ) 1994/1, pp . 42-48 .

VAJDA Erik: A csereformátumokról. In: Könyvtári Figyelő, 4. (40.) 1994/1, pp. 35-41.

British Library and Library of Congress sign cataloguing agreement. In: Public library journal, Vol. 11. No. 5. 1996, pp. 147-148.

UseMARCON : User controlled generic MARC converter. Technical description– July 1996

WILSON, Neil: UseMARCON : progress towards a generic MARC record conversion system. In: Select l The British Library, issue 18. Winter 1996, pp. 4.

 
* Erről a kérdésről részletesebben a Könyvtári Figyelő 1995/2. számában megjelent tanulmányában írt az OSZK Fejlesztési Osztály.

** MSZ 3563-80 Könyvek nemzetközi azonosító száma (ISBN) .

*** MSZ ISO 2108: 1994 Információ és dokumentáció. Könyvek nemzetközi azonosító számozása (ISBN)

****A MAMARC a Magyar Nemzeti Bibliográfia Könyvek Adatbázisában 1992-ig alkalmazott formátum.

 

Kategória: 1997. 1. szám | A közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!