A csereformátumokról

(Alapozás és kiegészítések Mirna Willer: A szabványosítás szükségessége a géppel olvasható katalogizálásban c. cikkéhez)

Bevezető szerzői magyarázkodás

A vaksors (vagy inkább a szaksors) úgy hozta, hogy amikor a Magyar Könyvtárosok Egyesülete Műszaki Könyvtáros Szekciója felkért, hogy tartsak előadást a csereformátumokról, és amikor a Könyvtári Figyelő szerkesztője hozzájárulásomat kérte az előadás szövegének közléséhez, akkor már beérkezett a KF szerkesztőségéhez CCF munkacsoportbeli kiváló kolléganőm és barátom, Mirna Willer fent említett cikkének1 angol nyelvű kézirata.
Bár az ismétlés a tudás anyja, ezúttal ez mégsem látszott célszerűnek, és ezért meg kellett vizsgálni, hogy érdemes-e, és ha igen, mit érdemes

  • előadásom tartalmából közölni. Az elemzés azzal az eredménnyel járt, hogy előadásom didaktikusabb, mint M. W-é, vagyis olyan fogalmakat tisztáz és magyaráz meg, amelyek általános ismertsége hazai könyvtári/tájékoztatási berkeinkben kétségbevonható,
  • olyan témákat is érintettem, amit M. W. cikke – amely elsősorban a MARC formátumokról szól – szükségképpen mellőzött.

Így született, vagy – Bereczky Lászlóval szólva – állt össze ez a cikk, amelynek bibliográfiai kapcsolata M. W. cikkével {lásd az alcímet), gondolom, meglehetősen nagy fejtörést okozna a bibliográfiai kapcsolatok típusait (mondjuk a rekord-kapcsoláskor szükséges típusmegjelölés kódjainak meghatározásához) kategorizálni akaró kollégáknak. Az olvasót viszont – remélem segíti tájékozódásában. Módszertani tanácsom szerint kezdje az én írásommal {aminek első két fejezetét nyugodtan át is lapozhatja, ha mindezt már tudja), majd a harmadik fejezet után olvassa el M. W. cikkét és aztán térjen vissza hozzám.

Mi az, hogy formátum ?

A formátum – esetünkben, vagyis bibliográfiai adatrekordok esetében, a bibliográfiai adatközlés formátuma – megnevezéseket, definíciókat, paramétereket {megengedett, illetve előírt értékeket) tartalmazó szabályrendszer, amely lehetővé teszi, hogy a számítógép szoftverje felismerhesse a bevitt, feldolgozandó, tárolandó és megjelenítendő adatokat. A formátum lehet adatbeviteli, feldolgozási, megjelenítési és csereformátum.
Az adatbeviteli (input) formátumot az teszi szükségessé, hogy az adatokat már bevitelükkor is a szoftver által felismerhető formában kell rögzíteni, bár – és ezt itt jegyezzük meg, de minden formátumra vonatkozik – a formátum olyan szabályokat is tartalmaz, amelyek valójában a közlendő adatok körére és közlésük módjára vonatkoznak, tehát – bibliográfiai rekordok esetében voltaképpen katalogizálási előírások. Az adatbeviteli formátum lényegében egy űrlap, vagy munkalap, a hozzá tartozó magyarázatokkal együtt, jóllehet az űrlap szót nem kell fizikailag konkrétan felfogni, mert ezt a beviendő adatok listája és beviteli előírásai is helyettesíthetik. Az adatbeviteli formátum tartalmában a rendszer céljához – tehát ha úgy tetszik a feldolgozási formátumhoz igazodik, formájában (legalábbis bevallott elvek szerint) igyekszik az adatokat bevivő könyvtáros, vagy egyéb “rabszolga” munkáját könnyíteni és pontosabbá tenni. Az alkalmazói szoftver többféle adatbeviteli formátum alkalmazását is lehetővé teheti.
A feldolgozási (vagy belső) formátum a gépen belül tárolt és kezelt adatok körének meghatározására, egyértelmű megjelölésére, kezelésük módjának rögzítésére szolgál. Az alkalmazói szoftvertől függ, hogy a használónak milyen ,;beleszólása” van a feldolgozási formátumba, jóllehet ma már ritkák a kulcsrakész, de merev, minden paramétert előre meghatározó, zárt jellegű formátumok. A felhasználónak tehát különböző mértékű lehetőségei, és egyben kötelezettségei vannak a feldolgozási formátum meghatározásában, aminek gyakorlati minimuma az adatelemek körének meghatározása. Aki azonban már hozott létre adatbázist, az tudja, hogy – pl. a CDS/ISIS mezőmeghatározó táblájának (field definition table) elkészítésekor – ennél lényegesen többet határoz meg.
A megjelenítési formátum (a szoftverek készítői gyakran csak ezt nevezik formátumnak, pl. CDS/ISIS, ALEPH) a tárolt adatok közül megjelenítendő adatok körét, sorrendjét, elhelyezését, központozását, esetleges állandó, vagy feltételes kísérő szövegeit, jeleit, vagyis a képernyőn láthatóvá tett, illetve kinyomtatható rekordok (tételek) képét határozza meg. Egy-egy adatbázishoz többféle megjelenítési formátum tartozhat (és többnyire tartozik is) a különféle használók különféle igényeinek kielégítése végett.
Végül a csereformátumokról csak annyit (hiszen erről szól e cikk), hogy – a megjelenítési formátumokhoz hasonlóan – ezek is kommunikációs (output) formátumok, de egyfelől esetükben nem képernyő, vagy nyomtatás útján, hanem géppel olvasható formában történik a kommunikáció, másfelől e kommunikáció címzettei más, számítógépes könyvtári és rokonterületi számítógépes rendszerek.

2. A formátumok elemei

Minden formátumnak – kérem fogadják el a felosztás önkényét, hiszen ezek az “elemek” is alárendelhető elemekből állnak – két, eltérő rendeltetésű és jellegű eleme (és további egy kiegészítő eleme) van.
Mielőtt ezek ismertetéséhez fognánk, a rend kedvéért tisztázzunk egy általánosan ismert, de gyakran pontatlanul értelmezett fogalmat, az adatelem fogalmát. E témakör szövegkörnyezetében az adatelem a rendszer (a szoftver) által egységként kezelt legkisebb karaktersor. (A szoftver az ezen az egységen belüli karaktereket már csak speciális célokra “bontja” tovább, és kezeli elkülönítetten, mint pl. akkor, amikor szavakból álló keresőfájlokhoz készít ott adatelemként viselkedő kisebb elemeket.) Az adatelemeket természetesen a formátum is elkülöníti, méghozzá hívójelekkel megjelölt mezőkben és – esetleg almező azonosítókkal megjelölt almezőkben, amelyek egymástól még a sajátos alkalmazási célt jelző indikátorokkal megjelölve is eltérhetnek. Más szóval, egy adott hívójellel megjelölt mező és – esetleg – almezőazonosítóval megjelölt almező, adott indikátorral megjelölt változatának tartalma egy adatelem. Ezért nevezik a hívójel, az esetleges almezőazonosító és az esetleges indikátor együttesét tartalmi azonosítónak (content designator). A mezők – mint ismeretes – rekordokat alkotnak, egy-egy rekord pedig – a legyakrabban használt bibliográfiai csereformátumok esetében – a rekordfejből, a mutatóból és az adatmezőkből, valamint a rekordhatároló jelből áll.
A formátumnak felismerhetővé kell tennie a szoftver számára, hogy az egyes rekordok, ezen belül pedig az egyes adatelemek hogyan különböztethetők meg és hogy találhatók meg. Erre különféle eszközök szolgálhatnak. A legkezdetlegesebb megoldás szerint a formátum egységesen rögzíti a rekordok és azon belül a mezők hosszát. Ezáltal a mezők elkülöníthetővé válnak, tartalmukat pedig sorrendjükkel lehet meghatározni. A korszerű formátumok ettől eltérnek, és változó (előre meg nem határozott) hosszúságú rekordokat, illetve mezőket tartalmaznak. Ennek megfelelően bonyolultabb “megjelölő eszközöket” (egyebek között a fent említett tartalmi azonosítókat) kell alkalmazniuk.
Azok az információk, amelyek lehetővé teszik a rekord és a mezők, illetve almezők és indikátorok felismerését a rekordfejben (más néven rekordcímkében) helyezkednek el. Ezek az információk – amelyek a rekordfej fix hosszúságú részeinek pozíciójához kötöttek – pl. megmutatják, hogy a rekordban milyen határolójeleket használnak, milyen hosszúságúak az almezőazonosítók és indikátorok, milyen a mutató elemeinek szerkezete. A rekordfej tartalmaz emellett a rekord jellegére, tartalmára és konkrét szerkezetére vonatkozó információkat is. A rekord mutatója már az adott rekord adatmezőinek azonosítását, keresését segíti, az adatmezők – határoló elemeik, almező azonosítóik és indikátoruk mellett – a bibliográfiai információkat tartalmazzák.
A formátumnak az az eleme, amely a rekordfej, a mutató és az adatmezők szerkezetét, részeit és ezek rendeltetését határozza meg, a formátum szintaxisa (struktúrája). Ez a szintaxis mint említettük – független a rekord tartalmától, így természetesen azoktól a szabályoktól is, amelyek szerint a rekord tartalmát meg kell választani és amilyen formában e tartalmat le kell írni, vagyis a struktúra független – esetünkben – a katalogizálási és kapcsolódó bibliográfiai adatközlési szabályoktól.
Az IS0 2709-1981 sz. nemzetközi szabvány2 és magyar megfelelője, az MSZ 193/1-19833 a bibliográfiai információcsere formátumaként a formátum szintaxisát határozza meg. A szintaxisnak a tartalomtól független használhatósága magyarázza az ISO 2709 sikerét: a csereformátumok többsége erre épül (mégpedig nem csak azért, mert – lásd M.W. cikkét – a formátumok jórészt MARC-alapúak, az IS0 2709 “nagyanyja” pedig az USMARC szintaxisa volt). E siker következménye, hogy a legtöbb könyvtári alkalmazói szoftver képes ISO 2709 szintaxisú rekordokat importálni.
A formátumok másik eleme – amit a formátum szemantikájának nevezhetünk és neveztünk is a néhai szocialista országok néhai szabványosítási együttműködése keretében – a formátum tartalmi kereteit (nem tartalmát, hiszen ez a mindenkori leírt dokumentumtól függ) határozza meg, azáltal, hogy felsorolja a kötelezően közlendő, vagy a közölhető adatelemeket, megállapítva természetes nyelvű nevüket, “gépi nevüket”, vagyis tartalmi azonosítójukat, valamint fogalmukat, kötelezőségi státusukat, ismételhető, vagy nem ismételhető voltukat, továbbá – közvetlenül, vagy katalogizálási szabályokra hivatkozva – közlésük módját (ide értve azon adatelemek esetében, amelyeket kódolva kell közölni, a kódkészletet és feloldását is). E “szemantikát” nevezhetjük az adatelemek adattárának is. Aligha nehéz belátni, hogy itt már nehezebb a szabványosítás, mert – nemzetek, kultúrák és iskolák szerint, de a könyvtárak és tájékoztatási intézmények funkcióadta igényei miatt is – majdhogynem ahány rendszer, annyi formátum. Ezért aztán a több rendszert érintő csereformátumok mindenképpen kompromisszumokra kényszerülnek a szemantikát illetően.
A formátum szintaxisa és szemantikája önmagában még nem elégséges az adott formátumban közölt rekordok kezeléséhez. Ehhez még ismerni kell a kódolt jelkészletet is, amit az adott formátumban rögzített rekordokban használnak. Magát a jelkészlet azonosító megnevezését a rekord tartalma, vagy a fájl címkéje megadhatja, de ez még nem elégséges. Ezért tekinthető – feltételesen – a formátumokhoz nem tartozó jelkészlet a formátum harmadik elemének.

3. Csereformátumok szükségessége

E cikk keretében nem szorul bizonyításra, hogy a korszerű információs világ az információk cseréjének és kölcsönös hasznosításának, a rendszerek összekapcsolásának, a hálózatoknak a világa. Másfelől a fentiekből következő, és egyébként is ismert tény, hogy az egyes könyvtárak, információs rendszerek meghatározó belső formátumai elütőek. Ehhez járul még, hogy a különböző könyvtárak eltérő alkalmazói szoftvereket használnak, (ha nem is mindenütt érik el az egy könyvtárra jutó alkalmazói szoftverek számának magyarországi, kiemelkedő értékét, vagyis – legalábbis szoftver-lobbyjaink által – dédelgetett szoftver-heterogenitásunkat, finomabban sokszínűségünket). A szoftverek eltérése szintén a formátumok különbségére vezet. Ez azt jelenti, hogy még optimális esetben is (az abszolút gátló tényezőkről utóbb lesz szó) a rendszerek közötti adatcsere konverziót igényel, kedvező esetekben számítástechnikai eszközökkel megvalósítható konverziót. Az adatcsere gyakorlata aránylag gyorsan vezetett két felismerésre, nevezetesen arra, hogy

  • a belső, és ebből adódóan az input-formátumok olyan közelítése, amely a konverziót szükségtelenné tenné, nem oldható és nem is oldandó meg, de
  • a konverziós erőfeszítések és ráfordítások csökkentendők lennének, csereformátumok útján.

Ha feltételezzük, hogy egy adatcserét lebonyolító könyvtári együttesnek öt tagja van, és mindegyiküknek eltérő saját formátuma van, akkor a teljes körű adatcseréhez mindegyik könyvtárnak négy konverziós programot kell készítenie, a másik négy könyvtár által adott adatok használatához (vagy ha az ügy iránti őszinte odaadást tételezünk fel, akkor saját formátumának mind a négy cserepartnerének formátumára való konverziójához, ami ugyanannyi programot jelent). Öt könyvtár esetében ez 20 konverziós program, általánosítva, X könyvtár esetében X(X-1) konverziós program. Ha azonban létezne egy közösen elfogadott csereformátum, akkor mindenkinek csak két konverziós programra (sajátjáról a csereformátumra és a csereformátumról a sajátjára) lenne szüksége, tehát az öt könyvtárnak 10 programra (X.2). Minél nagyobb a könyvtárak száma, annál inkább nő ez a különbség: nyolc könyvtár esetében az első variáns maximálisan 56, a második maximálisan 16 konverziós programot igényel.
Ilyen egyszerűen, a konverziós programok számának csökkenthetőségével bizonyítható a csereformátum (elvileg optimálisan egyetlen csereformátum) szükségessége. Emellett egy általános csereformátum (legalábbis szemantikájában) befolyásolhatja, közelebb hozhatja, adott körön belül akár egységesítheti is az érdekeltek saját formátumait.
A csereformátumnak – a fentiekből adódóan – a leggyakoribb alkalmazásokhoz kell alkalmazkodnia, illetve lehetővé kell tennie egymást nem szükségképpen kizáró variánsok rögzítését. Az első cél viszonylag jól elérhető, ha a szemantika a legelterjedtebben használt katalogizálási szabályzat(ok)ra épül (mint teszi pl. az USMARC, vagy a MAB), az utóbbi – kissé ellentmondó – cél viszont minél többféle megoldás befogadását követeli meg (mint a CCF és -korlátozottabb mértékben – az UNIMARC esetében).
A csereformátum valójában szabvány. Következésképpen elvileg egyetlen csereformátum országos, vagy világszerte elterjedt alkalmazása lenne célszerű. Az előbbiek és a gyakorlat utalnak arra, hogy ez a cél legfeljebb megközelíthető.
Ide tartozik még egy félreérthető és egy vitás kérdés lehetőség szerinti tisztázása:
a) A csereformátum nem csodaszer! Semmilyen csereformátum sem oldhatja meg az adatcserét, vagyis a kapott adatok gépi konverzióját és hasznosítását, ha az adatelemek adattára úgy tér el, hogy
- a fogadónak olyan adat kellene, amit a küldő nem dolgoz fel,
- a küldő (és a csereformátum) adatai összevontabbak mint a fogadóé,
- ha az adatelemek közlésmód-szabályai eltérőek a küldőnél és a fogadónál.
Ilyenkor csak a megalkuvás és/vagy a kapott rekordok intellektuális%manuális szerkesztése segít!
b) Sokan úgy vélik, hogy az online adatcsere, pontosabban egymás adataihoz való online hozzáférés korszakában az adatcsere problémája elavult. Ebben van némi igazság, de csak igen korlátozottan, mert a sok adatbázisban online kereső használónak a különböző körű, és igen korlátozottan szabványosított adatokban való eligazodás nehézségeket jelent, vagyis az adatcsere, vagy legalább az elterjedt formátumok egységesítő hatása nem mellőzhető. Maradéktalanul igaz viszont ez a feltételezés (mert vagy feleslegessé válik; vagy igen egyszerű az adatcsere) olyan zárt hálózatokon belül, ahol
- azonos az alkalmazói szoftver,
- azonos az adatelemek adattára,
- azonosak a közlésmódra vonatkozó és egyéb szabályok.

4. Kiegészíti történelmi és alkalmazói áttekintés a CCF-ről és a “csereformátum-politikáról”

Olvasóm már gazdagabb a MARC-formátumok és fejlődésük számos ismeretével, és röviden tájékozódott a Common Communication Format-ról (Közös Adatcsere Formátumról, CCF-ről) is, M. W. cikkéből. Az alábbi kiegészítések részben a CCF kialakulását; fejlődését és helyzetét, részben ennek tanulságait illetik.
Az 1978-ban, a szépséges és felejthetetlen Taorminában tartott szimpózium, amelynek célja az volt, hogy tanulmányozza, vajon mennyire kívánatos és lehetséges a létező bibliográfiai adatcsere-formátumok maximális kompatibilitásának megvalósítása, olyan helyzetben kerül sorra, amikor (a hivatkozásokat lásd M. W. cikkében)

  • egy évvel korábban már publikálták az egységes nemzetközi csereformátum igényével fellépő UNIMARC-ot,
  • 1974 óta létezett a szintén nemzetközi használatra szánt UNISIST Reference Manual,
  • további olyan csereformátumok készültek a közelmúlt években, amelyeket nemzetközi használatra szántak, de
    a géppel olvasható bibliográfiai adatok tényleges kommunikációja változatlanul elsősorban nemzetinek hívott, valójában inkább nemzeti könyvtári/nemzeti bibliográfiai, illetve egyes szolgáltatások által kifejlesztett formátumok használatával ment végbe,
  • mind nemzeti, mind nemzetközi keretekben egyre nyilvánvalóbb lett, hogy a szükségletek nem ismerik a nemzeti bibliográfiák közötti, vagy általában a könyvtárközi adatcsere, vagy éppenséggel a referáló és indexelő szakbibliográfiai szolgáltatások közötti adatcsere korlátait, hanem az e “táborok” között is szükséges.

Nem lehet csodálni, hogy lelkesen fogadták a szimpózium ajánlásait4, így azt is, hogy létre kell hozni egyetlen, közösnek nevezett csereformátumot, amely formátumok, vagy akár csereformátumok közötti hídként szolgálhat, és amelynek alapelvei, hogy

  • szintaxisa az ISO 2709 szerinti legyen,
  • kevés számú kötelező adateleme legyen alkalmas a legfontosabb, szabványosan meghatározott bibliográfiai adatokból álló rekordok létrehozására,
  • ezek az adatelemek egészüljenek ki szabványosan meghatározott fakultatív adatelemekkel,
  • szabványos módszert használjon a bibliográfiai szintek és a bibliográfiai tételek, közötti kapcsolatok kifejezésére.

A munka hat kiválasztott nemzetközi formátum elemzésével és egy nagy terjedelmű adatelem-gyűjtemény összeállításával indult. Ennek további elemzésére és az említett szabványos technikák meghatározására épült fel a CCF 1984-ben megjelent első kiadása, amelyet Peter Simmons és Alan Hopkinson szerkesztő munkája hozott létre, de amelynek minden adatelemét és technikáját az egész munkát szervező és finanszírozó Unesco Általános Információs Programja keretében működő CCF munkacsoport (Ad hoc Oroup on the Establishment of a Common Communication Format) vitatta meg és hagyta jóvá Nathalie Dusoulier elnöklete mellett. Bár nem volt jó jel, hogy a munkacsoportból (amelynek – más szakértők mellett – tagjai voltak számos nagy formátum reprezentánsai is) munka közben az utóbbiak közül többen kiváltak, mégis remélni lehetett, hogy a CCF betölti szerepét mint egységes nemzetközi formátum, amely nem szorítja ki a többi formátumot, de azok között hidat képezhet és mindazok rendelkezésére áll, akik nem kötelezték el magukat egyetlen formátum mellett. E szerepre a CCF rugalmassága folytán is alkalmasnak látszik, ugyanis csak minimálisan tartalmaz közlésmód-szabályokat, és változatokat kínál ugyanazon adatelem különböző formájú közléseinek elhelyezésére és megkülönböztetésére. Hasonlóan hat a kötelező adatelemek viszonylag csekély száma és a fakultatív adatelemek széles köre.
Tíz ével első kiadásának5 megjelenése után be kell látni, hogy a várakozások túlzottak voltak. Ennek egyik oka, hogy valamiféle rivalizálás alakult ki az UNIMARC és a CCF között. Az UNIMARC összeállítói – hiába volt az UNIMARC a maga nemzeti könyvtári és nemzeti bibliográfiai indíttatásával érzéketlen a szakkönyvtárak, szakbibliográfiák és a referáló/indexelő szolgáltatások követelményei iránt, mind összetételével, mind a bibliográfiai szintek kezelésével (így az analitikus – cikkrekordok problémáinak megoldatlanságával) – egyetlen nemzetközi formátumként kívánták látni az UNIMARC-ot. Másfelől a nemzeti formátumok használói és a különféle bibliográfiai szolgáltató központok nem mutattak különösebb hajlandóságot egyik nagy nemzetközi formátum használatára sem, eltekintve az UNIMARC M. W. által is említett alternatív használatától a nemzeti MARC formátumok mellett.
A CCF elsősorban a fejlődő országokban és nemzetközi szervezetek körében aratta sikereit, de – jó egy néhány kivétellel – nem csereformátumként, hanem olyan mintaként és referenciagyűjteményként, amire adatbázisok létrehozói építették adatelem-specifikációikat, vagy éppenséggel technikáikat is, másszóval a CCF belső formátumok alapjává vált.
Időközben a CCF a további években több irányban is fejlődött. 1988-ban megjelent második, a tapasztalatok alapján javított kiadása, 1989-ben sor került a CCF-használók első nemzetközi tanácskozására, amelynek ajánlásai nyomán a CCF legújabb kiadása két teljesen kompatibilis részre oszlott, és 1992-ben mint CCF/B, a bibliográfiai információk közlésére szolgáló CCF6 és CCF/F, a faktografikus információk közlésére szolgáló CCF7 jelent meg. E változást a faktografikus információk és a bibliográfiai információk integrált adatbázisokban és ennek nyomán az adatcserében végbementő ötvöződése tette lehetővé. Az immár két részre oszlott CCF sem csak csereformátumként, hanem adatbázisépitéshez is kitűnően használható – ezt e sorok írója saját tapasztalatával is igazolhatja. Megjelent a CCF használati tanácsadója (Implementation notes for users of the Common Communication Format) is, Alan Hopkinson tollából8.
Enyhült az UNIMARC/CCF feszültség is. 1992 júniusában Firenzében UNIMARC/CCF munkaértekezletet (workshop-ot) tartottak a problémák tisztázására (lásd még alább). Az ott elhangzottaknál is nagyobb mértékben járult hozzá az együttműködéshez a Peter Simmons által készített UNIMARC/CCF konvertáló program.

Hogy áll ezek után a csereformátum-politika?

a) a csereformátumok eredeti szerepe és jelentősége vitathatatlanul csökkent az “online környezetben”, de amíg offline adatcsere lesz, – és még belátható ideig lesz -, addig csereformátumokra szükség lesz.
b) Sem az UNIMARC, sem a CCF nem tudott a másik helyére lépni, sem kiszorítani a nemzeti és szolgáltatói kommunikációs formátumokat. Mégis, vitathatatlan vezető szerepük kialakult, és ma már jellemző egymás kiegészítése, és nem az, hogy ki akarnák szorítani egymást (még akkor is, ha a fent említett UNIMARC/CCF Workshopon olyan előadás is elhangzott, nem is akárki, hanem egy, mindkét formátumban érdekelt személy szájából, aminek – egyszerűsített – mondandója az volt, hogy legjobb lenne mindkettőt abbahagyni, és egységesen a USMARC-ot használni). A két formátum különösen az újonnan nemzeti, vagy szolgáltatói formátumot megalkotók számára lehet vonzó, ha Isten és az alkalmazói szoftver is úgy akarja.
c) Előtérbe került a két formátum – főként a CCF – “melléktermék”-hatása, nevezetesen az, hogy belső formátum alapjául alkalmazzák kisebb, vagy nagyobb mértékben adaptált változatát.

5. Hazai berkeinkből

Éber olvasóm figyelmét aligha kerülte el, hogy az ISO 2907 magyar változatának szabványjelzete MSZ 193/1-1983 (kiemelés tőlem, V.E.) Ez a /1 azt jelzi, hogy a /2, illetve esetleg a /x még várat magára, ugyanis ez(ek) a teljes formátumhoz még szükséges “szemantika” szabványa(i) lett(ek) volna. Nem nehéz kitalálni, hogy a folytatás miért nem született meg; nincs megegyezés abban, hogy mit adaptáljunk.
Időközben az Országos Széchényi Könyvtárnak létre kellett hoznia saját kommunikációs formátumát. Bár ez még csak közvetlenül “születés” előtt áll, az “ultrahangos vizsgálatok” elárulják, hogy a “magzat” a USMARC-hoz (tehát korántsem mindenben az UNIMARC-hoz és alig valamiben a CCF-hez) hasonlít, több reális indokkal (a belső formátum adottságai, az alkalmazói szoftver “gusztusa” stb). Úgy vélem, hogy ez nem kifogásolható, akár az sem, hogy az újszülött valószínűleg a HUNMARC nevet kapja. Születésének mindenki örülni fog, és várja a HUNMARC-ban terjesztett központi szolgáltatásokat (hiszen a konverzió szempontjából a legfontosabb mégis csak az ISO 2907-en nyugvó szintaxis).
Mindez azonban nem jelenti azt, hogy e HUNMARC legyen az MSZ 193/2. Személy szerint úgy vélem, hogy formátum-szabványra szükség van. Semmi baj nem történik azonban, ha több változatot enged(nek) a szabvány(ok). Jelöltjeim: a CCF (mind a kettő), az UNIMARC és – esetleg – a HUNMARC, vagy ezek egyszerűsített változatai. A formális szabványt más ajánlások is pótolhatják, a jelzett tartalommal. Ha lehet, mielőbb.

Hivatkozások

1. WILLER, Mirna: Szabványosítási követelmények a géppel olvasható katalogizálásban = Könyvtári Figyelő. 48. évf. 1994. 1. sz. 44-50. p.

2. ISO 2709-1981. Format for bibliographic information inter-change on magnetic tape.

3. MSZ 193/1-1983. A mágnesszalagos bibliográfiai adatcsere formátuma. A rekordok szerkezete.

4. Towards a common bibliographic exchange format? Proceedings of the International Symposium on Bibliographic Exchange Formats, Taormina, Sicilyt 27-29 April 1978: Budapest, CMKDK-Technoinform, London, UNIB I D, 1978:

5. CCF: The Common Communication Format. Edited by Peter Simmons and Alan Hopkinson for the General Information Program and UNISIST. Paris, Unesco, 1984. (PGI-84IWS/4)

6. CCF/B: The Common Communication Format for Bibliographic Information. Edited by Peter Simmons and A1an Hopkinson for the General lnformation Program. Paris, Unesco, 1992. (PGI-92/WS/9)

7. CCF/F: The Common Communication Format for Factua1 Information. Edited by Peter Simmons and Alan Hopkinson for the General Information Program. Paris, Unesco, 1992. (PGi-92-WS/8)

8. HOPKINSON, Alan: Implementation Notes for Users of the Common Communication Format (CCF). Paris, Unesco, 1993. (PGI-90/WS/3)

Kategória: 1994. 1. szám | A közvetlen link.

MINDEN VÉLEMÉNY SZÁMÍT!