„Mi célt is szolgálna mindez a technikai felkészültség,
ha nem tenné számunkra lehetővé a történelem,
az irodalom vagy bármely tudomány jobb megismerését?”
(Jean-Pierre Angrémy)1

A Gallica program előzményei

1988. július 14-én a híresen kultúrált és olvasott Francois Mitterand elnök ünnepi beszédébe szőtte elgondolását a világ legnagyobb, legmodernebb és felépítésében teljesen eredeti könyvtáráról: „Ennek a nagy könyvtárnak az ismeretek minden területét le kell fednie, mindenki rendelkezésére kell állnia, a legmodernebb adatátviteli technikákkal kell rendelkeznie, lehetőséget kell adnia a távoli használatra és kapcsolatban kell állnia más európai nagykönyvtárakkal.”2 Ezzel vette kezdetét a XXI. század igényeit is kielégítő, fáraói léptékű francia nemzeti könyvtár megépítésének ötlete után az újabb nemzeti könyvtári „nagy project,” amelyet a franciák a szakirodalomban éppúgy, mint a köznyelvben sokáig csak „TGB programként” emlegettek.3 A virtuális könyvtár modelljét már évekkel korábban, az új nemzeti könyvtár felépítése és feladatai kapcsán Jacques Attali4 nemcsak felvetette, hanem meg is határozta kritériumait. Egy digitalizált könyvtár ugyanis nemcsak a tudományos ismeretek tárháza, hanem számos más technikai és tartalmi probléma forrása. Így a tartalmi feltárás szintjén az indexálási módszerek kiválasztása, hatékonysága, a metaadatok alkalmazása, a feltárási és szétsugárzási eszközök, az alkalmazott szoftver és hardver eszközök modernsége, teherbírása, az új olvasási szokások kialakítása, ezáltal a „Teaching Library” feladatkörének betörése, mind újabb és újabb megoldásra váró gondot vetítenek elénk. Mert ne feledjük, az új nemzeti könyvtár célul tűzte ki a nemzeti-tudományos és bizonyos mértékig a közművelődési könyvtár feladatkörének ellátását is úgy, hogy technikailag és módszertanilag semmiben se maradjon le az amerikai könyvtárak lehetőségeitől.

A Gallica program

A terv megvalósítására 30 millió francia frankot különítettek el és a „semmiből indulva” kívántak 30 milliónyi lapot digitalizálni – mindezt öt évnél rövidebb idő alatt. A Francia Nemzeti Könyvtár (a továbbiakban BNF) munkatársai Gallica projektnek nevezték el elképzelésüket, melynek eredményét a világhálón 1997 októbere óta láthatjuk. Nem szabad összetévesztenünk azonban a BNF digitalizált gyűjteményeit, OPAC-ját és magát a Gallica webhelyet. Ez utóbbinak tartalma ugyanis csak egy szelete a Francia Nemzeti Könyvtár feldolgozott állományának. Körülbelül egyharmada, az a része, amelyik már nem esik szerzői jogvédelem alá.

A Gallica tehát kísérleti szerverként működik, melynek elsődleges célja az, hogy lehetővé tegye a Francia Nemzeti Könyvtár különféle helyeken lévő digitalizált dokumentumainak elérését. A franciáknak ez a lépése volt az első erőfeszítés ahhoz, hogy nemzetük közgyűjteményeinek kulturális értékét a hálózaton „teljességet idéző válogatásban,” elektronikus formában közkinccsé tegyék mindenki számára. A Gallica életében történetileg eddig három nagy szakasz különíthető el:

Első szakasz: 1992–1997: az első 100 000 kötet és 300 000 kép;

Második szakasz: 1999–2001: a nyomtatott anyag kiegészítése további szerzői korpuszokkal, enciklopédiákkal és a XVII-XIX. századi folyóiratokkal;

Harmadik szakasz: 1999–2002: újabb 20 000 nyomtatott mű és 80 000 fix kép digitalizálása (a Musée de l’Homme, és a Museum National d’Histoire Naturelle anyaga alapján), valamint eddig nem létező irodalomtudományt-történettudományt érintő tematikus részek összeállítása (pl. Voyages en France 2001 márciusában).5

A megvalósításon két csoport dolgozott: az egyik a tudományos-szakmai feladatokkal, a digitalizálásra kerülő művek kiválasztásával foglalkozott, míg a másik csoport a digitalizálási módszerek, a szkennelési és informatikai feladatok, a képfelbontások, majd a kapott anyag minőségének ellenőrzéséért és annak a könyvtári integrált rendszerbe való illesztéséért volt felelős. A nehézséget többek között az okozta, hogy a nemzeti könyvtárnak mind tartalmilag, mind technikailag voltak már olyan meghatározó tényezői, mint a nemzeti-patriotika anyag gyűjtése és archiválása, az enciklopedizmusra való törekvés és az alkalmazott BN-OPALE PLUS több mint 7 millió alap- és több mint 2 millió egységesített besorolási adattal (authorithy rekorddal).

A digitalizálás első korszaka 1992–1999 között lezárult. Ennek az időszaknak a legnagyobb részét (1992–1997) a feladatok pontos körülhatárolása és megtervezése töltötte ki. Az egyik alapvető kérdés a „mit digitalizáljunk” felvetése volt. A dokumentumok körét szorosan össze kellett hangolni a tudományos és oktatási igényekkel Általában elsőként a történelmi források és a tudományos folyóiratok digitalizálását tartják a legfontosabbnak. Ezek után pedig mindazokat, amelyek digitalizálása gazdagíthatja a már feldolgozott területek kutatását és tudományos elemzését. A technikai feltételekről azon szakmai tervek alapján döntöttek, amelyek a könyvtárat, mint „enciklopedikus és patriotika gyűjteményt” határozták meg, különös tekintettel a régi, illetve a nehezen hozzáférhető dokumentumokra. „Igen jelentős kiadványegyüttest hoztunk létre, amelyhez több tízezernyi kiadatlan forrást kapcsoltunk, hogy rávilágítsanak a szövegösszefüggésekre és azok hátterére” – emlékezik vissza Daniel Renoult, a BNF általános igazgatója.6

Az eredeti elképzelések szerint a terv alapjait elsősorban a közönség által leginkább keresett XIX. századi anyag képezte, mégpedig: 2300 monográfia és képként archivált periodika füzetei, a Frantext7 céljainak megfelelően szöveges formában regisztrált mintegy 300 francia nyelvű alapmű és 7000 fotó és több órás hanganyag. Az első szakasz végére a nyomtatott könyvek állománya a százezer egységet, a fix képek száma a háromszázezret érte el.

Az első 100 000 képként archivált kötet tartalmi és időbeli megoszlása:

Időrendi megoszlás:

A digitalizálásra szánt általános irodalom egyes csoportjait szakmai érvek alapján választották ki. Ismeretes, hogy a nemzeti könyvtárak többsége hasonló esetben a franciákhoz hasonlóan cselekszik: a patriotika irodalmat és az adott ország nyelvét, történetét, kultúráját reprezentáló műveket részesíti előnyben. Arra törekedtek, hogy ez a százezer mű jól reprezentálja az állomány sokszínűségét, ugyanakkor keresztmetszetét adja a francia nemzet szellemi nagyságai életművének. Így elsősorban a jelentős szerzők életműkorpuszai (Grands Écrivains de la France, francia folyóiratok pl. Revue Historique, Bibliographie de la France, Revue Méthaphisique et de morale etc.), nagy tematikus sorozatok (Garnier, Michaud, Guizot), a francia nyelv nyelvészeti irodalma és segédkönyvei, életrajzi lexikonok, feldolgozására került sor. Nyilvánvaló, hogy egy ilyen összetett kulturális, művészeti, történeti, társadalomtudományi anyag nem nélkülözheti a háttérinformációkat tartalmazó, a tájékozódáshoz/tájékoztatáshoz szükséges alapvető kézi-és segédkönyvek meglétét sem. Jól példázza ezt a nemzeti könyvtár Warburg nevű állományrésze, amely bővelkedik a francia gondolkodásra nagy hatást gyakoroló olyan szellemtörténészek műveiben, mint amilyen Saxl, Frances Yates vagy Panofsky voltak. Munkásságukat a BNF munkatársai modellértékűnek tartották és ki is választották digitalizálásra. Itt azonban nem álltak meg, mivel a Warburg könyvtár egyedisége éppen abban rejlik, hogy az itt dolgozó kutatók nemcsak az imént említett jeles szerzők, hanem számos más XVI-XVII. századi gondolkodó életműve mellett a század szellemtörténetében, gondolkodásában szerepet játszó valamennyi történeti és nyelvészeti kézikönyvet szabad hozzáféréssel a felhasználók rendelkezésére bocsátottak. A digitalizálás során tehát szükséges volt ehhez az elvhez ragaszkodni, hogy a kutatók valamennyi kor tudásanyagában és az akkori francia nyelvet reprezentáló ismeretanyag kézikönyveiben egyaránt tallózhassanak. Ezért került digitalizálásra az Astrée szótártól kezdve a Dictionnaire des Prétieuses szótáron át a Dictionnaire de l’Académieig minden. Az általános enciklopédiák és szótárak mellett a történelmi, topográfiai, biográfiai, jogi, gazdasági, esztétikai, etimológiai, argó, egyéb nyelvészeti, filozófiai, teológiai, politikatudományi, hivatali és természettudományi, vagyis mérnöki, matematikai, biológiai, kémiai, élettani, orvostudományi stb. szótárak mind bekerültek az adatbázisba.

A digitalizálás ilyen szellemű első lépéseként így született meg a valamikori kultuszminiszter, az író André Malraux „képzelt/képzeletbeli könyvtára.”8

Az olyan egyszerűnek tűnő feladat, mint az írók és műveik kiválogatása azonban sajátos problémákat vetett fel. Az irodalom kezdeteitől napjainkig tartó időszak számos – még ha az átlagolvasó számára ismeretlen is – fontos szerzővel vagy anonim művel büszkélkedhet.9 Önmagában már ez a szám is jelentős, hát még műveik, melyek digitalizálásánál figyelembe vették a különféle kiadásokat, valamint a rájuk vonatkozó filológiai kutatásokat.10

Ennek hatékonyabbá tétele érdekében a könyvtár szerződést kötött számos kiadóval is, hogy azok engedélyezzék különféle dokumentumaik digitalizált változatának hozzáférését. Közvetlenül azonban nem kapnak elektronikus formájú/digitalizált dokumentumokat a kiadóktól.

A tanulás és a kutatás számára nélkülözhetetlen információhordozók közül két dokumentumtípust azonban előnyben részesítettek a többihez képest: a folyóiratokat és a kézi/segédkönyveket. A történettudományi, irodalmi, természettudományos stb. folyóiratokban foglalt ismeretanyag és azok használata ugyanis mind a kutatás alapelemeihez tartoznak, hiszen valamennyi önmagában is adatbázisnak fogható fel. Legyen az a szimbolisták kérészéletű folyóirata a „Revue des deux Mondes”, vagy a XIX. századot átívelő „Revue Encyclopé-dique ou Universelle”, a „Revue de Méthaphysique et de morale”, az „Acta Eruditorum”, vagy a „Revue d’Anthropologhie” és hosszan folytathatnánk még a sort.

A szövegben és a rendszerben való navigálási lehetőségek és a feldolgozás módszerei miatt a Gallica erőteljesen közelít a virtuális könyvtárak jellemzőihez. A meglévő anyagot nagy tematikus csoportokra osztották, melyek mindegyikét egy történeti-kulturális megközelítésű ismertető vagy kisebb tanulmány vezeti be. Az egyéb kapcsolatok és hiperlinkek pedig az internet számos más területéhez vezetik az érdeklődőt. Egy adott/választható századról képek, kultúrtörténet, történelem, társadalomtudományok, jog és társadalom, filozófia és teológia, irodalomtudomány stb. érhetők el. E témaköröket kiegészítik a kutatómunkához szükséges segédletek hálózatos forrásai: egy-és többnyelvű szótárak, enciklopédiák, forrásgyűjtemények, digitalizált folyóiratok gyűjteménye, metszetek, pénzek, gemmák digitalizált változatai és egyéb szöveges, ill. szövegként elmentett állományok.

Az egyes Gallica részek

A digitalizált könyvtár tehát nemcsak arra törekedett, hogy a legfontosabb, legismertebb és legkeresettebb szerzők és különböző kiadású műveik gyűjtőhelye legyen, hanem arra is, hogy mintegy új típusú antológiaszerűen közvetítse és rendszerezze az egyes tudományok elméleti-történeti összefüggéseit. A digitalizálás ehhez mérten, az adott korra jellemző dokumentumok mennyisége, tartalma és minősége arányaihoz viszonyítva foglalja magába a különböző tudományterületek dokumentumait. Ezt az elképzelést maga a számítógépes megvalósítás is tükrözi. A Felfedezés (Découverte) rész témánként és századonként segíti a felhasználót a „francia civilizáció felfedezésében” az alábbi szempontok szerint: A) egy század képei, B) könyvtörténet, C) történelem, D) a világ körül, E) hatalom és társadalom, F) természettudományok, G) irodalom, H) filozófia. E jellemzőket táblázatos formába rendezték el a feldolgozott évszázadokkal. A témakör és az évszázad egy-egy koordináta pontjára rákattintva, elénk tárulnak a választott téma jellemzői, amelyeken belül hipertext rendszerben keresztül-kasul bolyonghatunk. A bolyongás során egy adott mű teljes szövetében kereshetünk, a szokásos kulcsszó, név, évszám megadásával.11

1999-ben a programot két nagy területre bontották. Ennek egyik eredménye lett a Gallica Clas-sique, vagyis a Klasszikus Gallica anyagot tartalmazó rész, amely a francia irodalom klasszikus anonim és ismert szerzőinek életművét öleli fel (1999 márciusától). A XVI. század és a XIX. század között született 1001 nagy irodalmi alkotást digitalizáltak azért, hogy minél szélesebb kör számára tehessék elérhetővé a francia írókat. A Francia Akadémia, a Bibliopolis12 kiadó és a Francia Nyelv Nemzeti Intézete segítségével váltották valóra elképzeléseiket. Az Akadémia Chateubriand összes művét, valamint Balzac teljes Emberi Színjátékát (La Comédie Humaine), a Bibliopolis pedig a Classiques Garnier c. sorozatát és a TREVI-nek nevezett adatbázisát adta át hasznosításra. A Bibliopolis olyan kiadó, amely kifejezetten a francia könyvtárak számára elektronikus dokumentumok kiadásával foglalkozik. Az interneten önálló honlapot hozott létre Biblionet13 névvel, amelyen Corneille-től La Fontaine, Goncourt-on, Flaubert-en át Zoláig. 68 francia író műveit, sőt, sokuk teljes életművét közzéteszi a keresőmotorjáról TREVI-nek elnevezett teljes szövegű adatbázisában és CD-ROM-on. Az írók kiválasztását a Radio France munkatársai által vezetett irodalmi műsorok alapján a közönség szavazatai és a Classique Garnier kiadó irodalomkutatásai és elemzései alapján együtt végzik. Arra ügyelnek, hogy a franciaországi szerzői jogot, – amely a szerző halála után 70 évig érvényes – ne sértsék meg. Az 1999. október 21-étől létező honlap statisztikája alapján látható, hogy naponta 680–700 személy keresi fel a Gallicába integrált helyeket és eddig majd két és félmillió oldal letöltését kérték.

A honlap alfejezetei a sokoldalú keresést teszik lehetővé:

  • A szerzők listája, akikre abc-ben és kor szerint is rá lehet keresni (vö: a Gallica kronológia c. fejezetével);
  • A „Kronológia” címszó elvezeti az érdeklődőt a Gallica „Découverte” („Felfedezés”) c. részéhez;
  • Az „Egyéb honlapok” olyan honlapok gyűjtőhelye, amelyek az adott korszakban írott egyéb digitalizált műveket tartalmaznak.

1999 novemberétől látható a textuális kutatások szempontjából a kutatók, hallgatók számára igen hasznos Gallica Proust, vagyis a Proust-tal kapcsolatos digitalizált anyag. Ez nem más, mint az író leghíresebb regényciklusának, „Az eltűnt idő nyomában…”-nak, ezen belül is annak utolsó kötetének, a „Megtalált idő”-nek a változatait és kéziratait tartalmazó nagy digitális gyűjtemény, amely előzőleg egy jelentős Proust kiállítás anyagaként gyűlt össze. A kiadóval való együttműködésnek köszönhetően az eredeti 1927-es kiadás szövegfájlban került az adatbázisba. A webhely tartalmi fejezetei átölelik Proust teljes írói világát: életének jelentős színtereit (Combray, Paris, Balbec jellemzése az író élettapasztalatán keresztül), a sorsfordító személyek szerepét Proust életében, részleteket, ill. visszaemlékezéseket közölnek az „akaratlanul megírt” emlékiratairól, Proust terveiről és a BNF Proust kéziratairól.

A hely érdekessége a Voix sur Gallica rész, amely a XX. század elején még csak kezdetleges technikával rögzített hangok, történetileg igen fontos hangdokumentumok állományát tartalmazza. Ennek egyik érdekessége Apollinaire: A Mirabeau-híd (Le Pont Mirabeau) c. verse, amelyet a szerző előadásában hallgathatunk meg egy 1913-as hangfelvételről.

A BNF állományának digitalizálása szakrészlegenként és dokumentumtípusonként

A BNF Kézirattárának anyaga

A Kézirattár világviszonylatban is felülmúlhatatlan ritkaságokkal büszkélkedhet. A világ legrégibb könyvétől kezdve az i. e. 2000 körül, hieratikus egyiptomi írással készült és az ajándékozó Priss d’Avennes neve után Priss Papirusznak nevezett kéziraton át több mint száz nyelven, számos íráshordozóra írott kéziratok gazdag tárháza ez. Csak a keleti kéziratok száma meghaladja a 120 ezret, nem beszélve a több mint 60 000 japán, kínai, koreai, tibeti stb. fametszetről, a hozzájuk tartozó majd százezer kötetes kézikönyvtárról és a tízezret meghaladó középkori kéziratról, melyek a kor miniatúraművészetének teljes palettáját őrzik.

Érthető, hogy ebből az anyagból nehéz lehetett 1000 illuminált kódexet kiválasztani digitalizálás céljára. A kiválasztottak V. Károly könyvtárából valók voltak. Számítógépes feldolgozásuk után ún. dedikált munkaállomásokról tekinthetők csak meg, a Gallica webhelyen még nem láthatók.

Metszet- és fotótár

Főként a szájhagyomány, de talán az írásos dokumentumok is azt sugallják, hogy a könyvtárnak e részlege is Colbert-nek köszönhető, aki 1667-ben Marolle abbé 120 000 darabos metszet-és rajzgyűjteményét egyszerre vásárolta meg. A tartalmában, technikai sokszínűségében különlegesen gazdag és értékes anyag kifejezetten alkalmas volt a digitalizálásra. A százezernél jóval nagyobb állományból Eugene Atget, Étienne-Louis Bouillé, Jean-Jacques Lequeu, Hippolyte Destailleurs műveit a Gallica számára is, DATAR-ét (1984-1985) pedig helybeni, dedikált munkaállomásokról történő használatra digitalizálták.

Térképtár

Az 1828-ban Edme-Francois Jomard geográfus mérnök által alapított térképtár több mint 600 000 térképe és 104 földgömbje közül több jelentős adomány gazdagította mennyiségileg és hírnévben ezt az állományt. Ezek közül a XVIII. század kiváló kartográfusának Jean-Baptiste Bourguignon d’Anville-nek mind a mai napig önálló állományrészként egybentartott gyűjteményét és a Párizsi Geográfiai Társaság közel 200 000 darabos gyűjteményét digitalizálták és tették elérhetővé a Gallica lapjain.

Pénzek, érmek, antik gyűjtemény

A gyűjtemény eredete a francia királyok uralkodásáig nyúlik vissza. A numizmatikai anyag 1360-as évszámmal őrzi az első olyan pénzdarabot, a Franc a cheval-t, amely az euro megjelenéséig töretlenül élvezte elsőségét és napjainkig a franciák hivatalos pénzének névadója volt. A XV. századi itáliai városállamokban kibontakozó medálművészet pedig a XVII. századi Franciaországban élte aranykorát. Mindebből a körülbelül 500 000 darabból álló gyűjteményből 1995-től számítógépes formában már tájékozódhattak az érdeklődők a BNF BN-OPALINE nevű adatbázisában, a Gallica számára viszont egy ún. Basile-gyűjteményt állítottak össze.

Zeneműtár

A könyvtár alapgyűjteményeihez képest igen későn, csak a XX. században, 1942-ben került sor arra, hogy a meglévő XVIII. századi zenei anyagot az Operaház-Múzeum-Könyvtár és a Zenekonzervatórium könyvtárának anyagával egyesítsék, megteremtve ezzel az önálló zenei gyűjteményt. Az igen speciális anyagból egyelőre kizárólag a zeneszerzők képeit válogatták ki digitalizálásra és a Gallican való közzétételre.

Film-és színházművészet remekeiből számos moziplakátot, az 1911-ben alapított, mára már több mint milliót meghaladó audio-vizuális gyűjteményből pedig több tízezer dokumentumot digitalizáltak.

A digitalizálás melletti érvek: mit, miért, milyen előnyökkel jár

A digitalizálás szakmai szempontjait a már eddigi tapasztalatok alapján a konferenciák és a tapasztalt szakemberek az alábbiak szerint foglalják össze.

Miért digitalizálunk?

  • Mert jól megőrizhetővé és archiválhatóvá válnak az eredeti dokumentumok;
  • A digitalizált dokumentum egyszerre, egy időben több munkaállomásról, számítógépről használható;
  • A hálózatnak köszönhetően lehetővé teszi a távoli elérést, méghozzá jó minőségben;
  • Az igen értékes, ritka, nem vagy nehezen hozzáférhető gyűjtemények anyaga, vagy speciális dokumentumok, mint pl. a kéziratok, kódexek stb. a hálózaton vagy CD-lemezen (CD-ROM, Interaktív CD-ROM, Photo CD stb.) bárki számára hozzáférhetővé válnak, amelyekről azután papír vagy egyéb másolat készülhet.

Informatikai szempontból mit digitalizáljunk?

  • Fel kell mérni tartalmi, esztétikai és a kulturális örökség szempontjából a gyűjteményt, mert csak az e szempontból értékeseket érdemes digitalizálni;
  • A túlságosan sok használatnak kitett, nagy formátumú, különlegesen ritka, becses dokumentumokat;
  • A nagyon ritka és zárt gyűjteményeket, hogy ezzel a nagyközönség számára hozzáférhetővé tegyük őket.

Milyen előnyei vannak a képi digitalizálásnak?

  • Bármikor rámásolhatjuk lemezre a merevlemez tartalmát (és fordítva);
  • Elektronikus úton terjeszthetővé válik;
  • Idő és hely kötöttsége nélkül bármikor dolgozhatunk vele, javíthatunk rajta, kicsinyíthetjük, nagyíthatjuk stb.;
  • Elmenthetjük és megőrizhetjük;
  • Nagy távolságról is hozzáférhetünk ill. hozzáférhetővé tehetjük;
  • A speciális helyi vagy távoli adatbázisokban is hozzáférhetővé tesszük minden érdeklődő számára.

A BNF digitalizálási jellemzői

Már a projekt kezdetekor egy ARGON nevű adatbázis építésébe fogtak, amely lehetővé tette, hogy a digitalizálásra szánt dokumentumokat osztályozhassák, rendszerezzék és visszakereshessék, de ez az adatbázis végül nem nőtte ki magát munkaadatbázissá. Ennek az a magyarázata, hogy az új könyvtár építésével párhuzamosan elkezdődtek a retrokonverziós munkálatok, hiszen a Szajna-parti épületbe már kizárólag feldolgozott és digitalizált anyagot kívántak átvinni. Ez a munka a nyomtatott és az audiovizuális anyag összességét, mintegy 11 millió dokumentumot érintett. Mindezt az ORACLE 7.0 integrált könyvtári rendszer katalogizáló moduljával végezték, mely köztudottan relációs adatbázis-kezelésre ad lehetőséget. Az érdeklődők e dokumentumokat azután a Janus-arcú modul OPAC felületén a hagyományos (szerző, cím, sorozat stb.), valamint a Boole-algebra és bármilyen kritériumú összetett kérdéssel az indexek összességében kereshetik meg.

A tartalomjegyzékek, a folyóiratok, a képek leírásai mind teljes szövegű adatbázisba kerültek. Ennek alapjait már az 1971 óta a CNRS (Centre National Recherche Scientifique) által épített, kb. 3000 műből álló Frantext adatbázis képezte.

Az így feldolgozott valamennyi rekordot ellátták a metaadatokkal és jogi szempontból is meghatározták, hogy kölcsönzés, letöltés, másolás esetén milyen szerzői jogok védik.

Technikai megvalósítás/kivitelezés

Az előkészítő szakasz után megkezdődött a dokumentumok képként való regisztrálása, amit a dokumentum típusától függően 300–400 dpi-s felbontással TIFF formátumban (6.0) mentettek el. Elképzelhető, hogy a bitmap formátumok közül tudatosan választották a TIFF formátumot14, hiszen a szakirodalom alapján elmondható, hogy a szkenneléssel előállított grafikus bitmap fájlok közül ez az egyik leggyakoribb, ugyanakkor a legrugalmasabb nyomtatáskor és kiváló átjárást nyújt a különféle alkalmazások és platformok között.15

Az így kapott anyagot a CCITT (4. csoport)-vel tömörítették. Mivel zömében XVII., XVIII., XIX. századi anyaggal dolgoztak, igen sok nehézség adódott a szkennelés utáni optikai karakterfelismertetéssel (OCR). Nyilvánvaló, hogy a régi tipográfia és helyesírás magas hibaszázalékot eredményezett, melynek javítását költséges kézi erővel kellett megoldani. A hibaszázalék betűk esetén elérte az 5%-ot, szavak esetén azonban a 20–30%-ig is felugrott.

Az újabb kori munkák más típusú problémát okoztak. Mindezek ellenére a képi módban történő rögzítés tűnt a leggazdaságosabb és a leggyorsabb megoldásnak. A feldolgozásra kerülő anyag körülbelül 40%-a az eredeti munkák alapján, kb. 60 000 cím a partnerintézményektől, 26 000 cím a BNF állományából, a maradék 60% pedig a már mikrofilmekre (35 mm), vagy a mikrolapokra került dokumentumok digitalizálásából tevődött össze.

Miután egy-egy mű alapján elkészült egy informatikai adatállomány, amely bibliográfiai leírásából, képi formájú feldolgozásából és a hozzá kapcsolódó utaló tételekből stb. állt, az egész anyagot 4 mm-es DAT mágneses kazettákra másolták át részben állományvédelmi, részben végső minőségellenőrzési okokból.

A DAT kazettákkal a könyvtár szakembergárdája dolgozott tovább. Saját módszert dolgoztak ki az egyes próbaellenőrzésekre, amely során azt vizsgálták meg, hogy a végső formátum, a szerkezet, a tartalom és a megjelenítés megfelel-e vagy sem az előtervben rögzített elvárásoknak.

A PDF formátum és a Gallica program

Az interneten való letöltések elősegítésére, amit még hangsúlyosabbá tett az a tény, hogy a feldolgozott állomány mindenféle dokumentumtípust (könyv, folyóirat, mikrofilm, kép, kézirat, audio-vizuális dokumentum stb.) tartalmaz, a BNF munkatársai az Acrobat Reader által kifejlesztett és javasolt .pdf formátumban tették elérhetővé a kiadványokat. A Portable Document Format nem szoftver, hanem egy ún. hordozható dokumentum formátum, amely igen elterjedt annak köszönhetően, hogy PC-n, Macintosh, Unix gépeken egyaránt használható, mivel a különféle platformok közötti átjárást áthidalja/lehetővé teszi. Ez a felhasználók, az olvasók szempontjából kedvező feltétel. A számítógépes feldolgozást, digitalizálást végzők szempontjából viszont az az előnye, hogy bármilyen alkalmazás végterméke átalakítható pdf. formátumra. Ha kell, interaktívvá tehető és a hipertextre jellemző módon és a HTML dokumentumnál megszokott módon bolyonghatunk is benne. A legfontosabb viszont az, hogy a PDF formátum az interneten olyan, mint a PostScript (PS) formátum a nyomtatók számára: nyelvtől, operációs rendszertől függetlenül megőrzi a dokumentumok eredeti arculatát, így azok bárhol, azaz akár képernyőn, akár nyomtatásban, eredeti minőségben jeleníthetők meg. Nem kell csodálkoznunk ezen, hiszen mindkettő az Adobe cég terméke. A PDF formátum logikus következménye a PostScript formátumnak. A legújabb verzió (Acrobat Reader 5.0) az olvasáson kívül a biztonságos adatforgalomra is kínál megoldást és olyan export/import lehetőséget fejlesztettek benne, amely látványosan sokoldalúbbá teszi. Ebben a verzióban már nemcsak PDF formátumban menthető el a kész munka, hanem JPEG, PNG, TIFF képet is exportálhatunk és BMP16, JPEG17, PCX18, GIF19, HTML, TIFF és egyéb szöveges fájlokat is importálhatunk, amelyeket a program értelmezni tud és ennek következtében automatikusan PDF formátumúra konvertál, amelyet azután önállóan is elmenthetünk, vagy egy már létező dokumentumhoz kapcsolhatunk.

A program webes integrációja szintén megoldott. Az adatok a jövő webnyelvén, XML formátumban kódolva kerülnek küldésre, amelyek azután szinte bármilyen gépen értelmezhetőek. A webhelyek automatikusan konvertálhatók PDF formátumra, hogy azután off-line lehessen őket használni úgy, hogy valamennyi Java Script, link és stíluslap megmarad eredeti formájában.

Noha nem célom az Acrobat cég termékeinek bemutatása és elemzése, ennyit feltétlenül szükségesnek tartottam elmondani ahhoz, hogy kitérhessünk a PDF formátum és a Gallica project kapcsolatára.

A szakirodalom elvétve, vagy gyakran? – ez megítélés kérdése –, de foglalkozik a virtuális könyvtárak technológiai követelményeinek, feltételeinek kiválasztásával. Az eddigi kísérletek, projektek megvalósításában jól nyomon követhető az a folyamat, ahol a nagy virtuális, elektronikus könyvtárak, doktori gyűjtemények és kereskedelmi programok a PDF formátum mellett törnek lándzsát. A Gallimard Kiadónál 1996-ban napvilágott látott „Kiberplanéta: Internet és kibertér”20 című sikerkönyv szerzője, a híres montreáli professzor, Jean-Claude Guédon az elsők között volt, aki nemtetszé-sét, talán inkább kételyeit fejezte ki a BNF-nek a PDF formátum melleti döntése miatt.21

Amint már említettük, a BNF szövegei képként TIFF formátumban készültek. E képeket mintegy „becsomagolták egy PDF csomagba” és ezért megjelenítésükhöz, illetve nyomtatásukhoz az e formátumot olvasni, értelmezni tudó szoftverre, az Acrobat Readerre van szükség.

A kétkedők az alábbi gondokat vetik fel:

  • a PDF valóban igen elterjedt internetes forma. Az Adobe cég 1997-es felmérése szerint naponta több mint 50 ezren töltik le a formátum olvasásához szükséges ingyenes szoftvert a cég honlapjáról. Ugyancsak az ő felmérésükből tudható, hogy több mint 250 ezer webhely alkalmazza a PDF formátumot. Igen ám, de ez csak szokás, bevált gyakorlat, nem pedig nemzetközi szabvány vagy ajánlás. Kérdés, hogy ki garantálja az olvasóknak, hogy a PDF formátum tíz év múlva is ugyanilyen olvasható lesz-e, mint ma?
  • Ma, amikor erősen érzékelhető a weben található információ fizetőssé válása,22 ki garantálja, hogy a szoftver ingyenes és bárki által letölthető lesz?
  • Noha a PDF napjainkban hatékony mint technológia, de vajon az lesz-e 15 év múltán is?
  • Igaz ugyan, hogy az Acrobat fájlai megfejelhetők a metaadatok fejlécével, de az általa elfogadott vagy felkínált metaadatoknak semmi közük sincs a normaként tisztelt Dublin Core 13-15 elemeihez. Ez tehát csapda, mert az így elkészült rekordok nem lesznek kompatibilisek a későbbi szabványokkal és megint csak egy adott cég adott technológiájához, legfeljebb annak fejlesztéseihez, fejlettebb változataihoz leszünk láncolva.
  • Próbáljuk meg letölteni a Gallicáról PDF formátumban Zola, Balzac, Flaubert, Proust vagy Roger Martin du Gard egy-egy nagyobb regényét! Látni fogjuk, hogy egy 500–600 oldalas műnél, még ha tömörítve van is, milyen lassan és nehézkesen fog a rendszer működni.

A PDF formátum tehát sok előnye mellett valóban igen jó a kis vagy kisebb terjedelmű munkák esetében, de milliónál több rekordból álló dokumentációs rendszert túl nagy könnyelműség volt erre alapozni.

A hosszú távú archiválás és letöltés gondjai sokakat foglalkoztatnak. Nem véletlen tehát, hogy erre vonatkozóan is ISO szabványt kívántak létrehozni tekintet nélkül a hagyományos vagy elektronikus forrásokra. Az OAIS (Open Archival Information System), a PANDORA (Preserving and accessing networked documentary resources of Australia), a NEDLIB (Networked Deposit Libraries) modellek a fent említett problémák kiküszöbölésére tett kísérletek.

A digitalizált állományhoz való hozzáférés és keresési lehetőségek

A többféle hozzáférési módból kettő kifejezetten a könyvtárosok munkáját és érdekeit könnyíti, kettő pedig az olvasók táboráét. Nyilvánvaló, hogy egy elektronikára épített könyvtárnak nemcsak gondolnia, hanem fel is kell készülnie azokra az esetekre, amikor az informatikai rendszer valamilyen okból felborul és használhatatlanná válik. Az addig feldolgozott anyag azonban nem veszhet el. Az előbbiekben már említettük, hogy a BNF – a hasonló könyvtárak gyakorlatát követve -, minden dokumentumról és minden munkafolyamatról napi rendszerességgel készít archiválási példányt és biztonsági másolatot. Ehhez természetesen csak a szakembereknek van hozzáférési joguk, mint ahogyan a rendszerben rejlő export-import képességek kiaknázásához is. Ez utóbbit hangsúlyosan alkalmazzák, hiszen nemzeti könyvtár lévén az országos hálózaton számos közművelődési könyvtárnak exportálnak bibliográfiai rekordokat.23

Az olvasói hozzáférés két csatornán biztosított. A BNF helybeli használatán és az internet Gallica webhelyén keresztül. 2002 elején ez a két lehetőség az alábbi tételeket foglalta magába: BNF: 100 000 kötet és 300 000 fix kép, valamint animált állományok, és hangzó dokumentumok feldolgozását. A Gallica webhelyen 50 000 képi módon digitalizált kötet, 1240 szövegként mentett kötet és 80 000 fix kép képezte az állományt.24 Korábban már említettük, hogy a számszaki különbségek abból erednek, hogy az interneten megjelenő Gallica rész csak egy része a BNF digitalizált gyűjteményeinek. Körülbelül az az egyharmada, amelyik már nem esik szerzői jogvédelem alá.

Helyszíni munka esetén két fogalommal találkozik az olvasó: a PAV és a PABN szavakkal. A zavartalan munka érdekében illik ismerni, melyik mit jelent. A PAV (Poste Audio Visuel) az audio-vizuális munakállomásokat, a PABN (Poste Acces Bibliotheque Numérique) pedig a digitalizált könyvtár ún. dedikált munkaállomásait fedi. Ez utóbbiak sokkal több lehetőséget biztosítanak a felhasználónak, mint egy átlagos számítógép. Ezek a munkaállomások ugyanis lehetővé teszik hogy a digitalizált könyvállományban ún. „átlagos/alap” ill. „felfedező” módszerrel dolgozzon az olvasó. A felfedező módra úgy is tekinthetünk, mint a Teaching Library tipikus példájára. A „tanító könyvtárra,” amely direkt és indirekt módszerekkel felfedezteti és lépésről-lépésre megtanítja az informatikai rendszerben rejlő lehetőségek kiaknázásával a lehető legeredményesebb használatot. A PABN állomások egyszerre nyitottak mindenfelé: hozzáférést biztosítanak a könyvekhez éppúgy, mint az internethez vagy a CD-ROM szerverhez. Átjárhatóságot adnak a különféle platformok között, az olvasó egyazon képernyőn szöveg – és képi módban is dolgozhat, ha kedve tartja. A szövegben kereshet, kijelöléseket végezhet, jegyzeteket fűzhet hozzá egy saját jegyzetfüzetben és ki is nyomtathatja vagy lemezre mentheti, amire szüksége van. Mivel valamennyi feldolgozott dokumentumnak külön megállapították a szerzői jogát és ezt csatolták is az adott rekordhoz, a rendszer azt is jelzi, hogy ennek megfelelően letölthető-e vagy sem a kívánt mű.

A Gallica fondjai és egyéb digitális könyvtárak tartalmi kapcsolata

Többször már utaltam rá, s a Gallica nyitólapi grafikáján lévő ellipszis maga is mintegy szimbolizálja a webhely enciklopedizmusra való törekvését. Nyilván ezért nem kérhető rajta számon valamennyi tudományterület igen alapos feltárása. Az azonban feltűnő volt számomra, hogy vannak kiemelkedő nevek, tárgykörök, korszakok, amelyeket maga a BNF-Gallica is hangsúlyosan, de nem teljességre törekvően kezel, ugyanakkor nem hívja fel az olvasó figyelmét azokra az egyéb könyvtárakra, amellyek kifejezetten arra az adott témakörre specializálták magukat. Még furcsább, hogy hiperlinket ezekhez egyáltalán nem ad.

Nyilvánvaló, hogy hosszadalmas, több évig tartó kutatás tudná pontosan összegyűjteni valamennyi érintett témakör külső kapcsolatait, de a gyakran keresett témákat mégiscsak összefüggéseikben kéne láttatni. Én ezzel kiegészíteném a Gallica egyes fondjait és meggyőződésem, hogy így még inkább kitágulnának a felhasználási lehetőségek.

Jóllehet ezek a könyvtárak gyakran kanadai városokban és kanadai szervereken vannak, ám nagyon alapos gyűjtések. A BNF gyűjtőkörén még ha kívül is esik, valami köztes megoldást talán lehetne találni, hogy a témakörhöz illő egyéb frankofon anyagról is tudomást szerezhessen az olvasó.

Íme néhány példa annak illusztrálására, hogy mire is gondolok:

A Gallica külön területet szentel Marcel Proust életművének. Illinois államban van egy önálló alapítvány, amelyik csakis Proust-tal foglalkozik és teljes körűen gyűjt, digitalizál tőle/róla mindent, amihez hozzáfér. A Kolb-Proust Alapítvány címe:  http://www.library.uiuc.edu/kolbp/homeF.htm

Számomra különleges, hogy nincs sem a Gallicának idevezető linkje, sem az alapítvány nem utal egy szóval sem a Gallica Proust fondjára. Ez utóbbi érthetőbb, hiszen ez a teljesebb állomány.

Ez a webhely számos dokumentumtípust dolgoz fel, teljes szövegű adatbázist szerkeszt, mindenféle keresési szemponttal segíti a kutatókat és demo változatot is közread. Ennek egy részletét közlöm az alábbiakban.

Ez egy Proust levél, melynek beszkennelt változata a hozzá tartozó kritikai és egyéb megjegyzésekkel a textológiai kutatások számára előkészítve, a benne szereplő helyek, személyek magyarázatával hipertextes formában olvasható.

Lettre de Marcel Proust a Antoine Bibesco

Letter from Marcel Proust to Antoine Bibesco

http://www.library.uiuc.edu/kolbp/Lettjpg.htm

Le filigrane de cette lettre, visible seulement par transparence, représente une couronne.

(The watermark on the stationery of the letter above is the image of a crown which appears when the letter is held to a light source.)

Lundi [22 aout 1904] (1)

Mon cher Antoine

Que deviens-tu? Donne-moi de tes nouvelles! Ou sont les Yeatman que je les remercie des jolies cartes postales? (2) J’ai betement raté la visite d’Emmanuel et en suis inconsolable. (3) J’ai été quelques jours sur le yacht du beau pere de Billy. Joli bateau, jolie navigation, jolies femmes. Je ne sais ou je vais repartir. Je ne puis comprendre comment ta cousine a été dédécorée, puisque c’était signé. (4) C’est une grande déception pour moi bien que je n’attache pas a ces choses-la beaucoup d’importance. Je pense affectueusement a toi et je serais content d’avoir de tes nouvelles.

Marcel Proust

(1) o. ph. Coll. U. Ill. Sur papier de grand deuil. Ne porte que la date du Lundi; doit dater du lundi 22 aout 1904: allusions a la croisiere a bord du „yacht du beau pere de Billy”, a la décoration de Mme de Noailles. Voir la note (4) ci-apres, et la lettre ou Proust annonce son retour de la croisiere, lettre que nous datons du Lundi soir [15 aoűt 1904].

(2) Cf. la lettre a Léon Yeatman, ci-apres, que nous datons du Mercredi [24 aoűt 1904].

(3) Les princes Antoine et Emmanuel Bibesco sont nommés parmi les personnes ayant assisté a une représentation de Le Coeur a ses raisons chez Mme Eugene Pouquet (Le Figaro, 29 mai 1904, p. 2); Le Figaro du 10 juin 1904 note qu’ils ont donné un thé a l’hôtel Ritz. Le Figaro du 24 juin 1904 annonce, sous la rubrique des déplacements et villégiatures: „M. le prince Antoine Bibesco, a Londres.”

(4) Le Gil Blas du lundi 8 aoűt 1904, page 2, annonce, sous la rubrique Le Diable Boiteux. Le ruban rouge: „… La comtesse Mathieu de Noailles n’aura pas le ruban rouge cette année. Le ministre l’avait pourtant mise sur sa liste. Mais la grande chancellerie a trouvé que l’auteur du Visage émerveillé était trop jeune. Espérons que douze mois suffiront a réaliser le miracle de rendre Mme de Noailles assez vieille.”

——————————————————————————–

Kolb, Philip. Correspondance de Marcel Proust, tome IV. Librairie Plon, Paris, 1978.

——————————————————————————–

accueil | home recherche | search

vos commentaires | comments

A Lisieux-i Digitális Elektronikus Könyvtár (http://www.bmlisieux.com/ ) több területre specializálta digitális anyaggyűjtését. Feladatának tekinti a normandiai, a lexoviens és egyéb nyelvjárásokra vonatkozó lexikonok, szótárak és dokumentáció összegyűjtését. A Lexo Tor adatbázis és a Langue du XIXe siecle (A XIX. század nyelvei) webhelyek Torontóban készülnek, de szorosan kapcsolhatók lennének a Gallicához, különösen annak Dictionnaire (szótárak) és a XIX. századot bemutató tartalmi részéhez.

A LEXOTOR adatbázis nyitóoldala és URL-je:

http://www.chass.utoronto.ca/epc/langueXIX/lexotor/

A Langue du XIX e siecle URL címe:

http://www.chass.utoronto.ca/epc/langueXIX/

Ez utóbbiból találomra kiválasztottam tizenötöt a lekérdezhető majd kilencven francia nyelvű nyelvi és egyéb szakszótárból. Közülük mindössze öt volt meg a Gallicában és az olyan fontos, elsősorban a XIX. századra vonatkozó szótárak, mint pl.

Élie Blanc, Jacques-Philippe Saint-Gérand, Le Dictionnaire Logique de la Langue Française d’Élie Blanc: Images, analogies et pathologie de la langue française au XIXe siecle
W. Duckett (dir.), Dictionnaire de la conversation et de la lecture, 2e éd., 1864: Titre – Table des auteurs-rédacteurs – Avis – Articles choisis
művei, nem voltak megtalálhatóak. Ezért tartanám mindenképpen fontosnak hogy a XIX. századi anyag mellett ez a link valamiképpen megjelenjen.

Az 1998 májusától létező Chronologie littéraire francaise 1848–1914 (Francia irodalmi kronológia 1848–1914) nevű hely nemcsak évenkénti bontásban közli az akkor történt irodalmi és kulturális eseményeket, hanem elvezet az írók, kiadók stb. honlapjaihoz és külön felhívja a helyeihez kapcsolható, témájában odaillő Gallica honlapra is a figyelmet. Ugyanez fordítva nem található.

Egy adott évben megjelent és digitalizált regény teljes szövege mindig abban a digitális könyvtárban olvasható, ahol azt feldolgozták. Így minden jelentős irodalmi webhelyhez (ABU, ATHENA, GALLICA stb.) elvezet ez az összeállítás.

A Catalogue Critique des Ressources Textuelles sur Internet (CCRTI) nevű oldal segédlet az olvasóknak ahhoz, hogy eligazodjanak a francia irodalmi szövegeket digitalizáló és közreadó elektronikus-digitális könyvtárak választéka között. Részletesen kifejtett, többféle szigorú szakmai szempont alapján választják ki az ide bekerülő oldalakat, adatbázisokat. Valamennyiről rövid értékelést adnak és biztosítják az adott adatbázisban való keresést. Az eddig említett helyek között olyan fontosak találunk, mint pl. a reneszánsz időszakát felölelő Epistemon, a XIX. század szinte egészét bemutató Dix-neuf, a CETE-ként ismert XVI–XVII.századi művek fakszimiléit és integrált szövegeit tartalmazó adatbázis, vagy a középkori kutatásoknál hasznos Centre d’Études des Textes Médiévaux-t, vagy a legnagyobb klasszikus irodalmat közlő Mozambook nevű helyet.

Közöttük található a Gallicáé is. A róla alkotott és itt mellékelt kép jól példázza a feldolgozási-bemutatási módszereket.

Catalogue critique
des ressources textuelles
sur Internet

Les bibliotheques de littérature générale

Gallica

Hypertextes et Textualité
électronique
Adresse Internet : http://gallica.bnf.fr/classique

France : Bibliotheque Nationale de France.

Langue de l’interface du site : Français.

Responsable du site : Lionel Micault
(lionel.micault@bnf.fr ).

Page d’accueil
Présentation du
CCRTI
Plus d’un millier de textes de tous les siecles et de tous les genres, en mode texte et mode image.

Moteur de recherche et référence a l’édition.

Typologie des ressources textuelles :

Consultation du catalogue
Bibliotheque
générale

Bibliotheque par
auteur
Sélection de liens
Bibliotheque générale.

Le site présente ses propres versions électroniques des textes.

Méta-catalogue de ressources textuelles : présence d’une liste de liens vers d’autres sites.
Tous les textes sont intégraux.

Traitement éditorial des textes :

Nouveaux sites
indexés
La référence a l’édition papier ou a la source numérisées est indiquée.
La pagination de l’édition papier ou a la source numérisées est indiquée pour certains textes.

CRAI :
Catalogue des Ressources
Auteurs sur Internet
Les dates biographiques des auteurs ne sont pas indiquées.
La date de publication des textes est indiquée.
Des notices bibliographiques sont présentes.

A Gallica előzményei és helye a francia digitalizálási törekvésekben

Nem véletlen, hogy a Gallica program Francois Mitterand nevéhez fűződik. A programnak voltak már előzményei. Ezek szintén Mitterand elnök ötletei alapján valósultak meg.

Az elnök fő elképzelése az ún. „Bibliotheca Universalis”25 megvalósítása volt, amelynek legfontosabb célja a világ tudományos és kulturális örökségének hozzáférhetővé tétele közös multimédiás technológiák révén, hogy ezáltal is elősegítse az ismeretek nemzetközi cseréjét. A világ digitalizálási programjait egyetlen nagy, osztott virtuális ismeretgyűjteménybe, könyvtárba kívánják szervezni, hogy a felhasználók kiszolgálása eredményesebb legyen. Az egyes országok által leírt, digitalizált, indexelt kulturális értékek közös fennhatóság (public domain) alá fognak tartozni. Az egyes nemzeti vagy közkönyvtárak megerősödnek funkcióikban, mindegyik rákényszerül, hogy saját digitális technológiáját tökélyre fejlessze és olyan informatikai rendszereket alkalmazzon, amelyek nemcsak a bibliográfiai rekordok (szöveg, kép, grafika, múzeumi tárgy, hang-és videó stb.) nemzetközi adatcseréjének továbbítására, hanem a pontos információtartalom feltérképezésére, visszakeresésére is alkalmasak. Mindezek után egy hatalmas, különféle dokumentumtípusok tízmillióit tartalmazó információszolgáltatót kell létrehozni. A network szerkezete így az osztott digitális szervereken, a visszakeresést szolgáló közös grafikus interfészen, a korszerű, szemléletes, intelligens navigációs eszközök és a szupergyors, kommunikációs protokollok megvalósításán nyugszik majd.

A terv hivatalos mederbe terelése a G7-ek országainak 1994. júliusi nápolyi csúcstalálkozóján indult, mert ennek az értekezletnek egyik kiemelt témája volt a világméretű információs társadalom fejlesztésének támogatása. A tagországok és az EU-közösség együttes döntéshozatalára alkalmasnak bizonyult az 1995. február 25–26-án Brüsszelben rendezett miniszteri konferencia, ahol megszülettek a támogatást érdemlő nemzetközi együttműködési projektek, amelyekben minden ország felelős az általa kidolgozandó munkamódszerekért és az eredmények valóságos adataiért. A megoldandó feladatokat az alábbiakban határozták meg:

az információ globalizálásával kapcsolatos kérdések tisztázására vitalehetőség, egyeztetési tárgyalások megalapozása a tagországok között,
az információcsere irányításának és az információs társadalom továbbfejlesztésének lépései,
a tisztán szociális, gazdasági és kulturális hasznokat hozó projectek kiválogatása és kivitelezésének segítése,
ezek gyakorlati megvalósításával és felhasználásával kapcsolatos akadályok felismerése,
az új termékek és szolgáltatások piacának kiépítéséhez segítségadás.
A „hetek stratégiájának” végül 11 konkrét kísérleti projektje készült el Brüsszelben,26 és ennek két francia eredménye a Gallica, ill. a Bibliotheca Universalis digitális projektek megszületése.

Összegzés

A program már megnyitása előtt sok érvet és ellenérvet tudhatott magáénak. Az ellenérvek legtöbbje technikai jellegű volt: mivel a szövegek többségét képként archiválták, az alkalmatlanná vált az integrált szövegű keresésre és olvasásához az Acrobat Reader-re27 mindenképpen szükség volt. Másrészt a szép grafikájú nyitóoldal és maga az egész hely a legújabb technikai-informatikai hardver és szoftverkészlettel dolgozott és ahhoz, hogy ezt mások is értelmezhessék, meglehetősen új számítógépes konfigurációkkal kellett/kellene rendelkezniük. Felmerült a kérdés azóta már többször is, hogy helyes volt-e már a kilencvenes évek elején egy ilyen nagyméretű és ennyire centralizált digitalizálásba fogni? Nem lett volna helyesebb, ha az osztott katalogizálás elve alapján a BN is megosztotta volna a különféle könyvtárakat, s gyűjtőkörének, állománynagyságának megfelelően mindegyik megkapta volna a maga digitalizálási területét és a végén a BN csak ezt fogta volna szerves egységbe?

Több mint négy év telt el a megnyitás óta és bizony sokszor tapasztalhatjuk, hogy a rendszer éppen dúrdefekttel küzd. Az első ilyen alig két héttel a hivatalos megnyitás után történt. 1997. október 13-án, ezen az ún. „fekete kedd”-en egy szolgálati monitorból kiinduló baj néhány perc alatt először 2800 szolgálati számítógép, majd az egész integrált könyvtári rendszer teljes leállásához vezetett. A legutolsó ilyen alig néhány hete történt. Ennek ellenére elmondhatjuk, hogy a hatalmas pénzügyi és szellemi befektetéssel igen értékes digitális könyvtárral gyarapodott a világ.

Melléklet

A Gallica Découverte (Felfedezés) részének tematikus csoportjai:

Középkor:

a)  A Basile-kincs és a numizmatikai intézet egyéb éremanyaga

b)  A középkori nyomtatott könyv

c)  Középkori történelem

d)  Kereszteshadjáratok

e)  Isten országa

f)  A világegyetem harmóniája

g)  Az írás kezdetei

h)  Arisztotelész, egyházatyák, tomizmus

XVI. század:

a)  A Basile-kincs és a numizmatikai intézet egyéb éremanyaga

b)  A XVI. századi nyomtatott könyv

c)  A nemzeti történelem felé

d)  Az Újvilág

e)  A herceg és a kurtizán

f)  Az emberi test felfedezése

g)  Egy mozgalmas század

h)  Filozófia és humanizmus

XVII. század

a)  A Basile-kincs és a numizmatikai intézet egyéb éremanyaga

b)  A XVII. századi nyomtatott könyv

c)  Történelem és tudományosság

d)  Feladatok

e)  Az állam születése

f)  Mozgásban a Föld

g)  A „nagy század”

h)  A karteziánizmus és a janzenizmus

XVIII. század

a)  Jean-Batiste Bourguignon d’Anville, Étienne-Louis Boullée, Jean-Jacques Lequeu, a Basile gyűjtemény

b)  A XVIII. századi nyomtatott könyv

c)  Szellemtörténet

d)  A tanulmányozott világ

e)  Fiziokraták

f)  A teremtéstől az evolúcióig

g)  Irodalmi téma nincs

h)  A felvilágosodás filozófusai

XIX. század

a)  Zenészek arcképei, Eugene Atget stb. illusztrált könyvei, az Embertani Múzeum, a Nemzeti Természeti Múzeum anyaga, építészet stb.

b)  A XIX. századi nyomtatott könyvek

c)  Nemzeti emlékezet

d)  Új területek meghódítása

e)  Szabályok és szabályozás

f)  A tudomány

g)  Romantika és realizmus között

h)  A pozitivizmus és az eklektizmus

Jegyzetek

Jean-Pierre Angrémy a BNF elnök-főigazgatója. Vö.: Les bibliotheques craquent pour les voyages numériques = Livres de France, No 231. (2000) 7-8. p. 2.

Francois Mitterand levelét idézi Bibliotheque Nationale de France – au seuil du vingt et unieme siecle. Katalógus. Paris, 1998.  p. 19.

TGB project = a „Tres Grande Bibliotheque (nagyon nagy könyvtár)” kifejezés kezdőbetűi alapján

Jacques Attaliról http://www.attali.com

Jean-Dider Wagneur, a BNF internetes változata tudományos igazgatóhelyettesének szíves szóbeli közlése és nekem írt e-mailje. Segítségét ezúton is köszönöm.

12 millions de pages sur Gallica 2000 = Livres de France, No 227. 2000,  mars. p. 33.

A Francia Nyelv Nemzeti Intézetének (Institut National de la Langue Francaise) egyik adatbázisa.  Kezdeményezésükre indult az ARTFL = Trésor de la Langue Francaise programja (A francia nyelv kincsei/kincsesháza). URL-je: http://humanities.uchicago.edu/ARTFL.html

André Malraux 1947-ben jelentette meg a „Le musée imaginaire” c. művét (Ford. Ditrói Endre: Korunk, 1977. 7. sz.), melyben arról vallott, hogy az emberiség történetének lényegét a múzeumokban összegyűjtött értékek tudatunk képzeletbeli múzeumában megjelenő összessége adja. De Gaulle tábornok idején vállalt kultuszminisztersége alatt kitágította ezt a fogalmat a „bibliotheque imaginaire”- rel is. Azt a könyvtárat nevezte így, amely a kultúra egészét átfogta volna fizikai meghatározottság nélkül. Akkor még nem gondoltuk, hogy ez az idő is elérkezik egyszer és megvalósulhat ez az irreálisnak tűnő elképzelés.

Hogy csak érintőlegesen soroljunk fel néhányat közülük: pl. az itáliai nyomdászcsalád gyermeke Pierre Larivey (1540–1612), akit stílusa miatt Moliere előképének tartanak;  a Péiade-ok legifjabb tagja Étienne Jodelle (1532– 1533);

Első kiadás, életmű kiadás, kritikai kiadás stb. a hozzájuk kapcsolódó kéziratokkal.

A témaköröket a melléklet közli

A Bibliopolis a Garnier Classique Kiadóval együtt a könyvtárak és hivatásosok számára az elektronikus könyvkiadásra szakosodott  francia kiadók.

A Bibliopolis honlapjáról elérhető a Biblionet adatbázis: http://minotaure.bibliopolis.fr:7999

TIFF = Tagged Image File Format, kiterjesztése .tif ,  melyet az Aldus és a Microsoft alkotott meg a beszkennelt képek általános formátumaként. V. ö.: Boursier, Patrice: La technologie multimédia. Paris, 1994.

A leglényegesebb formátumok és jellemzőik bemutatására igen jó az alábbi kanadai hely: http://docu.sit.ulaval.ca

A BMP formátum = Bitmap formátum. Ez a Windows Paintbrush rajzoló programjának a megjelenítési formája, melyet a Microsoft definiált grafikus interfésze számára. Kiterjesztése .BMP. A TIFF formátumokkal egyenrangúnak tartják, mivel szinte minden kép típusra alkalmas. Ezt viszont Macintosh gépen bizonyos alkalmazásoknál nem lehet használni. (pl. exploitation et partage des photos)

JPEG = Joint Photographic Expert Group web képformátum, amelyet olyan normaként tartanak számon, amelyik a digitalizált fix képek tömörítésének és kicsomagolásának algoritmusát is meghatározza, valamint olyan csereformátum, amely többféle alkalmazás számára készült. Az egyik leghatásosabb képtömörítő, amely mind a tömörítés/kicsomagolás technikája, időigénye és képminősége szempontjából minőségi.

A PCX formátum a PC Paintbrush formátuma, amely az egyik legrégebbi DOS alatt működő bitmap rajz alkalmazás.

GIF = Graphics Interchange Format speciális web fájlformátum, amelyet a CompuServe fejlesztett ki,  hogy megkönnyítse a grafikus fájlok hálózaton történő cseréjét.

Guédon, Jean-Calude: La planete cyber : Internet et cyberespace. Paris : 1996, Gallimard.

A vélemény a Biblio-fr levelezőlistán hangzott el.

Haeberli, David: Le web n’a plus gu’une certitude: l’information va devenir payante  = Le Temps. Science & Multimedia. 2001. Novembre 13.  A cikk lényege, hogy a legjobb internethelyek felelősei azon törik a fejüket, hogyan lehetne megfizettetni az információkat az internetezőkkel, mivel az információ előállítása – legyen az papíralapú, vagy elektronikus –,  mindig igen költséges. Pénzmegtakarítást az elektronikus változatnál kizárólag a terjesztésnél lehet megtakarítani. Megjelent még: Biblio-Culture, No 159. 2001. Novembre, pp. 22-23.

Gyakorlatom színhelye, a Lyoni Bibliotheque Municipale szintén rendszeresen kapta a nemzeti bibliográfiából származó rekordokat a BNF-től.

Jean-Didier Wagneur szíves közlése e-mailben.

A cím bizonyára a XVI. században élt és „a német Pliniusnak” nevezett Conrad Gesnernek, az irodalomtörténetnek új irányt kijelölő főművének, a Bibliotheca universalisnak eszmeiségére rímel. Híres mondása, mely szerint „katalógus nélkül a könyvtár csak rendezetlen könyvhalmaz” jól illik e mai projekthez is, melynek fő célja egy nemzetközi összefogáson és együttműködésen alapuló tervnek, „a világ virtuális könyvtárának ” létrehozása.

Ezek: A „világleltár” elkészítése  – Felelős: Japán, EU Közösség; Az internacionális képzés és oktatás megteremtése – Felelős: Franciaország, Németország; Szupergyors szupersztráda kiépítése, a hálózatok kompabilitásának globálissá tétele – Felelős: Japán, Kanada; Az egyetemes világkönyvtár, a Bibliotheca Universalis életre hívása – Felelős: Franciaország, Japán; A világ kulturális örökségének multimédiás módon való hozzáférhetővé tétele, elektronikus múzeumok létrehozása – Felelős: Franciaország, Olaszország; A környezetvédelem és a természeti erőforrások ellenőrzése  – Felelős: USA; A GEMINI, vagyis az eseményekről és a rendkívüli helyzetekről tájékoztató globális információs rendszer kiépítése – Felelős: Kanada; A világméretű egészségvédelmi rendszer megvalósítása – Felelős: Európai Közösségek; A kormányok közötti közvetlen kapcsolat létesítése – Felelős: Egyesült Királyság;  A világot átfogó piac kialakítása a kis-és a közepes vállalkozások számára –  Felelős: Európai Közösségek, USA, Japán; A tengeri információs rendszerek megépítése – Felelős: Európai Közösségek, Kanada

Az Adobe cég szoftvere, a PDF amely a .pdf kiterjesztésű (= portable document format), hordozható és az interneten egyre inkább elterjedt szöveges állományok olvasására/nyomtatására használatos szoftver.