38. évfolyam, 1992. 2. szám
Archívum

Két hónap alatt CD-ROM: megcsináltuk és maguknak is sikerülhet!

Amanda Siewling Lo, Yu-Huei Lainer, Ching-chih Chen

A szerzők "Two mounths to a CD-ROM: We did it and so can you! (The Fourth International Conference on New Information Technology, Budapest, 1991. dec. 2-4. pp. 109-120.) c. tanulmányát Orbán Éva fordította.

Bevezetés

Az utóbbi néhány évben az elektronikus CD-ROM kiadás hihetetlenül gyors fejlődésének lehettünk a tanúi. Jelenleg több, mint 1500 CD-ROM cím kapható kereskedelmi forgalomban. Ezzel összhangban az információs központokban és könyvtárakban is egyre gyorsabban terjed a CD-ROM használata (Chen, 1991.) Ennek ellenére a legutóbbi időkig a költségek visszatartották az egyéni szervezeteket attól, hogy maguk is CD-ROM előállítására vállalkozzanak. Így csak néhányan lennének érdekeltek a CD-ROM készítésében.
A személyi számítógépek hardverjének és szoftverjének a fejlődése az utóbbi időben (és különösen az olcsó asztali lemezszerkesztés megoldása a mikrogépek számára, ami ma már közhelynek számít az irodákban) a könyvtárosok és információs szakemberek számára is lehetővé tette annak megfontolását, hogy maguk is belevágjanak az asztali CD-ROM kiadásba. Könnyen felmérhető, hogy milyen lehetőségek rejlenek ebben a világ könyvtárai és információs központjai számára. A CD-ROM számos előnnyel kecsegtet, és ez feledteti a velejáró nem kis problémákat, a költségeket, a hozzáférést, a terjesztést, amelyekkel a könyvtárosoknak és információs szakembereknek meg kell küzdeniük. A CD-ROM óriási tárolókapacitása, szállíthatósága, valamint az, hogy könnyűszerrel használatra kész állapotba hozható, ideális adathordozóvá teszik az információszolgáltatás és -elosztás terén. Hasonlóképpen nagyok a CD-ROM lehetőségei az információhozzáférés és -megosztás elősegítésében a fejlődő és gyengébben fejlett országok könyvtárai és információs központjai számára.
A könyvtár- és információtudományi doktori program két hallgatója a Simmons College-ben 1991 nyarán intenzív tanfolyamot végzett Chen professzornál, és nagy lelkesedéssel tanulták meg a saját CD-ROM készítés csínját-bínját. A professzoruk szervezte NIT'91 konferencia, illetve az, hogy az új információs technológiáról szóló konferenciasorozat korábbi anyagait asztali kiadványszerkesztéssel állították elő, arra ösztönözte a két hallgatót, hogy kihasználják a kínálkozó lehetőséget ennek a nagyszabású és hasznos tervnek a végrehajtására. Ahelyett, hogy a folyamattal többé-kevésbé elméleti síkon ismerkedtek volna meg, úgy döntöttek, hogy közvetlen tapasztalatokat szereznek a CD-ROM előállításában, amely a Chen által szervezett mind a négy konferencia anyagát összefogja:
- The First Pacific Conference on New Information Technology, Bangkok, 1987. június 16-18.
- The Second Pacific Conference on New Information Technology, Singapore, 1989. május 29-31.
- The Third International Conference on New Information Technology, Guadalajara, Mexico, 1990. november 26-28.
- The Fourth International Conference on New Information Technology, Budapest, 1991. december 2-4.
Bár látszólag reménytelenül rövid a csupán két hónapos határidő, a projekt mégis lehetséges, hiszen a korábbi anyagok több, mint a fele már géppel olvasható formátumban áll rendelkezésre.
Az ötlet 1991. szeptember közepén született, és a tényleges munka már a következő héten megkezdődött.

2. A tervezés folyamata

A tervezés minden program legkritikusabb szakasza. Chen és Wiggins (1990) multimédia munkájukban, amellyel a CD-ROM technológiát és termékeket mutatják be (1. ábra) világosan szemléltetik a CD szerkesztés termelési láncát (2.-3. ábra). Nyilvánvaló, hogy a kezdettől a befejezésig az asztali vagy más eljárású CD-ROM szerkesztés a következő lépésekben zajlik:

Programunk sikere érdekében a fenti lépések mindegyikét szigorúan kézben kell tartanunk. Ezen kívül még számos logisztikai problémát is meg kellett oldanunk a tervezés során. Ezek a következők voltak:

Mivel a NIT nem profit-orientált konferenciasorozat, amelyet Chen a nemzetközi könyvtár- és információügyhöz való hozzájárulásként szervez, az egyik legsúlyosabb leküzdendő probléma valószínűleg az anyagi korlátozottság lehet. Szerencsére több szoftveres cég hozzájárult a munkánkhoz. A rendelkezésünkre álló idő nem tette lehetővé, hogy az asztali CD szerkesztő programrendszerek között összehasonlító vizsgálatokat végezzünk, a Knowledge Access International KAwareTM Disk Publishert választottuk. Sőt, anyagi természetű aggodalmaink is szertefoszlottak a munka derekán, amikor is a Disc Manufacturing, Inc. (DMI), amely a Philip Dupont Optical Inc. (PDO) alappéldány készítő és másoló berendezéseit megvásárolta, nagylelkűen beleegyezett, hogy CD-ROM-unkat ingyenesen, a nemzetközi fejlődés elősegítésére előállítsa.
Amint várható volt, jelenleg majdnem az összes asztali CD szerkesztő program futtatható IBM személyi számítógépen, vagy 100%-osan kompatibilis, legalább 640KB RAM-mal rendelkező gépen.

 

2. ábra
A HyperIntro to CD-ROM Technology and Products CD szerkesztő modulja, amely a CO-ROM termelési láncot mutatja be

 

3. ábra
A HyperIntro to CD-ROM Technology and Products egyik képernyője, amely a termelési lánc folyamatábráját mutatja be

 

2.1 Adatgenerálás és adatbázisfejlesztés

Az elektronikus szerkesztés folyamatának első lépése, hogy meghatározzuk, milyen típusú információt kell megszerkeszteni. Az információforrások lehetnek szövegesek, mezőkre bontottak vagy képiek. E szakaszban alapvetően az információgyűjtés és annak elektronikus kezelése folyik. Az előbbi határozza meg azokat a formátumokat, amelyeket felvesznek, míg az utóbbi azt befolyásolja, hogy milyen módon lehet a kívánt információt elektronikus formába önteni és kezelni.
CD-ROM-unk potenciálisan mindhárom információtípust tartalmazhatja, ám a résztvevőkre vonatkozó adatok kivételével, amelyek mezőkre osztott adatbázis formátumban érkezhetnek, szinte valamennyi adatállományunk teljes szöveget tartalmaz. Az egyes konferenciai anyagok átlagosan 45 képet tartalmaznak. Ha egy cikket képek illusztrálnak, nagyon hiányozhatnak, ha nem kerülnek a szöveg mellé. Ezért kezdettől fogva úgy határoztunk, hogy mind a szöveges, mind a képi információ szerepeljen a CD-ROM-on.
Pontos leltárt készttettünk arról, hogy az egyes konferenciai anyagok hány cikket tartalmaznak, és a három kiadott konferenciai anyag képeinek számát is meghatároztuk. Készítettünk egy naprakész jegyzéket a konferenciai anyagokban szereplő tanulmányokról, amelyben egyértelműen jeleztük, hogy milyen típusú információról - nyomtatott anyagról vagy elektronikus adatállományról - van szó. Ha elektronikusan rögzített adatállomány állt a rendelkezésünkre, az egyes adatállományok méretét is feljegyeztük, és körültekintően megvizsgáltuk, hogy kompatibilisek-e a rendszerrel (IBM PC vagy Mac adatállomány stb.) és milyen szövegszerkesztő szoftverrel készültek. Az IBM-en a WordStar Professional, a WordPerfect 5.0, a Microsoft Word és a Word 4.0, a Macintosh-on a MacWrite, a WordPerfect szövegszerkesztő szoftvereket használják általában. Nem szabad átsiklani e fölött a jegyzék fölött, mert nagyon fontos lépés az adatok konzisztens konverziója felé, hiszen minden szövegszerkesztővel készült adatállományt az ASCII-re kell konvertálni. A 4. konferenciára érkező tanulmányok különböző időközönként érkeztek a szerkesztőhöz, és néhány ezek közül csupán egy héttel a konferencia előtt, ezért mindegyiket az érkezéskor, egyenként dolgoztuk fel.

2.2 Adatelőkészítés

2.2.1. Adatkonverzió

2.2.2. Adatállomány szerkesztés

A CD-ROM adatelőkészítés egyik leglényegesebb lépése ez. Amikor a rendelkezésünkre álló információt és/vagy adatokat összegyűjtöttük és elektronikus formátumúvá alakítottuk, az információs adatállományokat indexelnünk, formatálnunk kell, és olyan logikai formátumba kell szerveznünk, amely meghatározza a lemez tervét. Ahhoz, hogy az indexelésre készen álljanak az adatállományok, mindegyiket először egyenként, majd összeolvasztva kell előkészíteni és elemezni.
Mielőtt a KAwareTM Disk Publishert lefuttatnánk, hogy a forrás-adatállományt indexelje, és ezáltal teljesen visszakereshetővé tegye, a forrásadatállományoknak és képeknek egy igen aprólékos folyamaton kell keresztülmenniük: jelzőket kell kitenni, el kell készíteni a speciális szójegyzékeket, kifejezésjegyzékeket, meg kell határozni a tiltott kifejezéseket stb. A mi programunkban minden konferenciai anyag egyetlen adatállományt alkot. Mindegyiket külön elemeztük, készítettük elő és indexeltük, mielőtt a négy konferencia anyagát összeolvasztottuk volna (a WordPerfect segítségével), és egy menetben lefuttattuk volna a lemezszerkesztőn.
A KAwareTM Disk Publisherrel végzett előzetes adatállomány előkészítés során az adatállományokat jelzőkkel és jelzésekkel láttuk el. A 4. ábra mutatja, milyen egy jelzőkkel és jelzésekkel preparált adatállomány. A jelzéseknek elsősorban az a szerepük, hogy az olyan besorolási adatokat mint a SZERI, CÍM, REFERÁTUM a KAwareTM visszakereső rendszerének tartalomjegyzékében megjelentesse. Ha egy adatállományhoz már hozzárendelték a jelzőket, lefuttatható a KAwareTM Disk Publisher szövegelemző programjával, hogy minden olyan szabálytalanságot vagy problematikus oldalt, sort kiszűrjenek, amely a végső szakaszt, a szöveg indexelését felboríthatná. A második szakaszban készítik elő az adatállományt indexelésre. Az 5. ábrán látható, hogyan határozzák meg a problémákat, ha vannak a szövegelemző jelentésben.

4. ábra
A jelzővel ellátott adatállomány mintája

TZ=\THE COMING OF DIGITAL VISUAL INFORMATION AGE: IMPLICATIONS FOR INFORMATION ACCESS

AU=\..Ching-chih Chen
Graduate School of Library & Information Science
Simmons College Boston, MA 02115, USA

KW=Keyword: Analog Videodisc, Digital technology, Multimedia Technology, Visual Information Age, Information Access, PROJECT EMPEROR-I, Photo-CD, Scanning Technology, Electronic Imaging.

AB=\.. Abstracts: A brief overview on the recent technological development in the area of multimedia technologies to enhance information access. Topics covered will include analog videodisc, digital technologies and their interactive applications, and the current media-mixed information provision environment. As an illustration to the technological development discussed, an update the recent development of the 6-year R&D project, PROJECT EMPEROR-I, will be given. Implications of these technologies in enhancing information access and provision will be discussed.

5. ábra
Szövegelemző jelentés

 

6. ábra
A képbehívás példái

 

2.2.3. A képi adatállomány előkészítése

A képi adatállományokat a KAwareTM Disk Publisher F3 (Other Utility) részébe kell sűríteni. A tömörített képeket *.CPR-ként állítják elő és mentik ki. A tőmörített képi adatállomány a KAware2TM-mel kereshető vissza, miután a szöveges adatállományt egy "image call" (képhívás) jelzővel látják el. A 6. ábrán látható, hogy a képeket adatállományok neveivel jelölték, mint pl. IM=9ICHEN0%.CPR (ez nem látható a felhasználó számára), és az ALT-1 megnyomásakor válik láthatóvá. Mint a 2.2.1 részben említettük, nem minden képi adatállomány, amely TIFF címkével vagy kiterjesztéssel szerepel, kompatibilis automatikusan a többivel, és tömöríthető a KADIval (KAwareTM Disk Publisher).
A mi programunkban 184 képi adatállományt kellett kezelnünk, amelyek között volt vonalas és tónusos kép, a méretük pedig 80KB-tól 300KB-ig terjedt. Egy IBM-kompatibilis optikai leolvasó készlet jelentette a megoldást a TIFF tömörítéssel kapcsolatos problémákra. Az olcsó Marstek ScanKit egy 4,5 x 4,5-os kézi leolvasóból és az optikai leolvasó szoftverből áll. A letapogató szoftver segítségével 4,5"x 4,5" méretű képek optikai leolvasására van mód, és ezeket a képeket különböző formátumokban (.TIFF, .PIX, TIF 1D stb.) lehet kimenteni. A mi esetünkben végül is a "TIF 1D"-t választottuk, miután több mással is kísérleteztünk. Ez a formátum a KADI-val is működött. Miután a leolvasott képeket a Marstek ScanKittel, TIF 1 D-ként kimentettük, a képeket (*.TIF) a képtömörítő segítségével összenyomjuk a megfelelő *.CPR-t előállítva.
A következő lépés az adatállomány áthelyezése a MOVE segítségével, amikor a *.CPR-t a root dir C:\ egyik alcímjegyzékébe helyezik. A *.CPR azon címjegyzékének egyik alrészlegében kell hogy legyen, amelyben a forrás-adatállományt tárolják. Ez a MOVE hasonló a COPY utasításhoz a DOS-ban. A 7. ábra mutatja, hogyan segíti a KAwareTM Disk Publisher a tömörített képi adatállományok mozgatását, áthelyezését.
Érdemes megjegyezni, hogy mivel olcsó optikai leolvasót használtunk, a leolvasott képek nem a legjobb minőségűek. Sőt, az idő szűkössége miatt sem tudjuk tovább finomítani a képfeldolgozást. Ennek ellenére, örömünkre szolgál, hogy lemezünkkel biztosítani tudjuk a felhasználóknak a képvisszakeresés lehetőségét, egyben a közelítés négy szintjét is.

7. ábra
Tömörített képek mozgatása

 

2.2.4. Indexelés

Ha egy adatállomány elkészült, és a szükséges kisegítő adatállományok - az adatállomány definiálás, a stoplista, a kifejezések jegyzéke - is rendelkezésre állnak, megkezdhetjük az adatállomány indexelését a szerkesztővel. A 8. ábrán látható a KAwareTM-mel történő indexelés néhány lépése:

Talán érdekes megemlíteni, hogy - mint a 8. ábrán látható - a négy NIT konferencia anyagának teljes adatállománya 84.466 szövegsorból áll, amelyek 44.561 unikus szót tartalmaznak. A NIT adatállomány teljes mérete mintegy 4MB, és az indexelési idő 48 perc 43 másodperc. A szöveges adatállományon túl a NIT CD-ROM mintegy 180 képi adatállományt is tartalmaz. Bár viszonylag olcsó kézi leolvasót használtunk, a felbontást 400 dpi-re tudtuk állítani. Számos kép eredetije azonban, különösen a Bangkokban rendezett konferenciáról származók, gyenge minőségűek voltak, így az optikai leolvasással nyert képek nem olyan minőségűek, amilyent mi szerettünk volna. Az egyes képek mérete változó, 80KB-tól 350 KB-ig terjed, így a képi adatállomány mérete tömörítés előtt több, mint 40 MB-ra rúgott. A tömörítés után azonban a méretet radikálisan csökkentettük, mintegy 9 MB-ra.

8. ábra
Az adatállomány futtatása a TEXT INDEXER-en

 

2.2.5. Teljes szöveges keresés

Ha egyszer túljutottunk az elemzés, előkészítés és indexelés nagy pontosságot igénylő folyamatain, a KAware2TM Retrieval System segítségével teljes szöveges keresést végezhetünk. Az F3 (Válogatás) gomb megnyomásával a kereshető mezők jegyzéke jelenik meg , pl. TARTALOM, KONFERENCIA, CÍM, SZERZŐ stb. A TARTALOM kiválasztásakor a használó egy olyan új menüt pergethet végig, amely a cikkek cím, szerző és referátum szerinti jegyzékét tartalmazza. A kért cikk teljes szövege megjeleníthető, ha bármelyik kiválasztható tételt kérik.

2.3. Összeállltás és előállítás

2.3.1. Feldolgozott adatállományok összeállítása

Ha minden adatállomány készen áll az alaplemez előkészítésére, meg kell fontolnunk, milyen alternatív tárolóra töltsük be az adatállományokat az IBM PS/2 merev lemezéről.
A Pipeline System, amelyet a Knowledge Access kölcsönzött a számunkra, nem volt alkalmas konfiguráció arra, hogy a mi PS/2-nkkel használjuk. Megpróbáltuk egy 386-ossal felállítani, de még így is számos probléma maradt, amelyet még a KAI kisegítőkkel sem sikerült hamar megoldani. Az időhiány arra kényszerített bennünket, hogy floppyra töltsük be az adatállományokat. Az installáció egyes technikai nehézségeivel meg kellett alkudnunk, míg másokon sikerült úrrá lennünk, és ekkor készültek d a KAwareTM Disk Publisher által létrehozott adatállományok arra, hogy a DMI-be bevihetők legyenek, ahol az alaplemezt előkészítették, véglegesítették és sokszorosították. Ezt megelőzően azonban a következő előkészületeket kellett végrehajtani:

9. ábra
Keresés és visszahívás a KAware2 Retrieval System-mel

 

2.3.2. Az alaplemez előkészítése, véglegesítése és sokszorosítása

Többnapos kemény munka után végül becsomagoltuk feldolgozott adatállományainkat, és a Federal Express-szel 1991. november 14-én elküldtük a DMI-nek Wilmingtonba. (Delaware államba). Az adatállományokat a DMI-ben betöltötték és hardverrel szimulálták. Ugyancsak a DMI készítette el a teszt anyagot 1991. november 18-án, amit a következő napon mi ellenőriztünk (ld. a 10. ábrát). Miután meggyőződtünk róla, hogy nincs benne hiba, a 9 sávos szalagot továbbítottuk a DMI hunsville-i üzemegységéhez Alabamába még ugyanazon a napon. Végül megtérült minden fáradságunk, amikor az újonnan nyomtatott CD-ROM-ok a tasakjukban pontosan megérkeztek, éppen időben ahhoz, hogy a NIT'91-re Budapestre elhozzuk őket 1991. november 28-án.

10. ábra
Az ellenőrző lemez megérkezett!

 

2.4. Terjesztés

Büszkén mondhatjuk, hogy asztali szerkesztésű CD-ROM-unkat, amely a tervezéstől számított két hónapon belül készült el, ingyen adhatjuk e konferencia résztvevőinek a kezébe.

3. Következtetés

Nem volt könnyű ez a program, mert mind a technológia, mind a folyamat új, és kevés ember járatos e technológia ellenőrzésében az amatőr asztali megoldás esetén. Bár a szoftvert forgalmazó cég felajánlotta, hogy amikor csak szükségünk van rá, technikai segítséget nyújt számunkra, többnyire olyan nehézségek és problémák merültek fel - akár képfeldolgozásról, akár a hardver konfigurációról vagy az adatállományok összeolvasztásáról volt szó -, amelyek a forgalmazó szakemberei számára is újak voltak. Így sikerült kitartással és próbálkozások révén a nehézségeket leküzdenünk. Eközben problémáink több megoldási módját ellenőriztük és vetettük el. Rengeteget tanultunk, és csodálattal töltöttek el bennünket azok a lehetőségek, amelyeket ez az alkalmazás a könyvtárak, információs központok és levéltárak számára tartogat. Korlátozott forrásainkkal is megvalósítottuk "a lehetetlent", és erre maguk is képesek! Használják ki a rendelkezésükre álló eszközökből fakadó előnyöket, és engedjék, hogy azok dolgozzanak maguknak!

Köszönetnyilvánítás
Az ilyen intenzív program csak számos ember és szervezet közreműködésével valósulhat meg. Szeretnénk kifejezni hálánkat a Knowledge Access International-nak és elnökének, Dr. Matilda Butler-nek, hogy hozzájárultak, hogy használjuk a KAwareTM Disk Publishert és a KAware2TM Retrieval System-et termékünk előállításához. Megköszönjük Fred Cash-nek és Sue Davy-nek, a Knowledge Access International munkatársainak, hogy hosszú órákat töltöttek a telefon mellett, hogy megbeszéljék velünk technikai problémáinkat. A DMI és marketing igazgatójának, Rusky Capernek a nagylelkű adománya nélkül nem nyújthatnánk át ingyen a CD-ROM-ot a NIT'91 résztvevőinek. J. Philips Busk, a DMI munkatársa felbecsülhetetlen értékű műszaki tanácsokkal szolgált, és Wendy Buyea és Calyton Summer szombatjuk egy részét áldozták ránk. Valóban szerencsésnek érezzük magunkat, hogy a DMI e szakembereivel dolgozhattunk. Nagyra értékeljük Hugh Blackmer támogatását a Simmons College-tól. Végül szeretnénk megköszönni Lora Lopes-nek, hogy ellenőrizte nemcsak a NIT'91 kéziratait, hanem részben a másik három konferencia kéziratait is. Az ő és két kisegítő diák, Jenn Desormeau és Magi Rami munkáját nagyra értékeljük.

Országos Széchényi Könyvtár
Észrevételek (2000/04/12)