„A tudomány … utakat nyithat a faj krónikájának megteremtéséhez, tárolásához és eléréséhez.”  
                                                                                                                          (Bush 14. o.)

Bevezetés

Vannevar Bush 1945-ben megjelent (az utóbbi öt évben a Web of Science alapján 203 alkalommal idézett) híres cikkének2 alapgondolata indította el egy új tudományterület, az információkeresés (information retrieval) megszületését és azóta is tartó gyors fejlődését.

Az információkeresés életkorait (1945-2015) a shakespeare-i felosztás szerint tárgyaló írás (Lesk) az 1990-es éveket a „kapuzárási pánik”, (mid-life crisis) a XXI. sz. első évtizedét pedig a „kiteljesedés” (fulfillment) korszakának tekinti.

Az 1990-es évek fejlődési irányai, ill. problémái az információkeresés terén:

  • a dokumentumok teljes szövegének elérhetősége és kereshetősége, on-line katalógusok nyilvános használatának megvalósulása, az internet technológiai forradalma;
  • Vannevar Bush személyi érdeklődés szerinti információtárolási modelljének megvalósulása;
  • a fejlett keresési algoritmusok kidolgozásában és használatában még mindig csupán a könyvtárak érdekeltek, kereskedelmi rendszerekben való felhasználásuk nem jellemző;
  • a keresés értékelése terén a 90-es évek a TREC (Text REtrieval Conference) felmérések és konferenciák időszaka, melynek konklúziója: további kutatásokra van szükség annak megértéséhez, hogy hogyan fogalmazzák meg az emberek a kérdéseiket és hogyan alakíttathatunk ki olyan kérdéseket, amelyekre jó válaszokat tudunk produkálni.

A XXI. sz. első évtizede a következő kutatási-fejlesztési irányvonalakat mutatja:

  • hang- kép- és videofájlok kezelésének, indexelésének, visszakeresési lehetőségeinek (kép- és hangfelismerés) kutatása;
  • könyvtári állományok retrospektív anyagának konvertálása;
  • folyóiratok retrospektív anyagának elektronikus formában történő elérhetősége, tárolása.

Napjaink információs szakembereinek feladata (a 90-es évek eredményeire támaszkodva és a következő évek kutatási irányának ismeretében) a nagy tömegű információmennyiségben való tájékozódni tudás kialakítása.

A keresett információ gyors és hatékony elérését befolyásoló tényezők közül az indexelés minősége és a keresőprogram képességei a legfontosabbak. E tényezők jelentőségét igazolják az említett faktorokra irányuló kurrens kutatási-fejlesztési törekvések.

A megfelelő stratégia kidolgozása a szakterület feltárására és kereshetővé, elérhetővé tételére csak a párhuzamos törekvések előzetes áttanulmányozásával lehetséges. Az interneten jelenleg észlelhető alapszabályok, törekvések:

  • felhasználó-központúság (többféle indexelési eljárás és keresési módszer párhuzamos alkalmazása a jobb keresési eredmények érdekében, felhasználói felület-tervezés);
  • adatcsere-formátumok (MARC formátumok), metaadatok (Dublin Core, TEI, Harvest);
  • szabványosítási törekvések (XML, SGML, XHTML, Z39.50);

Egy átlagos kereséskor a használó szempontjából tulajdonképpen közömbös, hogy honnan van az információ: bibliográfiából, katalógusból vagy weboldalról származik. Tudományos információk keresése esetén azonban szelektálási szempont lehet a különböző információtípusok megkülönböztethetősége. A lényeg a felhasználó számára szükséges információ gyors, hatékony megtalálása. Ennek alappillére a kölcsönösen egymásra épülő megfelelő adatbázis-szerkezet és keresési feltételek megléte. A felhasználó-központúság ezen alapelvét szem előtt tartva, a megfelelő technikai feltételek kifejlődése révén lehetőség van adatbázisok összekapcsolására közös felhasználói felületen (közös katalógusok, átfogó tezauruszok építése, olyan szakterületi keresők – pl. Health on the Net –, melyek egyetlen keresési feltételre több forrásból többféle, jól elkülöníthető információtípusokat kínálnak eredményként).
A nyilvánosan elérhető on-line könyvtári katalógusok 1. generációja (1970-es évek közepe) tulajdonképpen a cédulakatalógus gépesített változata volt (1. ábra) azzal megegyező adatokkal és visszakeresési lehetőségekkel. Az 1980-as évek közepére új keresési lehetőségek (kulcsszavas keresés, Boole-operátorok használata – összetett keresés -, böngészés) megjelenésével kialakult az OPAC-ok 2. generációja. A mai könyvtári rendszerekben használatos webfelületű on-line katalógus (a WebPAC, a 3. generáció, a 1990-es évek második felétől) a számítástechnika, s elsősorban a hálózatok fejlődésének eredménye. A WebPAC felhasználói felülete és keresési lehetőségei megegyeznek bármely on-line bibliográfiai adatbázis keresési lehetőségeivel.

1. ábra

Megjegyzések

Néhány megjegyzést szeretnék tenni a közös katalógusok webfelületének vizsgálata előtt:

  1. Adatbázisról (adatbázisokról) van szó, melybe ma már szabványos módon (MARC formátum) visszük/töltjük be egyre többféle dokumentumtípus adatait. Az egységesített formátum azért fontos, mert nagyon jól definiálhatók azok az ismérvek, melyek szerint a rekordok visszakereshetők, másrészt rugalmasságot biztosít abban a tekintetben, hogy a definiált ismérvek, visszakeresési lehetőségek közül melyeket emeljük ki, melyek szerint tesszük elérhetővé az információkat, s ezeket a lehetőségeket egyrészt változtatni tudjuk az adatbázis változásaival párhuzamosan (új dokumentumtípusok megjelenése, helyi információk, kapcsolódási lehetőség a dokumentum teljes szövegéhez, adatbázisokhoz, kép, ill. audiovizuális illusztrációkhoz, fájlokhoz, más on-line katalógusokhoz és webforrásokhoz), másrészt a felhasználók igényeihez tudjuk igazítani őket.
  2. Webfelületről beszélünk, ahol az egyes oldalak könnyen alakíthatók az adatbázisok adottságai, illetve a felhasználói szempontok szerint (pl. magyarázatok, példák egyszerűen beilleszthetők). Ugyanakkor az adatbázishoz való igazodáson kívül a WebPAC-ok felhasználói felületének tervezésekor figyelembe kell venni bizonyos web tervezési szempontokat, melyek az ide vonatkozó legújabb, felhasználócentrikus szakirodalomban részletesen definiálva vannak. A WebPAC előnye az előző generációval, illetve más, „hagyományos” on-line katalógussal szemben a grafikus eszköztár mellett a web adta lehetőségek kiaknázása: az információ szervezésének hipertext-modellje – a már említett kapcsolódási lehetőségek a különböző információ-, illetve dokumentumtípusok szupermarketévé tették az on-line katalógust. Ily módon a „katalógus” fogalma kitágult, hiszen rég átléptük már a könyvtár falait, és nem csupán egy adott könyvtárban fellelhető dokumentumokról adunk tájékoztatást.
  3. A kitűnő technológiai lehetőségek és a közös felhasználói felület miatt nem teszek különbséget a fizikailag egy helyen tárolt, illetve a virtuálisan közös (ám fizikailag elkülönülő) katalógusok között. Induljunk ki, tehát az egyes OPAC-ok ideális felhasználói felületéből s ezt fűszerezhetjük azokkal a plusz szolgáltatásokkal és lehetőségekkel, amelyeket egy közös katalógus nyújthat a felhasználóknak.

WebPac-ok felhasználói felülete

Visszakeresési lehetőségek (keresőfelületek)

A felhasználó szempontjából jelentkező problémák a keresés elvégzésekor:

  • Fogalmi: az információszükséglet keresőkérdéssé alakítása „Milyen kifejezést használjak?”
  • Szemantikai: „Milyen keresési technikát használjak?” (Egyáltalán: mit jelent a „keresés”, ill. a „böngészés”?)
  • Technikai: számítógéphasználati jártasság hiánya és szintaktikai problémák („Mark Twain vagy Twain Mark?” – ha még azt is tudja, hogy Samuel Clemens néven is szerepelhet, fogalmi probléma is társul a szemantikaihoz). Ide sorolható még a kis- és nagybetűk, illetve ékezetek használatának kérdése.

Ezen problémák feloldására sokat tehetünk a keresési környezet megfelelő kialakításával:

  • az OPAC kezdőlapján kiválasztható legyen az alkalmazni kívánt keresési mód, s a választás megkönnyítésére magyarázzuk meg azokat, ajánljunk információszükséglet szerinti megoldást; Adjuk meg, mely mező(k)ben és milyen módszerrel lehet keresni az egyes keresési lehetőségekkel;
  • ismertessük meg a felhasználót a katalógusban használt tárgyszórendszerrel (ismertető, példák, hierarchia), az legyen kereshető;
  • óvakodjunk az egységes, hosszú súgóoldaltól, helyette építsünk ki az adott oldalon / helyzetben / környezetben használható (context-sensitive) súgó-rendszert rövid, érthető magyarázatokkal és példákkal. Adjunk tippeket eredménytelen kereséskor, és további tippeket, manőverezési lehetőségeket eredményes kereséskor.
  • mindig tudja a használó, hogy hol van, egyértelmű legyen, hogy melyik keresési módot használja éppen. Könnyen át tudjon térni más keresési módszerre, ha a kiválasztott módon nem kielégítő a keresés eredménye.

A közös katalógus sajátossága: egyértelmű legyen, hogy mely könyvtárak katalógusában keres a felhasználó, az egyes könyvtárak állományában külön-külön is tudjon keresni (lelőhely vagy lelőhelykód szerint – ezeket fel kell oldani!).

Keresési módok

A továbbiakban a három alapvető keresési mód jellemzőit foglalom össze:

Böngészés

A katalógus egyes indexeiben való böngészésre, a keresőkérdés pontosítására szolgál. A böngésző kérdés beírásakor a kiválasztott (szerzői, cím, tárgyszó, stb.) indexbe való belépési pontot adjuk meg. A böngészés eredménye az adott index egy részlete, amelyből kiválasztható az a tétel (cím, szerző, tárgyszó), amelyhez tartozó találatokat ki akarjuk keresni a katalógusból.

2. ábra

Egyszerű/gyors keresés

A kiválasztott szempont (szerző, cím, tárgyszó, lelőhely, osztályozási jelzet stb.) szerinti gyors keresésre szolgál. Tudjon a felhasználó dokumentumtípusra (pl. internet dokumentumok, folyóiratok, stb.), illetve lelőhelyre szűkíteni, változtathassa a találatok oldalankénti számát.

3. ábra

Összetett keresés

Több keresés összekapcsolása logikai operátorok (AND, OR, NOT) segítségével. Ne legyen túl bonyolult a keresőképernyő.

A National Library of Medicine keresőjében kiválasztható, hogy a kifejezéseket egységként vagy egyenként kezelje, valamennyi vagy bármelyik szóra keressen, NOT operátort is használ (nyilván azért mert a MeSH a tárgyszórendszere).

  • A VOCAL keresője kicsit zsúfolt, de nagyon jók és egyértelműek a szűkítési lehetőségei (kiadási idő, nyelv, típus). Az oldalankénti öt tétel megjelenítését alapbeállításban kevésnek tartom, mert sokat kell lapozni (közös katalógus lévén sok találatra lehet számítani), és a felhasználó rendszerint elfelejti átállítani.

4. ábra

A Magyar Orvosi Bibliográfia keresőfelülete túl bonyolult, nem egyértelmű a név keresése, a dokumentumtípusokból sok van, nem tudhatja a használó hogy azok mit takarnak (gyorskatalogizált, nem katalogizált), mi lehet a különbség az információhordozó és az információhordozó típus között?

5. ábra

A tárgyszavas keresés problémája

Módszerek

A keresés terminológiája szerint a tárgyszavas keresés lehet

  • kontrollált szótáras (a pontos terminológia ismerete nélkül lehetetlen boldogulni),
  • kulcsszavas (természetes nyelvi) vagy
  • osztályozási jelzet szerinti.
  • A keresett mező szerint lehet
  • szabadszöveges (az egész rekordot végigkeresi) vagy
  • mezőnkénti.

6. ábra

A gyakorlatban a tárgyszavas keresés alatt az OPAC-ok jó része kulcsszavas keresést végez a tárgyszómezőben.

Problémák

Több tanulmány is kimutatta (Thomas), hogy a tárgyszavas keresések több mint fele eredménytelen (nincs találat vagy túl sok találat). Ennek számos oka lehet pl.:

  • a felhasználó által használt keresőkifejezés és a katalógus tárgyszórendszere nem egyezik (nem ismeri a rendszer által használt tezauruszt);
  • nem is tudja a felhasználó, hogy szabályos kifejezéseket kellene használnia;
  • helyesírási, elírási, tipográfiai hibák;
  • a felhasználó nem használja vagy nem ismeri a Boole-operátorok használatát;
  • a felhasználó nem ismeri a szakterületet;
  • a felhasználó nem tudja használni az OPAC-ot.

Az eredménytelen keresések eredményessé tételére alkalmazzák a kulcsszavas keresést, ám ennek két fontos hátránya van: vagy nem talál meg minden releváns tételt, vagy sok irreleváns találatot hoz (az irreleváns találatok száma többszöröse is lehet a releváns találatok számának).

Közös katalógusban további, nagyon súlyos probléma az egyes könyvtárak által használt tárgyszórendszerek különbözősége nem csak tartalmi-formai, de esetleg nyelvi szempontból is.

7. ábra

Találatok megjelenítése

Alapszabály a találatok megjelenítésekor, hogy a találati oldalakon legyen(ek) kiemelve a keresőkifejezés(ek), legyen kapcsolódási pont keresésmódosításhoz, új kereséshez, illetve más keresési módokhoz. Ajánljon a rendszer kapcsolatot a hasonló témában található rekordok halmazához (7. ábra). A lehető leghamarabb derüljön ki a dokumentum lelőhelye (HOL VAN, melyik könyvtárban), ha ezt a találati listán kódokkal, ill. rövidítésekkel oldjuk meg, azok jól észrevehető helyen fel legyenek oldva.

Találati lista

Példa értékű a Budapesti Műszaki Egyetem (BME) találati lista formátuma (8. ábra).

8. ábra

Tartalma a cím, szerző, megjelenés éve, amiből gyorsan választani lehet, nem kell valamennyi találat rövid formáját letöltögetni (9. ábra). A teljes rekord megjelenítéséhez elegendő a rekord sorszámára kattintani, táblázatos formája könnyen áttekinthető. Közös katalógusban a raktári jelzet helyett lelőhelykódokat adhatunk meg.

9. ábra

Hosszú vagy mezőnkénti megjelenítés

A 9., illetve 10. példán (9–10. ábra) nem tudjuk, hogy épp milyen megjelenítési módot látunk, a rövid, ill. hosszú formátum között csak 1-2 mező a különbség, és az, hogy megtudjuk, hozzáférhető-e a dokumentum, a hosszú módból még két lépésbe kerül. Ez az út lerövidíthető lenne a találati lista lelőhelykódjával, az intézmény státusz-információjához való egyszerűbb hozzáféréssel. Rendkívül kényelmetlen, hogy a „rövid” módban egyenként ki kell jelölni a rekordokat.

10. ábra

Státusz

A dokumentumok aktuális hozzáférhetőségéről szóló információ nagyon fontos, de közös katalógusban csak akkor ajánlott, amennyiben aktualizálható (van közös kölcsönzési adatbázis, illetve kapcsolódás az egyes kölcsönzési adatbázisokhoz), tehát valós adatokat tartalmaz.

Bibliográfiai/Irodalomjegyzék formátum

Nagy közös katalógusoknál különösen jó szolgáltatás, bibliográfia összeállításához használható. Tartalma: szerző, cím, megjelenés helye, kiadó neve, megjelenés éve. Érdemes lenne egy kiválasztott stílust alkalmazni, jó lenne, ha egy külön fájlba (pl. lemezre) lehetne menteni a kiválasztott rekordokat.

Letöltés

A letöltési funkció nélkülözhetetlen a könyvtárak közötti rekordcseréhez, ám meg kell magyarázni, hogy tudja a felhasználó, miről is van szó (11. ábra ).

11. ábra

Összegzés

A közös katalógusok felhasználói webfelülete kapcsán három fontos területet emelek ki:

  1. Milyen visszakeresési lehetőségeket biztosítunk, ezekhez milyen segítséget nyújtunk a használónak?
  2. Milyenek legyenek a találatok megjelenítési formátumai: tudnunk kell, hogy a felhasználó milyen célból keres (akar-e bibliográfiát összeállítani, hisz erre egy virtuális, nagy adatbázis kitűnő eszköz), s az egyes megjelenítési módokat, az azokban feltüntetett információkat ehhez tudjuk igazítani.
  3. Weboldaltervezési szempontok, amelyek – mivel az OPAC rendszerint nem önálló szolgáltatás, hanem egy vagy több intézmény honlapjának egy részét képező, az elektronikus szolgáltatások között felsorolható/felsorolandó részegység – a teljes webterületen megfontolandók: a szerkezet ‘laposítása’ (minél kevesebb kattintással jusson el a használó a keresett információkhoz), áttekinthetősége, esztétikussága, stb.

Plusz még egy szempont: a többnyelvűség, melyet ha felvállalja a rendszer, legyen valóban többnyelvű: figyelni kell a menüpontok, súgószövegek, mezőnevek fordítására, a lelőhelyek feloldására.

A flexibilisen, egyszerűen végrehajtható, sokszor többszörösen összetett keresésekkel a lehetőségek végtelen tárháza tárult fel. Ránk, információs szakemberekre, könyvtárosokra – az információ szervezőire – óriási felelősség hárul: hogyan és mit szolgáltatunk, és hogyan segítjük a tájékozódást. Egyre több(féle) információ egyre több(féle) keresési módja egyre nagyobb zavarba ejtheti a felhasználót, ezért fontos a felhasználói felület megfelelő tervezése, hiszen a célunk még mindig az, hogy a releváns információt hatékonyan találjuk/találják meg.

Irodalom

BAKONYI Géza – KOLTAY Klára: Tárgyszókezelés osztott katalogizálási környezetben. In: Networkshop ’2000
On-line: http://nws.iif.hu/NwScd/

BUSH, Vannevar: Út az új gondolkodás felé. Ford. Ivacs Ágnes. (Eredeti változat: As we may think. In: Atlantic Monthly, 176. 1945. júl. p. 101-108.)
On-line: http://mek.iif.hu/porta/szint/muszaki/szaamtech/ multimed/memex.hu

GIRILL, T.R.: Fuzzy matching as a retrieval-enabling technique for digital libraries.
On-line: http://www.asis.org/midyear-96/girillpaper.html

HILDRETH, Charles R.: Accounting for users’ inflated assessments of on-line catalogue search performance and usefulness: an experimental study.
On-line: http://informationr.net/ir/6-2/paper101.html

HILDRETH, Charles R.: Online catalog design models: Are trieval. UDT Occaswe moving in the right direction?
On-line: http://phoenix.liu.edu/~hildreth/clr-opac.html

LESK, Michael: The seven ages of information reional Paper.
On-line. http://www.ifla.org/VI/5/op/udtop5/

LONG, Chris Evin: Improving subject searching in Web-based OPACs: Evaluation of the problem and guidelines for design. In: Internet serching and indexing: The subject approach. Szerk.. Alan R. Thomas, James R. Shearer. New York: Haworth, 2000. 159-186.

MARCHIONINI, Gary – KOMLODI, Anita: Design of Interfaces for Information Seeking. In: Annual Review of Information Science and Technology. vol.33, 1998. 89-130.

NIELSEN, Jakob: Designing Web usability. Indianapolis: New Riders, 2000.
Rosenfeld, Louis, Peter Morville: Information architecture for the World Wide Web. Beijing: O’Reilly, 1998.

STERN, D., szerk.: Digital libraries, philosophies, technical design considerations and example scenarios. New York: Haworth, 1999.

Thomas, Alan A., James R. Shearer, szerk.: Internet searching and indexing: the subject approach. New York: Haworth, 2000.

YEE, Martha M: „Guidelines for OPAC displays” 65th IFLA Council and General Conference Bangkok, Thailand, August 20-28, 1999.
On-line: http://ifla.inist.fr/IV/ifla65/papers/098-131e.htm