A könyvtári weboldalak optimalizálása: főbb alapelvek, sikeres projektek1

Kategória: 2018/ 8

A mai felhasználó az információkeresés során elsősorban valamilyen keresőeszközt használ, egyre kevésbé fordul a könyvtári katalógushoz. Ezt támasztják alá a statisztikák is, amelyek bizonysága szerint a Google-ben másodpercenként mintegy 40 000 keresést indítanak. A könyvtárak a kulturális örökség digitalizálásának köszönhetően a tartalmaik jelentős részét elérhetővé tették az interneten, ennek ellenére továbbra is problémát jelent, hogy e tartalmakat nem lehet megtalálni az egyes keresőrendszerekben. A cikkben megmutatjuk, hogyan működnek az internetes keresők: mely tartalmakat látnak, és melyekkel vannak problémáik. Rávilágítunk, milyen szempontokat vesz figyelembe a Google a tartalmak értékelésekor és hozzáférhetővé tételekor. Mindezt olyan, a hatékonyságot jól példázó szlovák könyvtári weboldalakkal illusztráljuk, amelyek kifejezetten támogatják a digitális örökség internetes visszakereshetőségét.

Egyre inkább az internet válik a könyvtári szolgáltatások és termékek közvetítőeszközévé. Ezt támasztja alá a tartalmak tömeges digitalizálása: az Europeana digitális könyvtárban mintegy 49 millió digitális objektum található, és egyedül a szlovák Dikda projekt keretében 2,5 millió objektumot digitalizáltak. A könyvtári weboldalak digitális tartalmaikkal fontos virtuális kapcsolódási pontot jelentenek a felhasználó és a könyvtár között. A közösségi hálókkal szemben a weboldal állandó, stabil tájékozódási pontot jelent, ezért is érdemes külön figyelmet szentelni annak, hogy mennyiben felel meg a felhasználói igényeknek és a keresőmotorok működési alapelveinek.

Hogyan működik a keresőeszköz?

Koster olyan számítógépes programként definiálja a keresőmotort (spider, crawler), amely a web hipertextstruktúráját kutatja át abból a célból, hogy megtaláljon egy dokumentumot, valamint minden egyéb dokumentumot, amelyre az adott dokumentum hivatkozik.2 A talált dokumentumokat a kereső indexeli és elteszi őket az adatbázisába. A keresőprogram ezután összeveti ezeket a felhasználó által indított keresésekkel. A weboldalak relevanciáját, ezzel együtt a találati sorrendet a rendszer egy olyan algoritmus alapján állapítja meg, amely titkos, valamint állandóan változik. A weboldal-optimalizálással (search engine optimization = SEO) foglalkozó szakemberek ugyanakkor a rendszeres tesztelések révén meg tudtak állapítani néhány olyan alapelvet, amelyet a weboldalak visszakereshetősége érdekében javasolt figyelembe venni.

Fishkin  értelmezésében a SEO a webhely módosítására irányuló aktív tevékenység, amely a weboldal egyes aspektusainak (onpage factors), valamint a weboldalon kívül található jeleknek (offpage factors) a tökéletesítésén keresztül valósul meg, és azt a célt szolgálja, hogy növelje a visszakereshetőséget (megtalálhatóságot) és a keresőrendszerek felől érkező látogatók számát.3 Közelebbről a cél, hogy a weboldal a potenciális felhasználó által folytatott keresés során a konkurens oldalt megelőzően, lehetőleg az első, de legalább a harmadik találati oldalon jelenjen meg. Annak ellenére, hogy az egyes felhasználók a rendelkezésükre álló eszközöktől függően más-más találatokat kapnak, valamint dacára annak, hogy a műszaki és kreativitási tényezők az időben változnak, a Search Engine Land portál rendszeresen összegzi a főbb faktorokat a SEO-elemek periódusos táblázatában. Ebben a cikkben ismertetjük azokat az alapvető megközelítéseket, amelyek könyvtári környezetben is alkalmazhatók.

A weboldalak megtalálhatóságát befolyásoló főbb SEO-tényezők

A weboldal indexelhetősége

Bármely interneten elérhető digitális tartalom keresőeszköz általi megtalálhatóságának alapfeltétele, hogy a keresőrobot hozzáférjen az adott tartalomhoz. Egyes katalógusok vagy szöveges források például azért nem hozzáférhetőek a robotok számára, mert az oldal forráskódjában a „robots nofollow” címkét (tag-et) használják (ami egyébként könnyen ellenőrizhető), vagy azért nem elérhető szöveges formában a digitális objektum vagy a rávonatkozó katalógusrekord, mert a katalógushasználat regisztrációhoz kötött.

Lehetséges, hogy a katalógus vagy a könyvtár egyéb információs produktuma nem található meg a kereső adatbázisában, és ezért nem indexelt. Ezen könnyen segíthetünk azzal, hogy az URL-ünket regisztráljuk a Google Search Console-ban. Azon felül, hogy ezzel a lépéssel a Google-t informáljuk a weboldalunkról (katalógusunkról, adatbázisunkról…), ezzel az intuitív, egyben ingyenes eszközzel egy, a weboldalunk felhasználóinak viselkedésére vonatkozó webanalitika is jár, ami jól alkalmazható a felhasználói szükségletek felmérése során.

A pozsonyi Szlovák Közgazdasági Könyvtár (Slovenská ekonomická knižnica) esete jól példázza, hogy a weboldalunknak a keresőrendszerbe való manuális bejelentése milyen mértékben segíti a visszakereshetőséget. A könyvtár elektronikus katalógusának látogatottsága a háromszorosára növekedett, miután regisztrálták a Google-nél és az Ebsco Discovery Service-ben.4

A katalógusadatok láthatóságának növelését célozza az Open Bibliography and Open Bibliographic Data kezdeményezés. Erre példa a Német Nemzeti Könyvtár, amely a MARC 21-formátumú leírásait nyílt kapcsolt adatként (Linked Open Data, LOD) is hozzáférhetővé tette. A LOD a weben található adatállományok URI-kon keresztül való összekapcsolásán alapul. Az adatreprezentáció a rendszerek közötti adatcserét lehetővé tevő RDF nyelven történik (Resource Description Framework) / RDFS (Resource Description Framework Schema), általában XML szintaxissal.5 A LOD használata tehát a keresőmotor és a könyvtár közötti sikeres kommunikációt szolgálja.

A könyvtár és a keresőmotor közötti kommunikáció

Érdemes megjegyeznünk, hogy annak ellenére, hogy a képek és nem-szöveges dokumentumok terén jelentős előrelépések történtek, a keresőmotorok továbbra is a szövegeket tudják csak jól értelmezni, azok közül is főként a HTML vagy XML nyelven közölteket. Egy átlagos keresés során a találati listán a HTML-állományok megelőzik mind a Word-, mind a PDF-állományokat, még a Google Scholarban is. Törekednünk kell ugyanakkor a megfelelő metaadatolásra.6

A keresőmotor és a könyvtár közötti kommunikációs problémák többek közt onnan erednek, hogy az információ a könyvtári katalógusban és a weben másképpen szerveződik. Míg a keresőhöz a digitális objektumokról szóló információ olyan metaadatokon (HTML-címkéken) keresztül jut el, mint az „alt”, a „title”, „H1”-„H6”, addig a könyvtárak az objektumaikat MARC-tartalomjelölők segítségével írják le. Kivételként lehetne említeni a Szlovák Nemzeti Galéria (Slovenská národná galéria) Web umenia projektjét, amely a digitális objektumokat HTML-címkékkel is ellátja, így azokat a Google keresőmotorja probléma nélkül indexelni tudja.

A keresőeszközök és könyvtárak közötti „megértéshez” járul hozzá a Dublin Core, amit a keresők értelmezni tudnak, valami okból azonban nem számolnak vele a webtartalmak relevanciájának értékelésekor.7 Manapság ugyanakkor azt látjuk, hogy a keresők a Schema szótára alapján egyre inkább képesek a szemantikus visszakeresésre, illetve a könyvtárak is egyre inkább szemantikusan teszik közzé tartalmaikat (az RDA katalogizálási szabályait követve), esetleg már RDF-ként, ahogy például a már említett Német Nemzeti Könyvtár.8

A weboldal minőségének külső tényezői

Azt, hogy a keresőrobotok hogyan értékelik a tartalom minőségét és relevanciáját, az adott tartalomra vonatkozó hipertextes hivatkozások mennyisége és minősége is befolyásolja. Ha a digitális könyvtárra, illetve katalógusra semmilyen más weboldal nem hivatkozik, a kereső nem fogja azt megtalálni. Ezzel szemben, ha minőségi weboldalak hivatkoznak nagy számban az oldalunkra, a kereső megbízhatóként fogja azt értékelni, valamint előrébb helyezi a találati listán. A külső internetes hivatkozások száma befolyásolható a hivatkozásépítés (linkbuilding) stratégiájának alkalmazásával. A linkbuilding egy etikus mód arra, hogy hipertextes hivatkozásokat helyezzünk el egyéb weboldalakon.9 Érdemes ebből a célból megszólítanunk a partnerkönyvtárakat, vagy olyan weboldalak üzemeltetőit, amelyek szempontjából a könyvtárunk által kínált digitális tartalom releváns lehet. Alább említünk néhány lehetőséget a hivatkozásépítésre.

A könyvtárak általában sok olyan partnerrel rendelkeznek, működnek együtt, amelynek módjában áll a saját weboldalán olyan hivatkozásokat elhelyezni, ami az ő honlapjukra mutat. Természetesen jelentős mértékben esnek számításba a közösségi hálókon, például a Facebookon található hivatkozások, a könyvtár saját oldalán vagy máshol közzétett linkek. A keresőeszköz számára is fontos tehát, hogy a könyvtárról „beszélgetés folyjon”.

Változások a Pozsonyi Egyetemi Könyvtár Digitalna.kniznica.info weboldalának látogatottságában

Érdekes, egyben hatékony stratégia lehet a Wikipédia aktualizálása a könyvtár birtokában lévő, vagy az intézménnyel valamiképpen összefüggő tartalmakkal. Természetesen ilyenkor is a szerzői jog tiszteletben tartásával szükséges eljárnunk, valamint – a könyvtár weboldalára mutató – forráshivatkozásokat kell elhelyeznünk a szócikkekben a jegyzetek vagy külső hivatkozások között. A Wikipédiát a keresőmotorok általában nagyon jól értékelik. A tény, hogy a Digitalna.kniznica.info portálon található digitális tartalmait ezen a felületen is közzé tette, közvetlen módon járult hozzá, hogy a Pozsonyi Egyetemi Könyvtár weboldalának látogatottsága láthatóan megnövekedett.10 A stratégia megvalósítása során 81 új Wikipédia-szócikk jött létre, valamint 244 Wikipédia-oldalt egészítettek ki tartalommal, beleértve a digitális könyvtár vonatkozó objektumaira mutató hivatkozásokat. A projektet követően a havi látogatószám a mutatók alapján a kétszeresére növekedett, és az oldalak gyors elhagyására vonatkozó ún. visszafordulási arány (bounce rate) a hatodára csökkent, ami a belinkelt objektumok magas relevanciaértékére utal.

A Szlovák Nemzeti Galéria ugyancsak érdekes és hatékony hivatkozásépítési stratégiát választott. A fasizmusról szóló kiállításukhoz készítettek egy portált, amelyhez a művészeti tartalmú „Web umenia” oldalon található, az adott témával foglalkozó digitális objektumokat használtak fel. A „digitális kiállítás” projektről a közösségi hálókon keresztül értesítették az elektronikus sajtót, valamint több befolyásos személyt. Köszönhetően annak, hogy a megszólított médiumok hírt adtak a vitát kavart kiállításról, valamint hivatkoztak az adott weboldalra, a Google úgy értékelte, hogy a felhasználó számára különösen fontos oldalról van szó, és előnyös helyet juttatott neki a találati listán. A Szlovák Nemzeti Galéria így elérte azokat a felhasználókat, akik például a második világháborúról vagy a zsidókról szerettek volna információkat találni.11

Egy kép és a kapcsolódó HTML-kód a Web umenia oldalon12

A felhasználói szükségleteket tiszteletben tartó tartalom

Ahogy láttuk, azzal, hogy a keresést végző felhasználók szükségleteit sikerül kielégíteniük, a könyvtárak jeleket küldenek a keresőmotoroknak a tartalmaik relevanciáját illetően. Szükséges tehát, hogy megismerjük és megvizsgáljuk a felhasználók szándékait, ami a keresőkérdéseken keresztül lehetséges, hiszen azok tükrözik a felhasználói célokat és szükségleteket. Az átlagos felhasználó szándékai eltérhetnek a könyvtáros szakember által elvártaktól, például megmutatkozhatnak egy olyan szókapcsolatban, mint „ingyen wifi” vagy „ingyen internet”. Ezért is rendkívüli fontos a felhasználói szükségletek felmérése.13 A felhasználók közvetlen megkérdezése mellett a Google Adwords Keyword Research Tool is megsúghat nekünk néhányat a keresőkérdésekben előforduló szavak közül. Ezeket a kulcsszavakat érdemes azután használnunk a weboldal szövegében, de mindenekelőtt a címekben, fejcímekben.

Az a tartalom, amely a felhasználó számára a leghasznosabb, egyben a leglátogatottabb is, aminek a megállapításához érdemes webanalitikát használnunk, így például a Google Analytics és Search Console eszközöket. A Google a keresési találatok között előnyben részesíti az elsődleges forrásokat, ezért a visszakereshetőség optimalizálásakor a legfontosabb, hogy az ilyen jellegű tartalommal rendelkező digitális könyvtárra koncentráljunk. Ha szeretnénk a találatok között olyan könyvtárakat is látni, amelyek eddig csak másodlagos információt szolgáltattak (pl. katalógusrekordokat), érdemes elgondolkodnunk, nem kellene-e létrehoznunk egy könyvtári blogot. A bejegyzések szólhatnak például a gyűjteményben található érdekes könyvekről, amelyeket maguk a könyvtárosok ajánlanak olvasásra. Főleg az a fontos, hogy valamiféle hozzáadott értéket nyújtson, valamint gondoskodjanak a rendszeres aktualizálásáról.

Lokális keresés

Érdemes figyelmet szentelni a lokális keresési találatok optimalizálásának is, hiszen a könyvtáraknak továbbra is vannak hagyományos, az intézmény épületén belül nyújtott szolgáltatásaik, így a róluk szóló információ a helyi lakosság számára különösen releváns lehet. A lokális találatok a felhasználó környezetében található intézményekről szóló információkra vonatkoznak, a Google Local esetében ezek közvetlenül a Google keresési találatai között találhatók. Olyan jellegű információkról van itt szó, mint az intézmény címe, kapcsolati adatai, a térképen való pontos elhelyezkedése, fényképek, általános ismertetés, illetve a nyitvatartási idő. Mindenekelőtt a következő tényezők azok, amelyek mind szlovák viszonylatban, mind általános értelemben befolyással vannak arra, hogy egy cég felbukkanjon a Google lokális találatai között: a szervezetnek rendelkeznie kell egy bárki számára elérhető Google+ profillal, fel kell tüntetni a Google térképén, valamint minél több értékelést kell szereznie a Google+ szolgáltatásban.14 A Google+ profil elkészítése és a Google Maps kiegészítése az intézmény lokális profiljához vezető kapcsolattal minimális időt vesz igénybe, ugyanakkor adott esetben jelentősen növeli a láthatóságot. Az értékelések összegyűjtése hosszabb időt vesz igénybe, ellenben bármely, a szolgáltatásokkal elégedett felhasználónak módjában áll értékelni a könyvtárat annak Google+ profilján keresztül.

Mobil változat és a betöltődés sebessége

Ahogy növekszik a weboldalak mobiltelefonon való megtekintésének a száma, egyre inkább szükségessé válik, hogy a könyvtári weboldalak is megfeleljenek a reszponzivitás igényének, ami lehetővé teszi, hogy a tartalmakat anélkül jelenítsük meg a mobileszközünkön, hogy azt horizontális helyzetbe kellene állítanunk, vagy szükség volna a szöveg felnagyítására. Marcotte a reszponzivitás (vagy alkalmazkodóképesség) három pillérét határozta meg: flexibilis megjelenítés (amelynek segítségével a weboldal szélességét az aktuálisan használt böngészőablakhoz mérten lehet növelni vagy csökkenteni), flexibilis ábrák (amelyek az adott képernyőfelbontáshoz igazodnak), valamint médialekérdezés (vagyis az aktuális megjelenítőeszköz paramétereinek a lekérdezése).15 A reszponzív weboldal HTML-forráskódja nem változik, az eltérő megjelenítés lehetőségeiről a CSS-kód gondoskodik.

A betöltődés gyorsasága szintén fontos SEO-tényező, amit támogathat a képek tömörítése, a mobilváltozat tartalmának észszerű elrendezése (priorizálása), ami könyvtári weboldalak esetén főként a kapcsolati információk és a nyitvatartási idő kiemelését jelenti.16

Zárszó

Megvizsgáltuk a visszakereshetőség (megtalálhatóság) alapelemeit, amilyen a minőségi, hasznos, valamint a keresőeszköz számára értelmezhető tartalom, a magasan értékelt weboldalakkal való kapcsolódások (linkek) száma, a lokális keresési találatok, valamint az oldal használhatóságát jelző tényezők, mint amilyen a betöltődés sebessége vagy a felhasználói viselkedés. A weboldalak optimalizálása azonban olyan tudomány és művészet, amelyet nem lehet rövid terjedelmi keretek között a maga egészében ismertetni. Emellett a keresők algoritmusa folyamatosan és gyakorta változik, ezért érdemes figyelni a weboldalak visszakereshetőségének optimalizálásával (SEO) foglalkozó portálokat, amilyen például a Search Engine Watch, a Moz vagy a Search Engine Land, illetve be lehet kapcsolódni a digitális tartalmak optimalizálásával foglalkozó szakemberek munkájába. Az optimalizálás mindenképp figyelmet érdemel, hiszen az a tartalom, ami nem visszakereshető, mintha nem is létezne. Ebből a szempontból nézve azok a könyvtári digitalizálási projektek, amelyek részben a tartalmak széles körű hozzáférhetővé tételére irányulnak, olykor elvétik a célt. Egy másik fontos ok, hogy foglalkozzunk a kérdéssel, a társadalmi felelősségtudat. Amennyiben a könyvtár nem szentel figyelmet a tartalmai visszakereshetőségének, a többség olyan tartalmakra fog bukkanni a keresőeszközök használatával, amelyek minősége kérdéses.17

A fordítást Dancs Szabolcs készítette

Jegyzetek

1.   A cikk az ELTE 2018. május 27–31-én rendezett Digital Humanities konferenciáján elhangzott előadás alapján készült. Az eredeti előadást lásd itt: Hrčková, A.: Increasing the Findability of Digital Heritage Documents by Using Search Engine Optimization Methods (prezentácia). 2018. [online]. Digital Humanities Budapest, 2018. [2018-08-20]. https://www.slideshare.net/AndreaHrckova/increasing-the-findability-of-digital-heritage-documents-by-using-search-engine-optimization-methods

2.   Koster, Martijn: Robots in the Web: threat or treat? 2007. [online]. [2018-08-20]. http://www.robotstxt.org/threat-or-treat.html

3.   Fishkin, Rand: Beginner’s guide to SEO [online]. Seattle: SEOmoz, c2018. [2018-08-10]. https://moz.com/beginners-guide-to-seo ; The Periodic Table of SEO Success Factors. [online]. In: Search Engine Land, 2017. [2018-08-30]. https://searchengineland.com/seotable

4.   Kmeťová, J.: Generácia mileniánov  výzva pre akademickú knižnicu. 2017. [online]. In: Infos, 2017. http://www.infolib.sk/files/infos_2017_prezentacie/sskk_zbornik_sympozium-infos-2017.pdf

5.   Špániová, M.: Význam terminológie pre informačnú činnosť: terminologické princípy tvorby tezaurov a interoperabilita s inými slovníkmi. [online]. In: Knižničná a informačná veda XXVI. Pozsony: Univerzita Komenského v Bratislave, 2016. [2018-08-20]. https://fphil.uniba.sk/fileadmin/fif/katedry_pracoviska/kkiv/Rozne/Zbornik_Kniznicna_a_informacna_veda_26_zbornikkkivxxvi_01.pdf

6.   Arlitsch, O´Brien.: Invisible Institutional Repositories: Addressing the Low Indexing Ratios of IRs in Google Scholar. 2012. [online]. [2018-08-20]. https://www.semanticscholar.org/paper/Invisible-Institutional-Repositories%3A-Addressing-of-Arlitsch-O’Brien/29706c9408b3c173f1e9475ef7cfe71cfc795766

7.   Azfar, A.: Dublin Core vs. Schema.org: A head to head metadata comparison. 2015. [online]. [2018-08-20]. https://seopressor.com/blog/dublin-core-vs-schemaorg-metadata-comparison/

8.   Hrčková, A.: Marketing knižníc orientovaný na používateľa [online]. Pozsony: Stimul, 2017. [2018-08-20]. http://stella.uniba.sk/texty/AH_marketing_kniznic.pdf

9.   Makulová, S., Hrčková, A.: Optimalizácia webových stránok pre vyhľadávacie nástroje. 2011. [online]. Pozsony: Elet, 2011. [2018-08-20]. www.elet.sk/seo/makulova-hrckova.pdf

10. Dollerová, J.: Prieskum kauzality medzi obsahom Wikipedie a zvýšením návštevnosti digitálnej knižnice UKB. 2017. [online]. In: Infos, 2017. [2018-08-20]. www.infolib.sk/files/infos_2017_prezentacie/prieskum_kauzality-dollerova.pdf

11. Čudrnák, M., Balko, G.: Web sen x skutočnosť – udalosti slovenského štátu v 4 kapitolách. 2017. [online]. In: Infos 2017. [2018-08-20]. http://www.infolib.sk/files/infos_2017_prezentacie/sskk_zbornik_sympozium-infos-2017.pdf

12. https://www.webumenia.sk/

13. Hrčková, A.: Marketing knižníc orientovaný na používateľa [online]. Pozsony: Stimul, 2017. [2018-08-20]. http://stella.uniba.sk/texty/AH_marketing_kniznic.pdf

14. Duriš, D.: Výskum Pizza SEO: Ako dosiahnuť lepšie lokálne výsledky? 2015. [online]. In: Pizza SEO.Pozsony, 2015. [2018-08-20].https://pizzaseo.com/sk/blog/lokalne-vysledky-lepsie-pozicie/

15. Marcotte, Ethan: Responsive web design [online]. New York: A Book Apart, 2011. [cit. 2018-08-01]. http://www.abookapart.com/products/responsive-web-design

16. Hrčková, A.: Marketing knižníc orientovaný na používateľa [online]. Pozsony: Stimul, 2017. [2018-08-20]. http://stella.uniba.sk/texty/AH_marketing_kniznic.pdf

17. Ez a cikk a HIBER, APVV 15-0508 projektnek köszönhetően jött létre.

Címkék