2. rész1: A könyvtár és a mesterséges intelligencia kölcsönhatásai

A könyvtárak a digitális transzformáció során a tartalmak létrehozásával, közzétételével, gondozásával, adat- és információmenedzsment–tevékenységgel, keresőnyelvek gondozásával és szabályozásával, linked data és a szemantikai hálózati adatmátrixok építésével megteremtették és támogatják a mesterséges intelligencia fejlesztésének könyvtári előzményeit. Az információtartalmak osztályozása, kategorizálása, szemantikus hálóba rendezése a természetes nyelvi folyamatok algoritmusokkal történő tükrözéséhez, a nyelvi modellek vizsgálatához, használatra történő előkészítéséhez „előfeldolgozásként” is értelmezhetők. A mesterséges intelligencia könyvtári alkalmazását2 ezért nem csak az emberi viselkedés, gondolkodás és cselekvés szimulálásának szempontjából szeretném áttekinteni, fontosnak tartom a részterületekre kiterjedő megoldásokat és a beépített szoftverelemeket is.

Az új technológia értékelésében már kezdjük felmérni a jelenlegi korlátokat, és már látható, hogy a tervezésben, modellezésben, tesztelésben, elemzésben vannak még feladatok, ugyanakkor az újdonságokban nagyon gyorsan és váratlanul jelennek meg a jelenlegi kultúránkat teljesen megváltoztató felfedezések. A korábbi technológiával kezelt megoldásaink továbbfejlesztésében óvatosan haladunk, mert még barátkozunk a szemantikai rendszerekkel, és csodálkozunk a hálózattechnológia alapján összerendeződő biológiai és mesterséges rendszerek rejtélyein.

Könyvtári értékszemlélet és versenyhelyzet az információsszolgáltatásban

Az intelligens rendszerek és a mesterséges intelligencia közötti határvonalakra a gyorsan átrendeződő átmenetek a jellemzők. Könyvtári vonalon az intelligens rendszerek automatizáló folyamatain felül vannak olyan elemek, amelyek beépített algoritmusok alapján önállóan végeznek műveleteket, kapcsolódva az ember gondolkodóképességének valamely eleméhez (következtetés, hasonlóságok, ok-okozati kapcsolat felismerése és végrehajtása új környezetben, osztályba sorolás, klaszterálás stb.). A robottechnológia látványosan szimulálja az emberi cselekvéseket, azonban jelenleg inkább egyszerű kommunikációs helyzetekre alkalmazható. A robot­tech­nikában és a könyvtári vonatkozású területeken is a legizgalmasabb és talán a legnehezebb feladat a természetes nyelvi folyamatok tükrözése. A mesterséges intelligencia fejlődése napi számítógépes tevékenységünk minden területére vagy azok részleteire vonatkoztatható (gyűjteményszervezés, adatmenedzsment, keresés, kép- és szöveggondozás, stb.), a jelen szakaszban főként az emberi képesség kiterjesztését várjuk mentőövként a nehezen megoldható feladatainkban. A tartalmak elemzésénél a kép- és szövegfelismerésben, a hasonlóságok rutinszerű kimutatásában eddig nem várt eredményeket láthatunk a mesterséges intelligencia nagy áttekintő képességet biztosító rendszereiben. A felismerés és áttekintés gyorsasága messze meghaladja az emberét, amely elősegíti a tudomány fejlődéséhez szükséges tudás és információ terjedésének és igénybevételének a sebességét.

A tudomány és technológia fejlődésében már nem az együttműködés célszerűségéről, hanem nélkülözhetetlenségéről van szó, az egyes területek konvergenciájával és szinergiájával.3 Egy könyvtári robot létrehozásához és szolgáltatásba állításához számos technológiai, nyelvi, pszichológiai és szövegelemzési feladat megoldására van szükség (válaszlehetőségek, kapcsolódó könyvtári tevékenységek, a leginkább jellemző szakkifejezések, használói kérdések stb.). A nyelvről, az emberről, a kialakított algoritmusok működéséről szóló vertikális ismereteink mélyülnek, az együtthatás pedig további összefüggések felismerésével jár. A tudományos kontrol és könyvtári értékeszemlélet fenntartása fontos a technológia esetleges emberellenes érvényesülésének korlátozásához a döntéshozók befolyásolásának felelősségével. Az emberi intelligencia által teremtett hagyományos és az új kultúra kezelésében jelentkező feladatok, a fenntartásáért és pozitív irányú fejlesztéséért folyó könyvtári törekvések jelentős formái az „open” mozgalmak. Az átláthatóság, a szakértői és társadalmi kontrol, a „láthatatlan kollégiumok” – virtuális szakmai közösségek – meggátolják a hatalmi törekvések rossz irányú kiszolgálását az új technológia oldalán.

A könyvtárak és archívumok ma már nem egyedüli szolgáltatói és átörökítői a kulturális és tudományos információknak, új helyzettel kell számolni az általános könyvtári értékszemlélet érvényesítésében. A tudás és információ gyors gyarapodása, a források bővülése a könyvtárakra korábban is erős hatással volt a belső szakmunka és a használói rendszerek oldaláról egyaránt. A tőkeerős vállalkozások képesek nagyobb arányú befektetéseket áldozni innovációk, hatalmas tárolók üzemeltetésére, figyelmük sok olyan tényezőre is irányul, amelyek esetleg kívül esnek a könyvtárak látóterén. Igénybevételüknél a könyvtáraknak fenn kell tartaniuk a befolyásolástól mentes, értékalapú szelekciót, a hamis hírek kiszűrését, és ehhez a folyamathoz szükség van szakmai egységfrontra, fórumokra és partnerviszonyokra.

A könyvtárakban a tudás elsődlegessége és a fenntartható fejlődés érvényesítésének támogatása (lásd erről az IFLA programokat) erős támaszt talált az ismeretek átörökítése, megőrzése és szétsugárzása gyakorlatában. A tartalomszolgáltatásban a versenyhelyzet anélkül alakult ki, hogy a könyvtáraknak hasonló lehetősége lenne a tőkeerős vállalkozásokéhoz. A közszolgáltatásokra berendezkedett könyvtáraknak viszont vannak olyan unikális értékei a teljes üzemelési időben nyújtott szolgáltatói szemlélet és gyakorlat oldaláról, amelyek párosulnak az eszközrendszerek nyílt és szervezett elérésének biztosításával, a hátrányos helyzetűek mentorálásával. A lemaradók tömege jelenleg is túl széles, amely a társadalom működésében komoly fennakadásokat, feszültségeket eredményezhet.

Világunk egyensúlyát eddig a tudás és az emberi intelligencia együtthatása mentette meg az erő érvényesítése ellenében. Jövőnk kulcskérdése, mennyire tudjuk fenntartani ezt, nem véletlen, hogy az átláthatóság és elérhetőség a mesterséges intelligencia kiemelt fejlesztési céljai közé tartozik. Fejlődés közben nehéz a jelen folyamatainak átlátása, most mégis nyilvánvaló, hogy világunk, környezetünk, működésünk mátrixában paradigmaváltásra kerül sor, más módon, más eszközökkel, más kiindulópontokkal és más eredményekkel kell számolnunk.

Paradigmaváltás? Úton a „mobil-world” helyett a mesterséges intelligencia alapú világhoz?

Az információk és tudástárak gépi értelmezésének lehetőségét előremozdító szemantikai adatfeldolgozás, az új adatkapcsolat–struktúrák, a hozzáférhető mesterséges intelligencia alkalmazások bevezetése és népszerűsítése, a gépi tanulás, a szövegelemzés és értékelés módszereinek könyvtári adaptálása paradigmaváltásnak tűnik a könyvtári szolgáltatásokban. A MARC feltárási rendszer gazdagítása vagy cseréje és a meglévő könyvtári szakértői rendszerek adaptálása a mesterséges intelligencia technológiai környezetébe szintén jelentősen fogják befolyásolni tevékenységünket.

Az adat- és információmenedzsment minden területén szabályozott, nemzetközi szintű, elméletileg megalapozott folyamatok gyakorlatát követjük; a könyvtárak természetes módon illeszkednek a globális fejlődési trendekhez az új beszerzésektől kezdve a szolgáltatásig. Használóink igényeit és szokásait folyamatosan elemezzük, ezáltal olyan információkhoz jutunk, amelyek a mesterséges intelligencia rendszerek fejlesztésénél beépíthetők, és amelyekhez más szolgáltatók nehezebben férnek hozzá. Ismerjük a különböző korosztályi és társadalmi csoportok információhasználati szokásait, tervezni tudjuk ezek alapján a várható igényeket és változásokat.  Míg a kutatási, archiválást végző vagy múzeumi intézményekben kevésbé kényszerítő a „just in time” jellegű igények kiszolgálása, addig a könyvtárakban egyre nyomasztóbb a szolgáltatások gyorsítására irányuló igény. Egyértelmű érdekünk, hogy az információk felkészítésében és szolgáltatásában transzformáljuk folyamatainkat az új technológia igénybevételéhez, a hálózatokban összekapcsolt „giga”–rendszerekben meg kell találnunk a könyvtárak illeszkedő technológiáit és munkafolyamatait.

Negyedik ipari forradalom?4

Több szakíró negyedik ipari forradalomként említi a fejlődés új irányait. Figyelemreméltó, hogy a használói gyakorlat sokkal erősebben befolyásolja a folyamatokat, mint korábban. A fogyasztói szemléletű társadalom ontja a kényelmi rendszerek fejlesztésére irányuló befektetéseket az eladás és a piaci siker versenyében. A tudományos kontrol nem mindig képes lépést tartani a gyors változásokkal, az előzetes elemzés nem terjed ki a fejlődés összes hatására. Nem láttuk előre, hogy az elektronikus eszközök a fiatalok széles rétegeit vonják majd el az olvasástól, vagy teljesen más jellegű olvasással kell számolnunk, amely már alig hasonlít a többezer éves tanulási és információszerzési gyakorlathoz. Vajon a gyorsaság egyben felületességhez is vezet, vagy más alapokra kell helyeznünk az értékmérőt? Nem biztos, hogy bármit tehettünk volna, ha ismerjük a következményeket.

A korábbi html dokumentum alapú tárolásra és keresésére berendezkedett webtechnológia felváltásával megkezdődött a „data of web”, vagyis az adatokra alapozott feltáró, nyilvántartó szemantikai hálózati rendszerek fejlődése, megteremtve a korábban rejtett információs rétegek – „deep web”, „deep learning” stb. – területek fejlődését. Az előkészítésnek számos elméleti, matematikai, hálózati, programozási, tervezési és technológiai feltétele van.

A wireless technológia szorosan együtt halad a fejlődéssel, a MI a 4G mobil eszközökben jelen van már, nagyobb áttörést az 5G rendszerekkel ígérnek a fejlesztők. Sundar Pichai,5 aki az utóbbi évek „mobil-first world” jelensége helyett „AI-first world” megjelöléssel a fejlődés két irányát szétválasztva jósolja a mesterséges intelligencia várható rohamos elterjedését, pedig inkább az együtthatás elemei jellemzőek. A mobil technológia „utóléri” és alkalmazza az új információkezelési technológiát, sőt sok MI fejlesztés eleve mobil eszközökre készül.  A mobil rendszerekkel együtt fejlődő web technológia eredménye az ún. „digital reality”, „virtual reality” és „augmented reality” (digitális, virtuális, kiterjesztett valóság) stb. irányzat, amelyek képek és videók, vagy szimulált emberi környezet megteremtésével kiegészítik és élvezetessé teszik a mobilra épített tájékoztatást és oktatást.  Az ábrázolt világ látszata (illúziója, víziója) szerint a szemlélő „benne mozog” a képben, amelyet ezért második valóságként érzékelhetünk. Célzottan és hangsúlyosan emeli ki a valóság egyes részleteit az oktatás és tájékoztatás adott céljának megfelelően – az új technológia második világát immersive web elnevezéssel is jelölik.6

Immersive web, augmented reality, second life – teremtett „szép új világ”

Az immersive web és egyéb second life típusú rendszerek a tájékozódó, kereső embert a valóságot szimuláló rendszerek virtuális világába vezetik, ahol élményszerű látvány alapján tájékozódhat, létrehozhat és működtethet valódi tárgyakat szimuláló képi, oktatásra vagy elemzésre szánt ábrázolásokat, felhasználva az új technológia képi- és szövegfelismerő vagy hangfelismerő stb. technológiáját. (Lásd a termékfejlesztésben, kutatásban, orvoslásban, autógyártásban stb.) A második teremtett világ a művészi alkotásokban, a tudományban, gyártásban, termelésben, orvoslásban kiegészíti vagy felváltja az emberi tevékenységet. A gyorsan létrehozható képi és video eszközökkel rugalmasan idomul a változásokhoz és új követelményekhez. Leegyszerűsített világot látunk a valósághoz képest, hiszen tárolt minták vagy gráfok alapján, kiemelt tulajdonságokra redukálja a vizsgálatot, elhagyja az emberi szem által észlelhető, de a felismerést nem befolyásoló részleteket. A mondanivaló és cél szolgálatába állított megjelenítési mód célzott feladatokhoz jól alkalmazható, viszont nem minden oldalról kielégítő az emberi kommunikációhoz képest szegényesebb megoldásaival. (Lásd művészetek, filmek, videók, tv, stb.) Bizonyosan kutatásra érett téma, hogy mennyire szabad didaktikus célból egyszerűsíteni és kiemelni a mondanivalót a valóság gazdagságának visszatükrözése helyett. A vizualitás fejlődése általánosan jellemző a mesterséges rendszerekben, mert a vizuális jelek tömören képesek hosszabb közlések közvetítésére, egyszerűsítik a felismerést a humán jellegű logikai műveletek gyors elvégzéséhez a vizuális jelek gyors, bővebb vagy közmegegyezésen alapuló tömör értelmezésével.  A művészeti könyvtárak, múzeumok gyakorlatában gyakran láthatunk olyan tájékoztatókat, amelyek mobil eszközre telepített „augmented reality” módszerekkel könnyítik meg a tájékozódást, de gyakori a turisztikában, autótervezésben és egyéb ipari dizájn területeken, gyógyászatban, oktatásban, ahol a térbeli látásnak, vagy a részletek bemutatásának, mozgatásának (kiemelésének, nagyításának, ismétlésének, stb.) fontos szerepe van. A módszer korán megjelent a könyvtári fejlesztésekben is.

1. ábra
Az okos/smart kampusz sémája RFID szenzorokkal működő internet of things technológiával, a beérkező adatokat értelmező és elemző eszközöket működtető dashboarddal (Forrás: T-Systems)

Vajon csökkenti-e az emberi megfigyelési képességet a gyors felismerést támogató egyszerűsített kommunikáció tömeges alkalmazása? Nyilván ez a kétség jelenik meg a mobil játékok visszaszorítási törekvéseiben, mert egyes játékokban az erő, ügyesség és hatalom egyszerű közlései nem a mélyebb gondolkodásra serkentik a gyerekeket, hanem az agresszióra és az olcsó sikerek megélésének örömére.

Az előrejelzések szerint az 5G mobil technogia újabb lehetőségekkel terjeszti ki a kommunikáció és technológia határait a „virtual reality”, a mesterséges intelligencia és az IoT (internet of things) összehangolt fejlesztéseivel, amelynek során a tárgyak és emberek közötti kommunikációt szenzorok (érzékelők, pl. RFID) segítségével valósítják meg távirányítással. A jelzések figyelése a „dashboard” alkalmazások vizuális eszközei alapján történik: a beépített elemző eszközök a tényadatok alapján összehasonlításokat, grafikonokat, elemzéseket és következtetéseket, döntéstámogatást biztosítanak a távolról irányító IT mérnökök számára.7 Az 5G, a mesterséges intelligencia és az internet of things alapján összekapcsolt mobil alkalmazások lehetővé teszik az utazás, a bankolás, a háztartás, az energiagazdálkodás és az intelligens vállalatirányítás, gyógyítás stb. mobil eszközökről történő együttes, akár összehangolt vezérlését, amelyekre hazánkban is vannak már példák a betegirányítás, távorvoslás, parkolás, és egyéb intelligens programokkal biztosított mobil alkalmazásokban.8 A fenntartható fejlődés programját pedig az ún. „smart city / okos, illetve intelligens város” fejlesztésekben támogatják az IT fejlesztők. Tömeges alkalmazásuk jelentősen megkönnyítik a fejlődés támogatását, viszont a rendszerek irányításához, lekérdezéséhez a mesterséges intelligencia eszközök nélkülözhetetlenné válnak. Fontosnak tartom, hogy minden „intelligens város” fejlesztésben számoljanak a döntéshozók a könyvtárak intelligens rendszereinek, nyílt közösségi helyeinek és szolgáltatói arzenáljának bekapcsolásával, akik ezzel jelenleg még adósok.

Az új technológia igénybevételének generációs jelenségei a könyvtárakban és oktatásban

Hogyan reagál az új jelenségekre az ember, az intézmény, az oktatási rendszer és a könyvtár?

Az új technológiák igénybevétele alapján polarizálódó használói rétegek között szakadék tátong. Az új technológia már jelenleg is áthatja a teljes irányítási, ipari és tudományos területeket. A korábbi években mutatkoztak eredmények a modern technológia könyvtári használatában, mára azonban az új generációk információkezelési szokásai annyira eltérnek az általános szokásoktól, hogy lehetetlenné válik a homogén szolgáltatási rendszerek alkalmazása, új stratégiákra van szükség.

A Z generáció gyakorlata nem illeszkedik az oktatási és szolgáltatási rendszerekhez

Az új technológiákat és a mobil alkalmazásokat napi rutinként használó fiatal generációk tudása már nem (csak) a tankönyvekre épül, de még nem látható át, milyen tudást szívnak magukba a hivatalos tananyag számukra unalmasan tálalt ismeretei helyett. Ez a tudás hézagos lehet, és a korosztályi „véleményvezérek” erős hatásával kell számolnunk a tájékozódásban és az információk értelmezésében, irányultságában. Nehezen látható át, hol múlják magasan felül a hivatalos tananyagot vagy hol maradnak mélyen alatta az így szerzett ismeretek, és abból hogyan alakulhat ki használható ismeretrendszer és műveltség. A kortársi normák egyre kevésbé illeszthetők az iskolai tananyaghoz és tudás szinthez, a tájékozottság, a motiváció és a sikeresség tényezői és feltételei nehezen mérhetők az otthoni és iskolai keretekben. A nevelők, a szülők, a fiatalok keresik az igazodási pontokat, a könyvtárak is kutatják, hol tudnak eredményesen belépni szolgáltatásaikkal a különböző korosztályoknál.
A Z-generáció már nem rendelkezik azokkal a támpontokkal, vagy nem fogadja el azokat, amelyek a korábbi nemzedékeknek keretrendszert nyújtottak az eligazodáshoz, önértékeléshez és a beilleszkedéshez. Használati szokásaihoz nehezen lehet alkalmazkodni, mert a színvonal vagy a kapcsolódási pontok nem mérhetők az ismert és értelmezhető standardokhoz. A versengéshez szokott „mobil-lét” gyakorlásában könnyedén túllépnek a játékok kezeléséhez szokott rutin- és ötletszerű kereséseiken, az új felfedezéseket szinte azonnal megosztják (megmérik) saját közösségi hálózataikon – előre nem jósolható hatásokkal és irányváltásokkal. Az elfogadás vagy elutasítás ismérvei a kívülálló számára nehezen értelmezhetők, viszont állásfoglalásaik határozottsága meglepően erős az elutasítás (főleg a felnőttek információival szemben) vagy elfogadás tekintetében is. A játékokban szerzett kimagasló logikai és érvelési technikájuk fölényével kizárják a külső hatások érvrendszereit, a gyors és sikeres informálódásban versenytársat csak saját generációjukban találnak. A könnyedén hozzáférhető információk birtokában minden korábbi elméletet és gyakorlatot cáfolnak, felborul a nevelő – tanuló kapcsolat korábbi egyensúlya, mert a felnőtt oldal nem képes és nem is akar annyi időt fordítani az új eszközökkel elérhető információk, kommunikációs eszközök, képi és zenei források keresésére, értelmezésére és élvezetére. Azt sem látjuk világosan, hogy milyen szempontok alapján válogatnak. Ennél fogva természetesen a hatásokkal sem vagyunk tisztában. A következmények viszont súlyosak lehetnek, a kezelés mélysége vagy felületessége miatt túl korán és élesen eldől, hogy a munkamegosztásban alacsony vagy magas szintű munkavégzésre lesznek-e képesek a korábbi technológiahasználat nyomán.

A korosztály sikeresebb megnyeréséhez kiváló alkalmat kínálnak az új technológia intelligens szolgáltatásai a könyvtárakban, a feladatokhoz biztosított sokszínű eszköztár és infrastruktúra hátterével, korosztályi klubokkal. A felsőoktatási és tudományos szakkönyvtárakban elsősorban a digitális forráskínálat, a hozzájuk kapcsolódó discovery és egyéb szolgáltatási rendszerek gazdagsága, az intelligens szövegelemzési és keresési módszerek és eszközök színvonala, a kutatóhelyek, a munkaszobák és a könyvtárak digitális laborjainak illeszkedő és kompatibilis rendszerei vagy akár műhelyei ígérnek sikereket. A használók polarizálódását fokozhatja a készségek és tudásszintek éles kettéválásának esélye. A mindennapi életünket meghatározó technológia használata a munkakörökben, életmódban, vagy az állampolgári tevékenységekben (pl. elektronikus ügyintézés) meghatározó eséllyé és feltétellé válik. A mesterséges rendszerek teremtett világában eligazodni képtelenek számára csak a rutinszerű feladatok útján lehet szolgáltatásokat nyújtani, amely a rendszerek fejlesztőit új követelmények elé állítja az egyszerű, vizuális eszközökkel áttekinthetővé tett használói rendszerek tervezése, a felkészítő oktatási programok, és a végrehajtás vezérlése igényével (video, e-learning, programozott oktatás, webex stb.). A fejlesztők és használók oldalán is elválasztódik a kód- és logikai rendszereket könnyedén vagy nehezen kezelők csoportja. Az elvont rendszerekben való gondolkodás készsége és képessége bizonyára erős követelmény és megkülönböztető tényező lesz.

A könyvtárak jelenleg is sok mentorálási feladatot végeznek példamutató eredményekkel, kreatív ifjúsági közösségek működtetésével. Bizonyára erősödni fognak a mentor-munkakörök vagy coaching igények, de emellett a többi könyvtári munkakör megváltozásával is számolnunk kell.

Hol tartunk? Hogyan változtatja meg a mesterséges intelligencia a könyvtárakat?

Feltehetnénk az ismert kérdést, vajon megy-e előbbre a világ a MI elterjedésével, könnyebbé válik-e a mindennapok munkája a géppel kiváltott emberi tevékenységek nyomán. Sokkal valószínűbbnek látszik, hogy nem könnyebb, hanem inkább teljesen más lesz. A kiváltott tevékenységek helyett újak, bonyolultabbak jönnek létre, a felkészülés, elsajátítás és alkalmazás érdekében ismét új készségekre lesz szükség, a szakmai kritériumok változó tendenciája továbbra is jellemző marad.

A fekete doboz rejtélye9

Az információk hálózati terjedésével, a tudáshálózatok törvényeinek kutatásával a tudósok mellett  tőkeerős, vagy startup vállalkozások is foglalkoznak. A tudományos eredmények nyilvánossága mellett a vállalkozók nem feltétlenül osztják meg új ismereteiket, ezért fontos stratégiai elem, hogyan tartsuk meg és hangoljuk össze a könyvtári tevékenység értékeit az új információs megoldásokkal és rendszerekkel. Az átvett, beépített fejlesztések sokszor „fekete doboznak” látszanak, fogalmunk sincs, milyen folyamatok vezetnek az eredményekhez, – nemcsak a könyvtárak, hanem a különböző szakmák és alkalmazások területén. A gráfok és hálózatok működését, a természetes nyelvi folyamatokat matematikai törvények alapján programozzák a mesterséges intelligencia rendszerek tanulási, megismerési, felfedezési folyamataiban a műveletek elvégzéséhez. Az információelmélet fejlődésére nagy hatást gyakorló agyi folyamatok (neuronhálók) és egyéb hálózatok (például internet) működésének folyamatos tanulmányozása ellenére is kevés az ismeretünk, de attól a hálózat még működik, az információ és tudás terjed. Érdekes problémafelvetést olvashatunk Lovász László akadémikus interjújában a biológiai és társadalmi hálózatok működéséről, aki nemrég nyerte el két tudóstársával az ERC Synergy Grant díját Magyarországon elsőként a hálózatelméleti kutatások eredményességéért. „Nem vitás, hogy az emberi agy egy hatalmas hálózat, de hogy az agyra vonatkozó biológiai eredményeket hogyan lehet először hálózati nyelvre lefordítani, és aztán a hálózatok nyelve segítségével matematikailag megközelíteni, ehhez első lépésben feltétlenül szükség van olyanokra, akik értik a biológiai kísérletek lényegét. […] Persze az agy „csak” egy a fontos a nagy hálózatok közül, nyilván hasonló szakértői segítségre lesz szükség az internet vagy a társadalmi hálózatok területén”.10 A kutatók vizsgálatának egyik érdekes témája, hogy az egyszerű hálózatok működésének törvényei vonatkoztathatók-e a nagy hálózatokra, vagy a bonyolult hálózatokat egyszerűsíthetjük-e úgy, hogy az egyszerű hálózatokra vonatkozó törvények alapján vizsgáljuk őket.

A „fekete doboz” rejtélye ellenére a tudás és információ hálózati terjedését és hatását a gyakorlati szolgáltatásokra a könyvtáraknak is adaptálniuk kell.  A Stanfordi Egyetem könyvtári konzorciuma 2018 őszén érdekes szakmai beszélgetés sorozatról adott hírt (Information, Intelligent Machines, and New Knowledge) Nicole Coleman,11 a digitális kutatások architektjének cikke nyomán a könyvtárak által is inspirált mesterséges intelligencia fejlesztéseiről. Elsősorban azt taglalják, hogyan hat a mesterséges intelligencia a könyvtárak discovery szolgáltatásaira a felsőoktatási könyvtárakban, vagyis a keresés, a kutatás és a szolgáltatás folyamataira. A beszélgetés–sorozat következtetéseit egy 2019 januárjában tervezett konferencián szándékoznak összegezni.

A tervezés bizonytalansága

A könyvtárakban olyan innovációt érdemes szorgalmazni, amelynek eredményeként több információt tudunk több embernek szolgáltatni, jobb elérhetőséggel. Az egyszerű kijelentés mögött a könyvtár minden munkamozzanata jelen van, és mindegyikre hatással lehet a mesterséges intelligencia új technológiája, a változásokat proaktív módon célszerű értékelni és irányítani. Kim Bahyum szellemes példájával szeretném a gondolatot alátámasztani, aki a vezérlés szükségességére a versenyautó példáját hozza. Szerinte nem szabad megvárni, amíg elszabadul a technikai erő, mert akkor már csak azt lehet mérlegelni, hogyan lehet a kormányzás, megfékezés és irányítás helyett a legkisebb veszteséggel túlélni a száguldást? Szerinte a bizonytalanság „fekete dobozkéntaposztrofált rejtélyét a technológia Achilles sarkának nevezhetjük, mert sok nyitott kérdés van az intelligencia természetét illetően a meghatározások és értelmezések oldaláról. Nem látjuk előre, hogyan határozzuk meg tíz év múlva az emberi intelligencia jellemzőit? Nem meglepő, hogy azzal sem vagyunk tisztában, kialakulhat-e a mesterséges tudat, és azzal milyen kapcsolatteremtési lehetőségekre kellene felkészülni. Bizonyos viszont, hogy a MI technológia sok változást hoz az információelmélet, a tudás és intelligencia fejlődésében, amelyek mindegyike hatással van a könyvtárakra.12 (Kim Bahyum)

Az utóbbi két-három év eredményeiben látható tényezők (hatalmas digitális hálózati adatmennyiség, digitális transzformáció, fejlődő és növekvő számítógépes kapacitás, tudományos publikációk és növekvő szakértői réteg) folyamatos fejlődése állandósult. Inspiráló hatást gyakorolnak az open irányzat jelenségei az elérhető nyílt felhőtárolókkal, ahol programokat, kódolási eredményeket, kutatásokat tettek nyilvánossá mások számára a kutatók és fejlesztők. A technológia és elmélet mellett az ID és „access” rendszerek, a szellemi tulajdonjog védelem, a szabványos nemzetközi szerzői, földrajzi névterek és digitális életművek, repozitóriumok és discovery felületek tovább erősítették az új eredmények megszületését és használatbavételi lehetőségét. A nagy adat- és információtárolókban, a tudásreprezentációs (könyvtári) eszközökben a kutatásokhoz elegendő minta- és forrásanyag található az automatikus értelmezés elősegítéséhez, a szövegek elemzéséhez és vizsgálatához. A tárolókban elhelyezett információforrásokhoz a könyvtárak sokféle feltárási és elemzési eszközt alakítottak ki (adatmenedzsment, információkezelési nyelvek, tezauruszok, szemantikus leírási sémák, ontológiák, stb.), amelyek a tudásreprezentáció létrejöttében jelentős eszközrendszert képeznek.

A mesterséges intelligencia előszobájában – adatmenedzsment, mint „core” tevékenység

A bölcsész beállítottságú könyvtárosok tudása a „digital humanities” vagy digitális bölcsészet összefoglaló névvel jelölt tevékenységekben fontos minőségi kritériumot képviselnek a tartalomforrások igényes és gyakran tudományos igényű feldolgozása, a használatra vagy gépesítésre való felkészítés során. Az adatok kódolásában, formalizálásában, a más tudományokkal folytatott együttműködésben, az új programok szolgáltatásra történő felkészítésében az adatkurátorok gyakran több intézmény kooperatív rendszereinek felkészítését irányítják az egységesítés és integrációs folyamatok lehetőségével, kapcsolatban az adattudomány adatmérnökeinek feladataival. A gépesítésnél az egységesség megkönnyíti a tervezés és végrehajtás lépéseit. A könyvtáraknak hangsúlyos szerepe van az adatok pontosságának és gazdag kapcsolati hálójának kialakításában.

A könyvtári adatmenedzsment tevékenységben egyre szabályosabb (csereszabatos) adatokat kell előállítani az új technológia igénybevétele mellett. A MARC leírások rekordjaiból kiemelt és önálló létre alkalmas authority adatok létrehozása, bővítése nagy felelősséggel jár, mert meg kell felelniük a nagy nemzetközi rendszerek szabványainak a későbbi feldolgozások és a szemantikus hálók építőköveiként. A „web of data”13 technológia alkalmas keretrendszer a MARC leírásokból kiemelt authory adatok önálló hálózati tárolására és visszakeresésre, és később a web rejtett tartalmainak felkutatására. Az ún. open linked data adatkezelés nyomán lehetővé vált a hierarchikus struktúrába rendezett adathálózatok gyors növekedése azáltal, hogy a könyvtári leírás alapegysége nem a rekord és nem a dokumentum, hanem az adat, amelyek géppel olvasható és értelmezhető jelentést hordoznak a weben. A kodifikált adatok a tudásgráfok csomópontjain az éleken jellemzett tulajdonságaik oldaláról szabványos elnevezésekkel rendelkeznek a kooperálók konvenciói és adatszótárai alapján, és forrásazonosítókkal ellátva válnak a visszakeresés eszközévé. A gépi tanulás, a kép- és szövegfelismerés fejlesztésében jelentős szerepet kapott az adatok és szövegek hierarchiájára utaló gráfszerkezetek korlátlan bővülése.

Könyvtári adatmodellek – felkészülés a gépi felismerésre és gépi tanulásra

A neurális hálók felépítéséhez hasonló hálózati tudásgráfok megváltoztatták a könyvtári tudásfeldolgozás központi filozófiáját az FRBR (Functional Requirements for Bibliographic Records) leírási séma alapján. A feldolgozás az új leírási sémák szerint nem dokumentumleíráson alapul, mert a feldolgozás alapegysége az adat lett, viszonyítási pontja a szellemű mű (entitás), amelynek manifesztálódása megteremti a fizikai vagy elektronikus megjelenésű dokumentumtípusok válfajait és hálózatait. A címhez, mint központi elemhez élekkel kapcsolódó jellemzők és tulajdonságok gráf szerkezetben jelennek meg a hálózaton, géppel értelmezhető jelentést képviselve az automatikus szövegmodellezés, a gépi keresés, gépi tanulás folyamataiban. A hálózati adatmodellek lehetővé teszik az információk eddig rejtett mély rétegeinek feltárását és megismerését. A hierarchiában képviselt struktúrák pontosabb keresési eredményeket adnak a kulcsszavas keresésnél, mert a jelentést erősen meghatározzák a gráf modellek mintái alapján megmutatkozó adat- és szövegkapcsolatok, és megkönnyítik a rejtett tartalmak gépi felismerését, rendszerezését, csoportosítását és osztályozását.

A könyvtári adatmodell készítés főbb lépései:

  • az adatmodell osztályok meghatározása, könyvtári tudásgráfok tervezése, adatok azonosítókkal történő ellátása, URI tervezés (Unified Resource Identifier = egységes forrásazonosító);
  • MARC és RDF transzformációk, adatbő­ví­tés, adatmanipuláció szabályozás, adat­ko­di­fi­káció;
  • ontológiák, adatszótárak a kapcsolatok jellemzéséhez, az adatmodell tervezéshez, az osztályok és tulajdonságok meghatározásához, a fogalmi kapcsolatok szabályozása és szabványosítása.

2. ábra
Az FRBR leírási séma, az adatmodell és a gráfkapcsolat hármas felépítéséről15

A gráfok alapján egy adott entitásra, műre, objektumra vonatkoztathatók az egyszerű, hármas felépítésű RDF-séma szerinti állítások (alany-állítmány-tárgy = tripletek) a gépek számára értelmezhető módon. A tulajdonságok szabványos elnevezései (lásd Schema.org, LCSH, ontológiák, tárgyszó és tezaurusz eszközök stb.)14 a könyvtári és mesterséges intelligencia szempontjából is megkönnyítik a modellek és nyelvi kifejezések, szövegek formalizálásának előkészítését. A csomópontok összekötésére szolgáló értékválaszték a vonatkozó szabványok és szótárak alapján lehetővé teszik a későbbi gépesített tartalomelemzés programozását a nyelvi és elnevezési különbözőségek kezelésével. Az azonosításra, automatikus felismerésre és keresésre szolgáló forrásazonosítók könyvtári jelentőségét kiemeli, hogy visszamutatnak az adatforrásokhoz, könyvtárakhoz, tudatosítva a könyvtáron kívül elhelyezett adatok származási helyét.

A könyvtári oldal innovációi a szemantikai adat- és információmenedzsmentben

A szemantikus adatfeldolgozás és a MARC további használata tekintetében vannak ellentétes vélemények. A fejlődés adott szakaszában láthatóvá válik majd, hogy a rekord szintű és az adatszintű leírási típus mindkettőjének meddig van létjogosultsága párhuzamosan. A fejlesztések elmélete és gyakorlata jelenleg is „core” intézményekben összpontosul az erőforrások és kompetencia sűrűsödésének erővonalai szerint. Az áttérés gyors és átütő lehet, de azt sem lehet kizárni, hogy a két típus még továbbra is együtt fog fejlődni.

A MI fejlődéséhez vezető lépések a könyvtárak napi munkavégzésében:

  • Géppel olvasható adatok növelése: digitalizálás, nyílt hozzáférés szabályozása, repozitóriumok fejlődése, kódolás, azonosítás, egységesítés, adatmodellek és adatmenedzsment, névterek fejlesztése és bővítése, szenzitív adatok menedzselése, copyright szabályok egységesítése, hozzáférési és elérési szabványok, eljárások, integrációs lehetőség az egyes eszközök között (Signle-sign on, LDAP active directory, EduID, ORCID, Neptun hozzáférések, stb.).
  • Adatok megbízhatóságának fejlesztése: kodifikált adatok nagy mintavétel alapján, nemzetközi nevezéktanok és szakértői rendszerek (VIAF, ISNI, Wikidata, stb.) használatával, bővítésével és fejlesztésével, amelynek két fejlődési ága van: saját nemzeti névterek fejlesztése, és/vagy kapcsolódás a nemzetközi rendszerekhez – mindkettő együtthaladással lehet hatékony.
  • Adatbiztonság rendszer és eljárási szinten a GDPR szabályzat erre vonatkozóan tartalmaz kihívásokat.
  • Keresés fejlesztése a tudáshálók és tudásbázisok jelentéstani elemzésével: szótárak és információkereső nyelvek egységesítése, fejlesztése, átvétele. Ebben a kérdésben sok lehetőség van a speciális eszközök és a globális rendszerekhez történő kapcsolódás szintjén egyaránt.
  • A fejlődés másik oldala az általános, globális kereső rendszerek bevonása, beillesztése a könyvtári szolgáltatásokba (lásd Talk to books, SemanticScholar, Google Scholar stb.).
  • Szakértői rendszerek felkészítése a mesterséges intelligencia alkalmazásokhoz; programozott oktatás, e-learning, önképzés rendszerek, web-ex és egyéb távoktatás változó automatizmussal vagy beillesztett mesterséges intelligencia elemekkel.
  • Gépi tanulási folyamatok előkészítése: a könyvtári szakmunkához és a használói rendszerekhez programozott útmutatók, szabad szöveges kérdések és válaszok elemzése és egységesítése használói és könyvtáros oldaláról, öntanuláshoz programozott folyamatok a szakmunka és használat számára, szöveg és képgyűjtemények fejlesztése és felkészítése a modellalapú elemzésekre, stb.
  • Saját rendszerek, fejlesztések és külső eszközök integrációi: a mesterséges intelligencia szolgáltatások begyűjtése, alkalmazása, használata, transzformálása illesztőprogramokkal.

Félautomata adat- és tartalomkutatás: az adatbányászattól a szövegbányászatig

Az információ feldolgozására, formális és tartalmi elemzésére szolgáló információkereső nyelvek fejlesztése, az indexelés, a tartalmi kivonatok és automatizálásuk egyes lépései, az osztályozás és klaszterálás, a statisztikai elemzés korábban is része volt feladatainknak. Az új szemantikai leírási szabványok áthatják a könyvtári feladatok teljességét a leírástól, a tartalmi feldolgozástól a keresésig.  A különféle szabványos fogalmi jelölőnyelvek, fogalmi szótárak és ontológiák a szemantikai fejlesztés fontos feltételeként hozzájárulnak a mesterséges intelligencia rendszerek tervezéséhez, modellezéséhez.  A természetes nyelvi keresés, a gép és ember, valamint a gépek közötti kommunikáció fontos előfeltétele a szövegértelmezés, a természetes nyelvi folyamatok tanulmányozása és formalizálása. Jelentős emberi tevékenységet képez a rendszer előzetes tervezése, tesztelése és az optimalizálás a szolgáltatások bevezetése előtt – olyan befektetésként, amelyek az automatikus szolgáltatásokban megtérülnek (vagy hiányozhatnak is).16 Mivel a nyelv hierarchikus rendszer, a nem strukturált indexek nem nyújtották a szövegösszefüggések tükrözését -  hasonlóan ahhoz, mikor szavak megtanulásával szeretnénk idegen nyelvet elsajátítani a nyelvtani szerkezet kapcsolatai nélkül. A kulcsszavak és indextételek a teljes dokumentumok tartalmára utaltak, de a tartalom jelentős része rejtve maradt, és nem tudtuk, hogy a relevancia milyen foka várható az előkeresett tartalomban. Az üzleti intelligencia megoldások a gépi tanulás előzményeként ezt a hiányt kívánták pótolni speciális elemző eszközök kombinációival a „deep” rétegek feltárásában.

Az üzleti intelligencia (BI = business intelligence) rendszereiben az adattárházak és adatbázisok tárolt információit félautomatikus adat- és szövegbányászati módszerek segítségével kutatták a jelentéskészítésben és monitorozásban.17 A matematikai tudáshoz kötött bonyolult eljárásokkal olyan összefüggések és információk kinyerésére nyílt lehetőség, amelyek ezen eszközök hiányában rejtettek maradtak a használók előtt. Az adatbányászat esetében jól strukturált faktogratikus, számszerű adatok, a szövegbányászatban strukturálatlan szöveges állományok képezik a kiindulási alapot.18 A batch–jelentések készítéséhez speciális matematikai ismerettel rendelkező szakemberekre (ma adattudósok, adatmérnökök) és drága eszközökre van szükség.

Az adatbányászatnál is alkalmaznak modellezési technikákat, amelyekhez algoritmusokat készítenek az adatmérnökök (előrejelzés a még nem ismert értékek becslésére, osztályozás a csoportbasoroláshoz, regresszió: hiányzó értékek becslése, szegmentálás és klaszterezés: a csoportbasorolás az adatok kohéziója alapján, idősorelemzés, adatgráfok hasonlósági vizsgálata, asszociációs kapcsolatok, rejtett, de jellemző összefüggések, vagy viselkedési minta feltárása, stb.) A szövegbányászatnál az algoritmusokat kiegészítették a gépi tanulással a batch üzemmódú jelentések real-time váltázatának kialakításához.

3. ábra
Az adattárház sémája (Sidló Csaba)19

Könyvtári példák

A fejlett, újgenerációs könyvtári rendszerekben20 az adatbányászat és a jelentéskészítés szolgáltatásokra vannak példák:

  • online és batch szolgáltatáshoz SQL alapú lekérdezés és/vagy szelekciós modulok;
  • predefiniált kérdésekre jelentések futtatása automatikus indítással, „alert” funkciók , újdonságlisták, tematikus leválogatás előre megadott szempontok szerint, SDI figyelés beállítása használói csoportok számára stb.;
  • szeparált adattárak speciális tartalmainak jelentései saját lekérdezési funkciók beállításával vagy társításával;
  • kimutatások statisztikai módszerekkel, feltételek előzetes betáplálásálval (idő, korcsoport, dokumentum típus, mennyiségi és minőségi mutatók, web analízis, könyvtári fókusz csoportok elemzése, használói viselkedés alapján előrejelzések, adatok és állományok összetételének vizsgálata, integritása, adattisztítás, stb.);
  • szakértői rendszerek könyvtári alkalmazása – részfeladatok automatizálásával.21
  • A könyvtári szakértői rendszerek manuális eszközeit az elektronikus változatokban először egyéb adattárakra utaló hivatkozásokkal oldották meg, amelyek bővebb, magyarázatokkal ellátott információs bázisokhoz vezették a használót. A könyvtári szakértői rendszerek mellett jellemző a kiszolgált szakterület adat- és tudásbázisainak bekapcsolása is (pl. drog adatbázis, művészeti segédanyagok, mérnöki adattárak stb.), amelyek használatához speciális szolgáltatásokat társítottak az automatizálás teljes vagy limitált szintjén (példák, kérdés-válaszok, programozott lépések, stb.).

Néhány konkrét példa:

  • OCLC gyűjteményanalízis-rendszere,22 amely más könyvtárak állományával történő összehasonlítással (könyvtár típus vagy az elsajátítást példákkal, kérdés-válaszokkal, programozott lépésekkel, szakterület, földrajzi hely stb. alapján) elemzi a gyűjtemény összetételét, arányainak, teljességének vagy hiányainak feltárásával.
  • Használói fókuszcsoportok elemzése (használat, kérések, keresési szokások, hallgatói eredményesség a könyvtárhasználók között, stb.), statisztikai adatok alapján automatikus következtetés, jóslás, vagy előrejelzés,23
  • döntés-támogató rendszerek (decision support system DSS) elemzése és módszerei.
  • Ezek a módszerek részben automatikusan működnek, és alkalmassá tehetők a korábban rejtett információ rétegek egy részének feltárására. A fejlődés során a rendszerekhez új informatikai megoldásokat társítottak, hasonlóan a DBPedia alkalmazáshoz fűzott természetes nyelvi folyamatok kutatásán alapuló szolgáltatásoknál.24

A másik oldal: a mesterséges intelligencia a könyvtárak számára fontos innovációi

A mesterséges intelligencia fejlesztésében az alábbi területek képeznek jelentős állomásokat a könyvtári szolgáltatások jövőbeni tervezésében és működtetésében a tartalomfeltárás és keresés szempontjából:

  • természetes nyelvi folyamatok (natural lan­gu­age processing, NLP) megismerése és programozása a gépi rendszekben az automatikus folyamatokhoz; szavak, szövegelemek osztályozása, klaszterálása (vektorok); információk kiterjesztése, bővítése (extraction); szövegből beszéd, beszédből szöveg automatikus előállítása;  automatikus fordítás; szöveg és képelemek felismerése, automatikus címkézése;
  • gépi tanulás, mély rétegek (deep learning, deep web stb.);
  • szakértői rendszerek fejlesztése és automatizálása, tudásbázisok építése, következtető motorok és használói felületek tervezése, döntéstámogató rendszerek tervezése és kialakítása, automatizált folyamatok, programozott oktatás, e-learning;
  • tervezés, előkészítés, osztályozás és opti­ma­li­zá­ció módszerek a gépi automatizáláshoz;
  • robotika, gépi kommunikáció, beszéd- és hangfelismerés, természetes nyelvi modellek;
  • vizualitás fejlesztése, gépi látás (image vision, machine vision, augment reality, virtual reality) videokamerák alkalmazásával, az analóg jelek digitális konverziójával.
  • A gépi látás módszere a mesterséges intelligencia fontos eleme. Fejlesztését programozással vagy a bemutatott minták „megtanításával” lehet fejleszteni. Programozás esetén a felismerést a tárgyak, alakok adatbázisából a hasonlóság felismertetése alapján biztosítja a rendszer. A tanulás alapú megismerésnél a hasonló ismerethálók (gráfok) jellemzőinek többszöri betáplálásával a látványban rejlő többszintű (vektoranalízisen alapuló) hasonlóságot már elvont és azonosításra alkalmas tulajdonságként értelmezi a rendszer, vagyis betanító fájlt alkalmazunk a művelet elvégzéséhez. „Rendszerint a mintaillesztés bizonyos formáját alkalmazzák arra a célra, hogy a képet néhány reprezentatív összetevőjével vegyék figyelembe,”25 és elvonatkoztassanak a nem meghatározó tulajdonságoktól (például árnyék, elmosódottság stb.).

A mesterséges intelligencia kulcskérdése: a természetes nyelvi folyamatok modellezése26

A természetes nyelvek nem gépi használat céljára keletkeztek. Míg az emberek könnyedén alkalmazzák a nyelvi fordulatokat, értelmezik az asszociációs, szaknyelvi kapcsolatokat, kiegészítik korábbi szövegösszefüggések alapján a hiányzó aktuális részeket, néhány betűből felismerik a szavakat, szófordulatokat, képesek korábbi szövegkontextusok felidézésére, szaknyelvi elemek és a köznyelv váltására, eltérő műveltségi szinthez igazítják közlendőiket – a számítógépek számára ezeket a készségeket programnyelvek segítségével kell betáplálni. Annak ellenére, hogy a beszélt nyelv és gondolkodás gyermekkorban kialakul egy megfelelő (fejlődő) szinten, az algoritmusok útján történő visszaadásban van hová fejlődni. Nem lenne meglepő, ha a tökéletes visszaadás csak mesterséges tudat (gondolkodás, emlékezet, felidézés, tanulás, következtetés, stb.) kialakulásával válna teljessé. „A természetes nyelv-feldolgozás (Natural Language Processing, NLP) a számítástudomány egy területe, mely olyan számítógépek létrehozását tűzte ki célul, melyek inputként vagy outputként természetes nyelvet használnak. A természetes nyelv kommunikációs eszközként való alkalmazása az ember igényeinek kiszolgálását jelenti, ugyanakkor nehéz feladatot ró a gépre. Különösen a bemeneti oldal, az emberi nyelv inputként való alkalmazása nehéz a beszélt nyelv sokszínűsége és a hordozott jelentés többszintűsége miatt.”27A korábbi üzleti intelligenciaelemző rendszereinek félautomata rendszereit felváltják az automatizált szövegfeldolgozások és szövegbányászati eljárások a nagy feldolgozási kapacitásnak köszönhetően a rejtett rétegek feltárására. A természetes nyelvi keresésnél és a szövegbányászati feladatok megoldása során egyaránt szükség van matematikai, informatikai, azon belül gépi tanulással kapcsolatos eszköztárakra, valamint emellett a természetes nyelvek feldolgozásával foglalkozó területek, a számítógépes nyelvészet, a nyelvtechnológia eredményeinek és statisztikai módszerek használatára.28 A gépekkel történő kommunikációt a kapcsolatteremtés redukált céljára tervezzük, amely nem terjed ki a nyelv minden adottságára. Az információhalmazok kezelése vagy a monoton tevékenységek helyettesítése során nem kell a természetes nyelv összes kreativitását visszatükröznünk, helyettük modellekkel dolgozhatunk, amelyek később több kontextusban alkalmazhatók. A gyakoriság elemzések statisztikái jól használhatók a valószínűség jóslásánál, az osztályba sorolásnál és a klaszterezésnél. A természetes nyelv feldolgozásának problémáit (előzmények, szintek, morfológiai problémák, többértelműség, stb.) a programozásnál figyelembe kell venni.

A szövegbányászat a strukturálatlan vagy kis mértékben strukturált szöveges állományaiból történő ismeretkinyerésnél különböző dokumentumforrásokból származó, korábban rejtett ismeretek és információk gépi intelligenciával történő kigyűjtésére és reprezentációjára kerül sor képek és szövegek  keresésével. A természetes nyelv gépi értelmezése a vektor analízisek algoritmusainak alapján indult gyors fejlődésnek a gépi rendszerekben, a szavak közötti rokonságok, hasonlósági modellek és minták, vizsgálati eredményei alapján. Az emberi ismeretszerzés és tanulás során is ez történik, az új ismeretek osztályozásához és a tudás struktúrába való illesztéséhez hasonló mintákat és előzményeket keresünk. Az emberi gondolkodást szimuláló mesterséges intelligencia rendszereiben is ezen az elven alapulhatnak a megismerés, felfedezés, tanulás lépései. Az orvostudományban a hasonló betegségek, tünetek, problémák, vizuális jelenségek keresése, kutatása és azok kezelésének standardjai az evidence based (tapasztalatokon, előzményeken, hasonlóságokon alapuló) orvoslás fejlődésének nagy lendületet adott, de más tudományterületeken is jelentős a szerepe van a hasonlóságnak és azok kifejezésének a jelenségek értelmezésében. Az újabb kutatások kiterjednek a humor vagy szleng vizsgálatára is.

A szavak, kifejezések és kisebb szövegelemek modell és vektor alapú analízisében a modelleket, programokat és az eredményeket strukturált módon, példamondatokkal29 felhőtárolókon teszik hozzáférhetővé. Az egyes szakterületekhez adaptálják, optimalizálják a modelleket, például a könyvtári szolgáltatásokban használhatók az általános ügyfélkapcsolati modellek, de adaptálni kell őket a könyvtári használatra, elemezni kell, hogy adott témában milyen használói kérdéseket várhatunk, és azokra a könyvtár milyen válaszokat szándékozik adni például a GYIK automatizálása esetében. A vizsgálatnál a kérdés-válaszokat ötvözni kell a szolgáltatási szituáció gyakorlatához a formalizálásnál. A szemantikai hasonlóság elemzése annak kimutatására szolgál manuális eszközök nélkül, hogy két szövegdarab (közel) azonos jelentése formalizálható legyen a kérdésre adható válaszokban más helyzetekre adaptálható módon is.  A vizsgálat természetes nyelvi példák alapján történik. A jelenlegi ügyfélrobotok30 már visszakérdezni is tudnak, de a kommunikációs színvonal még nem hibamentes.31

Szemantikailag hasonló típusú kérdések és válaszok:

4. ábra
Ügyfélrobot kommunikációs sémája

A gépi tanulás és a mély rétegek a könyvtári szolgáltatások szempontjából

A mesterséges intelligencia alkalmazások fejlődésének kulcskérdése, hogy az ismeretek tárolása és visszakeresése mellett a tanulás képességével kell rendelkezniük. Legjelentősebb összetevői ezért a humán intelligencia képességeihez kapcsolódnak: tanulás, emlékezés, felidézés, következtetés, az ismeretek fejlesztése, példák elemzése, értékelése és beépítése a korábbi ismeretekbe, minta-, szöveg- és képfelismerés, stb. Azokat a számítógépes programokat, amelyek nem képesek az emberi gondolkodás legalább valamely elemének szimulálására a beépített tudás használati módszerei mellett, nem tekintik intelligensnek. Minél több jó minőségű adat vagy szöveg van a jól megtervezett modell vizsgálatára, annál jobb eredményeket várhatunk, ezért a gépi tanulás előkészítéséhez a fejlesztők a nyelvi és képi modelleket „előfeldolgozzák” a programozás során a megoldás optimalizálásához.  A tanuló rendszerekre jó példa a kutatóegyetemek tudósainak bevonásával fejlesztett Watson, amely a JEOPARDY (USA-ban honos szellemi játék) humán nyerteseinek legyőzésével vonult be a mesterséges intelligencia történelmébe. A webről 200 millió oldalnyi információ 4 TB memórián, a komplett angol nyelvű Wikipédia anyagával volt tárolva. Azóta egyéb, pl. orvosi ismeretekkel is bővül. Megszemélyesítő képe dinamikus színváltozással jelzi a válasz helyességébe vetett bizalmát. Java és C++ nyelveken írt szoftvere több mint száz technikát alkalmaz a természetes nyelv elemzésére, a válaszhoz szükséges források azonosítására, a válaszkínálat generálására, relevanciájuk értékelésére, valamint a végső válasz összeállítására. Az alkalmazott tudásbázis szerteágazó forrásokból építkezett: enciklopédiák, szótárak, újságcikkek, irodalmi művek, Internet források, tezauruszok, taxonomiák és ontológiák szolgálták a rugalmasságot és átfogó felfogást. A DBPedia, WordNet és Yahoo adatbázisokat is használták. A program fő szoftvermoduljait a következő ábra mutatja:

5. ábra
Watson kérdésre válaszoló rendszerének felépítése32

Watson példája mutatja, mennyire összetett módon lehet eredményt elérni a mesterséges intelligencia alkalmazásokban, és a források gazdagításában hol láthatók a könyvtári alapok. Sokkal kisebb lépésekben is lehet haladni, amelyet kis cégek sikerei bizonyítanak.

A Google gépi tanuló keretrendszere, a TensorFlow a szövegek osztályozására, hasonlóságok kimutatására, klaszterálásra és egyéb NLP folyamatok vizsgálatára szolgáló nyílt forráskódú szoftver, amely begyűjti az adatokat, oktató modellel rendelkezik, és támogatja a „deep learning” eljárásokat. Flexibilis architektúrájának köszönhetően platformfüggetlen alkalmazás, Python és C++ programnyelvet használ, front-end API beállításával támogatja alkalmazások építését és integrációját.33

Könyvtári mesterséges intelligencia területek – tudásreprezentáció alapokon

A tudásreprezentációs alkalmazások fejlődésük során tartalmazták könyvtári szempontból az adott technológiához illeszkedő és használati feltételekkel, metaadatokkal felkészített forrásanyagokat. A mesterséges intelligencia tudásreprezentációi komplex problémák megoldására alkalmas számítógépes technológiákat alkalmaznak, amelyek az emberi problémakezelés folyamatát szimulálják. A tudásreprezentációk a szemantikus web kulcsfontosságú megoldásai, az automatikus osztályozásnál nem szöveges karakterláncok alapján történik a keresés, hanem logikai struktúrák szerint, amelyek a térképeket is kereshetővé teszik.  A szemantikus web integrálja a tudásmegjelenítést az XML-en alapuló jelölőnyelvek alkalmazásával. Mivel a fogalmakat más fogalmakhoz való viszonyuk fejezi ki, ezért a szemantikai hálók jobban jellemzik az adott tudástartalmat a szavakban kifejezett egyes fogalmaknál, ezért az internet tudásalapú objektumainak tulajdonságait kapcsolataik alapján tárják fel a tudásalapú rendszerek. A tudásreprezentáció technológia a szakértői rendszerekkel és a gépi tanulással párhuzamosan fejlődik. Fontos adottságuk, hogy a tárolt tudást értelmezni, osztályozni, rendszerezni stb. tudják, és annak alapján következtetésekre és döntések létrehozására is képesek. A Web Ontológia Nyelv (OWL) fejlesztésével kiegészíthetjük a szemantikai struktúrákat, integráltan kezelve az automatikus osztályozási összetevőkkel, ezáltal folyamatosan frissíthető a tartalmak osztályozásának, kategorizálásának képessége és eszközkészlete.34

Könyvtári gyakorlati példák:

  • Intézményi repozitóriumok, kutatási adattárak, amelyek hozzáférhetővé teszik a szerzők munkásságát, és teljes szövegű tudásforrásokat nyújtanak fejlett kereső eszközökkel. A gyűjtemények a szerzői és kiadói jogok tiszteletben tartásával közlik a publikációk teljes szövegét. Erre a fenntartó intézmény vállal garanciát ugyanúgy, mint a metaadatok hitelességére. Az MTMT és az egyetemi repozitóriumok integrált fejlődése és kapcsolatrendszere a szerzőkre vonatkozó adatreprezentációkkal, kutatási regiszterekkel és életművekkel fontos hazai eredmény.
  • Heterogén gyűjtemények kombinálása: metaadat sémák, ontológiák, szakértői szótárak integrációja a saját rendszerben és külső rendszerekből, szintaktikai és szemantikai struktúrák átvétele és tervezése;
  • Természetes nyelvi megoldások fejlesztése, fogalmi- és szöveganalízis; bizonyítási és elemzési folyamatok szabályozása tér- és időbeli összefüggések között; kommunikációs folyamat tervezése; intelligens interfészek beépítése a tudásreprezentációs eszközök kommunikációjához; perszonalizáció, szemantikai és audiovizuális eszközök integrációja; automatikus annotációk; ontológia kiterjesztések, stb.35
  • A tudásreprezentáció szemantikus és mesterséges intelligencia megoldásai kibővítik a könyvtári döntéshozás és elemzés folyamatához szükséges eszközkészletet, de teljes mértékben itt sem helyettesíti az emberi alkotó tevékenységet.

A könyvtári szakértői rendszerek

A szakértői rendszerek a mesterséges intelligencia fejlődésének fontos elemei. A könyvtári szakértői rendszerek számítógéppel támogatott problémamegoldást nyújtanak az emberi intelligenciát és szaktudást (részben) helyettesítő módon. Képessé tesznek terjedelmes, bonyolult, vagy sok adatot és hivatkozást igénylő feladatvégzésre, vagy a kiszolgált terület átlátására. Rendszerint olyan következtető motorokat használnak, amelyek hasonlóan „viselkednek”, mint a humán szakértők: felhasználva a megoldáshoz vezető szabályokra és folyamatokra való hivatkozást a belső vagy külső adatbázisokból és segédanyagokból. (Lásd a könyvtári katalogizálási és osztályozási szabályzatokat, ontológiákat és tezauruszokat, az orvosi drog adatbázisokat, művészeti  stílus- és formatanokat, színtérképeket, a mérnöki méretezési számításokat, szerkezeti ábrákat, stb.)36 A legtöbb szakértői rendszert specializált szoftvereszközök segítségével fejlesztették ki. Két fő részük mellett (tudásbázis és következtető motor) általában számos funkcióval rendelkeznek, mint például a hiperszöveg írására szolgáló eszközök, barátságos felhasználói felületek létrehozása, listák, karakterláncok és objektumok manipulálása, valamint a külső programok és adatbázisok összekapcsolására szolgáló eljárások. A mesterséges intelligencia-fejlesztések fontos összetevői, mert a gépi tanulás és emlékezet számára forrásanyagként használhatók.

  • Tudásbázisa több száz eset és szabály feldolgozására alkalmas, programozása az összes könyvtári területre vonatkoztatható (tanácsadás, speciális szelekció, célhoz illesztett és szerep alapú megközelítés, oktatási célra alkalmas felépítés, sztenderd problémakezelés, stb.) A könyvtári elektronizált szakértői rendszerek hagyományos területeit minden könyvtáros ismeri (katalogizálás, osztályozás, gyűjteményszervezés, tájékoztató szolgálat, stb.), ezért könyvtárosok számára újdonságot a mesterséges intelligencia beépítése, valamint a lefedett szakterület adatbázisai és egyéb forrásai jelentik. Az átmeneteknek itt is változékonyak a határai.
  • Inference / következtető motorja a tudásbázis szabályait alkalmazva támogatja a döntéshozást, magyarázatokkal és számos funkcióval (hipertextírás, használói felületek szerkesztése, listák manipulálása, dokumentumláncok létrehozása, stb.) rendelkezik.
  • Beépített workflow (folyamatkövetés) tartozik az alkalmazás vagy elsajátítás lépéseihez, példákkal és alkalmazási szabályokkal.
  • Intelliges ágensek szolgálnak többféle tranzakció elvégzésére és több adatbázisban történő keresésre, indexelésre. Automatizálják az ismétlődő feladatokat, képesek korábbi tranzakciókat felidézni, adaptálni és azok alapján új feladatokat végrehajtani, valamint korábbi keresések alapján javaslatot adni a használóknak.

6. ábra
Példa: adatbázis szelekciós szakértői rendszer olvasói és könyvtárosi oldalról, statisztikai elemzéssel és nyelvi példamondatokkal37

A rendszerhez statisztikai elemző rendszer is tartozik, automatikus összesítést követően kiértékeli az eredményeket. A rendszer kétoldalú, a használók és a könyvtárosok szempontjából is elemez.

Keresés: a szemantikától a szabad szöveges kérdésekig és válaszokig

Az agyi neuronok közötti impulzusokhoz hasonló módszerek gépi programozásával készítik fel a mesterséges intelligencia rendszereket a dokumentumok jellemzésén alapuló automatikus visszakeresésre. Ehhez a módszerhez a szemantikus web adathálózatának felépítésére van szükség, ahol az egyes csomópontok közötti haladás szintén a tanulás és megismerés agyi folyamatait tükrözi. A MI elméletében a keresés folyamatai és típusai matematikai módszerekkel leírhatók. Az elemek kódolása és programozása az emberi keresés folyamatait szimulálják, minél inkább megismerjük az emberi agy működését, annál fejlettebb programok készítésére válik képessé az ember a keresés gépi szimulálására. A korábbi években több szemantikus kereső született a Google, a Microsoft és egyéb szolgáltatók kezdeményezése során, amelyek hátterében többféle eszköz kombinálása, a megnevezések nemzetközi kooperációs hátterrel zajló fejlesztése állt. A Google 2012-ben a Microsot-tal, a Yahoo-val és a Yandex-szel, valamint az OCLC-vel és a Library of Congress-sel együttműködve projektet indított a szemantikai keresés fejlesztésére, amelynek hátterében a Freeweb akkor 12 millió (2016-ban már 400 millió!) bejegyzést tartalmazó tudásbázisának megvásárlása állt.

A mély rétegek kérdése

A mély rétegek feltárásának bonyolultságára az emlékezet és a problémamegoldás kapcsolatát lehetne említeni: az emberi problémamegoldásban könnyedén felidézzük korábbi emlékeinket (egy forrás  használatánál emlékszünk az előnyeire vagy hibáira, a kapcsolatos kritikákra vagy elismerésekre minden feljegyzés nélkül is). A személyes vélemény nem programozható, előtte el kell jutni az általánosság vagy következtetés megfelelő szintjére az algoritmusokkal történő modellezéshez.38

A metakereséstől a szemantikai hálókon át a mesterséges intelligenciáig

A metaadatok keresése az új technológia módszereihez képest egyszerűnek tűnik a könyvtárosok számára. Ha pontosak voltak, a visszakeresés is pontos és teljes lehet. A kulcsszavak automatikus keresésre kevéssé alkalmasak, mert a gépek nem tudják eldönteni, mikor van szükség módosításra, kapcsolati hálójuk nélkül nem tükrözik a pontos jelentéstartalmat. A szemantikus hálók, gráfok alkalmazása a keresési mintákban viszont ígéretes eredményeket hozott a kapcsolatok és azok tulajdonságainak hátterével az RDF alapú szemantikai struktúrákban. A géppel értelmezhetó RDF elemek a keresést korlátlan adatkapcsolatokkal terjesztik ki.

A mesterséges intelligencia alkalmazásaiban gépi programozással szimuláljuk az emberi intelligenciát az információk kereséséhez és szolgáltatásához szabad szöveges kérdések és válaszok formájában is, a gépi szövegfelismerés és szöveg-értelmezés, fordítás, stb. igénybevételével. A mesterséges intelligencia alapján történő szabad szöveges keresésekben felhasználják a természetes nyelvi folyamatokat és azok modellezését, a szövegfelismerés és gépi tanulás módszereihez tervezett algoritmusok alapján.

Néhány fontos automatikus keresési stratégia:39

  • A vektor alapú keresési modell azon alapul, hogy a dokumentumot a benne foglalt kifejezések alapján lehet jellemezni és keresni. A keresésnél két dokumentum hasonlóságát vagy különbözőségét legjobban a jellemző kifejezéseik hasonló vektora alapján lehet kimutatni, a kifejezések előfordulásának gyakorisága, vagy a többi kifejezéshez való viszonya alapján. Jellemző az is, hány dokumentumra lehet vonatkoztatni a kereső kérdések vektorát, vagy adott kifejezés milyen súlyt képvisel a vektorban a többi gyakori kifejezéssel szemben.
  • A probabilisztikus keresési modell azon alapul, hogy a dokumentum, amelyben a kifejezés szerepel, a legjobban képviseli a fogalom jelentését. Ha az elemzéshez össze tudunk hasonlítani releváns és nem releváns dokumentumokat, a különbségek vagy azonosságok alapján keresési mintákat tudunk előállítani, amelyek eredményesebben valószínűsítik a relevancia fennállását vagy hiányát a vektor vizsgálat modellje alapján. A hasonlóság vizsgálata számítógéppel történik a bizonytalanság csökkentése érdekében több mintaszöveg alapján.
  • A neurális háló alapú keresésben a hálózatban található csomópontok között (matematikai képletekkel leírható módon) „halad” a keresés, amely akkor indul, amikor a lekérdezés aktiválja a dokumentumokra mutató linkeket. A keresésnél a relevancia mintákhoz kötődő hasonlósági együtthatókat használják.40

Mesterséges intelligencia „keresi a tűt a szénakazalban”41

Két különleges mesterséges intelligenciát tartalmazó új, szabad szöveges kereső a Semantic Scholar és a Talk to books.

A Semantic Scholar (2015)42 tudományos publikációk keresésre szolgál az Allen Institute for Artificial Intelligence (AI2) fejlesztésében és Oren Etzioni vezetésével, aki az AI kutatója és professzora. A fejlesztésnél kombinálták a gépi tanulást, a természetes nyelvi folyamatok programozását, beépítettek egy szemantikai elemző és egy idézés analízis eszközt, amelynek eredményeit grafikusan is bemutatja a rendszer. A keresőoldal áttekinthető, letisztult keretrendszert nyújt, háromszintű előválogatással: az összes tartalomból, az orvos- és információtudományi közleményekből. A találatokhoz értékelést is kapunk a hivatkozási index, és más dokumentumokhoz vezető kapcsolatok alapján. Alapfunkciói (mentés, megtekintés, hivatkozás és „alert” szolgáltatás készítése) mellett az ábrákat, grafikonokat a cikkből kiemelve nyújtja. Közli az egyes szerzőkhöz tartozó hivatkozások számát, és a téma előfordulásának évenkénti gyakorisági grafikonját. A keresőkifejezés beírását követően hasonló találatokból is választéklistát kínál megjelenési évszámokkal. A publikációk elemzéséhez és a kulcsszavakhoz gépi technológiát alkalmaznak. A keresésnél kapcsolódó témákat is felajánl, például a tudásreprentecióhoz az ontológia, tudásbázis, természetes nyelvi folyamatok, szakértői rendszerek és rendszer architektúra folyamatok témáit, amely egyúttal egy témához tartozó fontos területekről is.  A Google Scholar és PubMed rendszerekhez hasonlóan itt is a legjelentősebb forrásokat építették be a keresésbe és a kapcsolatok kiépítésébe, kiemelkedő orvoslási forrásanyagokkal. A találati lisához rövid szöveges tartalmi jellemzők tartoznak. Induláskor 100 000 cikk alapján, több orvosi szakértő bevonásával, előzetes szakértői elemzésekkel kezdték a szolgáltatást, jelenleg 40 milliónál több (2018) forrásból válogathatunk. A mesterséges intelligencia kutatói automatizált kereső eszközt hoztak létre, amivel minden tudományos publikációt újra átvizsgáltak a tesztelés során, amely korábban nem feltárt kapcsolatok felkutatását is eredményezte. A szolgáltatásban évente közel 2 millió tudományos folyóirat feldolgozására és automatikus kategorizálására nyújt lehetőséget a megoldás. A „core” metaadatokat automatikusan választják ki, és GitHubon tárolt forrásklódokkal, munkaelemekkel és szoftverhivatkozásokkal dolgoznak.

Talk to books – a Google új mesterséges intelligencia keresője43

A Talk to books keresőben (a cikk első részében már említettem) szabadon fogalmazott kérdéseket is adhatunk – jelenleg angol nyelvre van felkészítve a rendszer. A kérdésekre a leginkább releváns válaszokat egy öntanuló “robot” keresi meg a Google Books tartalmából. Az angol nyelven feltett kérdésekre egészen jó válaszok érkeznek, a keresőkérdések kis módosítása nyomán változó, de hasonló a találati listákat kapunk. Az eszközt érdemes néhányszor tesztelni, hogy a könyvek feldolgozásának növekedésével hogyan alakulnak a találatok. A mesterséges intelligencia gépi tanulással értelmezi a kérdést, és az induláskor százezernyi könyv teljes szövegéből próbált értelmes, releváns válaszokat kihozni rövid metaadatokkal, a könyvborító képével, és rövid tartalmi jellemzőkkel. Öntanuló rendszer, a kezdeti próbálkozásoknál a relevancia korlátait meghatározza a beépített könyvek tematikája. A találati lista elemei referencia műnek jelenleg még nem kezelhetők, a könyvek érték szerinti válogatása valószínű nem történt még meg.

Több kérdést feltettem angol nyelven (Trianon hatása Magyarországra, milyen nép a magyar, ki gyakorol hatást a magyar fiatalokra, stb.), a válaszokra adott találatok tájékoztatás helyett inkább érdekesek, mint pontosak, arról kapunk információt, amely a tárolt könyvekből ránk vonatkozóan kinyerhető. A Google Books elemzett könyvei alapján ad válaszokat, vagyis a keresést nem igazán lehet értékelni.

Intelligens rendszerek fejlődési irányai (Gartner előrejelzés)44

A Gartner elemző cég tíz területen jelölte ki a mesterséges intelligencia fejlődését, amelyekből a következőkben a könyvtári szempontból fontosakat szeretném kiemelni. 1. AI foundations – alapok: a legtöbb IT cég foglalkozik mesterséges intelligencia fejlesztés megalapozásával, de még nem látható, hogy az emberi intelligencia gépi szimulálása és a gépi tanulás mennyire lesz teljes értékű. 3. Az IoT (internet of things) az intelligens tárgyakra vonatkozó előrejelzés szerint a gépek és emberek kommunikációjára, a szenzorok alkalmazására vonatkozó technológia fejlődése biztató, amelyek könnyen átültethetők a gazdasági eredményességet elősegítő megoldásokba (intelligens autók, robotika, drónok stb.). 6. Conversational platforms: párbeszéden alapuló rendszerek fejlődésében az eleinte egyszerű válaszok generálását követően komplikált interakciók kialakítása is várható az ügyfélszolgáltatásban. 7. Immersive experience: a digitalis világ virtuális teremtett rendszereinek fejlődése nyomán az emberek érzékletes módon kapcsolódnak a mesterséges környezethez, a határok elmosódnak a számítógépes programokkal teremtett világ és a való világ között (lásd AR – augmented reality, VR –virtual reality, turisztika, művészet, oktatás, okos város programok stb.). 9. Event-drived: esemény-vezérelt rendszerek mesterséges intelligencián alapuló feltárása elsősorban a media területén válik fontossá.  0. Risk – trust: a kockázatok és veszélyek elhárítását célzó biztonsági és adatvédelmi rendszerek fejlesztése és beépítése a rendszerekbe az álhírek és a megtévesztő információk és egyéb fenyegetések ellenében már most is kiemelt jelentőségű.

Hogyan állunk képességeinkkel, legyőz­hető-e az emberi intelligencia?

Az emberi agy teljesítményét összességében nem múlják felül a mesterséges intelligencia rendszerek, annak ellenére, hogy néhány területen jobb eredményeket érnek el nálunk. Amíg a fejlesztés folyamatait emberek vezérlik, addig az új technológia alkotásaira úgy kell tekintenünk, mint az emberi alkotókészség újabb megnyilvánulásaira, képességeink kiterjesztésére. A megismerés, a készségek és képességek fejlesztésének folyamata viszont a mesterséges intelligencia mellett az emberre is általánosan jellemző.

Jegyzetek és irodalom

[Az elektronikus források megtekintése: 2018. november 11.] 

1.   HORVÁTH Zoltánné: Szemantikus hálók és mesterséges intelligencia 1. rész: Értelmezések és alkalmazások könyvtári nézőpontból = Könyvtári Figyelő, 28. (64.) évf. 2018. 3. sz. 345–362. p.

2.   JOHNSON, Ben: Libraries in the age of artificial intelligence = Computers in Libraries =  January 2018. 

      http://www.infotoday.com/cilmag/jan18/Johnson–Libraries-in-the-Age-of-Artificial-Intelligence.shtml

3.   BAILEY, Charles W.: Intelligent library systems. Artificial intelligent tecnology and and library automation systems = http://digital-scholarship.org/cwb/intlibs.pdf

4.   OSSAWA, Edward: The fourth industrial revolution is here… = https://dzone.com/articles/four-waves-of-ai-and-what-the-future-holds-for-it

5.   SUNDAR, Pichai: We will move from mobile first to an AI first world = https://aibusiness.com/google-ceo-sundar-pichai-we-will-move-from-mobile-first-to-an-ai-first-world/

6.   MEDLEY, Joseph: https://developers.google.com/web/updates/2018/05/welcome-to-immersive;

      https://seliqui.eu/en/services/vr

7.   Explore Virtual Reality at DTU Library = http://www.bibliotek.dtu.dk/english/news; FORD, Anne: Making  virtual reality a reality. NCSU Libraries offer top-notch simulation technology = https://americanlibrariesmagazine.org/2017/09/01/making-virtual-reality-a-reality/

8.   HISMobile – Mobil kliens kórházi információs rendszerekhez – T-Systems = http://www.t-systems.hu/megoldasok/alkalmazasok/alkalmazascsomagok/egeszsegugyi-megolda
sok/hismobile

9.   Fekete doboz. EBERHARDT, George W.: An AI Lab in library. Kim Bahyum idézett szavai = https://americ anlibrariesmagazine.org/blogs/the-scoop/ai-lab-library/

10. LOVÁSZ László interjú (MTA 2018) = https://mta.hu/tudomany_hirei/megerteni-a-minket-korulvevo-nagy-halozatok-matematikajat-interju-lovasz-laszloval-109089

11. COLEMAN, Catherine Nicole: Library AI initiative = https://library.stanford.edu/projects/artificial-intelligence/

12. BAHYUM, Kim szavai = https://americanlibrariesmagazine.org/blogs/the-scoop/ai-lab-library/

13. Adatok webje, amely már nem csak html dokumentumok és weboldalak formájában tárolja az információt. Az adathálózatok lehetővé teszik a „mély web” kutatásokat. (https://en.wikipedia.org/wiki/Semantic_Web; DBpedia – a crystallization point for the web of data = https://www.sciencedirect.com/science/article/pii/S1570826809000225

14. Schema.org: https://schema.org/docs/gs.html; lásd még: strukturált adatok jelölőnyelv szótára, amelyet a keresőgépek értelmezni tudnak. A Google, Microsoft, Yahoo és a Yandex fejlesztette az OCLC és a Library of Congress közreműködésével = https://searchenginewatch.com/2016/07/19/the-complete-beginners-guide-to-schema-org-markup-2/; lásd még: OGBUJI, Uche (2018): Introduction to the schema.org information model: make your data more useful in automated applications = https://developer.ibm.com/articles/wa-schemaorg1/

15. GODBY, Carol Jean – VIZINE-GOETZ, Diane (2017): BIBFRAME and OCLC works: defining models and discovering evidence = https://www.slideshare.net/oclcr/bibframe-and-oclc-works-defining-models-and-discovering-evidence

16. Lásd a robottechnológiát vagy az emberi intelligencia szimulálásával működtetett automatikus ügyfélszolgálatokat a kérdések értelmezése és válaszadás során (Alexandra, Siri, Vanda stb.)

17. Üzleti intelligencia: https://dzone.com/articles/solving-architectural-dilemmas-to-create-actionabl?fromrel=true

18. https://hu.wikipedia.org/wiki/

19. SIDLÓ Csaba (2004): Összefoglaló az adattárházak témaköréről = http://scs.web.elte.hu/Work/DW/adattarhazak.htm

20. Az OCLC OLIB-nál pl. a rendszerbe építve, sok más rendszernél külön termékekkel biztosítják.

21. Gazdag választék található az egyes tudományokhoz pl. az Expert Systems for its Application folyóiratban: https://www.sciencedirect.com/journal/expert-systems-with-applications

22. Collection Evaluation = https://www.oclc.org/en/collection-evaluation/features.html

23. TISSOT, Leonardo: Predictive analytics to student success improvement (ld. ehhez a fenti cikket módszerként)= https://elearnmagazine.com/predictive-analytics-learning-analitycs/; Design of an integrated Decision Support System for library holistic evaluation (2014) = https://researchgate.net/publication/262877705_Design_of_an_integrated_Decision_Support_System_for_library_holistic_evaluation

24. PARUNDEKAL, Rahun: Classification of things in DBPedia using deep neural network = International journal of web and semantic technology = https://arxiv.org/ftp/arxiv/papers/1802/1802.02528.pdf

25. DUDÁS László (2011): Alkalmazott mesterséges intelligencia = https://www.tankonyvtar.hu/hu/tartalom/tamop425/0046_alkalmazott_mesterseges_intelligencia/ch03s02.html

26. Natural lanquage processing – NLP: An ontology-enabled natural language processing pipeline for provenance metadata extraction from biomedical text (Short paper 2016) = https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5486409/

27. Dudás László i. m.

28. https://hu.wikipedia.org/wiki/. A számítógépes nyelvészet másik ága a szókincs feltérképezése  http://real.mtak.hu/24408/1/TDM.pdf

29. TensorFlow Hub = https://tfhub.dev/google/universal-sentence-encoder-large/3; Kurzwell (a Google mérnöki igazgatója) https://qz.com/1252664/talk-to-books-at-ted-2018-ray-kurzweil-unveils-googles-astounding-new-search-tool-will-answer-any-question-by-reading-thousands-of-books/

30. Alexandra, Siri, Wanda, Sophia, Niki, Teneo, IBM Watson, stb.

31. http://computersinlibraries.infotoday.com/2018/Present ations.aspx;

32. Dudás László idézett művéből https://www.tankonyvtar.hu/hu/tartalom/tamop425/0046_alkalmazott_mesterseges_intelligencia/ch04s07.html

33. https://www.infoworld.com/article/3278008/tensorflow/what-is-tensorflow-the-machine-learning-library-explained.html; https://www.tensorflow.org/

34. https://en.wikipedia.org/wiki/Knowledge_representation_and_reasoning

35. (IEEE Intelligent Systems, 16.); Special issue on AI and cultural heritage =http://www.computer.org/portal/pages/intelligent/content/CulHerCFP.html

36. OLMSTADT, William: Cataloging expert systems. Optimism and frustrated reality http://southernlibrarianship.icaap.org/content/v01n03/olmstadt_w01.html; Expert systems= http://www.pcai.com/web/ai_info/expert_systems.html

37. Példa MA, Wei – COLE, Timothy: Electronic database selection expert system http://www.ala.org/acrl/sites/ala.org.acrl/files/content/conferences/pdf/ma.pdf

38. How the brain combines memories to solve problems = NeuroscienceNews, 19 September 2018 = http://neurosciencenews.com/memory-problem-solving-9891/

39. Teljes felsorolásra nincs itt lehetőség, a felsőoktatási e-tananyagok részletes feltárására lehet támaszkodni

40. https://en.wikiversity.org/wiki/Digital_Libraries/Indexing_and_searching; https://nlp.stanford.edu/IR-book/html/htmledition/probabilistic-information-retrieval-1.html;  Bővebb információk a felsőoktatási elektronikus tankönyvekben szerepelnek az egyéb keresési módszerekről és a matematikai alapokról. (Kiterjesztett Boole, fuzzy stb. algoritmusok)

41. BALÁZS Richárd: https://sg.hu/cikkek/tudomany/115613/mesterseges-intelligencia-keresi-a-tut-a-szenakazalban; http://www.kithirlevel.hu/index.php?kh=mesterseges_intelligencia_keresi_a_tut_a_szenakazalban

42. www.semanticscholar.org

43. https://books.google.com/talktobooks; Ray Kurzwell, a Google mérnökigazgatója  nyilatkozata a Talk to Books-ról (2018) https://qz.com/1252664/talk-to-books-at-ted-2018-ray-kurzweil-unveils-googles-astounding-new-search-tool-will-answer-any-question-by-reading-thousands-of-books/

44. Gartner előrejelzés 2018 = https://www.gartner.com/smarterwithgartner/gartner-top-10-strategic-technology-trends-for-2018/

Beérkezett. 2018. november 10.