1. rész*: Értelmezések és alkalmazások – könyv-tári nézőpontból

Bevezetés

A mesterséges intelligencia1 irodalmában meglepően sok a gépek győzelmének víziója, a gépek által átvett funkciók miatti aggodalom. Az informatika fejlődése közben felbukkanó félelem a korábbiakban is jellemző volt, viszont tapasztalataink szerint a változás inkább új típusú feladatokat, összetettebb szolgáltatásokat generált, új készségek és képességek elsajátítására nyitott lehetőséget.  A kibővülő munkakörök nyomán az új ismereteket beépítő tanulás életünket kísérő követelménnyé változott. Más szakterületeken is megfigyelhető a számítógéptudomány és a szaktudomány fejlődésének együtthatása. Az orvostudományban talán a leginkább szembetűnő a digitalizálás kedvező hatása, többek között a tapasztalati orvoslás eredményességére. A digitalizált képi és szöveges vizsgálati eredmények mintái és tapasztalatai gyorsan terjedtek a hálózaton, megerősítve vagy épp cáfolva a korábbi eljárásokat és kezeléseket. A meghaladás és frissítés különleges információs szolgáltatásokat generált „alert” funkciókkal és revíziókkal az „evidence based”, vagyis a bizonyítékokon alapuló gyógyítás gyakorlatában.2 Miközben küzdelmeket folytatunk a napi gyakorlat folyamatos megújításával, érdemes néha világszinten kitekinteni a megvalósult újdonságokra.

A gépi mesterséges intelligencia gyors reakcióidőkkel, széles áttekintési képességgel és növekvő gépi memóriával egészíti ki az emberi intelligencia lehetőségeit – kedvező hatással a tudományok, a gyógyítás, a tervezés, elemzés és döntés-előkészítés fejlődésére. A korábban megoldhatatlan vagy lassabban végezhető feladatokban az ember és gép együttműködése kimagasló eredményeket hozott a technológia és tudományok fejlődésében, az oktatásban és az emberi készségek területén. Az emberi agy működésének jobb megismerésére, az ún. neurális hálók működési elvére alapozták már a kezdeti kutatók is az ismeretbővítés és tudásközvetítés új elméleteit, amelyek nyomán egyre bonyolultabb számítógépes programok létrehozására váltak képessé a fejlesztők. Nem véletlen, hogy sok kutató csak az ember és a gép kölcsönhatásában látja a mesterséges intelligencia megvalósításának értelmét (hibrid rendszerek), tagadva a gépi intelligencia embertől független fejlődésének vagy működésének lehetőségét. A megújulás tényeiről szóló információk a globális digitális rendszerek nyilvánosságában könnyebben terjednek és gyorsabban kapcsolódnak egymáshoz, a növekvő adat- és információs kapcsolatok új értelmezési és felhasználási területekhez vezethetnek, ezért nevezhetők az új típusú információs hálók dinamikusnak.

Fenyegetés vagy megoldási lehetőség?

Komoly tudósok félelmei mellett Z. Karvalics László „alarmistának” nevezte a mesterséges intelligencia embert kiváltó hatásaiban a veszélyekre koncentrálókat, és „veszélydiskurzus” 3 jelöléssel illette a félelmek közléseit, amelyekben szívesen fedeznék fel némi iróniát.

Az ismeretlentől való félelem az emberi életösztön természetes jelensége, akkor is, ha esetenként eltúlzott. Könyvtári nézőpontból az informatikát használó emberek és a felzárkózással nehezen birkózók közötti társadalmi polarizáció miatt már most is nagy figyelmet kell fordítani a digitális írástudás fejlesztésére, amelyben a könyvtárak jelentős mentori szerepet vállalnak. Viszont a mesterséges intelligencia különbözik a korábbi technológiai fejlődéstől, mert a többi tudomány eredményeivel együtt halad. Az emberi intelligencia szimulálásához nem nélkülözhető az emberi agy működésének, az emberi nyelv törvényszerűségeinek, az ember társadalmi beágyazódásának (beállítódás, viselkedés, stb.) mélyebb kutatása sem. A szaktudományok és a mesterséges intelligencia fejlődése ösztönző hatást fejt ki egymásra.  A könyvtárosok a kulturális örökség hagyományai őrzésének hivatástudatával védik a klasszikus humán tudományok értékét. A nyelv és a művelődés korábbi gyakorlatának megőrzése érdekében örökségvédelmi intézményként a múzeumokkal, kutatási helyekkel és archívumokkal együtt érdekeltek minden szöveg-, kép-, hang- és dokumentum alapú innovációban.

A mesterséges intelligencia és a „veszélydiskurzusok”

Sokan gondolják, hogy az intelligens robotok megjelenésétől (2015) számíthatjuk a mesterséges intelligencia fejlődésének transzformálását a tudomány területéről a mindennapi tevékenységekhez vezető úton.  Az embert néhány művelettel kiváltó rendszerektől az önműködő és kommunikáló robotokig a mesterséges intelligencia értelmezése változó keretrendszert tükröz. A határvonalakról nem érdemes vitázni, mert minden fejlődés csak egy (rövid) állomásnak tekinthető a továbbiak előtt: a napokban jelent meg a festmények létrehozásának híre mesterséges intelligencia alapján, és várhatók az okos háztartások és okos televíziók emberi szóval vezérelt alkalmazásai, amelyek átalakíthatják korábbi életmódunkat, munkaköreinket, szórakozásunkat.

Az előző ötven év elméleti és programozási fejlődésének közvetlen beépítése a könyvtári szolgáltatásokba néhány éve még nagyon távoli lehetőségnek látszott. Bár az ügyfélfogadó robotok előre beépített szövegfordulatokkal képesek az ügyfeleket különböző nyelveken fogadni, beépítve a szleng és a humor fordulatait is, és egyre tökéletesebb formában utánozzák az emberi agy és gondolkodás működését, még nagyon sok fejleszteni való van a kívánt szint eléréséig.4 A könyvtári robot vonzó jelenség, kiválthat ismétlődő folyamatokat, sőt új részfolyamatokban is megjelenhet a gépi kérdés-válasz együttese, de mégsem ezt tartom fontos eredménynek szakmánkban, és főleg nem tartom fenyegetőnek a könyvtári munkakörökre nézve. Nem hiszem, hogy a jól programozható, ismétlődő feladatok vagy a kérdés-válasz jellegű ügyfélkapcsolatok átruházását a gépekre sajnálattal kellene fogadnunk. Gondoljunk csak a GYIK (gyakran ismétlődő kérdések) elektronikus változataira, amelytől csak egy nagy lépés az ügyfélfogadó robotok beillesztése. A folyamaton csak nyerhetünk, a kommunikációs helyzetek átgondolása a programozás előtt saját tevékenységünk minőségi fejlesztését szolgálja.

Miközben tömegesen özönlenek a veszélydiskurzusok5, a gépek fenyegetése áthatja a kulturális szféra jelenségeit, számos katasztrófafilmben is megjelenik a fiatal korosztály élénk érdeklődésével kísérve. Sokan utópiaként vagy valós fenyegetésként élik meg a gépek hatalomátvételének lehetőségét. Az online és virtuális térben folyó játékok, társasjátékok, videojátékok tematikájukban és megoldásaikban kivetítik az elmélet követőinek félelmeit – talán a Piroska és a farkas és más borzongató mesék transzformációjaként.  A félelmek feloldásának vágya magyarázatot adhat arra, hogy a gyártók olcsó sikerekre vadászó vad és véres filmjeleneteit miért éli át az ifjúság új típusú meseként akkora élvezettel, ráadásul minden más médiatípus használatának kárára. Látjuk, hogyan válnak az utópisztikus szereplők ikonokká és új jelképekké, egyben a szarkasztikus humor tárgyává az érettebb korosztálynál. A gyerekek változatos és virtuóz médiahasználatának jelensége elemzések és kutatások tárgya, felidézik azt a gondolatot, vajon az új technológia és a mesterséges intelligencia-eszközök létrehozása és majdani használata nem épp ezeket a készségeket és szemléletmódot igénylik majd? Minden elemzés, kritika és félelem jogos lehet, amely az egyoldalúságban látja a veszélyt, mert a mesterséges intelligencia létrehozásában nélkülözhetetlen a fejlett nyelvi intelligencia, a gondolatok mélységének és jelentésének felismerése, a logikai struktúrák létrehozásának elvont készsége. A nyelvi és gondolati intelligencia viszont nem képregény szintű közléseken nevelkedik, hanem komoly kognitív folyamatok előzményével. Lehet, hogy gyerekkorban túl korainak érezzük a használói és fejlesztői szemlélet vagy hozzáállás polarizációját, de egyben biztosak lehetünk, mindkettőnek fejlődnie kell.

„Fake news” – ismerethiány vagy rosszindulatú szándék?

A technológia lehetséges használóinak polarizációja és a kiszoruló rétegek hátrányai mellett számomra könyvtári szempontból a „fake news” (hamis hír)kérdése látszik fokozottan veszélyesnek, de ez a fenyegetés nem a számítógépektől ered. Rosszindulatú emberi beavatkozás következményeként születhetnek hibás információk és válaszok. Az ismerethiány bántóan széles körben hat a média és kommunikációs események színterein. A jelenség nyilvánvaló veszélyei mellett mégsem annyira súlyosak a következmények, mint a stratégia alapján tervezett szándékos megtévesztés esetében. A hibás vagy megtévesztő információk elhárításának módszereit ezért be kell építeni minden információközvetítéssel foglalkozó intézmény és szolgáltatás eszközrendszerébe, így a mesterséges intelligencia esetében is. A könyvtárakat az értékelt információk közvetítőjeként használjuk, ezért az önálló kereséseknél  jobb és biztonságosabb találati eredményeket várunk el tőlük. A szándékos megtévesztés jeleinek vagy a rosszindulatú szándék felismerésének és elhárításának módszereit a természetes emberi ellenőrzés lépései szerint alkalmazni kell, vagyis az intelligencia szimulálásának erre a területre is vonatkoznia kell. Ma már léteznek szándékosan hibás eredményeket adó megoldások, és a csalás felderítésére kialakított programok is. „Fel kell készülnünk arra a világra, amiben rutinosan keverednek a megbízható és hamis képek és videók” – intette az emberiséget Eric Goldman, a Santa Clara Egyetem Jogi Karának professzora.6

A gondolatsor befejezéseként idéznék Z. Karvalics Lászlótól egy mondatot: „Bármilyen szuperintelligenciát tételezünk is fel, az mindvégig csak az emberi értelem valamilyen (tehát nem minden) tartományban történő kiterjesztését szolgálja.” Robert Trappl megerősíti az állítást: „A mesterséges intelligenciának bizonyos dolgokat jobban kell csinálnia az embereknél, egy szuperintelligencia kialakítását viszont nagyon valószínűtlennek tartom.” 7

Fejlődési állomások és előzmények – szaktudományok, könyvtár, informatika

A szaktudományok fejlesztésében, használatában sok szakember vesz részt, ismereteiket, a működési sémákat tükrözni kell a mesterséges intelligencia programozásában ahhoz, hogy az ember legalább részben kiváltható legyen. Az ember és gép párosában soha nem egy emberről beszélünk, hanem szakértők tömegéről, akiknek előzetes munkája közvetlenül vagy közvetett módon a kapcsolat részévé válik. Mivel a gépek algoritmusok formájában képesek „elsajátítani” a szükséges ismereteket és műveleteket, az információs tárakat és a működési folyamatokat logikai struktúrákba kell rendezni az automatizálásnál. A szemantikus web fejlődése lényeges állomása a mesterséges intelligencia kialakulásának. Az adatok és információk jelentéstani és logikai feltárására kidolgozott módszerek és az információs hálóstruktúrák a teljes szövegű gépesített feldolgozás és szövegelemzés fejlődésének irányába mutatnak. A mesterséges intelligencia kialakulásának kezdetei az agyi neuronok működésére vonatkozó ismeretekre épültek, amely a hálóstruktúrák és a tanulási folyamatok mesterséges modellezésében is megjelenik. Az indexelhető authority (korábban: besorolási) adatok az információs hálók csomópontjainak kapcsolódása révén mutatják a feltárás vagy megismerés útvonalát, hasonlóan az agyi neuronok közötti ingerek és impulzusok terjedéséhez. Az informatikai eszközöket használó feldolgozásban a hozzáférési pont az entitások ismérvei és azok hálózati kapcsolataiban értelmezhetők. Az azonosítás az entitások megnevezésének és kapcsolati hálójának alapján történik. Az információk új értelmezési módja szükségessé tette az entitások tulajdonságainak pontos megnevezését, ezért a nagy könyvtárak az új típusú leírásokhoz adatszótárakat is készítenek, amelyek segítenek a nyelvi eltérések kezelésében és a gépi szövegértelmezésben, ezáltal a mesterséges intelligencia szövegelemzési és értelmezési folyamatai, a természetes nyelvi folyamatok gépi szimulálásának előzményeként kezelhetők.

Az indexelhető kulcsszavak szerepe a tartalom jellemzésében jól ismert a könyvtárosok körében, nem véletlen, hogy az információs hálók a legfontosabb általános, értékeket is hordozó, indexelhető témacsoportok köré rendeződnek (mű, alkotó, hely, idő, intézmény, stb.). Mivel adatok nélkül nincs információkezelés, a szövegek gépi felismerése és értelmezése előtti fejlődési szakasznak nagyon fontos állomása a digitalizált, hálózati formában tárolt és terjedő jelentésalapú szemantikus adatkezelés.  A fejlődés a beszéd- és szövegfelismerő, öntanuló rendszerekig, a szövegek automatikus elemzéséig, a szövegek rejtett hálózatának feltárásáig (deep -learning, -web, stb.)8  terjed, amelyek  a korábbi módszerekkel nem feltárható rejtett információs rétegekre is kiterjesztik a keresést. Az emberi elme kiváltásának folyamata csak részleges lehet, mert amíg az emberek programozzák a gépeket, önmagában egy gép nem lehet intelligens. Kizárólag a rendszertervező, a programozó, a nyelvész, a kommunikátor adhat olyan értelmezést és automatizmust a gépi folyamatoknak vagy a rendszerek együttesének, amely az emberek adott csoportjának kellően intelligens, értelmezhető, használható szolgáltatásokat nyújt. A mérnöki tudományok alapján tervezett és felállított rendszerek abban az értelemben nevezhetők intelligensnek, hogy működési folyamataik milyen szinten tükrözik az emberi alkotó gondolkodás tudásalapú jellegét, bonyolult és logikus rendjét. Az adott időpontban jellemző emberi intelligencia és a tükrözésére képes technológia meghatározza egymást: egy szint alatt vagy felett másként épül fel a rendszer alkotóik aktuális tudás- és intelligencia szintjének megfelelően. Egyes adottságainkat meghaladhatják a gépek (gyorsaság, pontosság, áttekintő képesség), de még a gépi tároló kapacitás növelése is csak az ember által lehetséges, annak ellenére, hogy a memóriatárak a gyorsaság és egyéb technológiák tekintetében túlléphetnek az emberi adottságok határain. Az ember minden technológiaváltás során újraértékeli az előzményeket, és gondolati műveletek alapján átrendezi az ismereteit, újraépíti a rendszert. A gépi működés céljára felállított mérnöki architektúra „építményei”, a  következtetésekre, analízisre beépített programok és eszközrendszerek túlmutatnak az egyéni képességeken, hiszen alkotóik csoportjának tudását tükrözik. Nem eldöntött kérdés, hogy lehet-e az elemzést követő gépi tranzakció vagy következtetés annyira újszerű, hogy a következő lépésben a gépi folyamat már meghaladja az emberi intelligencia határait.

A robottechnológia fejlődése látványos és nem vitatható módon a mesterséges intelligencia fejlesztésének kézenfekvő eredménye. Az emberhez hasonló kivitelezés formája mellett az ember kommunikációs képességének nyelvi, pszichológiai és szociális kapcsolatteremtési készségét tükrözi. Számomra könyvtári szempontból mégsem a robotok fejlődése a leginkább érdekfeszítő, hanem az az út, amely az első, emberi tevékenységet kiváltó számítógépes rendszertől egyenes vonalúan és természetes módon vezetett az emberi intelligencia gyakorlati számítógépes szimulációjáig. Az összetett könyvtári intelligens rendszerek, a különböző „smart” fejlődési irányok jelentős állomások voltak, köztük új típusú innovációt hozott az RFID könyvtári alkalmazása. Az egymással jelek alapján kommunikáló szenzorok, az RFID eszközök és a könyvtári rendszerek üzenetváltásának lehetősége az emberi tevékenység kiváltásával automatizáltak bizonyos folyamatokat (ellenőrzés, kölcsönzés, visszavétel, biztonság), a fejlettebb alkalmazásoknál egyszerűbb következtetések képességével műveletek generálására is alkalmassá váltak.

A szemantikus web más technológia alapján fejlődött. 2001-ben még utópiaként kezeltük Tim Berners-Lee nézeteit az open linked data (összekapcsolt nyílt állományok) fejlődéséről, de későbbi, gyakorlati tanácsokat is tartalmazó tanulmányait követően9 meglódult a kutatás és a szakmai felkészülés. A nagy könyvtári konzorciumok megkezdték az open linked data technológia alapján az adat- és információs hálózatok építését. Az adatok azonosítására alapozott új típusú leírási szabványok fejlesztése és a szemantikai alapú keresés megalapozása a megújult webtechnológia könyvtári importjával és az FRBR leírási séma befogadásával kezdődött, amelynek során nem a rekord, hanem az adat vált a leírás alapegységévé. A leírás tárgya nem a fizikai dokumentum, hanem az „elvont” mű(alkotás) lett, amely szellemi termékként magához vonzza a sokféle manifesztum lehetőségét a kapcsolatok feltárásával. A MARC rekordok börtönéből kiszabadult indexelhető adatok alapján a szemantikus web eszközrendszerével megindult a hálózaton lévő adatok géppel értelmezhető leírásainak, értelmezésének, keresésének gyakorlata, amely meghaladta a korábbi, strukturált adatbázisokra szűkített keresés lehetőségét.

Könyvtári szempontból az adatok és információk kapcsolatainak feltárása mellett folyamatosan aktuális maradt a szöveges és képi információk mélyebb, rejtett rétegeinek keresése. A megoldások kezdeti eredményei nem győzték meg a könyvtárosokat. A keresésben a teljesség és pontosság követelménye nem járt az elvárt eredménnyel az asszociációs kapcsolatokra, a korábbi szakértői keresések mintájára a közös és federatív keresésre alkalmazott innovatív kereső megoldásokban sem. A discovery szolgáltatási platformok kereső szolgáltatásai még nem terjedtek el kellő mértékben, amelyeknél a megtervezett forrásgyűjtemény együtteséhez egységes és közös kereső megoldások illesztésére került sor a milliós nagyságrendű források kutatására – meglehetősen magas áron.10 A szemantikus keresők minőségének folyamatos fejlődése (Hakia, Google Scholar, TextWise, Bing, stb.) mellett is minden könyvtáros álma egy olyan mesterséges intelligencia-eszköz, amely a szövegek és képek intelligens keresését kétségtelen eredményességgel végzi el anélkül, hogy a tartalmat előzetesen valamilyen módon formalizálni kellene, és a megoldások ára alkalmas szintű közszolgáltatások nyújtásához.

Az internet of things (IoT) (tárgyak internete) fejlődési irány az RFID technológia továbbfejlesztésével új távlatokat nyitott. A könyvtárakban jelenleg fejlődő szemantikus és digitális adatáramlás nemcsak a rokon intézmények között válik szabaddá (könyvtárak, múzeumok, levéltárak) az interneten, hanem a teljes tudományos, gazdasági és irányítási környezetben, amellyel a fenntartható fejlődés eredményei jobban érvényesülhetnek.  A „smart” és „hálózati” rendszerek eszköz- és eljárás készlete kiterjed a városokra, tárgyakra, közlekedésre, orvosi és mérnöki tudományokra, pénzügyi irányításra. A való világ dolgai és tárgyai az internethez kapcsolódva adatokat küldenek és fogadnak, távolról vezérelhetővé válnak. Az automatikusan indítható tranzakciók mellett a monitorozás, elemzés és értékelés eszközkészlete is bővül.  A kapott eredmények alapján az emberi beavatkozást kiváltó műveletek aktiválására is alkalmas elemző és következtető programokat illesztettek be a fejlesztők. A „smart” (vagy intelligens) automatizált irányítási és vizsgálati rendszerek számos iparágban váltják ki az emberi beavatkozás lépéseit, a vizsgálatok vagy következtetések végrehajtását, és azok alapján módosítási és cselekvési  utasítások kiadását generálják11 . A számítástechnikán alapuló automatizálás, az emberi műveleteket helyettesítő elemzések és értékelések az ún. üzleti intelligencia módszereiben jelentkeztek korábban komoly és drága elemzési eszközrendszerek beépítésének hátterével (OLAP, OLTP)12. Az adatokat hatalmas adatbázisokból matematikai módszerekkel nyerik ki az adattudósok és adatmérnökök. Az „adatbányászatnak” nevezett szakértői keresés egyes elemeit a könyvtárak is alkalmazták az információ „mély” rétegeinek kinyerésére, de költségei, jellege és az adatkinyerés mérnöki szintű eljárásai (költségei) miatt nem vált általánosan alkalmazható közszolgáltatássá.

A régi módon már nem jutunk el a kívánt eredményekhez, és a könyvtáron kívül fejlesztett szolgáltatások technológiáját kénytelenek vagyunk valahogy bevonni a könyvtári eszköztárba a használók megtartása érdekében. Számomra rendkívül izgalmas összefüggések jöttek létre az előzőekben jelzett „web of data”, a „smart rendszerek”, az open linked data, az internet of things és a szemantikus web, valamint a hálózattudomány fejlődési irányok elméletében és gyakorlatában. A mesterséges intelligencia szerintem ezekkel a fejlődésekkel összhangban, és ezekre épülve válhat jelentőssé a következő években a könyvtárak számára, amelyet jelez a mesterséges intelligencia könyvtári vonatkozású szakcikkeinek szaporodása a gyakorlatban való felhasználás kutatásával, a korábbi elméleti alapok transzformálásával.

A mesterséges intelligencia értelmezésének alapjai – rövid szemle

A mesterséges intelligencia értelmezésére hosszadalmas és bonyolult, másrészt nagyon egyszerű megfogalmazások is születtek, amelyek tükrözik a felfogásbeli és vonatkozási területek különbségeit. A Wikipédia meghatározása szerint tárgya egy gépi program vagy mesterségesen létrehozott  tudat által megnyilvánuló intelligens módszer, reakció, cselekvés, amelyet számítógépes programok keretébe helyeznek, és megfelel a következő három kritérium valamelyikének:

  1. Képes interaktív automatikus válaszokra emberi beavatkozás nélkül.
  2. Szimulálja egy természetes intelligenciával rendelkező élőlény viselkedését.
  3. Célszerűen és megismételhető módon változtatja viselkedését a gépi tanulás és adaptáció képességének hátterével.

Értékmérő, hogy az embert részben kiváltó, önállóan következtető, elemző, sőt cselekvő (programozott) gépek milyen szinten tudják szimulálni az emberi tevékenységet vagy probléma megoldást.  Mondanivalómhoz azok a nézetek állnak közel, amelyek szerint nem várható az emberi elme és cselekvés teljes kiváltása a programozással.

Írásom hátteréül a BME13 Mesterséges Intelligencia Elektronikus Almanach összeállítás, azok között Stuart Russell és Peter Norvig többször átdolgozott elektronikus formában közölt könyve,14 az ELTE, a Miskolci és a Debreceni Egyetem mesterséges intelligencia kurzusainak tananyagai, az ottani tanárok tanulmányai15, valamint Z. Karvalics László már említett átfogó tanulmánya a mesterséges intelligenciáról szolgáltak a fejlődési irány teljes struktúrájának és módszereinek áttekintésével.  A könyvtári szakterületen szeretném kiemelni Tóth Máté16 tanulmányát, amelyben a könyvtári technológia és felhasználás nézőpontjából tekintette át a mesterséges intelligencia fejlődését. A jelentős mennyiségű szakirodalom teljes áttekintése meghaladná írásom lehetőségeit, az említetteken kívül az utóbb három év szakirodalmát próbáltam követni. A legújabb információk – szokás szerint – a konferencia-előadásokban és folyóiratcikkekben jelennek meg.

A BME Villamosmérnöki és Informatikai Kar közlésében megjelentetett Mesterséges Intelligencia Elektronikus Almanach  összefoglalást ad a fontosabb érintett tudományterületekről és előzményeikről a kialakulás elméleti bizonyítékaival. A fejlődés az utolsó néhány évben lendületesen felívelt a tudományos módszerek kísérleteiben és a megközelítések összehasonlításában, nyilván a digitális kultúrának köszönhető nyíltabb hozzáférésnek köszönhetően is.  Az intelligencia természetének  jobb megértése együtt járt a valós rendszerek képességeinek javulásával. Az említett források gazdag irodalomjegyzéke tükrözi az elmélet fejlődésének állomásait.

Az Almanachban Stuart Russell és Peter Norvig könyve teljes áttekintést ad történeti és elméleti szempontból egyaránt, kitérve az egyéb szaktudományok vonatkozó eredményeire az ókortól napjainkig (filozófia, logika, pszichológia, számítógéptudomány, stb.). A szerzők elsősorban két dimenzióban tartják értelmezhetőnek a mesterséges intelligenciát: egyrészt a gondolati folyamatok és következtetések, másrészt a racionális és célszerű cselekvés szimulálásában. Vonatkozási területe  az alapvető emberi megismerési folyamatoktól az intellektuális képességeket igénylő feladatok rendszerezésének és automatizálásának teljességét magában foglalja. A számítógépeket az alábbi képességekkel kell felruházni a mesterséges intelligencia programozása során – amely más szerzők összefoglalásában is megjelenik szűkebb vagy bővebb felsorolásban:

  • természetes nyelvfeldolgozás (natural language processing);
  • tudásreprezentáció (knowledge representation) az ismert vagy hallott információ tárolására;
  • automatizált következtetés (automated reason­ing), hogy a tárolt információt kérdések megválaszolására és új következtetések levonására használjuk;
  • gépi tanulás (machine learning) az új körülményekhez való adaptálódás a minták felismerése és általánosítása érdekében;
  • gépi látás (computer vision) az objektumok érzékeléséhez;
  • és robotikára (robotics) az objektumok mozgatásához.

A mesterséges intelligencia történetéből csak néhány mozzanatot emelek ki a könyvből. Az 1940-es évek elejétől kezdődő folyamat a neuronhálók megismerésre vonatkoztatott példáját és a Turing-teszt elméletének megszületését (1950) követően indult gyorsabb fejlődésnek. 1956-ban új értelmezést kapott McCarthy szervező munkája nyomán, aki a Darmouth College-ban megteremtette a kérdés művelőinek szakértői csoportját, meggyőzte Marvin Minskyt, Claude Shannont és Nathaniel Rochestert, hogy segítsenek az automataelméletben, a neurális hálókban és az intelligencia kutatásában érdekelt kutatókat bevonni. A szakértői csoportok a McCarthy által alkotott mesterséges intelligencia (artificial intelligence) elnevezést fogadták el. A következő húsz évben egyetemi körökben és néhány tőkeerős informatikai vállalkozás keretében17 fejlődött az elméleti és gyakorlati kutatás, majd az utóbbi néhány évben kiterjedt a tőkeerős globális szolgáltatók innovációjára is (Google, Facebook, Youtube, stb.), amelynek eredményei megmutatkoznak a keresésekben és ajánlásokban is. Hazánkban a felsőoktatáson kívül a SZTAKI foglalkozott komolyabban a kérdéssel, kiemelten a kognitív irányzatokkal.18 Napjainkban minden jelentősebb vállalkozás innovációjában szerepel a fejlesztés, a látható eredmények a konferenciák előadásaiban jelennek meg. Könyvtári szempontból jelentős esemény a MIBE (Magyar Információbrókerek Egyesülete) 2018. évi konferenciája, amely a hazai megvalósult mesterséges intelligencia termékek és elméletek mellett könyvtári vonatkozásokra is kitért19.

A mesterséges intelligencia kutatások változásának legjobb tükrözése szerintem McAllister összefoglalásában jelenik meg:  Fel kell ismerni, hogy a gépi tanulást nem szabad elszigetelni az információelmélettől, a bizonytalanság melletti következtetést […]  a sztochasztikus modellezéstől,  a keresést a klasszikus optimalizálástól és szabályozástól, és az automatikus következtetést nem szabad elszigetelni a formális módszerektől és a statikus elemzéstől.20

Napjainkban fontos szempont a kutatások bizonyíthatósága (a sok utópia és „veszélydiskurzus” miatt is), amelyeket az interneten és a megosztott tesztadattárakban reprodukálhatóan és matematikai szabályokkal igazolnak. A nagy kapacitású felhőtárolókban egyes tudományok matematikai eredményei és a kódolás eszköztára használható mintákkal hozzáférhető több tudomány számára. A neuronhálók modellje az információtudományban a szemantikus web fejlődése során ismét aktuálissá vált, a hálók csomópontjai és élei közötti kapcsolat az információk terjedése és keresése mellett a gépi tanulás technikáiban is adaptálható. Már folynak kísérletek annak vizsgálatára is, hogy azonos kulcsszavak esetében a létrejött információs hálók mennyiben fedik le egymást. Az ember alkotta feltárásban nyilvánvaló az eltérés oka, a gépi rendszereknél azonban a különbözőséget indokolni kell.

A világhálós alkalmazásokban az MI-rendszerek mindennaposak lettek, az e-mail levelekben a szókezdetekhez megjelennek a választékajánlatok korábban tárolt mintaszövegek alapján, a keresések során korábbi keresésünkhöz hasonló ajánlott forrásokat kapunk, működnek az online fordító szolgáltatások. Látható, hogy az MI-technológiák az internetes keresőgépek, ajánló rendszerek és a weboldalszerkesztő rendszerek részévé váltak, elterjedésük rohamosan növekszik, a mögöttes részleteket azonban egyre kevésbé tekinthetjük nyilvánosnak. A GDPR21 védelem megjelenése indokolt, működnek plágium ellenőrző rendszerek is, de a hamis hírek felismerésére szolgáló rendszereket nem teszik nyilvánossá.

Russel és Norvig említett könyvében foglalkozik a világról alkotott tudás reprezentálásával is, amely a következtető és döntéselőkészítő folyamatokhoz szükséges ismereteket tárolja. Kitérnek a bizonytalan tudás és következtetés lehetőségére, a tanuláshoz szükséges tudás megszerzésének folyamatára is. A könyv hetedik részében a kommunikáció, észlelés és cselekvés módszereit tárják fel a szerzők az intelligens ágensek környezetéből (látás, tapintás, hallás, nyelvmegértés, stb.). A befejező, nyolcadik részben (Konklúziók) a technológia múltját és jövőjét, valamint várható filozófiai és etikai következményeket mutatják be.

A mesterséges intelligencia értelmezésének változatai

Az intelligens rendszerek és a mesterséges intelligencia közötti határt nehéz meghúzni, egymásba érnek az alkalmazott módszerek. A sokféle értelmezést tükrözi néhány rövid és jellemző megfogalmazás:

  • a számítógépek képessé válnak információk alapján döntéshozásra programozás alapján;
  • a mesterséges intelligencia az emberi intelligencia működését szimulálja a rendszerekben;
  • szövegkomponensek megértése szemantikai alapokon kombinált gépi technológiákkal;
  • a mesterséges intelligencia a korábbi manuális elemző és szakértői rendszerek programozása nyomán természetes nyelvi keresésre és válaszalkotásra képes;
  • a mesterséges intelligencia  az intelligens entitások megértése mellett ilyen entitások építésével is próbálkozik;
  • a mesterséges intelligencia sikeréhez két dolog szükséges: intelligencia és valamilyen mesterségesen létrehozott termék, „műtermék”. A választott műtermék a számítógép lett;
  • az intelligens alkalmazások gépi tanulás alapján képesek az emberrel és más rendszerekkel kommunikálni;
  • tudományos és mérnöki módszerekkel létrehozott intelligens gépek intelligens számítógépes programok alapján;22
  • a mesterséges intelligencia az a tudományterület, amely matematikai módszerekre alapozva keresi az intelligens viselkedés lényegét és fejlődését. Műszaki szempontból a mesterséges intelligencia fejlesztés alapja a jól meghatározott és átfogó tudásbázis, valamint  a megfelelő hatékonyságú, sokrétű és gyakorlatias manipulációs stratégia;23
  • a „gondolatok és az intelligens viselkedés alapjainak mechanizmusai és gépi szimulálásuk tudományos megértése” és még sok más megfogalmazást említhetnénk.24

Összefoglalva: intelligens szoftverrel szimulálják az emberi intelligencia néhány vagy több komponensét, amely bonyolult feladatok számítógépes megoldását kívánja, és az embertől is kellő szakértelmet, kreativitást és intuíciót kíván.

A mesterséges intelligencia általános komponensei a részletesebb kifejtésekben

Z. Karvalics László mindenre kiterjedő, már idézett tanulmányában részletesen szól az MI különböző irányzatairól és  elméleteiről, mint például  az „intelligenciarobbanás” (explosion artificial intelligence), amely nézet a 21. század közepe tájára jósolja az embereknél okosabb gépek uralmát. Többek között értékeli a Friendly AI (barátságos MI) és az Artificial Superintelligence – ASI irányzatokat, amelyek átveszik az innováció szellemi irányítását és megoldják azokat a dolgokat, amelyekre az emberek nem képesek. A szerző áttekintve az intézmények és kutatók munkásságát és elméleteiket, a „szuper” irányzatok helyett a kevésbé megjósolhatatlan eredménnyel járó fejlesztések és elméletek tanulmányozását javasolja, amellyel mélyen egyet lehet érteni.

A következő meghatározások azt mutatják, hogy a memória, a tárolt tudás áttekintési gyorsasága vagy a műveleti sebesség meghaladhatja az emberét, de a tudatos alkalmazásról nem beszélhetünk, és a gép nem képes az emberhez hasonlóan korábbi ismeretei önálló átrendezésére vagy meghaladására az új ismeretek alapján. Véleményem szerint ezért a tudásreprezentációk folyamatos frissítésre szorulnak.

  • Az intelligens gondolkodás számítógépes reprodukálásának szempontjából hasznos elveket, módszereket és technikákat kutatja, fejleszti, rendszerezi, 25
  • a háttérben a megoldást biztosító szoftverek intelligens módon működnek, mintha ember végezné a műveleteket (a Turing-teszt lényege, hogy ez a kritérium mennyire érvényesül), és öntanuló módon fejlesztik tranzakcióikat,
  • megoldási módszereire az átgondolt tudásreprezentáció és heurisztikával megerősített algoritmusok használata jellemző.
  • Programozott manipulációs eljárások együttese, folyamatszabályozás az emberi probléma megoldási folyamat utánzására, következtetés, jóslás és analízis műveletekkel.
  • A mesterséges intelligencia digitális technológiai eszközkészlet, amely szimulálja az emberi intelligencia működését, képessé teszi az eszközöket magas szintű és komplex kérdések önálló megoldására gépi programozás alapján. Részei:
  • tudásreprezentáció (leírás, adatbázisok) – amelyek kifejezik és leírják az intelligens viselkedést;
  • programozott manipulációs eljárások és folyamatszabályozás az ember probléma megoldási folyamatának utánzása, következtetési rendszer.

Könyvtári oldalról számomra a mesterséges intelligencia értelmezésében azoknak a kutatóknak a megállapításai fontosak, amelyekben a hangsúlyt a humán intelligencia feljavítására (intelligencia augmentation, IA) és nem a helyettesítésére helyezik, és ehhez a tudástárak gyors és élményszerű megértésének számítógépes elősegítését javasolják támogatni. Szerintük az emberi bölcsesség és tudás fejlesztése és kapacitásának növelése a fejlődés kulcsa, amely a tudós és tudásközösségek együttes szellemi teljesítménye alapján értelmezhető az egyre fejlettebb gépi alkalmazások támogatásával.

A szélesebb értelmezésekben nagyon sok könyvtári lehetőség rejlik. A magyar kutatók által indított interdiszciplináris útkeresés szerint is a mérnöki alkalmazásokat kell a kognitív tudományhoz és folyamatokhoz illeszteni a felhalmozott tudással összehangolva. A könyvtárak a felhalmozott tudás közzétételében és elérhetőségében kiemelt szereppel rendelkeznek, amelynek során elsősorban a rutin feladatokra szándékoznak gépi erőt igénybe venni, a célokat továbbra is az emberek jelölik ki az ismert feltételek hátterével.

A könyvtári bevezetés oldaláról figyelemre méltó a mesterséges intelligencia kutatása a gépi tanulás, a beszédfelismerés, a statisztika, az irányításelmélet, a nyelvészet, a neurológia, a gépi fordítás, a képalkotó, a kérdező-válaszadó-elemző rendszerek fejlődésében. Nyilvánvalóan a legfontosabb kérdés az, hogyan lehet az elméleti kutatásokat és a számítástechnika eredményeit, a már működő alkalmazásokat a könyvtári gyakorlatban alkalmazni minden szükséges tudományterület esetében?

A gépeket felkészítjük tanulásra (adaptív rendszerek), beszédfelismerésre, jelfelismerésre, és döntések létrehozására. Az eredmény során kérdéseket tehetünk fel és válaszokat is kapunk, amelyek gyorsabb reakcióidőt mutathatnak az emberénél. A gépek memóriájában az általunk áttekinthető könyvek mennyiségénél jóval több is lehet, hivatkoznék a Talks to Books és a Semantic Scholar mesterséges intelligencia alkalmazásokra26, de bármely nem programozott váltásra vagy tudatosan új értelmezésre jelenleg nem képesek, a válaszok csak a tárolt tudás és annak hálózata alapján lehetséges.

1. ábra
A Google Books könyveinek feldolgozása alapján automatikusan kapunk válaszokat szabadszöveges kérdéseinkre
(26. forrás)

A jelentős technológia birtokosai saját mesterséges intelligenciával (Google, Facebook, Microsoft, IBM, stb.) rendelkeznek és az informatika egyéb vállalkozásai is foglalkoznak a fejlesztés kérdéseivel, de a legnagyobb titok tárgyát képezik azok az algoritmusok, amelyek képessé teszik az eszközöket a gépi tanulásra a mesterséges intelligencia fejlődő rendszereinek kulcskérdéseként.

A Google kereséseinkből biztosan látható a 2012-es szemantikai fejlesztésük hatása, ma sokkal jobb találati eredményeket kapunk mint korábban. Az öntanulás és adaptáció érdekében az eszközöket a bevezető tesztelésnél szakértők kijelölt csoportjaira bízzák, keresési és használati módszereiket adaptálják a rendszerekbe. Már az Autonomy keresőjénél is ezt tanácsolták a fejlesztők jó 15 évvel ezelőtt, és a T-Systems Advise27 keresője is ezen az elven működik. A gép „megtanulja” az okos keresők lépéseit és a későbbiek során alkalmazza. Mivel a működési folyamat nagyon bonyolult, a szakértők csoportja együttesen képes „érteni” egy teljes rendszer és összetevői működését. A könyvtárak, amelyek ezeket a technológiákat használják, nagy szerepet játszhatnak az open source szolgáltatások működési folyamatainak kontrolállásában. Egy robotnak a feltett kérdésre adott válaszaiban nem tudjuk ellenőrizni, milyen „tudás-háttér”, módszer vagy szelekció alkalmazására került sor? Technológiai szempontból nem lehetetlen forrásjegyzéket kérni, a „kérdésedre az alábbi forrásokat futottam át” választípus azonban kíváncsiságunkat csak mechanikus módon elégíti ki. Abban viszont biztosnak kell lennünk, hogy semmilyen körülmény (pl. üzleti, politikai, ideológiai, stb.) nem gátolta a fontos források bevonását. A mesterséges intelligencia-alkalmazás akkor is működhet a háttérben, ha nem tudunk róla. Az alkalmazások egyre jobban megértik kérdéseinket, ezért a „nagy testvér figyel bennünket” nyomasztó érzése is felbukkan a kérdéseinkhez társított különböző ajánlatok mentén, miközben talán visszavágyakozunk régi könyvtári magányunkra. Természetesen merül fel a kérdés, mi áll a háttérben?

A gépi tanulás kérdése

A gépi tanulás vagy adaptálás képessége nélkül kevéssé beszélhetünk mesterséges intelligenciáról, hiszen a legegyszerűbb élőlényre is jellemző a számára (legalább az életben maradáshoz) szükséges tudás megléte vagy megszerzési képessége.  A gépi tanulás, a természetes nyelvi folyamatok28, a fejlődési stratégiák, víziók kutatása nem lezárt folyamat. Sokan kételkednek abban, hogy a gépek megtanulhatják a természetes nyelvi folyamatok intelligens (vagy tudatos) alkalmazását, jelenleg megelégednénk ennél kevesebbel is. Egyelőre hatalmas repozitóriumokban tárolják a szöveges tudásreprezentációkat és szakértői rendszereket29 a gépi igénybevételhez, nem véletlen, hogy a tőkeerős informatikai, könyvkiadó stb. vállalkozások mutatnak kiemelkedő eredményeket (Microsoft, Google, IBM, Facebook, Youtube, Elsevier stb.). A gépi programok fejlettségét műveltségi és egyéb ember-gép játékok során tesztelik, a látványos eredményekből sokan azt szűrik le, hogy a gépek lassan meghaladják az emberi képességeket – holott annak csak egyes mutatóit képesek túlszárnyalni. Egyes kutatások szerint az emberi memória lehetséges terjedelmét nem haladják meg a jelenlegi gépi memória adottságai.

Vajon ha egy MI-rendszer sokkal több könyvet „olvas el” adott témában, mint amelyre mi képesek vagyunk, jobb és pontosabb választ tud-e adni, mint az ember, a tanár vagy a könyvtáros, aki egyébként műveltnek tekinthető az adott témakörben? A sokszínű valóság teljes gépi tükrözését valószínűtlennek tartjuk. Hogyan győződünk meg a válaszok pontosságáról, valódiságáról? Ugyanarra a témakörre különböző rendszerek nem ugyanazt a választ fogják adni, hiszen a háttérben álló tudástár és a szelekciós, értékelő módszer valószínűleg nem azonos. A rendszernek meggyőzőnek lennie, hogy a lehetőségek közül a helyes választ kaptuk minden befolyásoló szempont nélkül. Lehetséges ez?

A 2017-ben elindított Semantic Scholar mesterséges intelligencia fejlesztői különös gondot fordítottak arra, hogy az évente megjelenő közel kétmillió tudományos szakcikk gépi feldolgozásában hiteles eredményeket tudjanak felmutatni. A gépi automatikus „olvasás”, feldolgozás és kategorizálás mennyisége messze meghaladja akár egy intézmény összes szakértőjének összteljesítményét is. A hitelesség a felkészülésben és az előkészítésben rejlik az érdekelt szakértők tömeges bevonása alapján. A szolgáltatás részletes bemutatására e cikk következő részében fogok kitérni.

Mesterséges neurális hálózatok modellezése és a gépi tanulás

A biológiai kutatások nyomán létrejött természetes neurális hálózatok mintájára tervezett „mesterséges” neurális hálózatok modellezése a mai informatika sok területén megjelenik, így a gépi tanulás fejlesztésében is. Az adaptáció és a tanulás az élő szervezetekre jellemző képességek, viselkedésüket a környezetből nyert ismeretek, tapasztalatok felhasználásával módosítani, javítani tudják. A neurális hálózatok mintáit az agyi működés leképzése alapján használják a programozók a tanulás és adaptáció folyamatainak matematikai algoritmusok alapján történő formalizálással. A tanuláshoz szükséges meglévő minták alkalmazásai a digitális tudástárakban nagy számban állnak rendelkezésre a törvényszerűségek, hasonlóságok levonásához.

Feladatmegoldás gráfként való értelmezése: a keresés, vagy a gépi tanulás útkeresési problémaként is értelmezhető az információs gráfok alapján30, amelyben adott csúcsból egy másik csúcsba való eljutás jelenti egy-egy programozható (keresési, stb.) feladat megoldását, ha a csúcsból kivezető élek száma véges. Ebben az esetben  az adott csúcsból kiinduló utak halmaza jelenti a megoldandó probléma lehetséges válaszainak halmazát. A tudásreprezentációs tárakban mintákat lehet képezni a hasonló feladatok megoldására.

Az új típusú számítógépek nagy teljesítménye, a tanulási folyamat jobb megismerése és a formalizálás módszereinek szemantikus eszközei együttesen segítik megalkotni a gépi és mély tanulás lehetőségének feltételrendszerét. Ahhoz hasonlóan, ahogy a neuronok működnek az agyban, a mesterséges neurális hálózatokban is keletkeznek új impulzusok, és létrejöhetnek az ember által nem felügyelt tanulási útvonalak a végtelen számú adatkapcsolatok használatával.

A tanulás a hálózatban lévő csatlakozások adaptációja, amelynek forrása a mesterséges intelligencia tudásreprezentációja. (Neurális modellezés). A tanulási rendszer kereteként integrálható a mesterséges intelligenciába, vagy annak integráns részeként fejleszthető.31

Az új számítási algoritmusokkal a mesterséges neurális hálózatokat sok bemeneti csomóponttal és sok réteggel társítják, ezáltal megteremtik az információs hálók kapcsolatai mentén pásztázó számítógépek számára a rejtett rétegek feltárását „deep-learning” megoldásokban.32 Mivel a megértés és megismerés nem szorítkozhat egyes szavak vagy mondatok felismerésére és értelmezésére, minden információ a kapcsolatrendszerével együtt fejezheti ki a tárolt tudás tartalmát. A gépi tanulás esetében is bonyolult verbális és kommunikációs folyamatok beépítésére van szükség, az értelmezés nem egyedi mondatokra épül.

A gépi tanulás szempontjából tehát a szemantikus hálók lényeges fejlődési szakaszt jelentenek, mert „minden szemantikusnak mondott rendszer a jelentéssel mint speciális, gépi nyelven leírható, kódolhatóvá tett objektummal foglalkozik: érzékeny rá, de nem „érti”, nem teremti […], hanem a számára értelmezhető jellé lefordított formájában komputálja. Az intelligens rendszer nem egyszerűen létrehozza, módosítja, folyamatosan átalakuló alakzatokba szervezi a jelentéseket, hanem minden egyes észlelési ciklus kezdetén újrateremti, újra értelmezi azokat, és azonnal összekapcsolja a jövő valamilyen előre jelzett képéhez igazodó cselekvés tervezésével. Információja nem létezik önmagában, hanem egy időtengely mentén felépülő, csakis történetiségében értelmezhető, folyamatosan változó, komplex kognitív univerzum részeként. A gépnyelvre lefordított információ statikus, és a kognitív univerzum valamely szakaszának vagy elemének képesség- vagy kapacitás korlátját segít lebontani.” 33

A fenti megállapítások és kutatások alapján a könyvtári szakma érintettsége a felkészülésben magától értődik. Az elsajátítást és megértést támogató használati módszerekhez a rendelkezésre álló források feldolgozását, előkészítését, az adatok formalizálását, közzétételét a könyvtárosok hivatásszerűen végzik. A jövőben várható az adattudósok és könyvtári adatspecialisták együttműködése, a könyvtárosok tudják, milyen típusú adatokat kell kezelni, mire lehet őket használni, hogyan lehet keresni, az adatmérnökök pedig azt tudják, mit és hogyan lehet velük tenni egy adott célfüggvény szerint kialakított rendszerben és miért úgy.

A géppel értelmezhető könyvtári adatoktól a mesterséges intelligenciáig ívelő fejlődés összefüggései

Minden előzetes hagyományos és modern könyvtári eljárás a számbavétel, az elérhetőség és a teljesség kérdése körül forog, amelyeket a digitalizálás korában a rohamosan növekvő információmennyiség miatt egyre inkább lehetetlen plusz (gépi) erőforrás hozzáadása nélkül biztosítani. Könyvtári szempontból a mesterséges intelligencia fejlődésében értékmérő, hogy intelligens számítógépes programozással hogyan lehet kibővíteni a könyvtárak áttekintő, értékelő és szolgáltatási tevékenységét, milyen módszerekkel alapozhatjuk a fejlődést a korábbi eredményekre, mennyiben kell átalakítani folyamatainkat és tevékenységünket az emberi intelligencia működésének leképezésével, milyen új szolgáltatásokat biztosíthatunk a segítségével? Talán vannak, akik félnek munkakörük elvesztésétől, de be kell látni, hogy az információmennyiség kezelésére a jelenlegi eszközeink kevésnek bizonyulnak. A rendelkezésre álló globális forráskínálat kihasználásához ugrásszerű fejlődés szükséges a könyvtárakban is, amely a könyvtári adaptáció folyamatát megkönnyíti és kibővíti. Állandó kérdés, hogy a meglévőkből mennyit tudunk költségvetésünkből és a rendelkezésre álló munkaerő alapján megszerezni, fenntartani, előfizetni vagy bérelni?

A könyvtári kapacitásbővítés szüksége egyértelmű, csökkenő munkaerő mellett a fejlődő számítógépes technológia alkalmazásával bővíthetjük áttekintő képességünk és szolgáltatásaink határait.  A folyamatos értékelés kulcskérdése, hogy adott információmennyiséggel milyen műveletek végrehajtási képességével rendelkezünk, vagy egy program (részben) emberi közreműködés nélkül mire képes?  Az egyre nagyobb tárolt információtömegből hogyan nyerhetünk mintákat az információforrások törvényszerűségeinek feltárására, és milyen módszerekkel építhetjük be ezeket a szolgáltatási eljárásokba? A fejlődés kétoldalú: az emberi intelligencia jobb megismerését szolgálják az egyre intelligensebb programok, viszont létrehozásuk és adaptációjuk is magasabb intellektuális tevékenységet és kreativitást igényel tőlünk.  A korábbi stációk alapján nehéz innovatív megoldásokat alkotni, nem meglepő, hogy az újabb fejlődések a nagy könyvtári konzorciumok környezetében sűrűsödnek kutatási eredmények adaptálásával, amelyeket kisebb országokban, kisebb cégekben lehetetlen elérni. A fejlődés koncentrálódása néhány nagy szolgáltató környezetében (Exlibris, EBSCO, OCLC, stb.) mintaszerű alkalmazásokat generál.  Az „újrakezdés” helyett érdemes a csatlakozásra felkészülni, amelynek során fejlettebb módszereket sajátíthatunk el a fejlesztői és könyvtárosi együttműködés mintáival. A szisztematikus építkezéssel elkerülhetők a kockázatok és a folyamatos újra tervezés, mindkettőre számos példa van.

A fejlődés másik oldala: saját eszköztárunk nemzeti, regionális vagy intézményi fejlesztése, innovációs lehetőségünk felismerése, amely lehet önálló kezdeményezés, vagy kapcsolódás és integráció egy fejlettebb rendszerrel, nagyobb könyvtári konzorciummal.  A rendszerek integrációja hátterében számos szabályozási, egységesítési feladat áll a rendszerek, az intézmények és a munkafolyamatok területén is. Az online információk, szabályzatok, ajánlások, leírási szabványok lehetőséget nyújtanak a felzárkózásra és szinten tartásra, a nemzetközi fejlődési vonal szintjének megfelelő eljárásokat behozhatjuk könyvtárainkba, használhatjuk, adaptálhatjuk a már elkészült (általában ingyenesen hozzáférhető) külső rendszereket (lásd a szabványos névtereket, elnevezési szótárakat, leírási szabványokat)34.  Távlatban kell átgondolnunk, hogy erőforrásaink korlátai mellett egy új rendszer létrehozásával (stratégiai fejlesztésével és fenntartásával) járunk-e jobban, vagy célszerűbb kész és referenciákkal rendelkező rendszereket bérbe venni vagy adaptálni.

Az általános mesterséges intelligencia rendszerek fejlesztését az alábbi területeken vélhetjük fontosnak könyvtári szempontból:

  • automatikus szövegfeldolgozás, -értelmezés, elemzés, felismerés és szövegalkotás, gépi fordítás, természetes nyelvi módszerek (NLP);
  • információforrások „mély” rétegeinek kutatása, keresése, értelmezése, öntanuló mechanizmusok beépítése;
  • szakértői tudásbázisokkal összefüggő automatizált folyamatok a könyvtári munka minden területén kezdve a katalogizálástól a szolgáltatásokig, az elsajátítást és alkalmazást támogató számítógépes képszerkesztő, animációs, augmented reality, és workflow eszközök beépítése a megértést, tudást, és elsajátítást támogató ellenőrző programokkal;
  • automatikus tranzakciók a korábbi manuálisan végzett folyamatokban, információk, vizsgálatok, eredmények, eszközök, megoldások automatikus értelmezésén alapuló elemzési és következtetési eszközök használata;
  • külső megoldások adaptációi saját feladatokra, stb.

A könyvtári automatizálás valamilyen szintje értelemszerű volt az előzményekben is, az újgenerációs, majd az intelligensnek nevezett rendszerek egyre magasabb szinten voltak képesek a monoton emberi tevékenységek kiváltására programozott automatikus megoldásokkal, rugalmas testre szabási módszerekkel. Az egyik legizgalmasabb kérdés az egyenes vonalú és logikus fejlődés a könyvtári informatika és gépesítés hőskorától napjainkig, a mesterséges intelligencia könyvtári alkalmazásáig.  Kezdetei visszavezetnek az első számítógépes programokhoz, mikor megkezdődött az emberi tevékenységek kiváltása, az adatok és információk gépi felismerése – a MARC rendszeren alapuló információ feltárástól az adatszintű feldolgozásokig. A MARC rekordok merev, lineáris szerkezete nem tudja kielégíteni a hálózati adatok kezeléséhez szokott használói igényeket. A szemantikus adathálók létesítése viszont csak akkor tekinthető bevált folyamatnak, ha a szolgáltatáshoz tömegesen rendelkezésre állnak az automatizált módszerek és kódolási folyamatok a szükséges ismeretekkel.

Ugrásszerű fejlődést hozott néhány körülmény „együttállása”: a neuronhálók kutatása, az agy működésének megismerése, (az agy mint az információtárolás és aktiválás biológiai információs hálója), az új webtechnológia megjelenése a könyvtárakban és hozzá a szemantikus adatsémák, a vonatkozó szabványok és adatszótárak eszközeivel.  Az adatszinten tárolt leírási egységek dinamikusabb információkezelést biztosítanak, az azonosított adatok önálló entitásként jelennek meg a weben és hálószerűen kapcsolódva új jelentéseket hordozhatnak. Az informatikai adathálózatok valamilyen elven vagy „rokonszinten” alapuló kapcsolódása (pl. asszociációs, időbeli, tematikai, alkotó szerinti, területi, stb.) azonos alapelveken nyugszik a mesterséges intelligencia tanulási képességének modellezésével.  Meggyőződésem, hogy a könyvtári informatika fejlődésében látható állomások egyike sem nélkülözhető a mesterséges intelligencia emberi működést szimuláló képességének kialakulásában, de a könyvtáron kívüli fejlődési irány és technológia jelentősen befolyásolja a könyvtári adat- és információkezelés módszereit.

A  szemantikai adatfeldolgozás mint a szövegértelmezés első lépcsője

A korai könyvtári informatika állomásait követően a linked data és a szemantikus web fejlődésnek stációit abból a szempontból érdemes érinteni, hogy milyen elemek járultak hozzá a mesterséges intelligencia programozásának fejlődéséhez, az információk géppel történő értelmezéséhez, kereséséhez, tranzakciók indításához, általában a tartalmak valamilyen géppel történő manipulációjához?

A weben látható adatok kapcsolatának létesítéséhez szükséges, a metaadatok értelmezésére használt RDF séma keretrendszerben az adatkapcsolatok egyszerű hármas szerkezetben (tripletek) történő rendszerezésével, dinamikus kapcsolatokkal, módosuló jelentéstartalmakkal jellemezhető az adott entitás jelenlegi állapota (fejlődik, stagnál, új elemekkel gazdagodik, változik, stb.). A szemantikus web könyvtári hálózati csomópontjai az adatokat mint entitásokat kezelik, az élek pedig az adatok közötti kapcsolatok létesítésével az adat tulajdonságait jelölik az automatikus gépi értelmezés (aratás, begyűjtés, szelekció, stb.) számára. A csomópontok közötti „haladással” a szöveges információk mély rétegeinek felismerésére modelleket lehet felállítani. Az adatmodellek jellemzőek adott intézményre, de elég általánosak ahhoz, hogy más, külső adatmodellek elemeivel kapcsolatok alakuljanak ki.

A megnevezések szabványosságának nem csak a keresés pontossága, a tartalom jobb jellemzése, és a gépi értelmezés megkönnyítése miatt van jelentősége. A mesterséges intelligencia fejlesztésében a gépi szövegfelismeréshez és tanuláshoz az egységes megnevezésekre támaszkodhatunk a programozás során, amelyek segítik az eligazodást a világháló teljes tartalmában, az összefoglaló információkban, alapot adnak a hipertext kapcsolatok felépítéséhez és azok könnyű megértéséhez. A Wikipédia szócikkek alatt láthatóvá váltak a „nagykönyvtárak” RDF és más szemantikus adatformátumai, az adatok előhívhatók innen is az URI-azonosítók alapján. A fejlesztésekről szóló tanulmányaikból látható, hogy milyen alapos, nemzetközi kapcsolatokra épülő – és több évig tartó –  előzetes szisztematikus tervezés és fejlesztés előzte meg az eredményt.35 Elgondolkodtató, hogy mennyire érdemes nekifogni intézményi keretben az újratervezéshez, vagy inkább az adaptációra és megtanulásra fordítsuk erőforrásainkat?

A nemzetközi névterekben a magyar vonatkozások már jelentős képviselettel rendelkeznek a külföldi könyvtárak állománya, és két éve az MTA KIK, a Szegedi Egyetem és a közeljövőben várható ELTE névadatok betáplálásának köszönhetően. Véleményem szerint önálló hazai rendszer fejlesztése mellett (helyett?) érdemes az elkészült globális névterekhez kapcsolódni.

A szemantikai adat- és információfeldolgozás alapgondolatához kapcsolódnak a mesterséges intelligencia értelmezései közül a „cselekvőhálózat-elmélet” (Actor-network Theory – ANT) tézisei az ember+gép kapcsolatának bővítésével és hálózati működés keretébe illesztésével. A rendszerben együttműködő (hibrid) elemek – emberek, technikai objektumok, jelentések (szemiotikai objektumok) hálózataként értelmezésével a csomópontjaik is hálózati természetűek. A működés bonyolult és finom eszközökkel árnyalt, mert „minden módosítás a cselekvő hálózat elemein és kapcsolatain kívül érinti az egyes elemek által egyszerűsített hálózatokat is.” 36

2. ábra
A BIBFRAME kutatásra alapozott linked data és hálózati adatfeldolgozás hatásai
(Eric Miller prezentációja, 35. forrás)

Érdekesen szemléltethetők ezek az összefüggések az OCLC VIAF Identity Network authority hálójával, ahol az egyes csomópontokra kattintva megjeleníthető a kijelölt névhez tartozó másik hálózat. A csomópont lehet névelem, esemény, intézmény, műalkotás, stb.

3-4. ábra
Az OCLC VIAF Identity network vizuális kapcsolati sémája Shakespeare nevéhez rendelve,
illetve a Hamlet címszereplő kiválasztásával módosítva37

„A szemantikus weben […] az információforrások olyan egységes ontológianyelven lesznek leírva, amely a lehető legközelebb áll az ember tudásreprezentációs és következtetési képességeihez – legalábbis az informatikai fejlettségünk jelenlegi szintje szerint. Azaz a konkrét adatok szintjén az informatikai rendszerek egyre több munkát végeznek ugyan el az ember helyett, ugyanakkor – ezzel egy időben – az ember tevékenységének jellege átalakul, [...]  munkája a metaadatok kezelésére kell, hogy fókuszáljon […] meg kell teremtenie és működtetnie kell azt a szemantikus (értelmezési) környezetet, amely nélkül egyre növekvő mértékű, hatékony gépi feldolgozás nem lenne lehetséges.38

A mesterséges intelligencia fejlődését generáló általános tendenciák

Foglaljuk össze tehát azt a néhány jelentős körülményt, amely a mesterséges intelligencia elméleti alapozását követően elősegítette az elmélet, a gyakorlat és a szolgáltatásokban eredményeinek jelentkezését:

  1. Hatalmas digitális adatmennyiség, digitális transzformáció, globális információ menedzsment.
  2. Számítógépes technológiai fejlődés nagy tároló kapacitással.
  3. Fejlődő informatika és számítógép tudomány.
  4. Szakértői szintek bővülése, emberi képességek és készségek fejlődése az 2. és 3. adottságok elsajátítása, alkalmazása és fejlesztése következtében.

Az 1. pontban jellemzett fejlődés világszintű a könyvtárakban is, amely az információt és a kapcsolatos könyvtári és archiváló tevékenységet globális jellegűvé tette. Az internetkapcsolattal rendelkező könyvtárak forrásgyűjteményeinek bősége csak a rendelkezésre álló kapacitásuk függvénye, bármely nyilvános könyvtár szolgáltatása közvetíthető, a nyilvános források rugalmasan illeszthetők saját gyűjteményeinkbe. Megszűnt a hagyományos fizikai gyűjtemény-centrikus szemlélet. A teljességet a tematikához vagy a könyvtár feladatához tartozó forrásnyilvántartással részben helyettesíthetjük és kiterjeszthetjük. A növekvő, gyakran milliós forrásgyűjteményekhez discovery szolgáltatásokkal biztosítják az egységesített, federatív platformokat akár több millió forrásból. Gyakorlatilag a forrásmennyiség meghaladja az áttekintés lehetőségét, amely arra készteti a fejlesztőket, hogy az emberi képesség kiterjesztését programozással segítsék.

A 2. pontban szándékosan nem intelligens gépeket említettem. Bár vannak ilyen típusú megjelölések, nyilvánvaló, és már említettük, hogy nem a gépek intelligensek, hanem azok az emberek által készített programok és rendszerek, amelyek szimulálják az emberi elme működését, és annak alapján tranzakciók generálására válnak képessé. Csak olyan „képességek” ültethetők be a gépek működésébe, amelyeket az emberi elme gondolati és ismereti szintjén rendelkezésre állnak és megfelelő algoritmusokkal jellemezhetők a gépi értelmezésre, ezért a mesterséges intelligencia korában még jobban érvényesül majd a tudományos és emberi fejlődés megjelenítése a rendszerekben.

A nagy tároló kapacitás több okból rendkívül fontos a tartalomszolgáltatásban, a szöveges információk tárolásában és közvetítésében. Az első és nyilvánvaló ok az exponenciálisan növekvő információ mennyisége, amelyet gyakran nehezít a rendszertelenül kiugró növekedés.  Jelenleg még nincs minden adatkapcsolat feltárva, és minden kapcsolat új kapcsolatok kiindulópontja lehet. A kapcsolódási dinamizmusnak a big data  jelenség az egyik tünete, amely kiugró adattömörülések kezelésére szolgáló (felhő) technológiát követel. A növekedés során a használati gyakoriságnak megfelelő tárolással tehermentesítik a használó oldali rendszereket clusterekkel és particionálással.39  A friss vagy gyakran használt adatokat gyors memória tárolókba helyezik elkülönítve az archivált és kevéssé használt anyagoktól.

3. A informatika fejlődése a számítógépes kapacitás és eszközkínálat növekedésével párhuzamosan és kölcsönösen ösztönző módon fejti ki hatását. Ha csak a könyvtári informatika területét nézzük, akkor is látható, hogy a könyvtári folyamatokban szinte lehetetlen lépést tartani a lehetőségekkel. Még csak kb. tíz éve kezdődött az open linked data és szemantikus web gyakorlati könyvtári alkalmazása világviszonylatban, és máris itt dörömböl a mesterséges intelligencia igénybevételének lehetősége, értelmezési és programozási problémákkal.  Még folyik a MARC leírási korszerűsítése adatbővítésekkel, de még nem tudjuk, hogy a linked data technológia  felválthatja-e teljesen a MARC leírásokat a tömeges használatban. A MARC lecserélése abban az esetben reális lehetőség, ha az adatok szemantikus konvertálása tömeges méretekben automatikusan zajlik, és a tesztelési eredmények meghozzák a teljesség és pontosság kívánt összhangját. Ezért figyeljük várakozással a potens és erős fejlesztési kapacitással rendelkező nemzetközi könyvtári konzorciumok eredményeit, a szükséges szellemi kapacitás, kutatási, elméleti háttér igényének tekintetében is.

4.  Az emberi intelligencia, készség és tudás fejlődése és fejlesztése a mesterséges intelligencia és a számítógép tudomány haladásának mentén erősen technológia orientált, de nagyon sok humán oldali fejlesztést kíván a határterületekben. Az oktatásban, nevelésben, képzésben, pszichológiai és szociológiai, nyelvi képzési területen kooperatív fejlesztésre és az eredmények folyamatos megosztására van szükség az adaptálható összetevőknél. Ha megvizsgáljuk a mostani generáció tájékozódási, információkeresési és művelődési szokásait, aggodalommal érzékeljük a klasszikus szépirodalom hanyagolását, a gyorsolvasást, a képi információkon alapuló, képregény-szerű áttekintési, felismerési és kommunikációs szokásokat. A világ kevésbé egyértelmű összefüggéseinek megismerési készségét is fejleszteni kellene ahhoz, hogy az igen/nem válaszoknál bonyolultabb összefüggések felismerésére is képesek maradjunk. A gépesítés nem jelentheti az emberi gondolkodás formalizált keretekbe történő szűkítését, a szükséges logikai keretrendszer egyeduralmát.

Az emberek és gépek együttműködésének számos vetülete van a könyvtári feladatok között. Ahhoz, hogy gépi programozásra kerüljön sor, a szakértőknek tisztázott problémákkal kell dolgozni, nem véletlen, hogy minden könyvtári fejlesztés előzményeként erős elméleti felkészüléssel kell számolni, amely biztosítja a probléma megértését. Az alkalmas válaszok tervezését és átültetését a számítógépeket vezérlő algoritmusokba úgy kell megtervezni a könyvtárakban, hogy a szolgáltatások színvonalának fejlesztése mellett a könyvtári szakmunka támogatásának jogos igénye is érvényesüljön.

*

A könyvtárak a digitális tartalmak létrehozásával, közzétételével és gondozásával hivatásszerűen támogatják a mesterséges intelligencia fejlesztésének elősegítését.

A könyvtári vonatkozások további kifejtését terjedelmi okokból írásom második részében, a folyóirat következő számában tervezem folytatni. Részletesebben a tudásreprezentációs alapú szakértői rendszerekre, a keresési folyamatokra, a megvalósult szolgáltatások áttekintésére és adaptációjára szeretnék kitérni, érintve a mesterséges intelligenciára vonatkozó előrejelzéseket és a kapcsolódó technológiák könyvtári felhasználásának lehetőségeit vagy példáit.

Jegyzetek

Az elektronikus hivatkozások utolsó megtekintése: 2018. augusztus 24.

Mesterséges intelligencia  (MI), angolul artificial intelligence (AI). Az elnevezés John McCarthytól ered, az AI egyes válfajaira még számos elnevezést használnak, pl. szuperintelligencia, augmented intelligence stb.

The Cohrain Library a bizonyítékokon alapuló orvoslás területén újszerű szolgáltatásokat alakított ki, amelynek fontos eleme a tények változásának rendszeres közlése (alert funkciók).

Z. KARVALICS László: Mesterséges intelligencia – a diskurzusok újratervezésének kora = Információs Társadalom, 2015. 4. sz. DOI: http://dx.doi.org/10.22503/inftars.XV.2015.4.1

Népszerű ügyfélfogadó robotok: kérdésekre válaszolnak, képesek információhiány közlésére, másik típusuk győztes játszmákra az emberrel. Ilyen robotok pl. Alexandra, Siri, Sophia, Wanda a T-Systemstől, Google asszisztens, IBM Watson, stb.

Stephen Hawking megjegyzését lásd Z. Karvalics i. m.

SZILÁGYI Szabolcs: Rossz hírünk van: soha többé nem hihet a szemének = Bitport, 2018. február 2.
https://bitport.hu/rossz-hirunk-van-soha-tobbe-nem-hihet-a-szemenek?=180201

Robert Trappl az Osztrák Mesterséges Intelligencia Kutatóintézet (OFAI) igazgatója.

Warren McCulloch és Walter Pitts 1943-ban megjelenő kutatásaikban kimutatták, hogy az összekapcsolt neuronok valamilyen hálózatával minden kiszámítható függvény előállítható, ill. egyszerű hálóstruktúrákkal az összes logikai művelet (ÉS, VAGY, NEM stb.) kifejezhető. A deep learning (mélytanulás) a neuronhálózatok modelljére alapozott tanulási modell. A deep web (mélyweb) az  internet rejtett, nem indexelt és nem strukturált tudásrétegét jelöli a kereséseknél. [Közli Russell és Norvig (ld. 14. jegyzet)].

Tim Berners-Lee 2001-es bevezető írását követően 2006-ban már gyakorlati példákat is adott az open linked data szemantikus feltárási módszer bevezetéséhez, és további munkássága is korábbi elméleteit igazolják. https://www.w3.org/People/Berners-Lee/Publications

A NISO (National Information Standards Organization) értékelése szerint az Exlibris és az OCLC discovery szolgáltatásai a legelterjedtebbek; kiemelték még az EBSCO EDS szolgáltatását is.

Internet of Things (IoT), a tárgyak internete. Lásd a „smart city” és egyéb intelligens irányzatok fejlődését, az automatikusan generált utasításokat a közlekedésben, a termelési folyamatokban, energiagazdálkodásban, a műveleti instrukciók utasításában stb. Bővebben: ANDERSON, Janna – RAINIE, Lee: The Internet of Things will thrive by 2025 = IOT Council Ecosystem, 2014. 14. 05. http://www.pewinternet.org/2014/05/14/internet-of-things/.

Üzleti intelligencia:  adattárházakban sorosan tárolt információk és elemző eszközök együttese üzleti adatok kinyerésére, előrejelzésekre, kockázatok matematikai eszközökkel segített kimutatására. OLAP  (Online Analitical Processing) és OLTP (Online Transactional Processing) eszközökkel és más alkalmazásokkal szabályozzák a gépi elemző és válaszadó folyamatokat. Egyes elemeik megjelennek a könyvtári elemzésekben is.

BME Villamosmérnöki és Informatikai Kar közreadásában: Mesterséges intelligencia almanach = http://mialmanach.mit.bme.hu/aima/index

RUSSELL, J. Stuart – NORVIG, Peter: Mesterséges intelligencia korszerű megközelítésben. Több kiadásban jelent meg. Lásd: http://mialmanach.mit.bme.hu/aima/index

Felsőoktatási oktatási anyagok összefoglalói

ELTE összefoglaló (tananyagról) gráf, MI, keresés, öntanulás, stb. témákhoz http://people.inf.elte.hu/gt/mi/mi.html;

ELTE IK Digitális Könyvtár, 2008. 300 dia http://www.inf.elte.hu/karunkrol/digitkonyv/Jegyzetek/mi.pdf;

GREGOROVICS, T.: Artificial intelligence. Elektronikus jegyzet. ELTE IK Digitális Könyvtár, 2015. http://www.inf.elte.hu/karunkrol/digitkonyv/Lapok/2014-esjegyzettámogatásipályázatotnyertoktatókésjegyzeteik.aspx;

DUDÁS László: Mesterséges intelligencia
http://ait.iit.uni-miskolc.hu/~dudas/MIEAok/MIea1.pdf [MI-irodalomjegyzék-szöveges forrásban]

DUDÁS  László: Alkalmazott Mesterséges Intelligencia = https://www.tankonyvtar.hu/hu/tartalom/tamop425/0046_alkalmazott_mesterseges_intelligencia/adatok.html;

ORMOS László: Mesterséges intelligenciák. Neurális hálózati struktúrájú mesterséges intelligenciák = https://slideplayer.hu/slide/2146557/;

TÓTH Máté: Tudásbázisok, szakértői rendszerek. = Könyvtári szolgáltatások menedzselése http://slideplayer.hu/slide/2060799/

Felsőoktatási fejlesztések

http://aima.cs.berkeley.edu/contents.html; https://www.csd.cs.cmu.edu/research-areas/artificial-intelligence;

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-034-artificial-intelligence-fall-2010/;

BAIR: Berkeley artificial intelligence researc: Stanford Artificial Intelligent Laboratory = http://ai.stanford.edu/; stb.

Könyvtári vonatkozások

COLEMAN, Catherine Nicole: Library AI initiative = https://library.stanford.edu/projects/artificial-intelligence;

JOHNSON, Ben: Libraries in the age of Artificial Intelligence (2018) = http://www.infotoday.com/cilmag/jan18/Johnson–Libraries-in-the-Age-of-Artificial-Intelligence.shtml;

HALL, Deme Wendy – PESENTI, Jerome: Growing the artificial intelligence industry in the UK =  https://www.gov.uk/government/publications/growing-the-artificial-intelligence-industry-in-the-uk

BARANYI Péter: kognitív infokommunikáció. A HT és TMIT ünnepi tudományos ülése fennállásuk 60. évfordulója alkalmából. http://www.tmit.bme.hu;
BARANYI Péter – NÉMETH Géza – KORONDI Péter: 3D internet for cognitive infocommunication = http://alpha.tmit.bme.hu/speech/docs/education/kognitiv_3d_net

MIBE konferencia. 2018. június 6. Mesterséges intelligencia az információkeresésben és -feldolgozásban. (Előadók: Deliága Ákos, Jóföldi Endre, Fegyó Tibor, Varjú Zoltán, Szabados Levente IT fejlesztések, Horváth Zoltánné könyvtári oldalról).

McAllister kijelentése könyvtári szempontból jelentős az információelméletre, a bizonytalanságra, és a keresésnél a formalizálásra utalás miatt, amelyek matematikai módszerekkel jelennek meg a tudományban és gyakorlati példákkal a könyvtáraknál.

GDPR – a személyes adatok védelmére kialakított EU szabályzat. A mesterséges intelligencia korában különösen fontossá válhat a csalások, és a kép- és videofelvételek csalásra történő felhasználása elleni felkészülésben.

John McCarthy a Stanford professzora, a mesterséges intelligencia atyjának is szokás nevezni. Bővebben: The key definitions of artificial intelligence (AI) that explain its importance = https://www.forbes.com/sites/bernardmarr/2018/02/14/the-key-definitions-of-artificial-intelligence-ai-that-explain-its-importance/#6cb9cddd4f5d

ORMOS László tanulmánya áttekinti a mesterséges intelligencia teljességét. (ld. 15. jegyzetben)

AITopics:  The Association for the Advancement of Artificial Intelligence (AAAI) weboldala, amely az internet legnagyobb mesterséges intelligencia-információ gyűjtőhelyének nevezi a szolgáltatásait = www.aitopics.org; Lásd még: BORDONI, Luciana – MELE, Francesco – SORGENTE, Antonio: Artificial Intelligence for cultural heritage https://www.cambridgescholars.com/download/sample/63242 stb.

ELTE összefoglalás http://people.inf.elte.hu/gt/mi/mi.html.

Talk to Books https://books.google.com/talktobooks– a Google Booksra alkalmazott szabadszöveges kereső, amelyhez szabadszöveges kérdéseket is fel lehet tenni, jelenleg már több százezer könyv tartalma alapján kapunk válaszokat a rendszerben már feldolgozott könyvek alapján.

Semantic Scholar jelenleg negyven milliónál több tudományos cikk alapján, beleértve a PubMed tartalmát, biztosítja a keresést. A tervezésben tudósok és orvosok vettek részt. Fejlesztője az AI2 – ALLEN Institute for Artificial Intelligence. Kombinálták a gépi tanulás, a természetes nyelvi folyamatok, a szemantikus analízis és a hivatkozási analízis módszereit. https://www.semanticscholar.org;
https://www.quora.com/What-is-Semantic-Scholar-and-how-will-it-work; stb.

Autonomy,  jelenleg a HP tulajdona, korábban az Autonomy Corporation PLC, szoftvere volt (Cambridge, United Kingdom, 1996.). Enterprise szintű adaptációs kereső és tudásmenedzsment eszköz, mintafelismerő tulajdonsággal, Bayes következtető motorral. Jelenleg a big data és más innovatív IT fejlesztésekkel foglalkoznak. Advise: a T-Systems intelligens, közös kereső rendszere, testre szabható szelekcióval, kommentekkel és egyéb használó központú megoldásokkal.

NLP (Natural Language Process): a modern nyelvészet és az MI nagyjából ugyanabban az időben született meg,  együtt fejlődött, a nyelv használatára összpontosító számítógépes nyelvészetnek (computational linguistics) vagy természetes nyelvfeldolgozásnak (natural language processing) nevezett hibrid területen találkozva egymással. A nyelv megértésének problémája továbbra is aktuális feladat. Lásd bővebben Russell–Norvig i. m.; A mesterséges intelligencia tudósai nagyrészt korlátozott szókincsben és szintaxissal építették ki a természetes nyelvi felületet, amely lehetővé teszi a számítógép számára, hogy megértse a főbb nyelvi fogalmakat egy kérdésben vagy megoldásban. Lásd: MOGALI, Shivaranjini: Artificial intelligence and its applications in libraries = https://www.researchgate.net/publication/287878456_Artificial_Intelligence_and_its_applications_in_Libraries.pdf

Tudásreprezentációk és szakértői rendszerek: a tudásreprezentáció (knowledge representation) annak a kutatása, hogy a tudást hogyan fejezzük ki a számítógép által feldolgozható formában (ld. Russell–Norvig i. m. és Ormos László i. m.);  szakértői rendszerek:  MUQUEEM, Shaista: Expert systems applications in libraries = http://www.klibjlis.com/2.14.pdf stb.

Gépi tanulás, reprezentációs gráfok: a gépi tanulás képessé teszi a gépeket ismeretek adaptálására előzetes programozás nélkül. Lásd Ormos László i. m. https://www.slideserve.com/thais/mesters-ges-intelligenciak; http://neuralnetworksanddeeplearning.com/chap5.html

A feladatmegoldás reprezentációs gráfjairól lásd az ELTE tananyag összefoglalót = http://people.inf.elte.hu/gt/mi/mi.html. „A feladatok útkeresési problémává alakítása során a gráf adott csúcsából adott csúcsba vezető utak jelképezik a feladat megoldását, amelyet a feladat gráfreprezentációjának is szokás nevezni.”

Deep learning – mélyhálós tanulás. Lásd MILACSKI Zoltán Ádám: Deep learning – mélyhálós tanulás. Mesterséges neuronhálók (2015) http://milacski.web.elte.hu/ann2015/ann_deep_learning.pdf; KONDACS Attila: Tanuló algoritmusok újragondolva = http://web.cs.elte.hu/tdk/TDK-szemin/tdk150629b.pdf; A mélyhálós tanulási szoftver megkísérli utánozni az aktivitást az agyi neuronok rétegeiben, ahol a gondolkodás történik. A szoftver valósághűen felismeri a hangok, képek és egyéb adatok digitális ábrázolásának mintáit. Az alapötlet 1943-ból származik, sok probléma után jelenleg a matematikai képletek és az egyre erősebb számítógépek fejlesztése miatt a számítógépes tudósok több virtuális neuronréteget tudnak modellezni, mint valaha. Lásd MIT Technology Review’s  10 breakthrough technology from 2013 (és évenként) = https://www.technologyreview.com/s/513696/deep-learning; Z. Karvalics  i. m., Uő.: Szemantikus háló alapú tudásszemléltetés: http://ait.iit.uni-iskolc.hu/~dudas/MIEAok/MIea6.PDF;  PAKSI Attila – KÁRPÁTI Andrea: A szemantikus háló az oktatásban. A multimédia annotációs eszközök új nemzedéke http://edutech.elte.hu/karpati/content/download/publikacio/PA_KA_SMAT.pdf

VIAF (Virtual International Authority File); DBpedia, ISNI, Wikidata, Geonames, Schema.org; Bibliograph.net, WorldCat világkatalógus, stb.

A 2. ábra forrása: MILLER, Eric: Becoming data native. How BIBFRAME extensibility delivers libraries a path to scalable, revolutionary evolution = https://www.loc.gov/bibframe/news/source/ala2017-june-bferic.pptx;
További információ: GODBY, Jean – VIZINE-GOETZ, Diane: BIBFRAME and OCLC Works: defining models and discovering evidence = https://www.slideshare.net/oclcr/bibframe-and-oclc-works-defining-models-and-discovering-evidence; Bibframe update forum at ALA annual conference 2017 = http://www.loc.gov/bibframe/news/bibframe-update-an2017.html;

OCLC linked data adatközpont: https://www.oclc.org/developer/develop/linked-data.en.html;

VIAF: The Virtual International Authority File (OCLC) kombinálja és elérhetővé teszi a különféle authority fájlokat, összekapcsolja a könyvtárakból származó (2,5 milliárd) rekord hitelesített, a WorldCat alaprendszerben tárolt adataival a szabványos authory adatokat és rekordokat, amelyek azonosítókkal ellátva elérhetők a weben is, pl. a Wikipédia szócikkek alatt. Az authority adatok szemantikus adatformátumait is közzéteszik, és a hálókapcsolatokat vizuálisan is ábrázolják az Identity Network alkalmazással. A kapcsolatok átrendeződnek, ha a kiválasztott csomópontra kattintunk:  http://experimental.worldcat.org/IDNetwork/display.html?query=lccn-nb2016004794

Tudás és hálózat. Beszélgetés Krauth Péterrel. Véry Zoltán interjúja = www.miau.gau.hu/miau/84/vz3.doc;

Particionálás: helytakarékos adattárolás a szervereken, a részekre szedett adatmennyiség akár több részre bontva számítógépes clustereken helyezhető el, a gyakran használt állományokat gyors elérésű memóriába helyezik és háttértárolókba az archív jellegű anyagokat.

Beérkezett: 2018. augusztus 25.