Bevezetés*

Korszerű világunkban a digitális adattárolás és kommunikáció rendkívüli mértékben megkönnyíti az információk előállítását és megosztását. Ez forradalmi előrelépés, hiszen a fejlődés egyik legfőbb motorja, hogy korábbi kutatások eredményeinek ismeretében új következtetéseket tudjanak levonni a kutatók.

Az írásbeli kommunikáció széles körű elterjedése már a fénymásolók megjelenésével egyszerűbbé vált, ugyanakkor az engedély nélküli másolás és terjesztés újfajta szerzői jogi kérdéseket vetett fel. A számítógépek megjelenése a háztartásokban a hétköznapi élet részévé tette az írott művek előállítását és megkönnyítette nemcsak mások műveinek elérését és másolását, hanem azok részben vagy egészben történő, hivatkozás nélküli felhasználását is. E jogszerűtlen felhasználás kiszűrését oldják meg a plágiumkereső rendszerek.

A legtöbb plágiummal foglalkozó oldal – legyen az iskolásoknak szóló vagy a tudományos élet szereplőit szolgáló – a plágiumot a következő általános jellemvonásokkal illeti: más által létrehozott mű vagy annak részlete a hivatkozás megfelelő megjelölése nélkül, egy saját név alatt közölt műben. A plágium kérdésköre azonban történelmi, jogi és technikai szempontból is ennél sokkal összetettebb.

Mielőtt rátérnénk, hogyan lehet új perspektívába helyezni a plágium kérdését, tekintsük át dióhéjban, miként változott a szellemi tulajdon megjelenése, megítélése a különböző korokban és kultúrákban. Mindez segítségünkre lesz abban, hogy jobban megértsük korunk szerzői jogi vitáit.

Ôsi kultúrák bölcsessége

Az ősi kultúrákban az emberi tudást nem ismerték el önálló értékként, ezért szellemi tulajdonról sem lehetett még beszélni. A cél a közösség erkölcsi fejlődése volt és mindannak a bölcsességnek, tudásnak a továbbadása, amit az ősöktől eredeztettek, illetve isteni eredetűnek tekintettek. A szerző szerepe a „közvetítés” volt a múlt, jelen és jövő között. Az iratok fizikai valóját lehetett ugyan birtokolni, de a tartalma nem volt sem a szerzőhöz, sem a tulajdonoshoz köthető.

A másolás mint értékmentés és értékteremtés

A másolás társadalmi megítélése ‒ mint az információ fenntartásának és terjesztésének forrása ‒ sokat változott az idők során. Mást jelentett a középkorban, a reneszánszban vagy az újkor embere számára, mai világunk hozzáállása pedig össze sem hasonlítható a korábbiakkal.

Szokás mondani, hogy egy másolat nem másolat, mert egynek könnyen nyoma vész. Az idők során számtalan eredeti dokumentum semmisült meg vagy tűnt el. Másolás nélkül nem maradtak volna fenn a csodálatos kódexek, életrajzok, naplók stb. sem, melyek ma ismereteinket gazdagítják. Az értékmentő másolást végzők között voltak rabszolgák, bérmunkások, írnokok, azaz hivatásos másolók, egyházi kiváltságosok, kedvtelésből másolók, akiknek munkája nélkül az adott társadalom is működésképtelenné vált volna. A középkori scriptorok szerepe a kódexirodalom fennmaradásában pótolhatatlan. A kódexeknél maradva, napjainkban immár a digitalizálás eredményeként a világ bármely pontjáról megtekinthető például a virtuálisan rekonstruált Bibliotheca Corviniana, Mátyás király könyvtára az Országos Széchényi Könyvtár honlapján1 Bibliotheca Corviniana Digitalis (e-corvinák) néven. A reneszánsz korban elismerték ugyan az alkotót, de a művet továbbra is isteni inspirációnak tekintették, amiért nem lehetett pénz kérni, mert az a szimónia bűnének számított. (A szerzők ezért általában az előszóban kértek támogatást olvasóiktól.)

A nyomtatás megjelenése

A másolások pótolhatatlan kultúramentő szerepe a könyvnyomtatás megjelenésével, a sokszorosítás technikájának elterjedésével alapvetően megváltozott. Megjelentek a kiadói monopóliumok is, melyek egy-egy mű megjelentetésének jogát sajátíthatták ki, anyagi érdekeiket védendő. A mennyiségi könyvkiadás elterjedésével tömeges vásárlói igény lépett fel, melynek hatására egyre több lelkes író meg is akart élni az alkotásaiból. Ekkor született meg a szerzői jog kezdetleges fogalma. A nyomtatásnak a művek széles körben való elterjesztésében játszott szerepe vitathatatlan, de felvet olyan jogi problémákat, melyek mind a mai napig aktuálisak.

Kompiláció – felhasználás tiszteletbôl

Egyes korokban, különösen irodalmi és zenei téren, a szellemi értékek felhasználásának egyik természetes eszközének számított, hogy a szerzők az elődök és a hagyomány tiszteletét szem előtt tartva plagizáltak. Gondoljunk például Saint-Saëns Az állatok farsangja című művére, melybe számos zenei idézetet épített be a zeneszerző más alkotók művéből (a Teknősbékák című tételben például Offenbach Orfeusz az alvilágban című művét hallhatjuk, csak lassabban). Ha Mozart Requiemjében gyönyörködünk, akkor a Kyrie-fúgában ugyanaz a téma köszön vissza, amely korábban Händel Messiásában szerepelt. És gondolhatunk a 17–18. századi hitszónokok kompilációs hagyományára is, „mert nem lopjuk azt, amit örökségül vettünk a mi régi atyáinktól.”2

A szellemi tulajdon védelme a digitális korban

Napjainkban akarva, akaratlanul létrehozunk olyan digitális alkotásokat, melyekhez jogaink fűződnek, amíg azonban nincs anyagi érdekünk ezen alkotások felhasználása kapcsán, addig nem szívesen foglalkozunk „unalmas” jogi procedúrával. Sokan hajlamosak a mások által létrehozott tartalmakat szabadon felhasználni, nem törődve az esetleg pontosan megjelölt felhasználási, sokszorosítási feltételekkel.

Maguk a jogalkotók is gondban vannak a szerzői jogsértések definiálásával3, mert a számítógépes kommunikáció az információval kapcsolatos műveletek annyiféle módját teszi lehetővé, hogy nehéz szétválasztani, mi számít bűncselekménynek, és mi tekinthető ésszerű felhasználásnak. Például, míg korábban egy mágneslemez vagy CD adathordozó lemásolása egyértelműen a felhasználói szerződés megszegésének minősült, addig mostanra elfogadott egy biztonsági mentés készítése, vagy a megvásárolt zeneszámok saját MP3-as lejátszónkra vagy mobiltelefonunkra másolása, szigorúan önmagunk szórakoztatása céljából.

Érdekek és eszközök

A szellemi alkotásokhoz különböző érdekei fűződnek a szerzőknek, a kiadóknak és a fogyasztóknak.

A szerző szeretné, ha eredményeit elismernék, és felhasználásuk esetén hivatkoznának a műveire, valamint hogy a mű előállításával kapcsolatos fáradozásait honorálnák, ezzel biztosítva munkásságának folytatását. A kiadó a sokszorosítással, reklámozással, a kapcsolt szolgáltatásokkal összefüggő kiadásait és üzleti hasznát kívánja érvényesíteni. A fogyasztó pedig megbízható, számára hasznos tartalmakhoz szeretne hozzájutni, a lehető legegyszerűbben és leggyorsabban.

Szakmai körökben ez a korábban elért szellemi eredmények további felhasználását, fejlesztését jelenti, mely egymásra épülés, haladás egyben az eredeti mű létrejöttének a célja is.

Ezen érdekek érvényesítésére különböző technikai megoldások születtek, melyek fejlődése jelenleg is töretlen. Ide tartoznak a digitális jogkezelés (DRM) eszközei, melyek a tartalmat magát igyekeznek megvédeni a jogtalan felhasználási módoktól. Ez a megoldás azonban éppúgy lehet akadály, mint védelem is a terjesztésben és felhasználásban, ahogy azt később látni fogjuk.

A plágiumkereső rendszerek a különféle publikációk önálló munka tartalmát és a felhasznált művek megfelelő hivatkozását tudják ellenőrizni, követhetővé téve mások eredményeinek jogszerű használatát.

Mit lehet ellopni: a mûvet vagy a tartalmat?

Mit kell védeni? A digitális állományt vagy magát az ötletet, az algoritmust, a szöveget? Meg lehet írni egy szoftver funkcióit újra, és az állományok már nem is fognak hasonlítani az eredeti alkotásra. Vagy egy e-book tartalmát át lehet másolni más formátumba, manuálisan vagy a képernyő képének automatikus szövegfelismerésével (OCR) úgy, hogy a végeredmény csak a tartalmazott információkban lesz azonos az eredeti adathordozóval, de fizikai valójában nem. A képi és hanganyagok hatékony tárolása pedig olyan tömörítési eljárásokat alkalmaz (veszteséges tömörítés), amelyek több paraméterben változtathatók úgy, hogy a megjelenített vagy hallható tartalom élvezhető marad, viszont a digitális állomány még méretében is eltérő az eredetinek tekinthető műtől.

Meg kell különböztetnünk a tulajdonjogot és más, felhasználási jogokat. Ha a tulajdonunkká válik egy szellemi alkotás, mert a fizikai hordozója hozzánk kerül, attól még nem lesz a miénk. Például szoftverekre legtöbbször csak a felhasználási jogot szerzi meg a felhasználó, és ha már nincs rá szüksége, meg kell semmisítenie, mert maga a termék nem lett az övé, és nem is adhatja tovább.

Az élmény mint szellemi alkotás

A közösségi weboldalak népszerűsége óriási változást hozott a marketing területén. Mivel a digitális tartalmak korlátozás nélkül, minőségi romlás nélkül másolhatók, így szinte végtelen számban értékesíthetők. De mit is értékesítenek ebben az esetben?

A legtöbb tartalom a licenc szerződésével még nem válik tulajdonunkká, csak gondosan felsorolt felhasználási jogokat szerzünk rá. Egy mai digitális mű esetében valójában semmi sincs a kezünkben, amire azt mondhatnánk, hogy a miénk. Leegyszerűsítve, nem a művet magát szerezzük meg, hanem a mű élvezetének élményét. Amikor megosztunk egy digitális alkotást, akkor is az élményt osztjuk meg.

A YouTube Content ID4 rendszere jól példázza, hogy a szerzőnek és a kiadónak az az érdeke, hogy a mű ismert legyen, ezért különböző módokon megengedheti, hogy az élményünket megosszuk.

Az áttekintett változások számtalan kérdést vetnek fel, mikor mások alkotásait kívánjuk saját munkánkhoz felhasználni. A plágium fogalma sokféle értelmezésen ment át az idők során. Irodalmi vagy tudományos művek esetén még tartják magukat a mű fizikai megjelenésével, másolhatóságával összeköthető „hivatkozási” jellegű jogok, kötelezettségek. Azonban az e-könyvek megjelenésével már nagyon is közel került az írott média az audiovizuális tartalmak digitális megjelenéséhez és azok védelmi és jogi rendszereihez.

Digitális tartalmak védelme

A szerzői jogok szempontjából létezik egy igen fontos különbség a korábbi analóg és a korszerű digitális információfeldolgozás között. Az analóg sokszorosítás nem tudta kiküszöbölni a másolás során fellépő információveszteséget. Idővel nemcsak a másolatok lettek felismerhetetlenek, hanem az eredeti felvételek is koptak, megnyúltak a sok használattól, míg végül gyakorlatilag maguk is megsemmisültek5. Ez a kiküszöbölhetetlen minőségi romlás egyfajta utolsó biztosítéka volt a művek szerzőinek és a kiadóknak a kalózmásolatok végtelen áradata ellen.

Míg korábban a kifejezetten korszerű, high-tech-eszközökre és szaktudásra volt szükség az illegális cselekmények elkövetéséhez, manapság, amikor már szinte mindenki otthonában ott a számítógép, csak minimális felhasználói tudásra van szükség a kivitelezéshez. Az illegális műveletekhez szükséges útmutatók és programok egyszerű használata azt a benyomást keltheti a hétköznapi felhasználóban (látens bűnelkövetés)6, hogy nem is tesz semmi helytelent. Mindezzel nemcsak az elkövetések időtartama csökkent le, hanem a felderíthetőségük, bizonyíthatóságuk is komoly akadályokba ütközik. Az elkövetések számához képest annyira elhúzódnak a felderített ügyek, hogy gyakorlatilag nem kelt valós aggodalmat a törvények megszegése.

A jogtiszta piac igyekszik olyan technológiai megoldásokkal előállni és olyan tartalmakat szolgáltatni, amelyekkel annak költségeit minimálisra szorítja le, elérhető áruvá téve a digitális és néha még a fizikai formában előállított szellemi alkotásokat is, hogy a legtöbb vásárló számára azok megvásárlása egyszerűbb és kifizetődőbb, mint illegális forrásuk felkutatása.

Digitális jogkezelés – DRM

A digitális jogkezelés (DRM – Digital Right Management) azon technológiák gyűjtőfogalma, melyek a digitális tartalmak védelmét szolgálják. Az első, korszerűnek tekinthető, tisztán szoftveres megoldásokat a legnagyobb lemezkiadók és számítástechnikai cégek kezdték alkalmazni az 1990-es évek második felében. Sok fejtörést okoz az informatikának, hogy a felhasználókhoz kerülő adatok, szellemi alkotások felett miként lehet valamiféle felügyeletet gyakorolni a későbbiekben is. Természetesen a felhasználókat legalább ennyire foglalkoztatja, hogy ki, miért és milyen felügyeletet akar gyakorolni az egyébként fizikailag tulajdonukat képező gépük tartalma felett. Azért is aggályos ez a kérdés, mert a számítógép felhasználója nem szükségszerűen informatikus, így nem sok eszköze van, hogy a gépe tartalmát ellenőrizni kívánó szervezetek és programok valódi ténykedését vizsgálja. A szándékon és szerződéseken kívül jelenleg nincs műszaki garancia arra, hogy a felügyeletet végző megoldások nem kíváncsiskodnak számítógépünk egyéb területein, alkalmazásaiban is7.

A digitális másolásvédelmi rendszerek legtöbbször rengeteg bonyodalmat okoznak mind a jogok tulajdonosainak, mind a felhasználóknak. Sokszor éppen a jogos felhasználást nehezítik meg annyira, hogy inkább meg sem veszik a vásárlók.

Vegyük sorra, mi mindent tehetünk egy hagyományos nyomtatott könyvvel: olvashatjuk, ahol akarjuk; kölcsönadhatjuk; eladhatjuk; felolvashatunk és felolvastathatunk belőle (read-out loud) stb. Az e-könyvek kezdeti licencelése inkább a szoftverekéhez hasonlított, azaz csak felhasználási jogot szerzett a vásárló. Egy hagyományos könyvet kölcsönadhatok, de egy e-könyvvel együtt nem akarom feltétlenül a kedvenc e-book-olvasómat és a rajta lévő további, akár több száz könyvemet is kölcsönadni. Viszont magát az e-könyv fájlt a DRM-védelem miatt nem tehetem át más eszközre, mert az nem tudja megjeleníteni.

Ironikus, hogy eközben a feltört kalózmásolatok ugyanolyan szabadon használhatók, mint egy hagyományos könyv, bár könnyebben másolhatók. Ezért több kiadó megszüntette az e-könyvek DRM-védelemmel való ellátását, mert így legalább azoktól befolyik a bevétel, akik szívesebben fizetik ki egy könyv árát, mintsem, hogy felkutassák az internetet a kalózkiadások után.

Az audiovizuális tartalmak terén a YouTube Content ID8 igen innovatív technológiai megoldás, melyben az eredeti anyagot feltöltő jogtulajdonos megadhatja, mi történjen, ha a rendszer a szóban forgó mű másolatát megtalálja a mások által feltöltött anyagok közt:

  • Block: amikor az újonnan feltöltött videót letiltják.
  • Track: a videó követése. Az eredeti tulajdonos nézettségi és egyéb statisztikai adatokat kap az anyag látogatottságáról. Így rajongói szokásokat ismerhet meg, illetve a videó alatti kommenteken keresztül marketing értékű kapcsolatokat építhet.
  • Monetize: „pénzzé tétel”. Ilyenkor a feltöltött videó nem kerül eltávolításra, de az alján reklám fog megjelenni, melyet a feltöltő nem tilthat le. A YouTube a videó témájával kapcsolatos célzott reklámokat helyez el.

A műveletekről mind az eredeti jogtulajdonos, mind a másolatot feltöltő felhasználó értesítést kap, így lehetőség van az ügy tisztázására, mert egy jogi vita sokkal költségesebb, mint amennyit egy ilyen megosztással kapcsolatos érdeksérelem megér.

Ezzel egyben körvonalazódik a legfontosabbnak látszó tényező, miszerint mind a szerzőnek és a kiadónak, mind pedig a vásárlónak egyetlen szempontja van, „érje meg a fáradtságot”.

Digitális plágium a közoktatásban és a tudományos életben

Sosem volt még ennyire egyszerű és gyors az információ felkutatása, elérése, mint manapság. Az információs szabadsággal azonban együtt jár a hanyagság is, legalábbis ami a szerző és az eredeti forrás megjelölését illeti, és könnyen feledésbe merülnek azon ismeretek is, hogy miként kell a megtalált tartalmakat szabályosan, jogszerűen felhasználni.

Az internetes plágiumkereső megoldások elsősorban az oktatási és a tudományos szektorra koncentrálnak: diákok dolgozatait, doktori értekezéseket, tudományos folyóiratok cikkeit vizsgálják.

A közoktatás és a tudományos világ plágium problémáit azonban érdemes különválasztani.

A közép- és felsőszintű oktatásban a plágium a tanulmányokat végzők tudását, a képzés minőségét rontja le. Mit ér egy olyan dolgozat, amit az internetről összemásolt anyagok alkotnak, hiszen a nagy keresőmotoroknak köszönhetően, ma már nem gond az anyaggyűjtés, a szövegszerkesztőkkel pedig pillanatok alatt azonos formátumra hozhatók az eltérő forrásból származó részletek. Közben a diák szinte semmit nem tanult: sem az érdemi források felkutatását, sem gondolatai rendszerezését, megfogalmazását, íráskészsége fejlesztését. Nincs az a pedagógus, aki képes lenne szakterülete mérhetetlen mennyiségű, valamennyi internetes forrását ismerni és felfedezni az ilyen jellegű csalásokat. Az oktatásban sok a szabadon hozzáférhető tananyag, melyek saját név alatti felhasználása egyértelműen csalás.

A tudományos világ, különösen a tudományos folyóiratok plágiumot ellenző hozzáállása más okokra vezethető vissza. Egyetlen szaklap sem szeretné ugyanis, hogy nehezen megszerzett tekintélye azért csorbuljon, mert egy általa korábban kiadott vagy máshol megjelent kutatási információt tartalmazó publikációt közölt.

Másolásvédelem helyett plágiumkeresés!

A másolásvédelemmel ellátott termékeket előbb vagy utóbb feltörik, ezért a digitális közlés és az elektronikus könyvtárak iránti bizalom gyengül, ha nem tudják hatékonyan megvédeni az eredeti tartalmakat, miközben megnehezítik a jogszerű felhasználást. A plágiumkeresés azonban képes felfedni az illegális alkalmazást, ezért ösztönzőleg hat a digitális közlésre, mert az ezzel járó és kívánatos népszerűség már nem jelenti azt, hogy az alkotás tartalma ellenőrizetlenül másolható lenne9, épp ellenkezőleg, az ismertség nyújt védelmet.

Az eredmények felhasználásának helyes módja

Mások szellemi alkotásait saját munkánkhoz felhasználni hasznos és támogatandó, hiszen épp ez az eredmények közlésének értelme. Az aggályokat a hiányzó vagy nem megfelelő hivatkozások jelentik, tehát amikor mások szellemi termékét a sajátjaként közli valaki. Az is probléma lehet, ha egy mű rendelkezik ugyan megfelelő hivatkozásokkal, de olyan sokkal, hogy szinte alig tartalmaz saját érdemi munkát. (Ennek megítélése azonban már nem a plágiumkeresés feladata, hisz meglévő eredmények újszerű struktúrában összeállítása is vezethet új felismeréshez.) A tanároknak rengeteg beadott munkát kell értékelniük, amelyhez az automatikus plágiumvizsgálat praktikus információkat nyújthat a külső forrásokból származó szövegrészek arányáról és a forrásmegjelölések meglétéről, de ha a tanárok túlzottan támaszkodnak ezekre az adatokra, a hagyományos tartalmi vizsgálat felületessé válhat. Egyelőre azonban úgy tűnik, hogy az automatizált segítség javítja mind a diákok által végzett munka minőségét, mind a tanárok által nyújtott visszajelzések hasznosságát10.

Sok helyen azért nem teszik közzé a digitálisan készült dolgozatokat, nehogy tömeges plágiumforrássá váljanak. Ez viszont akadályozza, hogy a meglévő eredményekre épüljenek az új munkák, aminek következtében évről évre sok azonos témájú, azonos módon feldolgozott tanulmány készül.

A plágiumkereső rendszerek alkalmazása támogatja az eredeti művek nyílt közlését, hisz adatbázisba vételükkel kockázatossá válik azokból másolni. Azzal, hogy elérhetők az anyagok, szabályos felhasználásuk révén új eredmények születhetnek11.

A plágium tíz fajtája

A Turnitin.com az egyik legnagyobb plágiumkereséssel foglalkozó szolgáltatás. A cég 879 középiskolai és felsőoktatási tanár kérdőíves megkeresésével a következő, a hivatkozások hibájából eredő plágium kategóriákat állapította meg12:

·     Klón – Más munkájának szó szerinti, teljes terjedelmű átvétele, saját név alatt.

·     CTRL-C – Egyetlen forrás valamely meghatározó szövegrészletének felhasználása átalakítás nélkül.

·     Keresés és csere – Kulcsszavak és mondatok módosításával a forrás valamely lényegi részének átemelése a saját dokumentumba.

·     Remix – Részletek kiemelése különböző anyagokból úgy, hogy végül azok tökéletesen illeszkedjenek egymáshoz a saját írásban.

·     Újrahasznosítás – Önplagizálás. Saját korábbi munka tartalmának nagymértékű felhasználása egy újabb anyagban, a hivatkozás megjelölése nélkül.

·     Hibrid – Helyesen idézett forrásokból származó részletek keverése hivatkozás nélküli szövegmásolatokkal.

·     Vegyes – Olyan írás, mely több különböző forrás másolt anyagait mutatja be, pontos hivatkozások nélkül.

·     404 hiba – Hivatkozás, mely nem létező forrásra utal, vagy pontatlan meghatározást tartalmaz. Az elnevezés a weben szokásos „oldal nem található” hibakódra utal.

·     Aggregátum – Megfelelő hivatkozások használatával megírt dokumentum, mely nem tartalmaz érdemi saját munkát.

·     Re-Tweet” – Olyan anyag, mely bár pontos hivatkozásokkal bír, de tartalma túlságosan hasonlít az eredeti szöveg szóhasználatára vagy struktúrájára. Az elnevezés utalás a népszerű mikro-blog szolgáltatás, a twitter.com oldalán használatos üzenet továbbküldési lehetőségre, melyben megjelölhető, korábban kitől érkezett hozzánk a megjegyzés.

A Turnitin tanulmánya információkat közöl arról is, hogy az oktatók szerint a fenti esetek milyen gyakoriak, illetve mekkora problémát jelentenek. A kutatás arra nem tért ki, hogy angolon kívül más nyelvű dokumentumokat is feldolgoztak-e, így ezen részleteket nem lehet azonos módon a hazai helyzetre értelmezni.

Plágiumvizsgálati módszerek

A számítógépek számára az írott szövegek tartalmi feldolgozása nem egyszerű feladat, hiszen nem rendelkeznek olyan értelmező képességgel, mint az ember. A programok karakterek láncolatát látják. Már a mondathatárok megtalálása is komoly feladat, hisz elég egyetlen rövidítés és máris pont került egy szó után, amiről a szövegkörnyezet értelmezése nélkül nem állapítható meg, hogy mi is a szerepe.

Alapvetően két lehetőség kínálkozik egy szöveges mű elemzésére:

·     összevetni a tartalmát más, ismert forrású művekkel,

·     ömagában vizsgálni a mű belső szerkezetét és ez alapján következtetni annak eredetiségére.

Mindkét esetben a dokumentumok tartalmát kell vizsgálni, ezért minden plágiumkereső rendszer első lépése kinyerni a formázás nélküli nyers szöveget az adatfájlokból. Utána eltávolítják a szövegből a túl rövid karakterlácokat (mint például a névelők vagy a 3–4 betűs szavak), mert jellemzően kevéssé fontosak a tartalmat illetően. Az összevetés típusú műveletekhez rendelkezni kell a megbízható forrásokból származó eredeti művek adataival. Hasonló ez a korábban említett Youtube Content ID megoldáshoz, ahol az ismert mesterkópiákhoz hasonlítják a feltöltött videókat. Az ilyen rendszerek hatalmas adatbázist építenek nemcsak az interneten szabadon elérhető dokumentumokból, mint például a Wikipedia, hanem zárt elérésű, digitális könyv- és folyóirattárak, tudományos források műveiből is, hisz legfőképp azok könnyelmű felhasználása okozhat komoly vitákat a későbbiekben (például tudományos fokozat visszavonása, amely mind az intézménynek, mind a személynek igen kellemetlen).

A művek belső szerkezetének vizsgálatával a stylometria foglalkozik. Az irodalmi alkotások nyelvtani szerkezetének, szóhasználatának elemzésével képet alkothatunk arról, hogy egyetlen szerző tollából származik-e az alkotás13. Megvalósítása még aktív kutatási fázisban van. Lényegükből adódóan ezen megoldások nyelvfüggőek és sok szubjektív, emberi értelmezést igényelnek, amik nehezen ültethetők át számítógépes programba. Az eredmények megbízhatósága most még nem éri el a kívánt szintet, ezért erre nem térünk ki.

Tartalmi átfedések

Ezek a megoldások a betáplált művek összehasonlítását végzik. A számítástechnikában csak mérhető egységekkel lehet dolgozni, ezért matematikai algoritmusokat dolgoztak ki a szövegek hasonlóságának, illetve távolságának meghatározására. Ilyeneket használnak a dokumentumok automatikus osztályozására is. Ezen mértékek kiszámításának egyik szempontja, hogy bizonyos szavak milyen gyakorisággal szerepelnek, vagy épphogy nem szerepelnek két összehasonlítandó dokumentumban. A túl rövid szavakat ilyenkor nem veszik figyelembe, mert előfordulásuk oly gyakori, hogy nem nyújtanak érdemi információt a dokumentumok tartalmáról. A túl hosszú szavak viszont egyes tudományterületek szakszavai lehetnek, amelyek inkább a dokumentum egyediségét és a szakterületet jellemzik, semmint azt, hogy milyen tartalommal bírnak.

A plágiumkeresés nem egyszerűen a dokumentumok tartalmi hovatartozását vizsgálja, hanem a köztük esetlegesen fennálló szövegbeli egyezéseket. Pontos eredményt kapnánk a szövegek azonosságáról, ha azokat karakterenként hasonlítanánk össze. Azonban ez nem célszerű, hisz – a szó szerinti idézés esetétől eltekintve – legalább minimális szórend, illetve szóhasználatbeli különbségekre számítanunk kell a forrásművek felhasználása során. További probléma a karakterenkénti, avagy szavankénti összevetéssel, hogy nagy mennyiségű dokumentum esetén rendkívül sok műveletet kell végrehajtani, mire mindent mindennel összehasonlítanánk. Ezt még a mai csúcsszámítógépek sem bírják.

Vízjel módszer

Inkább a digitális jogkezelés, ill. másolásvédelem kategóriába tartozik. Ilyenkor egyedi ellenőrző kódot (check sum, hash) kap az eredeti dokumentum vagy annak jelentős része. Ez azonban több-kevesebb munkával eltávolítható, és bármilyen kis változtatás a szövegen már más ellenőrző kódot eredményez, így nem mutatja az egyezőséget az eredeti művel.

Internetes keresôk igénybevétele

Egyes megoldások ismeretlen szempontok szerint vagy véletlenül kiválasztott mondatokat, szóösszetételeket ragadnak ki a vizsgálandó műből, majd arra szabadszöveges keresést végeznek a keresőmotorok segítségével. Jobb esetben könyvtári és más tudományos adatbázisokban is elvégzik ezt, mivel az internetes kereséssel csak a publikusan elérhető dokumentumok esetén remélhető eredmény. Az internetes keresők indexelési és sorba rendezési szempontjai teljesen eltérőek a megbízható plágiumkeresés számára szükségestől, ezért az így nyert eredményeket további vizsgálatnak kell alávetni.

Nyelvfüggô megoldások

Ezek az eljárások az egyes nyelvek sajátosságait algoritmusuk részeként veszik figyelembe. Ez egyes területeken javítja, más területeken leszűkíti felhasználhatóságukat.

Szövegdarabolás

A korszerű plágiumkereső rendszerek e módszer valamilyen változatát mindenképp használják. A megoldás lényege, hogy a vizsgálandó szöveget különböző módon megválasztott határoló szavak segítségével rövidebb-hosszabb töredékekre darabolják. Fontos, hogy ezek általában átnyúlnak a mondathatárokon, ha túl rövidek a szakaszok, akkor tipikus szófordulatok esetén is találat lesz. Ha azonban túl hosszúak a keletkező töredékek, akkor nagyobb szövegbeli átfedés szükséges a találathoz, és a rövidebb részletek átcsúsznak az ellenőrzésen.

A jelenleg legjobb eredményt nyújtó tördelő algoritmus egy csúszóablakot alkalmaz. Például egy 7 szavas csúszóablak először az első hét szót veszi töredéknek (1–7), majd a második szótól ismét hét szót (2–8), és így tovább. Ennek lényege, hogy átfedés van a töredékek közt. Emiatt egy-egy közbeszúrt szó még nem akadályozza meg a találatot két szöveg hasonló része közt, mert az előtte és utána képzett ablakokban lévő töredékek továbbra is jelzést adnak. Ahhoz, hogy a töredékek valóban lényeges szövegelemeket tartalmazzanak, eltávolítják a túl rövid szavakat, mint például a névelőket.

Hatalmas előnye a szövegtördeléses módszernek, hogy nem szükséges magukat a töredékeket szövegesen eltárolni. Léteznek olyan matematikai algoritmusok (hash), melyek rendkívül nagy valószínűséggel egyedi kódot rendelnek egy tetszőleges karaktersorozathoz, és ugyanahhoz a sorozathoz mindig ugyanazt a kódot generálják, de ezekből a kódokból nem lehet visszaállítani az eredeti szöveget. Ezen digitális ujjlenyomatok eredménye a tömörség, mert több száz karakter hosszú töredék egyedi azonosításához is csak alig néhány karakteres (4–8 byte) kódot kell rögzíteni, ami nagy mennyiségű mű tárolásakor kiemelt szempont. Továbbá bizalmasan kezelhető az eredeti dokumentum, mert nincs szükség a szöveg tárolására az adatbázisban ahhoz, hogy vizsgálni lehessen, másoltak-e belőle.

A dokumentumok adatbázisának felépítése során a feldolgozás első lépése a nyers szöveg kinyerése a forrásanyagból (PDF, DOC, RTF, HTML, stb. átalakítása TXT formátumra), majd a szöveg előfeldolgozása, a rövid karakterláncok eltávolítása és a dokumentum osztályozása következik. Végül a töredékek előállítása adott hosszú szószámmal, csúszóablak módszerrel és az egyedi kódok, az ujjlenyomatok kiszámítása és adatbázisban tárolása.

A lekérdezés során az új dokumentum feldolgozása az előbb említettek szerint történik, majd következik a keresési tér szűkítése. Ez a szöveg osztályozásának megfelelően a lehetséges találatokat adó tárolt művek előválogatását jelenti, hogy ne a teljes adatbázissal kelljen összevetni minden feltöltött művet, ami rendkívül erőforrásigényes művelet lenne. A vizsgált és az előválogatott dokumentumok kódjainak összevetése után a gyakori, különösen az egymás közelében lévő töredékek találata esetén az eredmény statisztikáinak tárolása, megjelenítése következik.Ez megmutatja, hogy a vizsgált mű az adatbázisban mely dokumentumokkal és milyen mértékű átfedéseket mutat, illetve hogy azok a dokumentumok mely részein vannak.

Plágiumvizsgáló rendszerek

A plágium elleni intézkedések valójában minőségbiztosítási lépések. Ezért nem meglepő, hogy a plágiumkereső algoritmusok tudományos kutatása mellett megjelentek a piaci alapú szolgáltatások is, elsősorban angol nyelvterületen. Amerikában évente számtalan dolgozatot adnak le a diákok közép- és felsőszintű tanulmányaik során, melyek feldolgozása komoly erőforrást igényel egy valóban használható rendszertől.

A hazai – ingyenes – SZTAKI–KOPI rendszerrel kapcsolatban az alkotók minden lényeges részletet publikálnak a szakfolyóiratokban, a külföldi és többnyire fizetős rendszerek azonban üzleti titokként kezelik működésük részleteit.

SZTAKI–KOPI

„Saját tollal ékeskedni”

„A KOPI Online Plágiumkereső és Információs Portál fejlesztése 2003-ban kezdődött az MTA SZTAKI Elosztott Rendszerek Osztálya, valamint a Monash University közreműködésével. A fejlesztés célja egy hálózati plágiumkereső portál létrehozása, amelynek segítségével az elektronikus formában rendelkezésre álló dokumentumok közötti hasonlóság felderítésével plágium vagy idézet, de akár ugyanannak a dokumentumnak egy régebbi vagy újabb változata is megtalálható14.”

A legtöbb fizetős, piaci plágiumkereső portállal ellentétben a KOPI jellemzően pályázati pénzből tartja fenn magát15. Ennek köszönhető, hogy az alkalmazott algoritmusok megismerhetők a különböző projekt publikációkban. A KOPI másik érdekessége, hogy a piaci szereplőkhöz képest más kutatási területekre fókuszál. Míg az angol nyelvterületen tevékenykedő nagy plágiumkeresők az előfizetők kegyeit keresik – például a dolgozatok osztályozásának, a tanárok visszajelzésének megkönnyítésével – , addig a KOPI a kereső algoritmusok megkerülésének, átverésének lehetőségeit igyekszik szűkíteni.

A szöveg töredékekre darabolását végző módszer a KOPI által jelenleg is alkalmazott megoldás: az alapötlet módosítása nélkül a fejlesztők jelentősen ki tudták terjeszteni a plágiumkeresés által átfogott dokumentumok halmazát. A potenciális plágiumforrásokat tartalmazó adatbázis építésébe kísérleti jelleggel bevonták az ugyancsak a SZTAKI Elosztott Rendszerek Osztály fejlesztésében növekvő SZTAKI–Szótárat. A töredékekben lévő szavakat a szótár segítségével a kiválasztott idegen nyelv összes lehetséges szó szerinti fordításával helyettesítik, és az ehhez tartozó töredékek kódjait is tárolják. Ez természetesen növeli az adatbázis méretét, viszont egy esetleges fordításban valószínűleg szerepelnek olyan szóláncok, melyek több, egymáshoz közel eső szakaszon egyezést mutatnak az automatikusan fordított töredékek egyikével, másikával. Emlékezzünk, hogy az előfeldolgozás eltávolítja a kis jelentőségű, rövid karakterláncokat, így a szavak jelenléte, sorrendisége fontosabb az összehasonlításban, mint a nyelvtan.

Ezzel a módszerrel lehetővé válik, hogy egy magyar nyelvű dolgozatban felismerhető például egy Wikipedia szócikk fordításával készített részlet. A KOPI már feldolgozta a Wikipedia angol nyelvű állományát, és a fent említett módon készített angol‒magyar szó szerinti fordítások azonosító kódjait eltárolta adatbázisában16. Erre a Wikipedia tartalmának licence, a Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)17 adott lehetőséget. Hasonló módon előkészületek folynak más nyelvű és egyéb ismert publikus weboldalak, illetve digitális könyvtárak állományának feldolgozására.

Érdekes kutatási irány a KOPI fejlesztésében a Szótár-projekttel párhuzamosan létrejött „műhely-alkalmazások” algoritmusainak beépítése is18.

Az egyik a Rövidítésgyűjtemény, mely oda-visz­sza tartalmaz rövidítéseket és értelmezéseket. A KOPI ezzel képes lehet a szövegekben előforduló rövidítések kifejtésére vagy behelyettesítésére.

A másik alkalmazható kísérleti algoritmus a Szofisztikátor. Jelenleg ez a program angol és magyar nyelvet kezel, és bonyolultabb vagy egyszerűbb működést állíthatunk be. Az algoritmus a szótárak használatával szinonimákat keres a szövegtöredékben előforduló szavakra, szóösszetételekre, majd ezeket ismét összefűzi egy lehetőleg értelmes szóláncolattá. A KOPI ezt a modult az idegen nyelvi fordításokhoz hasonlóanképes felhasználni. Az eredeti szövegből kinyert töredékeket egyszerűbb, illetve bonyolultabb szóhasználatúvá teheti a Szofisztikátor. Az így kapott, átalakított szövegdarabok egyedi azonosítóinak tárolásával körmönfont átfogalmazások vagy rövidített kivonatok is találatot adhatnak a plágiumkeresőben.

A SZTAKI–KOPI és a kapcsolódó projektek mögött folyó kutatómunka olyan különleges kombinációt alkot a plágiumkeresés fejlődésében, ami mindenképp figyelmet érdemel. Kívánatos lenne, ha főképp a magyar egyetemek összefogásában megindulna a komoly használata. Az eredeti mintadokumentumok alapján működő plágiumkereső rendszerek, ahogy a KOPI is, az adatbázisának méretével arányosan képes hatékony munkát végezni.

Kezdetnek fel lehetne tölteni a KOPI-ba a magyar digitális könyvtárakban meglévő írásokat, illetve a rengeteg, jelenleg csak az egyetemi könyvtárakban elérhető diplomamunkákat. Ezek hozzáférését eddig épp a tömeges plagizálás megakadályozása miatt nehezítették az intézmények. A SZTAKI–KOPI használatával azonban az írások végre tudományos értéküknek megfelelően felhasználhatóvá válnának, miközben a tartalmuk tömeges idézése kifejezetten kockázatos, és így kerülendő lenne19.

 TURNITIN

A Plagiarism.org szolgáltatás-csoportot az iParadigms, LLC. cég üzemelteti és fejleszti20:

·     a Turnitin.com – plágiumkereső szolgáltatás, elsősorban oktatók számára,

·     a WriteCheck.com – diákok számára biztosít ellenőrzési és támogatási lehetőségeket,

·     az iThenticate.com – tudományos munkák eredetiségének vizsgálatát végzi.

Mindegyik portál egyedi szolgáltatásokat nyújt a maga területén, melyek kivétel nélkül előfizetéshez kötöttek.

A Turnitin dolgozatjavítási, osztályozási és konzultációs (a hallgatóval a dolgozat közös áttekintését segítő) funkciókat biztosít a tanárok és diákok számára. Ezt a feladatnak megfelelő háttéradatbázisok támogatják, melyek több mint 24 milliárd weboldal, 300 millió dolgozat és 110 ezer publikáció tartalmának adatait tárolják. A feltöltött dolgozatok egyediségét mindezen források figyelembe vételével képes kiértékelni a rendszer.

A WriteCheck elsősorban a diákok számára kíván segítséget nyújtani dolgozataik, publikációik megírásához. A Turnitin egyediség-vizsgálatát, nyelvtani ellenőrzést és professzionális, személyre szabott konzultációt kaphat az előfizető.

Az iThenticate tudományos értekezések vizsgálatára szakosodott. 32 milliárd weboldal, 125 millió írás – köztük 34 millió tudományos publikáció a CrossCheck összefogás21 tagjaitól – alkotja adatbázisát.

A CrossCheck szolgáltatás a CrossRef.org szervezésében olyan publikációk teljes szöveges feldolgozását biztosítja a Turnitin számára, melyek adatai nélkül nem lehetne érdemben vizsgálni az újonnan születő tudományos írások forráshasználatát.

Plágiumkeresés témakörben igen hasznos és érdekes publikációk, felmérések találhatók a Turnitin weboldalán, köszönhetően az aktív tudományos használatnak és hatalmas adatbázisának.

A Turnitin már nem csak angol nyelven képes dolgozni. Néhány nyelvi támogatás még fejlesztési, tesztelési (béta) fázisban van, mint például az orosz és a lengyel. Magyart még nem lehet választani az oldalon, de egy 2012. januári sajtótájékoztató szerint22 képes angol nyelvű cikkek többek közt magyar nyelvű fordításait felismerni.

Egyéb plágiumkeresô rendszerek

A Google-ban23 az első találatok nem az oktatásban előforduló plágiumok keresésére alkalmas rendszereket mutatják, hanem a kereső optimalizálási (Search Engine Optimization, SEO) eszközöket kínáló oldalakat. Úgy tűnik, nagy a kereslet arra, hogy megtudjuk, felhasználták-e weboldalunk, blogunk tartalmát valahol máshol. Ezek a keresők jellemzően oldalunk webcí­mét vagy kisebb-nagyobb szövegrész bevitelét várják, melyet részletesebben nem ismertetett módon feldolgoznak, majd valamelyik nagy internetes keresőnek betáplálnak. Hasonló keresést általában magunk is kiadhatunk anyagaink jellegzetes részeiből válogatva.

A tudományos plágiumkereső eljárások nemcsak megoldásukat tekintve összetettek, hanem hatalmas, előfeldolgozott adatbázis nélkül nem is lennének képesek alapos munkát végezni.

A hazai fejlesztésű KOPI ingyenes, de az iParadigms kibővített szolgáltató rendszerei fizetősek. Hasonló a helyzet az interneten található keresők között is, azaz a komoly publikációs forrással bíró rendszerek mind előfizetésesek.

Az ingyenesek közül talán a legnagyobb a Vi­per24. Használatához telepíteni kell egy programot, ami aztán képes a helyi gépen lévő dokumentumok közt, illetve a közös adatbázisban keresni, melyet több mint 10 milliárd forrás alkot25, igaz, ezek tudományos összetétele nem ismert. Fontos még tudni, hogy a vizsgált dokumentumot fel is veszi a Viper az adatbázisába, így ha egy hallgató maga ellenőrizteti a munkáját, akkor később a tanár látni fogja a teljes egyezést az egyébként eredeti művel. A Viper büszke rá, hogy nem szab méretbeli korlátot a feltöltendő dokumentumnak.

A PlagiarismDetect26 angol és spanyol nyelven működik, és oldalanként kell fizetni a vizsgálatért. Működési elvéről annyit lehet tudni, hogy többrétegű elemzést hajt végre, és nem mondatok, hanem szókombinációk alapján határozza meg az esetleges hasonlóságokat.

A CheckForPlagiarism27 több nyelven is működik, szakterületi adatbázisok dokumentumaiban is keres (mint például jogi cikkekben, Lexus-Nexus, Blackwell-Synergy, Athens, Emerald, JSTOR, Harvard Journals, OptiQuest, stb.). Nyíltan közzéteszi, hogy az ingyenes plágiumkeresők ugyan hasznosak, de az eredményeik nem minden esetben kielégítőek28. Ennek egyik oka, hogy az általános internetes keresőmotorok – mint a Google, a Bing vagy az Ask – a népszerű, a találatok közül gyakran megtekintett oldalakat listázzák előre, míg az alig látogatottak olyan hátra kerülnek a találati listákon, hogy megtalálásuk szinte lehetetlenné válik.

Összefoglalás

Ahogyan korábban a könyvnyomtatás, most a digitális technika elterjedése nyitott új perspektívát mind a nyilvános közlés, mind a szerzői jogsértések területén. A lemaradásban lévő jogi szabályozások mellett megjelentek a digitális jogkezelő megoldások, melyek egyszerre lettek védői a műveknek, de gyakran a terjesztés akadályai is. Az elektronikus irodalom könnyen vált névtelen forrássá az újabb írásokban. Ez a tudományos élet publikációinak minőségét is jelentősen rontotta. A 2000-es évek egyik új kutatási és fejlesztési iránya lett a plágiumkereső megoldások létrehozása.

A témához kapcsoló források közül kiemelném Horváth József (Pécsi Tudományegyetem BTK Angol Alkalmazott Nyelvészeti Tanszék) írását29 a plágium kezeléséről. A cikk bemutat egy felmérést, amely a plágiumhoz való hozzáállást vizsgálta a pécsi egyetem diákjai és tanárai körében. A szerző rámutat, hogy mind a tanároknak, mind az egyetemnek el kell azon gondolkodnia, hogy kellő segítséget adnak-e a diákoknak a képzés során az internetforrások helyes használatára. A diákok (digitális bennszülöttek) már beleszülettek egy olyan világba, melyben a világhálón komolyabb irodalomkutatást és feldolgozást mellőzve is találhatók „odakészített” dokumentumok. A képzés kezdetén olyan kompetenciák kialakítása lenne szükséges, melyek felkészítik őket a digitális világ etikus használatára. A plagizálás rossz példaként emlegetése helyett a hivatkozások helyes használatát és pozitív példákat kellene bemutatni, hisz a tudás magunk és mások számára is öröm. „Egy híres orosz esztéta, irodalomtörténész és nyelvész a negyvenes-ötvenes években mondta, hogy tulajdonképpen a világon minden mindennel összefügg, tehát nem igaz, hogy van olyan önálló gondolat, ami nem kapcsolódik ezer más korábbi gondolathoz, és ezeket nem is lehet mindig se idézőjelbe tenni, se a forrásra visszautalni, mert sokszor már magad sem tudod, hogy ez a gondolat nem a tiéd. A hatalmas tudásodba ezek úgy beleépülnek, hogy nem tudod, hogy ezt nem te találtad ki eredetileg, és nincs is ilyen. Ezért a plágiumnál mindig az egyszerű, formális részt tudjuk ellenőrizni.”30

Jegyzetek

  1. Országos Széchényi Könyvtár honlapja http://www.oszk.hu [Letöltés ideje: 2013. 12. 14.]
  2. MACZÁK Ibolya: „Nem lopjuk azt, amit örökségül vettünk a mi régi atyáinktól” : kompilálás és excerpálás a magyarországi barokk kori prédikációkban. [PhD értekezés] Piliscsaba : Pázmány Péter Katolikus Egyetem, 2008.            
    http://mek.oszk.hu/08400/08405/08405.pdf [Letöltés ideje: 2013. 12. 14.]
  3. SPRANITZ Gergely: Digitális tartalmak szerzői jogi védelme online környezetben. 1. rész = Iparjogvédelmi és Szerzői Jogi Szemle, 2. [112.] évf. 2007. 3. sz. június, 32–33. p.
  4. YouTube honlap:
    https://support.google.com/youtube/answer/2797370?hl=hu  
    [Letöltés ideje: 2013. 12. 14.]
  5. SENKEI-KIS Zoltán: Az internetes szerzői jog és annak könyvtári vonatkozásai. Doktori disszertáció tézis.                     
    http://doktori.btk.elte.hu/lit/senkeikiszoltan/tezis.pdf  [Letöltés ideje: 2013. 12. 14.]
  6. SPRANITZ Gergely i. m. 32–33. p.
  7. SENKEI-KIS Zoltán i. m.
  8. YouTube honlap:       
    ld. 4.  hivatkozás.
  9. PATAKI Máté: KOPI Online Plágiumkereső és Információs Portál 
    http://eprints.sztaki.hu/3427/2/200404_Networkshop2004.pdf [Letöltés ideje: 2013. 12. 14.]
  10. Turnitin: White Paper – The sources in student writing. 
    http://pages.turnitin.com/sources_in_writing_sec_2012.html [Letöltés ideje: 2013. 12. 14.]
  11. PATAKI Máté: A new approach for searching translated plagiarism. Budapest : MTA SZTAKI, 2012.
    http://eprints.sztaki.hu/6539/3/20120712_PlagiarismConfe rence_NewApproachForSearchingTranslatedPlagiarism.pdf [Letöltés ideje: 2013. 12. 14.]
  12. Turnitin: White Paper – The plagiarism sprectrum : instructor insights into the ten types of plagiarism.   
    http://pages.turnitin.com/plagiarism_spectrum.html [Letöltés ideje: 2013. 12. 14.]
  13. HOLMES, David I.: The evolution of stylometry in humani­ties scholarship = Literary and Linguistic Computing,
    vol. 13. 1998. no.3. 111–117. p.
    http://llc.oxfordjournals.org/content/13/3/111.full.pdf  [2013. 12. 14.]
  14. PATAKI Máté: KOPI Online Plágiumkereső és Információs Portál.
    http://eprints.sztaki.hu/3427/2/200404_Networkshop2004.pdf  [Letöltés ideje: 2013. 12. 14.]
  15. PATAKI Máté–VAJNA Miklós–MAROSI Csaba Attila: Wikipedia as text = Ercim News. Special theme: Big Data. vol. 89. 2012. 48–49. p. http://eprints.sztaki.hu/6552/2/201204_ErcimNews_WikipediaAsText.pdf [Letöltés ideje: 2013. 12. 14.]
  16. Kopiwiki honlap. http://kopiwiki.dsd.sztaki.hu/ [Letöltés ideje: 2013. 12. 14.]
  17. Wikipédia Creative Commons license http://en.wikipedia.org/wiki/Creative_Commons_license [Letöltés ideje: 2013. 12. 14.]
  18. Origo SZTAKI Szótár Labor honlap. http://szotar.sztaki.hu/lab [Letöltés ideje: 2013. 12. 14.]
  19. PATAKI Máté: KOPI plágiumkereső a digitális tartalmak védelmében            
    http://eprints.sztaki.hu/3427/2/200404_Networkshop2004.pdf  [Letöltés ideje: 2013. 12. 14.]
  20. Plagiarism honlap. http://www.plagiarism.org/ [Letöltés ideje: 2013. 12. 14.]
  21. Crossref honlap. http://www.crossref.org/ [Letöltés ideje: 2013. 12. 14.]
  22. Turnitin honlap, sajtóközlemény: Turnitin introduces translated matching for multilingual plagiarism detection: innovative technology identifies translated reuse of English source materials.       
    http://pages.turnitin.com/rs/iparadigms/images/Turnitin_RELEASE_TranslatedMatching_ENGLISH.pdf [Letöltés  ideje: 2013. 12. 14.]
  23. Google honlap. http://www.google.com [Letöltés ideje: 2013. 12. 14.]
  24. Viper ingyenes plágiumkereső honlap. http://www.scanmy essay.com/ [Letöltés ideje: 2013. 12. 14.]
  25. Viper ingyenes plágiumkereső honlap. http://www.scanmy essay.com/features.php  [Letöltés ideje: 2013. 12. 14.]
  26. Plagiarism Detect honlap. http://www.plagiarismdetect.com/ [Letöltés ideje: 2013. 12. 14.]
  27. Check For Plagiarism honlap. http://www.checkforplagiarism.net/ [Letöltés ideje: 2013. 12. 14.]
  28. Check For Plagiarism honlap. http://checkforplagiarism.net/free-vs-paid-checking.html [Letöltés ideje: 2013. 12. 14.]
  29. HORVÁTH József: „A szakmai közösségeknek tudnia kell ezekről a problémákról” : a plágium kezelése a magyar egyetemi gyakorlatban = Iskolakultúra, 22. évf. 2012. 7–8. sz. 96–110. p.
  30. HORVÁTH József i. m. 104. p.

    Beérkezett: 2013. december 18.