Bátori István: Uráli Etimológiai Adatbázis: Mit tud az Uralotéka?

By admin 2015-06-02

Uráli Etimológiai Adatbázis: Mit tud az Uralotéka?

Az Uráli Etimológiai Adatbázis (Uralotéka/Uralothek) Rédei Uráli Etimológiai Szótárának (a továbbiakban UESz) számítógépre áttelepített megfelelője, amely az Interneten két cím alatt is elérhető: http://uraloteka.nytud.hu/ -címen Budapesten és http://uralothek.uni-koblenz.de:8080/Uralothek/pdom/basis.html -címen Koblenzben. A következőkben szeretném röviden bemutatni az Uralotéka célját, keletkezését és szerkezetét.

Az Uralotéka célja

Az Uralotéka a modern számítás- és kommunikációs technikát akarja az uráli nyelvészetben hasznosítani. Közelebbről a finnugor kutatást akarja támogatni, jobb hatásfokúvá tenni és egyidejűleg a finnugor nyelvrokonságot szélesebb körben is tudatosítani. A számítástechnika bevonulása a mindennapi életbe, az üzletvezetésbe, a tudományos kutatásba annyira elterjedt, hogy a finnugrisztika sem izolálhatja magát a papírra való nyomtatáshoz való ragaszkodással, még akkor sem ha az átállás a megindulásnál egy bizonyos számítástechnikai ismeretminimum elsajátítását jelenti. Ha a finnugrisztika „versenyképes” akar maradni, nem hagyhatja a számítástechnikai támogatás lehetőségét kihasználatlanul.

Az Uralotéka keletkezéséről: Az adatok felvitele

Amikor 1992-1996-ban a MTA Nyelvtudományi Intézetének munkatársai Csúcs Sándor kezdeményezésére, (Molnár Zoltán, Oszkó Beatrix, Salánki Zsuzsa, Sipos Mária, Falk Nóra és Fejes László) az Uralotéka felépítésének első lépéseit megtették és az UESz anyagát géppel olvashatóvá tették, nem követtek valami előre kidolgozott tervet. Sokkal inkább kockázatvállalásról volt szó.

Az UESz-ben használatos nyelvek ékezetes betűinek száma (cc.600-800; betű) meghaladta a közkeletű írógép billentyűzetének terjedelmét. A háromkötetes szótár géppel olvashatóvá tétele óriási munka volt: Nemcsak az UESz poliglott, rövidítésekkel teli anyagát kellett betűhíven géppel olvashatóvá tenni, hanem ki kellett találni egy átírást a szótárban használatos nyelvek ékezetes betűinek a betáplálására.

Az adatfelvételezés a WORD-rendszer rtf formátumában írógéppel (kódolva) történt. A WORD-rendszer lehetővé tette az ékezetes betűk megjelenítését. Ki kell emelni, hogy az UEDb adatfelvétele nem lapolvasóval (szkennerrel) történt, ami akkor ugyan már létezett, de nem volt hozzáférhető a Nyelvtudományi Intézetben. Az adatok felviteléről a jyväskyläi 8. Finnugor kongresszuson 1995-ben Molnár Zoltán tartott egy bemutatót és egy (rövid) beszámolót, ahol elmondta, hogy az UESz komputerizálásának a célja egy „computerized dictionary” amihez később (talán) egy „word processing program” fog kapcsolódni és nem egy adatbázis (Molnár 1996:V:122). Az elhangzottak alapján úgy tűnt, hogy az UESz adatfelvételezői, de az UESz szerkesztői sem voltak tudatában, hogy a vállalkozásuk: egy hagyományos és nagy etimolológiai szótárat átállítani elektronikus tárolásra, világszerte az első ilyen kezdeményezés. Viszont tény, hogy az UESz anyagának géppel olvashatóvá tétele megnyitotta az etimológiai anyag további gépi kiaknázásának az útját még akkor is, ha az UESz akkori munkatársai elsősorban csak a szövegszerkesztők (például a WORD) közvetlen előnyeit látták és nem az azon túlnyúló perspektívákat. A WORD mint szövegszerkesztő meg tudta ugyan jeleníteni az ékezetes betűket, de a WORD szövegek nem (vagy csak körülményesen) voltak hozzáférhetők más szövegszerkesztő rendszerekben.

A jyväskyläi kongresszusi bemutató után Bátori érintkezésbe lépett az UESz főszerkesztőjével, Rédei Károllyal és az MTA Nyelvtudományi Intézetének akkori igazgatójával, Kiefer Ferenccel és felajánlotta nekik, hogy egy kooperációs program keretében a Koblenzi Egyetem Számítástehnikai Karának CL-intézetében transzformálja az UESz géppel olvasható szövegszerű anyagát adatbázissá, ami lehetővé teszi az etimológiai anyag sokrétű használatát.

Az adatbázis felépítése

1998. január 29-én volt egy megbeszélés Rédei Károllyal Bécsben az Egyetem Finnugor Szemináriumában, ahol megszületett a kooperáció az MTA Nyelvtudományi Intézete és a Koblenz-Landaui Egyetem Számítástechnikai-Nyelvészeti Intézete között. A megbeszélésen részt vettek Rédei Károly (vendéglátóként), Bakró-Nagy Marianne, Honti László és Bátori István. A kooperáció az UESz etimológiai anyagának jobb hozzáférhetőségére, az RTF-formátumú anyag adatbázissá való átalakítására irányult. Rédei számára különösen fontos volt a copyright kérdése, a szótár anyagának változatlan (egy-az-egyhez való) átvétele és az hogy az etimológia anyag ne kerüljön illetéktelenek kezébe. Bátori (és a koblenziek) számára központi kérdés volt az interdiszciplináris „challenge”: közvetíteni a számítástechnika és az uralisztika között és felépíteni az első – a világon első – etimológiai adatbázist.

A géppel olvasható adatok adatbázissá való átalakítása Bátori István irányításával Koblenzben történt a Koblenz-Landaui Egyetem Számítástechnikai-Nyelvészeti Intézetében 1997 és 2002 között. A munkát a tudóscsereprogram („Projektbezogenen Personenaustausches mit Ungarn”) is támogatta. Az adatbázissá való átalakítás támaszkodott az UESz-ben már meglevő, de szigorúan még nem formalizált etimológiai és lexikológiai kategóriákra, mint szócikk, forrásnyelv, (-nyelvjárás), kútfő/forrás stb. és átalakította azokat egységes, koherens és az egész UESz anyagát átfogó szerkezetekké.

Problematikus volt a redundancia elkerülésére törekvő szótárszövegnek az adatbázis mezőire való leképzése. Az rtf-formátum a felszíni megjelenítésre vonatkozott és nem a megjelenítendő nyelvi kategóriákra. Az rtf-formátumban nem az volt megadva, hogy hol van szóalak, vagy a jelentés, hanem hogy hol kezdődik a dőlt betűs szegmentum és mi áll idézőjelben. A forrás- és a jelentés megadása a redundancia elkerülése érdekében arra épült, hogy a jelölés hiányában a megelőző nyelvbeli (nyelvjárásbeli) meghatározás marad érvényben. Az idézőjelben álló szöveg nemcsak a jelentéseket tartalmazta, hanem esetleges további magyarázatokat, másodforrásokat, változatokat stb.). Az rtf-rendszer az írásjeleket (vessző, kettőspont, idézőjel, zárójel stb.) használta a formátum jelölésére és ebből lehetett következtetni a szerkezetre, de az írásjelek értelmezése a környezettől függött.

A Nyelvtudományi Intézet munkatársai (Váradi Tamás, Molnár Zoltán, Csúcs, Sándor) több ízben jártak Koblenzben és munkájukkal, tanácsaikkal segítették a konverziót és az adatbázis felépítését. Két feladattal kellett megbirkózni:

Az rtf-szövegkódolást át kellett alakítani az adatbázis hierarchikus szerkezeteivé.
A szótár példaanyagának Unicode-kódolása, ami a 90-es években még úttörőnek számított, amit először külön ki kellett fejleszteni.

A Budapesti Uráli Műhely második tanácskozásán 1999-ben Bátori (1999:28) így fogalmazta meg az Urali Etimológiai Adatbázis célkitűzését:

„Az adatbázisrendszer célja az, hogy a tárolt anyagot sokoldalúan, hatékonyan és a felhasználóhoz alkalmazkodva tegye hozzáférhetővé.

Az adatok elérhetőségét a szerkezeti egységek szerinti tárolás (és a keresési technológia) biztosítja. Indextáblázatok segítségével minden mező és elemi adat közvetlenül megtalálható.
A kombinálhatóság természetesen összefügg az elérhetőséggel, de itt az a lényeg, hogy az adatbázis nemcsak az egyes mezők adatainak a felsorolását támogatja, hanem azok egybevetését és kiválasztását is. Idetartozik az adatok és a kombinálhatóságuk ellenőrzése is.
A felhasználóhoz való alkalmazkodás, a felhasználó igényeinek, adatszemléletének tekintetbevétele túlnyúlik a tároláson. …”.

Az rtf/xml-konverziót és az Unicode-betűk kifejlesztését a Koblenz-Landaui Egyetem informatika-szakos diákjai (Arne Fitschen, Krisztián Németh, Holger Puttkammer, Saliha Rabah) végezték el diplomamunkáikban Bátori szakfelügyelete alatt, amelyeknek az eredményei a ma működő adatbázisnak is szerves részei.

Az Unicode-kódolás és az ékezetes betűk

Az etimológiai szótárak rá vannak utalva a forráshűségre. Az univerzális Unicode kódolás keretében lehetséges minden uráli nyelv hangrendszerének (helyesírási rendszerének) torzítás nélküli visszaadása. Az Unicode-kódrendszer megkülönböztet 65 536 elemi jelet (betűt), amely gyakorlatilag lehetővé teszi minden írásjel megjelenítését beleértve a kínai és japán írásrendszert és a tipográfiai változatokat is (Courier, Times New Roman, Sans Serif stb.). Az Unicode ma általánosan használatos és így nem forog fenn az a veszély, hogy egy kutató olyan betűkkel, ékezetekkel dolgozik, amelyeket nem lehet megjeleníteni vagy kinyomtatni. Az Uralotékában az unicode jelek kaphatnak fonológiai értelmezést is.

Mivel az Unicode-betűk a 90-es években még nem voltak általánosan forgalomban, a Koblenzi Munkacsoport kifejlesztett belső használatra egy betűkészletet az UEDb-hez, amely maximálisan hasonlított az eredeti, az UEWb-ben használt „Times New Roman” betűkhöz. Így az Uralotéka az ékezetes betűk használatakor nem volt rászorulva külső támogatásra és minden elforduló uráli betűt vissza tudott adni.

Ezek a betűk a kódolási címtárban az un. „private use area”-ban voltak elhelyezve és tulajdonképpen az Uráli Etimológiai Adatbázis részei voltak. Ez azzal a következménnyel járt, hogy az Adatbázis telepítésekor a kódolást is át kellett venni (másolni) és bevezetni a fontok nyilvántartásába.

A saját készítésű kódolási eljárás (az akkor „Times New Roman Ural”-nak nevezett betűkkel) abból a feltételezésből indult ki, hogy az UEDb használója a rendszert saját gépre telepítve használja és így a betűkészletet csak egyetlen egyszer kell neki inicializálnia. A hálózati használat elterjedésével ez az elképzelés elavult és célszerűbb lett átállni az Unicode-rendszer „Combining Diacritical Marks”-funkciójára, amelynek segítségével a hálózatban elérhető fontokból lehet generálni az UEDb-ben szükséges mellékjeles betűket. Ez az eljárás mentesíti az Uralotéka használóit minden további rendszerprogramozói munkától. Az Uralotéka 2013 óta a „Gentium Plus” betűket használja és ezeket az alapbetűket egészíti ki az ékezetekkel.

A megjelenítő szoftver

A 2000-es tartui Finnugor Kongresszusra sikerült lezárni az rtf/xml-konverziót és kifejleszteni egy betűkészletet az UEDb anyagának a megjelenítésére, ami a Koblenzi Csoport számára sikernek számított, mert ez megfoghatóvá tette az adatbázist. A uráli betűkészlet nélkül ugyanis addig az adatbázisban csak a kódok jelentek meg és nem a betűk. De a konvertált szócikkek és az ékezetes betűk tényleges kibetűzése láthatóvá tette a konvertálás során elkövetett (és egyéb) hibákat is. Ezért a budapesti kollégáknak az UEDb-ben található hibák kijavítása tűnt a legsürgősebbnek. Bátorinak ill. a koblenzieknek inkább a megjelenítő szoftver volt fontosabb. A 2000-es tartui Finnugor Kongresszus után meglazult a kooperáció Budapesttel, de nem szűnt meg. Bátori, aki ekkor már nyugdíjban volt, kapott DFG-támogatást az UEDb további kiépítésére (DFG BA 332, Uralische Datenbank). Az állást Tapani Salminen tanítványa Jan Paakkanen kapta meg (2002-2004) és így sikerült a hibajavítást (ami ellen nem lehetett érvelni) valamelyest összhangba hozni a szoftver fejlesztéssel. Kritikus volt a sorozatosan visszatérő hibák felismerése, mert a megjelenítő szoftverben egy „elcsúszott” vessző vagy kérdőjel esetenként a szavak százait torzította el. Ezeknek a hibáknak a lokalizálása és kijavítása eredményesebb volt mint a hibavadászat a szöveg felszínén.

A megjelenítő szoftver szükségessége tudatos volt kezdettől fogva. Így például már Németh (2002) előkészítette az egész etimológiai anyagot felölelő fájl mellett az egyes címszavak egyedi tárolását. Elkészültek az ún. másodlagos kereső listák (forráslisták, egyedi nyelvi és nyelvjárási címszólisták), amelyek kompilálásában Paakkanenre hárult az a hálátlan feladat, hogy kiderítse a mi lehet a szóadat hiányzó forrása, vagy hogy például egy szelkup szó, amelynek a nyelvjárási hovatartozása hiányzik, melyik nyelvjárásból származhat. Voltak külön kereső programok regular expression formátumban, de hiányzott az összefogó szoftver-keret. Ezt a keretet sikerült Jerôme Dieboldnak a projekt-munkára támaszkodva diplomamunkájában megtalálni és kitölteni (Diebold 2005).

A szoftver-keret neve Uralotéka (németül Uralothek), amely felöleli a következő funkciókat:

Elöször is a megjelenítő rendszer generálásat, amibe beletartoznak nemcsak az összefoglaló UEDB.XML-fájl szócikkekre való feltörése, hanem további egyedi nyelvi keresőlisták előállítása is.
Az etimológia anyag általános, tartalomjegyzékszerű áttekintését
Az etimológiai anyag cikkenkénti megjelenítését
Különböző keresési módozatokat (nyelvpáronkénti -csoportonkénti szembeállítást, hangkörnyezet szerinti keresést, stb.)
Általános etimológiailag releváns uralisztikai információkat (idézett irodalom, nyelvjárási áttekintés, rövidítésjegyzék)
A megjelenítés és a keresés navigációs rendszerét.

Összefoglalva: A tulajdonképpeni adatbank UEDB.XML mellett van egy program-csomag, amely aktiválja az adatbankot. Az adatbank neve UEDb A program-csomag neve Uralotéka. Mivel a program-csomag tartalmilag üres és csak az adatbankkal együtt használható, az Uralotéka elnevezés magában foglalja az adatbázist is. Az adatbank (UEDb) Budapest és Koblenz közös munkájának az eredménye. A program-csomag (Uralotéka) koblenzi termék és a DFG-támogatás révén a DFG jogkörébe tartozik. Ez azt jelenti, hogy a német tudományos kutatás rendelkezésére kell hogy álljon (azaz nem lehet magán-copyright).

A 2010 óta működő hálózatbeli adatbázis tulajdonképpen szolgáltatás, amely biztosítja a adatok elérhetőségét, a szükséges software rendelkezésre bocsátását és a adatbázis folyamatos üzemeltetését. A szolgáltatás tartalmaz(hat) felújítást, revíziót, amely egyaránt érintheti a feldolgozó (szoftver) keretet és a tárolt adatokat.

A konverzió ellenőrzése és az egyenértékűség

A kooperáció során ismételten kitűnt, hogy a Nyelvtudományi Intézet Finnugor Osztályának mérvadó munkatársai számára továbbra is nyomtatott szöveg és az elektronikusan tárolt anyag egyenértékűsége volt a legfontosabb. A tárolt szöveg és az adatbázis közti alapvető különbség – úgy tűnt – elsikkadt. A szótárszerű használaton túl csak a statisztikai kiértékelés, táblázatok összeállítása váltott ki érdeklődést. 2005-ben Csúcs vette kezébe egy OTKA projekt keretében a korrektúrák lebonyolítását. Molnár Zoltán hasonlította össze az UESz betáplált szövegét szócikkről szócikkre az UEDb oldalaival. A munka lassan haladt, különösen miután Molnár kikerült a Nyelvtudományi Intézetből. Csúcs piliscsabai hallgatója Tánczos Orsolya folytatta a munkát, amit sikerült még 2010 nyarán a piliscsabai Finnugor Kongresszus előtt lezárni (Bátori 2010). Az RTF/XML-konverzió megkövetelte az eredmény ellenőrzését, de az anyagot csak akkor lehetett rendszeresen leellenőrizni, amikor kész lett az új betűkészlet. Az ellenőrzést célszerű volt úgy végezni, hogy az esetleges hibák eredetüktől függetlenül ki legyenek javítva:

A konverzió során azokat a sorokat, amelyekben a konverzió szempontjából volt valami tisztázatlanság (például, hiányzott a nyitó zárójel után a zárójel záró része) egyszerűen kihagytuk (átugrottuk, németül. „ki-kommentáltuk”). A legtöbb esetben ez betűket érintett, de néha nagyobb egységeket is. Így kb. 800 sor megcsonkult. Ezeket sorokat egyenként vissza kellett vezetni az eredeti helyükre.
Téves kódolások sorozatos hibákat okoztak. Ezeket rendszerint a tévedés felismerése után a kódolás szintjén egy egyszerű „change all” paranccsal ki lehetett javítani.
Az UEDb anyagának gépi kezelése lehetővé tette az UESz kódolási egyenetlenségeinek felismerését és eliminálását. Így például egységesítettük a rövidítéseket beleértve a forrásokra és az irodalomra való hivatkozást is.

Mindenképpen szükséges és hasznos volt a konvertált anyag leellenőrzése és a konverzációs (és egyéb) hibák kijavítása. Szükségtelen volt viszont a két álláspont szembeállítása, mert tulajdonképpen mind a két szemlélet – az egyenértékűséghez való ragaszkodás éppannyira, mint a technikai lehetőségek kihasználása – tartalmaz pozitív momentumokat. A Finnugor Osztály megkövetelte az egyenértékűséget, amelynek biztosítása nélkül az adatbázis használhatatlan. Az adatbázis tudományos szintje nem süllyedhet le / veszhet el a „komputerizálás” érdekében. Bátori álláspontja az adatbázis innovatív jellegének a hangsúlyozásával az ő informatikával való közelebbi kapcsolatán nyugodott és felkészített a kommunikációs paradigmaváltásra.

Az egyenértékűség és a továbbfejlesztés

Az UESz és az UEDb egyenértékűsége több vonatkozásban kétségbe vonható.

A leglényegesebb eltérés az, hogy az UESz egy statikus, nyomtatásban rögzített szöveg, az UEDb pedig egy dinamikus rendszer.
Az eltérések egy része formális adottság, mint például (- az UEDb-ben) a sorszámozás, a redundáns megjelenítés, a terjedelmes szócikkek tagolása (az alapszó és a származékok megkülönböztetésével), a felfedezett sajtó- és egyéb hibák kijavítása (illetve ezek hiánya — az UESz-ben).
Ugyancsak elképzelhető, hogy kivételesen akadnak esetleg az UEDb-ben szócikkek, amelyben egy transzliteráció vagy jelentésmegadás nem egyezik az UESz-szel.
Eltérő az UESz és az UEDb terjedelme is. Az UESz 1876 szócikket tartalmaz, amelyek felölelik az uráli, a finnugor, finn-permi, finn-volgai és az ugor etimológiákat. Az utóbbiak esetében azokat is amelyek csak az ugor nyelvekben vannak meg. De nem tartalmazza ezzel szemben a csak permi etimológiákat.
Az UEDb kiegészült Csúcs Sándor permi rekonstrukcióival, amelyek részben (546 esetben) csak a permi nyelvekben vannak meg. Így az UEDb (jelenleg 2015-ben) összesen 2422 szócikket tartalmaz.

Az Uralotéka mint egyszeri artefact:

Az anyag hitelessége: Az Uralotéka a hagyományos finnugrisztika módszereivel és tudományos megalapozottságával készült.
A gépi olvashatóság: Ha az etimológiákat javítani vagy kiegészíteni akarjuk, a gépi tárolás nagy segítség, mert nem kell az anyagot újra betáplálni.
Az univerzális Unicode kódolási rendszer használata lehetővé teszi az UEWb betűinek a maximális megközelítését.
A tárolt adatok adatbázisszerű (sorrendhez nem kötött) hozzáférhetősége: Az adatbázisban az etimológiai adatok közvetlenül elérhetők és nemcsak az olvasási sorrendben. Az adatokat meg lehet jeleníteni bármilyen kombinációban, kihagyással vagy kiegészítéssel stb. Így például az Uralotékában lehet megszorítással „lapozni”, például úgy, hogy a képernyőn csak azok a etimológiák jelennek meg, amelyekben van magyar, vagy zürjén tag.
A hálózati elérhetőség: Az Internet az Uralotékát világszerte elérhetővé teszi. Ez megkönnyíti és felgyorsítja a kommunikációt. A hálózati adatbázis nemcsak tárolt adathalmaz, hanem egy dinamikus rendszer, amely lehetővé teszi a hálózatban meglevő egyéb segédprogramok és eszközök használatát és a felújítást. Összefoglalásképpen el lehet mondani, hogy egy ilyen tudományos igényű, fonológiai megalapozottságú, egy egész nyelvcsaládot felölelő, hálózati adatbázis se az indogermanisztikában, se a turkológiában nincs.

Az elérhetőség

2010-ben Bátori átadta a konvertált és ellenőrzött adatbázist a Finnugor Osztálynak (Bátori 2011). A koblenzben „transzformált” adatbázishoz a Nyelvtudományi Intézetben készült egy SQL-en alapuló szoftver-csomag, amelynek segítségével az UESz/UEDb anyaga 2010 óta Budapestről az Interneten is elérhető: uralonet <http://www.uralonet.nytud.hu> néven . Ugyancsak elérhető (azonos adatokkal az eredeti XML-formátumú) Uralotéka Koblenzből is <http://uralothek.uni-koblenz.de:8080/Uralothek/pdom/basis.html> és Budapestről is <http://uraloteka.nytud.hu>

Irodalom

Rédei, Károly (Hg.): Uralisches Etymologisches Wörterbuch, (Band I-II: Unter Mitarbeit von Sándor Csúcs, István Erdélyi, László Honti, Éva Korenchy, Éva K. Sal und Edit Vértes, Band III: Register Zusammengestellt von Attila Dobó und Éva Fancsaly), Akadémiai Kiadó, Budapest (1986-1991) und Otto Harrassowitz, Wiesbaden (1988-1991).
Bátori, István – Németh, Krisztián – Váradi, Tamás: Computerwerkzeuge für die Sprachforschung: UEDB — Aufbau und Funktionen einer etymologischen Datenbasis für den uralischen etymologischen Wortbestand, Vortrag auf der 6. International Conference ‒ about the Use of Computers in Historical and Comparative Linguistics, Frankfurt a.M., 21.-24. October 1997 – Johann Wolfgang Goethe-Universität Frankfurt. In: Studia Iranica, Mesopotamica et Anatolica 3/1998 S. 3-14.
Bátori, István – Németh, Krisztián – Puttkammer, Holger: Lautrepräsentation in Etymologischen Wörterbüchern — anhand der Uralischen Etymologischen DatenBasis, in: Computer, Linguistik und Phonetik zwischen Sprache und Sprechen, (Tagungsband der 4. KONVENS-98, 5.-7. Oktober 1998 Universität Bonn), Hgg. Bernhard Schröder, Winfried Lenders, Wolfgang Hess und Thomas Portele, Peter Lang, Frankfurt am Main etc., 1998, S. 317-321.
Bátori, István – Németh, Krisztián – Puttkammer, Holger – Schäfer Dorothea: Multilinguale Ein- und Ausgabe am Beispiel der UEDb. Multilinguale Corpora — Codierung, Strukturierung, Analyse: Tagungsband der 11. GLDV-Tagung 1999 in Frankfurt a/M. Hgg.: Gippert, Jost and Petr Vavroušek, enigma, Prag 1999, 210-218.

Bátori, István S. – Csúcs, Sándor: Uralische Etymologische Datenbasis, in: Congressus Nonus Internationalis Fenno-ugristarum 7.-13.8. 2000 Tartu, Pars IV S. 113-121
Bátori, István: Az etimológiai szótár mint adatbázis, in: Budapesti Uráli Műhely II Budapest, MTA Nyelvtudományi Intézet 2001. S. 25-37
Bátori, István S.: Uralische Etymologische Datenbasis: Daten und Rekonstruktion, Vortrag auf dem 11. Finnougristenkongress. Published in :Congressus XI Internationalis Fenno-Ugristarum Piliscsaba 2010. Pars VI. Hgg. Sándor Csúcs, Nóra Falk, Viktória Tóth, Gábor Zaicz, Reguly Társaság, 2011. S. 9-15
Bátori, István S.: Az Uralotéka digitális adatbázis, Folia Uralica Debreceniensia 20. 2013 S. 3-22.
Bátori, István S.: Az Urali Etimológiai Adatbázis mint dokumentáció és mint az etimológiai kutatás eszköze, Debrecen, Magyar Nyelvjárások 52. (in print)
Csúcs, Sándor: Die Rekonstruktion der permischen Grundsprache, Akadémiai Kiadó, Budapest, 2005.
http://uralothek.uni-koblenz.de:8080/Uralothek/pdom/basis.html
Fitschen, Arne, Uralische Etymologische Datenbasis ‒ Eine Datenbank für die Uralischen Etymologien und ihre Anbindung ans INTERNET, Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, 1997.
Németh, Krisztián, Die virtuellen Tastaturen der Uralischen Etymologischen Datenbasis, Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, Studienarbeit, 1999.
Németh, Krisztián, XML Software für die etymologische Forschung – am Beispiel der UEDb, Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, Diplomarbeit, 2002.
Puttkammer, Holger, Die Erstellung der UEDb als XML-Datenbank unter Berücksichtigung der Integritätsbedingungen, Universität Koblenz-Landau, Fachbereich Informatik, Diplomarbeit, 2001.
Rabah, Saliha, Auswertung des Script-Felds im UEDb-System für die Erstellung von Dynamischen Font-Listen, Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, Studienarbeit, 2002.
Diebold, Jérôme, Formatierung der Kommentarteile in der UEDb-Datenbank Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, Studienarbeit, 2003.
Diebold, Jérôme, Verbesserung der Benutzerfreundlichkeit und der Funktionalität von elektronischen Wörterbüchern am Beispiel der Uralischen Etymologischen Datenbasis Universität Koblenz-Landau, Fachbereich Informatik, Koblenz, Diplomarbeit, 2005.

Bátori István

(Koblenz)