A Chicagói Egyetem Számítástechnikai Tanszéken az ősi nyelvek lefordításán dolgoznak

Persepolis ősi városa a mai Iránban található. Az 1930-as években a Chicagói Egyetem Keleti Intézete régészeti expedíciót indított Persepolis ókori városába, ahol hatalmas mennyiségű agyagból készült táblára leltek a kutatók. A leletek feldolgozása azóta is tart, ám most az intézet és a Számítástechnikai Tanszék közötti együttműködés lehetővé tette, hogy gépi tanulási program segítségével gyorsabbá váljon a fordítás. 

A Keleti Intézet és a számítástechnikai tudósok együtt dolgozták ki a táblák lefordítására szolgáló programot.  

Huszonöt évszázaddal ezelőtt az Óperzsa Birodalom „alkotmányát” agyagtáblákon rögzítették, ezek tízezreit fedezték fel 1933-ban. Azóta a kutatók gondosan tanulmányozzák és folyamatosan fordítják le ezeket az ősi dokumentumokat, de a kézi megfejtési folyamat nagyon nehéz, lassú és tévedésekre ad alkalmat.  

- Hirdetés -

Az 1990-es évek óta a tudósok folyamatosan próbálkoztak számítógépes segítség bevonásával, korlátozott sikerrel. Ugyanis a táblák véseteinek háromdimenziós jellege és az egyedi karakterek összetettsége miatt nem létezett olyan technológia, ami hatékony megoldást nyújtott volna erre a problémára.  

De a Chicagói Egyetemen bekövetkezett technológiai áttörés úgy tűnik, végre lehetővé teszi az agyagtáblák tartalmának automatizált leiratozását, felkészítve ezzel a nyers adatokat a magasabb szintű régészeti elemzésre. Így rengeteg új információ tárul fel az Óperzsa Birodalom történetéről, a társadalomról és a nyelvről.  

A munkában régészhallgatók és az egyetem Számítástechnikai Tanszékének kutatói vesznek részt. Egy olyan modellt – a DeepScribe-ot – hoznak létre, amely a Persepolis Erődítmény archívumának több mint 6000 képből álló készletét használja fel, az Adat- és Számítástechnikai Központ finanszírozza, és amely „leolvashatja” a gyűjteményben lévő, még nem elemzett agyagtáblákat. Ezzel egy egészen új eszköz kerül a régészek kezébe, amelyet a későbbiekben más ókori nyelvek esetében is felhasználhatnak. 

A táblák leolvasását úgy tették lehetővé, hogy a Keleti Intézet által még Iránban készített fotókat, illetve a gyűjtemény egyéb elemeiről készült képeket egységesítették, majd egy gépi látási algoritmus tréninganyagaként használták. A képanyag több mint 60 terabyte-ot tett ki.  

A program jelenleg 80%-os pontossággal fordít, amit a kutatók a jövőben szeretnének még magasabb szintre emelni. Az is érdekes információnak számít, hogy mi a közös a fennmaradó 20%-ban, mi okozza ezekben az esetekben a pontatlanságot. 

Ambiciózus módon a csapat a DeepScribe-ot egy általános célú megfejtő eszközként képzeli el a jövőben, amelyet megoszthatnak más régészekkel is. Lehetséges ugyanis, hogy az alapmodell átképezhető az óperzsától eltérő nyelvekre, vagy javaslatokat képes tenni arra vonatkozóan, hogy milyen szövegek vesztek el a hiányos információkat tartalmazó forrásokból. A gépi tanulási modell segíthet meghatározni a táblák és más ismeretlen eredetű tárgyak eredetét is, bár ezt a feladatot jelenleg a kémiai tesztelés is megoldja. Az együttműködésben résztvevők azt is remélik, hogy eredményeik ösztönzően hatnak a jövőbeli partnerségre a Keleti Intézet és a Számítástechnikai Tanszék között a digitális régészet fejlődése érdekében. 

Hegyi Heni/NEW technology magazin

- Hirdetés -

- Hirdetés -

Akár ez is tetszhet