Loading
jún 16, 2019

Mitől lesz egy nyelv fontosabb, mint a többi?

Az internet korában, ha nyelvi akadállyal találkozunk, rengeteg internetes forrás áll rendelkezésünkre, hogy megoldjuk: fordítóappok, netes szótárak, Wikipédia-oldalak idegen nyelvű verziói, na és persze az egyszerű, de nagyszerű Google-fordító.

A világon viszont mintegy 7000 nyelv létezik: ezek közül a top 10-et emberek százmilliói beszélik, de vannak olyanok is, melyet mindössze ezren. Ebből automatikusan feltételezhetnénk, hogy a nyelvek megítélése az alapján történik, hogy hányan beszélik: minél több beszélő, annál több forrás áll rendelkezésre a tanulásához, és annál nagyobb szerepet tölt be a világban.

Ez azonban nem így van. Bizonyos nyelvek sokkal egyenlőbbek más nyelveknél, és ennek megfelelően állnak rendelkezésre források a tanulásukhoz/fordításukhoz is. Az angol például nyilvánvalóan minden nyelvnél egyenlőbb, még ha a beszélőinek száma erre csak részben is ad okot, de mondunk pár más példát is: a svéd nyelvet kb. 9,6 millióan beszélik, azaz a beszélői száma alapján nem lenne túl fontos nyelv: mégis, a Wikipédia svéd nyelven rendelkezik a világ 3. legnagyobb cikkállományával, létezik a Google-fordító, sőt, még svéd nyelvű Facebook-, Bing- és Youtube-támogatás is van.

Ezzel szemben az orija nyelvnek, mely India egyik szövetségi államának, Orisszának a hivatalos nyelve, több, mint 38 anyanyelvi beszélővel, és kb. 20 millió nem anyanyelvűvel, még Google-fordítója sincs. Vagy vegyük az Etiópiában leggyakrabban beszélt oromót: bár közel 35 millió anyanyelvű beszélővel rendelkezik, a Wikipédia oromó nyelven mindösszesen 772 cikket tartalmaz (svédül 3 millió elérhető).

És akkor jöjjön a meglepetés: a magyar nyelv is azon nyelvek közé tartozik, melyet, bár alapvetően kevesen beszélnek, a beszélői számához képest nagy jelentőséget kap. De ilyen a görög, a cseh, és mint mondtuk, a svéd is: kevés beszélő (10-15 millió), mégis hatalmas internetes jelenlét és robosztus Wikipédia-források jellemzik őket.

Az ok részben az, hogy ezek a nyelvek az Európai Unió hivatalos nyelvei, ami azt jelenti, hogy rengeteg dokumentumot fordítanak emberi fordítók ezrei az Európai Parlament számára ezekről és ezekre a nyelvekre is. A gépi fordítók pedig mindig az emberi fordítások alapján dolgoznak: minél több (és minél több nyelvi rétegből származó) emberek által fordított dokumentum áll rendelkezésre, annál elismertebb lesz a nyelv is – ez az algoritmusok működésére vezethető vissza.

A másik ok, hogy pl. a cseh, svéd és magyar nyelv esetében is léteznek nemzetállamok és kormányok is, melyek egy viszonylag kis jelentőségű ország esetében is kénytelenek a könyvkiadást támogatni, nemzeti tévé- és rádióadókat alapítani, és legtöbbször állami szinten szabályozott nyelvi forrásokat (szótárakat, nyelvi törvényeket) létrehozni. Ez pedig nem mindegy: bár Bajorország gazdaságát tekintve fontosabb, mint Magyarország, mivel nem önálló állam, az ott beszélt alemann dialektus jellemzően a német egy alnyelvének van elkönyvelve, és – ahogy azt korábban írtuk – kihalóban van. De Bajorország a nevével ellentétesen nem ország, így nem is fektet olyan energiát a nyelve megőrzésébe, mint egy nemzetállam.

Szintén fontos az is, hogy az adott nyelv mennyi írni-olvasni képes beszélővel rendelkezik: hiába beszélnek egy nyelvet 50 millióan, ha ebből 80% analfabéta. A Wikipédia-cikkek ugyanis nem fogják önmagukat megírni (kivéve Svédországot, ahol már létezik egy bot, amely a természeti jelenségekre automatikusan létrehoz Wikipédia-fordításokat más nyelvekből.)

Amiket eddig írtunk, azok viszonylag logikus dolgok, létezik azonban még egy jelenség, mely igencsak besegít a nyelvek jelentőségének emelésében: ezek pedig a katasztrófák. Földrengések, hurrikánok, ciklonok, éhínségek, bozóttüzek: ahogy megtörténnek, emberek ezrei sietnek segíteni, és ahogy fellép a kommunikációs probléma, szépen lassan lejátszódik az a jelenség, mely egy nyelvnek alapvető világi jelenlétet ad: először az emberek által készített fordítások, feliratozott beszédek, stb., majd, ha ebből elég van, a botok által készítettek is. Bár nehezen lenne kimutatható, biztos, hogy a dunai hajókatasztrófa után javult a koreai-magyar nyelv közti automatikus fordítások szintje: hiszen az események miatt valószínűleg több cikket, tanulmányt kellett oda-vissza lefordítani, melyek aztán jó alapot adnak az algoritmusok működésének – bár nyilván nagyon nagy áron és egy szomorú esemény kapcsán.

Itt jön képbe az is, miért fontos, hogy egy nyelv, melyet sokan beszélnek, be legyen tagolva a nemzetközi áramlásba: hogy ha probléma van, közbe tudjunk avatkozni. Nyugat-Afrikában például az ebola többszöri kitörése a szuahéli, nandi és krió nyelvek megértését is nagyban segítette.

Azt persze nem lehet előre megjósolni, hogy mely nyelvek esetében lesz majd sürgős beavatkozásra szükség. Éppen ezért, a DARPA (Defense Advanced Research Projects Agency, azaz Fejlett Védelmi Kutatási Projektek Ügynöksége, az Egyesült Államok Védelmi Minisztériumának kutatásokért felelős részlege) jelenleg azon tevékenykedik, hogy olyan fordítóeszközt alkosson, mely akár egynyelvű szövegek alapján is képes fordításokat készíteni – egy katasztrófa esetén ez életeket menthet. Reméljük, sikerrel járnak!

Forrás: https://www.wired.com/story/google-translate-wikipedia-siri-widely-spoken-languages-cant-translate/