Více než sto let po kolonizaci téměř zanikl jazyk Ainu. Dnes mu ale naslouchají stroje, které zkoumají hodiny starých nahrávek – a učí se mu dát nový hlas.
Kazetový přehrávač zachytil cívky a spustil magnetickou pásku. Nejprve se ozvalo jen slabé šumění – a pak se celým pokojem rozlil hlas jejích předků.
Pohádky, které Maya Sekine slýchávala před spaním, byly výjimečné. Její otec jí vybíral pestré příběhy, nahrané na starých páscích, které vyprávěly tradiční ainské bajky. Všechny byly proneseny jazykem jejích původních předků – Ainů. Tato domorodá komunita žila na severních ostrovech dnešního Japonska už od 12. století, než je pohltil japonský stát.
Jako dítě měla Sekine nejraději příběh o vlku z Hokkaida, který zpíval. Příběh měl melodickou strukturu – střídaly se v něm ainské zpívané fráze a štěkot připomínající zvířecí hlas.
Ve škole ale její kamarádi ainsky nerozuměli. A i když její máma a prarodiče znali pár frází, většinou mluvili japonsky. Ostatní dospělí už jazyk neovládali vůbec. Sekine si začala uvědomovat, že jazyk – a s ním i celá kultura její rodiny – pomalu mizí.
„Jazyk je pro nás to nejdůležitější,“ říká. „Je to spojení mezi naší kulturou a hodnotami.“
Rodilých mluvčích ainštiny dnes zůstává jen pár. UNESCO jazyk zařazuje mezi kriticky ohrožené. Podle dostupných záznamů mluvilo v roce 1870 – tedy rok poté, co byla oblast Ezo (dnešní Hokkaidó) připojena k Japonsku – nějakou variantou ainštiny asi 15 tisíc lidí. Většina z nich přitom neovládala žádný jiný jazyk. Vládní politika, včetně zákazu užívání ainštiny ve školách, ale vedla téměř k úplnému vymizení jazyka i kultury. Už v roce 1917 se počet mluvčích odhadoval jen na 350 a od té doby dále klesal.
Přesto se dnes dá mluvit o jistém návratu ainštiny. V roce 2019 Japonsko poprvé oficiálně uznalo Ainy jako původní obyvatele země. Nový zákon zahrnoval i kroky na podporu jejich většího zapojení a viditelnosti ve společnosti. A právě jazyk se stal jedním z hlavních cílů současných projektů – včetně těch, které využívají umělou inteligenci. Existuje tak reálná šance, že se ainština udrží i pro příští generace.
Sekine se narodila a vyrůstala v městečku Nibutani na Hokkaidu, kde má podle odhadů až 80 % obyvatel ainštinské kořeny. I tam je však znalost jazyka mizivá.
„Myslím, že naše rodina je výjimečná,“ říká. „Moje máma je Ainka a její rodina je známá svým tradičním řemeslem. A můj táta – Japonec – učí ainštinu.“
Dnes je Sekine něco přes dvacet a sama provozuje YouTube kanál věnovaný běžné konverzaci v ainštině.
„Vím, že mám velké štěstí,“ dodává.
Ačkoli se během let ztratila spousta jazykových jemností, část znalostí přetrvala – podle jejího otce, Kenjiho Sekineho, například existuje více než 80 různých způsobů, jak v ainštině popsat medvěda. Jazyk podle něj odráží hluboký vztah komunity k přírodě a úctu ke všem živým bytostem.
„V ainském pojetí je všechno, co není člověk, kamuy – tedy duch nebo bůh. Některá zvířata tak nesou přímo označení kamuy, například kimunkamuy (medvěd) nebo horkewkamuy (vlk),“ vysvětluje.
Přestože je ainština uznávaná jako druhý národní jazyk Japonska, na školách v Hokkaidu se nevyučuje.
„Žáci nemají žádnou možnost poznat ainskou kulturu ani jazyk,“ říká Hirofumi Kató, profesor archeologie a ředitel Globální stanice pro studium původních obyvatel na Hokkaidské univerzitě. „Vzdělávací systém dál upevňuje jednolitý obraz japonské historie a kultury.“
Tento jednostranný výklad minulosti podle něj znesnadňuje Ainům pochopení vlastních kořenů a hledání identity v dnešním Japonsku. I když zájem o ainskou kulturu v posledních letech roste – například díky zobrazování Ainů v populárních mangách – objevují se i případy kulturního přivlastňování a nepochopení.
Sekine přiznává, že během dospívání na ni doléhal obrovský tlak na zachování kulturní identity – natolik, že své ainštinské kořeny během školních let skrývala. Až na univerzitě získala odvahu plně přijmout své původní dědictví a začít aktivně propagovat ainskou kulturu. Dnes patří k mladé generaci Ainů, kteří se snaží nově definovat, co znamená být Ainem v 21. století.
„Jazyk je pro nás klíčový. Je to spojení mezi naší kulturou a našimi hodnotami,“ říká. „A rodina taky. Máme velkou rodinu, každý večer se scházíme k večeři. To jsou hodnoty, které patří k Ainu.“
Přestože dnes existuje jen velmi málo rodilých mluvčích, zachovalo se bohaté ústní dědictví v podobě nahrávek. V posledních letech se badatelé začali těmto archivům věnovat s cílem vdechnout jazyku nový život.
„Díky naší technologii je tenhle proces z velké části automatizovaný. Momentálně máme k dispozici 300 až 400 hodin záznamů,“ říká Tacuja Kawahara, profesor informatiky na Kjótské univerzitě, který vede projekt využívající technologii rozpoznávání řeči k uchování ainské mluvy. „Kvalita nahrávek není ideální – většina byla pořízena na analogová zařízení, často doma, kde byl hluk. Je to opravdu výzva.“
S podporou státního financování využil Kawahara se svým týmem přibližně 40 hodin nahrávek takzvaných uwepeker – tradičních vyprávěných příběhů v próze – od osmi mluvčích. Tyto materiály jim poskytlo Národní muzeum Ainu v Upopoy a Kulturní muzeum Ainu v Nibutani. Celý archiv obsahuje přibližně 700 hodin zvukových záznamů, z nichž většina je na klasických kazetách – tedy podobně jako pohádky, které slýchávala Sekine jako malá.
V roce 2015 zahájila Agentura pro kulturní záležitosti digitalizaci těchto nahrávek pro výzkumné a vzdělávací účely. Iniciativa s využitím AI začala o tři roky později. Klasické systémy automatického rozpoznávání řeči se většinou učí z obrovských datových souborů, které jim pomáhají pochopit pravidla daného jazyka. To ale u ohrožených jazyků jako ainština není možné – chybí dostatek výchozích dat. Proto výzkumníci sáhli po tzv. end-to-end přístupu, který umožňuje systému učit se převádět řeč na text bez předchozí znalosti jazyka.
Tým nyní vyvíjí i syntézu ainské řeči – tedy systém, který umí převést text do mluvené podoby pomocí AI. Doposud se jim podařilo vytrénovat umělou inteligenci tak, aby napodobovala mluvčí, kteří poskytli více než 10 hodin nahrávek. Systém už zvládl vytvořit i zvukovou podobu dvou příběhů – Příběh o medvědovi, zapsaný v 50. a 60. letech 20. století, a Sestra boha hromu, zapsaný v roce 1958. Právě druhý jmenovaný příběh byl převeden do zvukové podoby a předán muzeu v Upopoy, které jej využívá pro výuku herců při představeních.
Pro laika zní výsledná nahrávka – hlas starší ženy s přirozenými pauzami a drobnými intonačními změnami – překvapivě věrohodně. Jen občas je slyšet, že mluva je trochu rychlejší, než by byla u člověka.
„Doufám, že taková umělá inteligence může pomoct lidem na Hokkaidu – ať už potomkům Ainů, nebo mladým lidem – s učením jazyka,“ říká profesor Kawahara.
Podle něj by technologie mohla jednou sloužit například pro vytvoření virtuálních avatarů – jakýchsi ainských jazykových asistentů, kteří by pomáhali při výuce. Tým plánuje do budoucna zaznamenat i další ainské dialekty a pracovat nejen se starými nahrávkami, ale i s novými nahrávkami mladých mluvčích.
Otázkou ovšem zůstává, nakolik je takový systém přesný. Podle výzkumníků dosahuje současná verze systému úrovně překladu srovnatelné se studentem vyššího stupně studia ainštiny. U některých mluvčích se rozpoznávání slov pohybuje kolem 85% přesnosti. U jednotlivých hlásek (fonémů) se AI trefuje až v 95 % případů – to však platí pro známé mluvčí. U neznámých osob se stejným dialektem přesnost klesá na 93 %, a u jiných dialektů až na 85 %.
Maya Sekine ale k takové technologii přistupuje opatrně. Pochybuje, že by AI zvládla mluvit autenticky – a obává se, že by mohla šířit špatné výslovnosti nebo další chyby. Podobné obavy měli zpočátku i další členové komunity, které Kawaharův tým oslovil.
„Lidé měli strach, že technologie vytvoří falešnou řeč, nebo že se bude šířit dezinformace,“ říká Kawahara.
Ti, kteří projekt podpořili, však pomohli s ověřováním kvality přepisů i syntetického hlasu – a také s kontrolou původních nahrávek.
„Je těžké říct, co si o tom projektu přesně myslím,“ říká Sekine. Na jednu stranu by podle ní technologie mohla zvýšit povědomí o jazyku, „ale Ainuové musí znát jazyk, aby sami poznali, co je falešné. Řekla bych, že je důležitější mít živá data a ověřovat je.“
Sekine si proto sama pořizuje nahrávky ainských příběhů, které vyprávějí její babička a další starší obyvatelé Nibutani.
Její otec Kenji Sekine se do AI projektu sám zapojil. Pomáhal týmu profesora Kawahary shánět nahrávky. Ačkoliv sám není Ainu, začal se učit saruský dialekt ainštiny poté, co se v roce 1999 přestěhoval do Nibutani a začal pomáhat své ženě s dětskou jazykovou třídou. Nakonec převzal vedení kurzu a učí ainštinu dodnes.
„Je to moje životní práce,“ říká. „Chci, aby se jazyk naučilo víc lidí. Myslím, že ten projekt je dobrá věc.“
Během návštěv výzkumníků v Nibutani spolu místní s vědci vařili rýžové knedlíčky a zúčastnili se také Kenjiho pravidelných lekcí, kam dochází více než tucet dětí ve věku od 7 do 15 let. Výuka probíhá v kruhu, je živá a využívá metodu Te Ataarangi – výukový přístup zaměřený na mluvení a vizualizaci, který vyvinuli Maoři na Novém Zélandu.
Ainové navíc tvoří i nová slova – například výraz imeru kampi, který kombinuje pojmy „blesk“ a „dopis“, a označuje e-mail.
„Naším problémem teď je, že máme málo nahrávek běžné konverzace. Poslední člověk, kterého jsme označovali za rodilého mluvčího, zemřel před 20 lety,“ říká Kenji Sekine.
Udržení jazyka je pro komunitu očividně důležité – ale za jakou cenu? Maya Sekine přemýšlí, zda budou data, na kterých se AI učí, vůbec veřejně dostupná.
David Ifeoluwa Adelani, odborník na jazyky s omezenými zdroji a asistent profesora na McGill University v Kanadě, upozorňuje, že výzkumníci musí s komunitou budovat důvěru a být transparentní.
„V některých případech revitalizace jazyků dochází k situaci, kdy někdo přijde, sesbírá data a pak je zpátky prodává komunitě,“ vysvětluje Adelani. „Je důležité získat souhlas a jasně dohodnout, jak budou data využita.“
To je obzvlášť citlivé téma pro Ainy, protože jejich kultura byla v Japonsku často komodifikována a zneužívána pro zisk – v turistice, médiích i obchodu, připomíná Sekine. Hrozba dalšího zneužití je pro Ainy reálná, zvlášť když jejich území bylo kolonizováno japonským státem. Po staletí jim bylo zakázáno rybařit a lovit, takže mnoho Ainů muselo přežívat jako zemědělci nebo levně placení dělníci.
Oficiální statistiky o počtu Ainů v Japonsku dnes neexistují, ale průzkum z roku 2023 provedený prefekturou Hokkaido ukázal, že 29 % Ainů zažilo diskriminaci – což je nárůst o 6 % oproti předchozímu průzkumu z roku 2017. Místní média navíc informují, že Ainuové vydělávají méně než průměrná populace a mají vyšší riziko nestabilního zaměstnání.
Adelani zdůrazňuje, že je etičtější školit samotné členy komunity, jak s nástroji pracovat a jazyk oživovat, místo aby výzkumníci jen přicházeli a sbírali data.
„Pracujeme s velmi malými komunitami v Kamerunu, protože chtějí sami na svých jazycích pracovat. Proto je důležité školit místní,“ říká.
Ačkoliv někteří Ainové vítají zájem vlády o ochranu jejich domorodé kultury, kritici tvrdí, že úsilí nestačí k nápravě historických nespravedlností a k zajištění základních práv. Někteří dokonce považují Národní muzeum Ainu Upopoy, které uchovává i lidské pozůstatky Ainů, za pokračování japonských asimilačních politik.
„Upopoy působí jako další příklad, kdy Japonci prosazují svou moc nad Ainy,“ uvedla aktivistka Shikada Kawami krátce před otevřením muzea. „Nevím, kolik Ainů si vůbec uvědomuje, do jaké míry jsou stále zneužíváni.“
Podle Kawahary má Národní muzeum Ainu práva k původním datům využitým při vývoji AI systému, s vědomím a souhlasem rodin mluvčích. Laboratoř, kde AI vzniká, vlastní práva k samotnému systému.
Ale systém by bez dat nefungoval,“ poznamenává.
V ideálním světě by jazykové technologie měly vznikat „od mluvčích pro mluvčí“, zdůrazňuje Sara Hookerová, vedoucí Cohere for AI, neziskové výzkumné organizace, která spolupracuje na technologii s firmou Cohere. „Když mluvíme o vícejazyčných systémech s globálním dosahem, nejde jen o pokrytí jazyků, ale také o zachycení nuancí a každodenního užívání těchto modelů tak, aby lidem skutečně sloužily.“
Podobný názor má i Francis Tyers, poradce pro výpočetní lingvistiku v projektu Common Voice, který spravuje otevřenou databázi vícejazyčných řečových dat pod záštitou neziskové organizace Mozilla Foundation. Technologie pro rozpoznávání a generování řeči se podle něj vyvíjejí velmi rychle.
„Dnes vznikají AI systémy, které podporují stovky jazyků – což bylo před pěti lety téměř nemyslitelné,“ říká Tyers.
Dává příklad Španělska, kde řada systémů strojového překladu pro menšinové jazyky jako katalánština nebo baskičtina vzniká přímo členy těchto komunit.
V případech, kdy jsou rodilí mluvčí vzácní nebo už neexistují, může podle Tyerse pomoci zajistit, aby domorodé komunity měly kontrolu nad tím, jak jsou veřejné prostředky využity pro vývoj nástrojů na podporu jejich jazyka. Uvádí příklad projektu pro sámský jazyk. Sámi žijí v oblasti Sápmi, která zasahuje do severních částí Norska, Švédska, Finska a na poloostrov Kola v Rusku.
„Lidé ze sámské komunity, kteří jsou do projektu zapojeni, dělají i politická a finanční rozhodnutí,“ vysvětluje Tyers.
Snaha o lepší zastoupení Ainů pokračuje. Pro Sekine a jejího otce je nadějí, že v budoucnu bude více Ainů plynule mluvit svým jazykem a japonská společnost lépe porozumí a přijme tuto jedinečnou součást domorodého dědictví regionu.
A naděje existuje. Mladší generace například stále tvoří nová slova a fráze v ainštině, včetně výrazu „imeru kampi“. „Imeru“ znamená blesk a „kampi“ dopis – dohromady se tak zrodil ainuský termín pro „email“.
„Jazyk už nebude stejný jako v dávných dobách, ale to je v pořádku,“ říká Sekineův otec Kenji. „Každý jazyk je živý, plný života – a mění se.“
Zdroj: BBC News (bbc.com)
Napsat komentář