Sinu brauser on natuke ajast maha jäänud. Et kõik töötaks, nagu vaja, palun uuenda enda brauserit.
Küpsised aitavad meil teenuseid edastada. Meie teenuseid kasutades nõustute sellega, et kasutame küpsiseid. ROHKEM INFOT >
Postimees 160 Juubeli puhul loe seda lugu tasuta!

Sakslanna uurib eesti keele pilte

KOMMENTEERI PRINDI ARTIKKEL
Saada vihje
Sakslannast foneetik Mareike Plüschke on üks vähestest välismaalastest, kes on end pühendanud eesti keele uurimisele. Naise sõnul pole välistatud ka võimalus hakata oma keeleoskust ja teadmisi rakendama tulevikus just Eestis. | FOTO: Margus Ansu

Foneetik Mareike Plüschke töö tulemusi saaks tulevikus rakendada eestikeelsete kõnetuvastusprogrammide arendamisel.

Kahesaja aasta eest kogus Karl Ernst von Baer materjali doktoritöö jaoks, mis rääkis eestlaste endeemilistest haigustest. Kakssada aastat hiljem laseb sakslane Mareike Plüschke 15 pärismaalasel mikrofoni kaudu arvuti sisse lihtlauseid lugeda.

«Pärast sügistöid polegi eestlastel miskit muud teha, kui pimedatel talveõhtutel end kurguauguni rasvast sealiha, mooritud hapukapsaid, musta leiba ning muud raskestiseeditavat kraami täis vitsutada, pääle üliohtrasti põletatud viina ja kanget koduõlut juua, pärast seda ent ühetoonilist laulujoru venitada ja veidramoelist jõnktantsu tammuda,» arutles Baer oma doktoritöös.

Heakene küll, Baer oli ise baltisakslane, aga miks peaks huvitama Müncheni ülikooli doktoranti kaugete eestlaste keel ja foneetika? Miks pean lugema poole tunni jooksul neid lihtlauseid kümnete ja kümnete kaupa mikrofonisse algul aeglaselt, siis kiiresti?

«Me leiame vaalu ju. Me nõuame vaalu ju. Me nõuame villu ju. Me leiame Villu ju. Me nõuame viilu ju. Me leiame viilu ju.» Ja nii edasi ja nii edasi. Sellist mängimist teise ja kolmanda vältega on nii palju, et kohati lähen isegi sassi.

Põnev keelepilt
Pärast ettelugemise lõppu üritan vajutada kõigi eesti keelt õppinud välismaalaste konnasilmale ja uurin Plüschkelt, mitu välteviga ta ettelugemise käigus ise tegi. «Lugesin selle kuus korda üle, aga ma ei tea, palju mul vigu oli – tegin seda üksi,» naerab Plüschke.

«Omastav ja osastav kääne on ikka kõige hullemad. Kui kuulen nimetavat käänet, ei pruugi ma teada, milline näeb välja omastav ja osastav.» Kolm väldet on siiski vähestes maailma keeltes ning see pakub välismaisele foneetikule iseäranis suurt huvi.

Nüüd näitab Plüschke rüperaali ekraanilt sonogrammi, mis on inimese jutu graafiline kujund. Selle pildi harutab ta omakorda lahti konsonantideks ja vokaalideks ning analüüsib ka nende kestust.

Mõne koha peal on jutu «foto» tumedam ja siis jälle heledam – nõnda leiab Plüschke häälikud üles. «Uurin põhitooni kontuure ja seda, kuidas on need seotud eesti keele väldetega. Kui räägime, on meil intonatsioon ehk põhitoon, mis on vahepeal kõrgem ja siis madalam,» selgitab ta.

Plüschke ei taha seekordse katse eesmärgist üleliia põhjalikult siiski rääkida. «Igal juhul on see seotud väldete, põhitooni kontuuri ja ka kõnetempoga,» poetab ta. «Minul on oma hüpotees, sestap lindistangi inimeste kõnet ja uurin, kas see hüpotees peab paika.»

Tegu on akadeemilise alus­uuringuga, mille täpsem sisu ja eesmärk ongi väga spetsiifiline. Ometi võiks see olla Plüschke hinnangul ka üks säärastest töödest, mida saaks tulevikus rakendada eestikeelsete kõnetuvastusprogrammide arendamisel.

Ja siin käib jutt juba arvuti või mobiiltelefoni võimest mõista inimkeelt. Kõikjal maailmas tegeletakse praegu sellega, et protsessoritega varustatud masinad suudaksid inimestega suhelda. Seni veel paistab arenguruum pea lõputu. «Kõne tuvastamiseks on vaja palju teada eesti keele intonatsioonist ja rõhkudest – sama teemaga tegelen ka mina,» selgitab Plüschke.

Eesti filoloogile sageli omistatavast märsilohistaja kuvandist on tema ettevõtmised igal juhul valgusaastate kaugusel. Õigupoolest ei saaks Plüschke oma doktoritöö eesmärke ilma arvuti ja sonogrammideta üldse sellisel kujul saavutada. Osa küsitletutest luges laused otse Plüschke arvutisse, suurem jagu tegi oma osa ära aga interneti kaudu.

Plüschke doktoritöö juhendajaks on Müncheni ülikooli foneetika ja digitaalse kõnetöötluse inglasest professor Jonathan Harrington. Doktoritöö üldisemaks eesmärgiks on õppida paremini tundma eesti keele prosoodiat ehk heli kõrgust, tugevust ja kestust.

Doktorikraad ootab
Ent siiski on paljude jaoks doktoritöö sisust ilmselt põletavam küsimus, miks peab Plüschke nägema säärast vaeva ühe väikerahva keelega, millel on kõigest miljon kõnelejat? Juba tema magistritöö tegeles eesti keele foneetikaga. «See on juhus,» tunnistab Plüschke.

«Tutvusin kunagi ammu ühe ungari perega, elasin aasta vabatahtlikuna Ungaris ja õppisin ka ungari keelt. Seejärel läksingi Müncheni ülikooli õppima foneetikat ning soome-ugri keeli.» Nõnda sattus Plüschke tudengite vahetusprogrammi käigus kaheksaks kuuks ka Eestisse ning see panigi paika, miks naine spetsialiseerus paljude soome-ugri keelte seast just nimelt eesti keelele.

Plüschke õppis mõnda aega ka soome keelt, aga ei saanud õppejõuga lihtsalt sama hästi läbi kui eesti keele õpetajaga. Lõppkokkuvõttes seob Plüschke ühe olulise eesti keelega tegelemise põhjuse ka oma meelelaadiga, mis igatseb pigem harva kui levinu järele. «Mulle meeldivad rohkem väikesed maad ja rahvad ehk see, mis pole nii tavaline. Hispaania keelt ei tahtnud ma eriti õppida, sest seda oskavad paljud!»

Münchenis on Plüschkel vaid kaks tuttavat, kellega ta saab eesti keeles kõneleda. Üks neist on Tartu Ülikoolist sellesama Jonathan Harringtoni käe alla doktoritööd tegema läinud foneetik Nele Salveste.
Kohapealsed tuttavad-sõbrad ei saa päris hästi aru, miks Plüschke eesti keelega jändab.

«Seda miks-küsimust küsisid nad juba siis, kui tegelesin ungari keelega,» räägib ta. «Aga Ungari puhul vähemalt teatakse, kus see asub. Eesti kohta küsitakse tihti – kus see on?» Aeg-ajalt ütleb Plüschke rahvuskaaslastele mõne eestikeelse lause, mis teeb neile nalja. «Minu jaoks on see ilus keel, aga neile teeb nalja näiteks sõnalõpp -eks.»

Plüschke tahab tuleval aastal doktorikraadi ära kaitsta. Seejärel tahab ta eesti keelega jätkata, ehkki ei kujuta veel päris täpselt ette, kuidas. «Kindlasti eesti keel, aga ma ei tea, kas tegelen siis eesti keele foneetikaga või asun tööle mõnes firmas, kus saan kasutada oma keeleoskust,» arutleb ta. «Igal juhul tahaks teha midagi, mis on seotud eestlaste ja/või ungarlastega.» Plüschke ei välista ka Eestisse tööle tulemist.

Akadeemiku ja Tartu Ülikooli eesti keele ajaloo ja murrete professori Karl Pajusalu sõnul on maailma ülikoolides kümmekond mitte-eestlasest teadlast, kes tegelevad eesti keele uurimisega hoolimata sellest, et neil endal puuduvad eesti juured.

Kõrvaltvaataja positsioon võib mõnel juhul olla ka plussiks – välisteadlased paigutavad eesti keele sageli laiemasse konteksti ja võrdlevad seda teiste keeltega. «Igal juhul on selliste teadlaste tegevus tervitatav kasvõi seetõttu, et eestlasi endid on ju vähe,» lausub Pajusalu.

Arvuteid vaevab kõne tuvastamise väljakutse

Tallinna Tehnikaülikooli küberneetika instituudi foneetika ja kõnetehnoloogia labori juhi Einar Meistri sõnul on Eestis jõutud kõnetuvastamise lahenduste vallas kaugemale kui mõneski lähiriigis, arenguruumi on meil aga ometi tohutult.

Kõne tuvastamine kujutab endast arvuti või telefoni võimet mõista inimese teksti. Alles sel juhul on teoreetiliselt võimalik inimese ja arvuti või – miks mitte – Michael Hasselhofi ja tema imeauto Kiti vaheline suhtlus.

Arvuti kõnelema õpetamine ehk kõne süntees pole võrreldes kõnetuvastusega kaugeltki nii keeruline kunst, säärased üsna hästi töötavad programmid on olemas ka eesti keelele.

«Kõneleja variatiivsus on aga väga erinev,» selgitab Meister. «Juba mehed-naised räägivad erinevalt, nende häälekõrgus on erinev. Kõnetuvastussüsteem peab olema võimeline aru saama väga paljude inimeste kõnest ja olema võimeline kohanduma erinevatele hääldusvariantidele.»

Uudis- ja unarsõnu kõnetuvastusprogrammid ei armasta, pigem eelistavad nad väga kokkuleppelist ja igasugustest murrete- ja slängivaba teksti.

Selleks et arvuti hakkaks kõnet tuvastama sarnaselt teise inimesega, peaks see hakkama ka samamoodi mõtlema, arenema ja sõnavara täiendama. Üleliia kõrge intellektiga tehisolendite suhtes tekib aga juba ohutunne. Ometi peab eestikeelset kõnetuvastust arendama kasvõi selleks, et meie keel ei jääks tulevikus ajale jalgu.

Meistri sõnul on eesti keelele praeguseks olemas mõned kõnetuvastuse demorakendused, ehkki igaõhtuste jutuajamisteni oma arvutiga jääb veel väga pikk maa käia. «Näiteks saab saata oma kõne wav-laiendiga failis ja vastu saate kirjutatud teksti,» selgitab ta.

«Saab ka sõnumeid Android-telefonis otse tsiteerida ja see muudetakse kirjalikuks tekstiks.» Ehkki need prototüübid teevad sõltuvalt rääkijast üksjagu vigu, pole sarnaseid lahendusi Meistri andmetel veel ei Lätis ega Soomes.

Kõnetuvastust rakendatakse Meistri sõnul edukalt ka teatud kitsastes valdkondades. «Näiteks on olemas radioloogidele mõeldud kõnetuvastussüsteemid,» selgitab Meister. Radioloog peab kirjeldama röntgenipilti, tema erialaterminoloogia on aja jooksul välja kujunenud ja kindlapiiriline.

«Oleme teinud radioloogidele ühe prototüübi ja saime enam kui 90-protsendilise tuvastuskorrektsuse. Radioloogidele avaldas see igal juhul muljet – nüüd on vaja programmi edasi arendada ja selge see, et lõpptulemuse kontrollib edaspidigi üle radioloog ise.»

Parimaid kõnetuvastuse alaseid tulemusi on maailmas seni saavutatud mõistagi inglise keeles, millel on palju kõnelejaid ning sedavõrd enam ka kõnetuvastuslahenduste arendajaid. Ometi pole inglise keeleski võimalik arvutiga suhelda nagu sõbraga. «Inglise keeles on võimalik dikteerida kirja või broneerida kõnetuvastuse kaudu lennupileteid,» ütleb Meister.

Eestikeelse kõne tuvastamise lahenduste väljatöötamisega kaasnevad Meistri kinnitusel võrreldes inglise või itaalia keelega oma erilised väljakutsed.

«Häda polegi niivõrd meie kolmes vältes, vaid keele ehituses – meil on praktiliselt piiramatu arv sõnavorme ja saame käänata, pöörata ning moodustada liitvorme,» räägib Meister, miks eestikeelne kõnetuvastus näiteks ingliskeelsest oluliselt keerulisem on. «See muudab erinevate sõnade hulga eesti keeles peaaegu lõpmatuks.»

Tagasi üles