Kategórie
Rozhovory

S Ondrom o Ondrovi

Ondro je nová slovenská syntéza reči, ktorú môžete použiť v každom operačnom systéme. Hlas jej prepožičal skutočný človek Ondrej Rosík. Čo jeho a ešte ďalších k natrénovaniu Ondra viedlo? Ako vôbec vznikal?

Audio verzia článku

Za všetkým je nedostatok prirodzených hlasov

RHVoice je projekt rečových syntéz v rôznych jazykoch s otvoreným kódom. To znamená, že doňho môže ktokoľvek prispievať. Väčšina hlasov je zadarmo, hoci objavujú sa už aj tie platené. Za projektom stojí Olga Yakovleva, nevidiaca programátorka z Ruska.

RHVoice vznikol najmä preto, že viacerí nevidiaci používatelia čítačov obrazovky pociťovali nedostatok kvalitných prirodzene znejúcich rečových syntéz pre menej rozšírené jazyky, ktoré by sa nepokúšali slová vyslovovať správne bez ohľadu na ich skutočný význam. Za všetkých spomeňme Rečové služby od Googlu, ktoré v najnovšej verzii odsekávajú začiatky a konce slov, alebo Lauru od Vocalizer TTS, ktorá si „domýšľa“ napr. význam skratiek (Jan = január), alebo použije anglickú výslovnosť na slovenské slovo (gate = gejt).

Proces tvorby rečovej syntézy cez RHVoice

Syntéza sa vytvára v dvoch fázach. Najprv je potrebné definovať pravidlá jazyka. Napríklad hlas musí vedieť, kedy vysloviť ďe, ťe, ňe, ľe a kedy tvrdo, de, te, ne, le. Určujú sa všetky používané zvuky v reči, teda samohlásky a spoluhlásky. Tu tiež definujete napríklad spodobovanie. Teda to, že namiesto „sme“ chceme vyslovovať „zme“.

V druhej fáze sa zostaví súbor, v ktorom sú na každom riadku kúsky textu. Ide o vety, ale niekedy sú to len časti viet alebo samostatné slová. Každý riadok potom musí niekto načítať, teda vzniká zvuková nahrávka konkrétneho hlasu. Na základe týchto textov a nahrávok sa hlas trénuje, naučí sa, ako znejú samohlásky, spoluhlásky, ale aj ich kombinácie.

Ak by ste napríklad v texte vynechali výskyt písmena g, RHVoice ho nebude vedieť vysloviť.

Slovensko má vlastný vývojársky tím

Na hlase Ondro Ondrej nepracoval sám. Ako hovorí: Sám by som to skutočne nedokázal spraviť. Trénovanie hlasov RHVoice je možné robiť v Linuxe, čo je pre mňa úplne neznáme prostredie. Na toto sa podujal Peter Vágner, ktorý tiež definoval pravidlá jazyka. Vyžadovalo si to takisto značné úsilie, lebo sa musel naučiť jazyk Foma, ktorý sa na to používa.

Pomohol tiež Zvonimir Stanečić z Chorvátska, ktorý jazyky študuje a má už skúsenosti s vývojom hlasov pre iné jazyky. V prvotnej fáze Ondra testovali len niekoľkí ľudia. Marek Macko navrhol vylepšenia zvuku a množstvo zlepšení, pokiaľ ide o výslovnosť. Peter Nedorost aktuálne pomáha s úpravami pre JAWS, cennými radami tiež prispel aj Peter Lecký.

Technická a časová náročnosť

Na otázku ohľadom nárokov na čas Ondro odpovedal: Aktuálne máme skoro tri hodiny zvukových nahrávok. K tomu treba pripočítať čas na ich spracovanie, nepodarilo sa mi tiež vždy nahrať text na prvý pokus. Petrovi Vágnerovi tiež zabralo niekoľko hodín študovanie pravidiel. Prebehlo niekoľko online stretnutí so Zvonimirom. Časová náročnosť teda nie je zanedbateľná.

Na vytvorenie nahrávok je dobré mať kvalitné vybavenie, Ondrej využil Zoom H1N. Nahrával doma, ako štúdio mu poslúžil bunker z diek a matracov. Toto riešenie priznáva svojej manželke Ivke. Hovorí: V našom byte sa totiž dosť ozýva a keby som nahrával povedzme niekde v kuchyni, ozvena by sa prejavila aj v samotnom hlase.

Ak by ste mali záujem sa na tvorbe hlasu podieľať, toto treba určite zvážiť. Nestačí sadnúť si do obývačky, zobrať mobil so slúchadlami a nahrávať. Aby výsledok stál za to, je potrebné mať dobré technické aj priestorové zázemie.

Koľko hlasov v slovenčine máme?

Zatiaľ je na použitie pripravený len hlas Ondro. Tým, že už sú definované pravidlá jazyka, tím okolo Ondra vie rýchlejšie vytvoriť aj nové hlasy. Pokusne nahrali nejaké vzorky hlasu Ondrejovej manželky.

Ondrej k tomu dodáva: Po zverejnení hlasu Ondro sa ozvalo pár ľudí, ktorý by chceli hlas vytvoriť. Uvidíme, či budú mať dostatok trpezlivosti. Určite by sme uvítali nejaký ženský hlas. Výhoda je, že ak opravíme výslovnosť konkrétneho slova, vieme to urobiť naraz pre všetky dostupné hlasy, hoci niekedy je potrebné nanovo spustiť trénovanie.

A čo na Ondra hovorí Ondro?

Predstavte si, že prídete ku kamarátovi na návštevu a z počítača na vás prehovorí váš vlastný hlas. Ale ešte horšie, chcete si prečítať e-mail a počujete z mobilu sami seba. Pýtala som sa, aký to je pocit.

Nebudem klamať, je to super pocit. Ani nie tak to, že Ondro už na vás vyskočí z chladničky, ale skôr fakt, že sa to podarilo a že máme slovenský použiteľný hlas zadarmo. Na začiatku nás motivovalo hlavne to, že aktuálne hlasy znejú síce pekne, ale často zbytočne nesprávne vyslovujú slová. Nedarilo sa nám komunikovať s vývojármi, nedošlo k zlepšeniu, skôr naopak. Samozrejme, je v tom aj kus zábavy. Pamätám si na také nedeľné ráno, keď mi Peťo Vágner poslal prvú nahrávku. To bolo v systéme len okolo sto nahrávok. Ale už som si povedal, že super, to znie ako Ondro.

Ondrej svoj hlas aj sám používa a testuje, no predovšetkým v telefóne. Dokonca tvrdí, že stále nie je zo seba unavený. Ale áno, testujem a neunavuje ma to. Však kto už môže povedať, že si sám sebe číta napríklad správy? Niekedy robím aj to, že keď chce Ivka vedieť, koľko je hodín, len odomknem telefón, však Ondro jej to už povie. Ja som zvyknutý počúvať svoj hlas. Pracujem v rádiu, stále strihám nejaké svoje nahrávky. Ale je pravda, že sa mi nepozdáva predvolená výška, ja si ho nastavujem hlbšie. Všímam si však, že ľudia ho bežne používajú v štandardnej výške.

Ak by ste si pri používaní všimli nejaké nedostatky, hláste ich vývojárom na e-mail hlas@ondrosik.sk

Ondro je už takmer všade

Hlas je možné inštalovať do smartfónov s operačným systémom Android. Slúži na to aplikácia RHVoice dostupná v Obchode play. V nej stiahnete hlas a nastavíte ho ako predvolený hlas systému.

Vo windowse je možné nainštalovať Ondra do rozhrania Sapi5 a používať ho napríklad v JAWSe, Balabolke alebo hociktorej aplikácii. Tiež existujú doplnky pre NVDA. Inštaluje sa ovládač pre RHVoice a potom samotný hlas.

Používatelia Linuxu si dokážu hlas skompilovať. V pláne je aj verzia pre IOS. Samotná aplikácia už existuje, ešte sa čaká na implementáciu.

Odporúčam pozrieť si stránku Hlas.ondrosik.sk, kde nájdete podrobnejšie inštrukcie, ako hlasy sťahovať, inštalovať, ale aj nahrávať vzorky pre trénovanie.

Budeme za hlasy platiť?

Určite nie, Ondro bude stále zadarmo. Páni o spoplatnení vôbec neuvažovali. Aktuálne už majú ľudia aj tak k dispozícii takú verziu, ktorá postačuje, a neboli by motivovaní kupovať si nejakú novšiu. Ondrej dodáva: Aj ostatné hlasy máme aktuálne v pláne robiť bezplatne. V zahraničí sú prípady hlasov, ktoré sú síce spoplatnené, no priznávam, že neviem, ako presne je to riešené, a hlavne ako je hlas chránený proti kopírovaniu. Naším cieľom nebolo mať z tohto projektu zisk. Venujeme sa mu vo voľnom čase, zároveň ale všetci hlasy viac či menej používame, čiže je to taká naša srdcovka.

Ako som hovorila v úvode, RHVoice je opensource. Takže nie je vylúčené, že napríklad komerčná firma môže použiť pravidlá, ktoré už existujú, vytvoriť hlas a spoplatniť ho.

Čo dodať na záver?

Snáď len poďakovanie za snahu, ochotu a nadšenie všetkým ľuďom, ktorí sa podujali vytvoriť kvalitný a prirodzený hlas, ktorý lahodí uchu, a navyše hovorí správne po slovensky. Ja sama Ondra používam pri čítaní elektronických kníh v čítačke Bookworm a už by som ho nevymenila.

Navyše Ondro je 1 z mála hlasov, ktorý reálne pomôže ľuďom prechádzajúcim na čítač obrazovky. Odpadá im obrovský stres z toho, že hlasom ako napríklad Espeak nerozumejú.

S detailnými otázkami o Ondrovi sa obráťte, prosím, na Ondra, a to aj v prípade, že by ste chceli byť ďalšími, ktorých hlas sa bude šíriť počítačmi, mobilmi, čítačkami a ktovie čím všetkým.

Ak sa chcete spojiť so mnou, môžete na Facebooku, Twitteri, e-mailom alebo do komentárov pod článkom. Som taktiež na sociálnej sieti LinkedIn.

Nezabudnite sa prihlásiť na odber newslettera Zo sveta prístupnosti.

Chcem odoberať newsletter

* označuje povinné položky


Začiarknutím potvrďte

Z odberu sa môžete kedykoľvek odhlásiť kliknutím na odkaz v päte e-mailu. Informácie o ochrane osobných údajov nájdete po kliknutí na stránku Zásady ochrany osobných údajov.

Na prihlásenie sa k odberu newslettera používam službu Mailchimp. Kliknutím na tlačidlo Prihlásiť potvrdzujete, že vaše údaje budú odoslané Mailchimpu na spracovanie.Viac zistíte tu (anglicky).


Jedna odpoveď na “S Ondrom o Ondrovi”

Dobrý den 100% souhlas taky ten hlas používám. Konečně si můžu vybírat mezi dvěma mužskými hlasy Ondro a Zdenek. Je to příjemná změna od toho že všechny telefony mluvili jen ženský hlasem. Takže už se dá krásně rozlišit když mluví telefon a nebo hodinky.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Táto webová stránka používa Akismet na redukciu spamu. Získajte viac informácií o tom, ako sú vaše údaje z komentárov spracovávané.