APLIKACE TN.CZ
Zpravodajství

Automatický zápis lidské řeči je zas blíž

Doba, kdy bylo třeba soudních zapisovatelek, pomalu končí. Výkonné čipy totiž stále zlepšují záznam mluveného slova.

Texty v češtině lze vytvářet už pouze diktováním do mikrofonu. Tuto zprávu přivítali všichni, kdo nemají rádi „datlování“.


Alternativa k psaní na klávesnici již bezmála dva roky významně usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, jednoho z výkonných systémů pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině.


Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.


Možnosti otevřely až nové čipy


Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost.


Čtěte také: Vyfoťte text. Mobil ho přeloží


„Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky,“ uvedl Petr Herian, šéf Newton Technologies.


Nové počítačové čipy, například Intel Core zroku 2010, pomáhají zvýšit výkonnost hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory to odpadá.


Zápis je stále rychlejší


V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.
 

Právě propojení s technologií, zejména s výkonem procesoru, považuje Petr Herian za určující faktor pro další rozvoj hlasových technologií.


„Systém pro češtinu je v současné době porovnatelný s ostatními jazyky, ale jeho možnosti dále vzrostou s další generací procesorů, které budou schopné poskytnout ještě vyšší výkon,“ říká Petr Herian, který odhaduje, že v ten moment přijde čas pro novou generaci hlasových systémů a technologií, uživatelsky ještě přizpůsobitelnějších, než jsou ty současné.


Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Heriana očekávat v horizontu 3–5 let.

adr, TN.cz

Co byste neměli přehlédnout

Důležité Události

Sledujte Televizní noviny bez reklam na Oneplay.cz