Rečové technológie

Rečové technológie sa v poslednom čase často používajú na riešenie problémov, s ktorými si predtým poradil len človek, takže dochádza k obrovským úsporám nákladov. Často sa však využívajú aj v prípadoch, keď ich nasadenie prinesie len zvýšenie používateľského komfortu, a teda istú konkurenčnú výhodu. Z futuristických predstáv sa stávajú užitoční pomocníci napríklad pri ovládaní mobilných zariadení, ale aj pri vyučovaní, spracovaní hlasového záznamu alebo pri vyhľadávaní v multimediálnom obsahu.

Hlasové vyhľadávanie

Komponent pre vyhľadávanie hlasom vznikol pre využitie v slovníkoch Lingea, avšak v kombinácii s ďalšími jazykovými technológiami sa stáva efektívnym nástrojom na vyhľadávanie v databázach a textoch v podmienkach, kde je hlasový vstup pohodlnejším riešením ako písanie na klávesnici. Túto technológiu možno kombinovať aj s prehľadávaním multimediálneho obsahu, tak vzniká systém, ktorý je rečou nielen ovládaný, ale v reči aj vyhľadáva.

Jazyková časť

Kombinuje rozpoznávač reči s technológiami pre fulltextové vyhľadávanie, prípadne synonymickým slovníkom alebo dokonca prekladačom. Výsledkom je jednoduché, ale silné vyhľadávacie rozhranie, ktoré sa jednoducho používa a pritom má výsledky porovnateľné s pokročilým vyhľadávaním využívajúcim písomné otázky.

Programové riešenie

Pre spracovanie sa typicky využíva online rozpoznávací server a náročné výpočty sa tak riešia vďaka dostatočne dimenzovanej infraštruktúre. Aplikáciu je teda možné využívať na takmer všetkých zariadeniach, vrátane tých, ktoré majú slabšie procesory a menšiu pamäťovú kapacitu (napríklad mobilné telefóny).

Prehľadávanie multimediálneho obsahu

Prehľadávanie multimediálneho obsahu je asi jedným z najefektívnejších využití rozpoznávania reči. Vďaka automatickému rozpoznávaniu textu nahrávok a ich indexácii dostanete prístup k informáciám v nahrávke bez toho, aby ste ju museli celú počúvať. To je obrovská úspora času, ak pracujete s väčším objemom zvukových záznamov. Ak máte k dispozícii takto spracovaný archív nahrávok, môžete nájsť aj informáciu, ktorá sa v danej nahrávke vyskytuje len okrajovo a podľa ručne zadaných kľúčových slov by ju preto nebolo možné dohľadať.

Jazyková časť

Táto technológia kombinuje rozpoznávač reči s fulltextovým vyhľadávaním doplneným jazykovými technológiami pre tvaroslovné vyhľadávanie, prípadne synonymickým slovníkom alebo prekladačom. Je možné ju kombinovať aj s hlasovým vyhľadávaním, čím vzniká systém, ktorý nielen vyhľadáva v reči, ale navyše je rečou aj ovládaný.

Programové riešenie

Na vyhľadávaných záznamoch prebehne - podobne ako pri všetkých rýchlych vyhľadávacích systémoch - najprv indexácia, a následne je možné v nich efektívne vyhľadávať.

Kľúčovým komponentom tejto technológie je rozpoznávač reči, ktorý prevádza zvuk na text (v prípade nejednoznačného výsledku rozpoznávania môže byť aj text nejednoznačný). Po ňom prichádza na rad spracovanie textu pred indexáciou (vytvorením registra – indexu), napríklad lemmatizácia (prevedenie slova na základný tvar) pre tvaroslovné vyhľadávanie, prípadne preklad do jazyka indexu, a nakoniec vlastné zapísanie do indexu, v ktorom následne program vyhľadáva podľa zadaných dopytov. Dopyty sa tiež spracúvajú, môže prebiehať napríklad lemmatizácia alebo expanzia tvarov (k jednému tvaru slova sa doplnia aj všetky jeho ostatné tvary, aby sa našli aj výskyty týchto tvarov, nielen tvaru zadaného), prípadne expanzia synoným alebo preklad do jazyka indexu.

Rozpoznávač je pomerne náročný na výpočtové prostriedky a jeho výpočtový výkon je potrebné stanoviť tak, aby bol schopný dostatočne rýchlo prevádzať novo indexované záznamy na text. Čas potrebný na spracovanie záznamu je zlomok času na jeho prehratie normálnou rýchlosťou. Vyšší počet jadier umožňuje spracovávať viac záznamov paralelne. Pre vyššiu záťaž je vhodné umiestnenie rozpoznávačov na špeciálne dedikované servery s vyhovujúcimi parametrami. Ostatné činnosti pri indexácii sú podstatne rýchlejšie. Pre vyhľadávanie pri veľkom zaťažení môže byť obmedzujúcim faktorom rýchlosť čítania z disku. Toto je možné riešiť napríklad použitím rýchlych, najlepšie SSD DISKOV, alebo ich zrkadlením na ďalšie disky, prípadne ďalšie vyhľadávacie servery.