"Ivona" - polski syntezator mowy, który przemówił ludzkim głosem

Pomoc niepełnosprawnym w korzystaniu z komputera, ułatwienie nauki języków obcych i e-learningu, to tylko niektóre z zastosowań "Ivony" - nowoczesnego syntezatora mowy - zapewniali w Warszawie twórcy urządzenia Michał Kaszczuk i Łukasz Osowski z IVO Software.

Pierwsze syntezatory mowy powstały 20 lat temu. Miały pomagać osobom niepełnosprawnym, zwłaszcza niewidzącym, w korzystaniu z komputera. Jednak wydawane przez nie dźwięki tylko w niewielkim stopniu przypominały ludzką mowę.

Tymczasem - jak mówili na konferencji prasowej Kaszczuk i Osowski - powstała w 2005 roku "Ivona" emituje doskonałej jakości dźwięki. Kaszczuk zaznaczył przy tym, że aby syntezator przeczytał tekst ludzkim głosem musi mówić w danym języku, posługiwać się głosem konkretnej osoby i rozumieć tekst na tyle, by nadać mu odpowiednią interpretację.

Jak wyjaśnił Kaszczuk, pierwszym krokiem przy tworzeniu syntezatora jest przygotowanie modelu językowego. Trzeba zgromadzić ogromną liczbę różnego rodzaju zdań. "Przygotowujemy zdania z wielu różnych źródeł, bo teksty które odczytuje syntezator też są zróżnicowane. Korzystamy więc m.in. z informacji prasowych, literatury technicznej, książek" - wyjaśniał.

Kolejnym krokiem jest przygotowanie skryptu nagraniowego dla lektora, który w studiu nagrywa poszczególne zdania, nawet przez kilka dni. Kaszczuk zwrócił uwagę, że syntezator w tłumaczonych później tekstach przenosi niektóre cechy charakterystyczne lektora i mówi jego głosem. Teoretycznie - żartował - gdyby lektor seplenił syntezator robiłby później to samo.

Syntezator może też odczytywać zdania, które nie były wcześniej nagrane przez lektora. Odbywa się to przez sklejanie fragmentów wcześniej nagranych zdań. W analogiczny sposób może tworzyć również zupełnie nowe słowa.

"Ivona" może również odczytać tekst dostępny na stronie internetowej, w programie Word czy innego rodzaju programach - użytkownik musi go po prostu wprowadzić do systemu syntezatora.

"System zawiera różnego rodzaju programy, które pełnią rozmaite funkcje w zależności od potrzeby danego użytkownika" - tłumaczy Kaszczuk. Na przykład - za pomocą odpowiedniego programu - syntezator odczyta na ekranie komputera osoby niewidomej tekst- instrukcję umieszczony w okienku, a potem będzie służył za wirtualnego przewodnika po całym ekranie.

A jeśli mamy książkę w formacie PDF syntezator bez problemu ją odczyta. Wystarczy wówczas zaznaczyć wybrany fragment książki, skopiować go do programu "Ivona Player", który ten wybrany fragment tekstu odczyta. Po odsłuchaniu, można plik dźwiękowy np. zapisać w formacie MP3 i odtwarzać wielokrotnie.

Według twórców "Ivony", syntezator może być niezwykle przydatny w nauce języków obcych. Jeśli czytamy dany tekst np. w języku angielskim, a nie wiemy jak wymawia się dany wyraz, wystarczy go wrzucić do syntezatora, a on poda nam właściwą wymowę.

Kaszczuk i Osowski podkreślali że mechanizm, który odczytuje na głos zapisany tekst może być przydatny w wielu innych dziedzinach. Jedynie syntezatory umożliwiają odczytywanie na bieżąco zmieniających się treści. Dzięki temu są chętnie wykorzystywane w telekomunikacji i call center, mogą również odczytywać SMS-y, komunikaty w windach i systemach informacji pasażerskiej. Coraz częściej są też używane w prezentacjach multimedialnych i plikach audio umieszczanych na stronach internetowych.(PAP)


ostatnia zmiana: 2009-05-28
Komentarze
Polityka Prywatności