System rozpoznawania mowy
Napisane 08.11.2020 przez admin
Tagi: rozpoznawanie-mowy, oprogramowanie, sztuczna-inteligencja, it, głosowe-wprowadzanie-tekstu, transkrypcja-na-żywo, pisanie-głosowe, komputer-neuronowy, komputer-kwantowy, super-komputer, zakupy-online, e-commerce, smartfon, google, speech-texter,

Rozpoznawanie mowy czyli systemy sztucznej inteligencji. Czy komputery naprawdę myślą?
W przeciwieństwie do sposobu postępowania z danymi wprowadzanymi poprzez klawiaturę, komputer odczytujący informacje głosowe musi przeprowadzić złożone procesy analityczne. Na podstawie prawdopodobieństwa ustala on wówczas, co użytkownik przypuszczalnie powiedział. W pierwszym etapie analizy komputer rejestruje dźwięk w postaci cyfrowej sekwencji audio i dzieli go na fragmenty o milisekundowej długości. Następnie działające w tle oprogramowanie porównuje te sekwencje z zapisanymi wzorcami mowy. Odpowiednia jakość wzorcowej bazy danych jest najważniejszym warunkiem sprawnego działania mechanizmu rozpoznawania mowy. Baza ta zawiera fragmenty głosu wielu osób mających zróżnicowane właściwości mowy: intonację, dialekt, akcentowanie głosek i wymowę. Ten element techniki rozpoznawania mowy określany jest mianem systemu niezależnego od mówcy. Systemy rozpoznawania mowy korzystają dodatkowo z techniki identyfikacji fonemów, czyli najmniejszych dźwiękowych jednostek mowy. Tę samą literę wypowiada się bowiem w różnych wyrazach inaczej. Podczas fazy treningowej oprogramowanie poznaje najważniejsze cechy fonemów wymawianych przez użytkownika i zapisuje te dane w indywidualnym profilu mówcy. Jest więc bardzo ważne, aby w trakcie późniejszego dyktowania użytkownik utrzymywał na możliwie niezmiennym poziomie melodię i sposób wymowy. Uzupełnienie mechanizmu rozpoznawania mowy stanowią podstawowe reguły zależności kontekstowych. Istnieje wysokie prawdopodobieństwo, że po określonym wyrazie użyta zostanie tylko pewna liczba innych słów, aby zdanie miało jakiś sens. Posiadacze telefonów komórkowych znają tę technikę z wiadomości SMS, gdzie podczas wprowadzania tekstu smartfon automatycznie proponuje odpowiednie słowo. Dzięki połączeniu różnych metod rozpoznawania mowy możemy zatem odnieść wrażenie, że programy analizujące głos naprawdę rozróżniają słowa wypowiedziano przez użytkownika. Jednak jak do tej pory wszystkie systemy sztucznej inteligencji to nadal tylko algorytm zaprojektowany do wykonywania określonych czynności - np. uczenia się, jednak trudno tu mówić o "sztucznej inteligencji" - to określenie raczej ma charakter marketingowy i nie ma nic wspólnego z prawdziwym organizmem, który sam decyduje o wszystkim.
Poprzedni artykuł: | Imprezy i przyjęcia. Planowanie i organizacja są kluczowe |
Następny artykuł: | Polecamy sprawdzony antywirus komputerowy! |