Cieľom predmetu je, aby študent nadobudol prehľad a porozumenie technológiám používaným v oblasti spracovania reči. Po úspešnom absolvovaní predmetu sa študent naučí špecifické vlastnosti rečových signálov v čase a frekvencií a bude schopný používať základné parametrizácie signálu na jeho analýzu ako: prechody nulou, autokorelácia,AMDF, banky filtrov, LPC model reči, MFCC koeficienty a ich modifikácie. Bude vedieť realizovať jednoduché systémy spracovania reči typu rozpoznanie a verifikácie hovoriaceho, rozpoznanie reči, syntéza reči, kompresia reči, a to s využitím nasledovných techník: K-NN, VQ, GMM, DTW, HMM a NN. Okrem teoretických poznatkov. Študent získa aj praktické skúsenosti s používaním spomenutých metód na reálnych dátach, ktoré sa dajú použiť aj v iných oblastiach.
Stručná osnova predmetu
- Úvod do spracovania reči a aplikácie spracovania reči.
- Vlastnosti rečových signálov v čase a frekvencií.
- Základné parametrizácie rečových signálov.
- Modely tvorby reči LPC analýza.
- Banky filtrov, psychoakustické frekvenčné mierky.
- MFCC koeficienty a ich modifikácie.
- Vektorová kvantizácia.
- Gaussov zmesový model.
- Rozpoznávanie reči: Dynamické programovanie, algoritmus DTW.
- Rozpoznávanie reči: Diskrétne skryté Markovove modely.
- Rozpoznávanie reči: Spojité skryté Markovove modely.
- Rozpoznávanie reči : Založené na Neurónových sieťach.
Podmienky absolvovania predmetu
- Aktívna účasť na cvičeniach, úspešné odovzdanie semestrálneho zadania a úspešné absolvovanie skúšky.
- Celková známka na skúške bude odvodená od bodového vyjadrenia nasledovne:
- Cvičenia 40 bodov (semestrálne zadanie 40 bodov), minimálny počet bodov pre pripustenie na skúšku je 20 a je podmienený max. 2 ospravedlnenými absenciami.
- Písomná skúška 60 bodov.
- Minimálny celkový počet bodov pre absolvovanie predmetu je 56.
Odporúčaná literatúra a zdroje
Základné:
- PSUTKA, J. Komunikace s počítačem mluvenou rečí. Praha : Academia, 1995.
- KOTULIAKOVÁ, J. – ROZINAJ, G. Číslicové spracovanie signálov 1. Bratislava : Vyd. FABER, 1996. 163 s. ISBN 80-967503-2-1.
Odporúčaná:
- E. Keller, Fundamentals of Speech Synthesis and Speech Recognition, John Wiley&Sons, 1994
- G. Rozinaj, J. Polec, J. Kotuliaková, P. Podhradský, A. Marček, S. Merchevský a kolektív : Číslicové spracovanie signálov II, FABER Bratislava, 1997
- X. D. Huang, Y. Ariki, M. A. Jack, Hidden Markov Models for Speech Recognition, Edinburg university press, 1990