Číslicové spracovanie reči

    Cieľom predmetu je, aby študent nadobudol prehľad a porozumenie technológiám používaným v oblasti spracovania reči. Po úspešnom absolvovaní predmetu sa študent naučí špecifické vlastnosti rečových signálov v čase a frekvencií a bude schopný používať základné parametrizácie signálu na jeho analýzu ako: prechody nulou, autokorelácia,AMDF, banky filtrov, LPC model reči, MFCC koeficienty a ich modifikácie. Bude vedieť realizovať jednoduché systémy spracovania reči typu rozpoznanie a verifikácie hovoriaceho, rozpoznanie reči, syntéza reči, kompresia reči, a to s využitím nasledovných techník: K-NN, VQ, GMM, DTW, HMM a NN. Okrem teoretických poznatkov. Študent získa aj praktické skúsenosti s používaním spomenutých metód na reálnych dátach, ktoré sa dajú použiť aj v iných oblastiach.

    Stručná osnova predmetu

    1. Úvod do spracovania reči a aplikácie spracovania reči.
    2. Vlastnosti rečových signálov v čase a frekvencií.
    3. Základné parametrizácie rečových signálov.
    4. Modely tvorby reči LPC analýza.
    5. Banky filtrov, psychoakustické frekvenčné mierky.
    6. MFCC koeficienty a ich modifikácie.
    7. Vektorová kvantizácia.
    8. Gaussov zmesový model.
    9. Rozpoznávanie reči: Dynamické programovanie, algoritmus DTW.
    10. Rozpoznávanie reči: Diskrétne skryté Markovove modely.
    11. Rozpoznávanie reči: Spojité skryté Markovove modely.
    12. Rozpoznávanie reči : Založené na Neurónových sieťach.

    Podmienky absolvovania predmetu

    • Aktívna účasť na cvičeniach, úspešné odovzdanie semestrálneho zadania a úspešné absolvovanie skúšky.
    • Celková známka na skúške bude odvodená od bodového vyjadrenia nasledovne:
    • Cvičenia 40 bodov (semestrálne zadanie 40 bodov), minimálny počet bodov pre pripustenie na skúšku je 20 a je podmienený max. 2 ospravedlnenými absenciami.
    • Písomná skúška 60 bodov.
    • Minimálny celkový počet bodov pre absolvovanie predmetu je 56.

    Odporúčaná literatúra a zdroje

    Základné:

    • PSUTKA, J. Komunikace s počítačem mluvenou rečí. Praha : Academia, 1995.
    • KOTULIAKOVÁ, J. – ROZINAJ, G. Číslicové spracovanie signálov 1. Bratislava : Vyd. FABER, 1996. 163 s. ISBN 80-967503-2-1.

    Odporúčaná:

    • E. Keller, Fundamentals of Speech Synthesis and Speech Recognition, John Wiley&Sons, 1994
    • G. Rozinaj, J. Polec, J. Kotuliaková, P. Podhradský, A. Marček, S. Merchevský a kolektív : Číslicové spracovanie signálov II, FABER Bratislava, 1997
    • X. D. Huang, Y. Ariki, M. A. Jack, Hidden Markov Models for Speech Recognition, Edinburg university press, 1990