Číslicové spracovanie reči

  Cieľom predmetu je, aby študent nadobudol prehľad a porozumenie technológiám používaným v oblasti spracovania reči. Po úspešnom absolvovaní predmetu sa študent naučí špecifické vlastnosti rečových signálov v čase a frekvencií a bude schopný používať základné parametrizácie signálu na jeho analýzu ako: prechody nulou, autokorelácia,AMDF, banky filtrov, LPC model reči, MFCC koeficienty a ich modifikácie. Bude vedieť realizovať jednoduché systémy spracovania reči typu rozpoznanie a verifikácie hovoriaceho, rozpoznanie reči, syntéza reči, kompresia reči, a to s využitím nasledovných techník: K-NN, VQ, GMM, DTW, HMM a NN. Okrem teoretických poznatkov. Študent získa aj praktické skúsenosti s používaním spomenutých metód na reálnych dátach, ktoré sa dajú použiť aj v iných oblastiach.

  Stručná osnova predmetu

  1. Úvod do spracovania reči a aplikácie spracovania reči.
  2. Vlastnosti rečových signálov v čase a frekvencií.
  3. Základné parametrizácie rečových signálov.
  4. Modely tvorby reči LPC analýza.
  5. Banky filtrov, psychoakustické frekvenčné mierky.
  6. MFCC koeficienty a ich modifikácie.
  7. Vektorová kvantizácia.
  8. Gaussov zmesový model.
  9. Rozpoznávanie reči: Dynamické programovanie, algoritmus DTW.
  10. Rozpoznávanie reči: Diskrétne skryté Markovove modely.
  11. Rozpoznávanie reči: Spojité skryté Markovove modely.
  12. Rozpoznávanie reči : Založené na Neurónových sieťach.

  Podmienky absolvovania predmetu

  • Aktívna účasť na cvičeniach, úspešné odovzdanie semestrálneho zadania a úspešné absolvovanie skúšky.
  • Celková známka na skúške bude odvodená od bodového vyjadrenia nasledovne:
  • Cvičenia 40 bodov (semestrálne zadanie 40 bodov), minimálny počet bodov pre pripustenie na skúšku je 20 a je podmienený max. 2 ospravedlnenými absenciami.
  • Písomná skúška 60 bodov.
  • Minimálny celkový počet bodov pre absolvovanie predmetu je 56.

  Odporúčaná literatúra a zdroje

  Základné:

  • PSUTKA, J. Komunikace s počítačem mluvenou rečí. Praha : Academia, 1995.
  • KOTULIAKOVÁ, J. – ROZINAJ, G. Číslicové spracovanie signálov 1. Bratislava : Vyd. FABER, 1996. 163 s. ISBN 80-967503-2-1.

  Odporúčaná:

  • E. Keller, Fundamentals of Speech Synthesis and Speech Recognition, John Wiley&Sons, 1994
  • G. Rozinaj, J. Polec, J. Kotuliaková, P. Podhradský, A. Marček, S. Merchevský a kolektív : Číslicové spracovanie signálov II, FABER Bratislava, 1997
  • X. D. Huang, Y. Ariki, M. A. Jack, Hidden Markov Models for Speech Recognition, Edinburg university press, 1990