SuperLectures.com

MODEL-BASED COMPRESSIVE SENSING FOR MULTI-PARTY DISTANT SPEECH RECOGNITION

Full Paper at IEEE Xplore

Robust ASR

Přednášející: Afsaneh Asaei, Autoři: Afsaneh Asaei, Hervé Bourlard, Volkan Cevher, Idiap Research Institute / Ecole Polytechnique Federale de Lausanne, Switzerland

We leverage the recent algorithmic advances in compressive sensing, and propose a novel source separation algorithm for efficient recovery of convolutive speech mixtures in spectro-temporal domain. Compared to the common sparse component analysis techniques, our approach fully exploits structured sparsity models to obtain substantial improvement over the existing state-of-the-art. We evaluate our method for separation and recognition of a target speaker in a multi-party scenario. Our results provide compelling evidence of the effectiveness of sparse recovery formulations in speech recognition.


  Přepis řeči

|

  Slajdy

Zvětšit slajd | Zobrazit všechny slajdy

0:00:22

  1. slajd

0:01:06

  2. slajd

0:01:31

  3. slajd

0:01:57

  4. slajd

0:02:54

  5. slajd

0:04:07

  6. slajd

0:05:32

  7. slajd

0:05:45

  8. slajd

0:07:10

  9. slajd

0:08:28

 10. slajd

0:09:47

 11. slajd

0:10:45

 12. slajd

0:11:52

 13. slajd

0:12:34

 14. slajd

0:13:22

 15. slajd

0:14:10

 16. slajd

  Komentáře

Please sign in to post your comment!

  Informace o přednášce

Nahráno: 2011-05-26 17:35 - 17:55, Panorama
Přidáno: 15. 6. 2011 19:18
Počet zhlédnutí: 43
Rozlišení videa: 1024x576 px, 512x288 px
Délka videa: 0:18:54
Audio stopa: MP3 [6.00 MB], 0:18:54