Geräuschreduktion f ür die robuste Spracherkennung

Konferenz: Sprachkommunikation 2006 - ITG-Fachtagung
26.04.2006 - 28.04.2006 in Kiel, Germany

Tagungsband: Sprachkommunikation 2006

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Breithaupt, Colin; Martin, Rainer (IKA, Ruhr-Universität Bochum, 44780 Bochum, Germany)
Schwarz, Jan (LNS, Christian-Albrechts-Universität, Kaiserstr. 2, 24143 Kiel, Germany)

Inhalt:
Wir stellen eine Geräuschreduktion auf Basis der Minimum-Mean-Square-Error-Schätzung (MMSE) im DFT-Bereich vor, die sowohl für Kommunikationsanwendungen als auch für die robuste Spracherkennung geeignet ist. Während für die Sprachkommunikation eine deutliche Geräuschreduktion und ein natürlich klingendes Restgeräusch von Bedeutung sind, wird die Filterung für die maschinelle Spracherkennung allein auf hohe Erkennungsraten optimiert. Deshalb wurden bisher für die beiden Anwendungsfälle verschiedene Lösungen eingesetzt. Die in der Sprachkommunikation eingesetzten DFT-basierten Verfahren sind jedoch auch für die maschinelle Spracherkennung geeignet, sofern die Varianz der geschätzten spektralen Koeffizienten reduziert wird.