Akustische Synthese mit HMM-kodierten Inventaren
Conference: Sprachkommunikation 2010 - 9. ITG-Fachtagung
10/06/2010 - 10/08/2010 at Bochum, Deutschland
Proceedings: Sprachkommunikation 2010
Pages: 4Language: germanTyp: PDF
Personal VDE Members are entitled to a 10% discount on this title
Authors:
Strecha, Guntram (Technische Universität Dresden, Deutschland)
Abstract:
In diesem Papier ist die akustische Synthese mit HMMkodierten Diphoninventaren beschrieben. Am Beispiel eines deutschen Inventars mit 1175 Diphonen sind die Schritte zur Erstellung eines kodierten sprecherabhängigen Inventars sowie die akustische Synthese mit diesem Inventar dargestellt. Das kodierte Inventar ist in seiner Größe zwischen 68 KByte und 19 KByte skalierbar. Ebenfalls beschrieben ist die Erstellung eines Inventars, dessen Kodebuch Bestandteil der HM-Modelle des Erkenners eines kombinierten Erkennungs- und Synthesesystems ist. Die Synthese mit diesem sprecherunabhängigen Inventar erfordert eine Stimmenkonvertierung. Eine Möglichkeit der Konvertierung ist in diesem Papier dargestellt. Zur Evaluation der Qualität der Synthese mit diesen Inventaren wurde ein MOS-Hörtest durchgeführt. Die Ergebnisse zeigen ähnliche bzw. höhere Bewertungen bei deutlich geringer Inventargröße im Vergleich zu Inventaren, welche mit Standard-Sprachkodierern (AMR, SPEEX) komprimiert wurden.