Vergleich der instrumentellen Erfassung der Qualitätsdimension ”Direktheit/Frequenzgehalt“ bei Schmalband- und Breitbandsprache

Konferenz: Sprachkommunikation 2006 - ITG-Fachtagung
26.04.2006 - 28.04.2006 in Kiel, Germany

Tagungsband: Sprachkommunikation 2006

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Scholz, K.; Huo, L.; Heute, U. (LNS, Christian-Albrechts-Universität, Kaiserstr. 2, 24143 Kiel, Germany)
Wältermann, M. (IKA, Ruhr-Universität Bochum, 44780 Bochum, Germany)
Raake, A. (DT Laboratories, Ernst-Reuter-Platz 7, 10587 Berlin, Germany)

Inhalt:
Der Mean-Opinion-Score (MOS) beschreibt die Gesamtqualität, die ein Hörer einem Sprachsignal zuordnet, und kann durch standardisierte instrumentelle Verfahren geschätzt werden. Zur Qualitätsanalyse sind MOS-Werte jedoch nicht ausreichend. Wir entwickeln daher mittels Urteilen über Qualitätsdimensionen ein instrumentelles Verfahren zur Analyse und Beurteilung von Sprachqualit ät. Die Dimensionen erfassen einzelne qualitätsrelevante Störungen und bilden gemeinsam ein Modell für die Gesamtqualität. Für die Qualitätsanalyse von Schmalbandsprache erweist sich u.a. die Dimension ”Direktheit/Frequenzgehalt“ als relevant. Wir stellen einen instrumentellen Schätzer für diese Dimension vor. Die Ergebnisse des Dimensionsschätzers besitzen für die verwendeten Testdaten eine Korrelation von ρ ˜ 0.95 mit den Ergebnissen des entsprechenden auditiven Tests. Des Weiteren wird der Schätzer in einer Pilotstudie auf potentielle Qualitätsdimensionen bei Breitbandsprache angewendet. Dieser Studie zufolge existieren zwei Breitband-Dimensionen, die in Zusammenhang mit der Schmalband-Dimension ” Direktheit/Frequenzgehalt“ stehen: ” Direktheit“ und ” Frequenzgehalt“.