Logo

28. Jahrestagung der Deutschen Gesellschaft für Audiologie e. V.

Deutsche Gesellschaft für Audiologie e. V.
04.-06.03.2026
Oldenburg

Meeting Abstract

Entwicklung, Modellierung und Evaluation eines Sprachverständlichkeitstests mit synthetischer Sprache in einer simulierten Alltagsumgebung

Jonas Stohlmann - Technische Hochschule Lübeck, Hörakustik, Lübeck, Deutschland
Fabian Hettler - Technische Hochschule Lübeck, Hörakustik, Lübeck, Deutschland
Hendrik Husstedt - Deutsches Hörgeräte Institut GmbH, Lübeck, Deutschland
Florian Denk - Deutsches Hörgeräte Institut GmbH, Lübeck, Deutschland
Jürgen Tchorz - Technische Hochschule Lübeck, Hörakustik, Lübeck, Deutschland
Markus Kallinger - Technische Hochschule Lübeck, Hörakustik, Lübeck, Deutschland
Tim Jürgens - Technische Hochschule Lübeck, Hörakustik, Lübeck, Deutschland

Text

Zur Quantifizierung des Erfolgs einer Hörsystemanpassung werden in der Regel standardisierte sprachaudiometrische Tests angewendet, deren gemessenes Sprachverstehen allerdings nicht unbedingt repräsentativ für Sprachverstehen in Alltagssituationen ist. Daher wird in diesem Beitrag ein neuer Sprachverständlichkeitstest vorgestellt, der auch Einflüsse wie Nachhall, Mehrsprechersituationen und Kontext mit einbezieht, um die ökologische Validität zu erhöhen.

Als Sprachmaterial wurde ein semantisch und syntaktisch realistischer Dialog zwischen einer männlichen und weiblichen Stimme mittels Google Text-to-Speech generiert. Das Sprachmaterial umfasste 20 zu erkennende Schlüsselwörter, eingebettet in zehn semantisch sinnvollen Sätzen mit jeweils zwei Schlüsselwörtern. Das Sprachmaterial wurde in eine virtuell nachgebildete Cafeteria eingebettet und gemeinsam mit in einer Higher Order Ambisonics (HOA) Hintergrundaufnahme einer realen Cafeteria wiedergegeben.

Der Sprachverständlichkeitstest wurde als HOA-Signal 7. Ordnung über ein sphärisches 65-Kanal-Lautsprechersystem im reflexionsarmen Raum mit einem Störgeräuschpegel von 65 dB SPL präsentiert. Das Sprachsignal wurde in zwei Durchläufen bei jeweils festem Darbietungspegel von vorne bei Signal-Rausch-Abständen (SNR) von -11 dB und -8 dB dargeboten. 24 normalhörende Erwachsene wählten aus jeweils 10 Antwortalternativen die verstandenen Schlüsselwörter und bewerteten jeden Messdurchlauf hinsichtlich der Natürlichkeit der verwendeten Stimmen, des Realismus der dargebotenen Szene und des empfundenen Schwierigkeitsgrades auf sechsstufigen Likert-Skalen. Zusätzlich wurde der Sprachverständlichkeitstest mittels des Framework for Auditory Discrimination Experiments (FADE) als einkanaliger Matrixtest modelliert.

Die an das gemessene Sprachverstehen gefittete psychometrische Funktion ergab eine Schwelle für 50% Sprachverstehen (SRT50) von -9,5 dB SNR und eine Steigung von 9,7%/dB. Die Messdurchläufe bei -8 dB SNR wurden als deutlich realistischer und einfacher bewertet als bei -11 dB SNR. Bei gemeinsamer Betrachtung beider SNR-Konditionen wurden die Cafeteria-Szene als „eher realistisch“ und die Stimmen als „eher natürlich“ eingestuft. Die FADE-Modellierung ergab bei einbezogenem Nachhall eine deutlich höhere SRT50 von +0,7 dB SNR und eine geringere Steigung von 3,6%/dB auf. Die Abweichung von den empirisch ermittelten Werten sinkt bei Modellierung von Sprache ohne Nachhall deutlich (SRT50 = -8,2 dB SNR und Steigung 6,7%/dB).

Insgesamt zeigt die Studie einen vielversprechenden Ansatz, um auf effiziente Weise mittels synthetischem Sprachmaterial einen Sprachverständlichkeitstest mit hohem Alltagsbezug zu erstellen. Dazu wurde der Sprachtest unter Verwendung virtueller Akustik in eine Alltagsszene eingebettet, wodurch eine hohe ökologische Validität bei hoher Messgenauigkeit zu erwarten ist. Die unzureichende Übereinstimmung der FADE-Modellierung wird diskutiert.