Sprach(erkennungs)modelle als Tool der präzisen Audiologie

Thomas Brand - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Christopher F. Hauth - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Simon Weihe - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Martin Berdau - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Saskia Röttges - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Bernd T. Meyer - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland

Jan Rennies-Hochmuth - Carl von Ossietzky Universität Oldenburg, Department für Medizinische Physik und Akustik, Oldenburg, Deutschland; Cluster of Excellence „Hearing4all“, Carl von Ossietzky Universität Oldenburg, Oldenburg, Deutschland; Fraunhofer IDMT, Sprach- und Audiotechnologie, Oldenburg, Deutschland

Text

Motivation: Das Sprachverstehen ist ein zentrales Ziel der Hörgeräteversorgung und hängt von einer Vielzahl von Faktoren ab – darunter Hörverlust, akustische Umgebung, Raumakustik, Störgeräusche und individuelle kognitive Ressourcen. Die derzeitige diagnostische Beurteilung basiert oft auf subjektiven Erfahrungen; es fehlt an standardisierten, empirisch fundierten Vorhersagemodellen. Ziel dieses Beitrags ist es, verschiedene Modellansätze zur Vorhersage des Sprachverstehens systematisch zu evaluieren und deren Anwendbarkeit in der klinischen Audiologie zu diskutieren.

Fragestellung: Welche Modelltypen – klassische psychoakustische Modelle oder moderne Ansätze aus der automatischen Spracherkennung – eignen sich am besten für die präzise Vorhersage des Sprachverstehens in komplexen Hörsituationen?

Methoden: Es wurden sowohl klassische, psychoakustische Modelle des Sprachverstehens als auch Methoden der automatischen Spracherkennung angewendet. Dabei können zwei Kategorien unterschieden werden: 1.) blinde Modelle, die ausschließlich auf den gemischten Signalen basieren, die auch die Versuchsperson hört und 2.) nicht-blinde Modelle, die zusätzliche Informationen benötigen, wie z.B. getrennte Sprach- und Störsignale, Transkripte der Sprache, Angaben zur Raumakustik oder binaurale Raumimpulsantworten. Ein gemeinsamer methodischer Aspekt aller vorgestellten Modelle ist die Berücksichtigung der Verbesserung des Sprachverstehens bei räumlicher Trennung von Sprache und Störgeräusch.

Ergebnisse: Ein hörschwellensimulierendes Rauschen ermöglicht eine zuverlässige Modellierung des Hörverlusts. Die Berücksichtigung von Nachverdeckung verbessert die Vorhersagegenauigkeit bei modulierten Störgeräuschen. Besonders hohe Präzision zeigten entweder nicht-blinde Modelle, die umfangreiche Zusatzinformationen (z.B. getrennte Sprach- und Störsignale und binaurale Raumimpulsantworten) nutzen oder blinde Modelle, die rein auf gemischten Signalen basieren. Hybridmodelle aus blinden und nicht-blinde Anteilen erwiesen sich als weniger vorteilhaft. Eine Individualisierung der Vorhersagen durch Referenzmessungen verbessert die Konsistenz.

Schlussfolgerung und Diskussion: Die Kombination von blinden psychoakustischen Modellen mit Methoden der automatischen Spracherkennung (z.B. Phonemerkennern) erweist sich als äußerst leistungsfähig – insbesondere in komplexen akustischen Szenarien. Da einige dieser Modelle bereits mit geringem Rechenaufwand in Echtzeit laufen, rückt ihre Integration in Hörhilfen zur Echtzeit-Überprüfung der Signalverarbeitung in greifbare Nähe.

Citation Note

Brand T, Hauth CF, Weihe S, Berdau M, Röttges S, Meyer BT, Rennies-Hochmuth J. Sprach(erkennungs)modelle als Tool der präzisen Audiologie In: Deutsche Gesellschaft für Audiologie e. V., editor. 28. Jahrestagung der Deutschen Gesellschaft für Audiologie. Oldenburg, 04.-06.03.2026. Düsseldorf: German Medical Science GMS Publishing House; 2026. Doc031.

DOI: 10.3205/26dga031

Download XML

Lizenz

© Brand et al.
Dieser Abstract steht unter den Bedingungen der Lizenz: Creative Commons Attribution 4.0 International License

Veröffentlicht: 2026-03-02

Get in touch.

28. Jahrestagung der Deutschen Gesellschaft für Audiologie e. V.

Sprach(erkennungs)modelle als Tool der präzisen Audiologie

Text

ZB MED is a member of DataCite

ZB MED advocates gender equality

Award for German Medical Science

ZB MED advocates Open Access

28. Jahrestagung der Deutschen Gesellschaft für Audiologie e. V.

Sprach(erkennungs)modelle als Tool der präzisen Audiologie

Text

ZB MED is a member of DataCite

ZB MED advocates gender equality

Award for German Medical Science

ZB MED advocates Open Access

28. Jahrestagung der Deutschen Gesellschaft für Audiologie e. V.