<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>26dga113</Identifier>
    <IdentifierDoi>10.3205/26dga113</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-26dga1136</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">Automatisierte Auswertung der Sprachaudiometrie f&#252;r Cochlea-Implantat-Tr&#228;ger mittels k&#252;nstlicher Intelligenz und flexibler Korrekturmethoden</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>G&#246;hring</Lastname>
          <LastnameHeading>G&#246;hring</LastnameHeading>
          <Firstname>Tobias</Firstname>
          <Initials>T</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t Z&#252;rich, ORL Klinik, Z&#252;rich, Schweiz</Affiliation>
          <Affiliation>University of Cambridge, MRC Cognition and Brain Sciences Unit, Cambridge, UK</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="yes">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Topbas</Lastname>
          <LastnameHeading>Topbas</LastnameHeading>
          <Firstname>Erdem Baha</Firstname>
          <Initials>EB</Initials>
        </PersonNames>
        <Address>
          <Affiliation>University of Cambridge, MRC Cognition and Brain Sciences Unit, Cambridge, UK</Affiliation>
          <Affiliation>Universit&#228;t Z&#252;rich, Computerlinguistik, Z&#252;rich, Schweiz</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished >20260302</DatePublished >
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0642</MeetingId>
        <MeetingSequence>113</MeetingSequence>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Audiologie e. V.</MeetingCorporation>
        <MeetingName>28. Jahrestagung der Deutschen Gesellschaft f&#252;r Audiologie</MeetingName>
        <MeetingTitle></MeetingTitle>
        <MeetingSession>Freie Vortr&#228;ge 10: Statistische Audiologie und KI</MeetingSession>
        <MeetingCity>Oldenburg</MeetingCity>
        <MeetingDate>
          <DateFrom>20260304</DateFrom>
          <DateTo>20260306</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>113</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph><Mark1>Fragestellung: </Mark1>Innovationen in der webbasierten Sprachaudiometrie k&#246;nnen die Teilnahme an H&#246;rtests erleichtern, bringen jedoch Herausforderungen bei der Datenanalyse mit sich. Die manuelle Auswertung gro&#223;er Datenmengen ist kostspielig, zeitaufwendig und kann f&#252;r adaptive Sprachtests bisher nicht in Echtzeit erfolgen. Hier versuchen wir diesen Prozess zu automatisieren und zu beschleunigen, indem wir automatische Spracherkennung (ASR) zur Transkription der Sprachaufnahmen von Cochlea-Implantat (CI)-Tr&#228;gern anwenden. Automatische Spracherkennung wird in vielen Anwendungen bereits erfolgreich genutzt, aber noch nicht f&#252;r CI-Sprachaudiometrie. Transkriptionen wurden verglichen zwischen ASR-Modellen und manuellen Bewertern mit und ohne Vorlagen des Testmaterials, sowie nach der Anwendung flexibler Methoden zur Fehlerkorrektion.</Pgraph><Pgraph><Mark1>Methoden: </Mark1>Eine Gruppe von CI-Tr&#228;gern (n&#61;15) h&#246;rte S&#228;tze aus dem BKB-Sprachkorpus, und ihre Antworten wurden aufgenommen. Dies wurde sowohl in einer kontrollierten Laborumgebung als auch remote mit einem Online-Testsystem durchgef&#252;hrt. Die Daten wurden unter drei H&#246;rbedingungen erfasst: S&#228;tze im St&#246;rger&#228;usch, nach der Verarbeitung mit einem Rauschunterdr&#252;ckungsalgorithmus und ohne St&#246;rger&#228;usch. Die Aufnahmen dieser Sitzungen wurden von menschlichen Bewertern, die eine Vorlage des BKB-Korpus nutzten (n&#61;4) oder keine Vorlage hatten (n&#61;4), und von modernen Open-Source-ASR-Modellen (n&#61;6) transkribiert. Die Transkriptionen wurden direkt und nach der Korrektur von Homophonen, Rechtschreibfehlern und anderen Fehlerquellen verglichen und hinsichtlich Effektgr&#246;ssen und Korrelationen analysiert.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Die von den ASR-Modellen generierten Bewertungen zeigten &#228;hnliche Muster wie die der menschlichen Bewerter &#252;ber alle H&#246;rbedingungen und CI-Teilnehmer hinweg. Unterschiede in der Aufnahmequalit&#228;t und Sprachverst&#228;ndlichkeit beeinflussten sowohl menschliche Bewerter als auch ASR-Modelle in &#228;hnlicher Weise. Die berechneten Effektgr&#246;&#223;en (Cohen&#8217;s d) waren vergleichbar zwischen den Bewertern. Im Vergleich zur traditionellen Bewertung mit Vorlage ergaben sich mit dem besten ASR-Modell durchschnittlich weniger als 10 Prozentpunkte Abweichung und eine Intraklassenkorrelation von 0,96, was &#228;hnlich zu den Durchschnittswerten der menschlichen Bewerter ohne Vorlage war.</Pgraph><Pgraph><Mark1>Schlussfolgerungen: </Mark1>ASR-Modelle, insbesondere gr&#246;&#223;ere Varianten, erzielten vielversprechende Ergebnisse, die denen der menschlichen Bewerter ohne Vorlage in Bezug auf absolute Genauigkeit, relative Rangordnung und statistische Messgr&#246;&#223;en &#228;hnelten. Sie erzielten konsistente Ergebnisse f&#252;r relative Messgr&#246;&#223;en und wichen in absoluten Messgr&#246;&#223;en weniger von der Referenz ab als menschliche Bewerter die keine Vorlage nutzten. Die flexiblen Korrekturmethoden reduzierten einige Fehler und Abweichungen, f&#252;hrten aber auch zu Falsch-Positiv Fehlern. ASR-Modelle besitzen grosses Potential zur Resourceneinsparungen in klinischen Anwendungen und der Standardisierung von CI-Sprachaudiometrie.</Pgraph></TextBlock>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>