<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>25dkou445</Identifier>
    <IdentifierDoi>10.3205/25dkou445</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-25dkou4454</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">KI-gest&#252;tzte Arthrosediagnostik: Prospektive Analyse der diagnostischen Pr&#228;zision von Large Language Models</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Pagano</Lastname>
          <LastnameHeading>Pagano</LastnameHeading>
          <Firstname>Stefano</Firstname>
          <Initials>S</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Klinik f&#252;r Orthop&#228;die &#8211; Universit&#228;t Regensburg, Bad Abbach, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="yes">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Michalk</Lastname>
          <LastnameHeading>Michalk</LastnameHeading>
          <Firstname>Katrin</Firstname>
          <Initials>K</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Klinik f&#252;r Orthop&#228;die &#8211; Universit&#228;t Regensburg, Bad Abbach, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Maderbacher</Lastname>
          <LastnameHeading>Maderbacher</LastnameHeading>
          <Firstname>G&#252;nther</Firstname>
          <Initials>G</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Klinik f&#252;r Orthop&#228;die &#8211; Universit&#228;t Regensburg, Bad Abbach, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Renkawitz</Lastname>
          <LastnameHeading>Renkawitz</LastnameHeading>
          <Firstname>Tobias</Firstname>
          <Initials>T</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Klinik f&#252;r Orthop&#228;die &#8211; Universit&#228;t Regensburg, Bad Abbach, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Schuster</Lastname>
          <LastnameHeading>Schuster</LastnameHeading>
          <Firstname>Marie Farina</Firstname>
          <Initials>MF</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Klinik f&#252;r Orthop&#228;die &#8211; Universit&#228;t Regensburg, Bad Abbach, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished>20251031</DatePublished>
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0634</MeetingId>
        <MeetingSequence>445</MeetingSequence>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Orthop&#228;die und Unfallchirurgie</MeetingCorporation>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Orthop&#228;die und Orthop&#228;dische Chirurgie</MeetingCorporation>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Unfallchirurgie</MeetingCorporation>
        <MeetingCorporation>Berufsverband f&#252;r Orthop&#228;die und Unfallchirurgie</MeetingCorporation>
        <MeetingName></MeetingName>
        <MeetingTitle>Deutscher Kongress f&#252;r Orthop&#228;die und Unfallchirurgie (DKOU 2025)</MeetingTitle>
        <MeetingSession>Abstracts &#124; Digitalisierung 1</MeetingSession>
        <MeetingCity>Berlin</MeetingCity>
        <MeetingDate>
          <DateFrom>20251028</DateFrom>
          <DateTo>20251031</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>AB70-2194</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph><Mark1>Zielsetzung und Fragestellung: </Mark1>Im Zuge der digitalen Transformation im Gesundheitswesen steigt das Interesse an Large Language Models (LLMs) auch in der Orthop&#228;die. Die vorliegende prospektive Validierungsstudie untersuchte die diagnostische Leistungsf&#228;higkeit verschiedener LLMs (GPT-4o, GPT-4 Turbo, GPT-4 mini, GPT-3.5, Llama-3.1, Gemma 2, Mistral Nemo, Gemini 1.5, Gemini 1.0) hinsichtlich derprim&#228;ren Diagnose der H&#252;ft- und Kniegelenksarthrose (OA)auf Basis von Patientenfrageb&#246;genim Kontext orthop&#228;discher Erstvorstellungen. Als sekund&#228;res Studienziel wurde die F&#228;higkeit zur differenzialdiagnostischen Abgrenzung gegen&#252;ber anderen muskuloskelettalen Erkrankungen evaluiert.</Pgraph><Pgraph><Mark1>Material und Methoden: </Mark1>Eine prospektive, klinisch-observationelle Studie schloss 104 Patienten ein, die sich in der Sprechstunde einer orthop&#228;dischen Fachklinik vorgestellt hatten. Vor der &#228;rztlichen Untersuchung erfolgte die detaillierte Erhebung der Anamnese und Symptomatikmittels eines strukturierten Papierfragebogens. Neun LLMs generierten, basierend auf den digitalisierten Frageb&#246;gen und einem spezifischen Prompt, automatisierte Diagnosevorschl&#228;ge. Die finale klinische Diagnose durch erfahrene Orthop&#228;den diente alsunabh&#228;ngiger Referenzstandard, um die diagnostische &#220;bereinstimmung zu evaluieren. Deskriptiv erfolgte die Berechnung und vergleichende Analyse von Sensitivit&#228;t (OA-Detektion), Spezifit&#228;t (Nicht-OA-Detektion) und Genauigkeit (Gesamt&#252;bereinstimmung) der LLMs. Der Einfluss der Antwortqualit&#228;t auf die diagnostische Genauigkeit wurde inferenzstatistisch mittels logistischer Regression untersucht.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>Das Studienkollektiv umfasste 94 OA- und 10 Nicht-OA-Patienten. GPT-4o erreichte die h&#246;chste Sensitivit&#228;t (91,5&#37;) und Gesamtgenauigkeit (87,5&#37;) (Tabelle 1 <ImgLink imgNo="1" imgType="table" />). Die h&#246;chste Spezifit&#228;t f&#252;r Nicht-OA-F&#228;lle betrug 50&#37;. GPT-4 Turbo (Genauigkeit 81,7&#37;) und Gemma 2 (Genauigkeit 80,8&#37;) zeigten ebenfalls hohe Genauigkeitswerte. F&#252;r GPT-4o wurde eine signifikante positive Korrelation zwischen Antwortvollst&#228;ndigkeit und diagnostischer Genauigkeit nachgewiesen (p&#60;0.001).</Pgraph><Pgraph><Mark1>Diskussion und Schlussfolgerung: </Mark1>In der prospektiven Validierung erwies sich GPT-4o als leistungsf&#228;higstes LLM f&#252;r die Prim&#228;rdiagnostik von H&#252;ft- und Knie-OA auf Basis reiner Patientenangaben und erreichte die beste Gesamtgenauigkeit.Diese Resultate belegen das Potential von GPT-4o als valides, KI-basiertes Assistenzsystem zur Arthrodiagnostik in fr&#252;hen klinischen Entscheidungen. Die limitierte Spezifit&#228;t (50&#37;) indiziert jedoch Optimierungsbedarf und unterstreicht die Notwendigkeit weiterer Forschung zur Steigerung der differenzialdiagnostischen Pr&#228;zision von LLMs in der Orthop&#228;die, insbesondere zur Entwicklung von Strategien zur Erh&#246;hung der Spezifit&#228;t und umfassenden Evaluation des klinischen Mehrwertsim realen orthop&#228;dischen Versorgungsalltag.</Pgraph></TextBlock>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID>1</MediaID>
          <Caption><Pgraph><Mark1>Tabelle 1: Diagnostische Leistung verschiedener Large Language Models (LLMs)</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>1</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>