<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>25gma049</Identifier>
    <IdentifierDoi>10.3205/25gma049</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-25gma0497</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">Bewertung von Mehrfach-Richtig-Falsch-Aufgaben: Beurteilung von Scoring-Algorithmen mittels Finite-State-Modell</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>M&#246;ltner</Lastname>
          <LastnameHeading>M&#246;ltner</LastnameHeading>
          <Firstname>Andreas</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;t Heidelberg, Qualit&#228;tssicherung Pr&#252;fungen&#47;QM Lehre, Heidelberg, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="yes">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished>20250908</DatePublished>
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0626</MeetingId>
        <MeetingSequence>049</MeetingSequence>
        <MeetingName>Jahrestagung der Gesellschaft f&#252;r Medizinische Ausbildung (GMA)</MeetingName>
        <MeetingTitle></MeetingTitle>
        <MeetingSession>V-07 Pr&#252;fungen 1</MeetingSession>
        <MeetingCity>D&#252;sseldorf</MeetingCity>
        <MeetingDate>
          <DateFrom>20250908</DateFrom>
          <DateTo>20250910</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>V-07-02</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph><Mark1>Fragestellung&#47;Zielsetzung: </Mark1>Seit &#252;ber 40 Jahren ist die Frage, wie Mehrfach-Richtig-Falsch Aufgaben (MTF, auch Typ X oder Kprim) optimal zu bewerten sind, immer wieder Thema von Publikationen. Schmidt et al. <TextLink reference="1"></TextLink> haben in einer &#220;bersichtsarbeit 31 unterschiedliche Scoring-Algorithmen f&#252;r MTF-Aufgaben in der Literatur aufgef&#252;hrt, die verwendet werden oder wurden.</Pgraph><Pgraph>In der Literatur findet sich eine Reihe von empirischen Vergleichen, die z. B. die Itemschwierigkeiten oder die Reliabilit&#228;t von Tests bei Verwendung unterschiedlicher Scoringmethoden untersuchen. Weitgehend offen ist hingegen die Frage, <Mark2>weshalb</Mark2> sich bestimmte Methoden anderen gegen&#252;ber als &#252;berlegen erweisen.</Pgraph><Pgraph>Ziel der Untersuchung ist </Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Kriterien zur Beurteilung von Scoring-Algorithmen zu begr&#252;nden und </ListItem><ListItem level="1" levelPosition="2" numString="2.">mittels eines mathematischen Modells (Finite-State-Modell) deren Eigenschaften zu untersuchen.</ListItem></OrderedList></Pgraph><Pgraph><Mark1>Methoden: </Mark1>Formales Modell zur Analyse von MTF-Aufgaben ist das Finite-State-Modell, das f&#252;r Typ A-Fragen von Garcia-Perez <TextLink reference="2"></TextLink> u. a. entwickelt wurde. In diesem Modell wird angenommen, dass jeder Testteilnehmer einen individuellen F&#228;higkeitsparameter <Mark2>p</Mark2> besitzt, welcher die Wahrscheinlichkeit daf&#252;r angibt, bei einer Teilfrage zu wissen, ob sie korrekt oder falsch ist.</Pgraph><Pgraph>Hiermit lassen sich Kenngr&#246;&#223;en wie die Ratewahrscheinlichkeit (Erwartungswert bei <Mark2>p</Mark2>&#61;0), der erwartete Score bei Kenntnis von 50&#37; der Aussagen (<Mark2>p</Mark2>&#61;0,5) und die &#220;bereinstimmung des Verlaufs der erwarteten Scores in Abh&#228;ngigkeit von <Mark2>p</Mark2> mit dem bei Typ A-Fragen behandeln.</Pgraph><Pgraph>Weiteres Beurteilungskriterium ist die Itemreliabilit&#228;t. Hierzu wird die Verteilung der F&#228;higkeitsparameter <Mark2>p</Mark2> durch eine Betaverteilung approximiert. In Abh&#228;ngigkeit von den Parametern der Verteilung lassen sich Reliabilit&#228;t sowie relative Reliabilit&#228;t im Vergleich zu einem f&#252;r die spezielle Verteilungsgestalt optimalen Scoring bestimmen.</Pgraph><Pgraph><Mark1>Ergebnisse: </Mark1>F&#252;r MTF-Aufgaben mit vier oder f&#252;nf Teilfragen f&#252;hrt die Vergabe von Teilpunkten bei einem bzw. zwei Fehlern &#252;ber einen weiten Bereich von Verteilungsannahmen f&#252;r <Mark2>p</Mark2> zu optimaler oder nahezu optimaler Itemreliabilit&#228;t. Die Scores k&#246;nnen so gew&#228;hlt werden, dass &#228;hnliche Ratewahrscheinlichkeiten wie bei Typ A-Fragen erzielt werden.</Pgraph><Pgraph><Mark1>Diskussion: </Mark1>Die theoretische Analyse stimmt mit den in der Literatur mehrfach berichteten empirischen Ergebnissen zum Scoring von MTF-Aufgaben &#252;berein. Durch eine ad&#228;quate Wahl der Scores k&#246;nnen &#228;hnliche Schwierigkeitscharakteristika wie die bei Typ A-Aufgaben erzielt werden, weshalb sich auch die oft verwendete 60 &#37;-Standardbestehensgrenze bei  Pr&#252;fungen mit MTF-Aufgaben rechtfertigen l&#228;sst.</Pgraph><Pgraph>Das Modell kann dahingehend verallgemeinert werden, dass f&#252;r die Teilfragen unterschiedliche Schwierigkeiten angenommen werden, wodurch die eine deutlich bessere Realit&#228;tsn&#228;he des Modells erzielt wird.</Pgraph><Pgraph><Mark1>Take Home Message: </Mark1>Das Finite-State-Modell erweist sich insbesondere bei MTF-Aufgaben als voraussetzungsarmes Modell, mit dem die Bewertungskriterien von Scoring-Methoden systematisch analysiert werden k&#246;nnen.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="2">
        <RefAuthor>Garc&#237;a-P&#233;rez MA</RefAuthor>
        <RefTitle>A finite state theory of performance in multiple-choice tests</RefTitle>
        <RefYear>1987</RefYear>
        <RefBookTitle>Progress in mathematical psychology</RefBookTitle>
        <RefPage>455-464</RefPage>
        <RefTotal>Garc&#237;a-P&#233;rez MA. A finite state theory of performance in multiple-choice tests. In: Roskam EE, editor. Progress in mathematical psychology. Amsterdam: Elsevier; 1987. p.455-464.</RefTotal>
      </Reference>
      <Reference refNo="1">
        <RefAuthor>Schmidt D</RefAuthor>
        <RefAuthor>Raupach T</RefAuthor>
        <RefAuthor>Wiegand A</RefAuthor>
        <RefAuthor>Herrmann M</RefAuthor>
        <RefAuthor>Kanzow P</RefAuthor>
        <RefTitle>Relation between examinees&#8216; true knowledge and examination scores: systematic review and exemplary calculations on Multiple-True-False items</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Educ Res Rev</RefJournal>
        <RefPage>1004509</RefPage>
        <RefTotal>Schmidt D, Raupach T, Wiegand A, Herrmann M, Kanzow P. Relation between examinees&#8216; true knowledge and examination scores: systematic review and exemplary calculations on Multiple-True-False items. Educ Res Rev. 2021;34:1004509. DOI: 10.1016&#47;j.edurev.2021.100409</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.edurev.2021.100409</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>