<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>25gmds010</Identifier>
    <IdentifierDoi>10.3205/25gmds010</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-25gmds0103</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">Vergleich Multipler Imputationsverfahren zur Ersetzung fehlender Werte in ordinalen Krebsregistervariablen bei der Durchf&#252;hrung von Cox Proportional Hazards Regressionen &#8211; Ergebnisse einer Simulationsstudie</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>K&#228;stner</Lastname>
          <LastnameHeading>K&#228;stner</LastnameHeading>
          <Firstname>Anika</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsmedizin Greifswald, Institut f&#252;r Community Medicine, Abteilung Versorgungsepidemiologie und Community Health, Greifswald, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Hoffmann</Lastname>
          <LastnameHeading>Hoffmann</LastnameHeading>
          <Firstname>Wolfgang</Firstname>
          <Initials>W</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsmedizin Greifswald, Institut f&#252;r Community Medicine, Abteilung Versorgungsepidemiologie und Community Health, Greifswald, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Stang</Lastname>
          <LastnameHeading>Stang</LastnameHeading>
          <Firstname>Andreas</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsmedizin Essen, Institut f&#252;r Medizinische Informatik, Biometrie und Epidemiologie, Essen, Germany</Affiliation>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>H&#252;sing</Lastname>
          <LastnameHeading>H&#252;sing</LastnameHeading>
          <Firstname>Anika</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsmedizin Essen, Institut f&#252;r Medizinische Informatik, Biometrie und Epidemiologie, Essen, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="de">multiple Imputation</Keyword>
      <Keyword language="de">Krebsregister</Keyword>
      <Keyword language="de">&#220;berlebenszeitanalyse</Keyword>
      <Keyword language="de">Simulationsstudie</Keyword>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished>20251103</DatePublished>
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0631</MeetingId>
        <MeetingSequence>010</MeetingSequence>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie</MeetingCorporation>
        <MeetingName>70. Jahrestagung der Deutschen Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)</MeetingName>
        <MeetingTitle></MeetingTitle>
        <MeetingSession>V: Cancer epidemiology</MeetingSession>
        <MeetingCity>Jena</MeetingCity>
        <MeetingDate>
          <DateFrom>20250907</DateFrom>
          <DateTo>20250911</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>Abstr. 101</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph><Mark1>Einleitung:</Mark1> Epidemiologische Studien auf Basis von Krebsregisterdaten sind oftmals durch einen hohen Anteil fehlender Werte limitiert <TextLink reference="1"></TextLink>. Besonders betroffen sind ordinalskalierte Variablen wie das Tumorstadium, Tumorgrading oder der allgemeine Gesundheitszustand (Eastern Cooperative Oncology Group Performance Status, ECOG-PS). Diese Variablen sind m&#246;gliche Confounder in &#220;berlebenszeitanalysen, da diese die Wahl der Therapie und das &#220;berleben unmittelbar beeinflussen <TextLink reference="2"></TextLink>. Dadurch k&#246;nnen Verzerrungen (Bias) resultieren, welche die Aussagekraft der Analysen erheblich einschr&#228;nken, insbesondere wenn die fehlenden Werte mit anderen Kovariaten wie dem Alter oder dem fehlenden Wert selbst zusammenh&#228;ngen <TextLink reference="3"></TextLink>. Die multiple Imputation mittels verketteter Gleichungen (MICE) ist ein etabliertes Verfahren zur Ersetzung fehlender Werte. Dennoch gibt es nur wenige Studien zur Untersuchung der geeignetsten MI-Methode f&#252;r den Umgang mit fehlenden Werten in ordinalskalierten Krebsregistervariablen <TextLink reference="4"></TextLink>, <TextLink reference="5"></TextLink>. Im Rahmen dieser Simulationsstudie wurden verschiedene MI-Methoden zur Ersetzung fehlender Werte in der ordinalskalierten Variable ECOG-PS unter verschiedenen Szenarien bei der Durchf&#252;hrung von Cox Proportional Hazards Regressionen untersucht.</Pgraph><Pgraph><Mark1>Methoden:</Mark1> Die Simulationsstudie basiert auf Lungenkrebsf&#228;llen mit Erstdiagnose im Zeitraum von 2019 bis 2022, die im Landeskrebsregister Nordrhein-Westfalen erfasst wurden und keine fehlenden Werte in den relevanten Variablen aufwiesen. In der ordinalen Variable ECOG-PS wurden fehlende Werte unter 45 verschiedenen Szenarien erzeugt. Dabei wurden unterschiedliche Mechanismen fehlender Werte (MCAR: Missing Completely at Random; MAR: Missing at Random; MNAR: Missing Not at Random), verschiedene Anteile fehlender Werte (10&#37;, 20&#37;, 30&#37;, 40&#37;, 50&#37;) sowie unterschiedliche Fallzahlen (N&#61;500, N&#61;1.000, N&#61;5.000) ber&#252;cksichtigt. Anschlie&#223;end wurden die fehlenden Werte f&#252;r jedes Szenario durch verschiedene MI-Verfahren ersetzt: MICE mit ordinal logistischer Regression (POLR), multinomial logistischer Regression (POLYREG), Predictive Mean Matching (PMM), Random Forests (RF) und das Joint Model mit latenten normalverteilten Variablen (JM). Zur Bewertung der MI-Methoden wurden der Bias, die mittlere quadratische Abweichung (MSE), die Breite des 95&#37;-Konfidenzintervalls und die Coverage der logarithmierten Hazard Ratios des ECOG-PS analysiert. Die Simulationen wurden mit dem Statistikprogramm R (Version 4.4.1) durchgef&#252;hrt.</Pgraph><Pgraph><Mark1>Ergebnisse:</Mark1> In Szenarien mit kleineren Fallzahlen (N&#61;500 und N&#61;1.000) waren wenige F&#228;lle mit stark eingeschr&#228;nktem Allgemeinzustand vorhanden. F&#252;r ECOG-PS&#61;4 zeigte sich in diesen Szenarien f&#252;r alle MI-Verfahren ab einem Anteil von 30&#37; fehlender Werte ein starker Bias, eine hohe MSE, breite 95&#37;-Konfidenzintervalle sowie eine niedrige Coverage.</Pgraph><Pgraph>In den Szenarien mit der gr&#246;&#223;eren Fallzahl (N&#61;5.000) erzielte MICE mit POLYREG f&#252;r alle Szenarien einen akzeptablen Bias (&#60;10&#37;). Auch MICE mit RF und PMM wiesen bei bis zu 40&#37; fehlender Werte unter MAR und MNAR akzeptable Bias-Werte auf, wobei MICE mit RF auch bei 50&#37; fehlenden Werten unter MNAR einen niedrigen Bias zeigte. Das JM sowie MICE mit POLR erzielten hingegen nur bis zu einem Anteil von maximal 20&#37; fehlender Werte akzeptable Bias-Werte.</Pgraph><Pgraph><Mark1>Diskussion:</Mark1> Die Ergebnisse unterstreichen die Bedeutsamkeit der Fallzahl und Verteilung der Kategorien ordinaler Variablen beim Umgang mit fehlenden Werten in Krebsregisterdaten. Insbesondere die Kombination aus kleinen Fallzahlen und Kategorien mit niedrigen Pr&#228;valenzen f&#252;hrte in allen untersuchten MI-Verfahren ab 30&#37; fehlenden Werten zu verzerrten Ergebnissen.</Pgraph><Pgraph><Mark1>Schlussfolgerung:</Mark1> MICE mit POLYREG erwies sich als geeignetste Methode zur Ersetzung fehlender ordinalskalierter ECOG-PS-Werte. Weiterf&#252;hrende Untersuchungen in Bezug auf &#220;berlebenszeitanalysen und multivariate Muster fehlender Werte sind erforderlich, um konkrete Empfehlungen f&#252;r den Umgang mit fehlenden Werten in ordinalskalierten Krebsregistervariablen abzuleiten.</Pgraph><Pgraph>Die Autoren geben an, dass kein Interessenkonflikt besteht.</Pgraph><Pgraph>Die Autoren geben an, dass ein positives Ethikvotum vorliegt.</Pgraph><Pgraph>Der Beitrag wurde bereits publiziert: <TextLink reference="6"></TextLink></Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>H&#252;bner J</RefAuthor>
        <RefAuthor>Baltus H</RefAuthor>
        <RefAuthor>Eisemann N</RefAuthor>
        <RefAuthor>Rohr M</RefAuthor>
        <RefAuthor>Schumann L</RefAuthor>
        <RefAuthor>Augustin J</RefAuthor>
        <RefAuthor></RefAuthor>
        <RefTitle>Evaluation of Early Skin Cancer Detection in Germany with Cancer Registry Data - Challenges, Solutions and Current Trends</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>J Dtsch Dermatol Ges</RefJournal>
        <RefPage>13-20</RefPage>
        <RefTotal>H&#252;bner J, Baltus H, Eisemann N, Rohr M, Schumann L, Augustin J, et al. Evaluation of Early Skin Cancer Detection in Germany with Cancer Registry Data - Challenges, Solutions and Current Trends. J Dtsch Dermatol Ges. 2023;21 Suppl 5:13-20. DOI: 10.1111&#47;ddg.15171</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1111&#47;ddg.15171</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Alifano M</RefAuthor>
        <RefAuthor>Daffr&#233; E</RefAuthor>
        <RefAuthor>Brouchet L</RefAuthor>
        <RefAuthor>Falcoz PE</RefAuthor>
        <RefAuthor>Le Pimpec Barthes F</RefAuthor>
        <RefAuthor>Pages PB</RefAuthor>
        <RefAuthor></RefAuthor>
        <RefTitle>Prognostic Score and Sex-Specific Nomograms to Predict Survival in Resectable Lung Cancer: A French Nationwide Study from the Epithor Cohort Database</RefTitle>
        <RefYear>2023</RefYear>
        <RefJournal>The Lancet Regional Health &#8211; Europe</RefJournal>
        <RefPage>100566</RefPage>
        <RefTotal>Alifano M, Daffr&#233; E, Brouchet L, Falcoz PE, Le Pimpec Barthes F, Pages PB, et al. Prognostic Score and Sex-Specific Nomograms to Predict Survival in Resectable Lung Cancer: A French Nationwide Study from the Epithor Cohort Database. The Lancet Regional Health &#8211; Europe. 2023;26:100566. DOI: 10.1016&#47;j.lanepe.2022.100566</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.lanepe.2022.100566</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Di Girolamo C</RefAuthor>
        <RefAuthor>Walters S</RefAuthor>
        <RefAuthor>Benitez Majano S</RefAuthor>
        <RefAuthor>Rachet B</RefAuthor>
        <RefAuthor>Coleman MP</RefAuthor>
        <RefAuthor>Njagi EN</RefAuthor>
        <RefAuthor></RefAuthor>
        <RefTitle>Characteristics of Patients with Missing Information on Stage: A Population-Based Study of Patients Diagnosed with Colon, Lung or Breast Cancer in England in 2013</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>BMC Cancer</RefJournal>
        <RefPage>492</RefPage>
        <RefTotal>Di Girolamo C, Walters S, Benitez Majano S, Rachet B, Coleman MP, Njagi EN, et al. Characteristics of Patients with Missing Information on Stage: A Population-Based Study of Patients Diagnosed with Colon, Lung or Breast Cancer in England in 2013. BMC Cancer. 2018;18(1):492. DOI: 10.1186&#47;s12885-018-4417-3</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1186&#47;s12885-018-4417-3</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Eisemann N</RefAuthor>
        <RefAuthor>Waldmann A</RefAuthor>
        <RefAuthor>Katalinic A</RefAuthor>
        <RefTitle>Imputation of Missing Values of Tumour Stage in Population-Based Cancer Registration</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>BMC Medical Research Methodology</RefJournal>
        <RefPage>129</RefPage>
        <RefTotal>Eisemann N, Waldmann A, Katalinic A. Imputation of Missing Values of Tumour Stage in Population-Based Cancer Registration. BMC Medical Research Methodology. 2011;11(1):129. DOI: 10.1186&#47;1471-2288-11-129</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1186&#47;1471-2288-11-129</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Quartagno M</RefAuthor>
        <RefAuthor>Carpenter JR</RefAuthor>
        <RefTitle>Multiple Imputation for Discrete Data: Evaluation of the Joint Latent Normal Model</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>Biom J</RefJournal>
        <RefPage>1003-19</RefPage>
        <RefTotal>Quartagno M, Carpenter JR. Multiple Imputation for Discrete Data: Evaluation of the Joint Latent Normal Model. Biom J. 2019;61(4):1003-19. DOI: 10.1002&#47;bimj.201800222</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1002&#47;bimj.201800222</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>K&#228;stner A</RefAuthor>
        <RefAuthor>Hoffmann W</RefAuthor>
        <RefAuthor>Stang A</RefAuthor>
        <RefAuthor>H&#252;sing A</RefAuthor>
        <RefTitle>Multiple Imputation for Missing Values of Ordinal Variables in Cancer Registry Data when Performing Cox Proportional Hazards Regression</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Statistics in Times of AI. DAGStat 2025. Statistics under one umbrella. 7th Joint Statistical Meeting; 2025 Mar 24-28; Berlin</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>K&#228;stner A, Hoffmann W, Stang A, H&#252;sing A. Multiple Imputation for Missing Values of Ordinal Variables in Cancer Registry Data when Performing Cox Proportional Hazards Regression. In: Statistics in Times of AI. DAGStat 2025. Statistics under one umbrella. 7th Joint Statistical Meeting; 2025 Mar 24-28; Berlin. Abstract-ID: 67.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>