<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>25gmds014</Identifier>
    <IdentifierDoi>10.3205/25gmds014</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-25gmds0141</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">Sprachverarbeitung von Pathologie-Berichten in einem Krebsregister: Implementierung und Qualit&#228;tskontrolle</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>H&#252;sing</Lastname>
          <LastnameHeading>H&#252;sing</LastnameHeading>
          <Firstname>Johannes</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Kaj&#252;ter</Lastname>
          <LastnameHeading>Kaj&#252;ter</LastnameHeading>
          <Firstname>Hiltraud</Firstname>
          <Initials>H</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Oesterling</Lastname>
          <LastnameHeading>Oesterling</LastnameHeading>
          <Firstname>Florian</Firstname>
          <Initials>F</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Staffa</Lastname>
          <LastnameHeading>Staffa</LastnameHeading>
          <Firstname>Anna-Lena</Firstname>
          <Initials>AL</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Berszinski</Lastname>
          <LastnameHeading>Berszinski</LastnameHeading>
          <Firstname>Alexander</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Voigt</Lastname>
          <LastnameHeading>Voigt</LastnameHeading>
          <Firstname>Mareike</Firstname>
          <Initials>M</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Stang</Lastname>
          <LastnameHeading>Stang</LastnameHeading>
          <Firstname>Andreas</Firstname>
          <Initials>A</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Landeskrebsregister Nordrhein-Westfalen gGmbH, Bochum, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="de">Krebsregister</Keyword>
      <Keyword language="de">Sprachverarbeitung</Keyword>
      <Keyword language="de">Natural Language Processing</Keyword>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished>20251103</DatePublished>
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0631</MeetingId>
        <MeetingSequence>014</MeetingSequence>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie</MeetingCorporation>
        <MeetingName>70. Jahrestagung der Deutschen Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)</MeetingName>
        <MeetingTitle></MeetingTitle>
        <MeetingSession>V: Cancer epidemiology</MeetingSession>
        <MeetingCity>Jena</MeetingCity>
        <MeetingDate>
          <DateFrom>20250907</DateFrom>
          <DateTo>20250911</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>Abstr. 218</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph>Das Krebsregister Nordrhein-Westfalen adoptiert Techniken, die automatische Sprachverarbeitung <Mark2>(natural language processing)</Mark2> nutzt, um strukturierte Daten aus Flie&#223;texten, hier pathologischen Berichten, zu extrahieren. Wir setzen Fremdanbieter-Software ein, die auf medizinische Terminologie zugeschnitten ist. Bevor wir den Arbeitsablauf &#228;ndern, muss er gepr&#252;ft werden.</Pgraph><Pgraph>Alle Pathologie-Berichte &#252;ber im Jahr 2019 neu diagnostizierte Tumoren wurden herangezogen. Als Goldstandard behandeln wir die manuellen Kodierungen aller Pathologie-Berichte zu TNM-Klassifikation, Residualgewebe, Grading, Morphologie inklusive Dignit&#228;t, Topographie und Lateralit&#228;t. Wir gruppierten die automatisch erzeugten Befunde nach dreistelligem ICD-10-Code und entwickelten Regels&#228;tze f&#252;r die &#220;bernahme von NLP-Daten f&#252;r jede dieser Tumorentit&#228;ten. Als graphische Veranschaulichung dienen Fluctuation Plots, H&#228;ufigkeiten &#252;ber  Automatisierte Befunde wurden &#252;bernommen, wenn der positive Vorhersagewert bei mindestens 95&#37; liegt. Da den NLP-Resultaten ein &#8222;Konfidenzscore&#8220; f&#252;r die ICD-O3-Variablen beigef&#252;gt wird, k&#246;nnen Untermengen gebildet werden, f&#252;r die der Konfidenzscore eine Schwelle &#252;berschreitet und innerhalb derer der &#220;bereinstimmungsgrad auf &#252;ber 95 gehoben werden kann.</Pgraph><Pgraph>Insgesamt 172352 Pathologie-Berichte wurden an das Krebsregister gesandt. F&#252;r die folgenden Tumorentit&#228;ten wurden Regels&#228;tze vereinbart und als Beschlussvorlagen verabschiedet: C44 (nichtmelanotische Hautkrebs), C50 (Brustkrebs), C61 (Prostatakrebs), C34 (Bronchialkarzinom), C18-20 (Kolorektalkarzinome), C43 (Hautmelanome), D05 (Mammakarzinom in situ), C25 (Magenkrebs), C67 (Harnblasenkrebs) and D06 (Geb&#228;rmutterkrebs in situ) mit einer Gesamtzahl von 113632 Reports. Hiervon konnten 57118 NLP-generierte Eintr&#228;ge &#252;bernommen werden. Der Umfang der automatisch &#252;bernommenen Eintr&#228;ge h&#228;ngt stark von der Tumorentit&#228;t und dem kodierten Merkmal ab. Insbesondere beim Grading wird ein positiver Vorhersagewert von 95&#37; selten erreicht.</Pgraph><Pgraph>Transparenz &#252;ber die Datenquelle und die Treffsicherheit der Methode ist grundlegend, da abh&#228;ngig von der Forschungsfragestellung verschiedene Genauigkeit vonn&#246;ten ist. Beim Abarbeiten der Regels&#228;tze nach H&#228;ufigkeit der Tumorentit&#228;ten macht sich ein abnehmender Grenznutzen bemerkbar, sodass seltene Tumoren nach wie vor h&#228;ndisch kodiert werden m&#252;ssen.</Pgraph><Pgraph>Die Autoren geben an, dass kein Interessenkonflikt besteht.</Pgraph><Pgraph>Die Autoren geben an, dass kein Ethikvotum erforderlich ist.</Pgraph><Pgraph>Der Beitrag wurde bereits publiziert: <TextLink reference="1"></TextLink></Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="2">
        <RefAuthor>Lee DH</RefAuthor>
        <RefAuthor>Kim B</RefAuthor>
        <RefAuthor>Lee ES</RefAuthor>
        <RefAuthor>Kim HJ</RefAuthor>
        <RefAuthor>Min JH</RefAuthor>
        <RefAuthor>Lee JM</RefAuthor>
        <RefAuthor></RefAuthor>
        <RefTitle>Radiologic Evaluation and Structured Reporting Form for Extrahepatic Bile Duct Cancer: 2019 Consensus Recommendations from the Korean Society of Abdominal Radiology</RefTitle>
        <RefYear>2021</RefYear>
        <RefJournal>Korean J Radiol</RefJournal>
        <RefPage>41</RefPage>
        <RefTotal>Lee DH, Kim B, Lee ES, Kim HJ, Min JH, Lee JM, et al. Radiologic Evaluation and Structured Reporting Form for Extrahepatic Bile Duct Cancer: 2019 Consensus Recommendations from the Korean Society of Abdominal Radiology. Korean J Radiol. 2021;22(1):41.</RefTotal>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Alawad M</RefAuthor>
        <RefAuthor>Yoon HJ</RefAuthor>
        <RefAuthor>Tourassi GD</RefAuthor>
        <RefTitle>Coarse-to-Fine Multi-Task Training of Convolutional Neural Networks for Automated Information Extraction from Cancer Pathology Reports</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>2018 IEEE EMBS International Conference on Biomedical &#38; Health Informatics (BHI); 2018 Mar 4-7; Las Vegas, Nevada, USA</RefBookTitle>
        <RefPage>218&#8211;21</RefPage>
        <RefTotal>Alawad M, Yoon HJ, Tourassi GD. Coarse-to-Fine Multi-Task Training of Convolutional Neural Networks for Automated Information Extraction from Cancer Pathology Reports. In: 2018 IEEE EMBS International Conference on Biomedical &#38; Health Informatics (BHI); 2018 Mar 4-7; Las Vegas, Nevada, USA. p. 218&#8211;21. Available from: https:&#47;&#47;www.osti.gov&#47;servlets&#47;purl&#47;1435267</RefTotal>
        <RefLink>https:&#47;&#47;www.osti.gov&#47;servlets&#47;purl&#47;1435267</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Moons KGM</RefAuthor>
        <RefAuthor>Harrell FE</RefAuthor>
        <RefTitle>Sensitivity and Specificity should be De-emphasized in Diagnostic Accuracy Studies</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Acad Radiol</RefJournal>
        <RefPage>670&#8211;2</RefPage>
        <RefTotal>Moons KGM, Harrell FE. Sensitivity and Specificity should be De-emphasized in Diagnostic Accuracy Studies. Acad Radiol. 2003 Jun;10(6):670&#8211;2.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Wickham H</RefAuthor>
        <RefAuthor>Hofmann H</RefAuthor>
        <RefTitle>Product plots</RefTitle>
        <RefYear>2011</RefYear>
        <RefJournal>IEEE Trans Vis Comput Graph</RefJournal>
        <RefPage>2223&#8211;30</RefPage>
        <RefTotal>Wickham H, Hofmann H. Product plots. IEEE Trans Vis Comput Graph. 2011 Dec;17(12):2223&#8211;30.</RefTotal>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Goulart BHL</RefAuthor>
        <RefAuthor>Silgard ET</RefAuthor>
        <RefAuthor>Baik CS</RefAuthor>
        <RefAuthor>Bansal A</RefAuthor>
        <RefAuthor>Sun Q</RefAuthor>
        <RefAuthor>Durbin EB</RefAuthor>
        <RefAuthor></RefAuthor>
        <RefTitle>Validity of Natural Language Processing for Ascertainment of EGFR and ALK Test Results in SEER Cases of Stage IV Non&#8211;Small-Cell Lung Cancer</RefTitle>
        <RefYear>2019</RefYear>
        <RefJournal>JCO Clin Cancer Inform</RefJournal>
        <RefPage>1&#8211;15</RefPage>
        <RefTotal>Goulart BHL, Silgard ET, Baik CS, Bansal A, Sun Q, Durbin EB, et al. Validity of Natural Language Processing for Ascertainment of EGFR and ALK Test Results in SEER Cases of Stage IV Non&#8211;Small-Cell Lung Cancer. JCO Clin Cancer Inform. 2019 Dec;(3):1&#8211;15.</RefTotal>
      </Reference>
      <Reference refNo="1">
        <RefAuthor>H&#252;sing J</RefAuthor>
        <RefAuthor>Oesterling F</RefAuthor>
        <RefAuthor>Patenge C</RefAuthor>
        <RefAuthor>Stang A</RefAuthor>
        <RefAuthor>Kaj&#252;ter H</RefAuthor>
        <RefAuthor>Mattauch V</RefAuthor>
        <RefTitle>Evaluation of Parsed Pathological Reports in the Data Collection Process of a Cancer Registry</RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>JRC135581 ENCR IACR Scientific Conference; 2023 Nov 14-16; Granada, Spain</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>H&#252;sing J, Oesterling F, Patenge C, Stang A, Kaj&#252;ter H, Mattauch V. Evaluation of Parsed Pathological Reports in the Data Collection Process of a Cancer Registry. In: JRC135581 ENCR IACR Scientific Conference; 2023 Nov 14-16; Granada, Spain.</RefTotal>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>