<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<!DOCTYPE GmsArticle SYSTEM "http://www.egms.de/dtd/2.0.34/GmsArticle.dtd">
<GmsArticle xmlns:xlink="http://www.w3.org/1999/xlink">
  <MetaData>
    <Identifier>25gmds043</Identifier>
    <IdentifierDoi>10.3205/25gmds043</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-25gmds0439</IdentifierUrn>
    <ArticleType>Meeting Abstract</ArticleType>
    <TitleGroup>
      <Title language="de">HPC-nativer 5-SAFE Trusted Research Environment (TRE) f&#252;r skalierbare Medizinische Datenanalyse</Title>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Quentin</Lastname>
          <LastnameHeading>Quentin</LastnameHeading>
          <Firstname>Lars</Firstname>
          <Initials>L</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Gesellschaft f&#252;r wissenschaftliche Datenverarbeitung mbH G&#246;ttingen (GWDG), G&#246;ttingen, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Nolte</Lastname>
          <LastnameHeading>Nolte</LastnameHeading>
          <Firstname>Hendrik</Firstname>
          <Initials>H</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Gesellschaft f&#252;r wissenschaftliche Datenverarbeitung mbH G&#246;ttingen (GWDG), G&#246;ttingen, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Kunkel</Lastname>
          <LastnameHeading>Kunkel</LastnameHeading>
          <Firstname>Julian</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Gesellschaft f&#252;r wissenschaftliche Datenverarbeitung mbH G&#246;ttingen (GWDG), G&#246;ttingen, Germany</Affiliation>
          <Affiliation>Georg-August-Universit&#228;t G&#246;ttingen, G&#246;ttingen, Germany</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="de">Trusted Research Environment</Keyword>
      <Keyword language="de">High-Performance Computing</Keyword>
      <Keyword language="de">Health Data Infrastructure</Keyword>
      <Keyword language="de">Datensicherheit</Keyword>
    </SubjectGroup>
    <DatePublishedList>
      <DatePublished>20251103</DatePublished>
    </DatePublishedList>
    <Language>germ</Language>
    <License license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
      <AltText language="en">This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License.</AltText>
      <AltText language="de">Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung).</AltText>
    </License>
    <SourceGroup>
      <Meeting>
        <MeetingId>M0631</MeetingId>
        <MeetingSequence>043</MeetingSequence>
        <MeetingCorporation>Deutsche Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie</MeetingCorporation>
        <MeetingName>70. Jahrestagung der Deutschen Gesellschaft f&#252;r Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)</MeetingName>
        <MeetingTitle></MeetingTitle>
        <MeetingSession>V: Gesundheitsdatennutzung &#8211; distributed &#38; federated analyses</MeetingSession>
        <MeetingCity>Jena</MeetingCity>
        <MeetingDate>
          <DateFrom>20250907</DateFrom>
          <DateTo>20250911</DateTo>
        </MeetingDate>
      </Meeting>
    </SourceGroup>
    <ArticleNo>Abstr. 229</ArticleNo>
  </MetaData>
  <OrigData>
    <TextBlock name="Text" linked="yes">
      <MainHeadline>Text</MainHeadline><Pgraph><Mark1>Einleitung:</Mark1> Die Medizinische Informatik Initiative (MII) <TextLink reference="1"></TextLink> hat durch die Etablierung von Datenintegrationszentren (DIZ) <TextLink reference="2"></TextLink> bereits entscheidende Fortschritte in der Standardisierung und Bereitstellung von Forschungsdaten erzielt. Nach der freien Daten&#252;bergabe an Forschende kann jedoch der Zugriff nicht mehr widerrufen werden und die Einhaltung von IT-Sicherheitsstandards weder &#252;berpr&#252;ft noch unterst&#252;tzt werden. Zudem existiert keine Transparenz &#252;ber Datenumgang und -lokalit&#228;t, worunter sowohl die IT-Sicherheit als auch die Forschungsreproduzierbarkeit leiden.</Pgraph><Pgraph>Gleichzeitig versch&#228;rfen sich die legislativen Anforderungen: Im European Health Data Space ist sekund&#228;re Datennutzung nur &#252;ber Secure Processing Environments m&#246;glich <TextLink reference="3"></TextLink>, und das Gesundheitsdatennutzungsgesetz legt fest, dass Konzepte zur Nutzung von sicheren Verarbeitungsumgebungen entwickelt werden sollen <TextLink reference="4"></TextLink>. Auch wachsen, insbesondere durch die steigende Adoption von k&#252;nstlicher Intelligenz <TextLink reference="5"></TextLink>, die Anforderungen an Rechenkapazit&#228;ten - typische Forschungsumgebungen bieten zu wenig Rechenleistung, w&#228;hrend in herk&#246;mmlichen High Performance Computing (HPC) Systemen der Fokus prim&#228;r auf Leistungsmaximierung liegt.</Pgraph><Pgraph>Als L&#246;sung hat die Gesellschaft f&#252;r wissenschaftliche Datenverarbeitung mbH G&#246;ttingen (GWDG) ein HPC-basiertes Trusted Research Environment (TRE) entwickelt, das auf dem etablierten &#34;5 SAFE&#34;-Framework aufbaut <TextLink reference="6"></TextLink>, <TextLink reference="7"></TextLink> und leistungsstarke Datenanalyse unter h&#246;chsten Sicherheitsanforderungen erm&#246;glicht.</Pgraph><Pgraph><Mark1>Methoden:</Mark1> Unser TRE implementiert das &#8222;5 SAFE&#8220;-Framework vollst&#228;ndig: Safe People (vertrauensw&#252;rdige, geschulte Nutzer), Safe Projects (nur genehmigte Projekte erhalten zeitlich beschr&#228;nkten Zugang), Safe Settings (isolierte Datenverarbeitung ohne Downloadm&#246;glichkeit), Safe Outputs (manuelle Statistical Disclosure Control vor Export durch Datenbesitzer) und Safe Data (pseudonymisierte Daten). Aufbauend auf der Standardisierungsarbeit der MII muss der Forschende f&#252;r den Zugriff auf Forschungs- und Versorgungsdaten den Projektantrag beim DIZ des Datenbesitzers stellen, der von einem Use-and-Access-Committee genehmigt werden muss. Nach erfolgreicher Schulung und Nutzervereinbarung richtet die GWDG projektspezifische HPC-Umgebungen ein, in denen pseudonymisierte Daten verschl&#252;sselt vom DIZ hochgeladen werden. Innerhalb der Forschungsumgebung k&#246;nnen Forschungsgruppen eigene Berechtigungssysteme erstellen.</Pgraph><Pgraph>Die Verarbeitung erfolgt in isolierten Umgebungen via Singularity-Containern mit permanenter Datenverschl&#252;sselung (GoCryptFS) und starken Netzwerk- und Dateibeschr&#228;nkungen mittels eBPF&#47;Firewall. Der Zugriff findet durch eine virtuelle Linux-Desktopumgebung statt. Da sich die Desktopumgebung bereits auf einem vollwertigen, nicht-virtualisierten Rechenknoten befindet, kann die Datenexploration und -analyse mit integrierten Analysetools oder spezialisierter Software interaktiv stattfinden. F&#252;r lange, rechenintensive Jobs k&#246;nnen zudem SLURM-Jobs genutzt werden.</Pgraph><Pgraph>F&#252;r den Datenexport wurde ein Schleusensystem-Workflow implementiert, bei dem nur aggregierte, nicht-personenidentifizierbare Daten nach einem Vier-Augen-Prinzip exportiert werden d&#252;rfen.</Pgraph><Pgraph><Mark1>Ergebnisse:</Mark1> Unsere TRE-L&#246;sung integriert sich nahtlos in bestehende Forschungsprozesse. Neben der verbesserten Datensicherheit durch Verschl&#252;sselung, Isolation, einem kryptografisch erzwungenen Rechtesystem und weiteren Anpassungen auf Kernel-Ebene bietet sie:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Vollst&#228;ndige Kontrolle &#252;ber Datenlebenszyklus f&#252;r Dateneigent&#252;mer</ListItem><ListItem level="1">Bereitstellung von Sensibilisierungstraining f&#252;r Forscher</ListItem><ListItem level="1">Transparenz durch Audit-Trails aller Dateizugriffe</ListItem><ListItem level="1">Interaktive Forschungsumgebungen mit High-Performance-Computing Kapazit&#228;ten</ListItem><ListItem level="1">Compliance mit internationalen Standards (ISO9001, ISO27001, C5 in Vorbereitung)</ListItem></UnorderedList></Pgraph><Pgraph>Ein Pilotprojekt mit den Universit&#228;tsmedizin G&#246;ttingen und Greifswald wird aktuell durchgef&#252;hrt.</Pgraph><Pgraph><Mark1>Schlussfolgerung:</Mark1> Das entwickelte HPC-basierte TRE erf&#252;llt alle 5-SAFE Kriterien und stellt einen Fortschritt f&#252;r die sichere Analyse medizinischer Daten dar, insbesondere f&#252;r rechenintensive Use-Cases wie Genomik-Analysen oder KI-gest&#252;tzte Bildauswertungen. Es &#252;berwindet die Leistungslimitationen traditioneller TREs und erm&#246;glicht ein interaktives grafisches Arbeiten. Die nahtlose Integration in bestehende Workflows und Nutzung etablierter Kompetenzen erleichtern die Integration. Mit der Fertigstellung der letzten Komponenten im zweiten und dritten Quartal dieses Jahres wird die TRE zu einer umfassenden L&#246;sung f&#252;r die sichere Analyse sensibler medizinischer Daten.</Pgraph><Pgraph>Die Autoren sind Mitarbeiter der GWDG und beschreiben in diesem Beitrag die TRE-L&#246;sung dieser Institution.</Pgraph><Pgraph>Die Autoren geben an, dass kein Ethikvotum erforderlich ist.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Semler SC</RefAuthor>
        <RefAuthor>Wissing F</RefAuthor>
        <RefAuthor>Heyder R</RefAuthor>
        <RefTitle>German Medical Informatics Initiative</RefTitle>
        <RefYear>2018</RefYear>
        <RefJournal>Methods Inf Med</RefJournal>
        <RefPage>e50-e56</RefPage>
        <RefTotal>Semler SC, Wissing F, Heyder R. German Medical Informatics Initiative. Methods Inf Med. 2018 Jul;57(S 01):e50-e56. DOI: 10.3414&#47;ME18-03-0003</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3414&#47;ME18-03-0003</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Albashiti F</RefAuthor>
        <RefAuthor>Thasler R</RefAuthor>
        <RefAuthor>Wendt T</RefAuthor>
        <RefAuthor>Bathelt F</RefAuthor>
        <RefAuthor>Reinecke I</RefAuthor>
        <RefAuthor>Schreiweis B</RefAuthor>
        <RefTitle>Die Datenintegrationszentren &#8211; Von der Konzeption in der Medizininformatik-Initiative zur lokalen Umsetzung in einem Netzwerk Universit&#228;tsmedizin</RefTitle>
        <RefYear>2024</RefYear>
        <RefJournal>Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz</RefJournal>
        <RefPage>629-636</RefPage>
        <RefTotal>Albashiti F, Thasler R, Wendt T, Bathelt F, Reinecke I, Schreiweis B. Die Datenintegrationszentren &#8211; Von der Konzeption in der Medizininformatik-Initiative zur lokalen Umsetzung in einem Netzwerk Universit&#228;tsmedizin &#91;Data integration centers-from a concept in the Medical Informatics Initiative to its local implementation in the Network of University Medicine&#93;. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz. 2024 Jun;67(6):629-636. DOI: 10.1007&#47;s00103-024-03879-5</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s00103-024-03879-5</RefLink>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Anonym</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>EHDS Regulation. HealthDCAT-AP. Literacy Article 73</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>EHDS Regulation. HealthDCAT-AP. Literacy Article 73. Available from: https:&#47;&#47;metadata.healthdataportal.eu&#47;dev.py&#63;N&#61;simple&#38;O&#61;2662</RefTotal>
        <RefLink>https:&#47;&#47;metadata.healthdataportal.eu&#47;dev.py&#63;N&#61;simple&#38;O&#61;2662</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Anonym</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear></RefYear>
        <RefBookTitle>Gesetz zur Nutzung von Gesundheitsdaten zu gemeinwohlorientierten Forschungszwecken und zur datenbasierten Weiterentwicklung des Gesundheitswesens (Gesundheitsdatennutzungsgesetz - GDNG)</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Gesetz zur Nutzung von Gesundheitsdaten zu gemeinwohlorientierten Forschungszwecken und zur datenbasierten Weiterentwicklung des Gesundheitswesens (Gesundheitsdatennutzungsgesetz - GDNG). Available from: https:&#47;&#47;www.gesetze-im-internet.de&#47;gdng&#47;BJNR0660B0024.html</RefTotal>
        <RefLink>https:&#47;&#47;www.gesetze-im-internet.de&#47;gdng&#47;BJNR0660B0024.html</RefLink>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Xie Y</RefAuthor>
        <RefAuthor>Zhai Y</RefAuthor>
        <RefAuthor>Lu G</RefAuthor>
        <RefTitle>Evolution of artificial intelligence in healthcare: a 30-year bibliometric study</RefTitle>
        <RefYear>2025</RefYear>
        <RefJournal>Front Med (Lausanne)</RefJournal>
        <RefPage>1505692</RefPage>
        <RefTotal>Xie Y, Zhai Y, Lu G. Evolution of artificial intelligence in healthcare: a 30-year bibliometric study. Front Med (Lausanne). 2025 Jan 15;11:1505692. DOI: 10.3389&#47;fmed.2024.1505692</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3389&#47;fmed.2024.1505692</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Stokes P</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2017</RefYear>
        <RefBookTitle>The &#8216;Five Safes&#8217; &#8211; Data Privacy at ONS</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Stokes P. The &#8216;Five Safes&#8217; &#8211; Data Privacy at ONS. Office for National Statistics; 2017. Available from: https:&#47;&#47;blog.ons.gov.uk&#47;2017&#47;01&#47;27&#47;the-five-safes-data-privacy-at-ons&#47;</RefTotal>
        <RefLink>https:&#47;&#47;blog.ons.gov.uk&#47;2017&#47;01&#47;27&#47;the-five-safes-data-privacy-at-ons&#47;</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Hubbard T</RefAuthor>
        <RefAuthor>Reilly G</RefAuthor>
        <RefAuthor>Varma S</RefAuthor>
        <RefAuthor>Seymour D</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2020</RefYear>
        <RefBookTitle>Trusted Research Environments (TRE) Green Paper</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Hubbard T, Reilly G, Varma S, Seymour D. Trusted Research Environments (TRE) Green Paper. Version 2.0.0. Zenodo; 2020. DOI: 10.5281&#47;zenodo.4594704</RefTotal>
        <RefLink>https:&#47;&#47;doi.org&#47;10.5281&#47;zenodo.4594704</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>