Logo

70. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V.

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)
07.-11.09.2025
Jena


Meeting Abstract

Anonymisierung von DNA-Sequenzdaten in der Infektionsdiagnostik

Anne-Kathrin Dietel 1
Marie Lataretu 2
Sascha Braun 3
Christian Brandt 4,5
Jens Hellwage 1
1InfectoGnostics Forschungscampus Jena e.V., Jena, Germany
2Genom-Kompetenzzentrum, Robert Koch-Institut, Berlin, Germany
3Leibniz-Institut für Photonische Technologien, Jena, Germany
4Institut für Infektionsmedizin und Krankenhaushygiene, Universitätsklinikum Jena, Jena, Germany
5Nanozoo GmbH, Jena, Germany

Text

Die Bestimmung von Infektionserregern erfolgt häufig mittels Next Generation Sequencing (NGS)-Technologien. Aufgrund der Probennahme am Patienten wird das genetische Material des Erregers häufig mit humaner DNA kontaminiert und ebenfalls der Sequenzierung unterzogen. Derzeit durchlaufen die erzeugten Datensätze keinen gezielten Filterprozess zur Enfernung humaner Sequenzen und bergen somit das Risiko, einen Patienten zu re-identifizieren. Dies stellt eine Herausforderung für den Datenschutz und die sichere Nutzung der Daten in Forschung und Diagnostik dar. Ziel des Projekts ist es, humane DNA bereits während der Sequenzierung zu entfernen, um eine Archivierung des menschlichen Erbguts zu vermeiden.

Da die Zusammensetzung von humaner zu bakterieller DNA in einem Patientenabstrich stark variiert, wurden in einer experimentellen Studie gezielt verschiedene Mengen humaner DNA mit DNA typischer bakterieller Infektionserreger kombiniert (10-90%). Mittels eines Workflows aus adaptiver Sequenzierung (Oxford Nanopore Technologies) und einem daran angeschlossenen Post-Processing-Algorithmus konnten über 99% des ursprünglich eingesetzten humanen Materials entfernt werden. Die verbliebenen humanen Sequenzen wiesen aufgrund ihrer geringen Länge und häufigen Sequenzwiederholungen nur einen geringen Informationsgehalt auf. Der entwickelte Workflow minimiert somit das Re-Identifikationsrisiko der jeweiligen Patienten und stellt damit eine geeignete Anonymisierungsmethode für DNA-Proben in der Infektionsdiagnostik dar.

Das Projekt ist eines von vier Use-Cases aus dem BMBF-geförderten Forschungscluster AVATAR, welches sich mit der Sekundärnutzung von Gesundheitsdaten befasst.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.