70. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V.
70. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V.
Klinische Studien in Deutschland: Registerbasierte Identifikation, Duplikaterkennung und Umgang mit Inkonsistenzen
2ZB MED - Informationszentrum Lebenswissenschaften, Köln, Germany
Text
Hintergrund und Zielsetzung: Valide Übersichten zu interventionellen klinischen Studien in Deutschland sind eine zentrale Grundlage für Meta-Forschung, Forschungsförderung und gesundheitspolitische Analysen. Darüber hinaus sind sie essenziell für Ärzt:innen und Patient:innen, um geeignete Studien zur Teilnahme zu identifizieren, sowie für Forschende, die bestehende Studien für Kooperationen oder Data-Sharing identifizieren möchten. Trotz regulatorischer und ethischer Registrierungspflichten sowie der verpflichtenden Begutachtung durch Ethikkomissionen ist diese Übersicht nicht verfügbar.
Das internationale Metaregister der WHO (ICTRP) führt die Daten aller Primärregister zusammen. Das ICTRP erlaubt aber nur eine eingeschränkte Suche und Filterung. Das ECRIN Metadata Repository hat einen Fokus auf europäische Studien und führt bereits eine vielversprechende Erkennung von Mehrfachregistrierungen durch. Analytische Workflows zur Qualitätsprüfung oder zur Erstellung von Studiensamples für bestimmte Sponsoren oder Förderer bleiben jedoch eine Herausforderung.
Vor diesem Hintergrund vergleichen wir Herausforderungen und Lösungsansätze aus zwei unabhängig voneinander entwickelten Arbeitskontexten: dem Health Study Hub, welcher im Kontext der Nationalen Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten (NFDI4Health) entwickelt wird, und mehreren Meta-Research-Projekten am QUEST Center for Responsible Research (Berlin Institute of Health), die auf die Identifikation, Analyse und Erfüllung von Transparenzkriterien klinischer Studien in Deutschland ausgerichtet sind. Ziel ist eine systematische Darstellung von Identifikation-, Validierungs- und Harmonisierungsschritten sowie der daraus abgeleiteten Limitationen und Stärken verschiedener Herangehensweisen.
Methode: Wir bringen die in beiden Arbeitskontexten eingesetzten Strategien zur Identifikation von Studien in Deutschland zusammen, die zur Erkennung von Mehrfachregistrierungen in den relevanten Registern (Cross-Registrierung) sowie zur Synthese der Daten verwendet wurden. Die Ableitung erfolgt auf Grundlage dokumentierter technischer Workflows, empirischer Zwischenergebnisse und erfahrungsbasierter Bewertungen durch das jeweilige Projektteam. Aus diesen Erkenntnissen leiten wir Empfehlungen ab – sowohl für zukünftige methodische Forschung (z.B. zur Verbesserung der Cross-Registrierungserkennung) als auch für Verbesserungen in der Datenqualität. Letztere betreffen insbesondere die Verantwortung der Studienverantwortlichen sowie die Rolle relevanter Akteure an Universitäten, Förderorganisationen und Ethikkommissionen.
Ergebnisse: Der Vergleich der Ansätze aus dem Health Study Hub und den Projekten am QUEST Center zeigt verschiedene Möglichkeiten auf, interventionelle Studien in Deutschland aus Registern zu extrahieren, potenzielle Duplikate/Cross-Registrierungen und heterogene Angaben zu identifizieren. Dabei kommen u.a. TRN-basierte Matching-Verfahren, Titelvergleiche, sowie manuelle Prüfungen zum Einsatz. Unterschiede zeigen sich in der Datenbasis, im Grad der Automatisierung und im Umgang mit unvollständigen oder fehlerhaften Angaben. Erste Umsetzungen deuten darauf hin, dass eine weitgehende technische Identifizierung möglich ist – aber nur unter Bedingungen gezielter Validierungs- und Nachbearbeitungsschritte. Konkrete Workflows und Ergebnisse werden vorgestellt.
Diskussion: Neben den uneinheitlichen Datenformaten sowie teils fehlender Schnittstellen der Registerinfrastrukturen ist die Datenqualität eine der identifizierten Herausforderungen. Perspektivisch könnte ein Feedback-System aufgebaut werden, das auf Basis von automatisierten Prozessen Hinweise zur Verbesserung einzelner Registereinträge gibt – z.B. bei fehlenden Verweisen von potentiellen Cross-Registrierungen, fehlerhafter oder unterschiedlicher Datenerfassung bei Cross-Registrierungen oder innerhalb der Registrierung. Zudem könnten Ergebnisse aus Monitoringaktivitäten – etwa zur Verfügbarkeit von Ergebnissen oder zur Aktualität von Studienstatus – systematisch mit den jeweiligen Registereinträgen verknüpft werden, um Transparenz und Nachnutzung weiter zu fördern.
Die Autoren geben an, dass kein Interessenkonflikt besteht.
Die Autoren geben an, dass kein Ethikvotum erforderlich ist.



