Logo

German Congress of Orthopaedics and Traumatology (DKOU 2025)

Deutsche Gesellschaft für Orthopädie und Unfallchirurgie (DGOU), Deutsche Gesellschaft für Orthopädie und Orthopädische Chirurgie (DGOOC), Deutsche Gesellschaft für Unfallchirurgie (DGU), Berufsverband für Orthopädie und Unfallchirurgie (BVOU)
28.-31.10.2025
Berlin


Meeting Abstract

Entwicklung eines Machine Learning Models zur Evaluation des Heilungsergebnisses bei Critical-Size- Knochendefekten anhand eines Knochenscores

Jonas Neijhoft 1
Wanda Virefléau 1,2
René Verboket 1
Christoph Hoog Antink 2
Ingo Marzi 1
Dirk Henrich 1
1Universitätsmedizin Frankfurt, Klinik für Unfallchirurgie und Orthopädie, Frankfurt am Main, Deutschland
2KIS*MED, Technische Universität Darmstadt, Darmstadt, Deutschland

Text

Zielsetzung und Fragestellung: Das critical-size Defektmodell des Rattenfemurs ist ein etabliertes System zur Untersuchung neuer therapeutischer Ansätze in der Knochenheilung. Die histologische Analyse ist dabei ein zentraler, aber arbeitsintensiver Prozess. Die Hypothese war, dass durch den Einsatz eines Convolutional Neural Networks (CNNs) zur automatisierten Segmentierung und Klassifikation histologischer Daten, die Effizienz und Objektivität der Auswertung kritischer Knochendefekte verbessert werden kann.

Material und Methoden: Es wurde ein Modell zur Segmentierung (Abgrenzung von Gewebestrukturen wie Knochen, Knorpel, Knochenmark und fibrösem Gewebe) sowie zur Klassifikation (Bewertung des Heilungserfolgs) entwickelt. Die Datengrundlage bestand aus 669 Movat-Pentachrom-gefärbten histologischen Schnitten aus experimentellen femoralen Knochendefekten bei Ratten in unterschiedlichen Heilungsstadien. Die histologischen Schnitte wurden in vier Heilungsgrade eingeteilt, die von sehr schlecht (keine bis minimale Knochenbildung, Grad 4) bis gut (vollständige knöcherne Überbrückung des Defekts, Grad 1) reichten. Zur Segmentierung wurden manuell erstellte Trainingsmasken genutzt. Als Modell diente eine modifizierte U-Net-Variante (Ronneberger, 2015), die mit 428 Trainings-, 107 Validierungs- und 134 Testschnitten trainiert wurde. Zur Validierung wurde ein neu entwickelter Knochenscore (20 Stufen: -10 bis +10) angewandt, in den das Modell, histologisch geschulte Studenten und Experten Defekte einordneten.

Ergebnisse: Zur Leistungsbewertung wurden der Dice-Koeffizient für die Segmentierung sowie die Klassifikationsgenauigkeit herangezogen. Nach zwei Trainingsdurchläufen (47 bzw. 23 Epochen) und adaptiven Anpassungen der Lernrate zeigten sich ein Anstieg des Dice-Koeffizienten und der Genauigkeit sowie eine Abnahme des Verlustwerts über die Trainingszyklen hinweg.

Defekte der Kategorie 4 wurden in 87,5% der Fälle korrekt klassifiziert, während 10% fälschlicherweise als Kategorie 3 eingestuft wurden. Gut verheilte Defekte (Grad 1) wurden mit einer Genauigkeit von 95,5% korrekt identifiziert. Die höchsten Fehlklassifikationen traten in den intermediären Graden 2 und 3 auf, in denen die korrekte Zuordnung in 60,7% bzw. 52,3% der Fälle erfolgte. Im neu entwickelten Knochenscore konnte das Modell vergleichbare Ergebnisse wie in die Histologie eingearbeitete Studenten erreichen.

Diskussion und Schlussfolgerung: Diese Studie stellt das erste maschinelle Lernmodell zur automatisierten Bewertung der Heilungsergebnisse experimenteller kritischer Knochendefekte vor. Durch die Kombination von Segmentierungs- und Klassifikationsansätzen ermöglicht das Modell eine präzise Einschätzung des Heilungsstatus und differenziert zuverlässig zwischen schlecht und gut verheilten Defekten. Eine Erweiterung um funktionelle Parameter, wie die Biegesteifigkeit, könnte die prädiktive Genauigkeit weiter optimieren und einer Auswertung auf Expertenniveau gleichstellen.