41. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)
41. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)
Dynamische 3D-MRT der Stimmlippenschwingungen zur Analyse verschiedener Stimmproduktionsmechanismen
2Medizinische Fakultät der Albert-Ludwigs-Universität Freiburg, Freiburg, Deutschland
3Klinik für Radiologie, Institut für Medizinphysik, Universitätsklinikum Freiburg, Freiburg, Deutschland
4Abteilung Phoniatrie und Pädaudiologie, Klinik für Hals-Nasen-Ohrenheilkunde, Klinikum der Universität München (LMU), München, Deutschland
5Institut Rummel, Frankfurt, Deutschland
Abstract
Hintergrund: Die klinische Stimmdiagnostik beruht traditionell auf endoskopischen Verfahren in Kombination mit Stroboskopie und Hochgeschwindigkeitsvideoaufnahmen (HSV), welche jedoch lediglich eine zweidimensionale Draufsicht auf die komplex dreidimensionalen Schwingungen der Stimmlippen erlauben. Besonders die vertikale Dynamik bleibt dabei weitgehend unzugänglich. Simulationen und ex-vivo-Studien zeigen jedoch, dass vertikale Parameter wie Dicke der Stimmlippen und Konfiguration des Glottiskanals entscheidend für den Glottisschluss, sowie die Effizienz und Stimmqualität sind.
Material und Methoden: Erste in-vivo-Darstellungen dreidimensionaler Stimmlippendynamik mittels MRT gelangen kürzlich durch die Vorarbeiten unserer Arbeitsgruppe. In dieser Studie wird erstmals die Zero-Echo-Time (ZTE)-MRT eingesetzt, um Stimmlippenschwingungen bei einer professionell trainierten Sängerin in verschiedenen Stimmgebungsmechanismen zu quantifizieren. Die Klassifikation erfolgte anhand des Estill Voice Training®-Modells. Erfasst wurden u.a. maximale vertikale und laterale Stimmlippenverschiebung sowie Kontaktflächenverläufe. Die MRT-Daten wurden in zehn Phasen des Schwingungszyklus segmentiert und geometrisch ausgewertet. Als Referenz dienten separat erhobene HSV- und Elektroglottographie (EGG)-Daten.
Ergebnisse: Die Ergebnisse zeigen deutliche Unterschiede zwischen den Stimmmodi. So wies eine leicht behauchte Phonation („Stiff“) die geringste, eine gepresste Phonation mit Taschenfaltenadduktion („Thick“ & FVF constrict) die größte Kontaktfläche auf. Letztere zeigte zudem minimale vertikale Verschiebung. Ein starker Zusammenhang zwischen medialer Stimmlippendicke und Kontaktfläche konnte bestätigt werden. MRT-basierte Messungen stimmen gut mit klassischen Parametern wie dem „Open Quotient“ (OQ) aus EGG und der Glottisfläche überein, liefern darüber hinaus jedoch absolute und räumlich aufgelöste Zusatzinformationen.
Schlussfolgerungen: Diese Studie belegt, dass 3D-ZTE-MRT eine vielversprechende Methode zur differenzierten In-vivo-Erfassung der Stimmlippendynamik darstellt. Die berechneten Parameter eröffnen neue Perspektiven in der Stimmdiagnostik und -pädagogik. Zukünftig soll die hier angewendete Methode auf Patient*innen mit Stimmstörungen ausgeweitet und automatisierte Auswertungsverfahren etabliert werden.
Text
Hintergrund
Die stimmphysiologische Forschung sowie die klinische Beurteilung von Stimmstörungen basieren häufig auf der endoskopischen Bildgebung der Stimmlippenschwingung. Obwohl die endoskopischen Hochgeschwindigkeitsvideoaufnahmen (HVI) und Videolaryngostroboskopie die Oszillation der Stimmlippen in einer zweidimensionalen Aufsicht erfassen, können sie doch die komplexe dreidimensionale Bewegung nicht erfassen. Insbesondere bleiben Stimmlippenparameter wie die vertikale Bewegung, die Dicke, der Schluss sowie die vollständige Öffnungsdynamik verborgen, wodurch eine umfassende Analyse der Schwingungsmechanik eingeschränkt ist [1]. Zur besseren Erfassung dreidimensionaler Dynamiken wurden in den letzten Jahren zunehmend Computersimulationen [2], [3], [4] oder ex vivo Untersuchungen an tierischen oder menschlichem Larynxproben [5], [6], [7] durchgeführt. Diese Untersuchungen zeigten die klinische Relevanz der medialen Oberflächengeometrie und der vertikalen Dicke der Stimmlippen.
Messungen dieser Parameter an Probanden während der Phonation waren bisher aufgrund der oben genannten methodischen Limitationen endoskopischer Verfahren unmöglich. Erst kürzlich gelang es uns erstmals, diese grundlegende Begrenzung zu überwinden, indem wir mit dynamischer 3D-MRT die Stimmlippenschwingungen mit Zero Echo Time (ZTE) sichtbar gemacht haben [8]. In der vorliegenden Studie wenden wir dieses Verfahren erstmals auf eine professionell ausgebildete Sängerin an, um unterschiedliche Phonationsmechanismen dreidimensional zu analysieren. Ziel ist es, neue Erkenntnisse über die vertikale und horizontale Bewegung sowie die Dicke der Stimmlippen während des Schwingungsablaufes verschiedener Phonationsarten zu gewinnen und diese mit etablierten Methoden wie der HVI und Elektroglottographie (EGG) zu vergleichen.
Material und Methoden
Die Aufnahmen erfolgten an einem klinischen 3T Tomographen (Siemens PrismaFit) mit einer selbst entwickelten Zero-Echo-Time-Sequenz (ZTE), welche eine zeitliche Auflösung Δt < 1 ms sowie eine räumliche Auflösung Δx < 1 mm ermöglicht [8]. Eine professionell ausgebildete Sängerin (Mitautorin SR) phonierte dabei 6 verschiedene Stimmgebungsmechanismen, jeweils mit dem Vokal [i:] bei konstanter Grundfrequenz von 190 Hz und möglichst stabiler Vokaltraktposition. Zur Datenaufnahme wurde direkt über dem Kehlkopf eine Empfangsspule positioniert. Die 6 Phonationsarten wurden nach Estill Voice Training® [9] definiert: 1) „Thick“ (dick) und 2) „Thin“ (dünn) bezieht sich auf die beabsichtigte mediale Dicke des Stimmlippenkörpers, während 3) „Stiff“ (steif) eine phonatorische Konfiguration beschreibt, die durch longitudinale Spannung und Dehnung der Stimmlippen gekennzeichnet ist. Dies führt typischerweise zu einer posterioren Glottislücke und unterschiedlichen Graden behauchten Phonierens. Die Konfigurationen 4) „Thick & ventricular folds (VenF) retract“ und 5) „Thick & VenF constrict“ kombinieren dicke Stimmlippen mit entweder Abduktion bzw. Adduktion der Taschenfalten (VenF). Die Konfiguration 6) „Thick & Aryepiglottischer Sphincter (AES)“ beinhaltet eine zusätzliche Aktivierung des AES bei gleichzeitig dicken Stimmlippen, wobei die Taschenfalten eine neutrale Position einnehmen sollen.
Während der Aufnahme (TA = 5 min 18 s) konnte die Probandin bei Bedarf atmen und schlucken – diese unerwünschten Bewegungen wurden über ein parallel gemessenes Navigatorsignal des Kehlkopfs erfasst und nachträglich korrigiert. Die aufgenommenen MRT-Daten wurden dann in 10 Phasen eines Schwingungszyklus zugeordnet, und es wurden 3D Bilddatensätze rekonstruiert. In jeder Phase wurde die Stimmlippenkontur segmentiert, um die maximale horizontale und vertikale Bewegung sowie der Kontaktfläche im mid-sagittalen Schnitt zu bestimmen. Zum Vergleich wurden in einer separaten Sitzung transnasale Hochgeschwindigkeitsvideoaufnahmen (HVI) mit 20.000 Bildern/s sowie akustische, EGG und Schalldruckmessungen durchgeführt [10]. Die Audiosignale aus beiden Verfahren wurden anschließend mit Hilfe der Open-Source-Software VoxPlot spektralanalytisch ausgewertet (u.a. LTAS, H1–H2, spektrale Neigung).
Ergebnisse
Die Stimmlippenoszillation und -konfiguration variierte deutlich zwischen den 6 untersuchten Phonationsqualitäten (Abbildung 1 [Abb. 1], exemplarisch dargestellt für die Phase der maximalen Glottisöffnung).
Abbildung 1: Sagittale, koronare und 3D-Luft/Gewebe-Grenzflächen der Stimmlippen-MRT bei den jeweiligen Phonationsarten.
Bei „Thick“, „Thick & AES“ und „Thick & VenF constrict“ zeigte sich ein ausgeprägter vertikaler Stimmlippenschluss mit eher quadratischer SL-Form. Demgegenüber wiesen „Thin“, „Stiff“ eine eher dreieckige Stimmlippenkonfiguration mit reduzierter Schlussfläche auf. „Thick & VenF retract“ zeigte zwischen den beiden Ausprägungen liegende Konfiguration.
Der dynamische Anteil der Kontaktfläche zwischen den Stimmlippen war am größten für „Thick & AES“ und „Thick“ und wurde in der Reihenfolge „Thick & VenF retract“, „Thick & constrict“, „Thin“ und „Stiff“ reduziert (Tabelle 1 [Tab. 1]). Entsprechend nahm der Offenheitsquotient (basierend auf dem HVI) in dieser Reihenfolge zu. Das Maximum der Kontaktfläche trat dabei bei „Thick“ früher und bei „Thin“ und „Thick & VenF constrict“ später im Zyklus auf.
Tabelle 1: Open Quotient (OQ) der Glottisöffnungsfläche (GAW) basierend auf HVI und EGG, maximale vertikale und horizontale Stimmlippenverschiebung, Stimmlippenlänge und maximale dynamische Stimmlippenkontaktfläche der unterschiedlichen Phonationsarten.
Die Analyse der horizontalen und vertikalen SL-Bewegung ergab vergleichbare Bewegungsradien von 2–3 mm in beide Bewegungsrichtungen. Die stärkste vertikale Bewegung wurde bei „Stiff“ und „Thick & VenF retract“, die geringste bei „Thick & VenF constrict“ festgestellt. Die größte horizontale Bewegung zeigte sich bei „Thick“, die geringste bei „Thin“. Die Stimmlippenlänge variierte je nach Phonationsqualität: kürzeste bei „Thick & AES“, längste bei „Thin“.
Die Kymogramme in Abbildung 2 [Abb. 2] zeigen, dass „Thick“, „Thick & AES“ und „Thick & VenF constrict“ insbesondere lateral die größte vertikale SL-Dicke im Verlauf der Oszillationsbewegung aufweisen. Eine geringe vertikale Ausdehnung zeigten „Thin“ und „Thick & VenF retract“. Die SL-Dicke in Abhängigkeit von der Distanz zur Medialebene verdeutlicht, dass „Thick“ und „Thick & AES“ die größte vertikale, aber geringste laterale Ausdehnung aufwiesen. Im Gegensatz dazu zeigten „Stiff“ und „Thick & VenF retract“ die geringste vertikale, aber die größte laterale Ausdehnung.
Abbildung 2: Kymogramm der Stimmlippendicke des Schwingungszyklus in der mittleren koronaren Ebene mit max. Schwingungsamplitude sowie Stimmlippendicke einer Stimmlippe an der Glottisöffnung ausgerichtet für alle Phonationsarten.
Diskussion
Diese Studie beschreibt erstmals die dreidimensionale Stimmlippenoszillation basierend auf dynamischer MRT für 6 unterschiedliche Phonationsmechanismen einer professionell trainierten Sängerin. Die MRT-basierten Parameter wurden mit HVI basierten Daten derselben Probandin verglichen. Die Stimmlippendicke während der Phonation bestätigt Daten, die bisher ex vivo [11], [12] und in Simulationsstudien [4] gemessen werden konnten: so konnte erstmals die postulierte Dickenzunahme der SL bei Aktivierung des Musculus thyroarytenoideus (TA) im Bruststimm- bzw. Sprechmodus („Thick“) bestätigt werden. Im Gegensatz dazu zeigte „Thin“ (Kopfstimme, M2, dominiert durch Aktivierung des M. cricothyroideus) eine verringerte Dicke und dreieckige SL Konfiguration. Die gemessene Kontaktfläche spiegelt die aus EGG-Messungen bekannten Relativwerte wider und weist daher vergleichbare Unterschiede auf: Beispielsweise korreliert die linksverschobene Position des Kontaktmaximums bei „Thick“ mit einer Linksneigung des EGG-Komplexes, mit geringem OQ während „Thin“ einen symmetrischeren Öffnungs-Schluss-Verlauf und höheren OQ zeigte. Insgesamt zeigt sich eine hohe Übereinstimmung der EGG- und GAW-basierten OQ-Werte mit den im MRT beobachteten SL-Kontaktflächen. Im Gegensatz zur EGG erlaubt die MRT die Erfassung der absoluten Kontaktamplitude, die bei „Thin“ deutlich reduziert war und mit verkürztem Stimmlippenschluss sowie erhöhten OQ-Werten in HVI- und EGG-Daten einherging. Auffällig war zudem, dass eine reduzierte Stimmlippendicke mit einer signifikanten Erweiterung supraglottischer Strukturen einherging – insbesondere des Sinus Morgagni (siehe Abbildung 1 [Abb. 1]), was endoskopisch bislang nicht erfasst werden konnte. Interessanterweise führte auch die aktive Retraktion der Taschenfalten bei „Thick & VenF retract“ trotz TA-Aktivierung zu einer geringeren Stimmlippendicke als bei „Thick“ ohne Retraktion. Dies zeigt, dass die Stimmlippendicke nicht nur durch die TA-/CT-Balance, sondern auch durch die angrenzende Raumkonfiguration beeinflusst wird. Während „Thick & AES“ und „Thick & constrict“ eine supraglottische Verengung mit verkürzter Stimmlippenlänge zeigten, war nur „Thick & AES“ mit hoher Kontaktflächenvariabilität sowie großer vertikaler und horizontaler Auslenkung assoziiert. Im Gegensatz dazu zeigte „Thick & VenF constrict“ eine reduzierte vertikale Bewegung und geringe Kontaktmodulation – was mit geringer Schwingungsamplitude verbunden ist. Die Befunde deuten darauf hin, dass selbst bei vergleichbarer laryngealer Konfiguration sowohl effektive als auch stark eingeschränkte Oszillationen auftreten können – abhängig von der muskulären Steuerung.
Fazit/Schlussfolgerung
Diese Studie zeigt erstmals, dass die dynamische 3D-ZTE-MRT eine differenzierte in-vivo Analyse der Stimmlippendicke, -bewegung und -kontaktfläche ermöglicht und damit eine präzise Beschreibung phonationsspezifischer Oszillationsmuster erlaubt. Die gewonnenen Parameter eröffnen neue diagnostische und didaktische Perspektiven und bilden die Grundlage für zukünftige Anwendungen bei Stimmstörungen sowie für automatisierte Auswertungsverfahren.
References
[1] Oren L, Khosla S, Gutmark E. Medial Surface Dynamics as a Function of Subglottal Pressure in a Canine Larynx Model. J Voice. 2021 Jan;35(1):69-76. DOI: 10.1016/j.jvoice.2019.07.015[2] Alipour F, Scherer RC. Vocal fold bulging effects on phonation using a biophysical computer model. J Voice. 2000;14(4):470-83. DOI: 10.1016/S0892-1997(00)80004-1
[3] Lehoux S, Zhang Z. A Methodology to Quantify the Effective Vertical Thickness of Prephonatory Vocal Fold Medial Surface. J Voice. 2024 Oct 23:S0892-1997(24)00338-2. DOI: 10.1016/j.jvoice.2024.09.047
[4] Zhang Z. Vocal Fold Vertical Thickness in Human Voice Production and Control: A Review. J Voice. 2023 Mar 22:S0892-1997(23)00078-4. DOI: 10.1016/j.jvoice.2023.02.021
[5] Berry DA, Montequin DW, Tayama N. High-speed digital imaging of the medial surface of the vocal folds. J Acoust Soc Am. 2001;110(5 Pt 1):2539-47. DOI: 10.1121/1.1408947
[6] Khosla S, Oren L, Ying J, Gutmark E. Direct simultaneous measurement of intraglottal geometry and velocity fields in excised larynges. Laryngoscope. 2014;124(S2):S1-S13. DOI: 10.1002/lary.24512
[7] Zhang Z, Chhetri DK. Effect of changes in medial surface shape on voice production in excised human larynges. J Acoust Soc Am. 2019 Nov;146(5):EL412. DOI: 10.1121/1.5131044
[8] Fischer JF, Tadjalli Mehr K, Traser L, Richter B, Bock, M. Isotropic 3D Sub-millimeter MRI of the Vocal Fold Oscillation with Sub-millisecond Temporal Resolution. In: ISMRM Annual Meeting Proceedings. 2024.
[9] Steinhauer K, Klimek M, Estill J. The Estill Voice Model: Theory and Translation. Pittsburgh: Estill Voice International; 2017.
[10] Echternach M, Burk F, Köberlein M, Selamtzis A, Döllinger M, Burdumy M, Richter B, Herbst CT. Laryngeal evidence for the first and second passaggio in professionally trained sopranos. PloS One. 2017;12(5):e0175865. DOI: 10.1371/journal.pone.0175865
[11] Hirano M. Vocal mechanisms in singing: Laryngological and phoniatric aspects. J Voice. 1988;2(1):51-69. DOI: 10.1016/S0892-1997(88)80058-4
[12] Van den Berg J. Register problems. Ann N Y Acad Sci. 1968 Nov 20;155(1):129-34. DOI: 10.1111/j.1749-6632.1968.tb56756.x
[13] Oren L, Khosla S, Farbos de Luzan C, Gutmark E. Effects of False Vocal Folds on Intraglottal Velocity Fields. J Voice. 2021 Sep;35(5):695-702. DOI: 10.1016/j.jvoice.2020.02.001
[14] Semmler M, Döllinger M, Patel RR, Ziethe A, Schützenberger A. Clinical relevance of endoscopic three-dimensional imaging for quantitative assessment of phonation. Laryngoscope. 2018 Oct;128(10):2367-74. DOI: 10.1002/lary.27165