Eine neue Auswertung von Tauchgangsprofilen – aber was können die Daten wirklich sagen?

Ein neues Paper zur DCS-Risikobewertung sorgt gerade für Diskussionen. Es wurde Anfang 2026 von einer Gruppe von Forschern veröffentlicht, die fast alle mit DAN Europe verbunden sind. Die Daten dafür kommen aus der DAN DSL Database, analysiert werden 127.957 Tauchgänge von 5.907 Tauchern. Neben den Tauchgangsprofilen beinhalten die Daten Informationen über die Taucher: Geschlecht, Größe, Gewicht, BMI, Kälte, Erschöpfung und einiges mehr – eine exzellente Chance, Hinweise zu den vielen offenen Fragen nach Risikofaktoren zu bekommen.
Auf Social Media werden einige der „Ergebnisse“ der Studie schon fleißig geteilt und diskutiert: Haben Frauen wirklich ein 3-4 mal erhöhtes Risiko, DCS zu bekommen? Und ist es pausibel, dass schlanke, eher untergewichtige Taucher ein höheres Risiko haben als übergewichtige?
Die teils überraschenden Ergebnisse könnten die Folge von einigen strukturellen Schwächen der Studie sein.

"Identification of DCS risk factors in recreational diving..."

Marroni, A., Kot, J., Pieri, M., Pelliccia, R., & Balestra, C. (2026). Identification of DCS risk factors in recreational diving: multifactorial model based on the DAN DSL Database 2024. International Maritime Health, 77(1), 1–12. https://doi.org/10.5603/imh.108038

Das fängt schon an mit der Frage, wie viele Tauchgangsprofile denn nun untersucht wurden. Vielleicht sind es nämlich auch 136.793 – einige Tauchgänge wurden zwar wegen Unklarheiten in den Daten aussortiert, tauchen aber später in der Auswertung trotzdem wieder auf.  Oder auch 127.197, die in der Frage nach der Häufigkeit von DCS auftauchen. Die Gesamtzahl der untersuchten Tauchgänge ist in dem Paper leider nicht konsistenter als der Rest, und der wenig sorgfältige Umgang mit diesen Zahlen stimmt misstrauisch.
Auf den ersten Blick klingt das aber dennoch beeindruckend: sehr viele Tauchgänge, reale Profile, große Datenbasis. Von der Auswertung solcher Daten versprechen sich viele Taucher relevante Erkenntnisse, und deshalb wird die Studie auch häufiger erwähnt und von mehr Menschen wahrgenommen, als es bei einem Nischenthema wie Dekompression normal wäre. Und weil es von DAN kommt, hat die Studie direkt einen Vertrauensvorschuß – aber hat sie den wirklich verdient?

Die Studie ist lang und wirft viele Fragen auf – zu viele, um sie in einem Blog zu besprechen. Drei Probleme stechen in dem Paper aber ganz besonders hervor, und die wollen wir uns in drei Beiträgen genauer anschauen. 

  1. Woher kommen die Daten? Die ganze Datensammlung wird nicht erklärt, und wie es aussieht, werden freiwillig berichtete Profile und an DAN gemeldete Fälle von DCS einfach zusammengenommen. Warum das ein Problem ist, besprechen wir hier: Statistics is hard to get
  2. Tauchgänge als unabhängige Events – die knapp 130.000 Tauchgänge werden ausgewertet als seien sie unabhängige Events, dabei stammen sie von nur knapp 6.000 Tauchern, die sehr unterschiedlich viel beigetragen haben. Warum das ein Problem ist, besprechen wir in diesem Artikel.
  3. Verwirrung mit dem „DSSG“: Die Autoren erfinden ein neues Maß für die Übersättigung, das sie nicht erklären – es ist aber eindeutig NICHT der normale GF bei Erreichen der Oberfläche, den Taucher kennen. Darum geht es in einem weiteren Blogbeitrag.

Manche Taucher zählen mehr als andere

In diesem Beitrag wollen wir einen Aspekt genauer anschauen, der zu Verzerrungen in den Ergebnissen führen kann: Was passiert, wenn Teile der Daten gar nicht unabhängig voneinander sind?

Die Studie selbst gibt an, dass einzelne Taucher sehr unterschiedlich viele Profile beigesteuert haben. Manche nur einen einzigen Tauchgang, andere sehr viele. Der Median liegt bei drei, das Maximum bei 1.432 Tauchgängen pro Taucher.
Wie war das gleich mit Median, Mittelwerten und so? Was ist hier gemeint? Der Median ist der Wert, bei dem die Hälfte der Daten darunter, die Hälfte darüber liegt. Das heißt, von den knapp 6.000 Tauchern haben 3.000 maximal 3 Tauchgänge beigetragen – das macht maximal 9.000 Tauchgänge, wahrscheinlich weniger. Die andern 3.000 haben je drei oder mehr beigetragen, von ihnen stammen dann mindestens 120.000 der Profile.

Eine Person, die extrem viele Tauchgänge beisteuert, weist viele Eigenschaften wie BMI und Geschlecht auf, die immer gleich bleiben. Ihre Daten zählen in der Auswertung mehr als diejenigen, die nur wenige Tauchgänge beigesteuert haben, und das kann das Bild verzerren. Zudem ist auch das Tauchverhalten einer Person meistens relativ konsistent, und damit werden dann auch die eigentlich von Tauchgang zu Tauchgang variablen Daten zu solchen, bei denen diese Person stärker in die Statistik einfließt als andere.

Das ist ein relevantes methodisches Problem. Um das genauer zu verstehen, hier  erst mal eine kleine Modellierung.

Wenn ein Taucher viele Daten beiträgt

Um ganz grundsätzlich zu verstehen, warum es nicht egal ist, wenn relevante Faktoren in der Auswertung in unterschiedlichem Maß zählen, nehmen wir mal ein kleines Modell. Gleich vorab: Bei größeren Datensätzen ist der Effekt bei weitem nicht so deutlich – wir wollen hier zeigen, wo methodisch das Problem liegt, und nehmen deshalb ein Beispiel, an dem es überdeutlich sichtbar wird. 

Wir denken uns 100 Taucher, die insgesamt 2000 Tauchgänge teilen. Dabei teilt einer gleich 1000 Tauchgänge, die anderen verteilen sich auf die restlichen 99 Taucher.

Man sieht hier direkt das Problem. Nur ein einziger Taucher trägt 50% der Daten bei – bestimmt also an der Person bleibende Merkmale wie Geschlecht und BMI zu 50%, obwohl er nur einer von hundert ist.
Was das in der Auswertung bedeutet, wenn man 10 DCS Fälle wild auf die geteilten Profile verteilt, schauen wir uns als nächstes an.

Simulation gemeldete Tauchprofile

Zwei Personen tauschen ihre Plätze

Aus diesen Profilen bauen wir jetzt kleines Gedankenexperiment. Dafür werden die Eigenschaften der 100 Taucher einmal zufällig festgelegt:

  • 25 Frauen, 75 Männer
  • BMI grob wie in einer europäischen Erwachsenenpopulation verteilt
  • Anzahl der geteilten Tauchgänge zufällig verteilt
  • 10 DCS-Fälle werden auf die Tauchgänge verteilt, mit höchstens einem pro Person

Mit diesem Datensatz analysieren wir, wie sich Geschlecht und BMI auf alle Tauchgänge verteilen – und wie auf die Tauchgänge, die mit DCS geendet haben. Daraus erstellen wir eine Auswertung und eine Grafik, die aussieht, als sei das richtig seriös: Wie hoch ist das DCS-Risiko nach Geschlecht und nach BMI? Während wir ein allgemeines Risiko von 0,5% über die gesamten 2000 Tauchgänge gesetzt haben, ändert sich hier die Verteilung.

Das machen wir zwei mal und ändern dabei nur eins an den Daten: In der ersten Sortierung ist der Taucher mit 1.000 Tauchgängen ein übergewichtiger Mann ohne DCS. Unter den Menschen mit nur einem gemeldeten Tauchgang ist eine untergewichtige Frau mit DCS. Und in der zweiten Auswertung tauschen wir diese beiden Personen aus. Wie sehen die Ergebnisse aus?

Ein übergewichtiger Taucher ohne DCS steuert 100 Tauchgänge bei
Untergewichtige Frau mit DCS steuert 1000 Tauchgänge bei

Kleine Änderung, große Wirkung

Wir können hier überdeutlich sehen, was es bedeutet, wenn eine Analyse einfach ignoriert, dass die Daten „Tauchgangsprofile“ eben nicht unabhängig sind von den Daten „Taucher“. Die eine untergewichtige Person mit DCS hat dafür gesorgt, dass „Untergewicht“ wie ein massiver Risikofaktor aussieht. Dabei ist es nur so, dass die drei untergewichtigen Taucher nur 5 Tauchgänge beigetragen haben, der eine übergewichtige aber 1000 – und das verschiebt hier das Ergebnis massiv. Und in dem Moment, in dem die Frau 1000 Tauchgänge beiträgt, erscheint es plötzlich so, als haben Männer mehr DCS – obwohl sie es sogar hatte.
Diesen Effekt muss man bei einer Auswertung vorab prüfen, etwa an kleineren Beispieldatensätzen, oder indem man nur einen Tauchgang pro Person aufnimmt und dann mit der Analyse vergleicht – Methoden dafür gibt es, das Problem ist ja bekannt.
Je größer die Menge an Daten wird, umso weniger relevant kann die Zahl der Datensätze pro Person werden. Wenn die Zahl der berichteten Tauchgänge sich so verteilt, wie das unter Tauchern nun mal verteilt ist; wenn unter den Vieltauchern und denen mit nur ganz wenigen Profilen die persönlichen Merkmale etwa gleich verteilt sind, dann spielt dieses Problem irgendwann keine Rolle mehr. Ob der Datensatz so aufgestellt ist, dass man die Frage ignorieren kann, muss man aber vorab validieren.

Was heißt das für das Paper?

Wir haben ja bereits vorab klargestellt, dass die Simulation rein didaktisch ist, und nichts mit den konkreten Zahlen aus der Studie zu tun hat. Wenn man eine enorm große Menge an Daten hat, ist der Effekt irgendwann nicht mehr relevant.
Aber: Die Datenmengen in der Studie sind nicht in allen Bereichen groß. Eins der „Ergebnisse“, die etwas Erstaunen hervorrufen, liegt ja in dem hohen DCS-Risiko bei untergewichtigen Personen – ein Ergebnis, mit dem niemand gerechnet hätte, gilt doch eigentlich allgemein Übergewicht als ein Risikofaktor, nicht Untergewicht.
Aber aus welcher Menge an Daten kommt denn die P(DCS), die Wahrscheinlichkeit, von 1,6%, dass ein Tauchgang einer Person mit moderatem Untergewicht? Diese Zahl kommt aus genau einem (!) DCS Fall in dieser BMI-Klasse…. Ein Fall mehr, und die Wahrscheinlichkeit wäre etwa 3,2; ein Fall weniger, und sie wäre 0 – da kann man hier nicht von viel mehr als statistischem Rauschen reden.
Aber schauen wir uns das mal genauer an. In der Studie werden zu Beginn die BMI-Klassen definiert, dabei steht auch, wie viele Tauchprofile in jeder BMI Klasse in der Datenbank vorliegen. Die Autoren kommen hier auf 101865 Profilen, bei denen der BMI bekannt war – die einzelnen Zahlen pro Profil ergeben aber 102.474. Wir arbeiten mal mit dieser Zahl weiter…..  Bei etwa 20% der Profile ist der BMI nicht bekannt. Und wie sich die BMI Klassen auf die Taucher verteilen, wird auch nicht erwähnt.
Das nächste, was zu BMI und DCS zu erfahren ist, steckt in einer Grafik, Figure 6. Dort ist die P(DCS) pro BMI Klasse eingetragen, also die Wahrscheinlichkeit in Prozent, dass ein Profil einer Person in dieser BMI Klasse mit DCS endet. Die reale Verteilung der DCS Fälle auf die BMI Klassen wird nicht gezeigt, und die Grafik ist nur als Schätzung ablesbar – aber das reicht, um eine Rekonstruktion der Verteilung der 628 DCS Fälle zu erstellen.

Rekonstruierte BMI-DCS-Tabelle

Arbeitsrekonstruktion auf Basis der publizierten Profilzahlen und plausibel aus Figure 6 abgelesener P(DCS)-Werte. Die konkreten Rohdaten pro BMI-Klasse wurden in der Studie nicht als Tabelle angegeben.

BMI-Klassen, Tauchgangsprofile, aus der Grafik abgelesene P(DCS)-Werte und rekonstruierte ganze DCS-Fallzahlen.
BMI-Klasse BMI-Bereich BMI Profile P(DCS) aus Grafik Fallzahl aus Grafik Rekonstruierte Fälle P(DCS) rekonstruiert
-3 <16,0 -3 12 0,00 % 0 0 0,00 %
-2 16,0–16,9 -2 63 1,60 % 1,01 1 1,59 %
-1 17,0–18,4 -1 877 1,05 % 9,21 9 1,03 %
0 18,5–24,9 0 41.429 0,85 % 352,15 343 0,83 %
1 25,0–29,9 1 44.888 0,50 % 224,44 223 0,50 %
2 30,0–34,9 2 13.588 0,35 % 47,56 46 0,34 %
3 35,0–39,9 3 1.125 0,30 % 3,38 3 0,27 %
4 ≥40,0 4 492 0,65 % 3,20 3 0,61 %
Summe dieser Rekonstruktion 102.474 628

Die echten Daten können von dieser Rekonstruktion natürlich abweichen. Das lässt sich nicht verhindern, da die Autoren sich entschieden haben, diese relevanten Zahlen nicht in die Veröffentlichung aufzunehmen. Aber die Abweichung ist gering genug, dass sich dadurch kein grundsätzlich anderes Bild ergeben kann.

Jetzt machen wir ein Experiment: Es kommt einfach zu den gesamten Daten ein einziger Datensatz dazu. Ein Tauchgang, eine Person, ein DCS-Fall. Nur einer.
Was verändert sich an der Auswertung, je nachdem, welchen BMI dieser eine neue Fall hat?
Und dann machen wir noch etwas: Wir nehmen an, in der BMI Klasse 0 war ein Taucher, der 1.000 Tauchgänge geteilt hat. Wie würde das Ergebnis aussehen, wenn dieser eine Taucher eine andere BMI-Klasse hätte?

Die rekonstruierten Zahlen

Wie viele DCS-Fälle gab es in jeder BMI Klasse? Wir haben das nachgerechnet – in den oberen und unteren sind es nur sehr wenige. Und das bedeutet, dass diese Gruppen anfällig sind für statistische Fehler.

Simulation 1: Ein DCS-Fall mehr mit BMI -3

Ein weiterer DCS-Fall zu den 628 ist nicht viel. Wenn der aber zufällig von einer stark untergewichtigen Person kommt, verschiebt sich das DCS-Risiko in dieser Gruppe massiv. Weil der eine Fall bei so wenigen Profilen einen sehr hohen Prozentsatz ausmacht.

Simulation 2: Ein Fall mehr mit BMI 0

Wenn in einer BMI-Klasse mit vielen Profilen und vielen DCS-Fällen einer dazukommt, macht das kaum etwas aus. Hier liegen genug Daten vor, dass kleine Verschiebungen das Ergebnis nicht komplett infrage stellen.

Simulation 3: Ein Fall mehr mit BMI 4

In der BMI Gruppe am oberen Rand gibt es zwar auch relativ wenig Profile und Fälle, aber doch genug, dass ein zusätzlicher Fall das Ergebnis nicht völlig umwirft. Die Veränderung ist deutlich, aber bei weitem nicht so dramatisch wie am ganz unteren Rand.

Simulation 4: 1000 Profile wechseln den BMI

Wir haben ja gesehen, dass der Effekt eines zusätzlichen Falles größer wird, je weniger Profile in der BMI Klasse geteilt wurden. Einige Taucher haben für die Studie ja sehr viele Profile beigetragen. Wenn nun eine einzige Person, ein Taucher, der 1.000 Profile gespendet hat, eine andere körperliche Eigenschaft hätte – was würde dann passieren? Wir nehmen an, ein Taucher mit vielen Profilen hätte statt BMI 0 ein mal BMI -2, und ein mal BMI 3. Die Daten dieses einen Tauchers verschieben dann das Ergebnis massiv.

Was wir hier sehr deutlich sehen können: Die Auswertung in den mittleren BMI Klassen, in denen viele Profile und auch eine relevante Zahl an DCS-Fällen vorliegen, kann durchaus interessant sein. Hier könnte dann eine weitergehende Analyse der Daten starten – sie endet aber nicht hier. Und für die sehr hohen und sehr niedrigen BMI Klassen muss man einfach anerkennen, dass die vorliegenden Daten nicht ausreichen, um daraus Schlüsse zu ziehen. Das ist ja nicht schlimm – DCS ist nun mal so selten, dass dieses Problem in der Forschung häufig vorkommt.
Das Problem der Verzerrung der Ergebnisse durch die stark unterschiedliche Beteiligung einzelner Taucher zeigt sich sicher auch an anderen Punkten in der Auswertung. Der BMI ist nur der, zu dem noch die meisten Zahlen sichtbar sind, und dessen „erstaunliches“ Ergebnis auf Social Media schon diskutiert wurde, deshalb taugt er zur Verdeutlichung. Die selbe Vorsicht ist natürlich auch bei dem Rest der Auswertung geboten.

Die Kritik an dieser Auswertung bedeutet aber nicht, dass die DAN-Daten wertlos sind. Im Gegenteil: Große reale Tauchdatenbanken sind wertvoll. Sie zeigen echte Profile, echte Wiederholungstauchgänge, echte Verhaltensmuster. Genau solche Daten brauchen wir, und eine gute Auswertung davon hätte echtes Potential, relevante Hinweise auf offene Fragen zum Thema Risikofaktoren zu liefern.
Leider wurde die notwendige Kalibrierung der Methode an kleineren Datensätzen hier einfach ausgelassen. Die Frage, wie die unterschiedlich vielen Datensätze pro Person die Auswertung beeinflussen wurde noch nicht einmal gestellt. Und wenn für bestimmte Aussagen nicht genug Daten vorliegen, wurde auch das nicht klar gesagt.

Die Daten selber sind Gold wert, und es wäre ein großer Gewinn, wenn sie analysiert würden. Aber wenn, dann als zwei Datensätze – Profile und DCS-Fälle – bei denen jeweils die verschiedenen Biases, methodische Fallen und Unklarheiten beseitigt oder klar benannt werden. Dann einmal zu schauen, was eigentlich die DCS-Daten von anderen Daten unterscheidet, könnte wirklich spannend sein.

Dieser Beitrag ist Teil einer Serie, für die Dominik Elsässer, Robert Helling mit seinem zu vielen Themen sehr empfehlenswerten Blog The Theoretical Diver und ich zusammengearbeitet haben.

WordPress Cookie Hinweis von Real Cookie Banner