Buceadores vs. Perfiles: El nuevo análisis de la base de datos de DAN

Un nuevo análisis de perfiles de inmersión, pero ¿qué pueden decir realmente los datos?

Un nuevo artículo sobre la evaluación del riesgo de EDD está generando debate. Fue publicado a principios de 2026 por un grupo de investigadores, casi todos ellos vinculados a DAN Europe. Los datos provienen de la base de datos DAN DSL, y se analizan 127.957 inmersiones de 5.907 buceadores. Además de los perfiles de inmersión, los datos incluyen información sobre los buceadores: sexo, altura, peso, IMC, frío, fatiga y mucho más, una excelente oportunidad para obtener pistas sobre las muchas preguntas abiertas sobre los factores de riesgo.
En las redes sociales, algunos de los «resultados» del estudio ya se están compartiendo y discutiendo activamente: ¿Las mujeres tienen realmente un riesgo 3-4 veces mayor de sufrir EDD? ¿Y es plausible que los buceadores delgados, más bien con bajo peso, tengan un riesgo mayor que los buceadores con sobrepeso?
Los resultados, en parte sorprendentes, podrían ser consecuencia de algunas debilidades estructurales del estudio.

"Identification of DCS risk factors in recreational diving..."

Marroni, A., Kot, J., Pieri, M., Pelliccia, R., & Balestra, C. (2026). Identification of DCS risk factors in recreational diving: multifactorial model based on the DAN DSL Database 2024. International Maritime Health, 77(1), 1–12. https://doi.org/10.5603/imh.108038

Esto comienza con la pregunta de cuántos perfiles de inmersión se examinaron. Quizás sean 136.793, ya que algunas inmersiones fueron descartadas debido a ambigüedades en los datos, pero luego reaparecen en el análisis. O también 127.197, que aparecen en la pregunta sobre la frecuencia de la EDD. Lamentablemente, el número total de inmersiones examinadas en el artículo no es más consistente que el resto, y el manejo descuidado de estas cifras genera desconfianza.
A primera vista, sin embargo, esto suena impresionante: muchas inmersiones, perfiles reales, una gran base de datos. Muchos buceadores esperan obtener conocimientos relevantes del análisis de estos datos, y por eso el estudio se menciona con más frecuencia y es percibido por más personas de lo que sería normal para un tema de nicho como la descompresión. Y como proviene de DAN, el estudio tiene directamente un voto de confianza, pero ¿realmente se lo merece?

El estudio es largo y plantea muchas preguntas; demasiadas como para tratarlas en un blog. Sin embargo, en el artículo destacan especialmente tres problemas, y queremos analizarlos con más detalle en tres entradas.

¿De dónde provienen los datos? No se explica el conjunto completo de datos y, por lo que parece, se agrupan sin más los perfiles comunicados voluntariamente y los casos de EDC notificados a DAN. Por qué esto es un problema lo comentamos aquí: Statistics is hard to get
Inmersiones como eventos independientes: las casi 130.000 inmersiones se evalúan como si fueran eventos independientes, a pesar de que provienen de solo unos 6.000 buceadores que han contribuido de manera muy desigual. Por qué esto es un problema, lo discutimos en este artículo.
Confusión con el «DSSG»: Los autores inventan una nueva medida de sobresaturación que no explican, pero que claramente NO es el GF normal al alcanzar la superficie que los buceadores conocen. Esto se aborda en otra entrada del blog.

¿De dónde provienen los datos?

Algunos buceadores cuentan más que otros

En esta entrada queremos analizar con más detalle un aspecto que puede provocar sesgos en los resultados: ¿qué ocurre si partes de los datos no son en absoluto independientes entre sí?

El propio estudio indica que los buceadores individuales han aportado un número muy diferente de perfiles. Algunos, solo una única inmersión; otros, muchísimas. La mediana es de tres, y el máximo, de 1.432 inmersiones por buceador.
¿Cómo era aquello de la mediana, la media y demás? ¿Qué se quiere decir aquí? La mediana es el valor por debajo del cual se sitúa la mitad de los datos y por encima del cual se sitúa la otra mitad. Es decir, de los casi 6.000 buceadores, 3.000 han aportado como máximo 3 inmersiones; eso supone como máximo 9.000 inmersiones, probablemente menos. Los otros 3.000 han aportado tres o más cada uno; de ellos proceden entonces al menos 120.000 de los perfiles.

Una persona que aporta un número extremadamente alto de inmersiones presenta muchas características, como el IMC y el sexo, que permanecen siempre iguales. Sus datos cuentan más en el análisis que los de quienes han aportado pocas inmersiones, y eso puede distorsionar el resultado. Además, el comportamiento de buceo de una persona suele ser relativamente consistente, y con ello incluso los datos que en realidad varían de una inmersión a otra pasan a ser datos en los que esa persona influye más en la estadística que otras.

Este es un problema metodológico relevante. Para entenderlo mejor, primero una pequeña modelización.

Cuando un buceador aporta muchos datos

Para entender, de forma muy básica, por qué no es indiferente que factores relevantes tengan distinto peso en el análisis, tomemos un pequeño modelo. Antes que nada: en conjuntos de datos más grandes el efecto dista mucho de ser tan evidente; aquí queremos mostrar dónde está el problema metodológico y, por eso, utilizamos un ejemplo en el que se ve de forma clarísima.

Imaginemos 100 buceadores que comparten un total de 2000 inmersiones. Uno de ellos aporta 1000 inmersiones, y las demás se distribuyen entre los 99 buceadores restantes.

Aquí se ve directamente el problema. Solo un buceador aporta el 50% de los datos, lo que determina el 50% de las características personales como el sexo y el IMC, a pesar de ser solo uno de cien.
A continuación, veremos qué significa esto en el análisis si se distribuyen 10 casos de EDD de forma aleatoria entre los perfiles compartidos.

Dos personas intercambian sus lugares

Ahora construiremos un pequeño experimento mental a partir de estos perfiles. Para ello, las características de los 100 buceadores se establecerán aleatoriamente una vez:

25 mujeres, 75 hombres
IMC distribuido aproximadamente como en una población adulta europea
Número de inmersiones compartidas distribuidas aleatoriamente
10 casos de EDD distribuidos entre las inmersiones, con un máximo de uno por persona

Con este conjunto de datos, analizamos cómo se distribuyen el sexo y el IMC en todas las inmersiones, y cómo en las inmersiones que terminaron con EDD. A partir de esto, creamos un análisis y un gráfico que parece muy serio: ¿Cuál es el riesgo de EDD según el sexo y el IMC? Si bien hemos establecido un riesgo general del 0,5% para las 2000 inmersiones, la distribución aquí cambia.

Hacemos esto dos veces y solo cambiamos una cosa en los datos: en la primera clasificación, el buceador con 1.000 inmersiones es un hombre con sobrepeso sin EDD. Entre las personas con solo una inmersión reportada, hay una mujer con bajo peso y EDD. Y en el segundo análisis, intercambiamos a estas dos personas. ¿Cuáles son los resultados?

Un buceador con sobrepeso sin EDD aporta 100 inmersiones

Mujer con bajo peso y EDD aporta 1000 inmersiones

Pequeño cambio, gran efecto

Aquí podemos ver muy claramente lo que significa cuando un análisis simplemente ignora que los datos de «perfiles de inmersión» no son independientes de los datos de «buceadores». La única persona con bajo peso y EDD hizo que el «bajo peso» pareciera un factor de riesgo masivo. Sin embargo, solo tres buceadores con bajo peso contribuyeron con 5 inmersiones, mientras que el buceador con sobrepeso contribuyó con 1000, y esto desplaza masivamente el resultado. Y en el momento en que la mujer aporta 1000 inmersiones, de repente parece que los hombres tienen más EDD, a pesar de que ella misma la tuvo.
Este efecto debe ser verificado previamente en un análisis, por ejemplo, con conjuntos de datos de ejemplo más pequeños, o incluyendo solo una inmersión por persona y luego comparando con el análisis; existen métodos para ello, el problema es conocido.
Cuanto mayor sea la cantidad de datos, menos relevante puede ser el número de conjuntos de datos por persona. Si el número de inmersiones reportadas se distribuye como se distribuye entre los buceadores; si entre los buceadores frecuentes y aquellos con muy pocos perfiles las características personales se distribuyen de manera similar, entonces este problema deja de ser relevante en algún momento. Sin embargo, es necesario validar de antemano si el conjunto de datos está configurado de tal manera que se pueda ignorar la pregunta.

¿Qué significa esto para el artículo?

Ya hemos aclarado de antemano que la simulación es puramente didáctica y no tiene nada que ver con las cifras concretas del estudio. Cuando se tiene una cantidad enorme de datos, el efecto deja de ser relevante en algún momento.
Pero: las cantidades de datos en el estudio no son grandes en todas las áreas. Uno de los «resultados» que causa cierta sorpresa es el alto riesgo de EDD en personas con bajo peso, un resultado que nadie habría esperado, ya que generalmente se considera el sobrepeso como un factor de riesgo, no el bajo peso.
Pero, ¿de qué cantidad de datos proviene la P(EDD), la probabilidad del 1,6% de que una inmersión de una persona con bajo peso moderado? Esta cifra proviene de un solo (!) caso de EDD en esta clase de IMC… Un caso más, y la probabilidad sería de aproximadamente 3,2%; un caso menos, y sería 0. Aquí no se puede hablar de mucho más que de ruido estadístico.
Pero veamos esto más de cerca. En el estudio, al principio se definen las clases de IMC, y también se indica cuántos perfiles de inmersión existen en la base de datos para cada clase de IMC. Los autores llegan aquí a 101.865 perfiles con IMC conocido, pero las cifras individuales por perfil suman 102.474. Seguiremos trabajando con esta cifra… En aproximadamente el 20% de los perfiles, el IMC no se conoce. Y tampoco se menciona cómo se distribuyen las clases de IMC entre los buceadores.
Lo siguiente que se puede aprender sobre el IMC y la EDD se encuentra en un gráfico, la Figura 6. Allí se muestra la P(EDD) por clase de IMC, es decir, la probabilidad en porcentaje de que un perfil de una persona en esa clase de IMC termine con EDD. La distribución real de los casos de EDD en las clases de IMC no se muestra, y el gráfico solo se puede leer como una estimación, pero eso es suficiente para reconstruir la distribución de los 628 casos de EDD.

Tabla de IMC-EDD reconstruida

Reconstrucción del trabajo basada en las cifras de perfiles publicadas y en valores de P(EDC) leídos de forma plausible a partir de la figura 6. En el estudio no se proporcionaron como tabla los datos brutos concretos por clase de IMC.

Clases de IMC, perfiles de inmersión, valores de P(EDD) leídos del gráfico y número de casos de EDD completos reconstruidos.
Clase de IMC	Rango de IMC	IMC	Perfiles	P(EDD) del gráfico	Número de casos del gráfico	Casos reconstruidos	P(EDD) reconstruida
-3	16,0	-3	12	0,00 %	0	0	0,00 %
-2	16,0–16,9	-2	63	1,60 %	1,01	1	1,59 %
-1	17,0–18,4	-1	877	1,05 %	9,21	9	1,03 %
0	18,5–24,9	0	41.429	0,85 %	352,15	343	0,83 %
1	25,0–29,9	1	44.888	0,50 %	224,44	223	0,50 %
2	30,0–34,9	2	13.588	0,35 %	47,56	46	0,34 %
3	35,0–39,9	3	1.125	0,30 %	3,38	3	0,27 %
4	≥40,0	4	492	0,65 %	3,20	3	0,61 %
Suma de esta reconstrucción			102.474			628

Los datos reales pueden, por supuesto, diferir de esta reconstrucción. Esto es inevitable, ya que los autores decidieron no incluir estas cifras relevantes en la publicación. Pero la desviación es lo suficientemente pequeña como para que no pueda resultar una imagen fundamentalmente diferente.

Ahora haremos un experimento: simplemente se añade un único conjunto de datos a todos los datos existentes. Una inmersión, una persona, un caso de EDD. Solo uno.
¿Qué cambia en el análisis, dependiendo del IMC que tenga este nuevo caso?
Y luego haremos algo más: asumimos que en la clase de IMC 0 había un buceador que había compartido 1.000 inmersiones. ¿Cómo sería el resultado si este único buceador tuviera una clase de IMC diferente?

Las cifras reconstruidas

¿Cuántos casos de EDD hubo en cada clase de IMC? Lo hemos recalculado, y en las clases superiores e inferiores son muy pocos. Y esto significa que estos grupos son susceptibles a errores estadísticos.

Ampliar gráfico

Simulación 1: Un caso más de EDD con IMC -3

Un caso adicional de EDD a los 628 no es mucho. Pero si este caso proviene de una persona con bajo peso, el riesgo de EDD en este grupo se desplaza masivamente. Porque un solo caso representa un porcentaje muy alto en tan pocos perfiles.

Ampliar imagen

Simulación 2: Un caso más con IMC 0

Si en una clase de IMC con muchos perfiles y muchos casos de EDD se añade uno, apenas influye. Aquí hay suficientes datos para que pequeños cambios no pongan en duda completamente el resultado.

Ampliar imagen

Simulación 3: Un caso más con IMC 4

En el grupo de IMC en el extremo superior también hay relativamente pocos perfiles y casos, pero suficientes para que un caso adicional no altere completamente el resultado. El cambio es significativo, pero no tan dramático como en el extremo inferior.

Ampliar imagen

Simulación 4: 1000 perfiles cambian de IMC

Hemos visto que el efecto de un caso adicional aumenta cuanto menos perfiles se compartieron en la clase de IMC. Algunos buceadores contribuyeron con muchos perfiles al estudio. Si una sola persona, un buceador que donó 1.000 perfiles, tuviera una característica física diferente, ¿qué pasaría? Asumimos que un buceador con muchos perfiles tuviera un IMC -2 en lugar de IMC 0, y otra vez un IMC 3. Los datos de este único buceador desplazarían masivamente el resultado.

Ampliar imagen

Lo que podemos ver muy claramente aquí: el análisis en las clases de IMC intermedias, donde hay muchos perfiles y también un número relevante de casos de EDD, puede ser bastante interesante. Aquí podría comenzar un análisis más profundo de los datos, pero no termina aquí. Y para las clases de IMC muy altas y muy bajas, simplemente hay que reconocer que los datos disponibles no son suficientes para sacar conclusiones. Esto no es grave, la EDD es tan rara que este problema es frecuente en la investigación.
El problema de la distorsión de los resultados debido a la participación muy diferente de buceadores individuales seguramente también se manifiesta en otros puntos del análisis. El IMC es solo el que tiene más cifras visibles y cuyo resultado «sorprendente» ya se ha discutido en las redes sociales, por lo que sirve para la aclaración. La misma precaución es necesaria, por supuesto, para el resto del análisis.

Sin embargo, la crítica a este análisis no significa que los datos de DAN carezcan de valor. Al contrario: las grandes bases de datos reales de buceo son valiosas. Muestran perfiles reales, inmersiones repetitivas reales, patrones de comportamiento reales. Necesitamos precisamente esos datos, y un buen análisis de los mismos tendría un potencial real para proporcionar pistas relevantes sobre preguntas abiertas relacionadas con los factores de riesgo.
Lamentablemente, la calibración necesaria del método en conjuntos de datos más pequeños se omitió aquí. La pregunta de cómo los diferentes números de conjuntos de datos por persona influyen en el análisis ni siquiera se planteó. Y si no había suficientes datos para ciertas afirmaciones, tampoco se dijo claramente.

Los datos en sí mismos son de oro, y sería una gran ventaja si se analizaran. Pero si es así, entonces como dos conjuntos de datos —perfiles y casos de EDD— en los que se eliminen o se nombren claramente los diferentes sesgos, trampas metodológicas e incertidumbres. Entonces, ver qué diferencia los datos de EDD de otros datos podría ser realmente emocionante.

Este artículo es parte de una serie en la que Dominik Elsässer, Robert Helling con su blog The Theoretical Diver, muy recomendable para muchos temas, y yo hemos colaborado.

Buceadores vs. Perfiles: El nuevo análisis de la base de datos de DAN

Un nuevo análisis de perfiles de inmersión, pero ¿qué pueden decir realmente los datos?

"Identification of DCS risk factors in recreational diving..."

Algunos buceadores cuentan más que otros

Cuando un buceador aporta muchos datos

Dos personas intercambian sus lugares

Pequeño cambio, gran efecto

¿Qué significa esto para el artículo?

Tabla de IMC-EDD reconstruida

Las cifras reconstruidas

Simulación 1: Un caso más de EDD con IMC -3

Simulación 2: Un caso más con IMC 0

Simulación 3: Un caso más con IMC 4

Simulación 4: 1000 perfiles cambian de IMC

Enviar comentario Cancelar la respuesta