Prueba de Kruskal-Wallis: guía completa para entender, aplicar e interpretar esta prueba no paramétrica

La Prueba de Kruskal-Wallis es una herramienta estadística no paramétrica ampliamente utilizada para comparar tres o más grupos independientes. A diferencia del ANOVA clásico, no asume normalidad en las distribuciones ni homogeneidad de varianzas, lo que la convierte en una alternativa robusta cuando los datos no cumplen las premisas paramétricas. En este artículo descubrirás qué es, cuándo usarla, sus supuestos, cómo realizarla paso a paso y cómo interpretarla correctamente. Además, encontrarás ejemplos prácticos en R y Python, ideas para análisis post hoc y recomendaciones para que puedas aplicar la prueba de Kruskal-Wallis con confianza en tus investigaciones.

¿Qué es la Prueba de Kruskal-Wallis?

La Prueba de Kruskal-Wallis es una prueba estadística no paramétrica que evalúa si existen diferencias significativas entre las medianas de tres o más grupos independientes. Se basa en los rangos de las observaciones en lugar de sus valores originales, lo que la hace menos sensible a la distribución de los datos. Su objetivo principal es responder a la pregunta: ¿provienen estas muestras de la misma población o no?

En términos técnicos, la Prueba de Kruskal-Wallis extiende la idea de la prueba de Mann-Whitney a más de dos grupos. Si el estadístico H es alto y el valor p asociado es menor que el nivel de significancia, se concluye que al menos uno de los grupos difiere de los demás. Es importante entender que, a diferencia del análisis de varianza tradicional, la prueba no especifica qué pares de grupos difieren; para ello se requieren pruebas post hoc con corrección de múltiples comparaciones.

Cuándo usar la Prueba de Kruskal-Wallis

La elección de la Prueba de Kruskal-Wallis se produce en varias situaciones habituales en investigación:

Cuando se tienen tres o más grupos independientes y los datos no cumplen la normalidad requerida por ANOVA.
Cuando las variables son ordinales, por ejemplo, escalas de satisfacción o clasificación de niveles de riesgo.
Cuando las muestras son pequeñas y no es razonable asumir una distribución normal.
Cuando la homogeneidad de varianzas no puede garantizarse de forma fiable y la robustez de la prueba no paramétrica es deseable.

Es útil recordar que la Prueba de Kruskal-Wallis no tests la igualdad de varianzas entre grupos; su interpretación se centra principalmente en la diferencia de distribuciones o medianas entre grupos. En situaciones donde las distribuciones de las poblaciones difieren en forma o en dispersión, la interpretación de la prueba debe hacerse con cautela y, si es posible, complementarse con análisis gráficos y pruebas post hoc específicas.

Supuestos de la Prueba de Kruskal-Wallis

Antes de aplicar la Prueba de Kruskal-Wallis, es importante verificar sus supuestos:

Independencia de las observaciones: las muestras deben ser independientes entre sí, y cada observación debe ser independiente de las demás.
Escala de medida: la variable dependiente debe ser al menos ordinal; también puede ser continua, siempre que se pueda asignar un orden significativo a las observaciones.
Distribuciones con forma similar: si las formas de las distribuciones de los grupos son muy distintas (p. ej., una muy sesgada y otra muy aplanada), la interpretación de diferencias en medianas puede ser menos clara.

Si alguno de estos supuestos no se cumple, conviene considerar alternativas adecuadas o aplicar transformaciones que permitan una interpretación más estable de los resultados. En cualquier caso, la Prueba de Kruskal-Wallis ofrece una opción sólida cuando se investiga si existen diferencias entre varios grupos sin depender de supuestos paramétricos fuertes.

Cómo se realiza la Prueba de Kruskal-Wallis

Realizar la Prueba de Kruskal-Wallis implica comparar la distribución de rangos de las observaciones entre los grupos. A continuación, se muestran los pasos principales, con énfasis en la intuición y en la práctica:

Preparación de datos

Reúne tus datos en categorías claras: cada observación debe pertenecer a uno de los grupos independientes. Verifica que no haya datos faltantes o, si existen, decide cómo manejarlos (por ejemplo, eliminación de casos incompletos o imputación razonable según el contexto).

Cálculo del estadístico H

El enfoque general para calcular el estadístico H es el siguiente:

Combina todas las observaciones y ordénalas de menor a mayor, asignando rangos. En caso de empates, se asigna el rango medio de las posiciones que ocuparían las observaciones empatadas.
Para cada grupo, suman sus rangos; denotemos la suma de rangos de cada grupo como R_i y el tamaño de cada grupo como n_i, con i = 1,…,k (donde k es el número de grupos).
Calcular H con la siguiente fórmula:

H = (12 / [N(N+1)]) * Σ (R_i^2 / n_i) – 3(N+1)

donde N es el total de observaciones (N = Σ n_i).
Si hay empates, se aplica una corrección para empates que ajusta el valor de H, de modo que la distribución de H se aproxime mejor a la chi-cuadrado en tamaños muestrales pequeños o con muchos empates.

El resultado, H, se compara con una distribución chi-cuadrado con grados de libertad igual a k-1 (donde k es el número de grupos). Un p-valor pequeño sugiere que al menos un grupo difiere significativamente de los demás en su distribución de rangos, lo que implica diferencias entre las poblaciones subyacentes.

Interpretación del p-valor y decisiones

Al interpretar el p-valor de la Prueba de Kruskal-Wallis, ten en cuenta lo siguiente:

Si p < α (nivel de significancia, por ejemplo 0.05), rechazas la hipótesis nula: existe al menos una diferencia entre grupos.
Si p ≥ α, no hay evidencia suficiente para afirmar diferencias entre los grupos; es posible que las muestras provengan de poblaciones con distribuciones similares en términos de central tendency.
La prueba no indica qué pares de grupos difieren. Para identificar específicamente dónde están las diferencias, se deben realizar pruebas post hoc que comparen pares de grupos y ajusten el nivel de significancia para múltiples comparaciones.

Corrección por empates (ties)

Cuando hay muchos empates en las observaciones, es necesario aplicar una corrección especial para obtener un estadístico H adecuado. Esta corrección ajusta la varianza de los rangos y puede cambiar ligeramente el valor p resultante. En software estadístico moderno, esta corrección suele aplicarse automáticamente, por lo que es poco común cometer errores si se utiliza un paquete confiable.

Ejemplos prácticos de la Prueba de Kruskal-Wallis

A continuación encontrarás ejemplos prácticos para entender mejor la aplicación de la Prueba de Kruskal-Wallis.

Ejemplo 1: tres grupos de tratamientos

Imagina un estudio que evalúa tres tratamientos para la reducción de dolor: A, B y C. Se mide la intensidad del dolor en una escala de 0 a 10 en 8 pacientes por grupo. Los datos se introducen en la Prueba de Kruskal-Wallis para determinar si alguno de los tratamientos difiere en eficacia.

Pasos resumidos:

Unir todas las observaciones y asignar rangos; si hay empates, asignar rango medio.
Calcular R_i para cada grupo y aplicar la fórmula de H.
Consultar el p-valor correspondiente con k-1 = 2 grados de libertad.
Si p < 0.05, concluir que al menos un tratamiento difiere en eficacia; realizando pruebas post hoc se identifica qué pares difieren.

En la práctica, es común que una prueba post hoc como la prueba de Dunn se utilice para comparar pares de tratamientos y controlar la tasa de error de tipo I.

Ejemplo 2: datos ordinales en investigación educativa

En un estudio educativo, se comparan tres métodos de enseñanza evaluados mediante una escala de satisfacción del 1 al 5. Dado que los datos son ordinales y no se cumple la normalidad, la Prueba de Kruskal-Wallis permite evaluar si existen diferencias en la mediana de satisfacción entre los métodos. Si el resultado es significativo, se procede a un análisis post hoc para identificar qué método o métodos generan mayores niveles de satisfacción.

Implementación de la Prueba de Kruskal-Wallis en R

R es uno de los entornos más utilizados para análisis estadísticos. A continuación, se muestran ejemplos prácticos para realizar la Prueba de Kruskal-Wallis en R:

# Datos de ejemplo: tres grupos
grupo <- factor(rep(c("A","B","C"), each = 8))
valores <- c(3,4,5,2,6,3,4,5, 7,8,6,9,8,7,6,5, 1,2,1,3,2,4,2,3)

# Prueba de Kruskal-Wallis
kruskal.test(valores ~ grupo)

# Si el resultado es significativo, realizar Dunn post hoc
# Instalar y cargar el paquete FSA o dunn.test para Dunn's test
install.packages("FSA")
library(FSA)
library(dplyr)

# Dunn's test para comparaciones múltiples con corrección de Holm
dunnTest(valores ~ grupo, data = data.frame(grupo, valores), method = "holm")

Este bloque de código ilustra la ejecución básica de la Prueba de Kruskal-Wallis en R y un paso posterior con Dunn para identificar diferencias específicas entre pares de grupos.

Implementación de la Prueba de Kruskal-Wallis en Python

Python, con bibliotecas como SciPy, también facilita la ejecución de la Prueba de Kruskal-Wallis. Aquí tienes un ejemplo práctico:

import numpy as np
from scipy.stats import kruskal

# Datos de ejemplo: tres grupos
grupo_A = np.array([3,4,5,2,6,3,4,5])
grupo_B = np.array([7,8,6,9,8,7,6,5])
grupo_C = np.array([1,2,1,3,2,4,2,3])

stat, p = kruskal(grupo_A, grupo_B, grupo_C)
print("Estadístico H:", stat)
print("p-valor:", p)

# Para pruebas post hoc, se puede usar un paquete como scikit-posthocs
# pip install scikit-posthocs
import pandas as pd
import scikit_posthocs as sp
df = pd.DataFrame({'valores': np.concatenate([grupo_A, grupo_B, grupo_C]),
                   'grupo': ['A']*len(grupo_A) + ['B']*len(grupo_B) + ['C']*len(grupo_C)})
sp.posthoc_dunn(df, val_col='valores', group_col='grupo', p_adjust='holm')

Con estos ejemplos en R y Python puedes adaptar la Prueba de Kruskal-Wallis a tus conjuntos de datos y obtener resultados reproducibles en tus informes.

Pruebas post hoc para la Prueba de Kruskal-Wallis

Si la Prueba de Kruskal-Wallis arroja una significancia, es necesario identificar qué pares de grupos difieren entre sí. Las pruebas post hoc más comunes para este objetivo incluyen:

Prueba de Dunn: compara pares de grupos y aplica corrección para múltiples comparaciones (Holm, Bonferroni, etc.).
Otras opciones: pruebas de pairwise con ajustes no paramétricos compatibles.

La interpretación adecuada de las pruebas post hoc es crucial, ya que evitan concluir diferencias cuando podrían ser contratos por el error de múltiples comparaciones. Un plan claro de análisis y una corrección conservadora suelen ser la mejor práctica.

Ventajas y limitaciones de la Prueba de Kruskal-Wallis

Como toda técnica estadística, la Prueba de Kruskal-Wallis tiene sus ventajas y limitaciones:

Ventajas:
- No requiere normalidad de los datos.
- Puede manejar variables ordinales y continuas sin transformaciones complicadas.
- Es robusta ante heterogeneidad moderada de varianzas entre grupos.
- Requiere menos supuestos que ANOVA cuando las condiciones no se cumplen.
Limitaciones:
- No indica qué pares de grupos difieren sin realizar pruebas post hoc.
- La interpretación se centra en diferencias de distribución o medianas, no en medias.
- Si las formas de las distribuciones entre grupos difieren sustancialmente, la interpretación puede ser menos clara.

Consejos prácticos para la investigación con Kruskal-Wallis

Para maximizar el rendimiento de la Prueba de Kruskal-Wallis y la interpretación de los resultados, considera estos consejos prácticos:

Explora visualmente las distribuciones de cada grupo mediante diagramas de caja, violín y gráficos de cuantiles para entender la forma de las distribuciones y detectar posibles efectos de empates o sesgos.
Antes de aplicar la prueba, verifica la independencia de las observaciones; la violación de este supuesto puede sesgar los resultados.
Si hay muchos empates, asegúrate de que el software utilice la corrección adecuada; de lo contrario, el valor p puede no ser preciso en muestras pequeñas.
Reporta no solo el p-valor, sino también el estadístico H y las sumas de rangos por grupo para una interpretación más informada.
Incluye un análisis post hoc claro y conservador si la prueba es significativa, especificando qué pares de grupos muestran diferencias y con qué ajuste de p se adoptará.

Preguntas frecuentes sobre la Prueba de Kruskal-Wallis

¿Qué significa un valor p en la Prueba de Kruskal-Wallis?

Un valor p bajo indica que es poco probable observar las diferencias de rangos entre los grupos si la hipótesis nula fuera cierta (que todos los grupos provienen de la misma distribución). En ese caso, se rechaza la hipótesis nula y se concluye que existen diferencias entre al menos dos grupos, aunque no se especifica cuáles.

¿Puede la Prueba de Kruskal-Wallis detectar diferencias entre más de dos grupos?

Sí, esa es precisamente su finalidad: comparar tres o más grupos independientes para detectar diferencias en la distribución de la variable de interés. Para tres o más grupos, la Prueba de Kruskal-Wallis es especialmente adecuada cuando no se cumplen los supuestos paramétricos.

¿Cómo interpretar las diferencias entre medianas tras Kruskal-Wallis?

Detectar diferencias entre medianas a través de la Prueba de Kruskal-Wallis no revela cuáles medianas difieren entre sí. Por ello, se recomiendan pruebas post hoc como la prueba de Dunn para identificar pares específicos y aplicar correcciones de múltiples comparaciones que controlen la tasa de error tipo I.

Conclusiones sobre la Prueba de Kruskal-Wallis

La Prueba de Kruskal-Wallis es una técnica poderosa para comparar tres o más grupos sin depender de supuestos paramétricos fuertes. Su enfoque basado en rangos la hace robusta ante no normalidad y permite trabajar con datos ordinales. Al planificar tu estudio, considera cuándo la prueba es la adecuada, verifica los supuestos, realiza un análisis post hoc si es necesario y reporta la estadística, el p-valor y las diferencias entre pares con claridad. Con estas prácticas, la Prueba de Kruskal-Wallis puede enriquecer tus conclusiones y fortalecer la calidad de tu investigación.

Contenido adicional: recursos y recomendaciones

Para profundizar en la Prueba de Kruskal-Wallis, considera estos recursos y enfoques prácticos:

Revisa guías y tutoriales sobre pruebas no paramétricas para comprender mejor el fundamento teórico detrás de la Prueba de Kruskal-Wallis y su relación con la distribución de rangos.
Explora ejemplos de aplicaciones en áreas como medicina, psicología, educación y ciencias sociales para ver cómo se implementa en contextos reales.
Practica con conjuntos de datos de ejemplo y replicables; la repetición ayuda a internalizar la interpretación de estadísticos y p-valores.
Utiliza software estadístico moderno que maneje correctamente la corrección por empates y ajustes para pruebas post hoc; esto garantiza resultados confiables en informes y publicaciones.