Estadística no paramétrica para una o dos variables

Versión PDF
II-1123 Estadística para Ingeniería Industrial II

Steven García Goñi
steven.garciagoni@ucr.ac.cr

26 de febrero de 2026

Agenda

  • Preguntas generadoras
  • Introducción
    • Usos, ventajas y desventajas
  • Prueba de signo
  • Prueba de rango con signo
  • Wilcoxon y Mann-Whitney
  • Para la varianza

Preguntas generadoras

  • ¿Qué significa ser “paramétrico” y “no paramétrico”?
  • ¿Cuándo se debe recurrir a estadística no paramétrica?
  • ¿Cuáles son las desventajas de los procedimientos no paramétricos?

Introducción

  • La mayoría de procedimientos que han sido abordados en este curso y otros anteriores tienen un supuesto importantísimo:

    • Se trabaja con variables aleatorias que siguen la distribución normal.
    • O bien, el tamaño de muestra es lo suficientemente grande para cumplir con el teorema del límite central (TLC).
      • Recuerde que el TLC depende, en gran medida de la asimetría de la distribución de la población y que no es una buena práctica asumir que en todos los casos se necesita \(n \ge 30\) (esta idea es prácticamente un fósil de la estadística). En ocasiones puede ser más o puede ser menos.
      • Puede visitar estos enlaces para mejorar su comprensión en este tema:
  • Igualmente, recuerde que estos los procedimientos paramétricos son, por lo general, relativamente insensibles a variaciones pequeñas en la normalidad.

    • Incluso si la condición no se cumple por muy poco, aún puede usarse el procedimiento.

Introducción

  • Existen procedimientos que son libres de distribución o no paramétricos que usualmente no hacen supuestos acerca de la distribución subyacente de los datos en la población.

    • En algunas ocasiones puede existir el supuesto de continuidad, es decir, que los datos sean continuos.
  • Los métodos no paramétricos no están libres de supuestos, porque algunos de los métodos más comunes, como la prueba de rango con signo y de suma de rangos que vemos en nuestro curso, parten del supuesto de simetría aproximada.

  • Lo que nos lleva a que en realidad los métodos no son aplicables de modo universal

  • Nótese que lo no paramétrico no es necesariamente “inferior” ni lo paramétrico es “mejor” o superior.

Estadística no paramétrica

  • La estadística no paramétrica es una rama de la estadística que permite analizar datos sin asumir que provienen de una distribución específica.

    • Nota del autor de esta presentación: nótese que indica que no provienen de una distribución específica, no solo de la normal, por lo que recomiendo evaluar si no existe una distribución particular que se pueda ajustar a los datos antes de aplicar un test paramétrico
  • Lo que la hace especialmente útil cuando las condiciones para los métodos paramétricos no se cumplen.

    • Este slide y el siguiente están basados en material de PhD. Isabel Escudero facilitado el 23 de agosto 2025 en la Lección Inaugural II Ciclo 2025 de la Escuela de Estadística y Programa de Posgrado en Estadística.

Estadística no paramétrica

Característica Paramétrico No paramétrico
Distribución de los datos Requieren que los datos sigan una distribución específica (normal) No requieren distribución específica
Tipo de datos Datos de intervalo o razón Datos ordinales, nominales o no normalmente distribuidos
Supuestos previos Más estrictos Más flexibles
Potencia estadística Mayor si se cumplen los supuestos Menor, pero más robustos ante violaciones de supuestos
Sensibilidad a outliers Alta (afectados por valores extremos) Baja (más resistentes a outliers)
Tamaño de muestra necesario Generalmente mayor Funciona bien con muestras pequeñas

Material de PhD. Isabel Escudero

Estadística no paramétrica

Ventajas

  • Fácil aplicación computacional.

  • Puede servir de método de evaluación rápido, antes de determinar si se requiere de un método más elaborado.

  • Muchos supuestos que típicamente se deben hacer respecto a la población en estadística paramétrica, no son requeridos. Pero sigue requiriendo independencia y otros supuestos.

  • Útil cuando el tamaño de muestra no es el adecuado (muy pequeño) para cumplir con el TLC.

Desventajas

  • Conceptualmente, no siempre son de fácil aplicación.

  • Si se puede aplicar una técnica paramétrica, porque se cumplen sus supuestos, es mejor, pues este generalmente es un método más eficiente: tiene más potencia para un mismo tamaño muestral.

  • En general, cuando los supuestos paramétricos se cumplen, las pruebas no paramétricas tienen menor eficiencia, por lo que pueden requerir una muestra mayor para alcanzar la misma potencia.

Reflexión

  • La estadística inferencial se basa o depende del proceso de extracción de la muestra y de si este es efectivamente aleatorio y está bien hecho: libre de sesgos evidentes, etc; lo cual es requisito de cualquiera de las pruebas estadísticas.

    • Ningún test, paramétrico o no, corrige un diseño erróneo.
  • En ocasiones sucede que la población sigue la distribución normal, pero que el método de extracción de los datos no lo refleja, pues no es correcto (aleatoriedad, el instrumento de medición no es adecuado, etc).

Reflexión

  • El \(n<30\) no significa que automáticamente se requiere de un test no paramétrico.
    • Esto es un error que hay que evitar reproducir.
    • El test no paramétrico se requiere cuando no se cumplan los supuestos del paramétrico, no por una cuestión del tamaño de muestra.
  • Por ejemplo, para hacer hipótesis de tendencia central:
    • La población es normal
      • Test paramétrico
    • La población no es normal, pero la muestra es suficientemente grande
      • Test paramétrico es adecuado por el TLC
    • La población es claramente no normal y la muestra es pequeña
      • Test no paramétrico

Tests no paramétricos

Prueba de signo

  • Es usada para probar hipótesis acerca de la mediana (\(\widetilde{X}\)) de una distribución continua o discreta. La mediana es el valor central de una distribución.
  • Las hipótesis son:
    • \(H_o: \widetilde{X}=\text{valor}\)

    • \(H_i: \widetilde{X}\ne\text{valor}\)

    • Son también plausibles las hipótesis alternativas con > y <.

  • Sus principales supuestos son: independencia, que el nivel de medición sea al menos ordinal y que la mediana está bien definida
  • Básicamente es la alternativa no paramétrica a las pruebas de hipótesis sobre tendencia central, como por ejemplo: una media.

Ejemplo 01

  • Nota: todos los ejercicios serán resueltos de forma manual, pero también pueden resolverse con software estadístico.

  • Se desea comprobar que la resistencia al corte de 20 motores seleccionados al azar sea de 2000 psi, con un 95% de confianza.
    • Los datos no provienen de una población normal (o no se puede asumir) y no se cumple el TLC, por lo que una prueba no paramétrica resulta apropiada.
  • Para ello se le proveen de 20 observaciones.
Observación Resistencia Observación Resistencia
1 2158.70 11 2165.20
2 1678.15 12 2399.55
3 2316.00 13 1779.80
4 2061.30 14 2336.75
5 2207.50 15 1765.30
6 1708.30 16 2053.50
7 1784.70 17 2414.40
8 2575.10 18 2200.50
9 2357.90 19 2654.20
10 2256.70 20 1753.70

Ejemplo 01

Se calculan las diferencias respecto al valor de \(H_o\).

Observación Resistencia Diferencias Signo Observación Resistencia Diferencias Signo
1 2158.70 158.70 + 11 2165.20 165.20 +
2 1678.15 -321.85 - 12 2399.55 399.55 +
3 2316.00 316.00 + 13 1779.80 -220.20 -
4 2061.30 61.30 + 14 2336.75 336.75 +
5 2207.50 207.50 + 15 1765.30 -234.70 -
6 1708.30 -291.70 - 16 2053.50 53.50 +
7 1784.70 -215.30 - 17 2414.40 414.40 +
8 2575.10 575.10 + 18 2200.50 200.50 +
9 2357.90 357.90 + 19 2654.20 654.20 +
10 2256.70 256.70 + 20 1753.70 -246.30 -

Ejemplo 01

  • Luego, se cuenta los signos positivos y negativos.

  • \(+ = 14\)

  • \(- = 6\)

  • El valor P se obtiene basándose en la distribución binomial (lo que tiene sentido, pues hay dos signos). Se hace de la siguiente manera (con \(+\) y con \(-\)):

  • \(2\cdot Bin(x \ge 14, n=20, p = 0.5) = 0.1153\)

  • \(2\cdot Bin(x \le 6, n=20, p = 0.5) = 0.1153\)

    • Si la hipótesis es unilateral, no se multiplica por 2 y se utiliza la desigualdad (\(\le , \ge\)) correspondiente.

Ejemplo 02 (Pareado)

  • Se instalan dos tipos de dispositivos de medición en el sistema electrónico de inyección de combustible de 12 automóviles.

  • Se desea determinar si existe diferencia en los datos de rendimiento entre dispositivos. Use un nivel de significancia de 0.05.

Automóvil D1 D2
1 17.6 16.8
2 19.4 20.0
3 19.5 18.2
4 17.1 16.4
5 15.3 16.0
6 15.9 15.4
7 16.3 16.5
8 18.4 18.0
9 17.3 16.4
10 19.1 20.1
11 17.8 16.7
12 18.2 17.9

Ejemplo 02 (Pareado)

Automóvil D1 D2 Diferencia Signo
1 17.6 16.8 0.8 +
2 19.4 20.0 -0.6 -
3 19.5 18.2 1.3 +
4 17.1 16.4 0.7 +
5 15.3 16.0 -0.7 -
6 15.9 15.4 0.5 +
7 16.3 16.5 -0.2 -
8 18.4 18.0 0.4 +
9 17.3 16.4 0.9 +
10 19.1 20.1 -1.0 -
11 17.8 16.7 1.1 +
12 18.2 17.9 0.3 +

Ejemplo 02 (Pareado)

  • La mediana hipotetizada en la población es de 0.

  • Se cuenta con 8 +’s y 4 -’s.

  • \(2\cdot Bin(x \ge 8, n=12, p = 0.5) = 0.3877\)

  • \(2\cdot Bin(x \le 4, n=12, p = 0.5) = 0.3877\)

  • Por lo que, no hay evidencia suficiente para rechazar la hipótesis nula de que los dos dispositivos de medición son iguales.

Prueba de rango con signo de Wilcoxon

  • Se utiliza para probar la hipótesis sobre la mediana de una distribución continua, si la distribución es simétrica alrededor de esa mediana.
  • Por lo que un supuesto de aplicación es esa simetría, además de la independencia y que la variable sea al menos ordinal.
  • Básicamente es la alternativa no paramétrica a las pruebas de hipótesis sobre tendencia central, como por ejemplo: una media.
    • Es una alternativa más potente a la prueba de signos. Pues esta incorpora más información
  • Las hipótesis son:
    • \(H_o: \widetilde{X}=\text{valor}\)
    • \(H_i: \widetilde{X}\ne\text{valor}\)

Ejemplo 03

  • Resuelva el ejercicio del Ejemplo 01, pero con esta técnica no paramétrica.

  • Los ejercicios resueltos los puede encontrar en este archivo Excel

Ejemplo 03

Observación Resistencia Diferencias Signo Diferencia absoluta Rango Observación Resistencia Diferencias Signo Diferencia absoluta Rango
16 2053.5 53.5 + 53.5 1 10 2256.70 256.70 + 256.70 11
4 2061.3 61.3 + 61.3 2 6 1708.30 -291.70 - 291.70 12
1 2158.7 158.7 + 158.7 3 3 2316.00 316.00 + 316.00 13
11 2165.2 165.2 + 165.2 4 2 1678.15 -321.85 - 321.85 14
18 2200.5 200.5 + 200.5 5 14 2336.75 336.75 + 336.75 15
5 2207.5 207.5 + 207.5 6 9 2357.90 357.90 + 357.90 16
7 1784.7 -215.3 - 215.3 7 12 2399.55 399.55 + 399.55 17
13 1779.8 -220.2 - 220.2 8 17 2414.40 414.40 + 414.40 18
15 1765.3 -234.7 - 234.7 9 8 2575.10 575.10 + 575.10 19
20 1753.7 -246.3 - 246.3 10 19 2654.20 654.20 + 654.20 20

Ejemplo 03

  • Se realiza la suma los rangos o rankings para cada signo, de tal forma que:

  • \(W^+=150\)

  • \(W^-=60\)

  • El valor P se puede conseguir con esta aplicación.

  • Valor P = \(P(W \le w) = P(W \le 60) = 0.04865\)

  • Como la distribución es simétrica, también puede: Valor P = \(P(W \ge w) = P(W \ge 150) = 0.04865\)

  • Concluya del estudio

Suma de rangos de Wilcoxon (Mann-Whitney)

  • Básicamente es la alternativa a las pruebas de hipótesis sobre dos poblaciones (en paramétrico usamos medias). Lo que evalúa es si las distribuciones de ambas poblaciones son iguales. Por lo que podría interpretarse como una prueba sobre la diferencia de las medianas siempre que el supuesto de forma se cumpla.
  • Puede probar la hipótesis de las distribuciones:
    • \(H_o:F_1(x)=F_2(x)\)
    • \(H_i:F_1(x) \ne F_2(x)\)
  • Si la forma de las distribuciones es la misma, puede probar la hipótesis de las medianas:
    • \(H_o:\widetilde{X_1}=\widetilde{X_2}\)
    • \(H_i:\widetilde{X_1}\ne\widetilde{X_2}\)

Ejemplo 04

  • Se quiere verificar que una nueva aleación más ligera (aleación 2) tiene más resistencia a la tensión que la aleación tradicional. Utilice una significancia del 5%.
  • No se cumplen las condiciones para realizar un test paramétrico, por lo que se recurre a uno no paramétrico.
Aleación1 Aleación2
3238 3261
3195 3187
3246 3209
3190 3212
3204 3258
3254 3248
3229 3215
3225 3226
3217 3240
3241 3234

Ejemplo 04

Aleación Valores Rango Aleación Valores Rango
Aleación2 3187 1 Aleación1 3229 11
Aleación1 3190 2 Aleación2 3234 12
Aleación1 3195 3 Aleación1 3238 13
Aleación1 3204 4 Aleación2 3240 14
Aleación2 3209 5 Aleación1 3241 15
Aleación2 3212 6 Aleación1 3246 16
Aleación2 3215 7 Aleación2 3248 17
Aleación1 3217 8 Aleación1 3254 18
Aleación1 3225 9 Aleación2 3258 19
Aleación2 3226 10 Aleación2 3261 20

Ejemplo 04

Rangos de Wilcoxon

\(W_i\) es la suma de las posiciones o rankings para cada \(i\).

  • Aleación 1 (\(n=10\)) = \(W_1=99\)
  • Aleación 2 (\(n=10\)) = \(W_2=111\)

Entonces, usando esta aplicación:

  • \(P(W_1 \ge 99) = 0.68474\)
  • \(P(W_2 \le 111) = 0.68474\)

Mann-Whitney

\[U_i=W_i-\frac{n_i\cdot (n_i+1)}{2}\]

  • Aleación 1 (\(n=10\)) = \(U_1=44\)
  • Aleación 2 (\(n=10\)) = \(U_2=56\)

Entonces, usando esta aplicación:

  • \(P(U_1 \ge 44) = 0.68474\)
  • \(P(U_2 \le 56) = 0.68474\)

Pruebas para la varianza

  • Para el caso de varianzas (y en Minitab de forma específica para dos varianzas) no hay TLC, ni cantidad de datos que nos salven.
    • Los datos deben seguir una distribución normal.
  • Algunas de las alternativas a la no normalidad son la prueba de Bonett y la de Levene.
    • Por lo general, Bonett es más potente, salvo que tengo muy pocos datos o la distribución es muy asimétrica.
  • No son pruebas no paramétricas; son robustas frente a violaciones de normalidad.

Ejemplo 05

  • Se utilizan los datos del Ejemplo 05, que puede encontrar en el Excel, para evaluar si la varianza de tres grupos es la misma.

  • En R

    • car::leveneTest(Respuesta ~ Grupo, data = datos)
    • intervcomp::Bonett.Seier.test(Grupo1, Grupo2, alternative = "two.sided")
  • En Minitab Stat>Basic Statistics>2 Variances…>Options

    • Si el “Use test and confidence intervals based on normal distribution” está marcado, se ejecutará el test F, caso contrario, se ejecuta Bonett y Levene (No paramétricos o robustos a la no normalidad).
  • Resuelva este ejemplo por cuenta propia. Tome en cuenta que por diferencias algorítmicas, puede obtener valores distintos en función del software.

Bibliografía

  • Montgomery, D; Runger, G. (2011) Applied Statistics and Probability for Engineers (5th Edition)
    • Capítulo 9.9, 10.3

Estadística no paramétrica para una o dos variables
II-1123 Estadística para Ingeniería Industrial II

Gracias por su atención
Steven García Goñi
steven.garciagoni@ucr.ac.cr

Dudas o correcciones requeridas pueden solicitarse al correo