Estadística no paramétrica para una o dos variables

Versión PDF
II-1123 Estadística para Ingeniería Industrial II

Steven García Goñi
steven.garciagoni@ucr.ac.cr

26 de febrero de 2026

Agenda

Preguntas generadoras
Introducción
- Usos, ventajas y desventajas
Prueba de signo
Prueba de rango con signo
Wilcoxon y Mann-Whitney
Para la varianza

Preguntas generadoras

¿Qué significa ser “paramétrico” y “no paramétrico”?
¿Cuándo se debe recurrir a estadística no paramétrica?
¿Cuáles son las desventajas de los procedimientos no paramétricos?

Introducción

La mayoría de procedimientos que han sido abordados en este curso y otros anteriores tienen un supuesto importantísimo:
- Se trabaja con variables aleatorias que siguen la distribución normal.
- O bien, el tamaño de muestra es lo suficientemente grande para cumplir con el teorema del límite central (TLC).
  - Recuerde que el TLC depende, en gran medida de la asimetría de la distribución de la población y que no es una buena práctica asumir que en todos los casos se necesita \(n \ge 30\) (esta idea es prácticamente un fósil de la estadística). En ocasiones puede ser más o puede ser menos.
  - Puede visitar estos enlaces para mejorar su comprensión en este tema:
    - Explicación, demostración y tutorial sobre el TLC
    - Efecto de la asimetría sobre el TLC
Igualmente, recuerde que estos los procedimientos paramétricos son, por lo general, relativamente insensibles a variaciones pequeñas en la normalidad.
- Incluso si la condición no se cumple por muy poco, aún puede usarse el procedimiento.

Introducción

Existen procedimientos que son libres de distribución o no paramétricos que usualmente no hacen supuestos acerca de la distribución subyacente de los datos en la población.
- En algunas ocasiones puede existir el supuesto de continuidad, es decir, que los datos sean continuos.
Los métodos no paramétricos no están libres de supuestos, porque algunos de los métodos más comunes, como la prueba de rango con signo y de suma de rangos que vemos en nuestro curso, parten del supuesto de simetría aproximada.
Lo que nos lleva a que en realidad los métodos no son aplicables de modo universal
Nótese que lo no paramétrico no es necesariamente “inferior” ni lo paramétrico es “mejor” o superior.

Estadística no paramétrica

La estadística no paramétrica es una rama de la estadística que permite analizar datos sin asumir que provienen de una distribución específica.
- Nota del autor de esta presentación: nótese que indica que no provienen de una distribución específica, no solo de la normal, por lo que recomiendo evaluar si no existe una distribución particular que se pueda ajustar a los datos antes de aplicar un test paramétrico
Lo que la hace especialmente útil cuando las condiciones para los métodos paramétricos no se cumplen.
- Este slide y el siguiente están basados en material de PhD. Isabel Escudero facilitado el 23 de agosto 2025 en la Lección Inaugural II Ciclo 2025 de la Escuela de Estadística y Programa de Posgrado en Estadística.

Estadística no paramétrica

Característica	Paramétrico	No paramétrico
Distribución de los datos	Requieren que los datos sigan una distribución específica (normal)	No requieren distribución específica
Tipo de datos	Datos de intervalo o razón	Datos ordinales, nominales o no normalmente distribuidos
Supuestos previos	Más estrictos	Más flexibles
Potencia estadística	Mayor si se cumplen los supuestos	Menor, pero más robustos ante violaciones de supuestos
Sensibilidad a outliers	Alta (afectados por valores extremos)	Baja (más resistentes a outliers)
Tamaño de muestra necesario	Generalmente mayor	Funciona bien con muestras pequeñas

Material de PhD. Isabel Escudero

Estadística no paramétrica

Ventajas

Fácil aplicación computacional.
Puede servir de método de evaluación rápido, antes de determinar si se requiere de un método más elaborado.
Muchos supuestos que típicamente se deben hacer respecto a la población en estadística paramétrica, no son requeridos. Pero sigue requiriendo independencia y otros supuestos.
Útil cuando el tamaño de muestra no es el adecuado (muy pequeño) para cumplir con el TLC.

Desventajas

Conceptualmente, no siempre son de fácil aplicación.
Si se puede aplicar una técnica paramétrica, porque se cumplen sus supuestos, es mejor, pues este generalmente es un método más eficiente: tiene más potencia para un mismo tamaño muestral.
En general, cuando los supuestos paramétricos se cumplen, las pruebas no paramétricas tienen menor eficiencia, por lo que pueden requerir una muestra mayor para alcanzar la misma potencia.

Reflexión

La estadística inferencial se basa o depende del proceso de extracción de la muestra y de si este es efectivamente aleatorio y está bien hecho: libre de sesgos evidentes, etc; lo cual es requisito de cualquiera de las pruebas estadísticas.
- Ningún test, paramétrico o no, corrige un diseño erróneo.
En ocasiones sucede que la población sigue la distribución normal, pero que el método de extracción de los datos no lo refleja, pues no es correcto (aleatoriedad, el instrumento de medición no es adecuado, etc).

Reflexión

El \(n<30\) no significa que automáticamente se requiere de un test no paramétrico.
- Esto es un error que hay que evitar reproducir.
- El test no paramétrico se requiere cuando no se cumplan los supuestos del paramétrico, no por una cuestión del tamaño de muestra.
Por ejemplo, para hacer hipótesis de tendencia central:
- La población es normal
  - Test paramétrico
- La población no es normal, pero la muestra es suficientemente grande
  - Test paramétrico es adecuado por el TLC
- La población es claramente no normal y la muestra es pequeña
  - Test no paramétrico

Tests no paramétricos

Prueba de signo

Es usada para probar hipótesis acerca de la mediana (\(\widetilde{X}\)) de una distribución continua o discreta. La mediana es el valor central de una distribución.
Las hipótesis son:
- \(H_o: \widetilde{X}=\text{valor}\)
- \(H_i: \widetilde{X}\ne\text{valor}\)
- Son también plausibles las hipótesis alternativas con > y <.
Sus principales supuestos son: independencia, que el nivel de medición sea al menos ordinal y que la mediana está bien definida
Básicamente es la alternativa no paramétrica a las pruebas de hipótesis sobre tendencia central, como por ejemplo: una media.

Ejemplo 01

Nota: todos los ejercicios serán resueltos de forma manual, pero también pueden resolverse con software estadístico.
Se desea comprobar que la resistencia al corte de 20 motores seleccionados al azar sea de 2000 psi, con un 95% de confianza.
- Los datos no provienen de una población normal (o no se puede asumir) y no se cumple el TLC, por lo que una prueba no paramétrica resulta apropiada.
Para ello se le proveen de 20 observaciones.

Observación	Resistencia	Observación	Resistencia
1	2158.70	11	2165.20
2	1678.15	12	2399.55
3	2316.00	13	1779.80
4	2061.30	14	2336.75
5	2207.50	15	1765.30
6	1708.30	16	2053.50
7	1784.70	17	2414.40
8	2575.10	18	2200.50
9	2357.90	19	2654.20
10	2256.70	20	1753.70

Ejemplo 01

Se calculan las diferencias respecto al valor de \(H_o\).

Observación	Resistencia	Diferencias	Signo	Observación	Resistencia	Diferencias	Signo
1	2158.70	158.70	+	11	2165.20	165.20	+
2	1678.15	-321.85	-	12	2399.55	399.55	+
3	2316.00	316.00	+	13	1779.80	-220.20	-
4	2061.30	61.30	+	14	2336.75	336.75	+
5	2207.50	207.50	+	15	1765.30	-234.70	-
6	1708.30	-291.70	-	16	2053.50	53.50	+
7	1784.70	-215.30	-	17	2414.40	414.40	+
8	2575.10	575.10	+	18	2200.50	200.50	+
9	2357.90	357.90	+	19	2654.20	654.20	+
10	2256.70	256.70	+	20	1753.70	-246.30	-

Ejemplo 01

Luego, se cuenta los signos positivos y negativos.
\(+ = 14\)
\(- = 6\)
El valor P se obtiene basándose en la distribución binomial (lo que tiene sentido, pues hay dos signos). Se hace de la siguiente manera (con \(+\) y con \(-\)):
\(2\cdot Bin(x \ge 14, n=20, p = 0.5) = 0.1153\)
\(2\cdot Bin(x \le 6, n=20, p = 0.5) = 0.1153\)
- Si la hipótesis es unilateral, no se multiplica por 2 y se utiliza la desigualdad (\(\le , \ge\)) correspondiente.

Ejemplo 02 (Pareado)

Se instalan dos tipos de dispositivos de medición en el sistema electrónico de inyección de combustible de 12 automóviles.
Se desea determinar si existe diferencia en los datos de rendimiento entre dispositivos. Use un nivel de significancia de 0.05.

Automóvil	D1	D2
1	17.6	16.8
2	19.4	20.0
3	19.5	18.2
4	17.1	16.4
5	15.3	16.0
6	15.9	15.4
7	16.3	16.5
8	18.4	18.0
9	17.3	16.4
10	19.1	20.1
11	17.8	16.7
12	18.2	17.9

Ejemplo 02 (Pareado)

Automóvil	D1	D2	Diferencia	Signo
1	17.6	16.8	0.8	+
2	19.4	20.0	-0.6	-
3	19.5	18.2	1.3	+
4	17.1	16.4	0.7	+
5	15.3	16.0	-0.7	-
6	15.9	15.4	0.5	+
7	16.3	16.5	-0.2	-
8	18.4	18.0	0.4	+
9	17.3	16.4	0.9	+
10	19.1	20.1	-1.0	-
11	17.8	16.7	1.1	+
12	18.2	17.9	0.3	+

Ejemplo 02 (Pareado)

La mediana hipotetizada en la población es de 0.
Se cuenta con 8 +’s y 4 -’s.
\(2\cdot Bin(x \ge 8, n=12, p = 0.5) = 0.3877\)
\(2\cdot Bin(x \le 4, n=12, p = 0.5) = 0.3877\)
Por lo que, no hay evidencia suficiente para rechazar la hipótesis nula de que los dos dispositivos de medición son iguales.

Prueba de rango con signo de Wilcoxon

Se utiliza para probar la hipótesis sobre la mediana de una distribución continua, si la distribución es simétrica alrededor de esa mediana.
Por lo que un supuesto de aplicación es esa simetría, además de la independencia y que la variable sea al menos ordinal.
Básicamente es la alternativa no paramétrica a las pruebas de hipótesis sobre tendencia central, como por ejemplo: una media.
- Es una alternativa más potente a la prueba de signos. Pues esta incorpora más información
Las hipótesis son:
- \(H_o: \widetilde{X}=\text{valor}\)
- \(H_i: \widetilde{X}\ne\text{valor}\)

Ejemplo 03

Resuelva el ejercicio del Ejemplo 01, pero con esta técnica no paramétrica.
Los ejercicios resueltos los puede encontrar en este archivo Excel

Ejemplo 03

Observación	Resistencia	Diferencias	Signo	Diferencia absoluta	Rango	Observación	Resistencia	Diferencias	Signo	Diferencia absoluta	Rango
16	2053.5	53.5	+	53.5	1	10	2256.70	256.70	+	256.70	11
4	2061.3	61.3	+	61.3	2	6	1708.30	-291.70	-	291.70	12
1	2158.7	158.7	+	158.7	3	3	2316.00	316.00	+	316.00	13
11	2165.2	165.2	+	165.2	4	2	1678.15	-321.85	-	321.85	14
18	2200.5	200.5	+	200.5	5	14	2336.75	336.75	+	336.75	15
5	2207.5	207.5	+	207.5	6	9	2357.90	357.90	+	357.90	16
7	1784.7	-215.3	-	215.3	7	12	2399.55	399.55	+	399.55	17
13	1779.8	-220.2	-	220.2	8	17	2414.40	414.40	+	414.40	18
15	1765.3	-234.7	-	234.7	9	8	2575.10	575.10	+	575.10	19
20	1753.7	-246.3	-	246.3	10	19	2654.20	654.20	+	654.20	20

Ejemplo 03

Se realiza la suma los rangos o rankings para cada signo, de tal forma que:
\(W^+=150\)
\(W^-=60\)
El valor P se puede conseguir con esta aplicación.
Valor P = \(P(W \le w) = P(W \le 60) = 0.04865\)
Como la distribución es simétrica, también puede: Valor P = \(P(W \ge w) = P(W \ge 150) = 0.04865\)
Concluya del estudio

Suma de rangos de Wilcoxon (Mann-Whitney)

Básicamente es la alternativa a las pruebas de hipótesis sobre dos poblaciones (en paramétrico usamos medias). Lo que evalúa es si las distribuciones de ambas poblaciones son iguales. Por lo que podría interpretarse como una prueba sobre la diferencia de las medianas siempre que el supuesto de forma se cumpla.
Puede probar la hipótesis de las distribuciones:
- \(H_o:F_1(x)=F_2(x)\)
- \(H_i:F_1(x) \ne F_2(x)\)
Si la forma de las distribuciones es la misma, puede probar la hipótesis de las medianas:
- \(H_o:\widetilde{X_1}=\widetilde{X_2}\)
- \(H_i:\widetilde{X_1}\ne\widetilde{X_2}\)

Ejemplo 04

Se quiere verificar que una nueva aleación más ligera (aleación 2) tiene más resistencia a la tensión que la aleación tradicional. Utilice una significancia del 5%.
No se cumplen las condiciones para realizar un test paramétrico, por lo que se recurre a uno no paramétrico.

Aleación1	Aleación2
3238	3261
3195	3187
3246	3209
3190	3212
3204	3258
3254	3248
3229	3215
3225	3226
3217	3240
3241	3234

Ejemplo 04

Aleación	Valores	Rango	Aleación	Valores	Rango
Aleación2	3187	1	Aleación1	3229	11
Aleación1	3190	2	Aleación2	3234	12
Aleación1	3195	3	Aleación1	3238	13
Aleación1	3204	4	Aleación2	3240	14
Aleación2	3209	5	Aleación1	3241	15
Aleación2	3212	6	Aleación1	3246	16
Aleación2	3215	7	Aleación2	3248	17
Aleación1	3217	8	Aleación1	3254	18
Aleación1	3225	9	Aleación2	3258	19
Aleación2	3226	10	Aleación2	3261	20

Ejemplo 04

Rangos de Wilcoxon

\(W_i\) es la suma de las posiciones o rankings para cada \(i\).

Aleación 1 (\(n=10\)) = \(W_1=99\)
Aleación 2 (\(n=10\)) = \(W_2=111\)

Entonces, usando esta aplicación:

\(P(W_1 \ge 99) = 0.68474\)
\(P(W_2 \le 111) = 0.68474\)

Mann-Whitney

\[U_i=W_i-\frac{n_i\cdot (n_i+1)}{2}\]

Aleación 1 (\(n=10\)) = \(U_1=44\)
Aleación 2 (\(n=10\)) = \(U_2=56\)

Entonces, usando esta aplicación:

\(P(U_1 \ge 44) = 0.68474\)
\(P(U_2 \le 56) = 0.68474\)

Pruebas para la varianza

Para el caso de varianzas (y en Minitab de forma específica para dos varianzas) no hay TLC, ni cantidad de datos que nos salven.
- Los datos deben seguir una distribución normal.
Algunas de las alternativas a la no normalidad son la prueba de Bonett y la de Levene.
- Por lo general, Bonett es más potente, salvo que tengo muy pocos datos o la distribución es muy asimétrica.
No son pruebas no paramétricas; son robustas frente a violaciones de normalidad.

Ejemplo 05

Se utilizan los datos del Ejemplo 05, que puede encontrar en el Excel, para evaluar si la varianza de tres grupos es la misma.
En R
- car::leveneTest(Respuesta ~ Grupo, data = datos)
- intervcomp::Bonett.Seier.test(Grupo1, Grupo2, alternative = "two.sided")
En Minitab Stat>Basic Statistics>2 Variances…>Options
- Si el “Use test and confidence intervals based on normal distribution” está marcado, se ejecutará el test F, caso contrario, se ejecuta Bonett y Levene (No paramétricos o robustos a la no normalidad).
Resuelva este ejemplo por cuenta propia. Tome en cuenta que por diferencias algorítmicas, puede obtener valores distintos en función del software.

Bibliografía

Montgomery, D; Runger, G. (2011) Applied Statistics and Probability for Engineers (5th Edition)
- Capítulo 9.9, 10.3

Estadística no paramétrica para una o dos variables

Agenda

Preguntas generadoras

Introducción

Introducción

Estadística no paramétrica

Estadística no paramétrica

Estadística no paramétrica

Ventajas

Desventajas

Reflexión

Reflexión

Tests no paramétricos

Prueba de signo

Ejemplo 01

Ejemplo 01

Ejemplo 01

Ejemplo 02 (Pareado)

Ejemplo 02 (Pareado)

Ejemplo 02 (Pareado)

Prueba de rango con signo de Wilcoxon

Ejemplo 03

Ejemplo 03

Ejemplo 03

Suma de rangos de Wilcoxon (Mann-Whitney)

Ejemplo 04

Ejemplo 04

Ejemplo 04

Rangos de Wilcoxon

Mann-Whitney

Pruebas para la varianza

Ejemplo 05

Bibliografía

Estadística no paramétrica para una o dos variables
II-1123 Estadística para Ingeniería Industrial II

Gracias por su atención
Steven García Goñi
steven.garciagoni@ucr.ac.cr

Dudas o correcciones requeridas pueden solicitarse al correo

Estadística no paramétrica para una o dos variables

Agenda

Preguntas generadoras

Introducción

Introducción

Estadística no paramétrica

Estadística no paramétrica

Estadística no paramétrica

Ventajas

Desventajas

Reflexión

Reflexión

Tests no paramétricos

Prueba de signo

Ejemplo 01

Ejemplo 01

Ejemplo 01

Ejemplo 02 (Pareado)

Ejemplo 02 (Pareado)

Ejemplo 02 (Pareado)

Prueba de rango con signo de Wilcoxon

Ejemplo 03

Ejemplo 03

Ejemplo 03

Suma de rangos de Wilcoxon (Mann-Whitney)

Ejemplo 04

Ejemplo 04

Ejemplo 04

Rangos de Wilcoxon

Mann-Whitney

Pruebas para la varianza

Ejemplo 05

Bibliografía

Estadística no paramétrica para una o dos variables II-1123 Estadística para Ingeniería Industrial II

Gracias por su atención Steven García Goñisteven.garciagoni@ucr.ac.cr

Dudas o correcciones requeridas pueden solicitarse al correo

Estadística no paramétrica para una o dos variables
II-1123 Estadística para Ingeniería Industrial II

Gracias por su atención
Steven García Goñi
steven.garciagoni@ucr.ac.cr