
Versión PDF
II-1120 Estadística para Ingeniería Industrial I
14 de marzo de 2026

Estadístico que es función de la muestra usado para estimar un parámetro desconocido de la población
Estadísticos que son función de una población, que indefectiblemente resumen una “gran” cantidad de datos en una o varias variables estadísticas
Cuando el método de recopilación de datos hace que los datos de la muestra reflejen incorrectamente la población.
En términos simples, es la diferencia que hay entre un estimador y un parámetro \(\text{sesgo}=|\hat{\theta}-\theta|\)
Nota: lo ideal es que el sesgo sea cero, pero eso es prácticamente imposible, entonces lo que se busca es minimizarlo y controlarlo, para que no cambie las conclusiones prácticas del estudio.
La estadística inferencial trata de describir la realidad o población (la persona en el video) a partir de los datos recolectados de una muestra (la sombra que se forma).
Un sesgo nos puede hacer pensar a partir de solo la sombra, que lo que estamos describiendo es una rana/sapo y no una persona..
Es un valor numérico que representa la oportunidad o posibilidad de que un evento en particular ocurra, tal como el aumento en el precio de un producto, de que el día sea lluvioso, se produzca una unidad defectuosa, entre otros.
En todos los casos es un valor entre cero y uno, ambos inclusive.
Existen al menos tres enfoques para asignar probabilidades:
Clásica empírica:
Se basan en datos observados, no en un conocimiento previo del proceso.
Se fundamenta en la ley de los grandes números.
También se conoce como probabilidad frecuentista.
\(P(x)=\frac{\text{Número de veces que el evento x ocurre}}{\text{Número total de observaciones}}\)
Se basa en observación y experimentación.
Subjetiva:
Es asignado, como su nombre lo indica, de forma subjetiva por un individuo, con base en cualquier información que encuentre disponible.
Nota: es la base, hasta cierto punto, de la estadística bayesiana.
Refleja el grado de creencia que alguien le asigna a un evento.
La estadística frecuentista se basa en la frecuencia relativa de los eventos, utilizando probabilidades objetivas, sin incorporar información previa.
En contraste, la estadística bayesiana incorpora creencias o información previa y las actualiza con datos observados, utilizando probabilidades subjetivas.
Este curso, y en general esta área de conocimiento, está centrado en la estadística frecuentista, pero es importante que conozca la existencia e importancia de la bayesiana.
Unión: de dos eventos A y B denotados por 𝐴∪𝐵 y leídos “A o B”, es el evento que consiste de todos los resultados que están en A o en B.
Intersección: de dos eventos A y B, denotada por 𝐴∩𝐵 y leída como “A y B”, es el evento que consiste en todos los resultados que están tanto en A como en B.
Complemento: de un evento A, denotado por 𝐴′, es el conjunto de todos los eventos del espacio muestral S que no están contenidos en A.


Sea un conjunto \(A=\{0, 1, 2, 3, 4\}\), uno \(B=\{3, 4, 5, 6\}\) y uno \(C=\{1, 3, 5\}\).
Dibuje un diagrama de Venn.
Obtenga:
Se le recomienda como ejercicio individual se plante y resuelva otros ejercicios.

| Edad | Sexo | Cintura.(cm) | Fuerza.agarre.mano.(N) | Hipertensión | Diabetes.no.controlada |
|---|---|---|---|---|---|
| 74 | H | 114.5 | 23.5 | 0 | 0 |
| 73 | M | 85.0 | 20.0 | 0 | 0 |
| 74 | H | 74.7 | 34.0 | 0 | 0 |
| 72 | H | 69.3 | 21.5 | 1 | 0 |
| 78 | M | 98.0 | 19.0 | 1 | 0 |
| 77 | M | 90.8 | 22.0 | 1 | 0 |
| 78 | H | 82.3 | 29.5 | 1 | 0 |
| 83 | H | 77.0 | 24.5 | 0 | 0 |
| 79 | H | 92.0 | 27.5 | 0 | 0 |
| 71 | M | 91.5 | 23.5 | 0 | 1 |
| 75 | M | 86.0 | 21.5 | 0 | 0 |
| 87 | H | 93.9 | 29.0 | 1 | 0 |
| 89 | H | 100.5 | 30.0 | 1 | 0 |
| 77 | H | 96.0 | 27.0 | 0 | 0 |
| 68 | M | 111.2 | 13.0 | 1 | 1 |
| 75 | M | 76.0 | 17.0 | 1 | 0 |
¿Cuál es la probabilidad de ser hipertenso?
En la submuestra
\(P(H = 1) = \frac{8}{16} = 0.5\)
En la muestra
| Hipertensión |
|---|
| 0 |
| 0 |
| 0 |
| 1 |
| 1 |
| 1 |
| 1 |
| 0 |
| 0 |
| 0 |
| 0 |
| 1 |
| 1 |
| 0 |
| 1 |
| 1 |
\(P(S=M \cap H=sí) = \frac{4}{16} = 0.25\)
En la muestra
| Sexo | Hipertensión |
|---|---|
| H | 0 |
| M | 0 |
| H | 0 |
| H | 1 |
| M | 1 |
| M | 1 |
| H | 1 |
| H | 0 |
| H | 0 |
| M | 0 |
| M | 0 |
| H | 1 |
| H | 1 |
| H | 0 |
| M | 1 |
| M | 1 |
Hay 25% de probabilidad, en la submuestra, de que la persona seleccionada al azar sea una mujer hipertensa.
Note que la información anterior se puede resumir en tablas de contingencia.
Esto puede ayudarle a resolver el ejercicio.
| Sexo | Hip=0 | Hip=1 |
|---|---|---|
| H | 5 | 4 |
| M | 3 | 4 |
| Sexo | Hip=0 | Hip=1 |
|---|---|---|
| H | 653 | 463 |
| M | 560 | 727 |
Esta ley nos permite encontrar la probabilidad de que ocurra “A o B o C”. Para tres eventos esta regla se define como:
\(P(A\cup B\cup C)=P(A)+P(B)+P(C)\\-P(A\cap B)-P(A\cap C)-P(B\cap C)\\+P(A\cap B\cap C)\)
Observe que primero se suman las probabilidades individuales, luego se restan las intersecciones dobles y finalmente se suma la intersección triple.
Este patrón se conoce como el principio de inclusión-exclusión.
Para más de tres eventos, la ley sigue un patrón alternado de sumas y restas conocido como principio de inclusión-exclusión:
\(P\left(\bigcup_{i=1}^{n} A_i\right)=\sum_{i=1}^{n}P(A_i) \\ -\sum_{i<j}P(A_i\cap A_j) \\ +\sum_{i<j<k}P(A_i\cap A_j\cap A_k)-\\;\cdots;\\+(-1)^{n+1}P(A_1\cap A_2\cap\cdots\cap A_n)\)
El signo alterna: se suman probabilidades individuales, se restan intersecciones dobles, se suman triples, se restan cuádruples, y así sucesivamente.
Calcule la probabilidad de aleatoriamente, se obtenga un hombre o una persona hipertensa. Nótese de la redacción que se solicita \(P(A \text{ o } B) = P(A\cup B)\)
\(P(A\cup B) = P(A) + P(B) - P(A\cap B) \\= 0.5625 + 0.5 - 0.25 = 0.8125\)
\(P(A\cup B) = P(A) + P(B) - P(A\cap B) \\= 0.4644195 + 0.4952143 - 0.1926758 \\= 0.766958\)
| Sexo | Hipertensión |
|---|---|
| H | 0 |
| M | 0 |
| H | 0 |
| H | 1 |
| M | 1 |
| M | 1 |
| H | 1 |
| H | 0 |
| H | 0 |
| M | 0 |
| M | 0 |
| H | 1 |
| H | 1 |
| H | 0 |
| M | 1 |
| M | 1 |
¿Qué tan probable es que alguien elegido al azar sea hombre y fumador al mismo tiempo?
Dado que ya se sabe que es hombre, ¿Qué tan probable es que sea fumador?
Calcule la probabilidad de que sea hipertenso (A) y tenga diabetes no controlada (B) (note la redacción). Es decir: \(P(A)\cdot P(B|A)\)
En la submuestra
\(P(A)\cdot P(B|A) \\= 0.5 \cdot 0.125 = 0.0625\)
\(P(A)\cdot P(B|A) \\= 0.4952143 \cdot 0.1487395 = 0.0736579\)
| Hipertensión | Diabetes.no.controlada |
|---|---|
| 0 | 0 |
| 0 | 0 |
| 0 | 0 |
| 1 | 0 |
| 1 | 0 |
| 1 | 0 |
| 1 | 0 |
| 0 | 0 |
| 0 | 0 |
| 0 | 1 |
| 0 | 0 |
| 1 | 0 |
| 1 | 0 |
| 0 | 0 |
| 1 | 1 |
| 1 | 0 |
Un diagrama de árbol puede ser una forma más intuitiva de resolver estos ejercicios, pues le obliga a pensar en secuencias y en condicionalidad.
Note que la suma de los nodos terminales debe ser igual 1.0; además la suma en cada nodo debe ser también 1.0.
Estos ejercicios también pueden resolverse con tablas de contingencia.
En la submuestra: \(P(A)\cdot P(B|A) = \frac{1}{16} = 0.0625\)
En la submuestra: \(P(A)\cdot P(B|A) = \frac{177}{2403} = 0.0736579\)
| Hipertensión | DNC=0 | DNC=1 |
|---|---|---|
| 0 | 7 | 1 |
| 1 | 7 | 1 |
| Hipertensión | DNC=0 | DNC=1 |
|---|---|---|
| 0 | 1118 | 95 |
| 1 | 1013 | 177 |
Cuidado: no confunda probabilidad conjunta con probabilidad condicional. Se escriben de forma similar, son conceptos distintos.
El teorema de Bayes se usa cuando se quieren invertir y reponderar probabilidades condicionales. Es decir, conocer la probabilidad de un evento A dado que ocurrió B, usando la información sobre B dado A.
Es decir, dado que tiene diabetes no controlada, ¿cuál es la probabilidad de que sea hipertensa?
La ley de la multiplicación sirve para calcular la probabilidad conjunta de que ocurran dos eventos.
El teorema de Bayes sirve para actualizar la probabilidad de un evento con base en nueva información
\[ P(Buena|Pasó) = \frac{0.9\cdot 0.8}{0.9\cdot 0.8 + 0.5\cdot 0.2} \]
\[ P(Buena|Pasó) = 0.878 \]
\[ P(A|B)= \frac{P(A\cap B)}{P(B)} = \frac{P(B|A)\cdot P(A)}{\sum_{i=1}^{k}P(B|A_i)P(A_i)} \] * Donde: * \(P(A)\): es también conocida como probabilidad a priori * \(P(A|B)\): recibe el nombre de probabilidad a posteriori
Esta es una explicación gráfica del Teorema de Bayes por Akshay Pachaar

Siga las ramas donde el resultado sea \(P(D=sí)\). En el numerador va la rama de interés (tener diabetes no controlada dado que se es hipertenso.) mientras que en el denominador va la probabilidad total de tener diabetes no controlada, tenga hipertensión o no. En este ejercicio particular es casualidad que las dos ramas tengan el mismo valor.
\(P(H=sí|D=sí) = \frac{P(H=sí \cap D =sí)}{P(D=sí)}\)
\(P(H=sí|D=sí) = \frac{0.0625}{0.0625 + 0.0625} = 0.5\)
\[ P(H=sí|D=sí) = \frac{1}{2}=0.5 \]
| Hipertensión | DNC=0 | DNC=1 |
|---|---|---|
| 0 | 7 | 1 |
| 1 | 7 | 1 |
Es por esto que, en presencia de todo el conjunto de datos Bayes se reduce algebraicamente a probabilidad condicional clásica. Por lo que quizá sea más sencillo obtenerlo de esta manera que con Teorema de Bayes.
El Teorema de Bayes resulta especialmente útil cuando solo se conocen probabilidades marginales y condicionales parciales.
Solo 1 de 1000 (0.001) adultos padece una enfermedad rara (\(A_{sí}\)) para la cual se ha creado una prueba de diagnóstico (\(B\)).
Un resultado positivo se presentará en el 99 % de las veces cuando se tenga la enfermedad \((B_+|A_{sí})\) y solo se presentará positivo el 2% cuando no se tenga la enfermedad \((B_+|A_{no})\).
Se selecciona y somete al azar a un individuo y el resultado es positivo (ya ocurrió el evento). ¿Cuál es la probabilidad de que tenga la enfermedad? \(P(A_{sí}|B_+)\).
Construya el diagrama de árbol y encuentre la probabilidad, ¿Compare la \(P(A_{sí})\) contra la obtenida anteriormente \(P(A_{sí}|B_+)\).
Realice los ejercicios con la base de datos completa, en esta presentación se muestran algunos de los resultados.
Utilice lo ya aprendido en muestreo y obtenga otras submuestras bajos los diferentes métodos estudiados y repita los ejercicios.