Vous êtes sur la page 1sur 20

UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN

FACULTAD DE INGENIERÍA AGRARIA, INDUSTRIAS ALIMENTARIAS Y


AMBIENTAL

ESCUELA PROFESIONAL DE INGENIERÍA ZOOTÉCNICA

ASIGNATURA: ESTADÍSTICA

TEMA: PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDAD

PROFESOR: Dr. JAIME FERNANDO VEGA VILCA

Septiembre 2017
Huacho-Perú
2

INTRODUCCIÓN

La estadística inferencial es la parte de la estadística que tiene


por finalidad averiguar cómo es la población a partir de una muestra.
El estudiante de zootecnia que conoce y utiliza las técnicas
descriptivas de un grupo de datos necesita pasar a la etapa inferencial
que le permita generalizar sus resultados. Para muchos estudiantes
de zootecnia estos aspectos probabilísticos resultan dificultosos; sin
embargo, cuando se aprenden pueden aplicar estas técnicas
inferenciales para generalizar sus resultados. Este hecho es posible
cunado se tiene conocimiento de la teoría de probabilidades,
distribuciones de probabilidad y distribuciones de muestreo. El
objetivo de estudiar los conceptos de probabilidad es entender
finalmente algunos modelos de distribución de probabilidades que
siguen las variables en zootecnia.

La separata empieza con aspectos básicos de probabilidad,


luego hace un análisis de las distribuciones de probabilidad y termina
con las distribuciones de muestreo. La distribuciones de muestreo
más conocidas son de las medias, proporciones y de las varianzas;
sin embargo, en esta separata únicamente se incide en la distribución
de muestreo de una media para explicando su base teórica.

Dr. Jaime Fernando Vega Vilca


3

PROBABILIDADES

1. EXPERIMENTO ALEATORIO

Es un acto o proceso de observación que nos conduce a un simple resultado que


no puede ser predicho con exactitud. Las características de un experimento son:

a) Cada experimento podrá ser repetido indefinidamente bajo las mismas


condiciones.
b) Todos los resultados posibles del experimento se pueden conocer a priori y
no el resultado del experimento.
c) Cuando el experimento es repetido un gran número de veces el conjunto
generado de resultados posibles describe un comportamiento que permitirá
el estudio del fenómeno aleatorio.

Ejemplos de experimentos aleatorios “” (epsilon):


1 = El tiempo de gestación de una oveja.
2 = Los animales que enferman en una semana.
3 = Tiempo de ordeño en vacas.
4 = Temperatura corporal de lechones al destete.
2. PUNTO MUESTRAL

Es el resultado básico que se obtiene de un experimento. No puede ser


particionado a más simples. Alternativamente el término evento simple también
es usado.

3. ESPACIO MUESTRAL

El espacio muestral de un experimento es la colección o conjunto de todos sus


puntos muestrales. Es denotado por “Ω” (omega)𝜀.

Ejemplos de espacios muestrales:

Ω1: {tiempo, días/0 ≤ t ≤ 150}


Ω2: {0, 1, 2, 3,…n}
Ω3: {tiempo, minutos/t > 0}
Ω4: {temperatura, ͦ C/35 < t < 42}

4. EVENTO

Es una colección específica de puntos muestrales, se denota por “E”. Existen


denominaciones particulares:

Dr. Jaime Fernando Vega Vilca


4

Evento complementario
Es el grupo de todos los resultados básicos no contenidos en el evento E.
𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴)
Evento intersección
Cuando se tiene dos eventos, es el grupo de resultados básicos que pertenece
a ambos eventos E1 y E2 de un espacio muestral.
E1 ∩ E2 o su equivalente E2 ∩ E1
Evento unión
Es el grupo de resultados básicos que pertenece como mínimo a uno de los
eventos E1 y E2 de un espacio muestral.
E1 U E2 o su equivalente E2 U E1
Si se tiene dos eventos la unión e intersección tienen esta relación:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
Eventos mutuamente excluyentes.
Si los eventos E1 y E2 de un espacio muestral no tienen resultados básicos en
común.
E1 ∩ E 2 = ∅
Eventos independientes
Si los eventos A y B son independientes, el evento condicional no tiene
influencia, luego:
𝑃(𝐵/𝐴) = 𝑃(𝐵) y 𝑃(𝐴/𝐵) = 𝑃(𝐴)

La probabilidad de que ambos eventos ocurran es igual al producto de cada


probabilidad:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

Eventos dependientes

Si los eventos son dependientes, es decir la ocurrencia del evento B depende de


la ocurrencia del evento A. Lo que se halla es la probabilidad condicional:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵/𝐴) =
𝑃(𝐴)
Y consecuentemente, la probabilidad que ambos eventos ocurran será:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵/𝐴)

Dr. Jaime Fernando Vega Vilca


5

5. PROBABILIDAD
La definición clásica de probabilidad menciona que si un experimento aleatorio
tiene resultados mutuamente excluyentes e igualmente posibles 𝑛(Ω), y si 𝑛(E)
de tales resultados están a favor de un evento E, entonces la probabilidad de
ocurrencia del evento E es dada por
𝑛(E)
𝑃(𝐸) =
𝑛(Ω)
Otra manera de entender la probabilidad es con la ley de los grandes números:
“La frecuencia relativa del número de veces que un evento ocurre cuando un
experimento es replicado una y otra vez (un gran número de veces) se aproxima
a la probabilidad del evento”.
Un ejemplo clásico es la frecuencia relativa del número de veces que una cara
ocurre cuando tiramos n veces una moneda. Cuando aumentamos el número de
tiradas vemos que esta se acerca a 0,5. Por lo tanto la probabilidad de cada
punto muestral en el experimeto de lanzar una moneda es 0,5.

6. REGLAS PARA ASIGNAR PROBABILIDADES A PUNTOS MUESTRALES


O EVENTOS SIMPLES

Sea A1, A2,…Ak, los eventos simples o puntos muestrales de un espacio


muestral. Luego tenemos:

a. La probabilidad de algún evento simple debe estar entre 0 y 1.

0 ≤ 𝑃(𝐴𝑖 ) ≤ 1, i = 1, 2, 3,…k

Dr. Jaime Fernando Vega Vilca


6

b. La suma de las probabilidades de todos los eventos simples o puntos


muestrales, es igual a 1.
𝑘

∑ 𝑃(𝐴𝑖 ) = 1
𝑖=1

Entonces cuando se desea realizar un experimento y se quiere calcular la


probabilidad de un evento en particular (colección de puntos muestrales), se
procede de la siguiente manera:

a) Definir el experimento; es decir describir el proceso usado para hacer una


observación y el tipo de observación que será registrada.
b) Listar los puntos muestrales.
c) Asignar probabilidades a los puntos muestrales.
d) Determinar la colección de puntos muestrales contenido en el evento de
interés (Ei).
e) Sumar las probabilidades de los puntos muestrales para conseguir la
probabilidad del evento (Ei).
Ejemplo 1
a) Experimento 1
Nacimiento de una cría
b) Espacio muestral
Macho
Hembra
c) Probabilidades de cada punto muestral
Macho 1/2
Hembra 1/2
d) Evento (E1)
Que sea macho
e) Probabilidad del evento (E1)
𝑛(𝐸) 1
P(macho) = 𝑛(Ω) = 2

Ejemplo 2
a) Experimento 2
Nacimiento de dos crías
b) Espacio muestral
Macho, hembra
Macho, macho
Hembra, macho
Hembra, hembra
c) Probabilidades de cada punto muestral
Macho, hembra 1/4
Macho, macho 1/4
Hembra, macho 1/4
Hembra, hembra 1/4

Dr. Jaime Fernando Vega Vilca


7

d) Evento (E1)
Obtener un macho exactamente
e) Probabilidad del evento (E1)
𝑃(𝐸1) = 𝑃(𝑚𝑎𝑐ℎ𝑜, ℎ𝑒𝑚𝑏𝑟𝑎) + 𝑃(ℎ𝑒𝑚𝑏𝑟𝑎, 𝑚𝑎𝑐ℎ𝑜)
𝑃(𝐸1) = 1⁄4 + 1⁄4 = 1⁄2
d1) Evento (E2)
Obtener por lo menos una cría macho
e1) Probabilidad del evento (E2)
𝑃(𝐸2) = 𝑃(𝑚𝑎𝑐ℎ𝑜, 𝑚𝑎𝑐ℎ𝑜) + 𝑃(𝑚𝑎𝑐ℎ𝑜, ℎ𝑒𝑚𝑏𝑟𝑎) + 𝑃(ℎ𝑒𝑚𝑏𝑟𝑎, 𝑚𝑎𝑐ℎ𝑜)
𝑃(𝐸2) = 1⁄4 + 1⁄4 + 1⁄4 = 3⁄4

Ejemplo integrador 1:
En un corral hay 10 terneros: 2 negros, 3 rojos y 5 manchados. Ellos son sacados
uno por uno en un orden completamente al azar. Las probabilidades de que el
primer ternero sea de un color en particular están en la siguiente tabla:

Terneros Evento (Ai) P(Ai)


2 negros A1 P(negro) = 2/10
3 rojos A2 P(rojos) = 3/10
5 manchados A3 P(manchados) = 5/10
Encontrar
a. El primer ternero sea manchado
b. El primer ternero sea negro o rojo
c. El segundo ternero sea negro si el primero fue manchado
d. El primer ternero sea manchado y el segundo negro
Solución
a. Hay un total de 10 terneros, y 5 son manchados. El número de resultados
favorables es 5 y el número total de resultados es 10. Por lo tanto, la
probabilidad que un ternero sea manchado es:

P (manchados) = 5/10 = 1/2

b. La probabilidad que el primer ternero sea negro o rojo es un ejemplo de unión.


P (negro o rojo) = P (negro) + P (rojo) +P (negro ∩ rojo) = 2/10 + 3/10 + 0 =
5/10 = ½.

También es igual que el ternero no sea manchado, el complemento del evento


que se describe en a.

1 1
𝑃(𝑛𝑒𝑔𝑟𝑜 ∪ 𝑟𝑜𝑗𝑜) = 1 − 𝑃(𝑚𝑎𝑛𝑐ℎ𝑎𝑑𝑜) = 1 − =
2 2

Dr. Jaime Fernando Vega Vilca


8

c. Este es un ejemplo de probabilidad condicional. La probabilidad que el


segundo ternero sea negro si nosotros conocemos que el primero fue
manchado, es número de terneros negros (2) dividido por el número de
terneros que permanecen después de remover a un manchado del corral (9).

P (negro/manchado) = 2/9

d. Este es un ejemplo de la probabilidad de una intersección de eventos


dependientes. La probabilidad que el primer ternero es manchado es P
(manchado) = 0,5. La probabilidad que el segundo ternero sea negro cuando
el primero fue manchado es:

Que el primer ternero sea manchado y el segundo sea negro es la intersección

𝑃[𝑚𝑎𝑛𝑐ℎ𝑎𝑑𝑜 ∩ (𝑛𝑒𝑔𝑟𝑜⁄𝑚𝑎𝑛𝑐ℎ𝑎𝑑𝑜)] = (5⁄10) (2⁄9) = 1⁄9

También podemos ilustrar la probabilidad de sacar dos terneros uno después de


otro con el diagrama del árbol que se muestra a continuación:

Primer ternero Segundo ternero

1 negro (2/10)(1/9)
2 negros (2/10) 3 rojos (2/10)(3/9)
5 manchados (2/10)(5/9)
2 negros (3/10)(2/9)
3 rojos (3/10) 2 rojos (3/10)(2/9)
5 manchados (3/10)(2/9)
2 negros (5/10)(2/9)
5 manchados (5/10) 3 rojos (5/10)(3/9)
4 manchados (5/10)(4/9)

Ejemplo integrador 2, con tablas

En una granja porcina se tiene registros de los partos de las cerdas cambourog
29 durante un período de 3 años. Un resumen por número de parto se muestra
a continuación

Número de parto Número de cerdas


1º 23
2º 27
3º 40
4º 10
5º 5
Total 105

Asignando probabilidades, tendríamos.

Dr. Jaime Fernando Vega Vilca


9

Número de parto Probabilidades


1º 0,22
2º 0,26
3º 0,38
4º 0,10
5º 0,04
Total 1,00

a. ¿Cuál es la probabilidad de escoger cerdas adultas?


Sea B el evento cerdas adultas,

P (B) = P (3) + P (4) + P (5) = 0,38 + 0,10 + 0,04 = 0,52

b. ¿Cuál es la probabilidad de escoger cerdas en crecimiento?


Sea A, el evento cerdas en crecimiento

P (A) = P (1) + P (2) = 0,22 + 0,26 = 0,48

Otra forma, P (A) = P (B’), entonces,

𝑃(𝐴) = 𝑃(𝐵′) = 1 − 𝑃(𝐴) = 1 − 0,52 = 0,48

Ejemplo integrador 3 con tablas:

Se tiene registros de preñez y metritis post parto en vacas de un establo de la


región. El número de vacas se muestran en el siguiente cuadro.

preñadas vacías Total


Con metritis PP 24 58 82
Sin metritis PP 114 177 291
Total 138 235 373

Asignando probabilidades tendremos,

preñadas vacías Total


Con metritis PP 0,06 0,16 0,22
Sin metritis PP 0,31 0,47 0,78
Total 0,37 0,63 1,00

a. ¿Cuál es la probabilidad que la vaca escogida tenga metritis post parto y esté
vacía:
Sea M, el evento que la vaca este con metritis
Sea V, el evento que la vaca este vacía

P (M ∩ V) = 0,16

Dr. Jaime Fernando Vega Vilca


10

b. ¿Cuál es la probabilidad que la vaca este preñada o sin metritis?


Sea Q, el evento que la vaca este preñada o sin metritis
Sea F, el evento que la vaca este preñada y
Sea N, el evento que la vaca este sin metritis

𝑃(𝑄) = 𝑃(𝐹) ∪ 𝑃(𝑁) − 𝑃(𝐹 ∩ 𝑁) = 0,37 + 0,78 - 0,31 = 0,84

c. ¿Cuál es la probabilidad que este vacía dado que esta con metritis?
Sea Z, el evento que la vaca este vacía
Sea L, el evento que la vaca este con metritis

𝑃(𝑍⁄𝐿) = 𝑃(𝑍) ∩ 𝑃(𝐿)⁄𝑃(𝐿) = 0,16⁄0,22 = 0,73

DISTRIBUCIONES DE PROBABILIDAD

1. VARIABLE ALEATORIA

Se denomina variable aleatoria a aquella que puede tomar diferentes valores


entre una prueba y otra en un experimento aleatorio.
Si sólo son posibles ciertos valores específicos (puede ser: 0,1, 2, 3...), la
variable aleatoria se denomina variable discreta. Si es posible que la variable
aleatoria tome cualquier valor dentro de cierto rango, se denomina variable
continua.

2. DISTRIBUCIÓN DE PROBABILIDAD

Si se considera una variable aleatoria, su distribución de probabilidad enlista


todos los valores posibles que puede tomar junto con la probabilidad de cada
uno.
Cuando y es discreta, la distribución de probabilidad de y, representada por p(y),
se denomina función de probabilidad. Si y es continua, usualmente la
distribución de probabilidad de y, es decir f(y), se denomina función de
densidad de probabilidad de y.
Existen distribuciones de probabilidad discretas como la distribución binomial,
poisson, geométrica e hipergeométrica. Mientras que en las distribuciones de
probabilidad continuas están la distribución normal, uniforme, gamma,
exponencial y Weibull; sin embargo, las distribuciones de probabilidad más
conocidas y útiles en nuestra área son la distribución binomial y la
distribución normal.

Dr. Jaime Fernando Vega Vilca


11

2.1. DISTRIBUCIÓN BINOMIAL

El modelo de distribución binomial es usado cuando la variable es discreta,


susceptible a conteo. Los resultados de un experimento siguen este modelo
de probabilidad si se satisface las siguientes características:
 En cada repetición del experimento puede ocurrir sólo de dos maneras,
una de ellas es llamada éxito y la otra fracaso.
 La probabilidad de éxito, representada por p, debe permanecer
constante cuando el experimento es repetido muchas veces.
 Las repeticiones de los experimentos deben ser independientes entre sí.

Entonces, si y es discreta:

0 ≤ 𝑝(𝑦𝑖 ) ≤ 1 para todos los valores de yi


𝑃(𝑦 = 𝑦𝑖 ) = 𝑝(𝑦𝑖 ) para todos los valores de yi
∑ 𝑝 (𝑦𝑖 ) = 1

En zootecnia, por ejemplo, algunas variables aleatorias se explican con el


modelo de distribución binomial como son el sexo de una cría (macho,
hembra), animales que sufren una alteración (enfermos, sanos) y otras .

Ejemplo 1

Analicemos el experimento del nacimiento de dos crías, deductivamente los


resultados posibles serían: MM, MH, HM, HH (el espacio muestral comprende
cuatro eventos y la probabilidad de cada evento es 1/4). Si x, la variable aleatoria
es el número de hembras nacidas (variable discreta), entonces ésta puede tomar
los siguientes valores 0, 1 y 2 hembras, por lo que las probabilidades de esos
resultados son:
P (X = 0) = P (MM) = 1/4
P (X = 1) = P (MH)+P (HM) = 1/4 +1/4 = 1/2
P (X = 2) = P (HH) = 1/4

Número
p(x)
hembras
0 1/4
1 1/2
2 1/4

Aplicando el modelo de distribución binomial que tiene la siguiente expresión:

𝑛
𝑝(𝑥) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥

Dr. Jaime Fernando Vega Vilca


12

Donde,
x = suceso de interés (0, 1, …,n)
p = P (suceso) en un ensayo o experimento
n = número de ensayos.

Se obtendrá lo mismo:

Número
Modelo binomial p(x)
hembras
0 2 1/4
( ) (0,5)0 (0,5)2
0
1 2 1/2
( ) (0,5)1 (0,5)1
1
2 2 1/4
( ) (0,5)2 (0,5)0
0

Ejemplo 2

Si tenemos programado diez partos en ovejas corriedale ¿Cuál es la probabilidad


de obtener 7 hembras?

Solución
El modelo de distribución binomial tiene la siguiente expresión:
𝑛
𝑝(𝑥) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥
Donde,
x = suceso de interés (0, 1, …,n)
p = P (suceso) en un ensayo o experimento
n = número de ensayos

En el ejemplo sería:
10 10!
𝑝(7) = ( ) 0,57 (1 − 0,5)10−7 = 7!(10−7)! 0,57 (1 − 0,5)10−7 = 0,12
7
Ejemplo 3

Si deseamos comprar o escoger un lote de animales para un determinado fin y


sabemos que la probabilidad de metritis subclínica en el hato es de 0,15, al
escoger o comprar 10 animales ¿Cuál es la probabilidad de hallar a 2 con metritis
subclínica?

10 10!
𝑝(2) = ( ) 0,152 (1 − 0,15)10−2 = 0,152 (1 − 0,15)10−2 = 0,28
2 2! (10 − 2)!

Dr. Jaime Fernando Vega Vilca


13

2.2. DISTRIBUCIÓN NORMAL

Entendamos intuitivamente esta curva. El histograma de la figura central fue


creado con clases más pequeñas que el de la izquierda. La tercera figura incluye
todos los valores de la población. Este no es un histograma puesto que la
población es infinitamente grande. Lo que se grafica es una distribución de
probabilidad. Aunque las distribuciones de probabilidad son similares a los
histogramas los eje Y son diferentes. En un histograma, el eje Y muestra el
número de observaciones en cada clase. En una distribución de probabilidad, el
eje Y no puede mostrar el número de observaciones en cada clase porque la
población e infinitamente grande y no hay clases. En vez de eso se representa
la probabilidad como el área bajo la curva. El área bajo la curva representa la
entera población.

Muestra de tamaño medio Muestra de tamaño grande Toda la población

Es la distribución más conocida ya que por medio de ella se pueden aproximar


muchas poblaciones útiles. Para identificar la distribución normal se requiere
conocer la media y la desviación estándar. Una curva normal es simétrica y en
forma de campana. Las muestras mayores a treinta tienden a esta forma y
podemos aprovechar algunas de sus características.

El modelo de distribución normal es usado cuando la variable aleatoria es


continua y tiene la siguiente expresión:

Dr. Jaime Fernando Vega Vilca


14

1 2 /(2𝜎 2 )
𝑓(𝑥) = 𝑒 −(𝑥−𝜇)
𝜎√2𝜋

La función muestra una curva simétrica de forma de campana, el área bajo la


curva representa la probabilidad de un rango se valores.
Esta distribución representa muchas variables de la vida real que se miden en
una escala continua.
Las propiedades de la función de densidad de probabilidad pueden resumirse
cuantitativamente como sigue:
0 ≤ 𝑓(𝑥)
𝑏
𝑃 (𝑎 ≤ 𝑥 ≤ 𝑏 ) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

Cuando tenemos definida una población en la que conocemos la media y


desviación estándar de una característica que nos interesa (por ejemplo peso
destete, con 𝑥̅ = 6,6 𝑘𝑔 𝑦 𝜎 = 0,9 𝑘𝑔) y deseamos encontrar la probabilidad de
hallar individuos en un rango de valores (entre 5 kg y 6 kg) se tendría que integrar
la curva para hallar esta probabilidad. Sin embargo, existe una alternativa más
atractiva, usar la tabla de valores Z (denominada distribución normal estándar).
La distribución normal estándar tiene una media es cero y una varianza de 1.
Para poder utilizarla y no estar integrando en cada problema, se estandarizan
los valores de interés utilizando la siguiente expresión:
𝑋−𝜇
𝑍=
𝜎
Con los datos, los valores estandarizados son:
5−6,6 6−6,6
𝑍1 = = −1,78 ; 𝑍2 = = −0,67
0,9 0,9

Después de calcular el valor estandarizado para cada valor, se consulta la Tabla


de la curva normal estándar para encontrar el área correspondiente bajo la curva.

Dr. Jaime Fernando Vega Vilca


15

Gráfica de distribución
Normal; Media=6,6; Desv.Est.=0,9
0,5

0,4

0,3

Densidad
0,2148
0,2

0,1

0,0
5 6 6,6
X

Ahora, si estamos interesados en encontrar individuos con valores mayores a


7,5 kg, seguimos los pasos indicados y nos resulta como sigue.

Gráfica de distribución
Normal; Media=6,6; Desv.Est.=0,9
0,5

0,4

0,3
Densidad

0,2

0,1
0,1587

0,0
6,6 7,5
X

Debemos señalar que un valor z en particular se buscan sumando los valores de


la primera columna con la primera fila, la intersección que se observa entre la
columna y la fila identificadas es la probabilidad buscada.

DISTRIBUCIONES DE MUESTREO

1. DEFINICIÓN

A diferencia de una distribución de probabilidad, donde se trata de hallar


individuos con determinados registros de interés en relación a una variable, la
distribución de muestreo es una función de probabilidad asociada a un
estadígrafo la cual se genera con todas las muestras de tamaño n que se pueden
extraer de una población. Así por ejemplo, 𝑥̅ 𝑦 𝑠 2 tienen una distribución de
probabilidad particular dependiendo de la muestra aleatoria que se haya
capturado.

Dr. Jaime Fernando Vega Vilca


16

2. TIPOS DE DISTRIBUCIONES DE MUESTREO

Las distribuciones de muestreo más conocidas son:


 Distribución de promedios muestrales.
 Distribución de diferencia de promedios muestrales.
 Distribución de una proporción muestral.
 Distribución de la diferencia de proporciones muestrales.
 Distribución Chi-cuadrado (varianzas).
 Distribución t de Student (promedios muestrales, muestras
pequeñas).
 Distribución F de Snedecor (relación de varianzas).

3. TEORÍA ESTADÍSTICA PARA LA COMPRENSIÓN DE UNA


DISTRIBUCIÓN DE MUESTREO

Para comprender aún más lo que es una distribución de muestreo; expondremos


un ejemplo clásico.
Se tiene una pequeña población de cinco ovinos blackbelly y se extrae
información de pesos al destete (dos meses):

8,9; 9,1; 10,4; 11,0; 10,1

Los parámetros de dicha población son:


∑𝑋
𝜇= = 9,9
𝑁
2
∑(𝑋 − 𝜇) ⁄
𝜎= √ 𝑁 = 0,79
Si tomamos muestras al azar de tamaño n = 3 de la población, todas las posibles
muestras sin repetición serían:

Muestra (X1,X2,X3) Media de la muestra


8,9; 9,1; 10,4 9,47
8,9; 9,1; 11,0 9,67
8,9; 9,1; 10,1 9,37
8,9; 10,4; 11,0 10,10
8,9; 10,4; 10,1 9,80
8,9; 11,0; 10,1 10,00
9,1; 10,4; 11,0 10,17
9,1: 10,4; 10,1 9,87
10,4; 11,0; 10,1 10,50
Media 9,9
Se observa que las muestras extraídas tienen promedios que van de 9,47 a
10,50 y todas pertenecen a la misma población. Es pertinente mencionar que

Dr. Jaime Fernando Vega Vilca


17

cuando queremos comparar dos poblaciones se entiende por lo tanto que dos
poblaciones son diferentes cuando la distribución de sus medias muestrales no
se entrecruzan (a) y son iguales cuando la distribución de medias se entrecruzan
(b).

(a) (b)
Analizando los datos del cuadro se comprueba que la media poblacional es la
misma que la media obtenida de las medias de las muestras, así se establece la
relación:
𝜇𝑥̅ = 𝜇 = 9,9

Y que la desviación estándar de la muestra está relacionada con la desviación


estándar de la población de la siguiente manera:
𝜎 0,79
𝜎𝑥̅ = = = 0,35
√𝑛 √5
De la relación encontrada entre la media de todas las muestras y la media
poblacional, así como la desviación estándar de todas las muestras y la
desviación estándar de la población surge el teorema de límite central (TLC),
que nos dice: No importando el tipo de distribución, si se extraen muestras y en
cada una de ellas se calculan la media y la desviación estándar las relaciones
siempre serán:
𝜇𝑥̅ = 𝜇
𝜎
𝜎𝑥̅ =
√𝑛
El TLC, es importante porque en estadística, nosotros hacemos inferencias
acerca de la media poblacional basados en el valor de una simple media
muestral. El TLC, dice que para grandes muestras (n ≥ 30), la distribución de las
medias muestrales es aproximadamente normal como se observa a
continuación.

Dr. Jaime Fernando Vega Vilca


18

Población Distribución Distribución


original de muestreo de muestreo
de 𝑥̅ para n=2 de 𝑥̅ para n=5

Al igual que con las distribuciones de probabilidad nosotros podemos realizar


afirmaciones acerca de la distribución de medias muestrales de tamaño n por
medio de la transformación a la distribución normal estándar que vimos
anteriormente pero ahora considerando los promedios y desviaciones estándar
muestrales. Así,

Distribución de probabilidad Distribución de muestreo


𝑋−𝜇 𝑥̅ − 𝜇𝑥̅ 𝑥̅ − 𝜇
𝑍= 𝑑𝑒 𝑚𝑎𝑛𝑒𝑟𝑎 𝑠𝑖𝑚𝑖𝑙𝑎𝑟 𝑍= = 𝜎
𝜎 𝜎𝑥̅ ⁄ 𝑛

Supongamos que tenemos una población con µ = 100 y 𝜎 = 10 . Si tomamos
una simple muestra al azar de tamaño 225 (muestra grande), y deseamos
encontrar la probabilidad que la media de la muestra caiga entre 99 y 102.
El problema de interés es establecido como sigue:
𝑃(99 ≤ 𝑋̅ ≤ 102)
La solución es transformar cada valor a valores Z:
99−100 102−100
𝑍1 = 10⁄ = -1,5 𝑍2 = 10⁄ =3
√225 √225

Dr. Jaime Fernando Vega Vilca


19

El problema de interés con valores Z sería:


𝑃(99 ≤ 𝑥̅ ≤ 102) = 𝑃(−1,5 ≤ 𝑍 ≤ 3)
Buscando las probabilidades en la tabla Z o utilizando la computadora se obtiene:
𝑃(−1,5 ≤ 𝑍 ≤ 3) = 0,93
Por lo tanto la probabilidad que la media de la muestra basada en 225
observaciones se encuentre entre 99 y 102 es 0,93.
La estadística-matemática ha demostrado que utilizando las propiedades de la
distribución normal estándar a partir de la media muestral se puede estimar la
media poblacional con la siguiente expresión:
𝑃(𝑥̅ − 𝑧∝⁄2 ∗ 𝜎⁄ ≤ 𝜇 ≤ 𝑥̅ + 𝑧∝⁄2 ∗ 𝜎⁄ ) = 0,95 (grado de confianza)
√𝑛 √𝑛
Sin embargo, en la práctica no se conoce la media y la desviación estándar de
la población. Por lo que en este caso se usa una distribución denominada t que
incluye la desviación estándar de la muestra en el cálculo para estimar la media
poblacional:
𝑃(𝑥̅ − 𝑡𝛼⁄2 ∗ 𝑠⁄ ≤ 𝜇 ≤ 𝑥̅ + 𝑡𝛼⁄2 ∗ 𝑠⁄ ) = 0,95 (grado de confianza)
√𝑛 √𝑛
Por ejemplo, para realizar la estima de la media poblacional del peso al destete
en lechones a una confianza del 95% a partir de una muestra de tamaño, n = 15
con ̅𝑥 = 6,5 𝑘𝑔 𝑦 𝑠 = 0,5 𝑘𝑔., se procede de la siguiente manera:
Solución:
Si la confianza es 0,95 el error es 0,05 (𝛼). El valor de t = 2,15 es hallado en
tabla o computadora con el valor de ∝⁄2 = 0,05⁄2 = 0,025 , y los grados de
libertad de la muestra (n-1). Reemplazando valores se obtiene:

𝑃(6,5 − 2,15 ∗ 0,5⁄ ≤ 𝜇 ≤ 6,5 + 2,15 ∗ 0,5⁄ ) = 0,95


√15 √15
𝑃(6,22 ≤ 𝜇 ≤ 6,78) = 0,95
La estima por intervalo nos dice que la media de esa población está entre 6,22
a 6,78 y esto se afirma con una confianza de 95%.
En la tabla de la distribución “t” los valores t se encuentran cruzando el valor de
probabilidad, que se encuentra en la línea superior y los grados de libertad (n-1)
que se encuentran a la izquierda.
Finalmente, recordemos que la distribución normal estándar en la práctica es
una distribución de probabilidad que se utiliza para hallar la probabilidad de
valores individuales mientras que la distribución t es una distribución de muestreo
y se utiliza para hallar la probabilidad de un estadígrafo, la media.

Dr. Jaime Fernando Vega Vilca


20

REFERENCIAS BIBLIOGRÁFICAS
Acuña, E. (2000). Análisis estadístico de datos. Usando Minitab para Windows.
Lima: Sanki
D`Agostino, R. B., Sullivan, L. M., Beiser, A. S. (2006). Introductory applied
biostatistics. Belmont, USA: Duxbury-Thomson.
Dawson, B. y Trapp, R. G. (2002). Bioestadística médica. Tercera edición.
México DF: El Manual Moderno.
Kaps, M. y Lamberson, L. (2009). Biostatistics for animal science. Segunda
Edición. Oxfordshire: CABI.
McClave J. T., Benson P. G. y Sincich T. (2008). Statistics for Business and
Economics. Décima edición. New Jersey: Pearson-Prentice Hall.

Dr. Jaime Fernando Vega Vilca