Académique Documents
Professionnel Documents
Culture Documents
Probabilidad
Muestreo aleatorio simple
Poblaci
on estadstica
Estimacion estadstica
Matematicas II en Biotecnologa
Carmen Armero
26 de enero de 2011
Muestra y poblaciones.
Inferencia estadstica
Definicion y caractersticas de una poblaci
on
Probabilidad
Muestreo aleatorio simple
Poblacion estadstica
Distribucion normal
Distribucion binomial
Estimacion estadstica
Variabilidad muestral
Estimacion de la media de una poblaci
on normal
Estimacion de una proporci
on poblacional
I Inferencia estadstica:
1. Definicion de la poblaci
on objeto de estudio. (E.1 (cont.): Grupo
sanguneo de todas las personas de UK). Definicion de poblacion
estadstica (?).
2. Seleccion de una muestra representativa de la poblacion (?)
3. Descripci on de los datos de la muestra (E.1 (cont.): Tabla de
frecuencias del grupo sanguneo de las 3,696 personas)
4. Procedimientos estadsticos para extraer conclusiones sobre la
poblacion (?).
Definici
on de poblaci
on:
I E.2: La noradrenalina (MOPEG) es un metabolito que juega un papel
muy importante en la funci on cerebral. En un estudio para determinar si
la ingesta de alcohol puede elevar la concentraci on de MOPEG en el
fluido cerebroespinal participan siete voluntarios hombres, j
ovenes y
sanos. La concentraci on de MOPEG se ha medido dos veces en cada
voluntario, una al pricipio de la experiencia y otra despues de beber 80 gr.
de etanol. Los resultados (en pmoles/ml) son los siguientes:
Voluntario 1 2 3 4 5 6 7
Antes 46 47 41 45 37 48 58
Despues 56 52 47 48 37 51 62
Diferencia 10 5 6 3 0 3 4
I Variable de inter
es: Diferencia en la concentraci
on de MOPEG despues
de beber 80 gr de etanol.
I Unidad observacional: Hombre joven y sano.
I Poblaci
on: Diferencias en la concentraci
on de MOPEG de TODOS los
hombres sanos y j
ovenes. Se mide antes y despues de beber 80 gr. de
etanol.
Tema 2: Inferencia en una poblaci
on Matem
aticas II en Biotecnologa
Muestra y poblaciones.
Probabilidad
Inferencia estadstica
Muestreo aleatorio simple
Definici
on y caractersticas de una poblaci
on
Poblaci
on estadstica
Estimacion estadstica
1. Par
ametros: Media poblacional, desviaci on tpica poblacional,
cuartiles poblacionales, mediana poblacional, . . .
2. Estadsticos: Media muestral, desviaci
on tpica muestral, cuartiles
muestrales, mediana muestral, . . .
Definici
on y caractersticas de una poblaci
on (cont.):
I Caractersticas de poblaciones correspondientes a variables categ
oricas:
frecuencia relativa o porcentaje de cada categora en la poblaci
on.
I E.4 En un estudio sobre la resistencia a la roya de la corona en plantas de
cebada se han registrado 31 plantas resistentes, 28 en niveles intermedios
y 11 susceptibles.
I Variable estudiada: Tipo de resistencia de una planta de cebada a la
roya de la corona
I Poblaci
on: resistencia (R), intermediatez (I) o susceptibilidad (S) a la
roya de la corona de todas las plantas de cebada.
I Proporci
on poblacional de resistentes, intermedios y susceptibles: pR , pI
y pS (Par
ametros).
I Proporci
on muestral de resistentes, intermedios y susceptibles:
p
R =31/70=0.44, p I =28/70=0.40, p
S =11/70=0.16 (Estadsticos). Son
estimaciones de los par
ametros.
Definici
on y caractersticas de una poblaci
on (cont):
E.5 Un grupo de 11 pacientes con adenocarcinoma han sido tratados con
mitomicina. Tres de los pacientes experimentaron una respuesta positiva
(disminuci
on del tamano del tumor en mas del 50 %).
I Variable: Respuesta (positiva o no) de un paciente con adenocarcinoma
que es tratado con mitomicina.
I Poblaci
on: Respuestas de todos los pacientes con adenocarcinoma que
podran ser tratados con mitomicina.
I p: Proporci
on poblacional de pacientes con adenocarcinoma con
respuesta positiva a un tratamiento con mitomicina (par
ametro).
I p
: Proporci
on muestral de pacientes con adenocarcinoma con respuesta
positiva a un tratamiento con mitomicina (estadstico), p
=3/11=0.27.
I p es desconocida y p
=0.27 es una estimaci
on de p (no decimos nada de
momento de si es una buena estimaci
on o no)
Definici
on y caractersticas de una poblaci
on (cont):
I Caractersticas de poblaciones correspondientes a variables cuantitativas:
media poblacional, desviacion tpica poblacional, cuartiles poblacionales,
mediana poblacional, . . ..
I E.6 Un investigador mide el numero de hojas en cada una de 150 plantas
de tabaco de la misma cepa (Habana). Los resultados son los siguientes:
N
um. hojas 17 18 19 20 21 22 23 24
N
um. plantas 3 22 44 42 22 10 6 1
I Poblaci
on: N
umero de hojas de todas las plantas de tabaco de la cepa
Habana.
I Media poblacional, : N
umero medio de hojas de las plantas de tabaco
de la cepa Habana (par
ametro).
I Desviaci
on tpica poblacional, : Desviaci
on tpica del n
umero de hojas
de las plantas de tabaco de la cepa Habana (par
ametro).
I Media muestral, y : N
umero medio de hojas en las 150 plantas tabaco de
la cepa Habana de la muestra (estadstico).
I Desviaci
on tpica muestral, s: Desviaci
on tpica del n
umero de hojas en
las 150 plantas tabaco de la cepa Habana de la muestra (estadstico).
Tema 2: Inferencia en una poblaci
on Matem
aticas II en Biotecnologa
Muestra y poblaciones.
Probabilidad
Inferencia estadstica
Muestreo aleatorio simple
Definici
on y caractersticas de una poblaci
on
Poblaci
on estadstica
Estimacion estadstica
Definici
on y caractersticas de una poblaci
on (cont):
I Notaci
on para los estadsticos y par
ametros m
as importantes
Muestra Poblaci
on
Medida Estadstico Par
ametro
Proporci
on p p
Media y
DT s
Varianza s2 2
INFERENCIA ESTADISTICA
1. Definici
on de la poblaci
on de interes. Definici
on de poblaci
on estadstica
(Probabilidad)
2. Selecci
on de una muestra representativa de la poblaci
on (Probabilidad)
3. Descripci
on de los datos de la muestra
4. Procedimientos estadsticos para extraer conclusiones sobre la poblaci
on
(Probabilidad).
PROBABILIDAD
I Experimento aleatorio: es un proceso bien definido que presenta
incertidumbre en los resultados (por ejemplo, lanzamiento de tres
monedas)
I Espacio muestral, S: Es el conjunto de todos los posibles resultados del
experimento {CCC , CCX , CXC , XCC , CXX , XCX , XXC , XXX }
I Suceso: Es un subconjunto de S (A = {S
olo sale una cara} =
{CXX , XCX , XXC })
I Un suceso ocurre cuando se produce alguno de sus resultados
I Probabilidad de un suceso A es un n
umero que cuantifica su ocurrencia,
P(A).
I Reglas b
asicas de la probabilidad:
PROBABILIDAD (cont.)
I M
as propiedades:
= 1P(A),
1. P(A)
2. P(A B) = P(A) + P(B)P(A B)
I Probabilidad condicionada de que ocurra A dado que ha ocurrido B,
P(A | B) = P(A B)/P(B), siempre que P(B) > 0.
I Independencia: Los sucesos A y B son independientes cuando
P(A B) = P(A)P(B); o equivalentemente P(A | B) = P(A) y
P(B|A) = P(B).
I Teorema de la probabilidad total:
P(A) = P(A|B)P(B) + P(A|B)P(
B)
I Teorema de Bayes:
P(B|A)P(A)
P(A | B) =
P(B)
EJEMPLOS Probabilidad
E.7 Los guisantes de Mendel pueden tener flores de color p urpura o blanco. El
color de las flores se debe a un unico gen con alelo lila (A) dominante con
respecto al alelo blanco (a). El hbrido F 1 (obtenido cruzando dos lineas puras
de reproducci on, una con flores lila y la otra con flores blancas) tiene flores lilas
y es heterozigotico, Aa.
Si seleccionamos una semilla F 2 procedente de un cruce de dos progenitores
F 1 heterocig
oticos:
1. P(F 2 es AA) = 1/4, P(F 2 es Aa) = 1/2 y P(F 2 es aa) = 1/4
2. P(F 2 flores blancas) = P(F 2 es aa) = 1/4 y P(F 2 flores lilas) = 3/4.
3. P(F 2 genotipo AA | F 2 flores lilas) =
P(+ | E ) P(E )
P(E | +) =
P(+)
y como:
I P(+ | E )=0.995 P( | E )=0.005
I P( | E )=0.98 )=0.02
P(+ | E
I P(E )=0.1 )=0.9
P(E
I P(+) = P(+ | E ) P(E ) + P(+ | E )P(E
)
= 0.995 0.1 + 0.02 0.9 = 0.1175
finalmente:
P(+ | E ) P(E ) 0.995 0.1
P(E | +) = = = 0.8468
P(+) 0.1175
ESTADISTICA
POBLACION
I Poblaci
on: conjunto de las observaciones de la variable de interes en
todas las posibles unidades experimentales del estudio.
I Poblaci
on estadstica correspondiente a una variable cuantitativa : curva
de densidad que resultara de considerar histogramas de muestras cada
vez m
as grandes e intervalos de clase cada vez m as peque
nos.
NORMAL
DISTRIBUCION
I La poblaci
on estadstica correspondiente a una variable Y cuantitativa
mas importante es la distribuci
on normal: curva simetrica, acampanada,
probabilidad es el
area bajo la curva del intervalo correspondiente y el
area total bajo la curva es siempre 1.
NORMAL (cont.)
DISTRIBUCION
I Curva normal est
a centrada en la media , los puntos en los que la
campana cambia la direcci on de la curvatura son y e y + ( es la
on tpica) y la curva se extiende hacia por la izquierda y +
desviaci
por la derecha.
I Notacion: Y N(, )
NORMAL (cont.)
DISTRIBUCION
Si Y N(, ):
I P(Y = a) = 0
I P(Y < b) = P(Y b) y P(Y > a) = P(Y a)
I P(Y b) = 1 P(Y > b)
I P(a < Y < b) = P(a Y b) = P(Y < b) P(Y < a) = P(Y
b) P(Y a)
NORMAL (cont.)
DISTRIBUCION
I C
alculo de probabilidades de una distribuci
on normal en
http://onlinestatbook.com/index.html
I Entrando en
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces (cont.) En una cierta poblaci
on del arenque
Pomolobus aestivalis, la longitud Y de los peces sigue una distribucion
normal con media =54.0 mm. y desviaci on tpica =4.5 mm,
N( =54.0, =4.5)
I Si se elige un pez al azar de dicha poblaci
on, cual es la probabilidad de
que su longitud sea superior a 51 mm, P(Y > 51)?
I Calculator > Normal distribution
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces (cont.) En una cierta poblaci
on del arenque
Pomolobus aestivalis, la longitud Y de los peces es N( =54.0, =4.5)
I Si se elige un pez al azar de dicha poblaci
on, cual es la probabilidad de
que su longitud sea inferior a 60 mm, P(Y < 60)?
I Calculator > Normal distribution
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces (cont.) En una cierta poblaci
on del arenque
Pomolobus aestivalis, la longitud Y de los peces es N( =54.0, =4.5)
I Si se elige un pez al azar de dicha poblaci
on, cual es la probabilidad de
que su longitud este entre 51 mm. y 60 mm,, P(51 < Y < 60)?
I Calculator > Normal distribution
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces (cont.) En una cierta poblaci
on del arenque
Pomolobus aestivalis, la longitud Y de los peces es N( =54.0, =4.5)
I Si se elige un pez al azar de dicha poblaci
on, cual es la probabilidad de
que su longitud sea inferior a 56 mm o superior a 63 mm,
P(Y < 46 Y > 63)?
I Calculator > Normal distribution
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces (cont.) En una cierta poblaci
on del arenque
Pomolobus aestivalis, la longitud Y de los peces es N( =54.0, =4.5)
I Definici
on de percentil del m % de la distribuci
on: Valor y de la variable
para el que P(Y y ) = m/100
I El percentil del 70 % de N( =54.0, =4.5) ser
a la longitud y para la que
P(Y y ) =0.70
I Calculator > Inverse Normal distribution
NORMAL (cont.)
DISTRIBUCION
I E.15: Longitud peces En una cierta poblaci
on del arenque Pomolobus
aestivalis, la longitud Y de los peces es N( =54.0, =4.5)
I Calcula la longitud y para la que P(Y y ) =0.80
I Calculator > Inverse Normal distribution
BINOMIAL
DISTRIBUCION
I La distribuci
on de una variable binomial es una distribuci
on de
probabilidad asociada con una particular operaci
on de azar definida en
terminos de un modelo de pruebas independientes.
I Modelo de pruebas independientes:Es una serie de n pruebas
independientes en la que en cada una de ellas el resultado puede ser
exito o fracaso. La probabilidad de
exito es p, siempre constante en
todas las pruebas, independientemente de los resultados de las pruebas
anteriores.
I E.16: Albinismo Si dos portadores del gen para el albinismo se emparejan,
cada uno de sus hijos tiene probabilidad 1/4 se ser albino. La probabilidad
de que el segundo hijo sea albino es la misma, 1/4, independientemente
de si el primer hijo es albino o no. De la misma forma, el tercer hijo
ser
a o no albino con probabilidad 1/4, independientemente de si lo son o
no sus dos hermanos. Si consideramos como exito ser albino y como
fracaso no ser albino, el modelo de pruebas independientes es el
adecuado con p = 1/4 y n el n umero de hijos en la familia.
BINOMIAL (cont.)
DISTRIBUCION
BINOMIAL (cont.)
DISTRIBUCION
I La distribuci
on binomial especifica las probabilidades asociadas al n
umero
de
exitos total en un experimento basado en un modelo de pruebas
independientes.
I Si tenemos un modelo con n pruebas independientes:
Prueba 1:
Exito (p) o Fracaso (1 p)
Prueba 2:
Exito (p) o Fracaso (1 p)
.. ..
. .
Prueba n:
Exito (p) o Fracaso (1 p)
I Una variable binomial Y describe la distribuci
on de probabilidad asociada
al n
umero de exitos en un modelo de n pruebas independientes con
exito p, Y {0, 1, 2, . . . , n}.
probabilidad de
I Notaci
on: Y Bi(n, p)
BINOMIAL (cont.)
DISTRIBUCION
I E.16: Albinismo (cont.) Suponemos que dos portadores del gen del
albinismo tienen dos hijos. Si representamos por Ai (A i ) el hecho de que
que el hijo i es albino (no albino) e Y es la variable que describe el
n
umero de hijos albinos:
I P(Y = 0) = P(A 1 A 2 ) = P(A 1 )P(A
2 ) = (3/4)(3/4) = 9/16
I P(Y = 1) =P([A1 A 2 ] [A
1 A2 ]) =
P(A1 A 2 ) + P(A
1 A2 ) = P(A1 )P(A 2 ) + P(A
1 )P(A2 ) =
(1/4)(3/4) + (3/4)(1/4) = 2 (1/4)(3/4) = 6/16
I P(Y = 2) = P(A1 A2 ) = P(A1 )P(A2 ) = (1/4)(1/4) = 1/16
BINOMIAL (cont.)
DISTRIBUCION
I E.16: Albinismo (cont.) Suponemos ahora que los dos portadores del
gen del albinismo tienen tres hijos. La variable Y que describe el n
umero
de hijos albinos es binomial, Y Bi(n = 3, p = 1/4), y su distribucion de
probabilidad es:
I P(Y = 0) = (3/4)3 = 27/64
I P(Y = 1) = 3 (1/4)(3/4)2 = 27/64
I P(Y = 2) = 3 (1/4)2 (3/4) = 9/64
I P(Y = 3) = (1/4)3 = 1/64
I Explicaci
on en la pizarra a traves de
arboles probabilsticos.
BINOMIAL (cont.)
DISTRIBUCION
I La distribuci
on de probabilidad de una variable Y Bi(n, p) es:
n!
C (n, k) = ,
(n k)! k!
siendo m! = m (m 1) (m 2) . . . 2 1 el factorial de m con 0! = 1,
C (m, 0) = C (m, m) = 1 y C (m, 1) = m.
I Si Y Bi(n, p) su media es = np y su desviaci
on tpica es
p
= n(p(1 p).
BINOMIAL (cont.)
DISTRIBUCION
BINOMIAL (cont.)
DISTRIBUCION
I C
alculo de probabilidades de una distribuci
on binomial en el Virtual Rice
Lab in:
http://onlinestatbook.com/index.html
I Entrando en:
Table of contents > XVI. Calculators > Binomial distribution
VARIABILIDAD MUESTRAL
siendo s la desviaci
on tpica de los datos y n el tama
no de la muestra.
INTERVALOS DE CONFIANZA
I Proporcionan informaci
on probabilstica sobre d
onde puede localizarse la
media poblacional .
I C
alculo de un intervalo de confianza para con coeficiente de confianza
0.95 (o del 95 %):
y t0.95(n1) SEy , y + t0.95(n1) SEy ),
(
siendo:
I n: tama no de la muestra
I y : media muestral
I SEy : error estandard de la media muestral
I t0.95(n1) : valor crtico de t para 0.95 con n 1 grados de
libertat (explicado despues)
I Interpretaci
on: Tenemos una confianza del 95 % de poder encontrar la
media poblacional dentro del intervalo de confianza calculado.
INTERVALOS DE CONFIANZA
I C
alculo de valores crticos t en la p
agina web del Virtual Rice Lab:
http://onlinestatbook.com/index.html. Entrando en:
Table of contents > XVI. Calculators > Inverse t
I t0.95(12) ,
DE UNA PROPORCION
ESTIMACION POBLACIONAL
INTERVALOS DE CONFIANZA