Académique Documents
Professionnel Documents
Culture Documents
• Población y Muestra
• Muestras Aleatorias
• Escalas de Medición
• Visualización de Datos
• Parámetros y Estadísticas
• Probabilidad
• Inferencia Estadística
• Pruebas de hipótesis
• Proporciones
• Media de una normal
• Diferencias Significativas
Población y Muestra
Subconjunto de
una población.
ESTADÍSTICAS
Medidas descriptivas de la
muestra que se usan para estimar
a los parámetros
PARÁMETROS
Medidas descriptivas de la población
Es el proceso de hacer una estimación o predicción
sobre los valores de los parámetros de una población
basados en los datos contenidos en una muestra.
Se usan las estadísticas para estimar a los parámetros.
Ejemplo 1: Se continuará ofreciendo un servicio en el Edo
de México solo si su penetración es mayor al 30%
Ejemplo 1: Se continuará ofreciendo un servicio en una
determinada plaza solo si su penetración es mayor al 30%
Se selecciona una
“Muestra
Representativa”
Ejemplo 1
no
“Muestra
Representativa” sí
no
no
Penetración
33%
si
Encuesta en la Muestra no
sí
no
no
Ejemplo 1
¿Se puede llevar a la Población la conclusión obtenida en la
“Muestra Representativa”?
Incertidumbre
• Causada por la variabilidad
• Tener Información incompleta de no
una muestra
sí
no
Penetración
no
33% Penetración
33%
si
no
sí
no
no
¿Se puede llevar a cabo una Inferencia Estadistica?
• ¿Que tan cerca esta el valor obtenido (la estimación) en la muestra del valor
que se tiene en la población?
Tamaño de
2, 7
muestra =2 2, 5 Media=4.5 2, 11
Media=3.5 Media=6.5
11, 3 2, 3
Media=7.0 Media=2.5
2, 5, 7, 11, 3
7, 3 Media=5.6 5, 7
Media=5.0 Media=6.0
7, 11 5, 11
Media=9.0 5, 3 Media=8.0
Media=4.0
En la práctica solo se colecta aleatoriamente
una muestra
1
10 2
Selección mediante un
2, 7 1 procedimiento aleatorio
2, 11
9
2, 5
Media=3.5
Media=4.5
Media=6.5 3 2
3
2, 3
11, 3
Media=7.0 Media=2.5 4 5, 7
5 4 Media=6.0
2, 5, 7, 11, 3
5, 7 6
7, 3 Media=5.6 Media=6.0 4
Media=10.0 7
8 8
7, 11
Media=9.0 5, 3
5, 11
Media=8.0
5
9
Media=4.0
10
7
6
2, 7
2, 5 Media=4.5 2, 11
Media=3.5 Media=6.5
11, 3 2, 3
Media=7.0 Media=2.5
2, 5, 7, 11, 3
7, 3 Media=5.6 5, 7
Media=10.0 Media=6.0
7, 11 5, 11
Media=9.0 5, 3 Media=8.0
Media=4.0
La media es
6.0
n n!
k k! n k !
2, 5, 7, 11, 3
Media=5.6
Escalas de Medición
Variables
•Genero
Masculino, Femenino Nominal
•Plaza
Oaxaca, DF
Cualitativas
•NSE
A, B, C, D, E
Ordinal
•Gusto en General
Nada (1), Poco (2), Mucho (3)
•Edad (años)
3, 40, 54
3.5, 40.3 54.2 Discreta/
Cuantitativas
•Precios ($)
Continua
3.342, 44.520, 10.388
Visualización de Datos
Ejemplo 2
Tablas de Frecuencias e Histogramas
Intervalos
de Clase Frecuencia
Salario Frecuencia Relativa
(M$)
[40, 50) 4 4/30
[50, 60) 4 4/30
[60, 70) 5 5/30
[70, 80) 6 6/30
[80, 90) 3 3/30
[90, 100) 4 4/30
[100, 110) 1 1/30
[110, 120) 1 1/30
[120, 130) 0 0/30
[130,140) 2 2/30
Ejemplo 3
NSE A/B
58%
¿En los últimos 12 meses ha ahorrado o invertido dinero con alguna institución financiera?/ ?/¿Cuando invierte, usted
generalmente... ?/¿En cuál o cuáles de los siguientes instrumentos ha invertido
Ejemplo 3
¿Cuál de las siguientes frases describe mejor su percepción sobre la situación del país…?
De la siguiente tarjeta dígame, comparado con el año pasado, ¿diría que su situación personal…?
Diagrama de puntos
N=17
1, 8, 8, 8, 8, 9, 9, 9, 9, 9, 10, 10, 12, 21, 22, 23, 24
1 2 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 21 22 23 24
Tarea
•Penetración
•Peso promedio de las bolsas
•Contenido de Sal Promedio
•Intención de compra
•Gusto en general
ESTADÍSTICAS
Medidas descriptivas de la
muestra que se usan para estimar
a los parámetros
PARÁMETROS
Medidas descriptivas de la población
Medidas de Tendencia Central
Término que hace referencia al conjunto de medidas relacionadas a la posición o
distribución de los datos en una escala.
• Media.- Comúnmente llamado promedio, es la suma de todos los valores divido entre el
número total de observaciones.
• Mediana. El valor que esta en medio de un conjunto de datos. Dos formas para calcularlo,
después de ordenar los datos de mayor a menor:
• Valores impar: la mediana es el valor que se localiza exactamente a la mitad de todos
los datos
• Valore pares: media de los dos valores a la mitad.
Desviación Coeficiente de
Media Varianza Estándar Variación
N N
X
iX 2
Población
i
2 i
100
i
Parámetros
N N
n n
Xi
ix x 2
s
Muestra
x i
s2 i s 100
Estadísticas n n 1 x
6, 6, 6, 6, 6, 6, 6 Media, Mediana, Moda
Media=6
1 2 3 4 5 6 7 8 9 10 11
Mediana=6
Moda=6
1, 1, 1, 2, 2, 6, 11
Media=3.43
Mediana=2
1 2 3 4 5 6 7 8 9 10 11 Moda=1
3.43
Media=8.57
Mediana=10
1 2 3 4 5 6 7 8 9 10 11 Moda=11
8.57
El efecto de puntos aberrantes
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 4 N=13
1 2 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 20 21 22 23
Media = 2.15
Mediana= 2.00
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 53 N=13
1 2 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 100
5, 6, 6, 6, 6, 6, 7
1 2 3 4 5 6 7 8 9 10 11
1, 4, 6, 6, 6, 8, 7, 11
150
100
50
-
0. 5 3 5.5 8 10.5 13 16 20 24.5 32 60 130
Fr e q ue ncy
Media x
x x i
2
Varianza
n 1
Desviación Estándar Varianza
Desviación Es tan dar
Coeficiente de Variación x100
Media
Cuantificación
de la
1 2 3 4 5 6 7 8 9 10
Variabilidad
5.4
Datos
Escala 1-10 Xi X ( X i X )2
X
1 -4.4 19.36
2 -3.4 11.56
5 -0.4 0.16
9 3.6 12.96
10 4.6 21.16
X 5.4 Total 0.0 Total 65.20
X i X
2
65.2
Variabilid ad Pr omedio i
13.04
n 5
X i X
2
65.2
Varianza i
16.3
n 1 5 1
Unidad de medida Unidad de medida
Variable Media Varianza Desviación Estandar
Media 300 $ 15 Kg
Desviación
Estándar 123 $ 5 Kg
Desviación Estándar
Coeficiente deVariación 100
Media
Coeficiente
de Variación
41% 33%
Tarea
X1 X2
5 1
6 2
8 2
3 3
3 1
5 1
4 0
4 1
3 1
4 2
3 1
5 0
7 1
4 1
4 0
Media
Varianza
Desv Estandar
Coef Variación
•Probabilidad
•Variables Aleatorias
Probabilidad
0.134
0.130
0.127
0.128
0.126
Probabilidad de la letra e = 0.127
0.124
0.120
0.116
0.112
1 2 3 4 5 6 7 8 9 10 12
Miles de letras
Un modelo probabilístico basado en al frecuencia relativa
NOTA:
Esto no debe tomarse como una definición de probabilidad;
simplemente diremos que la frecuencia relativa del evento A es
una medida de una cantidad desconocida que es la
probabilidad del evento A
Ejemplo. Muestra de pozos contaminados en tres regiones
Regiones
Regiones
Pozos contaminados Norte( N) Centro ( C) Sur (S)
Aguas Negras (an) 0.10 0.12 0.17 0.395
Residuos fabricas (rf) 0.20 0.22 0.05 0.469
Lluvia ácida (an) 0.05 0.06 0.02 0.136
0.346 0.407 0.247 1.000
Regiones
Pozos contaminados Norte( N) Centro ( C) Sur (S)
Aguas Negras (an) 0.10 0.12 0.17 0.395
Residuos fabricas (rf) 0.20 0.22 0.05 0.469
Lluvia ácida (an) 0.05 0.06 0.02 0.136
0.346 0.407 0.247 1.000
P(an) 0.395
P(C ) 0.407
P (an y C) 0.12
P ( N y C) 0
Probabilidades Marginales
P (an) 0.395
P (C ) 0.407
Probabilidades Condicionales
0.12 0.12
P(an / C ) 0.295 P (C / an) 0.303
0.407 0.395
0.05 0.05
P (rf / S ) 0.202 P ( S / rf ) 0.107
0.247 0.469
Regiones
Pozos contaminados Norte( N) Centro ( C) Sur (S)
Aguas Negras (an) 0.10 0.12 0.17 0.395
Residuos fabricas (rf) 0.20 0.22 0.05 0.469
Lluvia ácida (an) 0.05 0.06 0.02 0.136
0.346 0.407 0.247 1.000
Eventos Dependientes
0.12
P(an / C ) 0.295 P(an) 0.395 Dependencia
0.407
¿El evento rf es dependiente del S?
0.05
P(rf / S ) 0.202 P(rf ) 0.469 Dependencia
0.247
Regiones
Pozos contaminados Norte( N) Centro ( C) Sur (S)
Aguas Negras (an) 0.137 0.161 0.098 0.395
Residuos fabricas (rf) 0.162 0.191 0.116 0.469
Lluvia ácida (an) 0.047 0.055 0.034 0.136
0.346 0.407 0.247 1.000
Eventos Independientes
0.161
P(an / C ) 0.395 P(an) 0.395 Independencia
0.407
¿El evento rf es dependiente del S?
0.116
P(rf / S ) 0.469 P(rf ) 0.469 Independencia
0.247
Tarea
Variedades de Papa
Resistencia al
tizón tardío Alpha (Al) Atlantic (At) Frito Lay (FL)
Nula (N) 0.06 0.03 0.01 0.10
Moderada (M) 0.04 0.08 0.18 0.30
Resistente ( R) 0.07 0.19 0.34 0.60
0.17 0.30 0.53
X=0, 1, 2, 3
Supongamos que cada evento tiene las siguientes probabilidades
P(X=2)=9/32 P(X=1)=15/32
P(X=3)=1/32 P(X=0)=7/32
Distribución de probabilidades de X
Valor de X
(denotado por k) 0 1 2 3
P(X = k) 7/32 15/32 9/32 1/32 32/32
Distribución de probabilidades de X
Valor de X
(denotado por k) 0 1 2 3
P(X = k) 7/32 15/32 9/32 1/32 32/32
P( X 1) 9 / 32 15 / 32 1 / 32 25 / 32
P( X 1) 7 / 32
P(0 X 3) 7 / 32 9 / 32 15 / 32 31 / 32
Distribución de probabilidades de X
Valor de X
(denotado por k) 0 1 2 3
P(X = k) 7/32 15/32 9/32 1/32 32/32
7 15 9 1 36
Media de X X 0 1 2 3
32 32 32 32 32
2 2
7 15 9 1 42 60 36
Varianza de X 0 2 12 2 2 32
32 32 32 32 32 32 32
2
60 36
Varianza de X 1.875 1.266 0.609
2
X
32 32
Ejemplo
Eventos S E
X 1 0
P(X=k) p 1-p 1
Distribución de probabilidades de X
X 1 0
P(X=k) p 1-p 1
11
P ( X 1) p p (1 p )
1
P( X 0) (1 p) p 0 (1 p)10
1 k
P ( X k ) p (1 p )
k Distribución
Binomial
k 0,1 Puntual
X 1 0
P(X=k) p 1-p 1
X p
Var ( X ) p p 2 p(1 p)
Tarea
P ( X 1) P ( X 4)
P(3 X 0) P (3 X 0)
Valores de X -4 -3 -2 -1 0 1
P(X=k) 0.2 0.3 0.2 0.1 0.1 0.1
Variables Aleatorias Continuas
P( X k ) 0
Se puede calcular P(k1 X k 2 ) P(k1 X k 2 ) que corresponden
al área bajo la curva
Área total bajo la curva=1
P(k1 X k 2 ) P(k1 X k 2 )
k1 k2
Ejemplo f (x)
1
1 f ( x) 1 x 0 x2
2
0 1 2 x
f (x)
2x1
área bajo la recta 1
2
0 1 2 x
f (x)
1 1
1
1
P (1 X 2) 2
1 2 4
2
0 1 2 x
f (x)
1 1 3
P(0 X 1) 1
4 4
1
2
0 1 2 x
Tarea
1
f ( x) 1 x 0 x2
f (x) 2
1 P (0.2 X 1.5)
P (0 X 1.5)
0 1 2 x
P(0.5 X 2)
Modelos Probabilísticos
•Binomial
•Poisson
•Normal
•T-Student
Binomial
Consideremos el caso de 3 personas a las que se les
pregunta si tienen agua potable en su comunidad. Nos
interesa cuantificar en total de respuestas si (S)
1 2 3
Si Si Si
No No No
1 2 3
Si Si Si
No No No
n= 3
SSS SSN SNN NNN
SNS NSN
NSS NNS
No Letras (S ) = k 3 2 1 0
n= 3
n Número de personas SSS SSN SNN NNN
SNS NSN
k Número de letras S NSS NNS
No Letras = k 3 2 1 0
n n! Combinaciones 1 3 3 1
Probabilidad ppp ppq pqq qqq
k k! n k !
3 3! 3x 2 x1
1
3 3! 3 3! 3 x 2 x11
3 3! 3 x 2 x1
1
3
3!
3 x 2 x1
3 0 0! 3 0 ! 1 3 x 2 x1
2 2! 3 2 ! 2 x11
3 3! 3 x 2 x1
3
1 1! 3 1! 1 2 x1
Ejemplo con tres personas
P(S) = p, P(N)= 1-p =q
n= 3
SSS SSN SNN NNN
SNS NSN
NSS NNS
No Letras = x 3 2 1 0
Combinaciones 1 3 3 1
Probabilidad ppp ppq pqq qqq q=1-p
3 k 3 k
P( X k ) p q
k
k 0, 1, 2, 3
n Número de elementos en la muestra
Hay dos posibles resultados para cada elemento de la
muestra denominados Exito (E) y Fracaso (F)
X Total de éxitos en la muestra
p Probabilidad de éxito
Los eventos son independientes
n k nk
P( X k ) p q
k Binomial
k 0,1,2,3,..., n
X np
Var ( X ) npq
Poisson
Esta distribución surge cuando se cuentan eventos que ocurren en un periodo de
tiempo o en áreas.
•Número de plantas enfermas en una hectárea
•Enfermedades del suelo que ocurren en el tiempo de transplante de ciertos cultivos
•Número de partícula contaminantes en un cm3 el aire o en el agua
•Ataque de virus en el DF
e k
P( X k )
k!
k 0,1,2,3,.....
Ejemplo
e k
P( X k )
k!
k 0,1,2,3,.....
1.2 4
e (1.2)
P ( X 4)
4!
1.2 4
e (1.2)
P( X 4) 0.02602
4!
Tarea
Un proceso de purificación de agua en contenedores de 8000
litros produce el 5% de defectuosos.
Se toma una muestra aleatoria de 8 contenedores y se define
la variable aleatoria
X= Total de defectuosos en la muestra
P ( X 7)
P ( X 0)
P ( X 7)
Alturas de 100 Méxicanos
Frecuencias Relativas
Altura (m)
Ejemplo
Ventas
Histogram enwith
of CORTO, valor
Normal Curve
10
Frequency
0 10 20 30
CORTO
Miles de Pesos
Cheetos.mpj
Distribución Normal
Matemáticamente, la distribución normal se define de la siguiente manera:
(media, s)
Frequencia
20
10
0.95
0.025 0.025
Ejemplo 17
99 ML Estimates
Mean 14.6574
95
StDev 5.71198
90
Goodness of Fit
80
70 AD* 0.405
Percent
60
50
40
30
20
10
5
0 10 20 30
Data
Cheetos.mpj
Ejemplo 17
Datos no normales
ML Estimates
Mean 1.05094
99
StDev 1.15032
95
90 Goodness of Fit
80 AD* 27.88
70
Percent
60
50
40
30
20
10
5
0 5 10
Data
Tarea
n -1 = grados de libertad
k-1= grados de libertad
n-1=31-1=30 grados de libertad
t-Student
t=2.43
Normal (0,1)
Z=2.421
0.978706
0.984522
0.978706
0.00058
0.984522
n-1=7-1=6 grados de libertad
t-Student
t=2.43
0.948838
t06.051162 2.43
t06.051162 2.43
Tarea
50
20
40
….
30
Percent
Percent
10
20
10
0
0
24 26 28 30 32 34 36 38 40
20 25 30 35 40 45 50
n = 20
n= 20
x1 x2 x300
Inferencia
Ejemplo 18
Inferencia
Inferencia
Inferencia
Aprendizaje
Aprendizaje
•Los métodos estadísticos que se emplean para llevar a cabo las inferencias permiten
cuantificar la incertidumbre.
•Estos métodos hacen uso de la probabilidad.
Hipótesis Estadística
Hipótesis: P>0.5
Hipótesis Estadística
Hipótesis: La mayoría de los agricultores en Mexico prefieren el Fertilizante X
Hipótesis: P>0.50
Hipótesis: P 0.5
Rechazo Ho No Rechazo Ho
H 0 : P P0 H 0 : P P0 H 0 : P P0
H a : P P0 H a : P P0 H a : P P0
H 0 : P P0 H 0 : P P0 H 0 : P P0
H a : P P0 H a : P P0 H a : P P0
Obtener de la Z / 2 Z
tablas de la
normal estándar
pest P0
Z0
Estadística de P0 1 P0
prueba
n
0.05
1 0.95
1
0.95
2 2
0.025 0.025
Z 0.025 1.959
0.025
1 0.975
0.975
0.025
Z 0.025 1.959
Reglas de decisión
pest P0
Rechazar H 0 si Z 0 Z / 2
P0 1 P0
H 0 : P P0 n
H a : P P0
pest P0
Rechazar H 0 si Z 0 Z / 2
P0 1 P0
n
H 0 : P P0 pest P0
Rechazar H 0 si Z Z
P0 1 P0
H a : P P0 n
H 0 : P P0 pest P0
Rechazar H 0 si Z Z
P0 1 P0
H a : P P0 n
0.05
1 0.95
1
0.95
2 2
0.025 0.025
Z 0.025 1.959
0.025
1 0.975
0.975
0.025
Z 0.025 1.959
Ejemplo 20
Prueba de dos colas
De acuerdo al censo de 1970 la proporción de individuos menores de 40 años
en una ciudad es 70%. Se desea saber si esa proporción cambio en el 2010
600
Pest 0.75
800
Ejemplo 20
P es la propoción de personas menores de 40 años
H 0 : P 0.7 La proporción de personas mayores de 40 años es del 70%
0.75 0.70
0.05
Z0 3.086
0.701 0.70 / 2 0.025
800
/ 2 0.025 / 2 0.025
Ejemplo 20
H 0 : P 0.7
H a : P 0.7
0.75 0.70
Z0 3.09 Z 0.025 1.959
0.701 0.70
800
H a : P 0. 7
0.01
480
Pest 0.6
800
Pruebas de hipótesis para medias
Prueba de hipótesis para medias de una normal
H 0 : 0 H 0 : 0 H 0 : 0
H a : 0 H a : 0 H a : 0
n -1 = grados de libertad
k-1= grados de libertad
William Gosset
William Gosset was the eldest son of Agnes Sealy Vidal and Colonel Frederic Gosset who came from
Watlington in Oxfordshire. William was educated at Winchester, where his favourite hobby was shooting,
then entered New College Oxford where he studied chemistry and mathematics. While there he studied
under Airy. He obtained a First Class degree in both subjects, being awarded his mathematics degree in
1897 and his chemistry degree two years later.
Gosset obtained a post as a chemist with Arthur Guinness Son and Company in 1899. Working in the
Guinness brewery in Dublin he did important work on statistics. In 1905 he contacted Karl Pearson and
arranged to go to London to study at Pearson's laboratory, the Galton Eugenics Laboratory, at University
College in session 1906-07. At this time he worked on the Poisson limit to the binomial and the sampling
distribution of the mean, standard deviation, and correlation coefficient. He later published three important
papers on the work he had undertaken during this year working in Pearson's laboratory.
Many people are familiar with the name "Student" but not with the name Gosset. In fact Gosset wrote
under the name "Student" which explains why his name may be less well known than his important results
in statistics. He invented the t-test to handle small samples for quality control in brewing. Gosset
discovered the form of the t distribution by a combination of mathematical and empirical work with
random numbers, an early application of the Monte-Carlo method.
Writing in [8], McMullen says:-
To many in the statistical world "Student" was regarded as a statistical advisor to Guinness's brewery, to
others he appeared to be a brewer devoting his spare time to statistics. ... though there is some truth in both
these ideas they miss the central point, which was the intimate connection between his statistical research
and the practical problems on which he was engaged. ... "Student" did a very large quantity of ordinary
routine as well as his statistical work in the brewery, and all that in addition to consultative statistical work
and to preparing his various published papers.
From 1922 he acquired a statistical assistant at the brewery, and he slowly built up a small statistics
department which he ran until 1934.
Gosset certainly did not work in isolation. He corresponded with a large number of statisticians
and he often visited his father in Watlington in England and on these occasions he would visit
University College, London, and the Rothamsted Agricultural Experiment Station. He would
discuss statistical problems with Fisher, Neyman and Pearson.
In 1934 Gosset had a motor accident, described in [8]:-
...he ran into a lamp-post on a straight road, through looking down to adjust some stuff he was
carrying...
In fact when confined to bed for three months after the accident he was able to concentrate on
statistics. It was a year before he was recovered but he retained a limp for the remaining few
years of his life.
At the end of 1935 Gosset left Ireland to take charge of the new Guinness brewery in London.
Despite the hard work involved in this venture he continued to publish statistics papers.
McMullen, who was a personal friend, describes Gosset in [8] as follows:-
... he was very kindly and tolerant and absolutely devoid of malice. He rarely spoke about
personal matters but when he did his opinion was well worth listening to and not in the least
superficial.
He is described in [2] as follows:-
He was much beloved by all those with whom he worked and by a select circle of professional
and personal friends, who revered him as one of the most modest, gentle, and brave of men,
unconventional, yet abundantly tolerant in all his thoughts and ways. Also he loved sailing and
fishing, and invented the angler's self-controlled craft described in the 'Field' of March 28,
1936.
n-1=31-1=30 grados de libertad
t-Student
t=2.43
Normal (0,1)
Z=2.421
0.978706
0.984522
0.978706
0.00058
0.984522
n-1=7-1=6 grados de libertad
t-Student
t=2.43
0.948838
t06.051162 2.43
t06.051162 2.43
Prueba de hipótesis para medias de una normal
H 0 : 0 H 0 : 0 H 0 : 0
H a : 0 H a : 0 H a : 0
Obtener de la tablas
de la t-Student
tn 1
/2 tn 1
x 0
t0
Estadística de s2
prueba
n
Reglas de decisión
H 0 : 0 Rechazar H 0 si t 0 tn / 12
H a : 0
Rechazar H 0 si t 0 tn / 12
H 0 : 0
Rechazar H 0 si t 0 tn 1
H a : 0
H 0 : 0
Rechazar H 0 si t 0 tn 1
H a : 0
Ejemplo 21
Prueba de una cola
H 0 : 850
H a : 850
Se elige un 0.05
Prueba de normalidad
Vit D
836
849
872
861
839
826
856
862
859
862
848
839
846
870
861
Ejemplo 21
Estadísticas Descriptivas
Variable T P
Vit D 0.70 0.248
Variable T P
Vit D 0.70 0.248
p-Value
0.248
t0 0.70
Puntos Clave
H 0 : 850 0.05
H a : 850
s 14
x 845
n 15
Población, Muestra, Error de
Estimación y Tamaño de Muestra
Ejemplo 22
Población y Muestra
2, 7
2, 5 Media=4.5 2, 11
Media=3.5 Media=6.5
11, 3 2, 3
Media=7.0 Media=2.5
2, 5, 7, 11, 3
Media = 5.6
7, 3 5, 7
Media=5.0 Media=6.0
7, 11 5, 11
Media=9.0 5, 3 Media=8.0
Media=4.0
2, 7
2, 5 2, 11
Media=4.5 2, 3
Media=3.5 Media=6.5
Media=2.5
11, 3 2, 3
Media=7.0 Media=2.5
Error de Estimación 2.5 5.6 3.1
2, 5, 7, 11, 3
7, 3 Media=5.6 5, 7
Media=5.0 Media=6.0
7, 11 5, 11 5, 7
Media=9.0 5, 3 Media=8.0 Media=6.0
Media=4.0
2, 7
2, 5 Media=4.5 2, 11
Media=3.5 Media=6.5
11, 3 2, 3
Media=7.0 Media=2.5
7, 3
2, 5, 7, 11, 3
Mean=5.6
Tamaño de Muestra= n = 2
5, 7
Media=5.0 Media=6.0
7, 11
Media=9.0 5, 3
Media=4.0
5, 11
Media=8.0 Media población
5.6
Sample Mean Error Estimation ABS(Error de Est)
2 5 3.5 -2.1 2.1
2 7 4.5 -1.1 1.1
2 11 6.5 0.9 0.9
2 3 2.5 -3.1 3.1
5 7 6 0.4 0.4
5 11 8 2.4 2.4
5 3 4 -1.6 1.6
7 11 9 3.4 3.4
7 3 5 -0.6 0.6
11 3 7 1.4 1.4
Ejemplo 23
Tamaño de Muestra= n = 3
Mean population
5.6
Sample Mean population Error Estimation ABS(Error de Est)
2 5 7 4.7 -0.9 0.9
2 5 11 6.0 0.4 0.4
2 5 3 3.3 -2.3 2.3
2 7 11 6.7 1.1 1.1
2 7 3 4.0 -1.6 1.6
2 11 3 5.3 -0.3 0.3
5 7 11 7.7 2.1 2.1
5 7 3 5.0 -0.6 0.6
5 11 3 6.3 0.7 0.7
7 11 3 7.0 1.4 1.4
El error de Estimación y el tamaño de la muestra
Media Poblacional
5.6
Muestra Media Error Estimación ABS(Error de Est)
2 5 7 4.7 -0.9 0.9
2 5 11 6.0 0.4 0.4
2 5 3 3.3 -2.3 2.3
2 7 11 6.7 1.1 1.1
2
2
7
11
3
3
4.0
5.3
-1.6
-0.3
1.6
0.3
7
5 7 11 7.7 2.1 2.1
5 7 3 5.0 -0.6 0.6
5 11 3 6.3 0.7 0.7
7 11 3 7.0 1.4 1.4
Confiabilidad 70%
Intervalo de Confianza
x c
x c x c
Ejemplo 23 Estimador Insesgado
Media Poblacional
5.6
Muestra Media Error Estimación ABS(Error de Est)
2 5 7 4.7 -0.9 0.9
2 5 11 6.0 0.4 0.4
2 5 3 3.3 -2.3 2.3
2 7 11 6.7 1.1 1.1
2 7 3 4.0 -1.6 1.6
2 11 3 5.3 -0.3 0.3
5 7 11 7.7 2.1 2.1
5 7 3 5.0 -0.6 0.6
5 11 3 6.3 0.7 0.7
7 11 3 7.0 1.4 1.4
Medias
4.7
6.0
3.3
6.7
4.0
5.3
7.7
5.0
6.3
7.0 Se dice que la media es un
media
de las
Estimador Insesgado de la
medias 5.6 media poblacional
Ejercicio
Para n=4
2, 5, 7, 11, 3
Media=5.6
Error de Estimación, Confiabilidad y Tamaño de Muestra
Tamaño de la Población
Confiabilidad
Ejemplo 24 Calculando el tamaño de muestra para proporciones
PARAMETROS
PARAMETROS
PARAMETROS
P-B 0.425
P+B 0.575 Error tipo I 0.050
Z 2.287
Tamaño de la muestra 171
Pruebas
Dos colas Valor-p 0.0222
Proporciones p c P p
c
Ejemplo:
Penetración
Interpretacion:
La penetración se encuentra dentro de los límites
(4%,6%) con una confiabilidad del 95%
(*, *)
(*, *)
(*, *)
Que
significa? (*, *)
(*, *)
(*, *)
(*, *)
(*, *)
Ejemplo: 90% (*, *)
confianza (*, *)
(*, *)
(*, *)
(*, *)
(*, *)
Parámetro
IC para proporciones
pˆ (1 pˆ )
pˆ z
2 n
Ejemplo 26
pˆ (1 pˆ )
pˆ z
IC para proporciones 2 n
pˆ 0.60
0.05
1 0.95
Ejemplo 26
pˆ (1 pˆ )
IC para proporciones pˆ z
2 n
pˆ 0.60
0.05
1 0.95
1
0.95
2 2
0.025 0.025
Ejemplo 26
pˆ (1 pˆ )
IC para proporciones pˆ z n
2
n 30
alpha 0.05
pˆ 0.60 alpha/2 0.025
0.05 1-aplha/2
Z
0.975
1.960
1 0.95
Con una confiabilidad del 95% concluimos que el valor del parámetro se
encuentra entre los valores (0.42, 0.78)
Ejemplo 27
n Anchura del
Tamaño de la Muestra Intervalo Intervalo
Medias x c x c
n 1 s n 1 s
x t x t
2 n 2 n
Ejemplo 28 IC para Medias
n 30
n-1 29
Alpha 0.05
Alpha/2 0.025 2
t= 2.045 0.975 0.025
t 0( 29
.05
)
2.045
2
Media 18.00
Desviación Estandar 0.07
IC para Medias
Prueba de Normalidad
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
60 70 80
DENSIDAD
Average: 70.3298 Anderson-Darling Normality Test
StDev: 4.33499 A-Squared: 0.535
N: 47 P-Value: 0.162
Cheetos.mpj
Ejemplo 29
IC para Medias
One-Sample T: DENSIDAD
Test of mu = 75 vs mu not = 75
Variable 95.0% CI T P
DENSIDAD ( 69.057, 71.603) -7.39 0.000
Cheetos.mpj
• Población, Muestra, Muestra Aleatoria
• Escalas de Medición
• Parámetros y Estadísticas
• Inferencia Estadística
• Diferencias Significativas
Tarea
X
pˆ proporción de personas que les gusta Doritos X en
n una muestra de tamaño n
Numéricamente si
Límite
Límite Inferior 0.60 Inferior 0.63
Límite
Límite Superior 0.74 Superior 0.77
Anchura 0.14 Anchura 0.14
0.6 0.7
This definition can be generalized to the case where np only converges to a positive limit λ as n grows without limit.
The Poisson distribution is defined over the set of integers (including 0), and depends only on the single
positive parameter λ (whereas the binomial distribution depended on the two parameters n and p). So all binomial
distributions with a given value λ of the product np can be approximated by the same Poisson(λ) distribution for large
values of n, the approximation being all the better that n is larger (and therefore p smaller).