Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
Hace ms de 100 aos H. G. Wells, escritor e historiador ingls, dijo que el conocimiento
estadstico ser algn da tan necesario para ser un buen y eficiente ciudadano,
como la aptitud de poder leer y escribir.
HISTORIA DE LA ESTADSTICA
El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia
descriptiva de los Estados, se identific cada vez ms, en el siglo XIX, con las cifras
cuantitativas. Hacia 1830, en Francia e Inglaterra, el trmino ya fue usado de forma general
como sinnimo de la ciencia numrica de la sociedad. Este cambio de significado se debi
a que, desde 1800, los gobiernos de Europa Occidental y de Estados Unidos comenzaron
a recopilar y publicar sistemticamente una gran cantidad de registros de censos y de otros
tipos de tablas.
Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por
matemticos tales como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su
aplicacin al estudio de hechos estadsticos fue casi inexistente, ya que la mayor parte de
los estadsticos sociales de la poca se contentaban con dejar que los datos hablaran por
s mismos. En particular, en esa poca los estadsticos no estaban interesados en sacar
inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener
censos de la poblacin al completo. Como resultado, la inferencia probabilstica sobre la
poblacin a partir de muestras era prcticamente desconocida en las estadsticas sociales
del siglo XIX
1
Apuntes de clase Estadstica General
No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por
inferir conclusiones a partir de los datos numricos. El movimiento comenz con los
trabajos de Francis Galton sobre el anlisis de la influencia de la herencia a travs de la
utilizacin de tcnicas que actualmente se conocen como anlisis de regresin y
correlacin, que alcanzaron su mayor auge con los trabajos de Karl Pearson. ste, que
desarroll los contrastes de bondad de ajuste, fue el primer director del laboratorio Galton,
fundado por Galton en 1904. All, Pearson lider un programa de investigacin con el
objetivo de desarrollar nuevos mtodos en los que la Estadstica se utiliza con fines
inferenciales. Su laboratorio potenci que investigadores provenientes de distintas reas
de la ciencia y la industria aprendieran los mtodos estadsticos que podan tener
aplicacin en sus campos. Uno de los primeros estudiantes que acudi a su laboratorio fue
W. S. Gosset qumico de formacin, que demostr su devocin por Pearson y public sus
propios trabajos bajo el seudnimo de Student. Existe una famosa leyenda que mantiene
que Gosset tema publicar sus trabajos, bajo su propio nombre por miedo a que, en la
fbrica de cerveza Guinnes, donde laboraba, sus jefes descubrieran que uno de sus
qumicos realizaba investigaciones estadsticas. Gosset es famoso por el desarrollo de los
contrastes de t.
2
Apuntes de clase Estadstica General
La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el
estudio de las variaciones y (iii) como el estudio de los mtodos de reduccin de datos
(Fisher, 1925).
Nos topamos con ella en el lenguaje cotidiano. En realidad posee dos significados: En su
acepcin ms comn, la estadstica se refiere a informacin numrica. Algunos ejemplos
son: el sueldo inicial de los graduados de Universidad, el nmero de muertos provocados
por el alcoholismo el ao pasado, el nmero de goles en un partido de futbol etc. En estos
ejemplos las estadsticas se refieren a un valor o porcentaje.
ESTADISTICA.-
3
Apuntes de clase Estadstica General
DIVISION DE LA ESTADISTICA
ESTADSTICA DESCRIPTIVA
Por ejemplo, cuando se hace una encuesta para estudiar la opinin del pblico sobre la
calidad y el precio posible de un nuevo producto, con la aplicacin de la estadstica
descriptiva sera posible, entre otras cosas, clasificar las respuestas de modo tal que sea
posible tener una idea general de la opinin del pblico; con las respuestas sobre el precio
evaluar su promedio y la variabilidad de las respuestas; construir cuadros, tablas y grficos
que permitan evaluar visualmente el comportamiento de la informacin..
IDENTIFICAR, CONOCER
DESCUBRIR,RESUMIR
Datos recopilados
Proporcionando
ESTADISTICA INFERENCIAL
INFERIR
ANALIZAR
POBLACION MUESTRA
DATOS
4
Apuntes de clase Estadstica General
La estadstica como ciencia tiene como objetivo desarrollar procedimientos que permitan
obtener conclusiones acerca de los parmetros de una poblacin a partir de los datos
mustrales captados.
a.- Definicin del problema.- En esta etapa se determina con claridad el estudio por
realizar los objetivos de la investigacin. Adems, se debe establecer cul es la
poblacin en estudio, se debe identificar las variables de inters, se deben formular
hiptesis y se debe establecer el plan de tabulacin de datos. Esto ltimo constituye un
conjunto de modelos de cuadros que se pretenden formar con la informacin captada.
c.- Recopilacin de datos.- En esta etapa se recogen los datos de acuerdo con los planes
establecidos en la etapa anterior, teniendo cuidado en controlar la calidad de la
informacin que se recopila. El xito de una investigacin de pende de gran parte de la
calidad de los datos captados.
CONCEPTOS BASICOS
POBLACION
5
Apuntes de clase Estadstica General
tenencia de agua y desage, etc. Es decir se tiene una realidad que es desconocida y
sobre la cual se desea conocer cmo se comportan los elementos que la conforman
Segn sea el nmero de elementos, la poblacin puede considerarse como finita o infinita.
Es una poblacin finita cuando el nmero de elementos que la compone es limitado; es
infinita cuando consta de ilimitado nmero de elementos
Por ejemplo
MUESTRA
Ejemplo
CLASES DE MUESTRAS
Dependiendo de la forma como se eligen las unidades, las muestras pueden ser aleatorias
o no aleatorias
MUESTRAS ALEATORIAS
Son aquellas cuyos elementos son elegidos usando algn criterio probabilstico. En este
caso, todos los elementos tienen alguna posibilidad de salir elegidos. En algunos casos,
todos los elementos tienen la misma posibilidad de ser elegidos en otros casos no.
MUESTRAS NO ALEATORIAS
Son aquellas cuyos elementos son elegidos mediante criterios no probabilsticos. En este
caso, existen elementos de la poblacin que no tienen posibilidad alguna de ser elegidos.
Por otro lado, para que un anlisis estadstico basado en muestras sea objetivo y eficiente,
es necesario que la muestra sea representativa de la poblacin de donde se eligieron sus
elementos; es decir, es necesario que todas las caractersticas importantes existente en la
6
Apuntes de clase Estadstica General
poblacin se vean reflejadas de alguna manera en la muestra que ser utilizada para
realizar el anlisis
UNIDAD ELEMENTAL
Es todo elemento que est asociado a una caracterstica o factor que se desea estudiar en
la poblacin o muestra. Por ejemplo:
VARIABLE
TIPOS DE VARIABLE
Nivel de instruccin, nivel de pobreza, calidad de los artculos producidos por una
empresa
VARIABLE CUANTITATIVA
Es cuando la variable que se estudia aparece en forma numrica. Puede ser discreta y
contina.
- Variable cuantitativa discreta, es aquella que adopta solo ciertos valores y existe
vaco entre ellos, ejemplo:
7
Apuntes de clase Estadstica General
Son aquellas que se explican por otra variable, son los efectos o resultados respecto a los
cuales hay que buscar un motivo, causa o razn de ser. Es la variable que traduce la
consecuencia del efecto de una o varias razones o causas, de otras variables
Ejemplo:
OBSERVACION
8
Apuntes de clase Estadstica General
Tipos de variables
Cualitativas Cuantitativas
Discreta Continua
-Marca de PC
- Estado civil
-Color del cabello -Hijos por familia - Peso de un alumno
- Alumnos por - Estatura de un
aula alumno
Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los
clculos que se llevan a cabo con el fin de resumir y presentar los datos. Tambin
determina las pruebas estadsticas que se deben realizar.
Por ejemplo, si se compra una caja de lentejas de dulce, encontramos que hay seis
colores. Suponga que se le asigna 1 al caf, 2 al amarillo, 3 al azul, 4 al naranja, 5 al verde
y 6 al rojo. Sume la cantidad de lentejas que hay en la caja, la divide entre el nmero de
lenteja e informa que el color promedio es 3.56. Significa que el color promedio es azul o
anaranjado? Desde luego que no.
Otro ejemplo, en la pista atltica hay ocho competidores para una carrera de 400 metros.
Para indicar el orden en que llegan a la meta se dice que la media es de 4.5 Qu revela
este promedio? Nada. En ambos casos, no se emple adecuadamente en nivel de
medicin.
En el caso del nivel nominal de medicin, las observaciones acerca de una variable
cualitativa solo se clasifican y se cuentan. No existe una forma particular para ordenar las
etiquetas (categoras). La clasificacin de las de lentejas de dulce, simplemente se
clasifican por color. No existe un orden natural. Es decir, no se presentan primero las
lunetas color caf, las anaranjadas o las de cualquier color. El gnero representa otro
ejemplo del nivel de medicin nominal. Si contamos en una aula de clase, cuantos hombre
y cuantas mujeres hay. Podramos presentar primero a los hombres o a las mujeres. Para
el nivel nominal, la medicin consiste en contar.
9
Apuntes de clase Estadstica General
1.- Las calificaciones de los datos se encuentran representadas por conjuntos de etiquetas
o nombres (alto, medio, bajo), las cuales tienen valores relativos.
2.- En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
1.- Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la
caracterstica en cuestin
2.- Diferencias iguales en la caracterstica representan diferencias iguales en las
mediciones.
Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. El nivel
de razn es el ms alto. Posee todas las caractersticas del nivel de intervalo, aunque,
adems el punto 0 tiene sentido y la razn entre dos nmeros es significativa
10
Apuntes de clase Estadstica General
Razn 0 absoluto
Intervalo Distancia. Cero convencional
Ordinal Relacin de orden, igualdad y no igualdad
Nominal Relacin de identidad
11
Apuntes de clase Estadstica General
Niveles de Medicin
PARAMETRO:
ESTADISTICO O ESTIMADOR
Los valores que se obtienen al aplicar los estimadores o estadsticos a una muestra
particular son llamados estimados de los parmetros. Es decir, si para una muestra se
obtiene:
Estos valores son los estimados, de los parmetros definidos como media poblacional (),
variancia poblacional ( 2 ), y moda poblacional (Mo) respectivamente.
12
Apuntes de clase Estadstica General
DESCRIPCIN DE DATOS
Las partes de un cuadro estadstico son: 1 Nmero del cuadro; 2 Ttulo; 3 Cuadro
propiamente dicho; 4 Las notas explicativas o calce; 5 Fuente
1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se
escribe a continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto
cuadro del captulo dos.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin
y consta de un conjunto de casillas o celdas, dispuestas en columnas y filas. Sus
elementos esenciales son: encabezamiento de las columnas, columna principal o
matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y
el objeto de cada una de las columnas, es decir indica la naturaleza de los datos
inscritos en cada una de las celdas que se hallan debajo. Deben ser breves y
explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las
diferentes clases de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y
columnas, donde estn anotados los datos numricos.
13
Apuntes de clase Estadstica General
5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadro
TABLA DE FRECUENCIAS
Frecuencia
Frecuencia Frecuencia
relativa
Absoluta Relativa
Variable porcentual
%
Caracterstica A 100 %
Caracterstica B 100 %
Caracterstica Z 100 %
Totales N 1 100%
Tabla de frecuencia de los vehculos vendidos por VEHICULOS SAC, el mes pasado.
Tipo de Nmero de
automvil automviles
Domstico 50
De importacin 30
14
Apuntes de clase Estadstica General
Tabla de frecuencia relativa de vehculos vendidos por VEHICULOS SAC el mes pasado
Una caracterstica distintiva de la grfica de barras es que existe una distancia o espacio
entre las barras. Es decir que, como la variable de inters es de naturaleza cualitativa, las
barras no son adyacentes. Por consiguiente, una grfica de barras es una representacin
grfica de una tabla de frecuencias mediante una serie de rectngulos de anchura
uniforme, cuya altura corresponde a la frecuencia de clase
Grfica No 1 Vehculos vendidos por tipo el mes pasado por VEHICULO SAC.
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
Domstico De importacin
GRAFICA DE PASTEL
Grfica que muestra la parte o porcentaje que representa cada clase del total de
nmeros de frecuencia
15
Apuntes de clase Estadstica General
37.50% Domstico
62.50%
De importacin
Grafico Caracterstica
. Los datos de cada categora se representan por una barra rectangular
(vertical u horizontal)
Barras . La altura del rectngulo es proporcional a la frecuencia de la categora
. Si la escala es ordinal deben aparecer en su orden natural
. Las barras aparecen separadas
. Son apropiadas para variables cualitativas que no tengan muchas
categoras
Circular . Los datos de cada categora se representan por un sector circular
. El ngulo central de cada sector es proporcional a la frecuencia relativa
expresada porcentualmente
. Si el grfico toma forma tridimensional se denomina de pastel o torta
Ejemplo:
La empresa STAT.S.A llev a cabo un estudio sobre el empleo de los habitantes de una
regin. Entre las inquietudes que motivaron el estudio se tena inters por conocer los
sectores que generan mayor empleo. Para realizar el estudio se eligieron al azar 200
personas a las cuales se les pregunt, entre otras cosas, sobre el sector econmico en el
cual se desenvuelve la institucin por la cual trabajan. Luego de clasificar las respuestas
observadas, se ha obtenido por un proceso de conteo los siguientes resultados.
16
Apuntes de clase Estadstica General
DIAGRAMA DE BARRAS
17
Apuntes de clase Estadstica General
Ejemplo:
Frecuencia Frecuencia
Porcentaje
Sectores Sexo Absoluta relativa
%
Agricultura Femenino 36 0,35294 35,294
Masculino 37 0,37755 37,755
Comercio Femenino 15 0,14706 14,706
Masculino 20 0,20408 20,408
Educacin Femenino 35 0,34314 34,314
Masculino 19 0,19388 19,388
Industria Femenino 6 0,05882 5,882
Masculino 20 0,20408 20,408
Turismo Femenino 10 0,09804 9,804
Masculino 2 0,02041 2,041
Total Femenino 102 1,00000 100,00
Masculino 98 1,00000 100,00
18
Apuntes de clase Estadstica General
En este caso, como puede apreciarse, es conveniente adicionar una leyenda para indicar
el color que representa a cierta informacin. Por otro lado, tambin puede observarse que
existe una separacin entre cada grupo de barras verticales equivalente a la mitad del
ancho de cada grupo. Se debe tener en cuenta que si los nombres o etiquetas de las
categoras son grandes, es preferible utilizar el grafico de barras horizontales, cuya
construccin es similar a lo indicado anteriormente.
Del mismo modo, para mejorar la presentacin, se suele utilizar grficos en tres
dimensiones. Los grficos anteriores pueden ser presentados de la siguiente manera.
19
Apuntes de clase Estadstica General
Ante todo es conveniente familiarizarnos con ciertos smbolos que se usan tanto en la
variable discreta como en la variable continua.
N n Tamao de la muestra
N N Tamao de la poblacin o universo
Identificacin para cada valor observado (minscula en
la muestra)
Frecuencias absolutas
Frecuencias relativas
Frecuencias absolutas acumulativas
Frecuencias relativas acumulativas
Identifica la variable discreta o las marca de clase en
la continua
Identifica a ala variable continua con sus intervalos
I C Amplitud del intervalo
M M Numero de valores de la variable o de intervalo
1 10 2 8 3 4 4 6 5 5 6 8 7 10 8 3
9 7 10 3 11 6 12 7 13 2 14 8 15 2 16 3
17 9 18 7 19 8 20 1 21 9 22 = 10 23 5 24 6
25 4 26 6 27 7 28 5 29 7 30 3 31 5 32 8
Clasificacin.- En este caso se identifican los distintos valores que tiene y ubicamos el
mayor y menor valor: = 1 = 10
20
Apuntes de clase Estadstica General
Los diferentes valores que toma la variable los vamos a denotar por
1 = 1 2 = 2 3 = 4 4 = 2 5 = 4 6 = 4 7 = 5 8 = 5 9 = 2 10 = 3
Tabla No 4. Distribucin del nmero de flores por planta. Marzo 2016.
No de Tarjas Frecuencia
Flores
1 / 1
2 // 2
3 //// 4
4 // 2
5 //// 4
6 //// 4
7 ///// 5
8 ///// 5
8 // 2
10 /// 3
Total 32
CLASES.- (m, K)
Se llaman clases a cada uno de los grupos en los que se divide el conjunto de datos. No
hay una regla fija para determinar el nmero de clases.
4
K= 2, 5
K = 1 + 3, 3 log n
5 20
RANGO. - (R)
Diferencia entre la observacin que tiene el valor mximo y la observacin que tiene el
valor minino, tambin se conoce como recorrido amplitud total.
R=
21
Apuntes de clase Estadstica General
FRECUENCIA ABSOLUTA ( )
Llamada tambin frecuencia absoluta simple, es el nmero de veces que se repite los
valores dentro de las diferentes clases (intervalo) en la que est dividida la informacin.
= =
FRECUENCIA ABSOLUTA ACUMULADA ( ).-
= 1 + 2 + 3 + +
Entonces tenemos
1
1 = = 1
=1
2
2 = = 1 + 2
=1
3
3 = = 1 + 2 + 3
=1
4
4 = = 1 + 2 + 3 + 4
=1
5
5 = = 1 + 2 + 3 + 4 + 5
=1
Y as sucesivamente
se llama frecuencia relativa acumulada del valor a la frecuencia relativa total de las
observaciones menores o iguales a . Se denota como
=
=1
Entonces tenemos:
22
Apuntes de clase Estadstica General
1 = = 1
=1
2
2 = = 1 + 2
=1
3
3 = = 1 + 2 + 3
=1
4
4 = = 1 + 2 + 3 + 4
=1
5
5 = = 1 + 2 + 3 + 4 + 5
=1
As sucesivamente
0 1 1 1 1 1
1 2 2 2 2 2
2 3 3 3 3 3
0 y 0 para i = 1, 2, 3,., m
2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de
observaciones.
= 1 + 2 + =
=1
3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero
fraccionados no negativos, no mayores de uno.
0 1 0 para i= 1, 2,., m
= =
=1
23
Apuntes de clase Estadstica General
= = 1
=1
1 = 1 2 . Para i = 1, 2,, m
1 = 1 2 . Para i = 1, 2,, m
3,3 3,3 3,7 3,9 3,9 3,9 4,0 4,1 4,1 4,2
4,2 4,2 4,3 4,3 4,3 4,3 4,4 4,4 4,5 4,5
4,5 4,5 4,5 4,7 4,7 4,7 4,7 4,7 4,7 4,8
4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1 5,3 5,3
5,3 5,3 5,4 5,6 5,6 5,8 5,8 6,0 6,1 6,1
El rango ser:
R = 6,1 3,3= 2,8
El nmero de clases o intervalos ser:
4
K = m = 2,550 = 6,64 7
La amplitud del intervalo ser:
2,8
C= = 0,42 = 0,4
6,64
A continuacin calculamos:
24
Apuntes de clase Estadstica General
Lmites de clase:
El nmero menor se convierte en el lmite inferior de la primera clase. Se le suma el
intervalo de clase y se convierte en el lmite superior de la primera clase. As
sucesivamente
Marca de clase ( )
Es la semi suma de los lmites de clase. Es decir lmite inferior ms lmite superior entre
dos.
Frecuencia absoluta ( )
Frecuencia relativa ( )
= =
As sucesivamente
1 3 2 6
1 = = = 0,06 2 = = = 0,12 3 14 4 11
50 50 3 = = = 0,28 4 = = = 0,22
50 50
5 8 6 3 7 5
5 = = = 0,16 6 = = = 0,06 7 = = = 0,10
50 50 50
Interpretacin
= 1 + 2 + 3 + +
1 = 1=1 = 1 = 3
25
Apuntes de clase Estadstica General
2 = = 1 + 2 = 3 + 6 = 9
=1
3
3 = = 1 + 2 + 3 = 3 + 6 + 14 = 23
=1
4
4 = = 1 + 2 + 3 + 4 = 3 + 6 + 14 + 11 = 34
=1
5
5 = = 1 + 2 + 3 + 4 + 5 = 3 + 6 + 14 + 11 + 8 = 42
=1
Y as sucesivamente.
Interpretacin.-
2 = 9 Significa que hay 9 genotipos de papa cuyo rendimiento es mayor a 3,7 pero igual o
menor a 4,1 toneladas por hectrea.
Se llama frecuencia relativa acumulada del valor a la frecuencia relativa total de las
observaciones menores o iguales a . Se denota como
1 +2 +3 +.+
= 1 + 2 + . + =
=
=1
1 = = 1 = 0,06
=1
2
Interpretacin:
26
Apuntes de clase Estadstica General
As sucesivamente
3,3 3,7 3,5 3 0,06 3 0,06
3,7 4,1 3,9 6 0,12 9 0,18
4,1 4,5 4,3 14 0,28 23 0,46
4,5 4,9 4,7 11 0,22 34 0,68
4,9 5,3 5,1 8 0,16 42 0,84
5,3 5,7 5,5 3 0,06 45 0,90
5,7 6,1 5,9 5 0,10 50 1
HISTOGRAMA DE FRECUENCIA
Grafica en la que las clases se sealan en el eje horizontal y las frecuencias de clase en el
eje vertical. Las frecuencias de clase se representan por medio de las alturas de barras,
estas se dibujan de manera adyacente.
Un histograma que utiliza las frecuencias relativas de cada una de las clases, en lugar de
usar la frecuencia absoluta se conoce como histograma de frecuencias relativas. Este
histograma tiene la misma forma que un histograma de frecuencias absolutas construido a
partir del mismo conjunto de datos
27
Apuntes de clase Estadstica General
POLIGONO DE FRECUENCIAS
Tambin muestra la forma que tiene una distribucin y es similar a un histograma. Consiste
en segmentos de recta que conectan los puntos formados por las intersecciones de los
puntos medio de clase y las frecuencias de clase
16
14
12
10
8
6
4
2
0
5.6 7 8.4 9.8 11.2 12.6 14 15.1 16.5
El polgono tambin se puede construir con las frecuencias relativas, a esta figura se le
conoce como polgono de frecuencias relativas.
Grafica que resulta de la unin de las frecuencias acumulativas con las marcas de
clase. Nos permite ver cuntas observaciones estn por encima de ciertos valores
60
50
40
30
20
10
0
5.6 7 8.4 9.8 11.2 12.6 14 15.4
28
Apuntes de clase Estadstica General
Grfico Caracterstica
. Apropiadas para variable discretas
Barras
. Las barras aparecen separadas
. Son barras rectangulares contiguas
. Son apropiadas para variables cuantitativas continuas agrupadas en
intervalo
Histograma . La base de cada barra es proporcional a la amplitud del intervalo
. El punto medio de cada barra coincide con la marca de clase
. La altura de la barra es proporcional a su frecuencia
. Se obtiene uniendo con segmentos de recta los puntos medios de
Polgono de
las bases superiores de las barras de un histograma con su
frecuencias frecuencia.
Es otra tcnica para construir cuadros de frecuencias para datos continuos. Consiste en
realizar primero una ordenacin de datos. La ordenacin consiste en formar el llamado
tallo con los primeros dgitos significativo de los datos. Luego, las hojas se forman con
los otros dgitos. Despus, se puede hacer una representacin grfica preliminar en la que
se pueden observar ciertos detalles que pudieron estar o no previstos.
Ejemplo
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1 5,3 6,2
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3 9,1 8,6
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6 7,0 7,7
8,3 7,5 9,8 7,5
Para elaborar una representacin tallo hoja es recomendable, primero, ordenar los datos
en forma ascendente, con lo cual se obtiene lo siguiente:
5,2 5,3 5,4 5,7 6,2 6,4 6,5 6,6 6,6 6,8
7,0 7,0 7,1 7,1 7,2 7,3 7,5 7,5 7,7 7,8
7,8 7,8 8,1 8,2 8,2 8,3 8,3 8,4 8,5 8,6
8,7 9,0 9,1 9,2 9,4 9,6 9,8 10,1 10,2 10,2
El siguiente paso consiste en formar tallos. Teniendo en cuenta que los precios varan
entre 5,2 y 10,2, los tallos se pueden formar con los dgitos de las unidades. Es decir, se
tendr:
29
Apuntes de clase Estadstica General
Tallos
5.
6.
7.
8.
9
10.
A continuacin, se forman las hojas de cada tallo colocando a su lado derecho los dgitos
menos significativos que forman cada uno de los datos.
Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2
Tambin se puede agregar segmentos lineales partiendo de la ltima hoja de cada tallo
para obtener una aproximacin al polgono de frecuencias, obtenindose lo siguiente.
Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2
DIAGRAMA DE PARETO
En una representacin grfica que se utiliza usualmente para controles de calidad y que
permite tomar acciones correctivas necesarias.
Ejemplo
30
Apuntes de clase Estadstica General
No. De veces
Defecto Porcentaje
Que aparecen
Cabeza rota 22 26,2
Tamao inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Longitud imperfecta 12 14,3
Dureza fuera de la especificacin 29 34,5
Otros 4 4,8
Total 84 100,0
No. De veces
Defecto Porcentaje
Que aparecen
Dureza fuera de la especificacin 29 34,5
Cabeza rota 22 26,2
Longitud imperfecta 12 14,3
Tamao inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Otros 4 4,8
Total 84 100,0
Este grafico permite determinar el orden que se debe seguir para la correccin de los
defectos. As tenemos que el primer defecto que se debe corregir es la dureza fuera de las
especificaciones; luego, las cabezas rotas; en seguida, la longitud imperfecta; y as
sucesivamente
Cuando se recoge la informacin hay que distinguir datos para un corte transversal en el
tiempo y datos correspondientes a una serie del tiempo. El primero de ellos se refiere a
informacin coleccionada en un determinado momento; as por ejemplo se tiene la
31
Apuntes de clase Estadstica General
informacin recogida sobre las utilidades netas obtenidas en el ao 2000 por cincuenta
empresas. Los datos para serie del tiempo se refieren a informacin recogida para una o
ms variables a intervalos regulares de tiempo.
Estos intervalos regulares de tiempo pueden ser das, semanas, meses, bimestres,
semestres, ao, etc. As por ejemplo, se tiene la informacin sobre el producto nacional
bruto periodo 1991 2000.
Los datos en serie de tiempo para una variable determinada se pueden representar
grficamente en dos formas. La primera mediante barras, una barra para cada intervalo o
periodo de tiempo con una altura proporcional al valor que le corresponde a la variable de
inters. La segunda, mediante lneas que unen los puntos que tienen como componente el
periodo de tiempo y el valor de la variable
Ejemplo
Ao 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Volumen
12 15 19 25 26 28 30 28 24 22
De ventas
DESCRIPCCION DE DATOS
LA MEDIA ARITMTICA.-
32
Apuntes de clase Estadstica General
MEDIA POBLACIONAL:
=1
=
En la cual.
MEDIA MUESTRAL
=1
=
En la cual:
= Media muestral
n = es el nmero de valores de la muestra.
1.- Todo conjunto de datos de nivel de intervalo o de nivel de razn posee una media
2.- Todos los valores se encuentran incluidos en el clculo de la media
3.- La media es nica. Solo existe una media en un conjunto de datos.
4.- Si todos los valores observados X1, X2,. son iguales a b (donde b es una
constante) entonces la media de una constante es la misma constante
M(x) = M (b) = b
5.- Si a cada valor de las observaciones X1, X2,Xn se le suma (o se resta) una
constante, la media del nuevo conjunto transformado yi= xi b; es la media aritmtica
del conjunto original ms (o menos) la constante. Es decir
= M (Y)= ()
6.- Si cada valor de un conjunto X1, X2,.,Xn se multiplica por una constante
diferente de cero, la media aritmtica del conjunto transformado Yi = aXi, donde i= 1,
2,,n es la media aritmtica del conjunto original multiplicado por la constante. O sea:
= () = ()
7.- La suma algebraica de las desviaciones de cada valor observado X1, X2, X3,.Xn con
respecto a su media es cero. Esta propiedad significa que,
( ) = 0
Para datos agrupados esta propiedad se transforma en
33
Apuntes de clase Estadstica General
( ) = 0
=1
m = nmero de clases
= frecuencia absoluta de la clase i
Yi = punto medio del intervalo i (marca de clase)
Total = N X
MEDIA PONDERADA
( )
=
Ejemplo.- Un establecimiento vende gaseosas de tres tamaos: pequeo, mediano y
grande. El pequeo cuesta $0,50 (soles): el mediano $ 0,75; y el grande $ 1,00.
Ayer se vendieron 20 gaseosas pequeas, 50 gaseosas medianas y 30
gaseosas grandes. Cul es el precio medio ponderado por gaseosa?
MEDIANA
+1
Ubicacin de la mediana
2
Si hay cinco datos, entonces la ubicacin de la mediana (n+1)/2 ser igual a (5+1)/2 igual
a 3. Al ordenar los datos de menor a mayor, se obtiene el valor del tercer elemento, que es
7, la mediana
Nmero de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15
Mediana
34
Apuntes de clase Estadstica General
En el siguiente ejemplo hay seis elementos de manera que (n+1)/2 ser igual a (6+1)/2
igual a 3,5 Despus de ordenar los datos de menor a mayor se encuentra la semi suma de
los valores 3 y 4. Luego la mediana ser 31
Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35
31
Mediana
VENTAJAS Y DESVENTAJAS DE LA MEDIANA
1.- La mediana es nica; esto es, a semejanza de la media solo existe una mediana para
un conjunto de datos.
2.- No es difcil determinar la mediana para datos no agrupados. Tan solo se necesita
ordenarlos de menor a mayor o viceversa, y encontrar el valor del elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeos y por tanto, es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
4.- Puede calcularse para datos de nivel de razn, de intervalo y ordinal
MODA
Valor de la observacin que aparece con mayor frecuencia
La moda puede determinarse para todos los niveles de datos: nominales, ordinales, de
intervalo y de razn. La moda tambin tiene la ventaja de no verse afectada por valores
muy altos o muy bajos
Hay muchos conjuntos de datos que no tienen moda, porque ningn valor figura ms de
una vez. Pero tambin existen conjunto de datos que tiene ms de una moda.
Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6% respectivamente Cul es la media geomtrica de las
ganancias?
M.G. (1 )(2 )(3 ) . . ( )
4
M.G. (3)(2)(4)(6) 3,46%
35
Apuntes de clase Estadstica General
Ejemplo
Supongamos que un capital de 50 000 sea colocado a una tasa anual del 24% el primero
de Enero del 2012. Si se capitaliza los das primero de Enero de cada ao, calcule el
promedio del dinero invertido entre el 31 de Diciembre del 2012 y 31 de Diciembre del
2015
AOS log
2012 50 000 4,698970
2013 62 000 4,792392
2014 76 880 4,885813
2015 93 331,2 4,979235
19,356410
M.G. (1 )(2 )(3 ) . . ( )
log M.G. =
19,356410
log M.G. = = 4,8391025
4
M.G. = antilog 4,8391025
M.G. = 69,040.27 (Promedio invertido durante el perodo)
La media geomtrica para datos agrupados en clases, es la raz n-sima del producto
de las marcas de clase elevadas a sus respectivas frecuencias
. . = g = 1 1 2 2 .
MEDIA ARMONICA (h )
Es decir
36
Apuntes de clase Estadstica General
= =
= /
=
Ejemplo
4
= = 1 1 1 1 = 4,57143
+ + +
3 4 6 8
= =
=1
VENTAJAS Y DESVENTAJAS
1.- La media armnica se basa en todas las observaciones por lo que est afectado por los
valores extremos. Pero da a los valores grandes un peso menor que el que da la media
geomtrica; mientras que a los valores pequeos, le da un peso mayor que el que da la
media aritmtica y la media geomtrica.
2.- La media armnica no est defina, si alguno de los valores es cero
.
Aplicaciones de la media armnica
1.- Cuando se tiene trminos para cuyos recprocos se quiere calcular su media.
2.- Cuando se presenta una relacin inversa entre las variables implcitas, como por
ejemplo:
e=p x t
Donde: e = espacio p = productividad t = tiempo
- La velocidad y el tiempo
e=v x t
Donde: e= espacio v = velocidad t= tiempo
Ejemplos
1.- Suponga que ha gastado usted, un sol por 3 docenas de naranjas en una tienda, otro
sol por 4 docenas de naranjas en una segunda tienda y otro sol ms por 5 docenas en
una tercera tienda. Determinar el precio promedio por una docena de naranjas.
Solucin:
37
Apuntes de clase Estadstica General
= = 1
=1
3
= = 1 1 1 = 0,25
+ +
1/3 1/4 1/5
2.- Cinco secretarias tienen las siguientes velocidades 40, 36, 28, 40, y 35 palabras por
minuto. Si cada una de ellas escribe un mismo texto, calcule la velocidad media
5
= = 1 = 1 1 1 1 1 = 35,196 palabras/minuto
=1 + + + +
40 36 28 40 35
38
Apuntes de clase Estadstica General
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
Donde:
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
Me = + [ ]
100
2
45
= 9,9 +1,29[ ] = 10,158
70 45
MODA PARA DATOS AGRUPADOS
Mo= + [( ]
)+ ( +)
Donde:
39
Apuntes de clase Estadstica General
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
1
Mo = 1 + [( ]
1 )+ ( +1)
2513
Mo = 9,9 + 1,2 [ ] 10,5
(2513)+ (25 13)
= =
2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las
tres medidas toman valores diferentes, y la mediana queda comprendida generalmente
entre la moda y la media aritmtica.
40
Apuntes de clase Estadstica General
3 ()
Media =
2
2 ()+
Mediana =
3
Toma Es
Qu tan en afectada
Medida comn Existencia cuenta por los Ventajas/
es? cada valores Desventajas
Valor? extremos?
Promedio Siempre Es el de mayor uso,
Media ms existe Si Si sensible a los valores
conocido extremos
Mediana Valor en el Siempre No No Apropiada cuando
medio existe hay valores extremos
Valor ms Podra no Apropiada para
Moda frecuente existir No No variables en escala
nominal
41
Apuntes de clase Estadstica General
Los cuantiles ms usados son los cuartiles, , los deciles, Dj y los percentiles, .
PERCENTILES
El p simo percentil es un valor tal que, a lo sumo, p por ciento de las observaciones
son menores o iguales que este valor y, a lo sumo, (100 p) por ciento de las
observaciones son mayores o iguales que este valor.
3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la
posicin del i simo percentil.
Si k es entero, el i simo percentil es el promedio de los valores de los datos
ubicados en los lugares k y k + 1.
Ejemplo
53 55 70 58 64 57 72 53 69 57 68 53
Solucin
Para percentil 30
30
K= [ ]n = [ ] 12 = 3.6
100 100
42
Apuntes de clase Estadstica General
ocupa la posicin cuarta, o sea 55. Esto significa que el 30% de los datos es menor que
55 y el 70% mayor o igual a 55.
Para percentil 75
75
k= [ ]n = [100] 12 = 9
100
1.- Se calcula , donde i = 1, 2,3,..,99
100
Donde:
1 = Lmite inferior de la clase que contiene a
n = Tamao de la muestra o poblacin.
= Tamao del intervalo de clase
1 = Frecuencia acumulada de la clase anterior a la clase que contiene a
f = frecuencia simple de la clase que contiene a
Ejemplo
30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36
70 80 43 79
80 90 32 111
90 - 100 9 120
Solucin
43
Apuntes de clase Estadstica General
La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido
tenemos que encontrar las frecuencias acumuladas
75 120
1.- Se calcula = = 90
100 100
2.- La clase que contiene al 75 es 80 90
3.- Utilizando la frmula
1
100
= 1 + [ ]
9079
75 = 80 + 10 [ ] = 83.44
32
CUARTILES.-
Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, 1 deja el 25% de
los datos ordenados a su izquierda, y el otro 75% a su derecha. El segundo cuartil, 2 , deja
el 50% de los datos a su izquierda y el otro 50% a su derecha, este valor coincide con la
mediana, mientras que el tercer cuartil, 3 deja el 75% de los datos ordenados a su
izquierda y el otro 25% a su derecha.
Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12
Ingenieros Agrnomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880
Determine el 1 3
Solucin
Cuartil uno,
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
25
k= [ ]n = [ ] 12 = 3
100 100
44
Apuntes de clase Estadstica General
Cuartil tres, :
75
k= [ ]n = [ ] 12 = 9
100 100
1 2 3
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
= + [ ]
3
1
4
= + [ ]
Donde:
Ejemplo
Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la
aplicacin de un test que arroja los siguientes puntajes
45
Apuntes de clase Estadstica General
0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8
Determine:
1
= + [ 4 ]
Luego
500
El lugar del cuartil 1 es la posicin = = 125. Es decir, que el cuartil est ubicado
4 4
en la clase 20 40. Por lo tanto:
1
4
1 = 1
+ [ ]
1 = 20 + 20 [ ] = 24.43
Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43
b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores,
corresponde al valor del tercer cuartil.
3 3 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est
4 4
ubicado en la clase 40 - 60. Por lo tanto
46
Apuntes de clase Estadstica General
3
1
4
3 = 1
+ [ ]
375 234
3 = 40+ 20 [ ] = 57.625
160
Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625
Existen varias razones por la cual se debe estudiar la dispersin en un conjunto de datos
1.- Al aplicar una medida de dispersin es posible evaluar la confiabilidad del promedio que
se est utilizando. Una dispersin pequea indica que los datos se encuentran
acumulados cercanamente, por ejemplo, alrededor de la media aritmtica. Por tanto, la
media se considera bastante representativa de los datos. Esto es: la media es un
promedio confiable. Por el contrario, una dispersin grande indica que la media no es
muy confiable, es decir no es muy representativa de los datos.
2.- Una medida de dispersin permite apreciar cun dispersas estn dos o ms
distribuciones. Por ejemplo veamos la siguiente figura
A continuacin se muestran dos series de datos, ambos tienen la misma media aritmtica
pero se observa que tienen diferente dispersin alrededor de ella.
Se tiene dos series de datos:
a.- 48, 49, 49, 50, 50, 50, 51, 51,52
b.- 40, 47,47, 50, 50, 50, 53, 53,60
47
Apuntes de clase Estadstica General
En resumen podremos decir que en la serie B hay valores muy altos y muy bajos., mientras
que en la serie A los valores estn ms concentrados alrededor del promedio.
1.- Es fcil de calcular y sus unidades son las mismas que las de la variable
2.- No utiliza todas las observaciones (slo dos de ellas)
3.- Se puede ver muy afectada por alguna observacin extrema
4.- El rango aumenta con el nmero de observaciones o bien se queda igual. En cualquier
caso nunca disminuye.
DESVIACIN MEDIA:
| |
D.M.
Donde:
La desviacin media tiene dos ventajas. Utiliza en su clculo el valor de cada uno de los
elementos de un conjunto de datos, y es fcil de comprender; y es el promedio en que los
valores se desvan con respecto de la media.
Ejemplo
Los pesos de una muestra de cajas listas para embarcarse a Italia son (en kilogramos):
103, 97, 101, 106 y 103
= 103+97+101+106+103
= = = 102 Kg
5
48
Apuntes de clase Estadstica General
|103102|+|97102|+|101102|+|106102|+|103102|
D.M. =
5
D.M. 2,4 Kg
VARIANCIA.-
( )2
Variancia de poblacin: 2 =
2
2 ( ) 2
( ) 2 2
2
Variancia de la muestra: = = =
1 1 1
2
( ) 2
2 2
2
= =
1 1
PROPIEDADES DE LA VARIANZA
2.- La varianza de una constante es cero. Esto significa que si X1 = X2 =..= Xn= b
entonces:
V (b) = 0
49
Apuntes de clase Estadstica General
DESVIACION ESTANDAR
DESVIACIN ESTANDAR
CV = 100
MEDIA ARITMETICA
POBLACION CV = [ 100]
MUESTRA CV = [ 100]
50
Apuntes de clase Estadstica General
TEOREMA DE CHEBYSHEV.-
Una desviacin estndar pequea para un conjunto de valores indica que stos se
encuentran localizados cerca de la media. Por el contrario una desviacin estndar grande
revela que las observaciones estn muy dispersas con respecto a la media.
51
Apuntes de clase Estadstica General
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRIA.
Las medidas de asimetra tienen como facilidad elaborar un indicador que permita
establecer el grado de simetra o asimetra, que presenta una distribucin, sin necesidad
de llevar a cabo su representacin grfica.
=
Tambin existen otras frmulas alternativas para el clculo del coeficiente de asimetra.
3( )
=
Asimismo, el coeficiente de asimetra nos describe la forma de un conjunto de datos, es
decir, la manera como se distribuyen, comparando la media y la mediana. Si ambas
medidas son iguales, por lo general, se considera que los datos son simtricos (o con
sesgo cero, es decir, el coeficiente de asimetra es cero). Por lo contrario, los datos o su
distribucin es asimtrica o sesgada, es decir, si la media excede a la mediana, los datos
se describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetra
es positivo). Si la mediana excede a la media, los datos suelen llamarse sesgados a la
izquierda, o con sesgo negativo (el coeficiente de asimetra es negativo)
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales: el sesgo negativo ocurre cuando la media se reduce debido a algunos valores
muy pequeos. Los datos son simtricos cuando en realidad no hay valores extremos en
ninguna direccin, de tal manera que los valores grandes y pequeos se equilibran.
Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
Sesgo negativo o a la izquierda Media < Mediana < Moda
Analiza el grado de concentracin que presentan los valores alrededor de la zona central
de la distribucin, es decir, estudia la distribucin de frecuencias en la zona central. La
mayor o menor concentracin de frecuencias alrededor de la media y en la zona central de
la distribucin, dar lugar a una distribucin ms o menos apuntada.
Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin
leptocrtica (es ms apuntada o puntiaguda que la distribucin normal); en caso contrario,
52
Apuntes de clase Estadstica General
si la curtosis es negativa, se dice que los datos tienen una distribucin platicrtica (es
menos apuntada o puntiaguda que la distribucin normal). Si la curtosis es cero, entonces
los datos se distribuyen siguiendo una distribucin normal, y se dice que en este caso la
distribucin mesocrtica.
4
( ) 1 3 1
k= 3 k= [ ]
4 2 90 .10
Donde
( )2 ( )4
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media = 4
Varianza 2 = 8
4
( ) 288
k= 3 = - 3 = -1.875
4 (4)(64)
53
Apuntes de clase Estadstica General
Ejemplo
Solucin
3() 3(8773)
Reemplazando = = = 2.49
16.9
PROBABILIDAD
EXPERIMENTO:
EVENTO:
RESULTADO:
Ejemplos
54
Apuntes de clase Estadstica General
Caer un 2
Caer un 3
Caer un 4
Caer un 5
Caer un 6
ENFOQUES DE LA PROBABILIDAD:
Se analizarn dos enfoques de la teora probabilstica que son dos puntos de vista: objetivo
y subjetivo.
PROBABILIDAD CLASICA:
Probabilidad de un evento
Ejemplo:
1
Probabilidad de un dos: 6
MUTUAMENTE EXCLUYENTES
La ocurrencia de un evento significa que ningn otro puede ocurrir al mismo tiempo
COLECTIVAMENTE EXHAUSTIVO,
55
Apuntes de clase Estadstica General
Probabilidad de que suceda un evento
PROBABILIDAD SUBJETIVA
Posibilidad (probabilidad) de que suceda un evento, asignado por una persona con base
en cualquier informacin de que disponga
Ejemplo.-
1.- Estimar la probabilidad de que el equipo del JUAN AURICH, salga campen en el
campeonato de futbol profesional.
2.- Estimar la posibilidad de que usted tenga una calificacin de 20 en este curso.
REGLA DE LA ADICION
Ejemplo
En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero
impar" son mutuamente excluyentes. Si se observ un nmero par, no podra caer un
nmero impar al mismo tiempo.
Ejemplo
56
Apuntes de clase Estadstica General
de
Clasificacin empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000
Solucin
Sean los siguientes eventos:
B = El empleado seleccionado al azar es de mantenimiento.
E = El empleado seleccionado al azar es secretaria.
D = El empleado seleccionado al azar es de gerencia.
REGLA DE LA MULTIPLICACION
P (A y B) = P(A). P (B)
P (A B) = P(A). P (B)
57
Apuntes de clase Estadstica General
P (A\B) = P (A)
P (B \ A) = P (B)
Ejemplo
Una moneda es laEscriba aqu la ecuacin.nzada dos veces al aire, cul es la probabilidad
de que las dos veces se obtenga cara?
Solucin:
1 1
P (A) = P (B) =
2 2
1 1 1
P (A B) = P(A) P (B) = =
2 2 4
Ejemplo
Peso del
Probabilidad
paquete
Insuficiente 0.025
Satisfactorio 0.900
Excedido 0.075
P (F) = 0.025
P (F F F) = P (F) P (F) P (F) = (0.025) (0.025) (0.025)
P (F F F) = 0.000015625
b) Descubrir que a los tres paquetes les falte peso es poco probable.
Observacin
58
Apuntes de clase Estadstica General
Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo
ilustraremos esta idea:
Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn
defectuosos. Se selecciona uno:
3
P (D) = Probabilidad de que sea defectuoso.
10
7
P (D') = Probabilidad de que no sea defectuoso.
10
2
P (2 ) = Probabilidad de que el segundo rollo extrado sea
9
defectuoso dado que el primero lo fue.
7
P (2 ) = Probabilidad de que el segundo rollo extrado no sea
9
defectuoso dado que el primero fue bueno.
Este tipo de anlisis nos ayuda a definir la probabilidad condicional.
PROBABILIDAD CONDICIONAL
Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.
P (A B) = P (A). P (B\A)
( )
P (B \ A) =
( )
( )
P (B \ A) =
( )
P (A B) = P (A) P (B\A)
3 2
P (A B) = 10 = O.067
9
Donde:
Ejemplo
59
Apuntes de clase Estadstica General
Solucin
P (1 2 1 2 ) = (1 ) (2 / 1 ) (1 / 1 2 ) P (2 / 1 2 1 )
P ( / 1 2 1 2 )
13 12 13 12 13
P (1 2 1 2 ) = = 0.001014
52 51 50 49 48
Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero
es una permutacin con repeticin ya que las espadas se repiten dos veces y los
corazones tambin dos veces, entonces:
13 12 13 12 13 5!
P (1 2 1 2 ) = ( 52 ) = 0.0304
51 50 49 48 2 ! 2 !
TABLAS DE CONTINGENCIA
Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los
individuos de una poblacin se clasifican en funcin de dos variables. Tambin se le
conoce con el nombre de tabla de doble entrada.
Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han
clasificado segn el sexo y por su adiccin al tabaco.
Fumadores No Total
Hombres 120 fumadores
60 180
Mujeres 50 70 120
Total 170 130 300
Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de
probabilidad puede crearse dividiendo cada valor de las casillas por el total, que en el
ejemplo anterior sera 300.
Fumadores No Total
Hombres 120/300 fumadores
60/300 180/300
Mujeres 50/300 70/300 120/300
Total 170/300 130/300 300/300
Fumadores No Total
Hombres 0.4 fumadores
0.2 0.6
Mujeres 0.1667 0.2333 0.4
Total 0.5667 0.4333 1
60
Apuntes de clase Estadstica General
Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo,
elegida una persona al azar la probabilidad de que esta sea hombre es P (H) = 0.6 y la
probabilidad de seleccionar una mujer es P (M) = O.4
( ) 0.1667
P (M \ F) = = = 0.2942
() 0.5667
Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la
persona elegida.
Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada
segmento en el rbol es una etapa del problema.
Ejemplo
Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.
Estado Civil
Edad Civil
Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140
Solucin:
61
Apuntes de clase Estadstica General
Probabilidad Probabilidad
condicionada conjunta
P(S/A)
77 91 77
S p(A S) = P(A)P(S/A)
= = 0.55
91
140 91
91 A C P(A C) = P(A)P(C/A) 91 14 = 0.10
140 14 =
140 91
91
14
91
28 S P (B S) = P(B)P(S/B) 49 28 = 0.20
49
B
49 =
140 49
140
21 C P (B C) = P(B)P(C/B) 40 21 = 0.15
=
49 140 49
77
a.-P (A S) = 140 = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero
77
b.- P (S \ A) = 91 = 0.85 Probabilidad de que un cliente sea soltero dado que es menor
de 30 aos.
Estado Civil
Edad CivilIVIL
Soltero Casado Totales
A P (A S) P (A C) P (A)
B P (B S) P (B C) P (B)
Totales P(S) P(C) 1
Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:
Estado civil
Edad Civil
Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1
TEOREMA DE BAYES
62
Apuntes de clase Estadstica General
PROBABILIDAD A PRIORI
PROBABILIDAD A POSTERIORI
TEOREMA DE BAYES
( )( )
P(A\B) =
( ) ( )+ ( )( )+ .+( )( )
Ejemplo
La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe
que el 80% de los estudiantes terminarn los problemas asignados. Determin, que de los
estudiantes que cumplen con su trabajo el 90% aprobar el curso. De aquellos estudiantes
que no lo hacen as, el 60% ser aprobado. Eduardo Lpez tom Estadstica durante el
ltimo semestre con la profesora Blanquita y recibi una calificacin aprobatoria. Cul es
la probabilidad de que s haya hecho sus tareas?
Solucin:
Sea:
A = Estudiante que cumple con su trabajo.
A' = Estudiante que no cumple con su trabajo.
B = Estudiante que aprueba.
B' = Estudiante que no aprueba.
63
Apuntes de clase Estadstica General
P( ) = 0.1
P(A) =0.8 P(A ) = ()( )
P(B) =0.6
P( B ) = ( )( )
P( ) = 0.4
P( ) = ( )( )
P( ) = (0.2)(0.4) = 0.08
( )
P ( ) =
()
( ) ()
P ( ) =
( )
Tener en cuenta que P (B) no es discernible de inmediato. Aqu es donde participa el
teorema de Bayes. Existen dos razones por las que Eduardo Lpez haya aprobado el
curso. Puede haber hecho los trabajos asignados y aprobar el curso o puede no haber
hecho los trabajos asignados y tambin aprobar el curso, es decir:
P (B) = P (A y B) +P (A y B)
P(A)P()
P ( ) =
() ()+ ( )( )
0.72
P ( ) = =
0.72 +0.12
0.72
P ( ) = = 0.86 = 86%
0.84
Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas
dado que recibi una calificacin aprobatoria.
Ejemplo
64
Apuntes de clase Estadstica General
Ejemplo:
Supngase que se est interesado en el nmero de caras que caen al lanzar tres veces
una moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres
caras. Cul es la distribucin de probabilidades para el nmero de caras?
Solucin.
65
Apuntes de clase Estadstica General
VARIABLE ALEATORIA
Cantidad que es resultado de un experimento aleatorio que, debido al azar, puede tomar
distintos valores
Variable que slo puede tener ciertos valores claramente separados y que es el resultado
de contar algn elemento de inters.
Ejemplos:
- El nmero de caras que se presentan en tres lanzamientos de una moneda
- El nmero de estudiantes que sacaron 15 en un examen
- El nmero de empleados ausentes en una fbrica determinada
Es aquella que puede tomar uno de una cantidad infinitamente grande de valores, dentro
de ciertas limitaciones
Ejemplos:
- La duracin de cada cancin en el ltimo lbum de Corazn Serrano
- El peso de cada estudiante de esta clase
- La temperatura ambiente al momento que lee estos apuntes
MEDIA:
= () = [()]
Sirven para comparar la variacin en dos distribuciones que tengan la misma media, pero
diferente dispersin.
= [( ) ()]
Ejemplo:
Un vendedor, Juan Prez vende automviles nuevos para una empresa. Generalmente
negocia el mayor nmero de autos los sbados. Ha establecido la siguiente distribucin de
probabilidad para el nmero de autos que espera vender en un sbado en particular.
66
Apuntes de clase Estadstica General
Nmero de
automviles Probabilidad
Vendidos P(x)
X
0 0,10
1 0,20
2 0,30
3 0,30
4 0,10
total 1,00
Ejemplo:
Una segunda caracterstica de una distribucin binomial es que los datos recopilados son
resultado de conteos.
!
P(X) =
!( )!
67
Apuntes de clase Estadstica General
Donde:
n: es el nmero de ensayos
X: es el nmero de xitos observados
p: es la probabilidad de xito en cada ensayo
q: es la probabilidad de fracaso que se obtiene de 1- p
np
=
Ejemplo:
!
a.- P(X) =
!( )!
!
P(X= 3) = 0,853 0,15 = 0, 0026 = 0,26%
!( )!
!
b.- P(X) =
!( )!
!
P(X= 3) = 0,153 0,85 = 0,0839 =8, 39%
!( )!
c.- () = 1 [( =) + (=) ]
8! 8!
() = 1 [( =0) = 0,150 0,8580 + (=1) = 0,151 0,8581 ]
0!(8 0)! 1!(8 1)!
Ejemplo
68
Apuntes de clase Estadstica General
Otros ejemplos:
- Nmero de huevos de un insecto en una ovoposicin
- Nmero de bacterias en una muestra de agua
- Nmero de semillas defectuosas, observadas en una cinta transportadora por minuto.
- Nmero de nematodos por unidad de volumen de suelo
- El nmero de palabras mal escritas por pgina en un peridico
- El nmero de llamadas telefnicas por hora que recibe la secretaria de la Facultad
- El nmero de vehculos vendidos por da por la marca Toyota en la ciudad de
Lambayeque
- El nmero de goles en un encuentro de ftbol escolar
- Nmero de pulgones por planta
Se calcula de la siguiente manera.
P(X) = O bien P(X) =
! !
69
Apuntes de clase Estadstica General
P(X) =
!
Donde:
= np
Ejemplo
Si el 1% de las bombillas fabricadas por una compaa son defectuosas, hallar la
probabilidad de que, en una muestra de 100 bombillas, 3 sean defectuosas
P(X) =
!
=
= 100 (0,01) = 1
13 2,718281
P(X) = = 0, 06121 = 6,13%
3!
Ejemplo:
1.- Se sabe que el nmero medio de errores por factura se estim en 0,3. Cul es la
probabilidad de no encontrar errores en una factura seleccionada al azar? Cul es la
probabilidad de hallar exactamente un error?
2.- Si el nmero promedio de picaduras de gorgojos por semilla es 0,2 (de cada 100
semillas 20 se encuentran picadas) Cuntas de 100 semillas no tendra picaduras?,
Cuntas 1 picadura? Y Cuntas 2 ms?
70
Apuntes de clase Estadstica General
Ejemplo
Los registros de una empresa muestran que la probabilidad de que falle cierto tipo de foco
en las primeras 100 horas de uso es p = 0,0005. Determine la probabilidad de que, de un
lote de 1 000 focos, cuando mucho 2 fallen en las primeras 100 horas de uso a) usando la
distribucin Poisson b) usando la Binomial
Solucin:
= np = 1 000(0,0005) =0,5
1 000!
P(X =0) = (0,0005)0 (0,9995)1000 =0,6065
0!(1 000 0)!
1 000!
P(X =1) = (0,0005)1 (0,9995)999 = 0,3034
1!(1 000 1)!
1 000!
P(X =2) = (0,0005)2 (0,9995)998 =0,07581
2!(1000 2)!
Luego la probabilidad de que fallen cuando mucho 2 focos, segn distribucin Binomial
71
Apuntes de clase Estadstica General
0,5 0,5
50% 50%
%
1.- Aproximadamente el 68% del rea bajo la curva normal est dentro ms una y menos
una desviacin estndar respecto de la media. Esto se expresa as 1
2.-Aproximadamente el 95,5 % del rea bajo la curva normal est dentro ms dos y menos
dos desviaciones estndar respecto de la media. Esto se expresa as 2
72
Apuntes de clase Estadstica General
3.- Aproximadamente el 99,7 % del rea bajo la curva normal est dentro ms tres y
menos tres desviaciones estndar respecto de la media. Esto se expresa as 3
Mostramos esto en el siguiente diagrama
Estos conceptos pueden expresarse de manera algo distinta: el rea bajo la curva normal
dentro de ms y menos una desviacin estndar respecto de la media, es 0,6826. El rea
dentro de ms y menos dos desviaciones estndar respecto de la media, es de 0,9544. El
rea dentro de tres desviaciones estndar respecto de la media vale 0,9974
Ejemplo
73
Apuntes de clase Estadstica General
Z= 1,43 A (0,4263)
P(X 4,4) = 0,5 0,4263 = 0,0737= 7,37%
b.- Z=
3,2 3,9
Z=
0,35
Z= 2 A (0,4773)
P(X 3,2) = 0,5 0,4773 = 0,0227= 2,27%
c.-- Z=
3,0 3,9
Z=
0,35
Z= 2,57 A (0,4949)
P(X 3) = 0,5 + 0,4949 = 0,9949
P(X 3) = 99,49%
Ejemplo
Una mquina expendedora de gaseosa se ajusta para servir 7,00 onzas de lquido por
vaso. La desviacin estndar es de 0,10 onzas Cul es la probabilidad de que la mquina
sirva:
Distribucin de probabilidad que consta de todas las posibles medias de las muestran de
un determinado tamao de muestra de la poblacin y la probabilidad de ocurrencia
asociada con cada media muestral
Teorema:
74
Apuntes de clase Estadstica General
=
( )2
2 =
= 2
Pero: = Para una poblacin infinita
= X Para una poblacin finita
1
= Factor de correccin finita
1
OBSERVACION
Se puede usar = en una poblacin finita, pero siempre y cuando <0,05
Ejemplo
El tiempo de servicio de los empleados (POBLACION) a nivel de ejecutivo de la empresa
LA PONDEROSA es:
Aos de
Nombre
servicio
JUAN 20
DIANA 22
ROSA, 24
EDUARDO 26
HUGO 28
1 20+22+24+26+28
= = =24
5
( )2 (2024)(2224)(2424)(2624)(2824)
2 = = =8
5
= 2 = 8 = 2,8284
Ahora
a.-Formar muestras tamao 2
b.-Organice las medias en una distribucin de muestras
75
Apuntes de clase Estadstica General
Solucin:
Aos de Media Aos de Media
servicio muestral servicio muestral
(n = 2) (n = 2)
20, 22 21 22, 24 23
20, 26 23 22, 28 25
20, 24 22 26, 24 25
20, 28 24 26, 28 27
22, 26 24 24, 28 26
21+23+.+26
= = = 24
16
Luego: =
= X Para una poblacin finita
1
2,8284 5 2
= X
2 5 1
= ,
Z=
Ejemplo:
Se sabe que la produccin de pollos de una determinada granja tiene un peso promedio de
3,50 Kg. Y una desviacin estndar de 0,18 Kg. Cul es la probabilidad de que una
muestra aleatoria de 100 pollos de esta poblacin pesen entre 3,53 y 3,56 Kg.?
76
Apuntes de clase Estadstica General
3,56 3,50
Z= = = 0,18 = 3,33
100
Z3,33 A (0,4996)
3,53 3,50
Z=
= 0,18 = 1,66
100
Z1,66 A (0,4515)
Ejemplo
Z= =
2,700 2,800
Z= 280 = 2,14
36
, A( 0,4838)
Ejemplo
Z= =
1,60 1,50
= 0,25 = 2,40
36
Z2,40 A (0,4918)
77
Apuntes de clase Estadstica General
Ejemplo
Z= =
1
1,60 1,50
Z= = 2,51
0,25 400 36
36 400 1
, A( 0,4940)
Ejemplo:
1.- Un fabricante declara que la duracin de las bujas que l fabrica sigue una distribucin
normal con media de 36 000 Km y una desviacin estndar de 4 000 Km Para una
muestra aleatoria de diecisis bujas se obtuvo una duracin media de 34 500 Km.
Cul es la probabilidad de obtener una media muestral tan pequea como esta o
menor?
Es una distribucin probabilstica que consta de todos los valores posibles que pueda
tomar de un tamao de muestra dado, junto a su probabilidad de ocurrencia.
78
Apuntes de clase Estadstica General
=P
=P=
=
1
Recibe el nombre factor de correccin para una poblacin finita
1
Z= =
(1)
Ejemplo
Se tiene que el 4% de las piezas producidas por cierta maquina es defectuosa, Cul es la
probabilidad de que en un grupo de 200 piezas, el 3% o ms sean defectuosas.?
Z= =
(1)
0,03 0,04
Z= =
0,04 0,96
200
0,71
Z (0,71) = A (0,2612)
Ejemplo
Se desea estudiar una muestra de 49 personas para saber la proporcin de las personas
mayores de 40 aos, sabiendo que la proporcin en la poblacin es 0,4. Cul es la
probabilidad de que la proporcin en la muestra sea menor de 0,5?
79
Apuntes de clase Estadstica General
Z= =
(1)
0,5 0,4
Z= = 1,43
0,4 0,6
49
Z (1,43) = A (0,4236)
Ejemplo
Cuarenta y seis por ciento de los sindicatos del pas estn en contra de comercializar con
la China Continental; Cul es la probabilidad de que una encuesta a 100 sindicatos
muestre que ms del 52% tenga la misma posicin?
Z= =
(1)
0,52 0,46
Z= = 1,21
0,44 0,54
100
Z (1,21) = A (0,3869)
Ejemplo
80
Apuntes de clase Estadstica General
( 1 2 ) (1 2 )
Z=
2 2
1+ 2
1 2
( ) ( ) ( ) ( )
Z= =
2 2
+
Se puede aplicar esta distribucin cuando no se conocen las varianzas poblacionales las
cuales pueden ser sustituidas por variancias muestrales siempre que sean mayores de 30.
La frmula ser:
( ) ( )
Z=
2 2
+
Ejemplo
1.- Se obtiene una muestra aleatoria de 100 elementos de una poblacin normal que tiene
media 50 y desviacin estndar 8. Luego se selecciona otra muestra aleatoria de 400
elementos de una poblacin normal, que tiene media 40 y desviacin estndar 12.
Encontrar la probabilidad de que
SOLUCION
= 50 = 40 = 8 = 12 1 = 100 2 = 400
( ) ( ) ( ) ( )
a.- Z=
=
+
8 (50 40)
Z= = 2
64 144
+
100 400
2 = 2 A(0,4772)
81
Apuntes de clase Estadstica General
12 10
b.- Z= = 2
64 144
+
100 400
2 = 2 A(0,4772)
12 10
Z= = 22
64 144
+
100 400
2 = 22 A(0,5)
Luego
Ejemplo
( ) ( ) ( ) ( )
Z=
=
+
1,75 = A(0,4599)
82
Apuntes de clase Estadstica General
11,82 = A(0,4999)
A= 0,4999+0,4599=0,9598
P = 10,9598= 0,0402=4,01%
Ejemplo
( ) ( ) ( ) ( )
Z=
=
+
5 (0)
Z= = 1,12
144 576
+
36 36
1,12 = A(0,3686)
P = 0,50,9598= 0,1314=13,14%
(1 2 ) (1 2 )
Z=
1 1 2 2
+
1 2
Ejemplo
83
Apuntes de clase Estadstica General
( ) ( )
0,01 0,02
Z= = = 1,33
(0,07 0,93) (0,05 0,95)
+
+
2000 2000
Z= 1,33 A (0,4082)
0,01 0,02
Z= =4
(0,070,93) (0,05 0,95)
+
2000 2000
Z= 4 A (0,5)
Ejemplo
( ) ( )
Z=
+
0,08 (0,06)
= = 2,98
(0,14)(0,86) (0,2)(0,8)
+
200 100
Z= 2,98 A (0,4986)
DISTRIBUCION DE t
84
Apuntes de clase Estadstica General
Grados de libertad, esta expresin fue introducida por Fisher, dice que los grados de
libertad de un conjunto de observaciones, estn dados por el nmero de valores que
pueden ser asignados arbitrariamente, antes de que el resto de las variables queden
completamente determinadas. Ejemplo: Si tengo cuatro valores: 8 +10 + 6 + 20 = 44, se
observa que puedo asignar tres (3) valores arbitrariamente: 16 + 4 + 10 +14= 44, pero el
cuatro debe ser 14 y no lo puedo asignar libremente pues la suma debe ser 44. Por la tanto
= n 1 = 4 - 1 = 3. se lee nu o niu y se emplea para simbolizar los grados de
libertad
Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en
estadsticos muestrales, esto es, en funciones de la informacin muestral. La eleccin
apropiada de estos estadsticos depender de cul sea el parmetro de inters de la
poblacin. El verdadero parmetro ser desconocido, y un objetivo ser estimar su valor.
PARMETROS Y ESTADSTICOS
ESTIMACIN PUNTUAL
Se dice que:
85
Apuntes de clase Estadstica General
Salario Programa de
anual ($) Adiestramiento gerencial?
9 094,3 Si
3 263,9 Si
9 643,5 Si
9 984,9 Si
7 621,6 No
5924,0 Si
9 092,3 No
1 404,4 Si
3 957,7 No
5 109,7 No
1 +2 +3 +.+10
= = = 6 509.63
2
2 ( )
= = 9.09
1
S 3.01
4
= 0.4
10
INSESGO:
EFICIENCIA.
Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener
dos estimadores puntuales del mismo parmetro poblacional. En este caso, preferiramos
usar el estimador puntual con la menor desviacin estndar, porque tiende a proporcionar
estimados ms cercanos al parmetro poblacional. Se dice que el estimador puntual con la
menor desviacin estndar tiene una mayor eficiencia relativa que el otro.
86
Apuntes de clase Estadstica General
CONSISTENCIA.
{ x - Z + Z } = 1-
ERROR MUESTRAL
Para el caso en el que la media de una muestra estima a una media poblacional, el error
muestral es:
E = | |
87
Apuntes de clase Estadstica General
Ejemplo.-
1.- Un proceso de envase de bolsas de azcar refinada. El peso del contenido de estas
bolsas tiene una distribucin normal con desviacin estndar de 15 gramos. Los
contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
Calcule un intervalo de confianza del 95% para el verdadero peso medio de todas las
bolsas de azcar producidas por el proceso.
{ + } = 1
15 15
{100 1,96 100 +1,96 } =0,95
25 25
{Z +Z } = 1
Ejemplo.-
Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que
evaluasen unas determinadas condiciones de trabajo en una escala de 1 (no importante) a
5 (extremadamente importante). La seguridad de trabajo recibi una calificacin media de
4,38 con una desviacin estndar muestral de 0,70. Calcule un intervalo de confianza del
99% para la media poblacional
{Z +Z } = 1
0,70 0,70
{4.38 2.576 4.38 + 2.576 } = 0.95
172 172
88
Apuntes de clase Estadstica General
Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero
de xitos de una muestra entre el nmero total muestreado.
Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo
siguiente:
+ }= 1
{
Como p no se conoce
(1 )
=
Donde
=Valor asignado por el nivel de confianza
= = es la proporcin muestral
n = es el tamao de la muestra
Ejemplo.-
{ + } = 1-
(1) 0,55(10,55)
= = 0.0165
900
{0.5229 0,5771 } = 1
Ejemplo.-
Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que
puedan reconocer la marca de un limpiador con base en la forma y el color del recipiente.
89
Apuntes de clase Estadstica General
De 1400 personas 420 pudieron reconocer (identificar) la marca del producto. Si se utiliza
el grado de confianza del 99% Cul sern los intervalos de confianza?
{ + } =1 -
420
= 1400 = 0,30
(1) 0,30(10,30)
= = 0.0122
1400
{0.2686 0,3314 } = 1
Las producciones promedio en una planta qumica que usa materias primas suministradas
por dos proveedores diferentes.
(x1 x2 ) (1 2 )
Z=
2 2
1+ 2
1 2
( ) ( )
Z=
+
{ ( ) z + ( ) + z + } =1-
90
Apuntes de clase Estadstica General
{ ( ) z + ( )+ z + } =1-
Ejemplo:
LLANTA 1 LLANTA 2
1 = 26400 2 = 25100
12 = 144000 22 = 1960000
Solucin:
12 22
El error estndar = +
1 2
12 12
Que se puede estimar como = +
1 2
2 22 12 22
{ (x1 x2 ) z 1 + (x1 x2 ) + z + } =1-
1 2 1 2
91
Apuntes de clase Estadstica General
La media muestral de ( 1 - 2) es p1 p2
1 1 2 2
El error estndar es= +
1 2
1 1 2 2
Que se estima como = +
1 2
)
{( + ( ) +
+ }=1
)
{( + ( ) +
+ }=1
Ejemplo:
La propuesta de un bono para la construccin de una escuela ser enviada a los votantes
en la siguiente eleccin municipal. Una parte importante del dinero derivado de esta
emisin de bonos se emplear en construir escuelas en una zona de rpido desarrollo de
la ciudad y lo dems se usar para renovar y actualizar los edificios escolares del resto de
sta. Para evaluar la viabilidad de la propuesta de un bono, a una muestra aleatoria de
1 = 50 residentes de la zona de rpido desarrollo y 2 = 100 de las otras partes de la
ciudad, se les pregunt si piensan votar por la propuesta. Los resultados se dan a
continuacin:
Seccin en Resto de
desarrollo la ciudad
Tamao muestral 50 100
Nmero a favor de la propuesta 38 65
Proporcin a favor de la propuesta 0.76 0.65
92
Apuntes de clase Estadstica General
Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con
un 99% de intervalo de confianza.
1 1 2 2 11 22
{(1 2 ) Z + (1 2 ) + Z + } = 1
1 2 1 2
t=
93
Apuntes de clase Estadstica General
El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:
{ (1) + (1) } =1
{ (1) + (1) } =1
Ejemplo.-
Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes
universitarios en el primer mes del ciclo acadmico. La media y la desviacin estndar de
una muestra aleatoria de nueve alumnos fueron de $ 15 782 y $ 3889, respectivamente.
Suponiendo que la poblacin sigue una distribucin normal, calcule el intervalo de
confianza del 95% para el gasto medio poblacional
{ t (n-1) x + t (n1) = 1
{ t (n1) +(1) } = 1
3889 3889
{157822.3060 15782+2.3060 } = 1
9 9
{12792.65554 188771,3446} = 1
Ejemplo
Una muestra aleatoria de 26 observaciones tiene una media de 65 y una desviacin
estndar de 4,2. Se piden los lmites de confianza del 95%
94
Apuntes de clase Estadstica General
{ + } = 1
{ + }=1
4,2 4,2
{65 2,0595 65 + 2,0595 } = 0,95
25 25
{63,27 66,73} = 0,95
( )
+( ) ( )
+( )
{( ) t +
+ ( ) + +
+ } =1
( )
+( ) ( )
+( )
{( ) t +
+ ( ) + t +
+ }=1
Ejemplo
( )
( )
( )
( )
{( ) t + + ( ) + + + } =1-
9(0,49)+9(0,64) 9(0,49)+9(0,64)
{(81,7 88,3) 2,10 10+102
(81,7 88,3) + 2,10 10+102
} = 1
{7,31 , } = 0, 95
95
Apuntes de clase Estadstica General
10
P1 = = 0,62 2 = 18 = 0,55
t (26+182)(0,05) = 2,018
1 1 2 2 1 1 2 2
{(1 2 ) t + 1 2 (1 2 ) + t + }= 1
1 2 1 2
Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este
resultado es clave para construir un intervalo de confianza para la varianza poblacional
cuando se toman muestras de una poblacin
()
=
( )
( )
() ()
Ejemplo
Solucin
a.- n 15 g.l. 14
0.05
96
Apuntes de clase Estadstica General
( )
( )
() ()
(14)(2,36) (14)(2,36)
2
26,12 5,63
2.99 13.85
Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de
impurezas discurre entre 2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho
Problema VARIANCIA
No importa el tamao de
Muestra grande Muestra pequea
la muestra
n> 30 n< 30
Se utiliza Z
Se utiliza Z Se utiliza t
Z= Z= t=
z= =
z=
2 2 +
2 2
1
+
2 +
1 2 ( ) + ( )
=
+
MUESTRA PROBABILSTICA.-
97
Apuntes de clase Estadstica General
Muestra que se selecciona de modo que cada integrante de la poblacin en estudio tenga
una probabilidad conocida (no igual a cero) de ser incluido en la muestra
Cuando se quiere determinar el tamao de una muestra se debo tomar en cuenta los
siguientes factores: el tipo de muestreo, el parmetro a estimar el error muestral admisible,
la variancia poblacional.
Parmetro.- es una medida de resumen que describe una caracterstica de toda una
poblacin
Estadstico.- es una medida de resumen que se calcula para describir una caracterstica
de la muestra
ERROR DE MUESTREO
NIVEL DE CONFIANZA
98
Apuntes de clase Estadstica General
n
() ()
Donde:
2 2 2 2 1,962 32
n 2
()2
= = 138,30
() 0,52
2 2
n= 2
( 1)+ 2 2
Ejemplo
Un gerente de personal de una empresa que tiene 3 000 empleados desea estimar el
tiempo promedio que les lleva a sus trabajadores trasladarse entre sus casas y la empresa.
Desea construir un intervalo de confianza de 95% y que la estimacin est dentro de un
minuto alrededor de la media verdadera: a travs de una muestra piloto se sabe que la
varianza de los tiempos es de 30 minutos. Determine el tamao de la muestra que se
requiere para la estimacin.
2 2
n=
2 ( 1)+ 2 2
3000(1,96)2 (30)
n= 2 = 111,02
1 (3000 1)+(1,96)2 (30)
a.- Para caso de estimar una proporcin de sujetos que posee una caracterstica a travs
de estudios previos
n
()
Donde:
Ejemplo:
Cuntos sujetos debe tener una muestra si se desea estimar la proporcin de sujetos que
opinan de una determinada manera al nivel de confianza del 99% y un error de estimacin
del 5% sabiendo que p es el 25%?
z2 pq
n
(pP)2
2,962 (25)(75)
= = 657,12 = 658
52
q= 0,50
EJEMPLO:
z2 pq
n
(pP)2
2,962 (50)(50)
n= = 5476
22
100
Apuntes de clase Estadstica General
2
n=
( )2 ( 1) + 2
Donde
N = Es el tamao de la poblacin
= Riesgo o nivel de significancia
Z = Puntuacin correspondiente a
P= Porcentaje estudiado
Q= 100 P
(p P) =e = Error permitido
.Ejemplo
Se desea calcular el nmero de sujetos necesarios para realizar una investigacin en una
provincia en la que 60 000 alumnos terminaron tercero de secundaria. Se establece un
nivel de confianza del 95,44% y el margen de error es del 3% Estudios anteriores indican
que el 50% de los alumnos del tercero de secundaria optan por la Universidad
2
n
( )2 ( 1) + 2
4 50 50 60000
n
9(600001)+4 50 50
n= 1090,93 =1091
Bibliografa:
101