Vous êtes sur la page 1sur 200

Contenido

Unidad I - Estadstica Descriptiva ............................................................................... 3


1.1 Poblacin y muestra aleatoria ........................................................................... 15
1.2 Obtener datos estadsticos ................................................................................ 15
1.3 Medidas de tendencia central ........................................................................... 17
1.4 Medidas de Dispersin ..................................................................................... 22
1.5 Tablas de distribucin de frecuencia ................................................................ 24
1.6 Calcular Cuantiles ........................................................................................... 41
1.7 Grficos ............................................................................................................ 44
1.8 Cajas y alambres ............................................................................................... 45
1.9 Diagrama de Pareto .......................................................................................... 47
Unidad II - Probabilidad .............................................................................................. 49
2.1 Probabilidad de eventos .................................................................................... 49
2.2 Espacio muestral ............................................................................................... 49
2.3 Ocurrencia de eventos ...................................................................................... 51
2.4 Permutaciones y combinaciones ....................................................................... 53
2.5 Diagramas de rbol ........................................................................................... 54
2.6 Axiomas de probabilidad .................................................................................. 58
2.7 Independencia y probabilidad condicional ....................................................... 66
2.8 Teorema de Bayes ............................................................................................ 70
Proyecto .................................................................................................................. 75
Unidad III - Funciones de distribucin de probabilidades ..................................... 78
3.1 Variables aleatorias y su clasificacin .............................................................. 78
3.2 Distribuciones de probabilidad discretas .......................................................... 82
3.3 Distribucin de probabilidad Hipergeomtrica ................................................ 85
3.4 Distribucin de probabilidad Poisson ............................................................... 87
3.5 Distribuciones de probabilidad continuas......................................................... 92
3.6 Distribucin t .................................................................................................... 97
3.7 Distribucin Chi-cuadrada .............................................................................. 100
3.8 Distribucin F ................................................................................................. 103
3.9 Esperanza matemtica. ................................................................................... 104
Unidad IV ..................................................................................................................... 121
4.1 Inferencia estadstica ...................................................................................... 121
4.2 Muestreo estadstico ....................................................................................... 121
4.3 Estimadores .................................................................................................... 124
4.4 Estimacin puntual ......................................................................................... 124
4.5 Estimacin por intervalo ................................................................................. 125
4.6 Errores tipo I y II ............................................................................................ 135
4.7 Contraste de hiptesis unilateral y bilateral .................................................... 135
Unidad V ...................................................................................................................... 142
Regresin y correlacin ........................................................................................ 142
5.1 Control de calidad ........................................................................................... 142
5.2 Diagrama de dispersin .................................................................................. 143
5.3 Regresin lineal simple .................................................................................. 145
5.4 Correlacin ..................................................................................................... 146
5.5 Determinacin y anlisis de los coeficientes de correlacin y de determinacin.
.............................................................................................................................. 147
5.6 Distribucin normal bidimensional ................................................................ 148
5.7 Intervalos de confianza y pruebas para el coeficiente de correlacin. ........... 149
5.8 Errores de medicin. ....................................................................................... 150
Unidad IV ..................................................................................................................... 161
4.1 Inferencia estadstica ...................................................................................... 161
4.2 Muestreo estadstico ....................................................................................... 161
4.3 Estimadores .................................................................................................... 164
4.4 Estimacin puntual ......................................................................................... 164
4.5 Estimacin por intervalo ................................................................................. 165
4.6 Errores tipo I y II ............................................................................................ 175
4.7 Contraste de hiptesis unilateral y bilateral .................................................... 175
Unidad V ...................................................................................................................... 182
Regresin y correlacin ........................................................................................ 182
5.1 Control de calidad ........................................................................................... 182
5.2 Diagrama de dispersin .................................................................................. 183
5.3 Regresin lineal simple .................................................................................. 184
5.4 Correlacin ..................................................................................................... 185
5.5 Determinacin y anlisis de los coeficientes de correlacin y de determinacin.
.............................................................................................................................. 186
5.6 Distribucin normal bidimensional ................................................................ 187
5.7 Intervalos de confianza y pruebas para el coeficiente de correlacin. ........... 188
5.8 Errores de medicin. ....................................................................................... 189


Unidad I - Estadstica Descriptiva

1. Consideraciones Generales
La estadstica descriptiva maneja los datos obtenidos para su ordenacin y presentacin, y
hacer resaltar ciertas caractersticas de manera que sean mas objetivas u tiles; por ello,
investiga los mtodos y procedimientos, y establece reglas para que el manejo de los datos sea
eficiente, para que la informacin presentada resulte confiable, exprese en lenguaje sencillo los
contenidos para que el mayor numero de personas lo comprenda y puedan establecer
comparaciones y obtener conclusiones.
Poblacin
La investigacin estadstica es la operacin que se refiere a la recopilacin de informacin
sobre una poblacin o colectivo de individuos u objetos que tienen una caracterstica comn.

Muestra
Subconjunto propio o parte tomada de una poblacin

La Investigacin estadstica es la operacin que se refiere a la recopilacin de informacin
sobre una poblacin o colectivo de individuos, medias u objetos que tienen una caracterstica
comn, e incluye:
a) Sealamiento del elemento de la poblacin que origina la informacin (unidad de
investigacin), puede ser: una industria, un hogar, la persona, etctera; pero en todo
caso la unidad debe ser en su definicin medible y fcilmente identificable.
b) Citar: qu se investiga; cmo se debe realizar, cundo se llevara a cabo, y en lugar de
la investigacin que es el dnde.
c) La recoleccin de la informacin incluye: ordenarla, filtrarla eliminando posibles errores
y analizarla, aplicando los mtodos y normas estadsticos.
d) La publicacin de la informacin, ya sea para uso propio o ajeno.

2. Presentacin de la Informacin
Una vez obtenida la informacin resultante de una investigacin estadstica, que puede
haberse efectuado, por ejemplo, en medicina, para estudiar el comportamiento de enfermos
sujetos a un tratamiento especfico; en educacin, los ensayos orientados a estudiar los
campos de actitud y aprendizaje de alumnos sometidos a ciertos procesos educativos; en la
agricultura, dirigidos a medir el efecto de un insecticida bajo ciertas condiciones que varan bajo
el control del investigador, etctera.
A continuacin es necesario escoger la forma de organizarla para su anlisis o para su
publicacin que puede ser en:
- Cuadros numricos
- Grficos y Pictogramas
3. Cuadros Numricos de Informacin
A. Representacin tabular
Las lneas horizontales y las columnas verticales deben disponerse de manera que resalten los
aspectos que se desean mostrar y las comparaciones que se quieren hacer notar.
Incluir:
a) Ttulo. Donde se indica el objeto del cuadro.
b) Columna principal. Lugar donde se anotan las categoras.
c) Encabezado de las columnas, donde se explica el objeto de cada una de ellas.
d) Cuerpo. Lugar donde se supone la informacin.
e) Notas de pie. Ah se aclaran algunas operaciones y se indica la fuente de la
informacin.
Problema
El contador de una compaa industrial informa que durante el mes de marzo pasado el total de
ventas fue de $11 745 420 y la nomina de pago del mes por departamento fue as: personal
administrativo $425 760, personal de ventas y promocin $528 750 y de produccin $2 765
450. Elabora el cuadro que se seale:
a) Porcentaje de cada departamento con relacin al total de la nomina.
b) Porcentaje de cada departamento con relacin al total de ventas.
Resolucin
Nmina de pago por departamento
Mes de Marzo
Total de ventas en le mes $11 745 420
Departamento Gastos mes % nmina % ventas
Administracin
Ventas
Produccin
425 760
528 750
2 765 450
11.44
14.21
74.35
3.62
4.50
23.54
Totales $3 719 960 100.00 31.66

Operaciones que hicimos para llenar el cuadro: Calculamos por interpolacin polar.
(Razones y Porciones):
Nomina:
3 719 960: 100
3 719 960
::
x=
x=

x=
425 760 : x
425 760 (100)
42 576 000
3 719 960
11.44%

3 719 960: 100
3 719 960
::
x=
x=

x=
528 750 : x
528 750 (100)
51 875 000
3 719 960
15.21%

3 719 960: 100
3 719 960
::
x=
x=

x=
2 765 450 : x
2 765 450 (100)
276 545 000
3 719 960
74.34%

Ventas:
11 745 420: 100
3 719 960
::
x=
x=

x=
425 760 : x
425 760 (100)
42 576 000
11 745 420
3.62%

11 745 420: 100
3 719 960
::
x=
x=

x=
528 750 : x
528 750 (100)
51 875 000
11 745 420
4.50%

11 745 420: 100
3 719 960
::
x=
x=

x=
2 765 450 : x
2 765 450 (100)
276 545 000
11 745 420
23.54%
Problema
Un representante de la Secretara de Gobernacin ante un sorteo organizado por una casa que
vende material deportivo, para entregar tres premios consistentes, cada uno, en un viaje para 2
personas a Rotterdam, Holanda, a la semifinal de la Eurocopa informa:
En al primera extraccin de un boleto el premio fue con el nmero de folio 007950 y
corresponde a Manuel Lpez Galicia; en la segunda extraccin el premio corresponde a el
nmero de folio 015162 para Mara Roy Martnez; en la tercera extraccin el premio fue para el
nmero de folio 008032 para Yolanda Uribe May. Elabora el cuadro correspondiente a esta
informacin.
Cuadro de ganadores promocin Deportes Parti
Permiso de Gobernacin con nmeros S 0322 2000
Sorteo realizado el da 20 de junio del 2000
Nmero de extraccin Nmero de folio Nmero del ganador Premio
1
2
3
007950
015162
008032
Manuel Lpez Galicia
Mara Roy Martnez
Yolanda Uribe May
Final Eurocopa
Final Eurocopa
Final Eurocopa

B. Cuadros cronolgicos
Se usan para expresar las variaciones cronolgicas de poblacin, produccin, salarios,
etctera; el periodo que se cita en estos cuadros depende de lo que se desea comprar o
mostrar.
Problema
Elabora un cuadro cronolgico de ganancias de una fbrica de piezas de motor en el
quinquenio 1994-1998 que exprese:
a) Las variaciones de cada ao en tanto por ciento con base (con relacin) al ao anterior
b) Del ao 1998 con base (con relacin) al ao 1994.
Si las ganancias en miles de pesos fueron de 1994 = 575; 1995 = 644; 1996 = 730.94; 1997 =
672.47 1998 = 749.80.
Ganancias de la compaa
en miles de pesos durante el quinquenio 1994 - 1998
Ao Ganancia
% variacin
Base ao
anterior
Base ao
1994
1994
1995
1996
1997
1998
575
644
730.94
672.47
749.80
12
13.5
-8
11.49 30.4

Operaciones
Con la interpolacin polar




El 112% significa que la ganancia de 1995 fue de 12% ms de la obtenida en 1994 (que es el
100%)
Para las dems, razonamos en forma semejante.








575 : 100
574
::
x=
x=

x=
644 :: x
644 (100)
64 400
512
112%
644 : 100
644



113.4 - 100
::
x=
x=

x=
=
730.94 :: x
730.94 (100)
73 094
644
113.5%
13.5%
730.94 : 100
730.94



92 - 100
::
x=
x=

x=
=
672.47 :: x
672.47 (100)
67 247
730.94
92%
-8%








4. Grficos y pictogramas
La forma de presentar esta informacin por medio de ideogrficos depender del nivel cultural
del auditorio a que va dirigido, del lugar de exposicin: peridicos, revistas, televisin, escuelas,
etctera, que se deben analizar para escoger el mejor diseo; los mtodos ms usuales son:
Grficos de lneas, pictogramas o pictogrficos, grficos de barras y grficos circulares.
A. Grficos de lneas
Se usan para representar las distribuciones de frecuencias que estudiaremos
posteriormente en apartados en la parte correspondiente; y en series cronolgicas.
Los grficos son una representacin estadstica de utilidad para dar a conocer una idea
global sobre un programa en que se aplican procedimientos estadsticos, los datos que
proporcionan son aproximados y por ello se debe ser cuidadoso en su elaboracin. Si
en los grficos se dibujan simultneamente varios diagramas, la vista del usuario tiene
dificultad para identificarlos, aunque stos se hayan diferenciado con colores o por
diferente tipo de trazado.
Adems, la cantidad de informacin que proporciona un grfico no es tan completa y
extensa como la de un cuadro que tiene varias columnas que se leen por separado.

Al trazar un grfico de lneas (diagramas lineales) se tomarn en consideracin los conceptos
siguientes:

- La curva debe trazarse mas gruesa que las coordenadas para que resalte.
- La unidad de medida que se utilice debe destacarse claramente (no necesariamente
de un centmetro).
- La longitud se seleccionar de modo que la grfica resulte balanceada.
- En notas al pie se citarn conceptos aclaratorios de la curva.
- El cero de la escala vertical siempre debe colocarse.
- De ser posible se cita la fuente de informacin.
- Se localizan por las coordenadas correspondientes los puntos de inters, y se unen por
segmentos de rectas, formndose as una poligonal que es el diagrama de la serie
cronolgica.
- Es necesario tener cuidado con la escala de los ejes, pues es posible manejarlos en
forma engaosa, como se puede apreciar en el siguiente problema.


672.47 : 100
672.47



111.49 - 100
::
x=
x=

x=
=
749.80 :: x
749.80 (100)
74 980
672.47
111.49%
11.49%
575 : 100
575



130.4 - 100
::
x=
x=

x=
=
749.80 :: x
749.80 (100)
74 980
575
130.4%
30.4%
Problema
Una compaa industrial trata de vender acciones y su departamento de contabilidad presenta
dos grficas sobre su produccin en el periodo de 1994 1998. Decide cul de las dos grficas
presenta los datos con ms veracidad.










Es la ms veraz
Las dos grficas presentan hechos reales, pero se crearon en los diagramas dos imgenes
diferentes para un mismo suceso estadstico alterando los valores del eje vertical y la unidad
de la medida en la horizontal.
Problema
Consulta de un peridico de circulacin nacional y observa el ndice UV del da que t decidas.
El ndice UV se refiere al dao que los rayos ultravioleta pueden hacer a un humano.
Cuando el ndice UV est por encima de 9, los rayos UV-B son extremadamente fuertes y la
piel sufrir quemaduras en menos de 15 minutos. Los periodos de quemadura de la piel por
exposicin al Sol estn calculados con base en una piel clara no bronceada; el lapso de tiempo
sera un poco ms prolongado para aquellos con la piel ms oscura.
Tiempo Exposicin al Sol Calificacin
mas de 9 min
De 7 9
De 4 7
De 0 4
menos de 15 min
20 min
20 min
ms de una hora
Extremo 50
Alto
Moderado
Bajo


Problema
Se cita a continuacin una grfica que seala la tendencia alcista de las tasas de inters
internacionales. Qu concluyes?

Ah permanecer, excepto que en fecha prxima sea necesario encarecer el dinero para bajar
el consumo, y as evitar presiones inflacionarias.
B. Pictogramas
Un pictograma es la representacin de datos estadsticos con smbolos que por su forma
sugieren la naturaleza del dato, se utiliza para expresar comparaciones que atraigan la
atencin general, cualquiera que sea el nivel cultural del lector, su representacin no sirve para
anlisis estadsticos y nicamente permite obtener conclusiones vlidas muy generales.
Al hacer la representacin con un pictograma se debe utilizar figuras del mismo tamao, las
aproximaciones se hacen con fraccin de la figura, mitad y hasta cuartos, y la cantidad que
representa cada figura se indica con claridad en el encabezado.


Problema
Con motivo del reciente Censo Nacional de Poblacin la informacin oficial preliminar del
INEGI, seala: habitamos la republica Mexicana una poblacin de 97.4 millones de habitantes
de los cuales 47.4 millones son hombres y 50 millones son mujeres; de todos stos, 24.64
millones es poblacin rural, 72.76 millones urbana y dentro de la urbana el 17.79 millones
corresponde a la zona urbana del Valle de Mxico.
Agrega que la tasa de crecimiento anual fue: en los aos 1980 1990 el 2.4%; en el
quinquenio 1990 1995 el 2.1% y de 1995 2000 disminuy a 1.6%; por la tasa de
crecimiento ocupamos el sexto lugar en el mundo.
Que en el ao de 1980 ramos 88.8 millones, en 1990 subimos a 81.2 y en 2000 alcanzamos
la de 97.4, ocupando as el onceavo lugar en el mundo.
El crecimiento absoluto por estados es en millones de habitantes: Estado de Mxico 3.27;
Jalisco 1.02; Puebla 0.94; Baja California 0.83; Nuevo Len 0.73; los otros con 9.31.
Los ms poblados en millones de habitantes son: Estado de Mxico con 13.08; Distrito Federal
8.59; Veracruz 6.90; Jalisco 6.32 y Puebla con 5.07.
Representa grficamente esta informacin.

a) Poblacin en la republica Mexicana: 97.4 millones de habitantes

b) Distribuido as:
Aument la poblacin de 1990 al 2000, en:
1980
1990
2000
ramos 66.8
81.3
97.4

Del aumento de 97.4 81.3 = 16.1 se repartieron as:
Estado de Mxico
Jalisco
Puebla
Baja California
Nuevo Len
Otros Estados
3.27
1.02
0.94
0.83
0.73
9.31

Estados ms poblados (millones de habitantes)
Estado de Mxico
Distrito Federal
Veracruz
Jalisco
Puebla
13.08
8.59
6.90
6.32
5.07

Crecimiento: Disminuy
1980 1990 2.4%
1990 1995 2.1%
1995 2000 1.6%



5. Grficos de barras


Los grficos de barras proporcionan ms informacin y permiten una apreciacin estadstica
mejor que los pictogramas con sus figuras ms llamativas. Se utilizan para datos nominales,
variables cardinales y variables ordinales, Para su elaboracin se tomar en cuenta lo
siguiente:
En el grfico se evitar que las barras resulten muy anchas o excesivamente altas; se dejar
un espacio entre las barras que no sea inferior a la mitad del ancho de ellas; si el grfico
incluye muchas barras, es mejor sustituirlo con un diagrama lineal

Problema

Una fuente de trabajo y entrada de divisas extranjeras al pas, es la venta de la bebida tequila
en los mercados de Japn, Alemania, Estados Unidos y otros. La demanda aumenta y la
materia prima del agave, escasea cada vez ms, por ello los industriales del ramo han
decidido plantar los prximos 6 aos 263 millones de hijuelos de agave para evitar la escasez.

As en el presente ao y el prximo de 35 mil en cada uno; en el 2002, 37 mil y en cada uno de
los restantes 39 mil.

Expresa esta solucin con un grfico de barras.


Podemos Concluir:
Con base en los nacimientos entre 1980 1990 de 2.4%, en la actualidad la demanda
de estos jvenes es alta en las escuelas de enseanza media superior y superior; en cambio,
por los nacidos entre 1995 2000, apenas grupos de 20 a 25 alumnos.


Estas barras tambin se pueden disponer en forma horizontal.

Problema

El siguiente grfico de barras expresa las ventas en las tiendas de autoservicio y
departamentales en el mes de diciembre de 1990 y los de enero a abril del 2000, inclusive.
Qu se puede concluir?









Cuando el consumo aumenta y las personas empezamos a gastar en cosas innecesarias,
superfluas y no ahorramos, las autoridades econmicas, a fin de evitar presiones inflacionarias,
reducen el circulante con un corto.
Conclusin:
Hay mucho dinero circulante que no corresponde a nuestra capacidad de produccin
6. Grficos circulares

Se usan para presentaciones grficas de distribuciones porcentuales, y si se quiere utilizarlas
en secuencias cronolgicas es necesario dibujar crculos iguales, uno por cada ao, sealando
en cada uno la correspondiente distribucin porcentual.

El crculo de 360tiene un rea de 100%; un sector representa un tanto por ciento equivalente
a la razn entre el ngulo que forman los radios que limitan el sector y los 360que son el total
de grados de la circunferencia; en la forma siguiente:



Problema

El gas natural es uno de los principales insumos para la generacin de electricidad a travs de
las termoelctricas; de uso en la industria y en los hogares como combustible. La Secretara de
Energa en el ao de 1999 fue de 35 675.1 megawatts, generados as:

Termoelctrica
Hidroelctrica
Carboelctrica
Nucleoelctrica
Geotermoelctrica y
eoleoelctrica
21 351.1, el 59.8%
9662.8, el 27.1%
2600, el 7.3%
1309, el 3.7%

752.1, el 2.1%

De esas fuentes, la Carboelctrica resulta contaminante por el uso del carbn como
combustible.

Representar sta informacin en un grfico circular.



La industria elctrica demanda mucho gas natural.



A mayor industrializacin, que as se espera con los nuevos tratados econmicos, mayor
nmero de empleos, mayor demanda de energa elctrica y encarecimiento del gas natural,
industrial y domstico.

Procura que en tu casa, de ser posible, se instale un aparato que capte la energa solar; en
pases como Japn, Israel y Estados Unidos lo usan con xito y disponen de pocos meses en
que hay Sol; hay estados como el de Morelos, Zacatecas y otros muchos en los que el 90%
de das en el ao son con Sol


1.1 Poblacin y muestra aleatoria

Poblacin
Poblacin; la investigacin estadstica es la operacin que se refiere a la recopilacin de
informacin sobre una poblacin o colectivo de individuos u objetos que tienen una
caracterstica comn.

Muestra aleatoria
Es una muestra sacada de una poblacin de unidades, de manera que todo elemento de la
poblacin tenga la misma probabilidad de seleccin y que las unidades diferentes se
seleccionen independientemente.
1.2 Obtener datos estadsticos

Datos; sealamientos del elemento de la poblacin que origina la informacin, puede ser: una
industria, hogar, una persona, etc. pero en todo caso, la unidad debe ser en su definicin
medible y fcilmente identificable.

Organizacin de datos
Cualitativos: Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero
(no se pueden hacer operaciones algebraicas con ellos).
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)
Ordinales: Si sus valores se pueden ordenar
Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor
Arrojan respuesta categrica.
Miden cualidades
Cuantitativos: Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con
ellos)
Discretas: Si toma valores enteros
Nmero de hijos, Nmero de cigarrillos, Nmero de cumpleaos
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Altura, Presin intraocular, Dosis de medicamento administrado, edad
Producen respuestas numricas.
Miden cantidades
Tipos de datos cuantitativos
Discretos:
Si el nmero de posibles valores que puede tomar es contable (nmero naturales).
Generalmente resultan de un proceso de conteo
Continuos:
Si sus posibles valores estn en el continuo (nmeros reales).
Generalmente resultan de un proceso de medicin
Manejo de los datos
a) Citar qu se investiga, como se debe realizar, cuando se llevara a cabo y el lugar de la
investigacin que es el donde.

b) La recoleccin de la informacin incluye, ordenarla, eliminar posibles errores y analizarla,
aplicando los mtodos y normas estadsticas.

c) La publicacin de la informacin ya sea para uso propio o ajeno.

Presentacin de la informacin.

Una vez obtenida la informacin resultante de una investigacin estadstica, que puede
haberse efectuado, por ejemplo, en medicina, para estudiar el comportamiento de enfermos,
sujetos a un tratamiento especfico: Se escoge la forma de organizarla para su anlisis o
publicacin puede ser en:
- Histogramas
- Ojivas
- Polgonos de frecuencias
- Pictogramas
- Grficas de barras o circulares


1.3 Medidas de tendencia central

En los captulos anteriores, nos referimos a la clasificacin, ordenacin y presentacin de datos
estadsticos, limitando el anlisis de la informacin a la interpretacin porcentual de las
distribuciones de frecuencia.
El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales
pueda recaer la representacin de toda la informacin.
Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de la
informacin, son de gran importancia en el manejo de las tcnicas estadsticas, sin embargo,
su interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la
representatividad de ellas est asociada con el grado de concentracin de la informacin.
Las principales medidas de tendencia central son:
- Media aritmtica.
- Mediana
- Moda.

Media Aritmtica
Cotidiana e inconscientemente estamos utilizando la media aritmtica. Cuando por ejemplo,
decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no
aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que contiene un
paquete sino que es el resultado de la observacin, es decir, dicho sujeto puede consumir 18,
un da; 19 otro; 20, 21, 22; pero segn nuestro criterio, el nmero de unidades estar alrededor
de 20.
Matemticamente, la media o promedio (tambin llamada media aritmtica) formaliza el
concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del
recorrido de la variable segn la cantidad de valores obtenidos.
Se expresa


La media aritmtica se define como la suma de los valores observados dividida entre el nmero
de observaciones.
Por lo que se vio la mayor densidad de frecuencia est en la parte central de las grficas, de
ah el nombre de medidas de tendencia central que se da a la media aritmtica, la mediana y a
la moda.
Las medidas de posicin son aquellos valores numricos que nos permiten o bien dar alguna
medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la
cantidad de datos en partes iguales.
La media
Donde
n: es el nmero de observaciones
x: el valor de cada observacin
x : es la media aritmtica, media o x barra
La media es la nica de las medidas de tendencia central que puede intervenir en operaciones
algebraicas.
Ese valor tiene varias propiedades importantes:
1) Si x es una de las variables, su desviacin respecto a x es la diferencia x x . La
suma de estas diferencias es cero. ( )

=
=
n
i
i
x x
1
0
En toda distribucin, la suma de las desviaciones de cada uno de los valores de la
variable respecto a la media es cero.
2) Si se toman una cantidad cualquiera de conjuntos de valores, cada uno con su
respectiva media, la media del conjunto general es igual a la suma de cada una de las
medias de los diferentes conjuntos.

3) Es posible hallar la media de un conjunto de valores de una variable a partir de tomar la
distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la
variable)

4) Si a un conjunto de observaciones de una variable se le realiza una operacin
matemtica usando un valor constante, entonces la media del nuevo grupo de valores
as obtenidos es igual a la aplicacin de la misma operacin matemtica usando ese
valor constante sobre la media original.

Media para datos sin agrupar
Dado un conjunto de observaciones
n
x x x ,...., ,
2 1
la media se representa mediante x y se
obtiene dividiendo la suma de todos los datos por el nmero de ellos, es decir:


Problema

Hallar la media aritmtica de los siguientes valores: 5, 7, 8, 10, 15.



Problema
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes: 18 Martes: 21 Mircoles: 22 Jueves: 21 Viernes: 20 Sbado: 19 Domingo: 19
Entonces la media aritmtica es.
n
x
n
x x x
x
n
i
i
n

=
=
+ + +
=
1 2 1

20
7
19 19 20 21 22 21 18
7
1
=
+ + + + + +
=

= i
i
x
El fumador consume en promedio 20 cigarrillos diarios.
Ejercicios
1. Si las notas de un alumno en las distintas asignaturas de un curso durante una evaluacin
fueron: 7; 5; 6,5; 3,7; 5, 6,2. Hallar la nota media de la evaluacin.

2. La media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos son: 8, 12, 13, 5
y 9, hallar el elemento que falta.

Mediana y Moda
La mediana y la moda son medidas de tendencia central que por sus propiedades destacan los
valores individuales de un colectivo.
A. Mediana
La mediana se define como el valor que divide un conjunto de datos previamente
ordenados de menos a mayor y es el punto intermedio entre ellos dos.
Si el nmero N de datos es impar, entonces hay un nmero intermedio; por ejemplo, si se
tienen los datos 3, 5, 7, 9, 11 el nmero 7 es el nmero intermedio.
Si el nmero N de datos es par, entonces hay dos datos intermedios; por ejemplo, la media
de los valores 8, 10, 16, 19, 23, 25, hay dos valores centrales que son 16 y 19, el valor
equidistante entre ellos es la mediana:
5 . 17
2
35
2
19 16
= =
+
es la mediana
B. Moda

En un conjunto de datos de una distribucin de frecuencias, la moda es el valor que ocurre
con mayor frecuencia; por ejemplo, en los valores 1, 2, 5, 5, 6, 6, 6, 6, 7, 8, 9, 9, 9, la moda
es 6.
Media Ponderada
Por lo general, en Estadstica, los datos se nos presentan agrupados mediante una distribucin
de frecuencias que hace que no todos los elementos de la serie tengan el mismo peso
especfico, y eso influye a la hora de calcular la media, por eso se llama media ponderada.
Se define como la suma de los productos de cada elemento de la serie por su frecuencia
respectiva, dividida por el nmero de elementos de la serie.
Si
n
x x x ,...., ,
2 1
son las cantidades
n
c c c ,...., ,
2 1
las respectivas ponderaciones, entonces la
media ponderada x es:

=
=
=
+ + +
+ + +
=
n
i
i
n
i
n
n n
c
x c
c c c
x c x c x c
x
1
1
1 1
2 1
2 2 1 1


donde
i
c es la frecuencia o nmero de veces que se repite un valor. Tambin
i
c puede ser la
ponderacin de cada valor x
i
.
Para calcular la media aritmtica de una distribucin de frecuencias agrupadas consideramos
que a todos los valores que hay dentro de un intervalo de clase se les considera de un mismo
valor igual al de la marca de clase y las frecuencias son las ponderadas de los valores en
correspondencia con las marcas de clase y la suma de las frecuencias es el total de veces que
se tiene registro.



Problema
Durante el mes de octubre de 1981 los salarios recibidos por un obrero fueron:

Salario en
pesos
Frecuencia en
das
200.000 5
220.000 15
300.000 4

Hallar el salario medio durante ese mes.
( ) ( ) ( )
24
4 000 . 300 15 000 . 220 5 000 . 200 + +
= x
Problema

El nmero de das necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de
iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media,
mediana, moda, varianza y desviacin tpica.

La media: suma de todos los valores de una variable dividida entre el nmero total de datos de
los que se dispone:


La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra
mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones sea par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de
estos dos valores nos dar a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60





1.4 Medidas de Dispersin
La media aritmtica, mediana y la moda describen el comportamiento de los datos en una
distribucin de frecuencias.
Estas medidas no proporcionan informacin sobre la forma en que estn distribuidos o
dispersos los valores con relacin a la tendencia central, y poco informan sobre un dato
especfico con relacin a los otros en la distribucin de frecuencias.
Estudiaremos la desviacin media, la varianza y la desviacin estndar, que miden la
dispersin.
Rango
En toda distribucin hay valores extremos, uno menor y otro mayor, la diferencia entre estos
valores se llama rango y en el estn distribuidos todos los dems valores. Es una medida de
dispersin y es la ms fcil de obtener.
Desviacin media
La desviacin media y la varianza son medidas de dispersin que tienen relacin con la media
aritmtica, ya que las tres tienen propiedades algebraicas que les permiten su uso en
relaciones matemticas que son la base estructural de los anlisis estadsticos; por sus
propiedades algebraicos son las medidas de dispersin de ms frecuente aplicacin y de
mayor importancia.
La media aritmtica de los valores absolutos de las desviaciones de cada uno de los valores de
la variable, respecto a la media aritmtica, es la desviacin media.
Para datos no agrupados, se tiene

|


Y para datos agrupados


Probl ema
Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

| | | | | | | | | | | | | | | |


Varianza
La varianza (

) es la media aritmtica de los cuadrados de desviaciones respecto a la media


aritmtica.
La varianza (

) para datos no agrupados se obtiene con:


Para datos agrupados


Problema
Calcula la desviacin media DM y la varianza de la serie de nmeros 9,10,2,7,12,6,5,8,12,10

| | | | | | | | | | | | | | | | | | | |

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )


Desviacin estndar o tpica
La desviacin estndar o desviacin tpica, es la raz cuadrada de la varianza.
Desviacin estndar


La desviacin estndar es la ms importante de todas las medidas de dispersin ya que incluye
ms o menos el 68% de los trminos de una distribucin normal; adems, por sus propiedades
algebraicas se utiliza con facilidad en el anlisis estadstico.


1.5 Tablas de distribucin de frecuencia
Elaborar Tabla de distribucin de frecuencias
Una vez reunidos los datos de un colectivo para obtener a partir de ellos conclusiones, es
necesario organizarlos en una tabla de distribuciones de frecuencia.
La cual nos representa una funcin, se clasifican en tres tipos, segn el nmero de
observaciones y al nmero de valores distintos que toma la variable.
Distribucin de tipo uno.
Son aquellas que constan de un reducido nmero de observaciones y en consecuencia de un
reducido nmero de valores distintos que toma la variable.
Distribuciones de tipo dos.
Son las que el nmero de observaciones es grande, pero el nmero de valores distintos que
toma la variable son pequeo; en este tipo, se distribuyen o agrupan los resultados disponibles
en dos columnas, una para los valores distintos que toma la variable y otra para la frecuencia
de cada uno de ellos.
Problema.
Para determinar el grado de nutricin de 20 alumnos de secundaria se toma la altura en cm de
cada uno de ellos y son:
128 146 136 136 152
140 124 134 142 138
136 120 130 136 132
136 134 142 132 144

Para facilitar su interpretacin se ordenan de forma ascendente o descendente, a este proceso
se le llama orden de rango.
120 132 136 142
124 134 136 142
128 134 136 144
130 136 138 146
132 136 140 152

Para proceder a organizar los datos se usa la tabla de frecuencia que expresa el nmero de
casos de cada categora.

Distribucin de tipo tres
Si el nmero de observaciones y el nmero de valores que toma la variable son grandes para
su manejo se agrupan las observaciones en intervalos
i i
L L
1
, eligiendo entre ellos una
amplitud fija o variable, mismos que se anotarn en una primera columna; en la segunda, se
tabularn os valores para facilitar su conteo; y en la tercera, se pondr el nmero de frecuencia
f correspondiente a cada intervalo.
Los grupos o categoras que incluye
i i
L L
1
se llaman intervalos de clase; los valores
1 i
L
son los lmites inferiores y
i
L los lmites superiores de estos intervalos.
Clases
i i
L L
1

Tabulaciones Frecuencias
(f)
i
f
1 0
L L
2 1
L L


k k
L L
1


k
f
f
f
2
1


La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se repite la
variable
i
x ; as
1
f , es el nmero de veces que se repite la observacin
1
x ,
2
f el nmero
de veces que se repite la observacin
2
x , etc.

Problema
En un examen departamental de fsica se examinaron 50 alumnos con los siguientes
resultados;
87 66 73 68 48
37 76 85 74 65
93 77 66 83 68
49 57 38 69 78
89 96 78 97 74
76 68 63 70 81
64 83 67 61 90
77 88 74 75 80
71 73 61 57 72
80 77 85 80 89

Expresamos la tabla de frecuencia, con los datos en forma ascendente.

37 65 72 77 85
38 66 73 77 85
48 66 73 78 87
49 67 74 78 88
57 68 74 80 89
57 68 74 80 89
61 68 75 80 90
61 69 76 81 93
63 70 76 83 96
64 71 77 83 97


Tabla de frecuencias
Clases
i i
L L
1

Tabulaciones Frecuencias (f)
i
f
35-39 II 2
40-44 0
45-49 II 2
50-54 0
55-59 II 2
60-64 IIII 4
65-69 IIIII II 8
70-74 IIIII III 8
75-79 IIIII III 8
80-84 IIIII I 6
85-89 IIIII II 6
90-94 II 2
95-100 II 2

Marca de clase.
Una vez hecho todo lo anterior y antes de aplicar a la informacin los mtodos estadsticos, es
necesario sustituir cada intervalo por un nmero, a este nmero se le llama marca de clase y
es el valor central de cada intervalo, es decir la media aritmtica de los lmites inferior y
superior, se obtiene as:
Marca de clase =
2
1 i i
i
L L
x
+
=



Tabla de frecuencias
Clases
i i
L L
1

Tabulaciones Marca de clase
Mc
i
x
Frecuencias (f)
i
f
1 0
L L
2 1
L L


k k
L L
1


k
x
x
x
2
1

k
f
f
f
2
1


Los datos obtenidos los anotamos en la tabla de frecuencias
Clases
i i
L L
1

Tabulaciones Marca de clase
mc
i
x
Frecuencias (f)
i
f
35-39 II 37 2
40-44 0 42 0
45-49 II 47 2
50-54 0 52 0
55-59 II 57 2
60-64 IIII 62 4
65-69 IIIII II 67 7
70-74 IIIII III 72 8
75-79 IIIII III 77 8
80-84 IIIII I 82 6
85-89 IIIII II 87 7
90-94 II 92 2
95-99 II 97 2


Diagrama de frecuencia de puntos
El diagrama de frecuencia de puntos es una informacin grfica de cmo estn distribuidos los
datos sobre el rango (contradominio en el clculo).


Diagrama de barras
El diagrama de barras es la representacin grfica que se usa cuando se dispone de muchas
observaciones pero pocos valores de la variable (distribucin de tipo dos).
Se elabora sealando en el eje de las x (abscisas) de un sistema de ejes coordenados, los
valores de la variable, poniendo sobre ellas unas columnas a escala de las alturas igual a la
frecuencia de cada uno de los valores, medidos en el sentido del eje de las y (ordenadas).


Problema
Un grupo de 15 alumnos presenta examen extraordinario de qumica; un funcionario de la
escuela necesita saber cuntos alumnos obtuvieron calificacin inferior a 6 y cuntos entre 6 y
8.
Para resolver este tipo de problemas, ordenamos las calificaciones en una tabla de frecuencias
y contestamos preguntas como inferior o igual que y superior a. As:
x y
0 puntos 0
1 puntos 2
2 puntos 1
3 puntos 3
4 puntos 0
5 puntos 2
6 puntos 3
7 puntos 1
8 puntos 2
9 puntos 1
10 puntos 0

De donde 8 alumnos obtuvieron una calificacin menor a 6, y 6 su calificacin est entre 6 y 8.
Histograma. Datos agrupados
El histograma es la grfica ms usual y se utiliza cuando el nmero de observaciones y el
nmero de valores que toma la variable son grandes (distribuciones de tipo tres).
Los histogramas son una forma de representacin de la frecuencias de clase por medio de
reas rectangulares (barras), pero son diferentes a los diagramas de barras cuyas alturas
miden el tamao de la variable y generalmente se dibujan separadas, dejando espacios entre
ellas; en cambio, en los histogramas las frecuencias quedan representadas por el rea de los
rectngulos, no por sus alturas, y las barras necesariamente se dibujan sin dejar espacios entre
ellas.

Histograma


Concepto de densidad
La densidad fsica es un concepto relativo que relaciona el volumen de un cuerpo con su masa.
En estadstica, por la densidad de frecuencia, se obtiene la frecuencia absoluta o nmero de
casos que hay dentro del intervalo de clase
En los histogramas, el eje vertical mide la densidad de frecuencias y el eje horizontal mide los
intervalos de clase. As:

Longitud de los ejes para expresar un histograma
El eje vertical debe ser tres cuartos de la longitud del eje horizontal, el cual se escoge de
acuerdo con la necesidad del problema.
Problema
Traza el histograma de la distribucin de frecuencia agrupadas siguientes:

0
5
10
15
20
25
30
Series1

Clases
i i
L L
1

Tabulaciones Frecuencias
(f)
i
f
35-39 II 2
40-44 0
45-49 II 2
50-54 0
55-59 II 2
60-64 IIII 4
65-69 IIIII II 7
70-74 IIIII III 8
75-79 IIIII III 8
80-84 IIIII I 6
85-89 IIIII II 7
90-94 II 2
95-100 II 2

Para trazar el histograma procedemos as:
Sobre el eje de las abscisas ponemos a escala los valores de la variable x (los puntajes), por
intervalos.
Se trazan perpendiculares sobre el eje horizontal de la longitud que sea necesaria

C1
F
r
e
q
u
e
n
c
y
100 90 80 70 60 50 40
10
8
6
4
2
0
Mean 73.46
StDev 13.31
N 50
Histogram of C1
Normal


Polgonos de frecuencia
El polgono de frecuencia se obtiene uniendo los puntos medios de los intervalos de clase del
histograma


Frecuencia acumulada: Ojivas
El cuadro siguiente expresa la distribucin de frecuencias agrupadas no acumulativas que se
elaboro
Clase Frecuencias
123.5-128.5
128.5-133.5
133.5-138.5
138.5-143.5
143.5-148.5
148.5-153.5
153.5-158.5
158.5-163.5
163.5-168.5
4
4
8
21
6
25
21
10
1
Total 100

La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
Problema
Con base en el cuadro anterior de distribucin de frecuencias agrupadas, obtener dos
cuadros; el de frecuencias acumuladas hacia abajo y otro de frecuencias acumuladas hacia
arriba, y trazar las ojivas correspondientes.
Cuadro A
Frecuencia acumulada de estaturas que expresa el nmero de alumnos que miden menos
de la estatura indicada.
Estatura Nm. De
alumnos
123.5
128.5
133.5
138.5
143.5
148.5
153.5
158.5
163.5
168.5
0
4
8
16
37
43
68
89
99
100



Cuadro B
Frecuencia acumulada de estaturas que expresa el nmero de alumnos que miden ms de la
estatura indicada.
Estatura Nm. De alumnos
123.5
128.5
133.5
138.5
143.5
148.5
153.5
158.5
163.5
168.5
100
96
92
84
63
57
32
11
1
0



Distribucin de frecuencias relativas
Poder organizar la informacin en una tabla de frecuencias, presentarla en cuadros, marcar los
intervalos de clase y hacer las grficas de frecuencias absolutas, permiten relacionar y
comprender los valores de un mismo colectivo.
Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamao de
la muestra.
La frecuencia relativa de una clase se obtiene en tanto por ciento, que es la nueva base, si
dividimos la frecuencia de la clase entre el nmero total de frecuencias y el resultado lo
multiplicamos por 100.
100
N
L
relativa Frecuencia =
Para facilitar el clculo de las frecuencias relativas de cada clase, se usa un factor de
correccin que resulta de dividir 100 por el nmero total de frecuencias.
N
Factor
100
=
Problema
Las autoridades de la secretaria de educacin pblica deciden que en otra escuela tambin se
tomen las estaturas en cm. De todos los alumnos, pero ahora, de los menores de 17 aos, para
fines nutricionales.
Elabora un cuadro de frecuencias agrupadas que incluya las frecuencias absolutas y las
relativas, estas ltimas en tanto por ciento.
Clase Frecuencias Relativas en %
123.5-128.5
128.5-133.5
133.5-138.5
138.5-143.5
143.5-148.5
148.5-153.5
153.5-158.5
158.5-163.5
163.5-168.5
168.5-173.5
2
3
8
20
9
8
30
23
15
4
1.638
2.457
6.552
16.380
7.371
6.552
24.570
18.837
12.285
3.276
Total 122 100.00

Factor de correccin
( ) ( ) 457 . 2 819 . 0 3 638 . 1 819 . 0 2 819 . 0
122
100
= = = = factor

Distribuciones porcentuales acumuladas
Los cuadros de frecuencia acumulada porcentuales se obtienen convirtiendo las frecuencias
acumuladas en frecuencias relativas o proporcionales de base 100.
Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamao
de la muestra.
Problema
En el cuadro siguiente la distribucin acumulativa de estaturas de un grupo de alumnos, que
expresa el nmero de ellos que midieron, menos de la estatura indicada, agrega la columna
correspondiente a las frecuencias relativas y traza la ojiva porcentual.
Estatura Frecuencia acumulada
Nm. De Alumnos Relativas en %
128.5
133.5
138.5
143.5
148.5
153.5
158.5
163.5
168.5
173.5
0
2
5
14
38
45
65
89
103
106
0.000
1.886
4.715
13.202
35.834
42.435
61.295
83.927
97.129
100.000

Factor de conversin 943 . 0
106
100
= = f actor
Se obtienen las frecuencias relativas:
( ) ( ) ( ) 715 . 4 943 . 0 5 886 . 1 943 . 0 2 00 . 0 943 . 0 0 = = =


Media para datos agrupados
Problema
Calcular la media aritmtica de la distribucin de frecuencias agrupadas de la tabla de
frecuencias.
Clases
i i
L L
1

Tabulaciones Marca de clase
mc
i
x
Frecuencias (f)
i
f
35-39 II 37 2
40-44 0 42 0
45-49 II 47 2
50-54 0 52 0
55-59 II 57 2
60-64 IIII 62 4
65-69 IIIII II 67 7
70-74 IIIII III 72 8
75-79 IIIII III 77 8
80-84 IIIII I 82 6
85-89 IIIII II 87 7
90-94 II 92 2
95-100 II 97.5 2

Se procede de la siguiente manera

Intervalos Marca x
Frecuencias (
i
f )
i i
x f
35-39 37 2 74
40-44 42 0 0
45-49 47 2 94
50-54 52 0 0
55-59 57 2 114
60-64 62 4 248
65-69 67 7 469
70-74 72 8 576
75-79 77 8 616
80-84 82 6 492
85-89 87 7 609
90-94 92 2 184
95-100 97.5 2 194

50 2 2 7 6 8 8 7 4 2 0 2 0 2
1
= + + + + + + + + + + + + =

=
n
i
i
f
3670 194 184 609 492 616 576 469 248 114 0 94 0 74
1
= + + + + + + + + + + + + =

=
n
i
i i
x f

4 . 73
50
3670
1
1
= = =

=
=
n
i
i
n
i
i i
f
x f
x

..\..\..\..\semestre enero 2012\1 media.xlsx

..\..\..\..\semestre enero 2012\2 desviacin media.xlsx


1.6 Calcular Cuantiles
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina
la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un
nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella,
se puede dividir la distribucin en cuatro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles,
cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la
distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma
una extensin de la mediana.
Para algunos valores u, se dan nombres particulares a los cuantiles, Q (u):
u Q(u)
0.5 Mediana
0.25, 0,75 Cuartiles
0.1,,0.99 Deciles
0.01,,0.99 Centiles

CUARTILES
A fin de conocer los intervalos dentro de los cuales quedan representados proporcionalmente
los trminos de una distribucin, se divide la distribucin de frecuencia en 4 partes iguales,
cada una contiene igual nmero de observaciones (el 25% del total).
Los puntos de separacin de los valores de X se llaman cuartiles.
El primer cuartil corresponde al 25% y se designa con

.
El segundo cuartil es

que representa el valor de 50% y coincide con la mediana.


El tercer cuartil es

representa el 75% de las observaciones que estn por debajo de l.


Clculo de cuartiles
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expr esi n


Problema
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.
x
i


0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100



Primer cuartil


Primera


Segundo cuartil


Primera


Tercer cuartil


Primera


Clculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se encuentra

, en l a t abl a de
l as f r ecuenci as acumul adas.


El lmite inferior de la clase donde se encuentra el cuartil, es

.
La suma de las frecuencias absolutas, es N.
La frecuencia acumulada anterior a la clase del cuartil, es


La amplitud de la clase, es

.
Problema
Calcular los cuartiles en el cuadro de frecuencias agrupadas, en donde se han registrado las
alturas de un grupo de alumnos.
Clase


50-60
60-70
70-80
80-90
90-100
100-110
110-120
8
10
16
14
10
5
2
8
18
34
48
58
63
65
65
Clculo del primer cuartil
()


()



Clculo del segundo cuartil
()


()



Clculo del tercer cuartil
()


()





Clase Frecuencias
121.5-126.5
126.5-131.5
131.5-136.5
136.5-141.5
141.5-146.5
146.5-151.5
151.5-156.5
156.5-161.5
161.5-166.5
2
3
8
23
27
20
16
3
2
Total

Dividimos el total N de las frecuencias acumuladas entre 4 y obtenemos el nmero de
observaciones que hay en el primer cuartil.


El primer cuartil cae en la clase , las tres primeras clases contienen 13 alumnos
(sumamos 2+3+8=13) para las 13 que faltan los calculamos por interpolacin lineal, as;
1.7 Grficos

1.8 Cajas y alambres
Diagramas de caja
Los diagramas de Caja-Bigotes son una presentacin visual que describe varias
caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los
datos, sobre un rectngulo, alineado horizontal o verticalmente.
Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1,
Q2 o mediana y Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin.

Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran
el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y
mximo de la variable. Las lneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre
dentro de este rango es marcado e identificado individualmente.
Problema
Distribucin de edades
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad
de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

Ordenar los datos
Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de Cuartiles
Q
1
, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N =
20 resulta que

; el primer cuartil es la media aritmtica de dicho valor y el siguiente:


Q
2
, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados. Como

; la
mediana es la media aritmtica de dicho valor y el siguiente:


Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En
nuestro caso, como

, resulta


Dibujar la Caja y los Bigotes

El bigote de la izquierda representa al colectivo de edades (

)

La primera parte de la caja a (Q
1
, Q
2
),

La segunda parte de la caja a (Q
2
, Q
3
)

El bigote de la derecha viene dado por (

)
Informacin del diagrama
Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
- La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que
las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa
que entre el 50% y el 75%.
- El bigote de la izquierda (

) es ms corto que el de la derecha; por ello el


25% de los ms jvenes estn ms concentrados que el 25% de los mayores.
- El rango

; es decir, el 50% de la poblacin est


comprendido en 14,5 aos.

1.9 Diagrama de Pareto

El nombre de Pareto fue dado por el Dr. Joseph Juran en honor
del economista italiano Wilfredo Pareto.
Wilfredo Pareto (Paris 1848 Turn 1923) economista italiano,
realiz un estudio sobre la riqueza y la pobreza. Descubri que el
20% de las personas controlaba el 80% de la riqueza en Italia.
Pareto observ muchas otras distribuciones similares en su
estudio.
A principios de los aos 50, el Dr. Joseph Juran descubri la
evidencia para la regla de "80-20" en una gran variedad de
situaciones. En particular, el fenmeno pareca existir sin
excepcin en problemas relacionados con la calidad. Una expresin comn de la regla 80/20
es que "el 80% de nuestro negocio proviene del 20% de nuestros clientes."
Por lo tanto, el Anlisis de Pareto es una tcnica que separa los "pocos vitales" de los "muchos
triviales". Una Grfica Pareto es utilizada para separar grficamente los aspectos significativos
de un problema desde los triviales de manera que un equipo sepa dnde dirigir sus esfuerzos
para mejorar.
Definicin
El Diagrama de Pareto consiste en un grfico de barras similar al histograma que se conjuga
con una ojiva o curva de tipo creciente y que representa en forma decreciente el grado de
importancia o peso que tienen los diferentes factores que afectan a un proceso, operacin o
resultado.

..\..\..\..\semestre enero 2012\diagrama de pareto.xlsx






Al identificar y analizar un producto o servicio para mejorar la calidad.
Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma
sistemtica.
Al analizar las diferentes agrupaciones de datos (ejemplo: por producto, por segmento del
mercado, rea geogrfica, etc.)
Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
Al evaluar los resultados de los cambios efectuados a un proceso (antes y despus).
Cuando los datos puedan agruparse en categoras.
En casos tpicos, los pocos vitales (pasos, servicios, tems, problemas, causas) son
responsables por la mayor parte en el impacto negativo sobre la calidad.
Un equipo puede utilizar la Grfica de Pareto para varios propsitos durante un proyecto para
lograr mejoras.
- Para identificar oportunidades para mejorar
- Para identificar un producto o servicio para el anlisis de mejora de la calidad
- Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma
sistemtica
- Para analizar las diferentes agrupaciones de datos
- Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
- Para evaluar los resultados de los cambios efectuados a un proceso comparando sucesivos
diagramas obtenidos en momentos diferentes, (antes y despus)
- Cuando los datos puedan clasificarse en categoras
- Cuando el rango de cada categora es importante
Los propsitos generales del diagrama de Pareto

- Analizar las causas
- Estudiar los resultados
- Planear una mejora continua
- Como fotos de "antes y despus" para demostrar que progreso se ha logrado





Unidad II - Probabilidad
2.4 Permutaciones y combinaciones
2.5 Diagramas de rbol
2.6 Axiomas de probabilidad
2.7 Independencia y probabilidad condicional
2.8 Teorema de Bayes.

2.1 Probabilidad de eventos

Experimento Aleatorio
Definicin
Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita
siempre de la misma manera
2.2 Espacio muestral

Definicin
El conjunto de todos los posibles resultados de un experimento aleatorio recibe el nombre de
espacio muestral del experimento. El espacio muestral se denomina con la letra S.
Espacio Muestral discreto
Definicin
Un espacio muestral es discreto si est formado por un conjunto finito (o infinito contable) de
resultados.
Suceso
Definicin
Un suceso es un subconjunto del espacio muestral de un experimento aleatorio.
()

Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los
siguientes son eventos:

1. Obtener un nmero primo A = {2, 3, 5}
2. Obtener un nmero primo y par B = {2}
3. Obtener un nmero mayor o igual a 5 C = {5, 6}
Problema
Describa el espacio muestral que sea apropiado para un experimento en el que tiramos un par
de dados, uno rojo y uno verde.
El espacio muestral que proporciona la mayor informacin consiste en los 36 puntos dados por,
*( ) +
Donde
x representa el nmero en que cay el dado rojo
y representa el nmero en que cay el dado verde

Problema
Con respecto al ejercicio anterior describa el suceso A en que el nmero de puntos obtenidos
sea divisible entre 3.
Entre 1, 2, 3, 4, 5, 6, slo 3 y 6 son divisibles entre 3
*+
Problema
Describa un suceso B en que el nmero de puntos obtenidos con el par de dados sea 7.
Entre los posibles resultados, slo () () () () () () dan un total de 7.
Por lo que el conjunto solucin es *() () () () () () +


2.3 Ocurrencia de eventos

En funcin de la relacin de probabilidad que se pueda establecer entre los sucesos, estos se
clasifican en:
Mutuamente excluyentes o disjuntos.
Son aquellos sucesos en los que en un mismo experimento aleatorio no es posible que ocurran
simultneamente. La interseccin de los conjuntos que los representan es el conjunto vaco.
| = B A
No excluyentes entre s.
Son aquellos sucesos en los que en un mismo experimento aleatorio, en los que la posibilidad
de que ocurra uno de ellos no importa que el otro suceso ocurra; es decir pueden ocurrir
conjuntamente. La interseccin de los conjuntos que los representan, es el conjunto diferente
del vaco. | = B A
Problema
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a la vez, esto
quiere decir que estos eventos son excluyentes.

Problema
Experimento aleatorio: se analiza en un momento dado el estado de salud de los habitantes de
una comunidad.
Consideremos los sucesos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una enfermedad crnica
D: La persona tiene gripa
E: La persona es hipertensa
Diga que sucede para los sucesos anteriores si se pide;
B A

D B

C B

D A
Problema
Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60 aos de
edad de una comunidad.
Consideremos los siguientes sucesos.
A. Una persona tiene menos de 40 aos
B. La persona es ingeniero
C. La persona es analfabeta
D. La persona tiene 40 aos o ms
Que sucede con los sucesos si se pide;
D A C B D B B A


2.4 Permutaciones y combinaciones

( )( )( ) ()()




Permutacin y combinacin Qu diferencia hay?
Normalmente usamos la palabra "combinacin" descuidadamente, sin pensar en si el
orden de las cosas es importante. En otras palabras:
"Mi ensalada de frutas es una combinacin de manzanas, uvas y bananas": no
importa en qu orden pusimos las frutas, podra ser "bananas, uvas y manzanas" o
"uvas, manzanas y bananas", es la misma ensalada.
"La combinacin de la cerradura es 472": ahora s importa el orden. "724" no
funcionara, ni "247". Tiene que ser exactamente 4-7-2.
As que en matemticas usamos un lenguaje ms preciso:
- Si el orden no importa, es una combinacin
- Si el orden s importa es una permutacin
Permutaciones
Un arreglo de cosas en un orden dado; constituye una permutacin. En una
permutacin el orden es importante.
Problema

Se tienen 6 mquinas de escribir y 6 personas para operar las mquinas, de cuntas
maneras se pueden asignar las personas a las mquinas?

6 P6 = 6 ! = 6 5 4 3 2 1 = 720

Problema

De cuntas maneras se pueden ordenar las letras A, B, C tomndolas todas a la
vez?

Solucin: 3 P3 = 3 2 1 = 6 [ABC, BCA, CAB, BAC, CBA, ACB]

Problema

Cinco ciudades se comunican entre s, segn el diagrama



De cuntas formas es posible:
a) Viajar desde A hasta E
b) Hacer el viaje redondo desde A hasta E


2.5 Diagramas de rbol
Un diagrama de rbol es una herramienta que se utiliza para determinar todos los
posibles resultados de un experimento aleatorio. En el clculo de la probabilidad se
requiere conocer el nmero de elementos que forman parte del espacio muestral,
estos se pueden determinar con la construccin del diagrama de rbol.
El diagrama de rbol es una representacin grfica de los posibles resultados del
experimento, el cual consta una serie de pasos, donde cada uno de los pasos tiene un
nmero finito de maneras de ser llevado a cabo. Se utiliza en los problemas de conteo
y probabilidad.
Para la construccin de un diagrama en rbol se partir poniendo una rama para cada
una de las posibilidades, acompaada de su probabilidad. Cada una de estas ramas
se conoce como rama de primera generacin.
En el final de cada rama de primera generacin se constituye a su vez, un nudo del
cual parten nuevas ramas conocidas como ramas de segunda generacin, segn las
posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final).
Hay que tener en cuenta que la construccin de un rbol no depende de tener el
mismo nmero de ramas de segunda generacin que salen de cada rama de primera
generacin y que la suma de probabilidades de las ramas de cada nudo ha de dar 1.
Existe un principio sencillo de los diagramas de rbol que hace que stos sean mucho
ms tiles para los clculos rpidos de probabilidad: multiplicamos las probabilidades
si se trata de ramas adyacentes (contiguas), o bien las sumamos si se trata de ramas
separadas que emergen de un mismo punto.

A continuacin ejemplificaremos cada uno de estos conceptos.

Experimento aleatorio

Lanzar dos monedas al aire. Para conocer el dominio utiliza un diagrama de rbol.




Entonces el dominio es: {(AA), (AS), (SA), (SS)}.

Este conjunto se llama espacio muestral y se designa con S, que es, adems, el
dominio de la funcin aleatoria; a cada uno de sus resultados se les llama eventos.
Ahora determinaremos el espacio muestral de cada uno de los siguientes
experimentos aleatorios:

1. Lanzar tres monedas al aire.
2. Lanzar un dado y dos monedas.
3. Las respuestas de un examen, si las preguntas son las siguientes:
( ) Descubrimiento de Amrica. 1. 1810
( ) Conquista de Mxico. 2. 1492
( ) Declaracin de Independencia. 3. 1521
4. Los hijos varones y mujeres de una familia de tres hijos.
5. Los lugares que ocupan tres personas en una fila de supermercado.

Ayudados por un diagrama de rbol, los resultados de las preguntas anteriores seran:
1. Lanzar tres monedas al aire son:


2. Dos monedas y un dado con seis nmeros

3. Resultados de un examen.

4. Hijos varones y mujeres de una familia de tres hijos: varones H, mujeres M.

5. Lugares que ocupan tres personas en una fila de supermercado. Llamaremos
P1 = primera persona, P2 = segunda persona y P3 = tercera persona.




2.6 Axiomas de probabilidad

Probabilidades: Definiciones y Conceptos
Las Probabilidades pertenecen a la rama de la matemtica que estudia ciertos
experimentos llamados aleatorios, o sea regidos por el azar, en que se conocen todos
los resultados posibles, pero no es posible tener certeza de cul ser en particular el
resultado del experimento. Por ejemplo, experimentos aleatorios cotidianos son el
lanzamiento de una moneda, el lanzamiento de un dado, extraccin de una carta de un
mazo de naipes. Ms adelante se ver que debemos distinguir entre los conceptos de
probabilidades matemticas o clsicas de las probabilidades experimentales o
estadsticas.

Postulado 1
La probabilidad de un suceso es un nmero real no negativo; esto es () para
cualquier subconjunto A de S.
- Las probabilidades son los valores de una funcin de conjunto, tambin
conocida como medida de probabilidad, esta funcin asigna nmeros reales a
los diferentes subconjuntos de un espacio muestral S
Postulado 2
()
Postulado 3
Si

es una secuencia finita o infinita de sucesos mutuamente excluyentes


de S, entonces ( ) ( ) ( ) ( ) ... ...
3 2 1 3 2 1
+ + + = A P A P A P A A A P
- Los postulados de probabilidad se aplican slo cuando el espacio muestral S
es discreto
Problema
Un experimento tiene cuatro resultados posibles A, B, C, D que son ME. Explique por
qu las siguientes asignaciones de probabilidad no estn permitidas.

( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
120
46
120
27
120
45
120
9
)
20 . 0 45 . 0 63 . 0 12 . 0 )
= = = =
= = = =
D P C P B P A P b
D P C P B P A P a

Teorema
Si A es un suceso en un espacio muestral discreto S, entonces P(A) es igual a la suma
de las probabilidades de los resultados posibles que abarcan A.
Problema
Si lanzamos dos veces una moneda balanceada, Cul es la probabilidad de sacar al
menos una cara?
C- Cara
H-Cruz
El espacio muestral es { } HH HC CH CC S , , , =
Como la moneda esta balanceada, estos resultados son igualmente posibles y
asignamos a cada muestra la probabilidad de
4
1
. Denotemos con A al evento que
sacamos al menos una cara, obtenemos { } HC CH CC S , , =
( ) ( ) ( ) ( )
4
3
4
1
4
1
4
1
=
+ + =
+ + = HC P CH P CC P A P

Problema

Un dado est arreglado de manera que cada nmero impar tiene el doble de
probabilidad de ocurrir que un nmero par. Encuentre P (G), donde G es el suceso que
un nmero mayor que 3 ocurra en un slo tiro del dado.
Espacio muestral { } 6 , 5 , 4 , 3 , 2 , 1 = S
Si asignamos la probabilidad W a cada nmero par y la probabilidad 2W a cada impar,
se tiene
9
4
) (
9
1
9
2
9
1
) (
9
1
1 9 1 2 2 2
= + + =
= = = + + + + +
G P G P y
W W W W W W W W

Teorema
Si un experimento puede resultar en cualquiera de N resultados diferentes igualmente
probables y si n de estos resultados juntos constituye el evento A, entonces la
probabilidad del evento A es ( )
N
n
A P = .
Problema
Cul es la probabilidad de que una persona de 25 aos de edad llegue a sobrevivir
hasta que tenga 40 aos, si de acuerdo a una tabla de mortalidad de cada 93 745
persona de 25 aos de edad, 87 426 llegan a los 40 aos.
( )
% 25 . 93
9325 . 0
93745
87426
25
40
) (
745 93 426 87
=
=
= =
=
= =
aos de personas de total
aos los a lleguen que Personas
A P
N
n
A P
N n

Problema
En una caja hay 25 tornillos en buen estado y 80 defectuosos. Cul es la probabilidad
de sacar de la caja al azar un tornillo en buen estado?
( )
% 80 . 23
2380 . 0
105
25
80 25
25
) (
105 25 80 25
=
=
=
+
= =
=
= + = =
caja la en tornillos de total
estado buen en tornillos de Num
A P
N
n
A P
N n

Algunas reglas de probabilidad.
Teorema
Si
c
A y A son eventos complementarios en un espacio muestral S, entonces
( ) ( ) A P A P
c
=1




Teorema
( ) 0 = | P Para cualquier espacio muestral S.
Teorema
Si A y B son eventos en un espacio muestral S y ( ) ( ) B P A P entonces B A s c ,
Teorema
( ) 1 0 s s A P Para cualquier evento A.
Ley aditiva de la probabilidad
Teorema
Si A y B son dos eventos en el espacio muestral S, entonces, la probabilidad de que
un suceso u otro ocurran se calcula con las relaciones siguientes.
( ) ( ) ( )
( ) ( ) ( ) ( ) B A P B P A P B A P
B P A P B A P
+ =
+ =


a) Cuando dos sucesos son ME, se tiene que | = B A se utiliza la primera
relacin
b) Cuando dos sucesos no son ME, se tiene que | = B A se utiliza la segunda
relacin
c) ( ) B A P Se resta para rectificar el doble conteo

Demostracin. Si asignamos las probabilidades a, b, c a los eventos ME
( ) ( ) ( ) B A y B A B A
c c
, de acuerdo al diagrama de Venn.
( )
( )
( )
( ) ( )
( ) ) ( ) (
0
B A P B P A P
a a c b a
a a c b a
c b a
c b a B A P
+ + =
+ + + =
+ + + =
+ + + =
+ + =

Probl ema
En una zona de la ciudad, las probabilidades son 0.86, 0.35 y 0.29 de que una familia
tenga aparato de televisin a color, un aparato de televisin en blanco y negro, o
ambas clases de aparatos respectivamente. Cul es la probabilidad de que una
familia posea cualquiera de las dos o ambas clases de aparatos?
A. Familia con televisin a color
B. Familia con televisin blanco y negro
( ) ( ) ( )
( ) ( ) ( ) ( )
( )
( ) 92 . 0
29 . 0 35 . 0 86 . 0
29 . 0 35 . 0 86 . 0
=
+ =
+ =
= = =
B A P
B A P
B A P B P A P B A P
B A P B P A P


Probl ema
Para participar en la rifa de un reloj, los alumnos de primer ao compraron 18 boletos;
los de segundo grado 12 boletos. Si son 50 boletos en total, Cul es la probabilidad
de que un alumno de primero o segundo gane la rifa?
A. Gana un alumno de primer grado
B. Gana un alumno de segundo grado
El suceso que nos interesa es B A E = , los sucesos A Y B son ME, es decir
( ) | = B A
( )
( ) % 60
6 . 0
5
3
50
30
50
12
50
18
) ( ) (
=
= = = + = + =
B A P
B P A P B A P

Ley multiplicativa de la probabilidad
La probabilidad de que ocurran simultneamente dos sucesos A y B, se obtiene con el
producto de sus probabilidades.
( ) ) ( ) ( B P A P B A P =
Para aplicar la ley multiplicativa es necesario revisar si los sucesos involucrados son
independientes o dependientes.
a) Sucesos independientes
Son aquellos en los que la ocurrencia de uno, no afecta la probabilidad de que
ocurra el otro.
b) Sucesos dependientes
Son aquellos en los que la ocurrencia de uno afecta la probabilidad de que
ocurra el otro.
Probl ema
Experimento aleatorio: se lanza un dado y se saca una canica de una bolsa; en la
bolsa hay tres canicas, una roja, una azul y una verde. Cul es la probabilidad de que
salga un nmero primo y una canica azul?
Como cualquier resultado que aparezca en el dado no afecta la probabilidad del color
de la canica, ni viceversa, se dice que los sucesos son independientes.
A: { } 5 , 3 , 2 , 1
B: Sale canica azul
( )
( ) % 22
22 . 0
9
2
18
4
3
1
6
4
) ( ) (
=
= = =
|
.
|

\
|
|
.
|

\
|
= =
B A P
B P A P B A P

Probl ema
De un grupo escolar se van a elegir por sorteo a 3 alumnos que se hagan cargo de
una ceremonia escolar: en el grupo hay 24 hombres y 12 mujeres, Cul es la
probabilidad de que el grupo de representantes est conformado de las maneras
siguientes?
A. Sean tres hombres
B. Sean dos hombres y una mujer
C. Sean dos mujeres y un hombre
D. Sean tres mujeres
a) Sean tres hombres
( ) A P Se tienen que dar los siguientes sucesos
1
A : El primer alumno seleccionado sea hombre
( )
36
24
1
= A P
2
A : El segundo alumno seleccionado sea hombre
( )
35
23
2
= A P
Los sucesos
2 1
A y A son dependientes
3
A : El tercer alumno seleccionado sea hombre
( )
34
22
3
= A P
( ) ( ) ( ) ( ) ( )
% 34 . 28 ) (
2834 . 0
42840
12144
34
22
35
23
36
24
) (
3 2 1 3 2 1
=
= =
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
=
= =
A P
A P
A P A P A P A A A P A P

b) Sean dos hombres y una mujer
1
B : Sale el primer hombre
36
24
) (
1
= B P
2
B : Sale el segundo hombre
35
23
) (
2
= B P
3
B : Sale la mujer
34
12
) (
3
= B P
% 46 . 15 ) (
1546 . 0
42840
6624
34
12
35
25
36
24
) ( ) ( ) ( ) (
3 2 1
=
= =
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
= =
B P
B P B P B P B P

Probl ema
Cerca de cierta salida de una carretera, las probabilidades son 0.23 y 0.24, de que un
camin parado en un retn tendr frenos defectuosos o neumticos muy gastados.
Tambin, la probabilidad es 0.38 de que un camin parado en el retn tendr frenos
defectuosos y/o neumticos muy gastados. Cul es la probabilidad de que un camin
parado en este retn tendr los frenos defectuosos as como los neumticos muy
gastados?
B: Suceso que un camin parado tendr frenos defectuosos
T: Suceso que tendr neumticos muy gastados
38 . 0 ) ( 24 . 0 ) ( 23 . 0 ) ( = = = T B P T P B P
% 9
09 0 38 . 0 24 . 0 23 0
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
=
= + =
+ =
+ = +
+ =
T B P T P B P T B P
T P B P T B P T B P
T B P T P B P T B P


Probl ema
Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta ciudad en la
tabla siguiente se resumen sus hallazgos.
Buen servicio de garanta Mal servicio de garanta
En operacin por
10 aos o ms

16

4

20
En operacin
Menos de 10 aos

10

20

30
Total 26 24 50

a) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
b) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
a)
% 52 ) (
52 . 0
50
26
50
10 16
) (
=
= =
+
= =
G P
N
n
G P

b) Para la segunda pregunta, buscamos el espacio muestral reducido que consta
de la primera lnea de la tabla, esto es, 16+4 =20 agencias. De estas, 16
proporcionan buen servicio de garanta y se tiene

% 52 ) (
80 . 0
20
16
) / (
=
= =
G P
T G P


2.7 Independencia y probabilidad condicional

Probabilidad condicional
La probabilidad condicional se aplica en el clculo de un evento cuando se sabe que
ha ocurrido otro con el cual se relacionan; es decir, los sucesos son dependientes.

Sean A y B dos sucesos dependientes tales que ()

Para expresar la probabilidad de B dado que A ha ocurrido, se expresa ( )

De la misma manera si ()

Para sealar la probabilidad de A dado que B ha ocurrido, se expresa ()

Vamos a considerar ( )

La probabilidad de ( ) se realiza en un mismo espacio muestral, que es un
subconjunto del espacio muestral original S. Es decir, el espacio muestral original S se
ve modificado por que ya ocurri el suceso A.

Definicin
Si A y B son dos sucesos cualquiera en un espacio muestral S y 0 ) ( = A P , la
probabilidad condicional de B dado A es
) (
) (
) / (
A P
B A P
A B P

=

Problema
Como un ejemplo adicional, supngase que el espacio muestral es la poblacin de
adultos en un pequeo pueblo que han satisfecho los requisitos para graduarse en la
escuela. Se deben clasificar de acuerdo con su sexo y si trabajan o no actualmente.

Empleado desempleado Total
Hombre
Mujer
460
140
40
260
500
400
total 600 300 900
Se selecciona al azar a uno de estos individuos para que realice un viaje a travs de
todo el pas, con la intencin de promocionar las ventajas que se derivan del
establecimiento de las nuevas industrias en los pequeos poblados. El inters se
muestra en los siguientes eventos:
M: se escoge a un hombre.
E: el elegido tiene un empleo.
Al utilizar el espacio muestral reducido E, se encuentra que
()


Sea () el nmero de elementos de cualquier conjunto A. Utilizando esta notacin se
puede escribir S
()
( )
()

( )()
()()

( )
()

Donde ( ) Y () se obtiene del espacio muestra original S. para verificar este
resultado, ntese que.
()


( )


En consecuencia
()


Igual que antes.
Problema
La probabilidad de que un vuelo de programacin regular despegue a tiempo es
() La que llegue a tiempo es ( ) encuentre la probabilidad de
que un avin en el cual se:
a) llegue a tiempo dado que despego a tiempo,
b) despegue a tiempo dado que llego a tiempo.
Solucin:
a) La probabilidad de que el avin llegue a la hora prevista dado que parti a
tiempo es:
()
( )
()




b) La probabilidad de que salga a la hora prevista dado que llego a tiempo es:

()
( )
()


En el experimento de lanzar un dado se observa que
()

()
Esto es () . Ahora considrese otro en el cual se
sacan dos cartas en sucesin, con remplazo, de un paquete normal, los eventos se
definen como:
A: la primera carta es un as,
B: la segunda carta es de espadas.
Puesto que se remplaza la primera carta, el espacio muestral para ambas cartas
consisten de 52, en el que hay 4 ases y 13 espadas. Por lo tanto
()


Y
()


Esto es, () ()cuando esto es cierto, se dice que los eventos A y B son
independientes.
La nocin de probabilidad condicional permite revaluar la idea de probabilidad de un
evento de mayor informacin; es decir cuando se sabe que otro evento ha ocurrido. La
probabilidad () es una actualizacin de la ()con la base en la certeza de que
se ha presentado el evento B. en el problema del avin fue importante conocer la
probabilidad de que el vuelo llegara a tiempo. Supngase que sabe que se vuelo no
parti a tiempo, con estos datos adicionales, lo ms pertinente es calcular (
) esto es, la probabilidad de que llegue a tiempo, dado que no llego a tiempo. En
munchas situaciones las conclusiones que se sacan de las observaciones de la
probabilidad condicional ms importantes cambian totalmente la situacin. En este
ejemplo, el clculo de P()lo da
P()
()
()


Eventos independientes
Cuando A y B son dos eventos con probabilidades positivas, hemos visto que en
general la probabilidad condicional del evento B dado el evento A es diferente de la
probabilidad del evento B. Sin embargo, cuando se tiene la igualdad: () ()
es de especial importancia porque esto quiere decir que el evento B no depende o es
independiente del evento A. Es decir, no importa si ocurri o no el evento A puesto que
la ocurrencia o no de A no afecta al evento B.
Si B es independiente de A, entonces A es independiente de B.
A y B son independientes si y slo si () ()()
Si A y B son cualesquier eventos en el espacio muestral S, tales que
() ()
decimos que A es independiente de B si y solo si
( ) () e implica que ( ) ()
Si B es independiente de A, entonces A es independiente de B.
A y B son independientes si y slo si ( ) ()()
Problema
Lanzar al aire dos veces una moneda son eventos independientes por que el resultado
del primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o
sello, en el segundo lanzamiento.
Problema
A=evento que un estudiante tenga una tarjeta de crdito de un banco
B=evento que un estudiante tenga una tarjeta de crdito para viajes
() () ( )
Son los eventos A y B independientes?
()() ()()
Si, son independientes



2.8 Teorema de Bayes

















Proyecto

1. Cuntas palabras con cdigo de 3 letras se pueden formar usando las 8
primeras letras del alfabeto.
a) Si ninguna letra puede repetirse
b) Si se pueden repetir las letras

2. Las 5 finalistas del concurso Seorita Universo son los representantes de
Argentina, Blgica, Estados Unidos, Japn y Noruega. De cuantas maneras
pueden elegir los jueces;
a) La ganadora y la primera suplente
b) La ganadora, la primera y la segunda suplente?

3. Cuntas permutaciones diferentes hay de la palabra statistics?, Cuntas de
ellas comienzan y terminan con la letra s?

4. La seorita Jones tiene cuatro faldas, siete blusas y tres suteres. En cuntas
formas puede escoger dos de las faldas, tres de las blusas y uno de los
suteres para llevar en un viaje?

5. Cuntos grupos de 5 o ms personas pueden formarse con 10 personas?

6. Una placa consiste en dos letras seguidas por cuatro dgitos, cuntas placas
pueden elaborar s;
a) Se pueden repetir las letras y los dgitos
b) Si no se pueden repetir?

Calcula la permutacin o combinacin correspondiente a cada una de las
situaciones que se dan a continuacin.

7. Se elige un comit de 5 personas en el que debe haber 2 arquitectos de 7 que
hay en la compaa y 3 ingenieros de los 10 que trabajan ah. De cuntas
formas diferentes han de escoger el comit?

8. De cuantas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 15 socios?

9. Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60
aos de edad de una comunidad.
Consideremos los siguientes sucesos.
E. Una persona tiene menos de 40 aos
F. La persona es ingeniero
G. La persona es analfabeta
H. La persona tiene 40 aos o ms
Que sucede con los sucesos si se pide;
D A C B D B B A
10. En un grupo de 200 estudiantes (80 mujeres y 60 hombres), 140 en total son
alumnos de tiempo completo y otro de 60, (40 son mujeres y 20 hombres) son
de tiempo parcial.
Experimento: un estudiante es seleccionado al azar, para esto se definen tres
sucesos.

A. Estudiante seleccionado de tiempo completo
B. Estudiante seleccionado de tiempo parcial
C. Estudiante seleccionado sea hombre

a) Defina si los sucesos A y B son mutuamente excluyentes o no.
b) Defina si los sucesos A y C son mutuamente excluyentes o no.

11. Se analiza en un momento dedo el estado de salud de los habitantes de la
ciudad.
Consideremos los casos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una
enfermedad crnica.
D: La persona tiene gripa
E: La persona es hipertensa
a) Los sucesos A y B son mutuamente excluyentes o no?
b) Si | = E C son mutuamente excluyentes o no?
c) Qu sucede con los sucesos B y C?
d) Cmo son los sucesos C y D?

12. Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta
ciudad en la tabla siguiente se resumen sus hallazgos.
Buen servicio de
garanta
Mal servicio de
garanta

En operacin
por
10 aos o
ms

16

4

20
En operacin
Menos de 10

10

20

30
aos
Total 26 24 50

c) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
d) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de
garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
13. Una urna contiene 75 bolas blancas marcadas, 25 bolas sin marcar, 175 bolas
negras marcadas y 125 bolas negras sin marcar.
a) Se saca una bola al azar. Calcular la probabilidad que sea blanca.
b) Se extrae una bola y est marcada. Calcular la probabilidad que sea
blanca.

14. En un grupo de 200 estudiantes universitarios 138 estn inscritos en un curso
de Ingls 115 en uno de mecnica y 91 en ambos, Cuntos de estos
estudiantes no estn inscritos en uno u otro curso?
- Trace un diagrama de Venn apropiado y anote los nmeros asociados con
las diversas regiones.

15. Un taller sabe que por trmino medio acuden, por la maana 3 automviles con
problemas elctricos, 8 con problemas mecnicos y 3 con problemas de
chapas y por la tarde 2 con problemas elctricos, 3 con problemas mecnicos y
1 con problemas de chapa.
Elctricos Mecnicos Chapa Total
Maana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20

Calcular, P(A), P(B), P(C) , as como la probabilidad de que acuda por la
maana dado que tiene problemas elctricos
Aplique el concepto de probabilidad para resolver el siguiente problema.

16. En una caja hay 100 canicas azules y 300 rojas. Cul es la probabilidad de
sacar al azar una canica azul? Exprese el resultado en tanto por ciento.

17. En la oficina del subdirector de la escuela hay 12 calculadoras, algunas son
manuales (M), otras elctricas (E); adems algunas de ellas son nuevas (N) y
otras usadas (U), como se expresa en el cuadro siguiente:

M E
N 2 3 5
U 2 5 7
4 8 12

a) Una persona entra a la oficina y escoge aleatoriamente una calculadora y
observa que es manual. Cul es la probabilidad de que sea nueva?
b) Si la persona escoge una al azar una elctrica, Cul es la probabilidad de que
sea usada?

18. Empleando diagramas de Venn y con la definicin de conjuntos encontrar el
conjunto solucin para cada uno de los casos que se dan a continuacin.

{ } { } { } { } 7 , 6 , 5 , 2 , 7 , 5 , 3 , 1 , 5 , 4 , 3 , 2 , 1 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = = = = c B A U .
A C d B C c B C b A B a ) ) ) )

19. Una orquesta de 30 msicos deciden formar dos grupos musicales, uno de
clsica y otro de msica de saln, el primero con 12 personas y el segundo con
16; si tres de los msicos pertenecen a los dos grupos Cuntos miembros de
la orquesta original decidieron no pertenecer a ningn grupo?

20. De un lote de 15 camisas, 4 son defectuosas, si se toman al azar 3 artculos
del lote, uno tras otro; calcular la probabilidad de que los tres se encuentren en
buen estado.

21. En una escuela de enseanza media superior, el 20% de los alumnos
reprobaron matemticas, el 25% fsica y el 5% ambas materias. Si se
selecciona un alumno al azar:
a) Si reprob fsica. Cul es la probabilidad que haya reprobado
matemticas?
b) Si reprob matemticas. Cules la probabilidad de que haya reprobado
fsica?
c) Cul es la probabilidad de que haya reprobado fsica o matemticas?
22. En una escuela de enseanza media superior de la poblacin de alumnos el
40% mide ms de 1.50 m, el 25% pesa ms de 52 kilos y el 15% mide ms de
1.50 m y ms de 52 kilos. Si se escoge al azar un alumno:
a) Si mide ms de 1.50 m, calcular la probabilidad de que tambin pese ms
de 52 kg.
Proyecto
1. De cuntas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 15 socios?

2. Cinco ciudades se comunican entre s, segn el diagrama


De cuntas formas es posible:
c) Viajar desde A hasta E
d) Hacer el viaje redondo desde A hasta E

3. Use el principio multiplicativo para solucionar el problema siguiente.

De una ciudad A hasta B hay 4 caminos; a su vez, la ciudad B a la C hay 6
caminos, si todos los caminos son diferentes, de cuantas formas es posible:


De cuntas formas es posible:

e) Viajar de A hasta C pasando por B
f) Hacer el viaje redondo desde A hasta C pasando por B
g) Hacer el viaje redondo desde A hasta C pasando por B pero si utilizar el
mismo camino ms de una vez

4. Cuntos nmeros de 3 dgitos se pueden formar con 1, 2, 3 ,4,5 si;

a) No se permiten repeticiones
b) Se permiten repeticiones

5. Con los dgitos del 0 al 9 se quieren formar nmeros de cuatro cifras, sin repetir
cifras en ninguno de los nmeros formados.

a) Cuntos se pueden formar?
b) Cuntos nmeros son impares?
c) Cuntos nmeros son divisibles entre 2?
d) Cuntos nmeros son mayores o iguales que 3000?
6. Calcular cuntos nmeros enteros de tres cifras se pueden obtener con los
dgitos 2, 3, 5, 7 en los casos siguientes.

a) No se permite la repeticin de las cifras en ninguno de los nmeros
b) Se permite la repeticin de las cifras en los nmeros

7. Cuntas diferentes quintas de baloncesto pueden formarse con 7 jugadores
disponibles para jugar cualquier posicin?

8. Un alumno de preparatoria tiene 7 libros de fsica y 5 de matemticas. Calcular
de cuantas maneras posibles se pueden ordenar 3 libros de fsica y 2 de
matemticas en un librero.

9. De cuntas maneras diferentes se puede formar un comit con un presidente,
un secretario y un tesorero, en un club que consta de 20 socios?

10. Cuntas representaciones diferentes sern posibles formar, si se desea que
consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?,
s esta representacin puede ser formada de entre 25 miembros del sindicato
de una pequea empresa.

11. Obtenga todas las seales posibles que se pueden disear con seis
banderines, dos de los cuales son rojos, tres son verdes y uno morado.

12. De cuntas maneras es posible plantar en una lnea divisoria de un terreno
dos nogales, cuatro manzanos y tres ciruelos?

13. Si un equipo de ftbol soccer femenil participa en 12 juegos en una temporada,
cuntas maneras hay de que entre esos doce juegos en que participa,
obtenga 7 victorias, 3 empates y 2 juegos perdidos?

14. Si se cuenta con 14 alumnos que desean colaborar en una campaa pro
limpieza del Tec, cuantos grupos de limpieza podrn formarse si se desea que
consten de;

a) 5 alumnos cada uno de ellos
b) Si entre los 14 alumnos hay 8 mujeres, cuntos de los grupos de limpieza
tendrn a 3 mujeres?
c) Cuntos de los grupos de limpieza contarn con 4 hombres por lo menos?

15. En una escuela de enseanza media superior los alumnos de matemticas
presentan un examen que incluye 16 problemas para resolver 8 de ellos.
Cuntos exmenes diferentes de 8 problemas se pueden escoger de esos
16?

16. Un inspector de control de calidad desea seleccionar una parte para la
inspeccin de cada una de cuatro recipientes diferentes que contienen 4, 3, 5 y
4 partes, respectivamente. De cuntas maneras diferentes se pueden escoger
las cuatro partes?

17. De cuntas maneras diferentes se pueden contestar todas las preguntas de
una prueba de falso o verdadero que consta de 20 preguntas?

18. De cuntas maneras diferentes se pueden presentar al pblico los cinco
jugadores titulares de un equipo de baloncesto?

19. El nmero de permutaciones de las cuatro letras a, b, c y d es 24, pero cul
es el nmero de permutaciones si slo tomamos dos de las cuatro letras o,
como usualmente se expresa, si tomamos las cuatro letras dos a la vez?

20. De cuntas maneras puede una seccin local de la sociedad Americana de
Qumica programar a tres oradores para tres reuniones diferentes, si todos
ellos estn disponibles en cualquiera de cinco fechas posibles?

21. De cuntas maneras se pueden colgar, una junto a las otras, dos pinturas de
Monet, tres pinturas de Renoir y dos pinturas de Degas en la pared de un
museo sin hacer distincin entre las pinturas de los mismos artistas?

22. De cuntas maneras diferentes puede una persona, que rene datos para
una organizacin de investigacin de mercados, seleccionar tres de 20 familias
que viven en un complejo departamental dado?

23. En cuntas formas diferentes pueden seis lanzamientos de una moneda,
producir dos caras y cuatro cruces?

24. Cuntos comits diferentes, de dos qumicos y un fsico, se pueden formar
con los cuatro qumicos y los tres fsicos del profesorado de una pequea
universidad?






Unidad III - Funciones de distribucin de probabilidades

3.1 Variables aleatorias y su clasificacin
Introduccin
Poblacin, elementos y caracteres.
Poblacin
Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de
personas o cosas.
Elementos
Las personas o cosas que forman parte de la poblacin se denominan elementos. En
sentido estadstico un elemento puede ser algo con existencia real, como un automvil
o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo de
tiempo.
Poblacin finita: cuando el nmero de elementos que la forman es finito, por
ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito,
o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se
realizase un estudio sobre los productos que hay en el mercado. Hay tantos y
de tantas calidades que esta poblacin podra considerarse infinita.
Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los
elementos de la poblacin sino que se realiza sobre un subconjunto de la misma. Este
subconjunto puede ser una muestra, cuando se toman un determinado nmero de
elementos de la poblacin, sin que en principio tengan nada en comn; o una
subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la
poblacin que comparten una determinada caracterstica, por ejemplo de los alumnos
del centro la subpoblacin formada por los alumnos de 3 ESO, o la subpoblacin de
los varones.
Experimento
Es cualquier proceso de observacin o medicin
Espacio muestral
Es el conjunto de todos los resultados de un experimento, y se le representa con la
letra S.
Ejemplo

Supongamos el lanzar un dado al aire y observaremos los resultados siguientes

S = {1, 2, 3, 4, 5, 6} S = {6}

Ejemplo

En el lanzamiento de dos monedas tenemos

S = {HH, HT, TH, TT} S = {4}

Ejemplo
Describa un espacio muestral que sea apropiado para un experimento en el que tiramos un par
de dados, uno rojo y uno verde.
El espacio muestral que proporciona la mayor informacin consiste en los 36 puntos dados por
*( )| +
Donde x representa el nmero en que cay el dado rojo y y representa el nmero del dado
verde
Variables Aleatorias y Distribuciones de Probabilidad

Concepto de variable aleatoria discreta.







Sea E el espacio muestral de una experiencia, una variable aleatoria x, es una aplicacin que a
cada elemento de E (suceso elemental) le hace corresponder un nmero real.
El recorrido de una variable aleatoria es el conjunto de valores que puede tomar.
Recorrido *

+
Se dice que una variable aleatoria es discreta si su recorrido es finito.
Ejemplo:

Los valores enteros que satisfacen esta desigualdad donde x es la variable, son
que son los valores particulares que puede tomar la x.
Variables Aleatorias
E
x
R

Definicin
Es aquella que asume diferentes valores a consecuencia de los resultados de un
experimento aleatorio.
Si S es un espacio muestral con una medida de probabilidad y X es una funcin de
valor real definida sobre los elementos de S, entonces X se llama variable aleatoria.
Variable aleatoria discreta
Una variable aleatoria discreta slo puede asumir cierto nmero de valores
especficos. Si hay 100 empleados en una empresa, la cantidad de los ausentes el
lunes, slo puede ser 0, 1, 2, 3,, 100. En general, una variable aleatoria discreta x es
el resultado de contar algo. As por definicin:
Definicin
Variable aleatoria discreta (x). Se le denomina variable porque puede tomar diferentes
valores, aleatoria, porque el valor tomado es totalmente al azar y discreta porque solo
puede tomar valores enteros y un nmero finito de ellos.
Ejemplo
El nmero de hijos de una familia puede ser 0, 1, 2, 3, pero no 2.5 o 3.48 por lo que
es una variable aleatoria discreta.
x Variable que nos define el nmero de burbujas por envase de vidrio que son
generadas en un proceso dado.
x0, 1, 2, 3, 4, 5, etc., etc. burbujas por envase
xVariable que nos define el nmero de productos defectuosos en un lote de 25
productos.
x0, 1, 2, 3,....,25 productos defectuosos en el lote
xVariable que nos define el nmero de alumnos aprobados en la materia de
probabilidad en un grupo de 40 alumnos.
x0, 1, 2, 3, 4, 5,....,40 alumnos aprobados en probabilidad

Definicin; Variable aleatoria continua
Variable aleatoria continua (x). Se le denomina variable porque puede tomar diferentes
valores, aleatoria, porque los valores que toma son totalmente al azar y continua
porque puede tomar tanto valores enteros como fraccionarios y un nmero infinito de
ellos.
Es cuando entre dos valores consecutivos puede haber infinitos valores.
Ejemplo
La altura H de una persona, que puede ser 1.70, 1.751, 1.80, 1.85, dependiendo de
la precisin de la medida, es una variable aleatoria continua.
Ejemplos:

xVariable que nos define el dimetro de un engrane en pulgadas
x5.0, 4.99, 4.98, 5.0, 5.01, 5.0, 4.96

xVariable que nos define la longitud de un cable o circuito utilizado en un arns de
auto
x20.5 cm, 20.1, 20.0, 19.8, 20,6, 20.0, 20.0

xVariable que nos define la concentracin en gramos de plata de algunas muestras
de mineral
x14.8gramos, 12.0, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8


3.2 Distribuciones de probabilidad discretas
Si se organiza un conjunto de valores posibles de una variable aleatoria discreta, en
una distribucin de probabilidades, por lgica la distribucin se llama distribucin de
probabilidad discreta.
Definicin
En teora de la probabilidad y estadstica, la distribucin de probabilidad de una variable
aleatoria es una funcin que asigna a cada suceso definido sobre la variable aleatoria la
probabilidad de que dicho suceso ocurra. La distribucin de probabilidad est definida sobre el
conjunto de todos los eventos rango de valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los nmeros reales, la distribucin
de probabilidad est completamente especificada por la funcin de distribucin, cuyo valor
en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x.
Si X es una variable aleatoria discreta, la funcin dada por () ( ) para cada x dentro
del intervalo X, se llama distribucin de probabilidad de X en el intervalo ,-.
Teorema
Una funcin puede servir como la distribucin de probabilidad de una variable aleatoria discreta
x si y slo si sus valores f(x), satisfacen las condiciones
a) () , para cada valor dentro de su dominio
b) ()

, donde la suma se extiende sobre todos los valores dentro de su dominio


Ejemplo
Lanzamos dos dados al aire. Nos interesa encontrar las probabilidades tal como la probabilidad
de que la suma de los puntos en los dados es menor que 8.
El espacio muestral del experimento, son treinta y seis posibles resultados es;

Dado Rojo
Dado Verde 1 2 3 4 5 6
1 1,1 1,2 1,3 1,4 1,5 1,6
2 2,1 2,2 2,3 2,4 2,5 2,6
3 3,1 3,2 3,3 3,4 3,5 3,6
4 4,1 4,2 4,3 4,4 4,5 4,6
5 5,1 5,2 5,3 5,4 5,5 5,6
6 6,1 6,2 6,3 6,4 6,5 6,6

El suceso de que la suma es ocho contiene 5 resultados *() () () () ()+; por lo
tanto la probabilidad deseadas es

.

Las probabilidades asociadas con todos los valores posibles de x son

x P(X=x)
2


10


11


12



x 2 3 4 5 6 7 8 9 10 11 12
F(x)



Expresamos estos valores de probabilidad por medio de una funcin tal que sus valores f(x),
sean iguales a ( ) para cada x dentro del rango de la variable aleatoria X.
Para el total de obtenido con un par de dados se pueden lograr estos resultados mediante una
frmula.
()
| |


Sustituimos los valores de x
()
| |

||


()
| |

||


()
| |

||



Todos los valores concuerdan con los mostrados en la tabla.
Ejemplo
Encuentre una frmula para la distribucin de probabilidad del nmero total de caras obtenidas
en cuatro lanzamientos de una moneda balanceada.
Con base al ejercicio ya visto, y en base a las probabilidades en la tabla, encontramos que
( )

( )

( )

( )

( )


Al observar que los numeradores de estas cinco fracciones 1, 4, 6, 4, 1 son los coeficientes
binomiales .

/ .

/ .

/ .

/ .

/, encontramos que la frmula para la distribucin de


probabilidad se puede escribir como
()
(


Problema
Verificar si la funcin dada por ()

puede servir como una


distribucin de probabilidad de una variable aleatoria discreta.
()



()

()

()

()



Con estos resultados se satisface que ()

Comprobamos que se cumple la segunda condicin ()



() () () () ()


Por lo tanto se cumple con la segunda condicin.

Ejercicio

Verificar si la funcin ()

es una funcin de probabilidad.



Los valores de la funcin se pueden representar en una grfica como lo es el histograma.

3.3 Distribucin de probabilidad Hipergeomtrica
Definicin
En teora de la probabilidad la distribucin Hipergeomtrica es una distribucin discreta
relacionada con muestreos aleatorios y sin remplazo.

Para obtener una frmula anloga a la de la distribucin Binomial que sea vlida para el
muestreo sin remplazo, en cuyo caso los ensayos no son independientes.

Consideremos un conjunto de N elementos, de los cuales M se consideran como xitos y los
otros como fracasos.

En la binomial, estamos interesados en la probabilidad de obtener x xitos en n ensayos.
Ahora escogemos sin remplazo n de los N elementos contenidos en el conjunto.

Hay (

) maneras de escoger x de los M xitos y (

) maneras de escoger de los


fracasos, por lo tanto (

)(

) maneras de escoger x xitos de los fracasos.



Puesto que hay (

) maneras de escoger n de los N elementos en el conjunto y suponemos que


no todos son posibles, se tiene que la probabilidad de x xitos en n ensayos es:

(

)(

)
(

)

Definicin

Una variable aleatoria x tiene una distribucin Hipergeomtrica y se conoce como variable
aleatoria Hipergeomtrica si y slo si su distribucin de probabilidad est dada por

( )
(

)(

)
(

)


As que para el muestreo sin remplazo el nmero de xitos en n ensayos es una variable aleatoria que
tiene una distribucin Hipergeomtrica con los parmetros n, N y M.

Definicin

La media y la varianza de la distribucin Hipergeomtrica son

()()

()


Problema
En una jaula hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar calcular
posibilidad de que 3 de ellos hablen chino (caracterstica deseada).
N = 50 n = 10 M = 20 X= 3
( )
(

)(

)
(

)(

)
(

)(

)
(

)



Problema
De los 20 hombres y 18 mujeres del saln el 50% rprobo el examen de estadstica, si
tomamos 10 alumnos al azar encontrar la probabilidad.
A) 4 alumnos reprobados
B) 3 mujeres reprobadas
A) N = 38 n = 10 M = 19 x = 4

B) N = 38 n = 10 M = 9 x = 3


Problema
En un vagn de ferrocarril que acarrea a 60 reses el 20% de ellas estn
enfermas de vaca loca, si extraemos con propsito de inspeccin sanitaria una
muestra del 10% de las reses calcula la probabilidad de que hayan 2 vacas
con dicha enfermedad?
N = 60 n = 6 M = 12 x = 2

Problema
De 60 aspirantes a la UNIVERSIDAD 40 son de Baja California, si seleccionamos 20 aspirantes
al azar calcular la probabilidad de que 10 sean de Baja California?
N = 60 n = 20 M = 12 x = 10

3.4 Distribucin de probabilidad Poisson
Se considera a la distribucin de Poisson como una forma lmite de la Binomial
cuando n tiende a infinito, pero se considera por s misma como un proceso de
Poisson.
Ambas distribuciones son discretas, se aplican en procesos fsicos, entre otros:
En la industria en el control de calidad, en biologa para determinar el nmero
de bacterias, en fsica para calcular las partculas emitidas por una sustancia
radiactiva, en las instituciones de seguros para verificar el nmero de seguros.
Caractersticas
a. En el proceso que se estudia se identifica una unidad que puede ser: de
tiempo, de espacio, de volumen, etc.
b. Se contabiliza un cierto nmero de ocurrencias eventuales para cada
unidad
c. La VA puede tomar una cantidad infinita pero numerable de valores
, 3 , 2 , 1 , 0 = x
Ejemplo:
1) Unidad: un litro
Ocurrencia eventual: haya bacterias de clera.
Proceso con distribucin de Poisson: calcular el nmero de bacterias por
litro que hay en el agua de una delegacin poltica.
2) Unidad: 24 horas
Ocurrencia eventual: robo de vehculos.
Proceso con distribucin de Poisson: calcular el nmero de vehculos
robados cada 24 horas.
3) Unidad: una pgina de un libro
Ocurrencia eventual: erratas detectadas en el libro
Proceso con distribucin de Poisson: las erratas por pgina en un libro
de reciente publicacin.
4) Unidad: Tinacos de agua con capacidad de 1000 litros.
Ocurrencia eventual: Consumo de agua.
Proceso con distribucin de Poisson: la cantidad de tinacos de agua
potable consumidos por las escuelas primarias de la ciudad.

Un problema que satisface las anteriores caractersticas se resuelve con la
distribucin de probabilidad de Poisson con la relacin
( ) np donde
x
e
x P
x
= =


!

Donde:
El numero irracional
, 71828 . 2 = e letra (landa) del alfabeto griego es el
parmetro que determina el valor de esta distribucin
En la prctica real, rara vez se obtienen las probabilidades de Poisson por
sustitucin directa en la frmula de la definicin. Algunas veces nos referimos a
las tablas de probabilidades de Poisson, como la tabla II, pero ms a menudo,
hoy en da, nos referimos a programas de computadora apropiados. El uso de
tablas o computadoras es de especial importancia cuando nos interesan
probabilidades relacionadas con varios valores de x.
Problema
Si la probabilidad es de 0.005 de que una persona cualquiera que asista a un
desfile en un da muy caluroso de verano, Cul es la probabilidad de que 18
de 3000 personas que asistan al desfile sufran insolacin?
( )( ) 005 . 0 15 005 . 0 3000 18 = = = = = p np x

( )
( )
0706 . 0
! 18
15
!
15
18
= = =

e x
e
x P
x


La probabilidad de que 18 de 3000 personas que asistan al desfile sufran
insolacin es del 7.06%

Problema

Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin
defectuosa, use la distribucin de Poisson a la distribucin Binomial para
determinar la probabilidad de que 5 de 400 libros encuadernados en este taller
tendrn encuadernaciones defectuosas.

( )( ) 02 . 0 8 02 . 0 400 5 = = = = = p np x

( )
( )
093 . 0
! 5
8
!
8
5
= = =

e x
e
x P
x



Problema

La contaminacin es un problema en la fabricacin de discos de
almacenamiento ptico. El nmero de partculas contaminantes que aparecen
en un disco ptico tiene una distribucin de Poisson y el nmero promedio de
partculas por centmetro cuadrado de superficie del medio de almacenamiento
es 0.1. El rea de un disco bajo estudio es 100 cm
2
.
a. Encuentre la probabilidad de encontrar 12 partculas en el rea del disco
ptico
( )( ) 1 . 0 10 1 . 0 100 12 = = = = = p np x

( )
( )
095 . 0
! 12
10
!
10
12
= = =

e x
e
x P
x


b. Encuntrese la probabilidad de que no haya partculas contaminantes en
el rea del disco
( )
( )
5
10
0
10 54 . 4
! 12
10
!

= = =
e x
e
x P
x


Problema
Si la probabilidad de que una persona sufra una reaccin daina al ingerir
determinado antibitico es de 0,001. Calcula la probabilidad de que un total de
3000 pacientes sufran el malestar.
a. De exactamente 3 personas
( )( ) 001 . 0 3 001 . 0 3000 3 = = = = = p np x

( )
( )
2240 . 0
! 3
3
!
3
3
= = =

e x
e
x P
x


b. Ms de 2 presenten reaccin daina
( )
( )
( )
( )
( )
( )
( ) 751 . 0
2
9 3 1
1 2
2
9
! 2
3
2
3
! 1
3
1
1
! 0
3
0
3 3 3
3 3
2
3 3
1
3 3
0
=
|
|
.
|

\
|
+ + = >
= =
= =
= =
e e e
x P
e e
P
e e
P
e e
P

Problema
El nmero de camiones que llegan en un da cualquiera en un depsito de
camiones en cierta ciudad es segn se sabe 12. Cul es la probabilidad de
que en un da lleguen menos de 9 camiones a este depsito?
Problema
Si una distribucin de Poisson es de
( )
( )
!
56 . 0
74 . 0
x
e
x P
x
=
Calcular
( ) ( ) ( ) ( ) 4 , 3 , 1 , 0 P P P P

( ) ( ) ( ) ( ) 0019 . 0 4 , 039 . 0 3 , 2671 . 0 1 , 4771 . 0 0 = = = = P P P P

Problema
En una fbrica de ropa, el 10% de las prendas producidas resultan con algn
defecto. Calcula la probabilidad de que en un lote de 9 prendas elegidas al azar
salgan exactamente 2 defectuosas.
( )( ) 1 . 0 9 . 0 1 . 0 9 3 = = = = = p np x
( ) ( )
( )
1646 . 0
! 2
9 . 0
2
!
9 . 0 2
= = =

e
P
x
e
x P
x


Problema
La probabilidad de que un trabajador tcnico en computacin tenga un sueldo
mayor a 10000 pesos mensuales es de 0.001. Calcula la probabilidad en un
total de 2000 tcnicos que 4 personas reciban exactamente este sueldo.
( )( ) 001 . 0 2 001 . 0 2000 4 = = = = = p np x

( ) ( )
( )
1646 . 0
! 2
2
2
!
2 4
= = =

e
P
x
e
x P
x


Problema
Los registros muestran que las probabilidad es de 0.00005 de que un automvil
se le reviente un neumtico mientras cruza cierto puente. Use la distribucin de
Poisson para aproximar las probabilidades binomiales que, de 10000 autos que
cruzan este puente,
a. Exactamente dos tendrn un neumtico reventado
Al consultar la tabla II, encontramos que para

( )( ) 00005 . 0 5 . 0 00005 . 0 10000 2 = = = = = p np x

La probabilidad de Poisson es 0.0758

b. Cuando mucho dos tendrn un neumtico reventado
Al consultar la tabla II, encontramos que para
( )( ) 00005 . 0 5 . 0 00005 . 0 10000 2 , 1 , 0 = = = = = p np y x
Las probabilidades de Poisson son 0.6065, 0.3033, y 0.0758. As la
probabilidad de que cuando mucho dos de los 10000 autos que cruzan
el puente tendrn un neumtico reventado es
9856 . 0 0758 . 0 3033 . 0 6065 . 0 = + +

Propiedades de la distribucin de Poisson
La media
= u
La varianza o =
2

Desviacin o =


3.5 Distribuciones de probabilidad continuas

Definicin
Una funcin con valores ( ) x f , definida sobre el conjunto de todos los nmeros reales, se
llama funcin de densidad de probabilidad de la VAC X si y slo si
( ) ( )
}
= s s
b
a
dx x f b x a P

Para cualquiera constantes a y b con b a s
Donde f(x) es la funcin de densidad de la distribucin probabilstica correspondiente.
Es la probabilidad de que x tome un valor entre a y b es igual al rea que encierra con el
eje x entre los valores a y b.
Hay que estar conscientes de que en el caso de las variables continuas slo se puede calcular
la probabilidad de que un evento caiga dentro de un intervalo, debido a que la exactitud de los
instrumentos de medicin siempre es relativa y muy lejana a la "exactitud" de los clculos
matemticos.
Por esto, la probabilidad de que la variable aleatoria tome un valor exacto es nula:
( ) ( )
}
= = =
a
a
dx x f a x P 0

Esto se puede explicar de la siguiente manera: si, como ya dijimos, la probabilidad (frecuencia
relativa) es igual a la densidad del intervalo por la amplitud del intervalo, entonces no importa
qu tan grande sea la densidad de tal intervalo porque, como ya tambin se dijo, por ser
variable continua la amplitud del intervalo tiende a cero y, por tanto, la probabilidad es igual a
cero.
Caractersticas:
Es generada por una variable continua (x).

,...,
Una funcin de densidad de una VAC X a la funcin que verifica las siguientes
propiedades.

Definicin
Una funcin puede servir como una densidad de probabilidad de una VAC X si sus valores
satisfacen las condiciones:
1. ( ) 0 > x f Las probabilidades asociadas a cada uno de los valores que toma x deben
ser mayores o iguales a cero. Dicho de otra forma, la funcin de densidad de
probabilidad deber tomar solo valores mayores o iguales a cero. La funcin de
densidad de probabilidad slo puede estar definida en los cuadrantes I y II.
( ) x f
( ) x f
( ) x f
2. ( )
}


dx x f La sumatoria de las probabilidades asociadas a cada uno de los valores
que toma x debe ser igual a 1. El rea definida bajo la funcin de densidad de
probabilidad deber ser de 1.

Clculo de media y varianza para una distribucin continua
Media o valor esperado de x.
Definicin
Supngase que X es una VAC con una funcin de densidad de probabilidad para
< < x
La media de X, denotada por ( ) o x E es

( ) ( )
}


= = dx x f x x E
Donde:
= E(x) = media o valor esperado de la distribucin
x = variable aleatoria continua
f(x) = funcin de densidad de la distribucin de probabilidad

La varianza de X, denotada por ( )
2
o o x v Desviacin estndar es
( ) ( )
}


= dx x f x
2
2
o


Ejemplo:
Para la siguiente funcin, ( )

s s
=
dof
x para x
x f
0
3 0
9
1
2

a) Diga si esta funcin nos define una distribucin de probabilidad.
b) Si la funcin define una distribucin de probabilidad, entonces, determine su media y
desviacin estndar.
c) Determine la probabilidad de que 2 1 < s x .
Solucin:
Para verificar que la funcin nos define una distribucin de probabilidad, es necesario que
cumpla con las caractersticas que se haban mencionado.
x s es una variable continua porque puede tomar cualquier valor entre 0 y 3
( ) x f
( ) 0 > x f , lo que se comprueba si damos diferentes valores a x para ver que valores toma f(x),
dndonos cuenta de que efectivamente f(x) solo toma valores mayores o iguales a cero.
( ) 1 81 . 0 49 . 0 49 . 0 21778 . 0 1111 . 0 02778 . 0 0
3 7 . 2 1 . 2 4 . 1 5 . 1 1 5 . 0 0
x f
x

Para comprobar que la sumatoria de las probabilidades que toma cada valor de x es de 1, se
integra la funcin de 0 a 3 como se muestra a continuacin:


A= rea bajo la funcin
Con las operaciones anteriores comprobamos que la funcin
2
9
1
x
s nos define una
distribucin de probabilidad continua.
Clculo de media y desviacin estndar.


Las barras nos indican la evaluacin de la integral entre 0 y 3.


La barra nos indica la evaluacin de la integral de 1 a 2.
Con las operaciones anteriores nos damos cuenta que para evaluar probabilidades para
variables de tipo continuo, es necesario evaluar la funcin de densidad de probabilidad en el
rango de valores que se desea; que vendra siendo el rea que se encuentra entre f(x) y el eje
de las x y entre el rango de valores definidos por la variable x.

Ejemplo
Suponga que el error en la temperatura de reaccin, en
o
C, para un experimento controlado de
laboratorio es una variable aleatoria continua x, que tiene la funcin de densidad de
probabilidad:
( )

< <
=
dof
x para
x
x f
0
2 1
3
2
0

- Verifique la condicin ()

la definicin de una distribucin de


probabilidad continua.
- Determine la media o valor esperado de la distribucin de probabilidad
()

.
- Encuentre la probabilidad de que .



Solucin:
Como la tercera condicin es que la sumatoria de las probabilidades asociadas a cada uno de
los valores que toma x debe de ser 1, esto se comprueba de la siguiente manera:











3.6 Distribucin t
En el uso de la distribucin z su uso era para muestras 30 > n . En muestras pequeas
30 < n siempre y cuando la distribucin de donde proviene la muestra tenga un
comportamiento normal.
Es una condicin importante para utilizar las distribuciones
. , ,
2
Fisher F x Student t
Donde se har uso y manejo del concepto de grados de libertad, esto con base en la
varianza muestral
( )
1
2
2

n
x x
s
i

Supngase que se toma una muestra de una poblacin normal con media y
varianza
2
o . Si X es el promedio de las observaciones que contiene la muestra
aleatoria, entonces la distribucin
n
x
z
o

= es una distribucin normal estndar.
Supngase que la varianza de la poblacin
2
o es desconocida.
Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que v aumenta, la dispersin de la curva t correspondiente
disminuye.
A medida que ( ) v , la secuencia de curvas t se aproxima a la curva normal
estndar, por lo que la curva z recibe a veces el nombre de curva t con = gl
Def.
Sean

variables aleatorias independientes que son todas normales con


media y desviacin estndaro . Entonces la variable aleatoria

tiene una
distribucin t con 1 = n v grados de libertad.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra
tiende a infinito las dos distribuciones sern las mismas.
Problema
El valor de t con 10 gl y un rea de 0.025 a la derecha es:

Problema
El valor de t con 14 gl tiene un rea de 0.025 a la izquierda y por lo tanto un rea de
0.0975 a la derecha es,
975 . 0 1 = o

Problema
Encontrar ( )

Problema
Encontrar ( )

Problema

Un fabricante de focos afirma que us producto durar un promedio de 500 horas de
trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si el
valor y calculado cae entre t 0.05 y t 0.05, l se encuentra satisfecho con esta
afirmacin. Qu conclusin deber l sacar de una muestra de 25 focos cuya
duracin fue?:



Grados de libertad
Est se define como el nmero de valores que podemos elegir libremente, sea, el
nmero de observaciones menos uno


3.7 Distribucin Chi-cuadrada
En realidad la distribucin ji-cuadrada es la distribucin muestral de
2
S . O sea que si
se extraen todas las muestras posibles de una poblacin normal y a cada muestra se
le calcula su varianza, se obtendr la distribucin muestral de varianzas.
Definicin
Si
2
S y X son la media y la varianza de una muestra aleatoria de tamao n de una
poblacin normal con la media y la desviacin estndar o , entonces
-
2
S y X son independientes
- La variable aleatoria
( )
2
2
1
o
S n
tiene la distribucin ji-cuadrada con n-1 grados
de libertad.
El estadstico ji-cuadrada esta dado por:
( ) o o = > v x x P ,
2 2
donde
( )
2
2
2
1
o
S n
X

=
donde n es el tamao de la muestra, s
2
la varianza muestral y
2
o la varianza de la
poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin se puede
dar con la siguiente expresin:
( )
2
1
2
o

=

=
n
i
i
x x
X
Propiedades de las distribuciones ji-cuadrada
1. Los valores de
2
X son mayores o iguales que 0.
2. La forma de una distribucin
2
X depende del 1 = n gl . En consecuencia,
hay un nmero infinito de distribuciones
2
X .
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones
2
X no son simtricas. Tienen colas estrechas que se
extienden a la derecha; esto es, estn sesgadas a la derecha.
5. Cuando 2 > n , la media de una distribucin
2
X es n-1 y la varianza es 2
(n-1).
6. El valor modal de una distribucin
2
X se da en el valor (n-3).
Para denotar el valor crtico de una distribucin
2
X con gl grados de libertad se
usa el smbolo v X ,
2
o ; este valor crtico determina a su derecha un rea de o
bajo la curva
2
X y sobre el eje horizontal. Por ejemplo para encontrar 6 , 05 . 0
2
X
en la tabla se localiza 6 gl en el lado izquierdo y 05 . 0 = o a o largo del lado
superior de la misma tabla.

Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para
saber como se va a comportar la varianza o desviacin estndar en una muestra que
proviene de una distribucin normal.
Problema
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus
destinos en una ciudad grande forman una distribucin normal con una desviacin
estndar 1 = o minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
Primero se encontrar el valor de ji-cuadrada correspondiente a 2
2
= s como sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se
encuentra que a este valor le corresponde un rea a la derecha de 0.01. En
consecuencia, el valor de la probabilidad es ( ) 2
2
> s P .

Problema
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
poblacin normal con varianza 6
2
= o , tenga una varianza muestral:
a. Mayor que 9.1
b. Entre 3.462 y 10.745
a. Primero se proceder a calcular el valor de la ji-cuadrada:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la
derecha de 0.05. Por lo que la ( ) 05 . 0 1 . 9
2
= s P
Se calcularn dos valores de ji-cuadrada:
( ) ( )( )
847 . 13
6
462 . 3 1 25 1
2
2
2
=

=
o
s n
x y
( )( )
98 . 42
6
745 . 10 1 25
2
=

= x
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al
buscar el valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98
da un rea a la derecha de 0.01. Como se est pidiendo la probabilidad entre dos
valores se resta el rea de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la ( ) 94 . 0 745 . 10 462 . 3
2
= s s s P

Problema
Una compaa ptica compra cristales para fabricar lentes y experiencias anteriores
han demostrado que la varianza del ndice de refraccin de esta clase de cristal es
4
10 26 . 1

. Para convertir el cristal en lentes de una longitud focal dada, es importante
que las distintas piezas de cristal de esta clase se rechaza si la varianza muestral de
18 piezas seleccionadas al azar excede a
4
10 2

. Suponiendo, adems, que los
valores de las muestras se pueden tratar como si provinieran de una poblacin normal.
Problema
Encuentre la probabilidad de que una muestra aleatoria de 23 observaciones de una
poblacin normal con varianza igual a 2.4495, tenga una varianza 1 . 9
2
> s


3.8 Distribucin F

3.9 Esperanza matemtica.


Proyecto

1. Determine si las funciones
5 , 4 , 3 , 2 , 1
5
2
) ( =
+
= x para
x
x f ,
5 , 4 , 3 , 2 , 1
15
) ( = = x para
x
x f ,
4 , 3 , 2 , 1 , 0
30
) (
2
= = x para
x
x f
,
()


y
4 , 3 , 2 , 1 , 0
5
) (
2
= = x para
x
x f
pueden servir como una distribucin de probabilidad.

2. Construya un histograma de probabilidad para la funcin

|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
3
6
3
4 2
) (
x x
x f , para
encuentre la media y varianza para esta funcin.

3. Obtenga el valor esperado y la varianza de la VAD X que tiene la distribucin
de probabilidad 3 , 1 , 0 , 1
7
2
) ( =

= x para
x
x f
4. Dada la frmula de distribucin de probabilidad,
4 , 3 , 2 , 1 , 0
16
4
) ( =
|
|
.
|

\
|
= x para
x
x f

Obtenga:

a. Construya el histograma correspondiente.
b. La funcin de distribucin.

5. Encuentre la media
x
y varianza
x
o de la variable aleatoria discreta x. Una
grabadora de cinta contiene seis transistores, de los cuales dos estn
defectuosos. Si se seleccionan al azar dos de estos transistores extrados de la
grabadora e inspeccionados y si x es el nmero de unidades defectuosas
observadas, obtenga

a) La distribucin de probabilidad de x
b) La funcin de distribucin de x
c) Trace un histograma de la distribucin de probabilidad y una grfica de la
funcin de distribucin.

6. Si en general fallece el 30 % de los pacientes que padecen cierta enfermedad
Cul es la probabilidad de que en un grupo de 5 mueran exactamente 2?

7. Un ingeniero en seguridad de automviles afirma que uno de 10 accidentes
automovilsticos se debe a la fatiga del conductor. Utilizando la frmula de la
distribucin binomial Cul es la probabilidad de que cuando menos de tres de
cinco accidentes de automvil se debe a la fatiga del conductor?

8. Un psiclogo asevera que slo el 50% de todos los alumnos del ltimo ao de
preparatoria, capaces de desempear trabajos a nivel universitario, asisten en
realidad a la universidad. Suponiendo verdadera esta afirmacin obtenga las
probabilidades de:

a) Exactamente 10 asistan a la universidad
b) Cuando menos 15 vayan a la universidad
c) Cuando mucho cuatro vayan a la universidad

9. Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin
defectuosa, use la dist. de Poisson para determinar la probabilidad de que 5 de
400 libros encuadernados en este taller tendrn encuadernacin defectuosa.

10. Si la probabilidad de que una persona sufra una reaccin daina al ingerir un
determinado antibitico es de 0.001. Calcula la prob. De que de un total de
3000 pacientes sufran el malestar.

11. La probabilidad de que una muestra de aire contenga una molcula rara es
0.01. Si se supone que las muestras son independientes con respecto a la
presencia de la molcula rara, Cul es la probabilidad de que sea necesario
analizar exactamente 125 muestras antes de detectar una molcula rara?

12. En la fabricacin de las puertas de automviles, se ha observado que la
probabilidad de que una puerta resulte defectuosa es de 5%, Cul es la
probabilidad de que un automvil elegido al azar tenga a lo ms tres puertas
defectuosas?
Se supone que el modelo del automvil tiene 5 puertas.
13. El 30% de las piezas de televisin que fabrica una maquinaria recientemente
reparada son defectuosas, calcula la probabilidad de que en 8 piezas elegidas
al azar se obtenga:

a) Una pieza defectuosa.
b) Ninguna defectuosa.

14. Si la probabilidad es 0.75 de que el solicitante de una licencia de manejo
pasar la prueba de manejo en un ensayo dado, Cul es la probabilidad de
que un solicitante finalmente pase la prueba en el cuarto ensayo?

15. En una fbrica de ropa, el 10% de las prendas producidas resultan con algn
defecto. Calcula la probabilidad en base a la distribucin de Poisson de que en
un lote de 9 prendas elegidas al azar salgan exactamente dos defectuosas.

16. Encuentre la probabilidad de que 7 de 10 personas se recuperaran de una
enfermedad tropical si podemos suponer independencia y la probabilidad de
que cualquiera de ellos se recuperara de la enfermedad es de 0.8.
17. El nmero de camiones que llegan en un da cualquiera en un depsito de
camiones en cierta ciudad es segn se sabe 12. Cul es la probabilidad de
que en un da lleguen menos de 9 camiones a este depsito?

18. La probabilidad de que un trabajador tcnico en computacin tenga un sueldo
mayor a 10000 pesos mensuales es de 0.001. Calcula la probabilidad en un
total de 2000 tcnicos que 4 personas reciban exactamente este sueldo.

19. Los registros muestran que la probabilidad es de 0.00005 de que un automvil
se le reviente un neumtico mientras cruza cierto puente. Use la distribucin de
Poisson para aproximar las probabilidades binomiales que, de 10000 autos que
cruzan este puente,

c. Exactamente dos tendrn un neumtico reventado
d. Cuando mucho dos tendrn un neumtico reventado
20. De una poblacin normal con media 51.4 y desviacin estndar 6.8 se toma
una muestra al azar de tamao 64. Cul es la probabilidad de que la media de
la muestra:

a) Exceda a 52.9
b) Este entre 50.5 y 52.3
c) Sea menor que 50.6

21. Se toma una muestra aleatoria de tamao 100 de una poblacin infinita con
media 75 y varianza 256, con que probabilidad podemos afirmar que el valor
de caer entre 67 y 83?

22. Una compaa fabrica resistores que tienen una resistencia promedio de
y una desviacin estndar de . La distribucin de la resistencia es normal,
encuntrese la probabilidad de que al tomar una muestra de 30 resistores la
resistencia promedio de estos ser menor que .

23. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye
normalmente con media de 2000 libras y una varianza de

. Si se
selecciona una MA de 100 cuerdas, determine la probabilidad de que en esta
muestra:

a) La resistencia media encontrada sea de por lo menos 1958 lbs.
b) La resistencia media sea de 2080 lbs.

24. El precio medio de ventas de casa nuevas en una ciudad americana es de
$115 000 con una desviacin tpica de $25 000. Se toma una muestra aleatoria
de 100 casas nuevas de esta ciudad.

a. Cul es la probabilidad de que la media muestral de los precios de venta
sea menor de $110 000?

25. Se toma una muestra aleatoria de tamao 64 de una poblacin normal con
. Cul es la probabilidad de que la media de la muestra

a. Exceder 52.9
b. Caer entre 50.5 y 52.3
c. Ser menor que 50.6?

26. Encuentre la media y la varianza de la varianza de la poblacin finita que
consiste de los 10 nmeros 15, 163, 18, 10, 6, 21, 7, 11, 20 y 9.

27. El tiempo que un cajero de un banco atiende a un cliente es una variable
aleatoria con media 4.2 y una varianza de 2.56. Si se observa una MA de 74
clientes, encuentre la probabilidad de que el tiempo promedio de los mismos
con el cajero sea

a) Cuando mucho 3.7 min
b) A lo menos 4.5 min
c) Menos de 4.5 pero mas de 3.4 min

28. Los parvulitos de un jardn de nios tienen estaturas que estn distribuidas de
manera normal con respecto a una media de 39 pulgadas y una desviacin
estndar de 2 pulgadas. Se toma una muestra aleatoria de 30 y se calcula la
media muestral . Cul es la probabilidad de que este valor medio est entre
38.5 y 40 pulgadas?

29. Una compaa fabrica focos cuya duracin es normalmente distribuida con una
media igual a 800 hrs. y una desviacin estndar de 40 hrs. Encuentre la
probabilidad de que una muestra aleatoria de 40 focos se fundan entre 778 y
834 hrs. de uso. Encuentre la probabilidad de que una muestra aleatoria de 40
focos tenga una vida promedio de menos de 775 horas.


30. Una MA de tamao 81 se toma de una poblacin infinita con la media 128 y la
desviacin estndar 6.3, con que probabilidad podemos afirmar que el valor
que obtenemos para no caer entre 126.6 y 129.4?

31. Una compaa ptica compra cristales para fabricar lentes y experiencias
anteriores han demostrado que la varianza del ndice de refraccin de esta
clase de cristal es

. Para convertir el cristal en lentes de una


longitud focal dada, es importante que las distintas piezas de cristal de esta
clase se rechaza si la varianza muestral de 18 piezas seleccionadas al azar
excede a

. Suponiendo, adems, que los valores de las muestras se


pueden tratar como si provinieran de una poblacin normal.
32. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media y la desviacin estndar . Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es ?

33. Supongamos que el espesor de una parte usada en un semiconductor es su
dimensin crtica y el proceso de fabricar estas partes se considera que esta
bajo control si la varianza real entre espesor de las partes est dada por una
desviacin estndar no mayor que 0.60 milsimas de pulgada. Para mantener
un control sobre el proceso, peridicamente se toman MA de tamao 20 y se
considera que esta bajo control si la probabilidad de

asume un valor que, o


igual, al observado de la MA es 0.01 (aun cuando ), Qu se puede
concluir sobre el proceso si la desviacin estndar de una MA peridica tal es
milsimas de pulgadas?

34. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,
de una poblacin normal con varianza

, tenga una varianza muestral:


- Mayor que 9.1
- Entre 3.462 y 10.745
35. Encuentre la probabilidad de que una muestra aleatoria de 23 observaciones
de una poblacin normal con varianza igual a 2.4495, tenga una varianza
1 . 9
2
> s

36. Encuentre los valores crticos de
2
x
que determinan un rea de 0.05 en cada
cola, si tiene una muestra de 11.

37. Un fabricante de bateras para automvil garantiza que sus bateras durarn en
promedio, 3 aos, con una desviacin estndar de 1 ao. Si 5 de estas
bateras tienen duraciones de 1.9, 2.4, 3.5, y 4.2 aos.


Est el fabricante convencido an de que sus bateras tienen una desviacin
estndar de 1 ao?
38. Encuentre los valores crticos de
2
x
que determinan regiones crticas que
contienen un rea de 0.025 en cada cola. Suponga que el tamao de la
muestra es 10.
39. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media
47 = x
y la desviacin estndar
7 = s
. Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es
42 =
?
40. Para una muestra de 17 y con
01 . 0 = o
encuentre el rea a la derecha de 0.01
41. Dada una muestra de 30 encontrar la probabilidad de que
2
x
caiga entre
14.953 y 50.892.

42. Se toma una muestra de 27 observaciones de una poblacin normal con
varianza de 16.8, hallar la probabilidad aproximada de obtener una desviacin
estndar de la muestra entre 3 y 5.2.

43. Encuentre la probabilidad de
05 . 0 025 . 0
t t t < <

44. Encontrar
( ) 7 365 . 2 = < v cuando t P

45. Encontrar
( ) 24 318 . 1 = > v cuando t P


46. Encuentre k tal que
( ) 045 . 0 761 . 1 = < < t k P
, para una muestra aleatoria de
tamao 15 que se selecciona de una distribucin normal.
47. Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar
esta afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t
calculado cae entre t0.05 y t0.05, queda satisfecho con su afirmacin. Qu
conclusin extraera de una muestra que tiene una media de 518 gramos por
milmetro y una desviacin estndar de 40 gramos? Suponga que la
distribucin de rendimientos es aproximadamente normal.
48. Un fabricante de alambre de acero asegura que la fuerza media requerida para
romper una clase de alambre dada es de 500 lbs. Para probar esto, se toma
una muestra de 25 partes de este tipo de alambre y se somete a traccin, la
media y desviacin estndar de las fuerzas para romper estas muestras son
respectivamente,
lbs s y x 55 465 = =
Suponiendo que los esfuerzos de rotura
se puedan considerar como una MA de una poblacin normal con
500 =

49. Un fabricante de focos afirma que su producto durar un promedio de 500 hrs.
de trabajo. Para conservar este promedio esta persona verifica 25 focos cada
mes. Si el valor de t calculado cae entre
,
05 . 0 05 . 0
t y t
el se encuentra
satisfecho con esta afirmacin. Qu conclusin deber el sacar de una
muestra que tiene una media
hrs x 518 =
y una desviacin estndar de 40 hrs.
Asuma que la distribucin de los tiempos de vida es aproximadamente normal.

50. Una MA de tamao 16 proveniente de una poblacin normal tiene una media
de 48 y desviacin estndar de 5.2. Basndose en la decisin del estadstico t,
decir si es razonable indicar que esta informacin justifica la afirmacin de que
la media de la poblacin es como mnimo 52.



1. Sea X una variable aleatoria continua que tiene la siguiente funcin de densidad:
( )

s s +
=
dof
x para
x
c
x f
0
2 0
8
3
2

- El valor de c para que f(x) sea una funcin de densidad.
- Calcular: ) 5 . 1 1 ( s sx P
- Calcular: P(x > 1).

2. Sea X una variable aleatoria continua que mide el avance entre dos automviles
consecutivos elegidos al azar en segundos, su funcin de distribucin del tiempo
de avance presenta la forma:
( )

s
s s
=
1 0
2 0
4
x para
x para
x
k
x f
- Determinar el valor de k para que f(x) sea una funcin de densidad legtima.
- Obtener la funcin de distribucin acumulada.
- Calcular: P(X > 2) y P(2 <. X <. 3).
- Obtener el valor medio y la desviacin estndar del avance.

3. Determinar el valor de la constante c tal que f(x) defina una funcin densidad en
el intervalo dado y determinar la regla de correspondencia de la funcin de
distribucin acumulada correspondiente.
a. ,
b. ,
4. Determine
2
o y
para una variable aleatoria continua que tiene la densidad de
probabilidad;

( )

s s
=
dof
x para
x
x f
0
2 0
2

5. Demuestre que ( ) < < =

x para e x f
x
0
Representa una funcin de densidad de probabilidad
Bosqueje una grfica de esta funcin e indique el rea asociada con la
probabilidad que 1 > x
Calcule la probabilidad de que 1 > x

6. Para la siguiente funcin,
( )

s s
=
dof
x para x
x f
0
3 0
9
1
2

- Diga si esta funcin nos define una distribucin de probabilidad.
- Si la funcin define una distribucin de probabilidad, entonces, determine
su media y desviacin estndar.
- Determine la probabilidad de que 3 2 < s x .
7. Suponga que el error en la temperatura de reaccin, en
o
C, para un experimento
controlado de laboratorio es una variable aleatoria continua x, que tiene la funcin
de densidad de probabilidad:
( )

< <
=
dof
x para
x
x f
0
2 1
3
3

Verifique si esta funcin nos define una distribucin de probabilidad.
Determine la media o valor esperado de la distribucin de probabilidad.
Encuentre la probabilidad de que 1 0 < s x .
8. El salario medio de los empleados de una empresa se distribuye segn una
distribucin normal, con media 5 millones de ptas. y desviacin tpica 1 milln de
ptas. Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de
ptas.

9. La renta media de los habitantes de un pas es de 4 millones de ptas/ao, con una
varianza de 1,5. Se supone que se distribuye segn una distribucin normal.
Calcular:
a) Porcentaje de la poblacin con una renta inferior a 3 millones de
ptas.
b) Renta a partir de la cual se sita el 10% de la poblacin con mayores
ingresos.
c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con
renta media.
10. La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25.
Se hace un estudio en una pequea ciudad de 10.000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
b) Cuntos vivirn menos de 60 aos?
11. El consumo medio anual de cerveza de los habitantes de un pas es de 59 litros,
con una varianza de 36. Se supone que se distribuye segn una distribucin
normal.
a) Si usted presume de buen bebedor, cuntos litros de cerveza
tendra que beber al ao para pertenecer al 5% de la poblacin que
ms bebe?
b) Si usted bebe 45 litros de cerveza al ao y su mujer le califica de
borracho qu podra argumentar en su defensa?
12. Si Z es una VA con una distribucin normal estndar, determine las probabilidades
de que esta variable tenga un valor.
a) Mayor que 1.14
b) Menor que -0.36
c) Entre -0.46 y -0.09
d) Entre -0.58 y 1.12
e) Entre 0 y 1.28
f) Entre -3.20 y 0
g) A la izquierda de -1.35
h) El rea entre -1.5 y 2.1
i) Entre 0.7 y 2.1

13. En un proceso fotogrfico, el tiempo de revelado de impresiones se
puede considerar como una VA que tiene distribucin normal con media
15.40 seg. y Desviacin estndar de 0.48 seg. Encuentre las
probabilidades de que el tiempo que toma revelar una de las
impresiones ser
a) Al menos 16 seg
b) Cuando mucho 14.20 seg
c) Cualquier valor entre 15 y 15.80 seg
14. Supongamos que la cantidad de caf instantneo que una mquina sirve
en un frasco de 6 onzas es una VA que tiene distribucin normal con
desviacin estndar 0. 05 onzas. Si slo el 3% de los frascos deben
contener menos de 6 onzas de caf, Cul debe ser la media del llenado
de estos frascos.?

1. El espacio muestral S de la poblacin de adultos en un pequeo pueblo que
han satisfecho los requisitos para graduarse en la escuela. Se deben clasificar
de acuerdo con el sexo y si trabajan o no actualmente.
Empleado Desempleado Total
Hombre 460 40 500
Mujer 140 260 400
Total 600 300 900

Basados en el espacio muestral anterior definir:

a. La probabilidad de que sea empleado
b. La probabilidad de que sea empleado
c. La probabilidad de que sea hombre y al mismo tiempo sea desempleado
d. Encuentre la probabilidad de que se escoge un hombre dado que el elegido
tiene empleo

2. Lanzamos un dado. Decir los sucesos contrarios de:
{ }
{ }
{ } ) .
.
.
primo numero sacar C c
tres que igual o menos sacar B b
par puntuacin sacar A a
=
=
=


3. Supngase que se tiene una caja de fusible que contienen 20 piezas, de las
cuales 5 estn defectuosas. Si se seleccionan 2 al azar y se sacan de la caja
en sucesin sin reemplazo del primero, Cul es la probabilidad de que ambos
fusibles resulten defectuosos?
4. Si se lanza una moneda tres veces y se supone que los resultados posibles
son igualmente probables. Si A es el evento de que una cara ocurra en cada
uno de los dos primeros lanzamientos, B es el evento que una cruz ocurra en el
tercer lanzamiento y C es el evento que exactamente dos cruces ocurren en los
tres lanzamientos, demuestre que;

a. Los eventos A y B son independientes
b. Los eventos B y C son dependientes

5. La siguiente figura es un diagrama de Venn, con probabilidades asignadas a
sus diversas regiones. Verifique que A y B son independientes, que B y C son
independientes pero que A, B, y C no son independientes.


6. Hay 90 aspirantes para un trabajo en el departamento de noticias de una
estacin de tv. Algunos son egresados de la universidad y algunos no, algunos
de ellos tienen al menos tres aos de experiencia y algunos no la tienen, el
anlisis exacto es;
Egresados No
egresados
Al menos tres aos de experiencia 18 9
Menos de tres aos de experiencia 36 27

El orden en que el gerente de la estacin entrevista a los aspirantes es
aleatorio, G es el evento que el primer aspirante entrevistado sea un
egresado de la universidad y T es el evento de que el primer aspirante
entrevistado tenga al menos aos de experiencia, determine cada una de
las siguientes probabilidades.

( ) ( ) ( ) T G P c G T P b G P a / . / . .

7. Experimento aleatorio: se observa la escolaridad de las personas de 20 a 60
aos de edad de una comunidad.
Consideremos los siguientes sucesos.
I. Una persona tiene menos de 40 aos
J. La persona es ingeniero
K. La persona es analfabeta
L. La persona tiene 40 aos o ms
Son los sucesos mutuamente excluyentes o no?
D A C B D B C A ; ; ;
8. En un grupo de 200 estudiantes (80 mujeres y 60 hombres), 140 en total son
alumnos de tiempo completo y otro de 60, (40 son mujeres y 20 hombres) son
de tiempo parcial.
Experimento: un estudiante es seleccionado al azar, para esto se definen tres
sucesos.

D. Estudiante seleccionado de tiempo completo
E. Estudiante seleccionado de tiempo parcial
F. Estudiante seleccionado sea hombre

c) Defina si los sucesos A y B son mutuamente excluyentes o no.
d) Defina si los sucesos A y C son mutuamente excluyentes o no.
e) Defina si los sucesos B y C son mutuamente excluyentes o no

9. Se analiza en un momento dedo el estado de salud de los habitantes de la
ciudad.
Consideremos los casos siguientes:
A: La persona es diabtica
B: La persona est sana
C: La persona tiene un problema de salud permanente, tiene una
enfermedad crnica.
D: La persona tiene gripa
E: La persona es hipertensa
e) Los sucesos A y B son mutuamente excluyentes o no?
f) Si | = E C son mutuamente excluyentes o no?
g) Qu sucede con los sucesos B y C?
h) Cmo son los sucesos C y D?

10. Una organizacin de los consumidores ha estudiado los servicios con garanta
proporcionados por las 50 agencias de automviles nuevos en una cierta
ciudad en la tabla siguiente se resumen sus hallazgos.
Buen servicio de
garanta
Mal servicio de
garanta

En operacin
por
10 aos o ms

16

4

20
En operacin
Menos de 10

aos 10 20 30
Total 26 24 50

e) Si una persona selecciona aleatoriamente una de estas agencias de
automviles nuevos, Cul es la probabilidad de que seleccione una que
proporciona buen servicio de garanta?
f) Si una persona selecciona una de las agencias que han operado 10 aos o
ms, Cul es la probabilidad de que seleccione una agencia que proporcione
buen servicio de garanta?
G: Denota la seleccin de la agencia que proporciona buen servicio de
garanta.
S: Denota el nmero de elementos en el espacio muestral completo.
11. Una urna contiene 75 bolas blancas marcadas, 25 bolas sin marcar, 175 bolas
negras marcadas y 125 bolas negras sin marcar.
c) Se saca una bola al azar. Calcular la probabilidad que sea blanca.
d) Se extrae una bola y est marcada. Calcular la probabilidad que sea
blanca.

12. En un grupo de 200 estudiantes universitarios 138 estn inscritos en un curso
de Ingles 115 en uno de mecnica y 91 en ambos, Cuntos de estos
estudiantes no estn inscritos en uno u otro curso?
- Trace un diagrama de Venn apropiado y anote los nmeros asociados con
las diversas regiones.

13. Un taller sabe que por trmino medio acuden, por la maana 3 automviles con
problemas elctricos, 8 con problemas mecnicos y 3 con problemas de
chapas y por la tarde 2 con problemas elctricos, 3 con problemas mecnicos y
1 con problemas de chapa.
Elctricos Mecnicos Chapa Total
Maana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20

Calcular, P(A), P(B), P(C) , as como la probabilidad de que acuda por la
maana dado que tiene problemas elctricos
14. En una caja hay 100 canicas azules y 300 rojas. Cul es la probabilidad de
sacar al azar una canica azul? Exprese el resultado en tanto por ciento.

15. En la oficina del subdirector de la escuela hay 12 calculadoras, algunas son
manuales (M), otras elctricas (E); adems algunas de ellas son nuevas (N) y
otras usadas (U), como se expresa en el cuadro siguiente:

M E
N 2 3 5
U 2 5 7
4 8 12

c) Una persona entra a la oficina y escoge aleatoriamente una calculadora y
observa que es manual. Cul es la probabilidad de que sea nueva?
d) Si la persona escoge una al azar una elctrica, Cul es la probabilidad de que
sea usada?




16. Empleando diagramas de Venn y con la definicin de conjuntos encontrar el
conjunto solucin para cada uno de los casos que se dan a continuacin.

{ } { } { } { } 7 , 6 , 5 , 2 , 7 , 5 , 3 , 1 , 5 , 4 , 3 , 2 , 1 , 7 , 6 , 5 , 4 , 3 , 2 , 1 = = = = c B A U .
c
A e A B d C B c B C b A B a ) ) ) ) )

17. Una orquesta de 30 msicos deciden formar dos grupos musicales, uno de
clsica y otro de msica de saln, el primero con 12 personas y el segundo con
16; si tres de los msicos pertenecen a los dos grupos Cuntos miembros de
la orquesta original decidieron no pertenecer a ningn grupo?

18. De un lote de 15 camisas, 4 son defectuosas, si se toman al azar 3 artculos
del lote, uno tras otro; calcular la probabilidad de que los tres se encuentren en
buen estado.

19. En una escuela de enseanza media superior, el 20% de los alumnos
reprobaron matemticas, el 25% fsica y el 5% ambas materias. Si se
selecciona un alumno al azar:
d) Si reprob fsica. Cul es la probabilidad que haya reprobado
matemticas?
e) Si reprob matemticas. Cules la probabilidad de que haya reprobado
fsica?
f) Cul es la probabilidad de que haya reprobado fsica o matemticas?
20. En una escuela de enseanza media superior de la poblacin de alumnos el
40% mide ms de 1.50 m, el 25% pesa ms de 52 kilos y el 15% mide ms de
1.50 m y ms de 52 kilos. Si se escoge al azar un alumno:
b) Si mide ms de 1.50 m, calcular la probabilidad de que tambin pese ms
de 52 kg.
21. En una zona de una ciudad grande, las probabilidades son 0.86, 0.35, y 0.29
de que una familia tenga un aparato de tv a color, un aparato de tv en blanco y
negro, o ambas clases de aparatos respectivamente. Cul es la probabilidad
de que una familia posea cualquiera de los dos o ambas clases?
22. Cerca de cierta salida de la carretera, las probabilidades son 0.23 y 0.24, de
que un camin parado en un retn tendr frenos defectuosos o neumticos
muy gastados. Tambin, la probabilidad es 0.38 de que un camin parado en
un retn tendr frenos defectuosos y neumticos muy gastados. Cul es la
probabilidad de que un camin parado en este retn tendr los frenos
defectuosos as como los neumticos muy gastados?

1. El tiempo que un cajero de un banco atiende a un cliente es una variable
aleatoria con media 4.2 y una varianza de 2.56. Si se observa una MA de 74
clientes, encuentre la probabilidad de que el tiempo promedio de los mismos
con el cajero sea

d) Cuando mucho 3.7 min
e) A lo menos 4.5 min
f) Menos de 4.5 pero ms de 3.4 min


2. Los parvulitos de un jardn de nios tienen estaturas que estn distribuidas de
manera normal con respecto a una media de 39 pulgadas y una desviacin
estndar de 2 pulgadas. Se toma una muestra aleatoria de 30 y se calcula la
media muestral x . Cul es la probabilidad de que este valor medio est entre
38.5 y 40 pulgadas?

3. Una compaa fabrica focos cuya duracin es normalmente distribuida con una
media igual a 800 hrs. y una desviacin estndar de 40 hrs. Encuentre la
probabilidad de que una muestra aleatoria de 40 focos se fundan entre 778 y
834 hrs. de uso.

4. Una MA de tamao 81 se toma de una poblacin infinita con la media 128 y la
desviacin estndar 6.3, con que probabilidad podemos afirmar que el valor
que obtenemos para x no caer entre 126.6 y 129.4?

5. Una compaa ptica compra cristales para fabricar lentes y experiencias
anteriores han demostrado que la varianza del ndice de refraccin de esta
clase de cristal es
4
10 26 . 1

. Para convertir el cristal en lentes de una longitud
focal dada, es importante que las distintas piezas de cristal de esta clase se
rechaza si la varianza muestral de 18 piezas seleccionadas al azar excede a
4
10 2

. Suponiendo, adems, que los valores de las muestras se pueden
tratar como si provinieran de una poblacin normal.
6. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media 47 = x y la desviacin estndar 7 = s . Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es 42 = ?

7. Supongamos que el espesor de una parte usada en un semiconductor es su
dimensin crtica y el proceso de fabricar estas partes se considera que esta
bajo control si la varianza real entre espesor de las partes esta dada por una
desviacin estndar no mayor que 0.60 milsimas de pulgada. Para mantener
un control sobre el proceso, peridicamente se toman MA de tamao 20 y se
considera que esta bajo control si la probabilidad de
2
s asume un valor que, o
igual, al observado de la MA es 0.01 (an cuando 60 . 0 = o ), Qu se puede
concluir sobre el proceso si la desviacin estndar de una MA peridica tal es
84 . 0 = s milsimas de pulgadas?

8. Un fabricante de bateras para automvil garantiza que sus bateras durarn en
promedio, 3 aos, con una desviacin estndar de 1 ao. Si 5 de estas
bateras tienen duraciones de 1.9, 2.4, 3.5, y 4.2 aos.
Est el fabricante convencido an de que sus bateras tienen una desviacin
estndar de 1 ao?
9. Encuentre los valores crticos de
2
x que determinan regiones crticas que
contienen un rea de 0.025 en cada cola. Suponga que el tamao de la
muestra es 10.

10. Una muestra aleatoria de tamao 25 de una poblacin normal que tiene la
media 47 = x y la desviacin estndar 7 = s . Si basamos nuestra decisin en
la estadstica del teorema visto podemos decir que la afirmacin dada
sustenta la conjetura de que la media de la poblacin es 42 = ?
11. Dada una muestra de 30 encontrar la probabilidad de que
2
x caiga entre
14.953 y 50.892.

12. Se toma una muestra de 27 observaciones de una poblacin normal con
varianza de 16.8, hallar la probabilidad aproximada de obtener una desviacin
estndar de la muestra entre 3 y 5.2.

13. Encontrar ( ) 7 365 . 2 = < v cuando t P
14. Encontrar ( ) 24 318 . 1 = > v cuando t P
15. Un fabricante de alambre de acero asegura que la fuerza media requerida para
romper una clase de alambre dada es de 500 lbs. Para probar esto, se toma
una muestra de 25 partes de este tipo de alambre y se somete a traccin, la
media y desviacin estndar de las fuerzas para romper estas muestras son
respectivamente, lbs s y x 55 465 = = Suponiendo que los esfuerzos de rotura
se puedan considerar como una MA de una poblacin normal con 500 =
16. Un fabricante de focos afirma que su producto durar un promedio de 500 hrs.
de trabajo. Para conservar este promedio esta persona verifica 25 focos cada
mes. Si el valor de t calculado cae entre ,
05 . 0 05 . 0
t y t el se encuentra
satisfecho con esta afirmacin. Qu conclusin deber el sacar de una
muestra que tiene una media hrs x 518 = y una desviacin estndar de 40 hrs.
Asuma que la distribucin de los tiempos de vida es aproximadamente normal.
17. Una MA de tamao 16 proveniente de una poblacin normal tiene una media
de 48 y desviacin estndar de 5.2. Basndose en la decisin del estadstico t,
decir si es razonable indicar que esta informacin justifica la afirmacin de que
la media de la poblacin es como mnimo 52.






Unidad IV
4.1 Inferencia estadstica
La estadstica inferencial se define como la rama de la estadstica que proporciona
tcnicas o procedimientos para analizar, interpretar y tomar decisiones sobre una
poblacin, con base en la informacin que se obtiene de una muestra.
Esta generalizacin de tipo inductivo, se basa en la probabilidad. Tambin se le llama
estadstica matemtica, por su complejidad matemtica en relacin a la estadstica
descriptiva.
Tiene como objetivo generalizar las propiedades de la poblacin bajo estudio, basado
en los resultados de una muestra representativa de la poblacin.
El estudio de una poblacin tomando como base las muestras se llama estadstica
inferencial o inductiva, Teora de muestras.
La Inferencia estadstica persigue la obtencin de conclusiones sobre la poblacin
mediante los datos obtenidos de una muestra, e incluye;
- Teora de la muestra
- Estimacin de parmetros
4.2 Muestreo estadstico
Uno de los propsitos de la estadstica inferencial es estimar las caractersticas
poblacionales desconocidas, examinando la informacin obtenida de una muestra, de
una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la
poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden
hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras
representativas de la misma.
El tamao de la muestra debe calcularse utilizando tcnicas estadsticas.
La seleccin de la muestra debe hacerse en forma aleatoria.
La estimacin de las caractersticas de la poblacin debe hacerse de acuerdo a las
leyes de la estadstica.
Una aplicacin de muestreo que no cumpla con alguno de estos tres requisitos se
considera muestreo no estadstico. El muestreo estadstico posee algunas ventajas
con respecto al muestreo no estadstico, entre ellas las siguientes:
- Permite seleccionar de antemano el nivel de confianza de la prueba, es decir la
probabilidad de que las conclusiones obtenidas del muestreo sean correctas.
- La seleccin aleatoria impide que los prejuicios o preferencias del auditor
favorezcan la seleccin de algunos elementos de la poblacin en desmedro de
otros.
- Permite limitar el tamao de la muestra al mnimo necesario, evitando
realizar pruebas de auditora sobre una cantidad mayor de elementos.
- Los resultados de la prueba se expresan matemticamente en trminos
precisos, permitiendo elaborar recomendaciones sobre una base ms objetiva.
- Permite hacer ms defendibles las conclusiones de la prueba.
Una poblacin est formada por la totalidad de las observaciones en las cuales se
tiene una cierta observacin.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.
Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan
muestras por muchas razones; una enumeracin completa de la poblacin, llamada
censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes
se usan para determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para
controlar la calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos
prueban la eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar
los criterios del pblico sobre cuestiones relacionadas con el bienestar y la
seguridad nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadsticos para estimar valores
poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
El error muestral se refiere a la variacin natural existente entre muestras tomadas de
la misma poblacin.
Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamao sean representativas de
una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus
detalles. El error muestral es un concepto importante que ayudar a entender mejor la
naturaleza de la estadstica inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere
a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones
de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo
positivo) que el parmetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.
La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la
poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemtico.
Muestreo Aleatorio Simple
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
El objetivo principal de un diseo muestral es hacer uso eficiente del presupuesto
asignado para un estudio obteniendo un estimativo tan preciso como sea posible de
una cantidad de la poblacin. El muestreo aleatorio simple es la tcnica de muestreo
ms bsica que no slo asegura una muestra representativa sino que tambin produce
una estimacin de la cantidad de una poblacin y una especificacin de la precisin.
Muchas ramificaciones han evolucionado a partir de este concepto central del
muestreo aleatorio simple que permite alcanzar inferencias ms precisas para
diferentes tipos de poblaciones.
Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo
de estadstica de 20 alumnos.
20
C
5
da el nmero total de formas de elegir una muestra
no ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y despus los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despus extraer cinco papeles al mismo tiempo.
Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20
utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y
los revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la
tabla, se regresa al recipiente y despus de revolver otra vez se selecciona la seguida
tira que determina el segundo nmero de la tabla; el proceso contina hasta obtener
una tabla de dgitos aleatorios con tantos nmeros como se desee.
Muestreo Simple
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para
las encuestas nacionales de opinin sobre productos o sobre elecciones
presidenciales, sera muy costoso o tardado.
Error Muestral
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la
media poblacional , entonces la media muestral, como medida, conlleva algn error.
Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de
una poblacin con media : si la media de la muestra es , entonces a la
diferencia observada se le denomina el error muestral. Una media
muestral puede pensarse como la suma de dos cantidades, la media poblacional y
el error muestral; si e denota el error muestral, entonces:

Ejemplo 1.5
Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y
6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse
un gran nmero de veces, supondremos que ste se hace con remplazo, es decir, el
nmero elegido se remplaza antes de seleccionar el siguiente, adems, se
seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se
seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y
despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de
tamao 2 que es posible seleccionar con remplazo y tambin contiene las medias
muestrales y los correspondientes errores muestrales. La media poblacional es igual a

= (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina.
4.3 Estimadores
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. En los problemas de estimacin debemos
determinar el valor de un parmetro de un continuo posible de alternativas.
Los estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus
valores.
4.4 Estimacin puntual
Una estimacin es puntual cuando se usa un solo valor extrado de la muestra para
estimar el parmetro desconocido de la poblacin. Al valor usado se le llama
estimador.
- La media de la poblacin se puede estimar puntualmente mediante la media de
la muestra:

- La proporcin de la poblacin se puede estimar puntualmente mediante la
proporcin de la muestra:

- La desviacin estndar (tpica) de la poblacin se puede estimar puntualmente
mediante la desviacin tpica de la muestra, aunque hay mejores estimadores:

Todo nuestro estudio se basa en la normalidad de las distribuciones que empleamos.

4.5 Estimacin por intervalo
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten
dar un valor aproximado de un parmetro de una poblacin a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimacin de la media de una
determinada caracterstica de una poblacin de tamao N podra ser la media de esa
misma caracterstica para una muestra de tamao n.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:
- Estimacin puntual:
o Mtodo de los momentos;
o Mtodo de la mxima verosimilitud;
o Mtodo de los mnimos cuadrados;
- Estimacin por intervalos.
Intervalo de confianza
En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales
se estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir
de datos de una muestra, y el valor desconocido es un parmetro poblacional. La
probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de
confianza. En estas circunstancias, es el llamado error aleatorio o nivel de
significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un
intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumentan sus posibilidades de error.
Estimacin para la Media (Normal)
Sabemos que en base a la distribucin muestral de medias que se gener en el tema
anterior, la formula para el clculo de probabilidad es la siguiente

. Como en
este caso no conocemos el parmetro y lo queremos estimar por medio de la media de
la muestra, slo se despejar de la formula anterior, quedando de la siguiente
manera.


De esta formula se puede observar que tanto el tamao de la muestra como el valor
de z se conocern. Z se puede obtener de la tabla de la distribucin normal a partir del
nivel de confianza establecido. Pero en ocasiones se desconoce por lo que en esos
casos lo correcto es utilizar otra distribucin llamada "t" de student si la poblacin de
donde provienen los datos es normal.
Estimacin t-Student
Definicin
Si es el valor de la media de una muestra aleatoria de tamao n de una poblacin
normal con la varianza conocida

, entonces


Es un intervalo de confianza de ( ) para la media de la poblacin.
Problema
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
Solucin:
La estimacin puntual de es . El valor de z para un nivel de confianza
del 95% es 1.96, por lo tanto:

()

()








Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el
intervalo ser ms amplio:

()

()





El intervalo de confianza proporciona una estimacin de la precisin de nuestra
estimacin puntual. Si es realmente el valor central de intervalo, entonces estima
sin error. La mayor parte de las veces, sin embargo, no ser exactamente igual a y
la estimacin puntual es errnea. La magnitud de este error ser el valor absoluto de
la diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia
no exceder

.
Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un
nivel de confianza del 95%.

Definicin
Si y son los valores de la media y la desviacin estndar de una muestra aleatoria
de tamao de una poblacin normal, entonces
n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /


Es un intervalo con ( ) de confianza para la media de la poblacin.
Se realizo un estudio sobre la utilizacin del agua en una pequea ciudad. Para ello se
considero una muestra de 25 casa. El nmero de galones de agua que utilizan por da
(1 galn 0.0037854 m3) fue el siguiente:


Con base en esta informacin:
a) Hallar un intervalo de confianza del 90%


n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /


() (

) () (

)


Problema
A partir de 860 cuentas, un analista financiero toma una muestra aleatoria de 16
cuentas. Los saldos observados en la muestra son los siguientes: 165, 150, 300, 240,
250, 150, 300, 200, 140, 240, 260, 180, 190, 230, 350,360.
Determinar un i nterval o de confianza del 90% para estimar el saldo medio
de todas las cuentas.



() (

) () (

)


Ejercicio
Se selecciono una muestra aleatoria de 25 cuentas por cobrar de un registro que
contena 96 cuentas. La muestra dio una media de x = 2435colones y una desviacin
tpica de S = 335 colones. Obtngase un intervalo de confianza del 99% para estimar
la media de las 96 cuentas del registro.
Ejercicio
El auditor de una empresa al examinar los registros de facturacin mensual, mediante
el anlisis de una muestra aleatoria irrestricta de 10 facturas no pagadas encontr que
la media aritmtica fue de x = $9500 con una desviacin tpica de s = $327. Construir
un intervalo de confianza del 95%para estimar el parmetro poblacional.
Ejercicio
Una muestra aleatoria del proceso de produccin de 17 bombillos, dio una media de x
= 128 horas, con una desviacin tpica s = 15 horas. Construir un intervalo de
confianza del 99% para estimar el promedio de vida til de todos los bombillos del
proceso.
Definicin
Si

son los valores de las medias de muestras aleatorias independientes de


tamao

de poblaciones normales con las varianzas conocidas

,
entonces
2
2
2
1
2
1
2 /
2 1
2 1
2
2
2
1
2
1
2 /
2 1 ) ( ) (
n n
z x x
n n
z x x
a a
o o o o
+ - + < < + -
Es un intervalo de confianza del ( ) para la diferencia entre las dos medias
de las poblaciones.

Definicin
Si
1
x , 2 x
,
1
s

y

2
s

son los valores de las medias y desviaciones estndar de variables
aleatorias independientes de tamao n
1
y n
2
de poblaciones normales con varianzas
iguales, entonces

2 1
2 , 2 /
2 1
2 1
2 1
2 , 2 /
2 1
1 1
) (
1 1
) (
2 1 2 1
n n
s t x x
n n
s t x x
p n n a p n n a
+ - + < < + -
+ +

Es un intervalo de confianza del ( ) % 100 1 o

para la diferencia entre las dos medias
de las poblaciones.


Definicin
Si X es una variable aleatoria binomial con los parmetros n

y n , u

es grande y
.
u
y
n
x
, entonces

n
z
n
z
a a
) 1 ( ) 1 (
2 / 2 /
. . . .
.

- + < <

-
u u
u u
u u
u
Es un intervalo de confianza aproximado del ( ) % 100 1 o

para u



Definicin
Si

es una variable aleatoria binomial con los parmetros


1
n
y
2 1
, x u
es una variable
aleatoria binomial con los parmetros
2
n
y
2
u
,
1
n
y
2
n
son grandes,
1
1
1
n
x
=
.
u
y
2
2
2
n
x
=
.
u
, entonces
2
2 2
1
1 1
2 /
2 1
2 1
2
2
2
1
1 1
2 /
2 1
) 1 ( ) 1 (
) (
) 1 ( ) 1 (
) (
n n
z
n n
z
. . . .
. .
. . . .
. .

+

- < <

-
u u u u
u u u u
u u u u
u u
o o

Es un intervalo de confianza aproximado de
( ) % 100 1 o
para
2 1
u u
.

Definicin
Si
n
x
=
.
u se usa como un estimador de u
,

podemos afirmar con ( ) % 100 1 o de
confianza que el error es menor que
n
z
) 1 (
2 /
. .

-
u u
o













La estimacin de varianzas

Si
2
s es el valor de la varianza de una muestra aleatoria de tamaou


de una
poblacin normal, entonces
x x n n
s n s n
2
1 , 2 /
2
2
2
1 , 2 /
2
) 1 ( ) 1 (

< <

o o
o
Es un intervalo de confianza del ( ) % 100 1 o

para
2
o .

















TEOREMA 11.9 Si es el valor de la varianza de una muestra aleatoria de tamao


de una
poblacin normal, entonces



4.6 Errores tipo I y II
El error tipo I se define como el rechazo de la hiptesis nula H
o
cuando sta es
verdadera. Tambin es conocido como nivel de significancia.
El error tipo II error se define como la aceptacin de la hiptesis nula cuando
sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones
diferentes que determinan si la decisin final es correcta o errnea.
Decisin H
o
es verdadera H
o
es falsa
Aceptar H
o
No hay error Error tipo II
Rechazar H
o
Error tipo I No hay error


Ya se ha mostrado cmo puede estimarse un parmetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo,
muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una
decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de
la inferencia estadstica, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse
como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de
una o ms poblaciones.
4.7 Contraste de hiptesis unilateral y bilateral
Se pueden presentar tres tipos de ensayo de hiptesis que son:
- Unilateral Derecho
- Unilateral Izquierdo
- Bilateral
Dependiendo de la evaluacin que se quiera hacer se seleccionar el tipo de ensayo.
- Unilateral Derecho. El investigador desea comprobar la hiptesis de un
aumento en el parmetro, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptacin y de rechazo.
Ensayo de hiptesis:






- Unilateral Izquierdo: El investigador desea comprobar la hiptesis de una
disminucin en el parmetro, en este caso el nivel de significancia se carga
todo hacia el lado izquierdo, para definir las regiones de aceptacin y de
rechazo.
Ensayo de hiptesis:






- Bilateral: El investigador desea comprobar la hiptesis de un cambio en el
parmetro. El nivel de significancia se divide en dos y existen dos regiones de
rechazo.
Ensayo de hiptesis:







La hiptesis nula, representada por H
o
, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a
priori").
La hiptesis alternativa, representada por H
1
, es la afirmacin contradictoria a H
o
, y
sta es la hiptesis del investigador.
Problema
1. Una muestra aleatoria de 100 muertes registradas en Monclova el ao pasado
muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media hoy en da es
mayor que 70 aos? Utilice un nivel de significancia de 0.05.
Solucin:
a. Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
b. Datos:

c. Ensayo de hiptesis




d. Regla de decisin:


e. Clculos:


f. Justificacin y decisin.
Como 2.02 >1.645 se rechaza H
o
y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.
Problema
2. Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
de forma aproximadamente normal con una media de 800 horas y una
desviacin estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene
una duracin promedio de 788 horas, muestran los datos suficiente evidencia
para decir que la duracin media ha cambiado? Utilice un nivel de significancia
del 0.04.
Solucin:
a) Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
b) Datos:

c) Ensayo de hiptesis




d) Regla de Decisin:


e) Clculos:


f) Justificacin y decisin:
Como por lo tanto, no se rechaza H
o
y se concluye
con un nivel de significancia del 0.04 que la duracin media de los focos no ha
cambiado.



Proyecto

1. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa.

2. Se registraron las siguientes mediciones de tiempo de secado en horas de una
marca de pintura ltex, 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8, 5.6, 5.2, 2.9, 3.7, 3.0,
3.6, 2.8, 4.8, suponiendo que las distribuciones representan una muestra
aleatoria de una poblacin normal. Encuentre los lmites de tolerancia para un I
de C del 95%.

3. Una muestra de 12 latas de sopa producida por cierta compaa produjo los
siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8
11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza del
95% para el peso promedio de todas las latas de sopa producidas por la
compaa.
4. Un experimentador quiere verificar la variablidad de un equipo diseado para
medir el volumen de una fuente de audio frecuencia, tres mediciones
independientes registradas con este equipo fueron 4.1, 5.2, 10.2, estime
2
o .

5. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos, esto parece indicar que la vida media hoy
en da es mayor que 70 aos? Utilice un nivel de significancia de 0.05

6. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas
de la variabilidad de los resultados que producen muestras estndar. En un
estudio de la cantidad de calcio en el agua potable, el cual se efecta como
parte del control de calidad, se analiz seis veces la misma muestra en el
laboratorio en intervalos aleatorios. Los seis resultados en partes por milln
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados
de la poblacin para este estndar, usando un nivel de confianza del 90%.

7. Para tratar de estimar la media de consumo por cliente, en un gran restaurante,
se reunieron datos de una muestra de 49 clientes durante un periodo de tres
semanas. Si la media de la muestra es de $ 22.60 dlares, Cul es el
intervalo de confianza de 95% para la media de la poblacin?

8. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 96% y 98% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
9. Los salarios diarios en una industria particular presentan una distribucin
normal con una media de $13.20 y una desviacin estndar de $2.50. Si en
esta industria una compaa que emplea a 40 trabajadores les paga en
promedio $12.20, puede acusarse a esta compaa de pagar salarios
inferiores?, utilice un 05 . 0 = o

20 . 13 :
20 . 13 :
0
<
=

A
H
H

10. Cinco mediciones del contenido de alquitrn de cierta clase de cigarrillos dieron
cigarrillo
mg
y 6 . 14 3 . 14 , 4 . 14 , 2 . 14 , 5 . 14
. Suponga que los datos son una
muestra aleatoria de una poblacin normal, demuestre que para un 0.05 de
significancia se debe rechazar la hiptesis nula 0 . 14 = en favor de la
alternativa 0 . 14 =

11. El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora
que gastan varios aparatos electrodomsticos. Se afirma que una aspiradora
gasta un promedio de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12
hogares que se incluye en un estudio planeado indica que las aspiradoras
gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar
de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que
las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente?
Suponga que la poblacin de kilowatt-hora es normal.

12. El departamento de seguridad de una fbrica quiere saber si el verdadero
tiempo promedio que el guardin nocturno tarda en hacer su ronda es 30 min.
Si, en una muestra aleatoria de 32 rondas, el guardin nocturno promedi 30.8
minutos con una desviacin estndar de 1.5 minutos, determine si sta es
evidencia suficiente para rechazar la hiptesis nula min 30 = a favor de la
hiptesis alternativa min 30 = . Use un nivel de significancia del 0.01.
13. Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en pomedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de
que = 5.5 onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de
significamcia de 0.05.
14. Se sabe que los voltajes de una marca de pilas tamao C se distribuyen
normalmente, se prob una muestra aleatoria de 15 y se encontr que la media
es de 1.4 volts con una desviacin estndar de 0.21 volts. En el nivel de
significancia de 0.01:
a. Indica esto que la media de los voltajes es menor que 1.5 volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de
las pilas es de 1.3 volts.

15. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use 01 . 0 = o .
16. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra s
2
= 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use = 0.05.

Unidad V
Regresin y correlacin

5.1 Control de calidad

Actualmente, todas las empresas modernas saben que lograr un buen nivel de calidad
es fundamental para el xito de su gestin.
La obtencin de este objetivo, no solo es importante desde el punto de vista de la
competencia, sino tambin para la satisfaccin de las necesidades humanas.
Estas necesidades humanas evolucionan constantemente, hay cada da mayor
demanda de mejor precisin, ms exactitud, intercambiabilidad, confort, etc. y lo que
hoy acepta el consumidor, maana puede rechazarlo, pues esta demanda de la cual
estamos hablando, se perfecciona cada da, y toda empresa que no se adapte a este
movimiento continuo corre el riesgo de quedar desplazada a corto plazo.
Para marchar al comps de este ritmo se hacen necesarios mejores instrumentos,
maquinarias, mtodos, etc., y lo que es ms importante, un mejor aprovechamiento de
los mismos, es decir, obtener mejor calidad con la misma cantidad de dinero. Para
lograr este objetivo debemos recurrir al control estadstico de calidad, como una de las
armas ms poderosas para la realizacin de todas estas ideas.
El objetivo de este tema es tener una buena informacin de las herramientas
existentes para el control estadstico de la calidad, pero debemos dejar bien claro que
los objetivos de calidad no se logran esgrimiendo solamente estas herramientas
estadsticas. Hoy en da, el concepto de Control Total de Calidad, ensea claramente
que todos los niveles de la empresa estn involucrados en la obtencin de la mejor
calidad del producto, y que ste objetivo no es, de ninguna manera, responsabilidad
exclusiva de los departamentos tcnicos especializados en el control estadstico de la
calidad, sino de todos los integrantes de la empresa, desde el ms humilde empleado,
al ms importante de los gerentes.
Definicin de la calidad
Definiremos dos aspectos de la calidad, la Calidad del Diseo y la Calidad del
Producto.
Entendemos por Calidad del Diseo al grado de concordancia entre el diseo y el fin
para el cual fue creado, y por Calidad del Producto, al grado de conformidad entre el
producto y su diseo.
El objetivo de los mtodos estadsticos de control en los procesos.
Podramos preguntarnos, qu es un producto defectuoso? o ms concretamente,
qu es un defecto?
Definicin
Un defecto es el incumplimiento de una caracterstica de calidad respecto de un lmite
especificado.
Qu causa los productos defectuosos?
La variacin en los materiales, en las condiciones de la mquina, en los mtodos de
trabajo y en las inspecciones. Estas variaciones son las causas de los productos
defectuosos. Si no existiera ninguna de esas variaciones, todos los productos seran
idnticos y no habra variaciones en la calidad, y no existira la ocurrencia de
productos defectuosos y no defectuosos.
Son todos los defectos iguales? Debemos tratar a todos los defectos por
igual?
El sentido comn nos dice que no a las dos preguntas. No es lo mismo un defecto
considerado leve como ser una imperfeccin superficial en la etiqueta de un producto,
que una medida fuera de especificaciones en un repuesto para motor de automviles
que lo haga absolutamente inservible.
Y consecuentemente, no ser el mismo criterio para tolerar la presencia de ambos
defectos, y eso dar paso a distintos planes de calidad segn el tipo de defecto.
Clasificacin de los defectos, muestrario de defectos.
Defectos crticos: son aquellos que violan leyes, agreden al consumidor o hacen
inservible al producto.
Defectos mayores: producen una disminucin en el correcto funcionamiento o
utilizacin del producto y es notado por el consumidor.
Defectos menores: producen una disminucin leve en el correcto funcionamiento o
utilizacin del producto, probablemente no lo note el consumidor. Pero si lo nota, el
personal calificado de produccin y de control de calidad,
Cada tipo de defecto ser objeto de un estudio acabado por las partes interesadas y
deber finalizar en un muestrario de defectos, debidamente clasificado por tipo de
defecto y firmado por las partes involucradas.
En todos los casos posibles deber construirse el muestrario con defectos situados
justo en los lmites de aceptacin o rechazo.

5.2 Diagrama de dispersin

5.3 Regresin lineal simple

5.4 Correlacin

5.5 Determinacin y anlisis de los coeficientes de correlacin y de
determinacin.

5.6 Distribucin normal bidimensional

5.7 Intervalos de confianza y pruebas para el coeficiente de
correlacin.

5.8 Errores de medicin.

Proyecto V
7. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 3 , 1
8. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 4 , 1
9. En una investigacin sobre costos los pares de valores de ( ) Y X, son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 8 . 6 , 12 , 6 , 11 , 5 , 9 , 6 , 8 , 4 , 7 , 3 , 6 , 4 , 5 , 2 , 3 . Traza el diagrama de
dispersin, la recta de regresin de Y sobre X que consideres por aproximacin
como la ms adecuada.

10. Se dieron diversas dosis de una sustancia venenosa a grupos de 25 ratones y
se observaron los siguientes resultados.

Dosis mg
x
Nmero de muertes
Y
4 1
6 3
8 6
10 8
12 14
14 16
16 20

a) Encuentre la ecuacin de mnimos cuadrados ajustada a estos datos
b) Estime el nmero de muertes en un grupo de 25 ratones que recibieron una
dosis de 7 mg de este veneno

11. stas son las puntuaciones que obtuvieron 12 estudiantes en el examen
semestral y examen final en un curso de estadstica.

Examen semestral
x
Examen final
Y
71 83
49 62
80 76
73 77
93 89
85 74
58 48
82 78
64 76
32 51
87 73
80 89

a) Encuentre la ecuacin de mnimos cuadrados que nos permitir predecir la
puntuacin del estudiante en el examen final en este curso sobre la base de
su puntuacin en el examen final
b) Prediga la puntuacin del examen final de un estudiante que recibi 84 en
el examen semestral
12. La materia prima que se usa en la produccin de una fibra sinttica se
almacena en un lugar que no tiene control de humedad. Las medidas de la
humedad relativa y del contenido de humedad de muestras de al materia prima
en 12 das dieron los siguientes resultados.

Humedad
x
Contenido de humedad
y
46 12
53 14
37 11
42 13
34 10
29 8
60 17
44 12
41 10
48 15
33 9
40 13

a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
b) Use los resultados del inciso (a) para estimar el contenido de humedad
cuando la humedad relativa es del 38%

13. Los siguientes datos corresponden al cloro residual en una alberca en diversos
momentos despus de haberse tratado con qumicos.

Nmero de Horas
x
Cloro residual
(partes por milln)
y
2 1.8
4 1.5
6 1.4
8 1.1
10 1.1
12 0.9

a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
14. La tabla siguiente muestra valores de evaluacin y el precio de venta de ocho
casas, que constituyen una muestra aleatoria de todas las casas vendidas
recientemente en cierta rea de la ciudad.

Valores de valuacin
x
Precio de venta
Y
70.3 114.4
102 169.3
62.5 106.2
74.8 125
57.9 99.8
81.6 132.1
110.4 174.2
88 143.5

a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el precio
de venta en trminos de su evaluacin
15. La tabla siguiente muestra el alargamiento de varillas de acero de de la misma
composicin y dimetro cuando se sujetan a varias fuerzas de tensin.

Fuerza
X
Alargamiento
Y
1.2 15.6
5.3 80.3
3.1 39
2.2 34.3
4.1 58.2
2.6 36.7
6.5 88.9
8.3 111.5
7.6 99.8
4.9 65.7

a) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
alargamiento de las varillas de acuerdo a la fuerza establecida
16. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 . 7 , 6 , 3 . 5 , 6 , 2 . 5 , 5 , 2 . 4 , 5 . 4 , 3 . 4 , 4 , 3 , 4 , 3 , 3 , 5 . 1 , 5 . 2 , 3 . 2 , 2 , 1 , 5 . 1
(23.3 puntos)
17. Los trabajadores de a las proveedoras de la maquiladora a que nos referimos,
piden a los dueos de una maquiladora que para tener mejores condiciones de
salud de sus familias necesitan cotizar en el Seguro Social y es necesario
cambiar las condiciones de pago. Se conviene en pagar un sueldo base
equivalente q un salario mnimo, que por la zona donde estn es de 45 pesos,
y sobre esta cantidad continuar recibiendo 5 pesos por pieza entregada. El
cuadro de percepciones queda as:

Piezas 10 15 20 25 32 35 38 45
Pago 95 120 145 170 205 220 235 270

Traza el diagrama de dispersin, la grfica y expresa la ecuacin de la curva
correspondiente.


http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml

De Wikipedia, la enciclopedia libre


CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o
clasificacin de las personas cuando atienden caractersticas tales como peso,
estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos
primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante
la frmula:

k= 1,2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
- Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.

- El 60 percentil, es aquel valor de la variable que supera al 60% de las
observaciones y es superado por el 40% de las observaciones.

- El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
Frmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
frmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa
(I. De Clases) Empleados (f1)

200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la frmula

Siendo,
La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30.
Entonces,


El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin:
324.1 295 = 29.1
Li = 500, fi = 70

El percentil 30
Posicin:

138.9 85 = 53.9
fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo
de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el
70% de los empleados.

Hay 99 percentiles que se denotan: P
1
, P
2
, P
3
,......., P98, P
99
. As P
90
, por ejemplo, deja
por debajo de l el 90% de los elementos.
La frmula para realizar el clculo del percentil 45, por ejemplo sera:

)
100
45
(
45 i
f
N
f
I
l P + =

Ejercicio: De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el
sptimo decil y los percentiles 8 y 73.

Resp: Q
1
= 34,82; Q
3
= 47,36; D
2
= 32,85; D
7
= 45,83; P
8
= 26,94; P
73
= 46,75.

Obsrvese que entre los 6 cuantiles calculados, aparecen valores muy parecidos. En
particular se dan las siguientes coincidencias:
El segundo cuartil equivale a la mediana
El quinto decil y el quincuagsimo percentil se corresponden tambin con la
mediana.
Los percentiles P
25
y P
75
se corresponden con el primer y tercer cuartil,
respectivamente.

Los percentiles son valores que resultan de dividir la poblacin (el N de las
observaciones) en cien partes iguales (1% en cada una).
Clculo para datos sin agrupar
El percentil se obtiene identificando el valor que para la variable en cuestin tiene el
individuo que ocupa la posicin j%
Clculo para datos agrupados
Clculo a partir de la frecuencia relativa

Se debe tener en cuenta que cuando j es un valor entre 1 y 9 inclusive se debe escribir
0,0j en el numerador en lugar de 0,j
Percentiles y datos percentiles
La expresin percentil se usa para indicar en una distribucin de observaciones, el
valor por debajo del cual est situado cierto porcentaje de distribuciones de valores,
por ejemplo, al decir que en una distribucin de estaturas el 15.28% de los alumnos
mide 144.5 o menos, se expresa:
5 . 144
28 . 15
= P Estamos afirmando que el 15.28% de los alumnos est por debajo de
144.5 cm. de estatura.
Se presentan dos problemas relacionados al uso de percentiles:
- Obtener el valor de la abscisa x que corresponde a un valor percentil, y
- Obtener el rango percentil correspondiente a un valor de la abscisa
Solucin
1. Si conocemos el valor de x obtenemos el rango percentil
En la grfica de la ojiva se traza, por el punto x conocido, una paralela al eje de
las ordenadas hasta intersectar la ojiva y desde el punto de interseccin se
traza una paralela al eje de las abscisas y obtenemos el rango percentil .
y
P
2. Si conocemos el percentil (valor de y) obtenemos el valor de la abscisa x.
Se traza por el punto que corresponde al percentil y ( )
y
P , una paralela al eje de
las abscisas hasta intersectar la ojiva; desde el punto de interseccin se baja
una perpendicular al eje de las x.



Unidad IV
4.1 Inferencia estadstica
La estadstica inferencial se define como la rama de la estadstica que proporciona
tcnicas o procedimientos para analizar, interpretar y tomar decisiones sobre una
poblacin, con base en la informacin que se obtiene de una muestra.
Esta generalizacin de tipo inductivo, se basa en la probabilidad. Tambin se le llama
estadstica matemtica, por su complejidad matemtica en relacin a la estadstica
descriptiva.
Tiene como objetivo generalizar las propiedades de la poblacin bajo estudio, basado
en los resultados de una muestra representativa de la poblacin.
El estudio de una poblacin tomando como base las muestras se llama estadstica
inferencial o inductiva, Teora de muestras.
La Inferencia estadstica persigue la obtencin de conclusiones sobre la poblacin
mediante los datos obtenidos de una muestra, e incluye;
- Teora de la muestra
- Estimacin de parmetros
4.2 Muestreo estadstico
Uno de los propsitos de la estadstica inferencial es estimar las caractersticas
poblacionales desconocidas, examinando la informacin obtenida de una muestra, de
una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la
poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden
hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras
representativas de la misma.
El tamao de la muestra debe calcularse utilizando tcnicas estadsticas.
La seleccin de la muestra debe hacerse en forma aleatoria.
La estimacin de las caractersticas de la poblacin debe hacerse de acuerdo a las
leyes de la estadstica.
Una aplicacin de muestreo que no cumpla con alguno de estos tres requisitos se
considera muestreo no estadstico. El muestreo estadstico posee algunas ventajas
con respecto al muestreo no estadstico, entre ellas las siguientes:
- Permite seleccionar de antemano el nivel de confianza de la prueba, es decir la
probabilidad de que las conclusiones obtenidas del muestreo sean correctas.
- La seleccin aleatoria impide que los prejuicios o preferencias del auditor
favorezcan la seleccin de algunos elementos de la poblacin en desmedro de
otros.
- Permite limitar el tamao de la muestra al mnimo necesario, evitando
realizar pruebas de auditora sobre una cantidad mayor de elementos.
- Los resultados de la prueba se expresan matemticamente en trminos
precisos, permitiendo elaborar recomendaciones sobre una base ms objetiva.
- Permite hacer ms defendibles las conclusiones de la prueba.
Una poblacin est formada por la totalidad de las observaciones en las cuales se
tiene una cierta observacin.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.
Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan
muestras por muchas razones; una enumeracin completa de la poblacin, llamada
censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
7. Poltica. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.
8. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes
se usan para determinar la eficiencia de una tcnica o programa de enseanza.
9. Industria. Muestras de los productos de una lnea de ensamble sirve para
controlar la calidad.
10. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos
prueban la eficacia de una tcnica o de un frmaco nuevo.
11. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la
produccin los efectos de un fertilizante nuevo.
12. Gobierno. Una muestra de opiniones de los votantes se usara para determinar
los criterios del pblico sobre cuestiones relacionadas con el bienestar y la
seguridad nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadsticos para estimar valores
poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
El error muestral se refiere a la variacin natural existente entre muestras tomadas de
la misma poblacin.
Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamao sean representativas de
una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus
detalles. El error muestral es un concepto importante que ayudar a entender mejor la
naturaleza de la estadstica inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere
a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones
de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo
positivo) que el parmetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.
La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la
poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemtico.
Muestreo Aleatorio Simple
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
El objetivo principal de un diseo muestral es hacer uso eficiente del presupuesto
asignado para un estudio obteniendo un estimativo tan preciso como sea posible de
una cantidad de la poblacin. El muestreo aleatorio simple es la tcnica de muestreo
ms bsica que no slo asegura una muestra representativa sino que tambin produce
una estimacin de la cantidad de una poblacin y una especificacin de la precisin.
Muchas ramificaciones han evolucionado a partir de este concepto central del
muestreo aleatorio simple que permite alcanzar inferencias ms precisas para
diferentes tipos de poblaciones.
Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo
de estadstica de 20 alumnos.
20
C
5
da el nmero total de formas de elegir una muestra
no ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y despus los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despus extraer cinco papeles al mismo tiempo.
Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20
utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y
los revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la
tabla, se regresa al recipiente y despus de revolver otra vez se selecciona la seguida
tira que determina el segundo nmero de la tabla; el proceso contina hasta obtener
una tabla de dgitos aleatorios con tantos nmeros como se desee.
Muestreo Simple
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para
las encuestas nacionales de opinin sobre productos o sobre elecciones
presidenciales, sera muy costoso o tardado.
Error Muestral
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la
media poblacional , entonces la media muestral, como medida, conlleva algn error.
Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de
una poblacin con media : si la media de la muestra es , entonces a la
diferencia observada se le denomina el error muestral. Una media
muestral puede pensarse como la suma de dos cantidades, la media poblacional y
el error muestral; si e denota el error muestral, entonces:

Ejemplo 1.5
Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y
6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse
un gran nmero de veces, supondremos que ste se hace con remplazo, es decir, el
nmero elegido se remplaza antes de seleccionar el siguiente, adems, se
seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se
seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y
despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de
tamao 2 que es posible seleccionar con remplazo y tambin contiene las medias
muestrales y los correspondientes errores muestrales. La media poblacional es igual a

= (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina.
4.3 Estimadores
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. En los problemas de estimacin debemos
determinar el valor de un parmetro de un continuo posible de alternativas.
Los estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus
valores.
4.4 Estimacin puntual
Una estimacin es puntual cuando se usa un solo valor extrado de la muestra para
estimar el parmetro desconocido de la poblacin. Al valor usado se le llama
estimador.
- La media de la poblacin se puede estimar puntualmente mediante la media de
la muestra:

- La proporcin de la poblacin se puede estimar puntualmente mediante la
proporcin de la muestra:

- La desviacin estndar (tpica) de la poblacin se puede estimar puntualmente
mediante la desviacin tpica de la muestra, aunque hay mejores estimadores:

Todo nuestro estudio se basa en la normalidad de las distribuciones que empleamos.

4.5 Estimacin por intervalo
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten
dar un valor aproximado de un parmetro de una poblacin a partir de los datos
proporcionados por una muestra. Por ejemplo, una estimacin de la media de una
determinada caracterstica de una poblacin de tamao N podra ser la media de esa
misma caracterstica para una muestra de tamao n.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:
- Estimacin puntual:
o Mtodo de los momentos;
o Mtodo de la mxima verosimilitud;
o Mtodo de los mnimos cuadrados;
- Estimacin por intervalos.
Intervalo de confianza
En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales
se estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir
de datos de una muestra, y el valor desconocido es un parmetro poblacional. La
probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de
confianza. En estas circunstancias, es el llamado error aleatorio o nivel de
significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un
intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumentan sus posibilidades de error.
Estimacin para la Media (Normal)
Sabemos que en base a la distribucin muestral de medias que se gener en el tema
anterior, la formula para el clculo de probabilidad es la siguiente

. Como en
este caso no conocemos el parmetro y lo queremos estimar por medio de la media de
la muestra, slo se despejar de la formula anterior, quedando de la siguiente
manera.


De esta formula se puede observar que tanto el tamao de la muestra como el valor
de z se conocern. Z se puede obtener de la tabla de la distribucin normal a partir del
nivel de confianza establecido. Pero en ocasiones se desconoce por lo que en esos
casos lo correcto es utilizar otra distribucin llamada "t" de student si la poblacin de
donde provienen los datos es normal.
Estimacin t-Student
Definicin
Si es el valor de la media de una muestra aleatoria de tamao n de una poblacin
normal con la varianza conocida

, entonces


Es un intervalo de confianza de ( ) para la media de la poblacin.
Problema
2. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
Solucin:
La estimacin puntual de es . El valor de z para un nivel de confianza
del 95% es 1.96, por lo tanto:

()

()








Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el
intervalo ser ms amplio:

()

()





El intervalo de confianza proporciona una estimacin de la precisin de nuestra
estimacin puntual. Si es realmente el valor central de intervalo, entonces estima
sin error. La mayor parte de las veces, sin embargo, no ser exactamente igual a y
la estimacin puntual es errnea. La magnitud de este error ser el valor absoluto de
la diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia
no exceder

.
Como se puede observar en los resultados del ejercicio se tiene un error de estimacin
mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un
nivel de confianza del 95%.

Definicin
Si y son los valores de la media y la desviacin estndar de una muestra aleatoria
de tamao de una poblacin normal, entonces
n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /


Es un intervalo con ( ) de confianza para la media de la poblacin.
Se realizo un estudio sobre la utilizacin del agua en una pequea ciudad. Para ello se
considero una muestra de 25 casa. El nmero de galones de agua que utilizan por da
(1 galn 0.0037854 m3) fue el siguiente:


Con base en esta informacin:
b) Hallar un intervalo de confianza del 90%


n
s
t x
n
s
t x
n a n a
- + < < -
1 , 2 / 1 , 2 /


() (

) () (

)


Problema
A partir de 860 cuentas, un analista financiero toma una muestra aleatoria de 16
cuentas. Los saldos observados en la muestra son los siguientes: 165, 150, 300, 240,
250, 150, 300, 200, 140, 240, 260, 180, 190, 230, 350,360.
Determinar un i ntervalo de confianza del 90% para estimar el saldo medio
de todas las cuentas.



() (

) () (

)


Ejercicio
Se selecciono una muestra aleatoria de 25 cuentas por cobrar de un registro que
contena 96 cuentas. La muestra dio una media de x = 2435colones y una desviacin
tpica de S = 335 colones. Obtngase un intervalo de confianza del 99% para estimar
la media de las 96 cuentas del registro.
Ejercicio
El auditor de una empresa al examinar los registros de facturacin mensual, mediante
el anlisis de una muestra aleatoria irrestricta de 10 facturas no pagadas encontr que
la media aritmtica fue de x = $9500 con una desviacin tpica de s = $327. Construir
un intervalo de confianza del 95%para estimar el parmetro poblacional.
Ejercicio
Una muestra aleatoria del proceso de produccin de 17 bombillos, dio una media de x
= 128 horas, con una desviacin tpica s = 15 horas. Construir un intervalo de
confianza del 99% para estimar el promedio de vida til de todos los bombillos del
proceso.
Definicin
Si

son los valores de las medias de muestras aleatorias independientes de


tamao

de poblaciones normales con las varianzas conocidas

,
entonces
2
2
2
1
2
1
2 /
2 1
2 1
2
2
2
1
2
1
2 /
2 1 ) ( ) (
n n
z x x
n n
z x x
a a
o o o o
+ - + < < + -
Es un intervalo de confianza del ( ) para la diferencia entre las dos medias
de las poblaciones.

Definicin
Si
1
x , 2 x
,
1
s

y

2
s

son los valores de las medias y desviaciones estndar de variables
aleatorias independientes de tamao n
1
y n
2
de poblaciones normales con varianzas
iguales, entonces

2 1
2 , 2 /
2 1
2 1
2 1
2 , 2 /
2 1
1 1
) (
1 1
) (
2 1 2 1
n n
s t x x
n n
s t x x
p n n a p n n a
+ - + < < + -
+ +

Es un intervalo de confianza del ( ) % 100 1 o

para la diferencia entre las dos medias
de las poblaciones.


Definicin
Si X es una variable aleatoria binomial con los parmetros n

y n , u

es grande y
.
u
y
n
x
, entonces

n
z
n
z
a a
) 1 ( ) 1 (
2 / 2 /
. . . .
.

- + < <

-
u u
u u
u u
u
Es un intervalo de confianza aproximado del ( ) % 100 1 o

para u



Definicin
Si

es una variable aleatoria binomial con los parmetros


1
n
y
2 1
, x u
es una variable
aleatoria binomial con los parmetros
2
n
y
2
u
,
1
n
y
2
n
son grandes,
1
1
1
n
x
=
.
u
y
2
2
2
n
x
=
.
u
, entonces
2
2 2
1
1 1
2 /
2 1
2 1
2
2
2
1
1 1
2 /
2 1
) 1 ( ) 1 (
) (
) 1 ( ) 1 (
) (
n n
z
n n
z
. . . .
. .
. . . .
. .

+

- < <

-
u u u u
u u u u
u u u u
u u
o o

Es un intervalo de confianza aproximado de
( ) % 100 1 o
para
2 1
u u
.

Definicin
Si
n
x
=
.
u se usa como un estimador de u
,

podemos afirmar con ( ) % 100 1 o de
confianza que el error es menor que
n
z
) 1 (
2 /
. .

-
u u
o













La estimacin de varianzas

Si
2
s es el valor de la varianza de una muestra aleatoria de tamaou


de una
poblacin normal, entonces
x x n n
s n s n
2
1 , 2 /
2
2
2
1 , 2 /
2
) 1 ( ) 1 (

< <

o o
o
Es un intervalo de confianza del
x x n n
s n s n
2
1 , 2 /
2
2
2
1 , 2 /
2
) 1 ( ) 1 (

< <

o o
o

para
2
o .

















TEOREMA 11.9 Si es el valor de la varianza de una muestra aleatoria de tamao


de una
poblacin normal, entonces



4.6 Errores tipo I y II
El error tipo I se define como el rechazo de la hiptesis nula H
o
cuando sta es
verdadera. Tambin es conocido como nivel de significancia.
El error tipo II error se define como la aceptacin de la hiptesis nula cuando
sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones
diferentes que determinan si la decisin final es correcta o errnea.
Decisin H
o
es verdadera H
o
es falsa
Aceptar H
o
No hay error Error tipo II
Rechazar H
o
Error tipo I No hay error


Ya se ha mostrado cmo puede estimarse un parmetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador
puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo,
muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una
decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de
la inferencia estadstica, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse
como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de
una o ms poblaciones.
4.7 Contraste de hiptesis unilateral y bilateral
Se pueden presentar tres tipos de ensayo de hiptesis que son:
- Unilateral Derecho
- Unilateral Izquierdo
- Bilateral
Dependiendo de la evaluacin que se quiera hacer se seleccionar el tipo de ensayo.
- Unilateral Derecho. El investigador desea comprobar la hiptesis de un
aumento en el parmetro, en este caso el nivel de significancia se carga todo
hacia el lado derecho, para definir las regiones de aceptacin y de rechazo.
Ensayo de hiptesis:






- Unilateral Izquierdo: El investigador desea comprobar la hiptesis de una
disminucin en el parmetro, en este caso el nivel de significancia se carga
todo hacia el lado izquierdo, para definir las regiones de aceptacin y de
rechazo.
Ensayo de hiptesis:






- Bilateral: El investigador desea comprobar la hiptesis de un cambio en el
parmetro. El nivel de significancia se divide en dos y existen dos regiones de
rechazo.
Ensayo de hiptesis:







La hiptesis nula, representada por H
o
, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a
priori").
La hiptesis alternativa, representada por H
1
, es la afirmacin contradictoria a H
o
, y
sta es la hiptesis del investigador.
Problema
3. Una muestra aleatoria de 100 muertes registradas en Monclova el ao pasado
muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media hoy en da es
mayor que 70 aos? Utilice un nivel de significancia de 0.05.
Solucin:
g. Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
h. Datos:

i. Ensayo de hiptesis




j. Regla de decisin:


k. Clculos:


l. Justificacin y decisin.
Como 2.02 >1.645 se rechaza H
o
y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.
Problema
4. Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
de forma aproximadamente normal con una media de 800 horas y una
desviacin estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene
una duracin promedio de 788 horas, muestran los datos suficiente evidencia
para decir que la duracin media ha cambiado? Utilice un nivel de significancia
del 0.04.
Solucin:
g) Se trata de una distribucin muestral de medias con desviacin estndar
conocida.
h) Datos:

i) Ensayo de hiptesis




j) Regla de Decisin:


k) Clculos:


l) Justificacin y decisin:
Como por lo tanto, no se rechaza H
o
y se concluye
con un nivel de significancia del 0.04 que la duracin media de los focos no ha
cambiado.



Proyecto

17. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa.

18. Se registraron las siguientes mediciones de tiempo de secado en horas de una
marca de pintura ltex, 3.4, 2.8, 4.4, 2.5, 3.3, 4.0, 4.8, 5.6, 5.2, 2.9, 3.7, 3.0,
3.6, 2.8, 4.8, suponiendo que las distribuciones representan una muestra
aleatoria de una poblacin normal. Encuentre los lmites de tolerancia para un I
de C del 95%.

19. Una muestra de 12 latas de sopa producida por cierta compaa produjo los
siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8
11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza del
95% para el peso promedio de todas las latas de sopa producidas por la
compaa.
20. Un experimentador quiere verificar la variablidad de un equipo diseado para
medir el volumen de una fuente de audio frecuencia, tres mediciones
independientes registradas con este equipo fueron 4.1, 5.2, 10.2, estime
2
o .

21. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos, esto parece indicar que la vida media hoy
en da es mayor que 70 aos? Utilice un nivel de significancia de 0.05

22. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas
de la variabilidad de los resultados que producen muestras estndar. En un
estudio de la cantidad de calcio en el agua potable, el cual se efecta como
parte del control de calidad, se analiz seis veces la misma muestra en el
laboratorio en intervalos aleatorios. Los seis resultados en partes por milln
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados
de la poblacin para este estndar, usando un nivel de confianza del 90%.

23. Para tratar de estimar la media de consumo por cliente, en un gran restaurante,
se reunieron datos de una muestra de 49 clientes durante un periodo de tres
semanas. Si la media de la muestra es de $ 22.60 dlares, Cul es el
intervalo de confianza de 95% para la media de la poblacin?

24. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de un muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 96% y 98% para
la concentracin media de zinc en el ro. Suponga que la desviacin estndar
de la poblacin es 0.3.
25. Los salarios diarios en una industria particular presentan una distribucin
normal con una media de $13.20 y una desviacin estndar de $2.50. Si en
esta industria una compaa que emplea a 40 trabajadores les paga en
promedio $12.20, puede acusarse a esta compaa de pagar salarios
inferiores?, utilice un 05 . 0 = o

20 . 13 :
20 . 13 :
0
<
=

A
H
H

26. Cinco mediciones del contenido de alquitrn de cierta clase de cigarrillos dieron
cigarrillo
mg
y 6 . 14 3 . 14 , 4 . 14 , 2 . 14 , 5 . 14
. Suponga que los datos son una
muestra aleatoria de una poblacin normal, demuestre que para un 0.05 de
significancia se debe rechazar la hiptesis nula 0 . 14 = en favor de la
alternativa 0 . 14 =

27. El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora
que gastan varios aparatos electrodomsticos. Se afirma que una aspiradora
gasta un promedio de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12
hogares que se incluye en un estudio planeado indica que las aspiradoras
gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar
de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que
las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente?
Suponga que la poblacin de kilowatt-hora es normal.

28. El departamento de seguridad de una fbrica quiere saber si el verdadero
tiempo promedio que el guardin nocturno tarda en hacer su ronda es 30 min.
Si, en una muestra aleatoria de 32 rondas, el guardin nocturno promedi 30.8
minutos con una desviacin estndar de 1.5 minutos, determine si sta es
evidencia suficiente para rechazar la hiptesis nula min 30 = a favor de la
hiptesis alternativa min 30 = . Use un nivel de significancia del 0.01.
29. Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en pomedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de
que = 5.5 onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de
significamcia de 0.05.
30. Se sabe que los voltajes de una marca de pilas tamao C se distribuyen
normalmente, se prob una muestra aleatoria de 15 y se encontr que la media
es de 1.4 volts con una desviacin estndar de 0.21 volts. En el nivel de
significancia de 0.01:
c. Indica esto que la media de los voltajes es menor que 1.5 volts?
d. Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de
las pilas es de 1.3 volts.

31. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use 01 . 0 = o .
32. Una compaa que produce una parte maquinada para un motor, afirma que
tiene una varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra
aleatoria de 10 de dichas partes dio una varianza de muestra s
2
= 0.0003. Si se
supone que las medidas del dimetro se distribuyen en forma normal, hay
evidencia para refutar lo que afirma el proveedor? Use = 0.05.

Unidad V
Regresin y correlacin

5.1 Control de calidad

5.2 Diagrama de dispersin

5.3 Regresin lineal simple

5.4 Correlacin

5.5 Determinacin y anlisis de los coeficientes de correlacin y de
determinacin.

5.6 Distribucin normal bidimensional

5.7 Intervalos de confianza y pruebas para el coeficiente de
correlacin.

5.8 Errores de medicin.

Proyecto V
18. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 3 , 1
19. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 7 , 9 , 8 , 8 , 6 , 7 , 8 , 6 , 4 , 5 , 5 , 4 , 2 , 3 , 1 , 2 , 4 , 1
20. En una investigacin sobre costos los pares de valores de ( ) Y X, son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 8 . 6 , 12 , 6 , 11 , 5 , 9 , 6 , 8 , 4 , 7 , 3 , 6 , 4 , 5 , 2 , 3 . Traza el diagrama de
dispersin, la recta de regresin de Y sobre X que consideres por aproximacin
como la ms adecuada.

21. Se dieron diversas dosis de una sustancia venenosa a grupos de 25 ratones y
se observaron los siguientes resultados.

Dosis mg
x
Nmero de muertes
Y
4 1
6 3
8 6
10 8
12 14
14 16
16 20

c) Encuentre la ecuacin de mnimos cuadrados ajustada a estos datos
d) Estime el nmero de muertes en un grupo de 25 ratones que recibieron una
dosis de 7 mg de este veneno

22. stas son las puntuaciones que obtuvieron 12 estudiantes en el examen
semestral y examen final en un curso de estadstica.

Examen semestral
x
Examen final
Y
71 83
49 62
80 76
73 77
93 89
85 74
58 48
82 78
64 76
32 51
87 73
80 89

c) Encuentre la ecuacin de mnimos cuadrados que nos permitir predecir la
puntuacin del estudiante en el examen final en este curso sobre la base de
su puntuacin en el examen final
d) Prediga la puntuacin del examen final de un estudiante que recibi 84 en
el examen semestral
23. La materia prima que se usa en la produccin de una fibra sinttica se
almacena en un lugar que no tiene control de humedad. Las medidas de la
humedad relativa y del contenido de humedad de muestras de al materia prima
en 12 das dieron los siguientes resultados.

Humedad
x
Contenido de humedad
y
46 12
53 14
37 11
42 13
34 10
29 8
60 17
44 12
41 10
48 15
33 9
40 13

c) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
d) Use los resultados del inciso (a) para estimar el contenido de humedad
cuando la humedad relativa es del 38%

24. Los siguientes datos corresponden al cloro residual en una alberca en diversos
momentos despus de haberse tratado con qumicos.

Nmero de Horas
x
Cloro residual
(partes por milln)
y
2 1.8
4 1.5
6 1.4
8 1.1
10 1.1
12 0.9

b) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
contenido de humedad en trminos de humedad relativa
25. La tabla siguiente muestra valores de evaluacin y el precio de venta de ocho
casas, que constituyen una muestra aleatoria de todas las casas vendidas
recientemente en cierta rea de la ciudad.

Valores de valuacin
x
Precio de venta
Y
70.3 114.4
102 169.3
62.5 106.2
74.8 125
57.9 99.8
81.6 132.1
110.4 174.2
88 143.5

b) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el precio
de venta en trminos de su evaluacin
26. La tabla siguiente muestra el alargamiento de varillas de acero de de la misma
composicin y dimetro cuando se sujetan a varias fuerzas de tensin.

Fuerza
X
Alargamiento
Y
1.2 15.6
5.3 80.3
3.1 39
2.2 34.3
4.1 58.2
2.6 36.7
6.5 88.9
8.3 111.5
7.6 99.8
4.9 65.7

b) Ajuste una lnea de mnimos cuadrados que nos permitir predecir el
alargamiento de las varillas de acuerdo a la fuerza establecida
27. Obtener el coeficiente r de correlacin lineal del producto-momento, as como
el diagrama de dispersin si las coordenadas de (X, Y) son:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 3 . 7 , 6 , 3 . 5 , 6 , 2 . 5 , 5 , 2 . 4 , 5 . 4 , 3 . 4 , 4 , 3 , 4 , 3 , 3 , 5 . 1 , 5 . 2 , 3 . 2 , 2 , 1 , 5 . 1
(23.3 puntos)
28. Los trabajadores de a las proveedoras de la maquiladora a que nos referimos,
piden a los dueos de una maquiladora que para tener mejores condiciones de
salud de sus familias necesitan cotizar en el Seguro Social y es necesario
cambiar las condiciones de pago. Se conviene en pagar un sueldo base
equivalente q un salario mnimo, que por la zona donde estn es de 45 pesos,
y sobre esta cantidad continuar recibiendo 5 pesos por pieza entregada. El
cuadro de percepciones queda as:

Piezas 10 15 20 25 32 35 38 45
Pago 95 120 145 170 205 220 235 270

Traza el diagrama de dispersin, la grfica y expresa la ecuacin de la curva
correspondiente.


http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml

De Wikipedia, la enciclopedia libre


CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o
clasificacin de las personas cuando atienden caractersticas tales como peso,
estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos
primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante
la frmula:

k= 1,2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
- Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.

- El 60 percentil, es aquel valor de la variable que supera al 60% de las
observaciones y es superado por el 40% de las observaciones.

- El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
Frmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
frmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa
(I. De Clases) Empleados (f1)

200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la frmula

Siendo,
La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30.
Entonces,


El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin:
324.1 295 = 29.1
Li = 500, fi = 70

El percentil 30
Posicin:

138.9 85 = 53.9
fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo
de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el
70% de los empleados.

Hay 99 percentiles que se denotan: P
1
, P
2
, P
3
,......., P98, P
99
. As P
90
, por ejemplo, deja
por debajo de l el 90% de los elementos.
La frmula para realizar el clculo del percentil 45, por ejemplo sera:

)
100
45
(
45 i
f
N
f
I
l P + =

Ejercicio: De la siguiente serie hallar el primero y el tercer cuartil, el segundo y el
sptimo decil y los percentiles 8 y 73.

Resp: Q
1
= 34,82; Q
3
= 47,36; D
2
= 32,85; D
7
= 45,83; P
8
= 26,94; P
73
= 46,75.

Obsrvese que entre los 6 cuantiles calculados, aparecen valores muy parecidos. En
particular se dan las siguientes coincidencias:
El segundo cuartil equivale a la mediana
El quinto decil y el quincuagsimo percentil se corresponden tambin con la
mediana.
Los percentiles P
25
y P
75
se corresponden con el primer y tercer cuartil,
respectivamente.

Los percentiles son valores que resultan de dividir la poblacin (el N de las
observaciones) en cien partes iguales (1% en cada una).
Clculo para datos sin agrupar
El percentil se obtiene identificando el valor que para la variable en cuestin tiene el
individuo que ocupa la posicin j%
Clculo para datos agrupados
Clculo a partir de la frecuencia relativa

Se debe tener en cuenta que cuando j es un valor entre 1 y 9 inclusive se debe escribir
0,0j en el numerador en lugar de 0,j
Percentiles y datos percentiles
La expresin percentil se usa para indicar en una distribucin de observaciones, el
valor por debajo del cual est situado cierto porcentaje de distribuciones de valores,
por ejemplo, al decir que en una distribucin de estaturas el 15.28% de los alumnos
mide 144.5 o menos, se expresa:
5 . 144
28 . 15
= P Estamos afirmando que el 15.28% de los alumnos est por debajo de
144.5 cm. de estatura.
Se presentan dos problemas relacionados al uso de percentiles:
- Obtener el valor de la abscisa x que corresponde a un valor percentil, y
- Obtener el rango percentil correspondiente a un valor de la abscisa
Solucin
3. Si conocemos el valor de x obtenemos el rango percentil
En la grfica de la ojiva se traza, por el punto x conocido, una paralela al eje de
las ordenadas hasta intersectar la ojiva y desde el punto de interseccin se
traza una paralela al eje de las abscisas y obtenemos el rango percentil .
y
P
4. Si conocemos el percentil (valor de y) obtenemos el valor de la abscisa x.
Se traza por el punto que corresponde al percentil y ( )
y
P , una paralela al eje de
las abscisas hasta intersectar la ojiva; desde el punto de interseccin se baja
una perpendicular al eje de las x.