Vous êtes sur la page 1sur 65

ESTADSTICA PARA LA ADMINISTRACIN DE LOS NEGOCIOS

Maestra en Negocios
Introduccin a la estadstica
En este primer mdulo se detallar el concepto de Estadstica, clasificacin e
importancia, adems de las mltiples aplicaciones.
Definicin
Vamos a iniciar con la definicin de Estadstica. Para ello empezaremos
cuestionndonos qu se entiende por Estadstica?
En el uso ms comn, la estadstica se refiere a informacin numrica o porcentajes.
Por ejemplo: Las estadsticas de Expo Seguridad Mxico del 2008 son:
40% de los asistentes recomiendan o aprueban la compra de productos de seguridad.
18% de los asistentes haran compras durante el evento.
60% de los asistentes tomaran decisiones de compra durante el evento o en menos
de 6 meses despus de este.
80% de los participantes tenan presupuestos de hasta 5 mil pesos para la adquisicin
de sistemas de seguridad.
35% de los asistentes tenan presupuestos de 10 mil pesos y ms para la compra de
sistemas de seguridad.
La materia Estadstica que vamos a estudiar en el curso tiene un significado mucho
ms amplio. La siguiente es una definicin formal de Estadstica: Ciencia que se
ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a
una toma de decisiones ms efectiva.
Realizar la lectura denominada El progreso de la Estadstica y su utilidad en la
evaluacin del desarrollo por Adn BARRETO-VILLANUEVA. Posteriormente
disear un mapa mental para exposicin en grupo (Anexo 1).
Tiempo: 20 minutos.

Por qu estudiar Estadstica?


Los mtodos estadsticos son utilizados por mercadlogos, contadores, analistas de
control de calidad, clientes, profesionales del deporte, administradores de hospitales,
educadores, polticos y fsicos, entre otros.
La primera razn es que en todos lados encontramos informacin numrica. Si
revisamos peridicos o revistas, encontraremos un bombardeo de informacin
numrica. Para poder tener la capacidad de entender y analizar esta informacin, leer
diagramas y grficas, la comprensin de los conceptos bsicos de Estadstica sern
de gran ayuda.

La segunda razn es que las tcnicas estadsticas se utilizan para tomar decisiones
que afectan nuestra vida diaria, influyen en nuestro bienestar.
La tercera razn es que el conocimiento de los mtodos estadsticos ayuda a
entender por qu se toman ciertas decisiones, y aporta una mejor comprensin
respecto a la forma en la que nos afectan las decisiones. No importa el trabajo que
elijas, tendrs que enfrentarte a tomar decisiones, para lo cual te ser de gran ayuda
un anlisis confiable de la informacin.
Generalmente se clasifica a la Estadstica en dos categoras:
a) Descriptiva. Organiza, resume y presenta los datos
b) Inferencial. Mtodo utilizados para la toma de decisiones, estimaciones,
predicciones o generalizaciones sobre una poblacin, basndose en una
muestra.
Existen trminos de poblacin y muestra en la definicin de Estadstica Inferencial.
Estos trminos se definen a continuacin:
Poblacin: Conjunto de todos los posibles individuos, objetos, o medidas de inters.
Muestra: Una porcin, o parte, de la poblacin de inters.
Observa que poblacin en el sentido estadstico, no siempre se refiere a personas.
Ejemplo de estadstica descriptiva:
De acuerdo al reporte de consumidores, los dueos de lavadoras General Electric
reportaron 9 problemas de cada 100 lavadoras durante 2005. El estadstico 9 describe
el nmero de problemas de cada 100 lavadoras.
Ejemplo de estadstica Inferencial:
Las empresas de televisin constantemente monitorean la popularidad de sus
programas contratando a la empresa Nielsen y a otras organizaciones para conocer
las preferencias de los telespectadores.
Ejercicio: Integrar equipos de 3 personas y realizar 3 ejemplos de estadstica
descriptiva y 3 de inferencial, respecto a las actividades que se realizan en los
centros de trabajo de los integrantes.
Tiempo: 15 minutos
Tipos de variables
Existen bsicamente dos tipos de datos:

Cuando la caracterstica o variable en estudio es no numrica, se le denomina


variable cualitativa o de atributo (nominal). Ejemplo: Gnero, religin, tipo
de automvil, lugar de nacimiento, color de los ojos de la persona, entre otros.

En una variable cuantitativa la informacin es reportada numricamente.


Ejemplo: El saldo en tu cuenta de cheques, los minutos que le restan a la
clase, o el nmero de nios de una familia.

Ejercicio: Contestar el Anexo 2.


Tiempo: 10 minutos.
Las variables cuantitativas pueden ser discretas o continuas.
Las variables discretas pueden asumir slo valores cuya separacin sea fija.
Ejemplo: el nmero de recmaras en una casa, el nmero de estudiantes en el curso
de estadstica (1, 2,3,).
Las observaciones de una variable continua pueden tomar cualquier valor dentro de un
intervalo determinado.
Ejemplo: la presin del aire en un neumtico de automvil, el peso de un cargamento
de granos (15.0, 15.01, 15.013,toneladas).
Ejercicio: Contestar el Anexo 3. Crucigrama, en binas.
Tiempo: 10 minutos
Escalas (niveles) de medicin
Los datos pueden clasificarse de acuerdo a una escala o nivel de medicin.
Existen cuatro escalas de medicin:

Escala nominal: Las observaciones solamente se pueden clasificar o contar.


No existe algn orden especfico entre las clases. Ejemplos: color de ojos,
gnero, religin.
Escala ordinal: involucra datos arreglados con algn orden, pero las
diferencias entre los valores de los mismos no pueden ser determinadas o bien
no tienen algn significado. Ejemplo: en la prueba de 4 bebidas, la bebida C
obtuvo el nmero 1, la bebida B el nmero 2, la bebida A con el nmero 3, y la
bebida D con el 4.
Escala de intervalo: es similar a la escala ordinal, con la propiedad adicional
de que la diferencia entre los valores de los datos s pueden ser determinados.
Es importante sealar que el cero es solamente un punto de la escala, y no
representa la ausencia de la condicin. Ejemplo: temperatura en grados
Fahrenheit.
Escala de razn: esta escala tiene todas las caractersticas que la de intervalo,
pero adems el cero s tiene significado, y la razn (cociente) entre dos
nmeros tambin es significativa. Ejemplo: unidades de produccin, salarios,
distancia entre un conjunto de oficinas, la estatura. Magnitudes fsicas como la
velocidad pertenecen a esta escala.

Ejercicio: Contestar el Anexo 4. Tipo de variables, en forma individual


Tiempo: 10 minutos

Despus de haber revisado el tema de este mdulo, revisar el siguiente esquema de


evaluacin.
Tarea 1.
Actividad
1. Elaborar una presentacin en
power
point
de
las
aplicaciones de la Estadstica
en los negocios. (Mximo 5
diapositivas).

Medio de entrega
Presentacin
en
Power point.

Fecha lmite de envo


Mircoles
a
las
posterior
a
la
terminacin de la
primera semana de
sesin.

AUTOEVALUACIN
Elige la respuesta correcta:
1. Una estadstica es:
A. Un conjunto de valores.
B. Un valor nico.
C. La suma de varios valores.
D. El valor mayor de un conjunto de observaciones.
2. El objetivo de la estadstica descriptiva es:
A. Describir a la poblacin.
B. Describir a un conjunto de datos.
C. Inferir algo sobre la poblacin.
D. Obtener un promedio.
3. Cul de los siguientes enunciados se refiere a la poblacin?
A. Debe ser un gran nmero de valores.
B. Se refiere a personas.
C. Es un conjunto de individuos, objetos o mediciones.
D. Ninguna de las anteriores.
4. Cul de los siguientes enunciados se refiere a la muestra?
A. Es una parte de la poblacin.
B. Debe consistir al menos de cinco observaciones.
C. Se refiere a Estadstica descriptiva.
D. Todas las anteriores son correctas.
5. Una variable cualitativa:
A. Siempre se refiere a una muestra.
B. No es numrica.
C. Slo puede tener dos valores.
D. Todas las anteriores son correctas.
6. Una variable discreta es:
A. Un ejemplo de variables cualitativas.
B. Puede asumir slo un valor.
C. Puede slo asumir valores cuya separacin sea la misma.
D. No puede ser negativa.

7. Un ejemplo de una variable cuantitativa es:


A. El CURP.
B. La nacionalidad de las personas.
C. Valores negativos.
D. La temperatura.
8. La escala de medicin de intervalo:
A. Se utiliza exclusivamente para valores negativos.
B. No puede tomar valores negativos.
C. El cero es significativo.
D. Se basa en contar objetos.
9. La escala de medicin ordinal:
A. El cero es significativo.
B. Se basa en lugares o posiciones
C. No puede tomar valores negativos.
D. ninguna de las anteriores.
10. Para qu crees que te pueda servir en tu vida profesional el estudiar
Estadstica y Probabilidad?
_____________________________________________________________________
_____________________________________________________________________
_____________________________________________________________________
Estadstica descriptiva. Descripcin de los datos

Los datos no agrupados son valores originales sin procesar, es la recoleccin simple
o no organizada. No se realizan tablas de distribucin
Se considera que es el listado de los datos presentados en su forma primaria, es decir,
tal como fueron obtenidos durante el proceso observacin o medicin en la muestra o
poblacin.
A veces, de los datos recolectados ya organizados, se desea encontrar una especie
de punto central en funcin de las observaciones. En Estadstica se conocen tres
diferentes, llamadas medidas de tendencia central, cuya utilizacin vara de acuerdo
con lo que se desee del conjunto de datos recolectados.
Esas tres medidas de tendencia central son la media, la mediana y la moda. Cada una
de ellas se estudiar en dos partes: primero, cuando los datos no estn agrupados y

segundo, cuando estn organizados. Adems, a veces difieren las frmulas para
calcular alguna de ellas si se trata de poblaciones o de muestras. (ver formulario)
Al avanzar en el estudio de este mdulo, resolver cada uno de los ejemplos y aclarar a
la brevedad cualquier duda que te surja en cualquier procedimiento.

Media

RESUMEN NMERICO:
MEDIDAS DE TENDENCIA CENTRAL

Mediana
Moda

DEFINICIN
Si quieres resumir los datos que presentaste en el mdulo anterior en las
distribuciones de frecuencias, podemos empezar por buscar el centro de su
distribucin. Las medidas de tendencia central se utilizan para indicar un valor que
tiende a tipificar o ser el ms representativo de un conjunto de nmeros. Las medidas
ms empleadas son:
a) Media
b) Moda
c) Mediana
Caractersticas de la media
La media aritmtica es la medida de tendencia central ms usada. Seguramente has
obtenido el promedio de algunos datos, la media aritmtica se conoce comnmente
como el promedio.
Como t recordars, se calcula dividiendo el resultado de la suma de todos los datos
entre el nmero de datos.
Las principales caractersticas de la media son:

Requiere de una escala de intervalo.


Todos los valores son utilizados.
Es nica.
La suma de las desviaciones con respecto a la media es cero.
La media es afectada por valores inusualmente grandes o pequeos.
La media aritmtica es la nica medida de tendencia central donde la suma de
las desviaciones de cada valor, respecto de la media, siempre es igual a cero.

Media de la poblacin
Primero quiero que recuerdes que el trmino poblacin se refiere al conjunto de todos
los posibles individuos, objetos, o medidas de inters con los que ests trabajando.
Si adems de trabajar con el conjunto de todos los datos, trabajas con datos no
agrupados, es decir que no han sido procesados y presentados en una tabla de
distribucin de frecuencias, como las que aprendiste hacer en el mdulo anterior, la

media de la poblacin la puedes calcular sumando todos los valores y dividindolos


entre el nmero total de datos.
Para poder representar lo anterior mediante una frmula denotaremos a la media
poblacional como , N ser el total de observaciones de la poblacin y X un valor
particular.
=

x
N

La letra griega se utiliza para denotar una suma. Supongamos que x tiene los
siguientes valores 1, 5, 6 y 9, entonces x= 21.
Ejemplo:
La familia Castro es propietaria de cuatro autos. Los siguientes datos corresponden al
kilometraje de cada uno de ellos:
56,000 23,000 42,000 73,000
Encuentre la media aritmtica del kilometraje de los autos:
= (56,000 + + 73,000)/4 = 48,500
Media de una muestra
Continuaremos trabajando con datos no agrupados, pero ahora veremos el caso en el
que nos inters conocer la media muestral, es decir con una parte de tu poblacin. La
media muestral es la suma de todos los valores de la muestra dividida entre el nmero
de valores de la muestra. Donde n es el nmero total de valores en la muestra.

x=

x
n

Como puedes darte cuenta la nica diferencia es que la media de la poblacin se


representa con la letra griega y la media muestral con x y el nmero total de
observaciones con N y n respectivamente.
Ejemplo:
Una muestra de cinco ejecutivos recibi los siguientes bonos el ltimo ao ($000):
14.0, 15.0, 17.0, 16.0, 15.0
X 14.0 + ... + 15.0 77
X=
=
=
= 15.4
n
5
5
Existen otras diferencias entre la media poblacional y la media muestral. Tal es el caso
del concepto de los siguientes trminos:
Un parmetro es una caracterstica de una medida de la poblacin.
Un estadstico es una caracterstica de una medida de una muestra.
Caractersticas de la mediana
Ahora veremos otra medida de tendencia central, la mediana. La mediana es el valor
que corresponde al punto medio de los valores despus de ordenarlos de menor a
mayor.

Como puedes darte cuenta, cincuenta por ciento de las observaciones son mayores
que la mediana, y 50% son menores que ella.
Propiedades de la mediana

Es nica; esto es, a semejanza de la media, slo existe una mediana para un
conjunto de datos.
No se ve afectada por valores extremadamente grandes o muy pequeos, y por
tanto es una medida valiosa de tendencia central cuando esto sucede.
Puede calcularse para datos de nivel de razn, de intervalo y ordinal.
Puede calcularse para una distribucin de frecuencias con una clase de
extremo abierto, si la mediana no se encuentra en tal clase.

Para calcular la mediana debes tomar en cuenta si el nmero de datos con los que
trabajas es par o non.
Para un conjunto par de valores, la mediana ser el promedio aritmtico de los dos
valores centrales. Considero que ser mejor explicarlo con un ejemplo:
Ejemplo:
Las estaturas de 4 jugadores de basquetbol, en pulgadas, son:
76, 73, 80, 75
Primero ordenaremos los valores de menor a mayor:
73, 75, 76, 80
Valores centrales
Entonces la mediana es:

=75.5

Para un conjunto non de valores, la mediana ser el valor central.


Ejemplo:
Las edades de una muestra de 5 estudiantes del colegio son:
21, 25, 19, 20, 22
Ordenando los datos en forma ascendente, tenemos:
19, 20, 21, 22, 25. Entonces la mediana es 21.
*
En los ejemplos anteriores el nmero de datos es muy pequeo.
Cuando tengas que trabajar con un nmero mayor de datos te sugiero lo siguiente:
Ordena los nmeros de menor a mayor.
Si el nmero de datos en non, suma uno a esta cantidad y divdela entre dos. El
resultado de la divisin (cociente) te dir el lugar que ocupa la mediana.
Ejemplo:

2, 4, 6, 6, 7, 8, 9, 9, 9, 9, 10, 15, 18, 22, 23, 23, 24 28, 30.


Son 19 datos. Entonces:

=10

El nmero que ocupa el dcimo lugar es la mediana: 9


2, 4, 6, 6, 7, 8, 9, 9, 9, 9, 10, 15, 18, 22, 23, 23, 24 28, 30.
Puedes observar que antes y despus del 9 hay nueve datos.
Si el nmero de datos es par, divide la cantidad de datos entre dos. El cociente te
indicar las posiciones de los valores centrales para que puedas calcular el promedio
aritmtico de ellos.
Ejemplo:
2, 4, 6, 6, 7, 8, 9, 9, 9, 9, 10, 15, 18, 22, 23, 23, 24 28, 30, 31
Son 20 datos. Entonces: 20/2=10
Ahora debes obtener el promedio aritmtico de los nmeros que ocupan el dcimo y
onceavo lugar:
2, 4, 6, 6, 7, 8, 9, 9, 9, 9, 10, 15, 18, 22, 23, 23, 24 28, 30.
=9.5 Media
La moda
La otra medida de tendencia central que vamos a ver es la moda. La moda es el valor
de la observacin que aparece con ms frecuencia. Veamos un ejemplo:
Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87
Ya que 81 es el dato que aparece con ms frecuencia, ste es la moda.
La dispersin o variacin es una caracterstica importante de un conjunto de datos
porque intenta dar una idea de cun esparcidos se encuentran stos. Existen diversas
medidas de dispersin, algunas de ellas son (ver formulario):
Rango
Desviacin media
Desviacin estndar
Varianza
Definicin
En el mdulo anterior estudiamos las medidas de centralizacin, conforme avances en
este mdulo te dars cuenta que casi nunca son suficientes por s solas para resumir
adecuadamente las caractersticas de un conjunto de datos. Por lo general,
necesitaremos, adems, una medida de la dispersin de los datos. Las medidas de
dispersin nos indican si los valores estn relativamente cercanos uno de otro o si se
encuentran separados.

Ya vimos en el mdulo anterior que la media y la mediana localizan el centro de los


datos, pero no indican nada acerca de la diseminacin de los mismos. Las medidas de
dispersin nos permiten conocer sobre esta diseminacin.
Cuando tenemos un valor pequeo en una medida de dispersin los datos se
acumulan estrechamente, por ejemplo, alrededor de la media aritmtica. En este caso
la media aritmtica puede considerarse representativa de todos los datos.
Un valor grande en una medida de dispersin indicar que la media no es
confiable.
Las medidas de dispersin tambin son tiles para comparar la dispersin en dos o
ms distribuciones. No siempre se puede inferir de dos distribuciones con el mismo
valor para la media lo mismo.
Existen diferentes medidas de dispersin, por ejemplo, la amplitud que se basa en la
localizacin de los valores ms grande y ms pequeo de un conjunto de datos. Otros
ejemplos son; la desviacin media, la varianza y la desviacin estndar que se basan
en las desviaciones respecto de la media.
La amplitud de variacin es la diferencia entre el valor ms grande y el valor ms
pequeo. Su clculo es fcil ya que slo dos valores son utilizados para ello. Una
desventaja de esta mediada es que est influida por valores extremos. Y una ventaja
es que es fcil de calcularlo y entenderlo. Tambin se le conoce como rango.
La varianza de la poblacin es la media aritmtica de las desviaciones al cuadrado de
la media poblacional. Como ventajas tiene que todos los valores son utilizados en el
clculo y no est influida por valores extremos. Como desventaja el que las unidades
estn desproporcionadas, son los cuadrados de la unidad original.
La frmula para la varianza poblacional es:
( X ) 2
N
La frmula para la varianza muestral es:

2 =

s2 =

( X X ) 2
n 1

Recuerda que la nica diferencia entre el clculo de alguna medida, en este caso de
dispersin, entre la muestra y la poblacin es la notacin.
Considero que la mejor forma de entender el concepto de varianza es por medio de un
ejemplo.
Ejemplo:
Las edades de la familia Gonzlez son:
2, 18, 34, 42
Cul es la varianza poblacional?
Primero se calcula la media:

X 96
=
= 24
n
4

10

Luego se resta a la media cada uno de los datos, que es lo que se conoce como
desviacin media, se elevan al cuadrado se suman y se divide entre el total de
observaciones.
(X ) 2 (2 24)2 + ... + (42 24)2
=
N
4
944
=
= 236
4

2 =

La desviacin estndar poblacional


La desviacin estndar poblacional () es la raz cuadrada de la varianza poblacional.
Para el ejemplo anterior, la desviacin estndar es 15.36, calculada as:

= 2 = 236 = 15.36
En este ejemplo la media es de 24 y la desviacin estndar de 15.36.
Consideras que la media es un valor representativo de tus datos? Crees que resulte
til el valor de la desviacin estndar para responder a la pregunta anterior?
La representacin grfica de los datos no agrupados se recomienda sea a travs de
una grfica de barras, lineal o circular.
Distribucin de frecuencias (Determinar la informacin que interesa, recolectar datos,
organizar datos (distribucin de frecuencias), Presentar datos (grficas) y obtener
conclusiones).
Definicin
Los datos no procesados pueden carecer de significado. Tal vez te haya ocurrido que
grandes cantidades de nmeros te han confundido, esto es totalmente normal, ya que
nuestra mente no puede manejar la diversidad y detalle que acompaan los grandes
conjuntos de nmeros.
Al procesar los datos los transformamos en informacin organizada, ya sea en grficas
o en unos cuantos nmeros que revelan la esencia del conjunto. El efecto es que se
eliminan los detalles menores y se resaltan las caractersticas ms importantes.
Algunos usos comunes del procesamiento de datos en las empresas son en el balance
general y en el estado de resultados, cada uno resume las actividades de una
compaa.
Cuando existe una gran cantidad de datos, por ejemplo 30 o ms, es necesario llevar
a cabo, en primer lugar, el agrupamiento de los datos antes de analizarlos.
Una distribucin de frecuencias es un agrupamiento de datos en categoras
mutuamente excluyentes, que indican el nmero de observaciones en cada categora.
Cuando hablamos de categoras mutuamente excluyentes nos referimos a que un dato
no puede pertenecer a dos categoras distintas.

11

Cmo se elabora una distribucin de frecuencias?


El primer paso es anotar los datos en una tabla que muestre las clases (categoras) y
el nmero de observaciones en cada categora. Los pasos para elaborar una
distribucin de frecuencias se describe mejor utilizando un ejemplo:
El Dr. Yez es director de una Escuela de Negocios en la Universidad la Salle, desea
preparar un resumen mostrando el nmero de horas por semana que emplean los
estudiantes en instruirse. Selecciona una muestra de 30 estudiantes y determina el
nmero de horas que cada alumno estudi en la ltima semana.
15, 24, 20, 15, 18, 23, 14, 21, 14, 21, 18, 19, 13, 20, 14, 21, 18, 30, 17, 19, 10, 26, 16,
14, 18, 34, 23, 13, 27, 17
Organiza los datos en una distribucin de frecuencias.
Para ello vamos a seguir los pasos que se presentan a continuacin:
1) Ordenar los datos de menor a mayor:
_____________________________________________________________________
_____________________________________________________________________
_____________________________________________________________________
_____________________________________________________________________
2) Determinar el nmero de clases (categoras): ste nmero debe ser el ptimo.
Existe una regla que sugiere utilizar como el nmero de clases el menor nmero (k) tal
que 2k sea mayor que el nmero de observaciones.
En el ejemplo tenemos 30 observaciones, es decir, hay 30 datos. Entonces lo que
debemos hacer es buscar un nmero k, tal que 2k 30. (2k sea mayor o igual a 30).
Dos elevado a la quinta potencia es 32, 25=2x2x2x2x2=32.
Entonces k=5 y debemos tener al menos 5 clases. Eventualmente utilizaramos 6.
Tambin existe otro mtodo que es de sturges
K= 1+3.322 log (n), el resultado deber siempre el entero inmediato anterior al valor
encontrado.
3) Determinar el intervalo o amplitud: Generalmente debe ser el mismo para todas
las clases. Las clases deben cubrir al valor menor y al mayor. Para determinarlo se
recomienda el uso la siguiente expresin:
H L
i

En donde H es el valor mayor observado, L es el menor y k es el nmero de clases.


Como en el ejemplo el nmero mayor es 34 y el nmero menor es 10, restando 10 de
34 horas. El rango es 24 horas.
Dividimos 24 entre = 5 Vamos a redondearlo a 5 para que sea ms fcil trabajar con
esta amplitud. Por lo que cada que se obtenga un valor con decimal se aproximar a
su entero inmediato posterior.

12

El lmite inferior de la primera clase ser de 10 horas, ya que es el valor menor que
tenemos. Si a 10 le sumamos 5, que es la amplitud, tenemos 14
El lmite superior de la primera clase ser de14 horas.
Para que las categoras sean mutuamente excluyentes, es decir un dato no
corresponda a dos categoras distintas, el siguiente intervalo tendr como lmite
inferior el valor de 14, si le sumamos 5, el lmite superior ser 18 y as sucesivamente.
Intervalos de clase

Intervalos de clase

Frecuencia

Frecuencia

Frecuencia
relativa

Para saber que nmeros deben ir en la columna de frecuencia, tendrs que revisar los
datos del ejemplo y contar cuntos valores estn comprendidos en cada clase.
A continuacin se presentan algunos conceptos importantes:
Marca de clase: Un punto que divide el intervalo en dos partes iguales. Es el
promedio entre el lmite inferior y superior del intervalo de clase.
Frecuencia de clase: El nmero de observaciones en cada clase.
Intervalo de clase: El intervalo de clase se obtiene restando el lmite inferior de una
clase del lmite inferior de la siguiente clase.
La tabla anterior muestra el nmero total de observaciones en cada clase. En
ocasiones es preferible conocer la proporcin que hay en cada clase, es decir el
porcentaje. Una distribucin de frecuencias relativas muestra el porcentaje de
observaciones en cada clase. Se obtiene dividiendo la frecuencia de cada clase entre
el total de observaciones.

13

Intervalos de
clase

Frecuencia

Frecuencia
acumulada

Una distribucin de frecuencias acumuladas muestra el nmero de elementos que


son menores que cierto valor especfico o igual a ste. Se obtiene mediante sumas
sucesivas de frecuencias de clase.
Una distribucin de frecuencias relativas acumuladas muestra el porcentaje de
elementos que son menores que cierto valor especfico o igual a ste. Se obtiene
dividiendo las frecuencias acumuladas entre el total de observaciones.
La media para datos agrupados
Si vas a trabajar con una tabla de datos agrupados y deseas conocer la media tendrs
que utilizar la siguiente frmula:

X =

Xf
n

Nuevamente considero que lo mejor para explicarte como usar la frmula es mediante
un ejemplo.
Ejemplo:
Una muestra de 10 cines en una gran rea metropolitana cont el nmero total de
pelculas en exhibicin la ltima semana. Calcule el nmero medio de pelculas en
exhibicin.
Pelculas
cartelera

en

Frecuencia

Marca de
clase (X)

(f)(X)

13
46
79
10 12
13 15

1
2
3
1
3

2
5
8
11
14

2
10
24
11
42

Total

10

89

Cmo calcular la columna de marca de clase?


Para ello debes sumar el lmite inferior y el lmite superior de cada clase y
dividirlos entre dos. Por ejemplo, para la primera clase: 1+3=4/2=2; 4+6=10/2=5;
7+9=16/2=8.

14

Una vez que tienes los valores de X (marca de clase), debes multiplicar cada uno de
ellos por su frecuencia, para la primera clase la frecuencia es uno, y la marca de clase
es 2, entonces (1) (2)=2. Debes hacerlo para cada una de las clases.
El siguiente paso consiste en sumar todos los productos de las frecuencias por las
marcas de clase, que en este ejemplo da 89.
Lo ltimo que tienes que hacer es dividir la suma entre el nmero de observaciones,
en el ejemplo son 10.

X=

fX 89
=
= 8.9
n
10

La mediana de una tabla de datos agrupados


La mediana de una tabla de datos agrupados se calcula con:

Donde L es el lmite inferior de la clase que contiene a la mediana, n es el nmero


total de observaciones (datos), CF es la frecuencia acumulada precedente a la
clase mediana, f es la frecuencia de la clase que contiene a la mediana, e i es la
amplitud de la clase.
Cmo se encuentra la clase que contiene a la mediana?
1. Calcula la frecuencia acumulada de la tabla de datos agrupados.
2. Divide el nmero total de datos entre 2 (el total de la columna de frecuencia
acumulada). Determina cul clase contiene este valor.
Volvamos al ejemplo de los cines, en donde el valor de la frecuencia cumulada es 10,
es decir, n = 10, ahora dividimos entre dos el valor de la frecuencia acumulada: 10/2
=5, entonces ahora, busca que clase contiene el valor de 5. La clase que tiene como
frecuencia el valor de cinco es la segunda clase: 4-6.
Ya que encontraste la clase mediana, identifica los valores de L, lmite inferior de la
clase que contiene a la mediana, n nmero total de observaciones (datos), CF
frecuencia acumulada precedente a la clase mediana, f frecuencia de la clase que
contiene a la mediana e i que es la amplitud de la clase en que se encuentra la
mediana.

15

Pelculas
en
cartelera

L=4

Frecuencia

Frecuencia
acumulada

13

46

79

10 12

13 15

10

Total

f=2

CF=1

i=6 4 =2

10

n=10
Sustituyendo en la frmula tenemos:

Moda para datos agrupados


En este momento vamos a ver, para datos agrupados en una tabla, cmo es posible
aproximar la moda usando la marca de clase que contiene el mayor nmero de
frecuencias.
Vamos a volver a utilizar el ejemplo de los cines. En la tabla buscas el valor ms alto
en la columna de las frecuencias.

Pelculas
en
cartelera
13
46
79
10 12
13 15

Frecuencia

Frecuencia
acumulada

1
2
3
1
3

1
3
6
7
10

Total

10

Estars de acuerdo que el valor ms alto es 3. El valor se encuentra en las clases 7-9
y 13-15, por lo que hay dos valores para la moda. Para la primera clase, la marca de
clase es 8 y para la segunda clase es 14, por lo tanto se dice que la distribucin es
bimodal y los valores de la moda son: 8 y 14.

16

Varianza muestral para datos agrupados


Si en lugar de tener tus datos originales tienes una tabla de datos agrupados, y
adems no ests trabajando con la poblacin sino con una muestra, para calcular la
varianza muestral, debers emplear la siguiente frmula:

(fX ) 2
fX
n
s2 =
n 1
2

Utilicemos el mismo ejemplo del mdulo anterior para explicar el uso de la frmula de
la varianza:
Primero debemos identificar a f que es la frecuencia de clase y a X que es la marca de
clase.
Pelculas
en
cartelera

Frecuencia

Marca
de
clase
(X)

fX

13

=4

(1)(4)=4

(1)(2)=2

46

=25

(2)(25)=50

(2)(5)=10

79

=64

(3)(64)=192

(3)(8)=24

10 12

11

=12

(1)(121)=121

(1)(11)=11

13 15

14

=19

(3)(196)=588

(3)(14)=42

1
6
Total

10

=955

(
(

=7921
/n=7921/
10=792.1

La varianza es igual a:

(fX ) 2
fX
n = 955 792.1 = 18.1
s2 =
n 1
9
2

La desviacin estndar es igual a:

s = s 2 = 18.1 = 4.25
La desviacin estndar es una de las medidas de dispersin que ms se utiliza,
desempea un papel importante en la Estadstica. Sus unidades son las mismas que
las de la media.
En general, la deviacin estndar se emplea como una medida para comparar la
dispersin en dos o ms conjuntos de observaciones.

17

Por ejemplo:
Se ha calculado que la desviacin estndar para las cantidades quincenales invertidas
en el plan de participacin de utilidades de dos empresas es de $7.51 y $10.47,
respectivamente. Las medias de las cantidades invertidas en ambas empresas son
aproximadamente iguales. Cmo la desviacin estndar de la primera empresa es
menor, se puede inferir que las cantidades invertidas en ella no se dispersan tanto
como la de los empleados de la segunda empresa. Como las cantidades invertidas en
la primera empresa se acumulan ms hacia la media, se puede afirmar que la media
es una medida ms confiable en esta empresa que en la otra.
Presentacin de una distribucin de frecuencias en grficas
Las grficas y los diagramas son particularmente eficaces al proporcionar una imagen
objetiva de las caractersticas principales de los datos. No solamente sirven como
instrumento de comunicacin, sino que tambin ayudan a la conceptualizacin de
problemas. Desempean un papel muy importante en el anlisis estadstico.
Las tres grficas ms comunes son: histograma, polgono de frecuencias y distribucin
de frecuencias acumuladas, ya sea de valores absolutos o de frecuencias relativas.
Un histograma es una grfica en la cual los intervalos de clase se sealan en el eje
horizontal, y las frecuencias de clase en el eje vertical.
Las frecuencias de clase son representadas por barras de diferente altura y stas se
colocan una junto a otra.

Un polgono de frecuencias consiste en segmentos de lnea conectados a travs de


los puntos medios (marcas de clase) de clase en cada intervalo de clase.

18

Una distribucin de frecuencias acumulada (ojiva) es utilizada para determinar


cuntos o qu proporcin de los datos estn por arriba o por debajo de cierto valor.

Nombre de la grfica
Histograma de frecuencias
absolutas
Histograma de frecuencias
relativas
Polgono de frecuencias
absolutas
Polgono de frecuencias
relativas
Ojiva
de
Frecuencias
absolutas
Ojiva
de
Frecuencias
relativas acumuladas
Grfica circular

Clase

Eje X

Eje Y
Frecuencia absoluta

Clase

Frecuencia relativa

Marca de clase

Frecuencia absoluta

Marca de clase

Frecuencia relativa

Limite real de
superior
Lmite real de
superior
Frecuencia relativa

clase

Frecuencia acumulada

clase

Frecuencias
acumuladas

relativas

Revisar el siguiente esquema de evaluacin. En l encontrars las actividades que


debes de realizar para evaluar el aprendizaje logrado hasta el momento.
Incorporar: Leer la unidad 2 de la Antologa.

19

Hacer: La informacin de la siguiente tabla presenta los porcentajes de rentabilidad de


las acciones de 30 empresas. Haz una tabla de distribucin de frecuencias, con el
anlisis de las medidas de tendencia central y de dispersin, adems de las grficas
explicadas en las sesiones.
38,0
24,0
13,3
19,9
26,8

24,5
29,6
28,0
24,6
31,2

21,5
19,4
30,8
32,3
50,9

30,8
25,6
32,9
24,7
30,7

18,7
30,3
20,3
39,5
20,3

29,0
15,3
21,3
27,5
24,0

Conectar: Elaborar una diapositiva en power point sobre las conclusiones del
ejercicio.
Medio de entrega. El ejercicio deber entregarse en un documento en Word y en
Excel.
Autoevaluacin
Por favor contesta lo que se te indica.
1) Un conjunto de datos consta de 38 observaciones. Cuntas clases recomendara
para la distribucin de frecuencias?
2) Un conjunto de datos est integrado por 45 observaciones que van desde cero
hasta 29 dlares. Qu tamao de intervalo de clase recomendaras?
3) Un conjunto de datos contiene 53 observaciones. El valor ms pequeo es 42 y el
ms grande es 129. Los datos deben organizarse en una distribucin de frecuencias.
a) Cuntas clases se deben establecer?
b) Cul sera el lmite inferior de la primera clase?
4) La siguiente grfica muestra las calificaciones de un primer examen de Estadstica.

25

21

Frecuencia

20
15

15

13

10
5

0
50

60 70 80
Calificacin

90

100

a) Cuntos estudiantes hicieron el examen?


b) Cul es la amplitud del intervalo de clase?

20

c) Cul es la marca de clase para el primer intervalo?


d) Cuntos estudiantes obtuvieron una calificacin menor a 70?
5.

La diferencia entre calcular la media de la muestra y de la poblacin es:


A. La simbologa que se usa: usamos X en lugar de y n en lugar de N.
B. Dividimos el nmero de observaciones entre n - 1 en lugar de entre n.
C. Las observaciones se ordenan y se selecciona el valor medio cuando se trata
de calcular la media de la poblacin.
D. No hay diferencia.

6.
Cul de las siguientes medidas de tendencia central se ve ms afectada por
valores extremos?
A.
B.
C.
D.
7.

Mediana
Media
Moda
Media Geomtrica
Qu requisito es importante para el clculo de la mediana?

A.
B.
C.
D.

Ninguno en especial
Ordenar los valores
Sumar los valores
Restar el valor mayor del menor.

8.
Cul de las siguientes medidas de tendencia central se recomienda usar para
variables cualitativas?
A.
B.
C.
D.

Media
Mediana
Moda
Media ponderada

9.
En un conjunto de observaciones, cul medida de tendencia central reporta el
valor que se presenta con ms frecuencia?
A.
B.
C.
D.
10.

El promedio es la forma en que comnmente conocemos a:


A.
B.
C.
D.

11.

Media
Mediana
Moda
Media geomtrica

Media
Mediana
Moda
Media geomtrica
La media de 6, 3, 5, 7 y 6 es:

A. 5.4.
B. 6.
C. 4.5.

21

D. Ninguno de los anteriores.


12.
Supongamos que comparas la media de un conjunto de datos y la media del
mismo conjunto de datos en una distribucin de frecuencias el resultado ser:
A.
B.
C.
D.

El mismo.
El mismo valor que la mediana.
El mismo que la media geomtrica.
Aproximadamente igual.

13.
En un conjunto de 10 observaciones la media es 20 y la mediana es 15. Dos de
los valores son 6, y el resto de los valores son diferentes. Cul es la moda?
A.
B.
C.
D.

15
20
6
Ninguno de los anteriores.

14. Cul de las siguientes no es una medida de dispersin?


A.
B.
C.
D.
15.

Rango
Varianza
Deviacin estndar
Todas son medidas de dispersin
Una desventaja del rango es:

A.
B.
C.
D.

Slo se usan dos valores para calcularlo.


Sus unidades son distintas que las de la media.
No existe para algunos conjuntos de datos.
Todas las anteriores.

16. La desviacin media es:


A.
B.
C.
D.

La raz cuadrada de la media.


La varianza.
La mediana.
Ninguna de las anteriores.

17. La deviacin estndar:


A.
B.
C.
D.

Es la raz cuadrada de la varianza.


Tiene las mismas unidades que la media.
Emplea todos los valores del conjunto de observaciones para su clculo.
Todas las anteriores.

18. La varianza:
A.
B.
C.
D.

Se obtiene dividiendo a la media entre el nmero de observaciones.


Se da en las mismas unidades que los datos originales.
Se obtiene al sacar la raz cuadrada de la deviacin estndar.
Ninguna de las anteriores.

19. Cul de los siguientes enunciados es correcto con respecto a la


estndar?

deviacin

22

A.
B.
C.
D.

Nunca es negativa.
Si es cero, significa que todos los datos son iguales.
Tiene las mismas unidades que la media.
Ninguna de las anteriores.

20. La siguiente distribucin de frecuencias reporta el nmero de estudiantes


registrados en cada uno de los 50 grupos de varios cursos impartidos en La
Escuela de Negocios el verano pasado.
Estudiantes
1

Frecuencia

10

11 a

20

21 a

30

16

31 a

40

10

41 a

50

51 a

60

Total

50

a) Determine la desviacin estndar.


b) Determine la varianza.
c) Qu podras concluir de los resultados obtenidos?
Asimetra
En muchas empresas slo se calculan una medida de centralizacin y una medida de
dispersin, generalmente la media y la desviacin estndar. De esta forma, en muchas
ocasiones se reduce un gran conjunto de datos a slo dos nmeros. Para muchos
conjuntos de datos reales, esto puede justificarse, ya que, calculando otras medidas,
es muy poco lo que se puede aprender de ms sobre la distribucin. Sin embargo,
puede ocurrir que se pierda informacin significativa sobre la forma de la distribucin
poblacional cuando se reducen los datos a slo una medida de centralizacin y a una
medida de dispersin.
Consideremos los siguientes histogramas:

El histograma de arriba, representa una situacin en la que los datos se distribuyen


simtricamente alrededor de su valor central. Las observaciones extremadamente

23

grandes no son ms frecuentes que las extremadamente pequeas. La distribucin


tiene la misma forma en ambos lados del eje central. La moda, la mediana y la media
se localizan en el centro y siempre son iguales.

El histograma de arriba, presenta una cola ms grande a la derecha, con cortes ms


abruptos a la izquierda. Este tipo de distribuciones que se denominan asimtricas a la
derecha o con sesgo positivo, tienen como caracterstica que su media es mayor
que la mediana y que la moda. Por qu? Porque como ya mencion la media se ve
afectada por los valores extremos. En general, la mediana es la siguiente medida ms
alta en este tipo de distribuciones. Si la distribucin es muy asimtrica, la media no
sera una medida representativa til. La mediana y la moda seran una mejor medida.

El histograma de arriba, se presenta la situacin opuesta al anterior. Aqu la


distribucin es asimtrica a la izquierda o con sesgo negativo, de forma que los
valores ms bajos se extienden en una zona muy amplia, pero los ms altos no. En
este caso la medida menor es la media. El valor mayor es el de la moda. Nuevamente,
si la distribucin presenta una asimetra muy marcada, la media no es aconsejable
como medida representativa de los datos.
La media y la desviacin estndar no contienen informacin acerca de la simetra de
una distribucin. La simetra puede observarse muy clara en los histogramas y en los
polgonos de frecuencia.
El concepto de asimetra se refiere a si la curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha de un valor central (media aritmtica).

24

La asimetra es una medida que permite identificar y describir la manera como los
datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la
distribucin. Permite identificar las caractersticas de la distribucin de datos sin
necesidad de generar el grfico.
a) Asimetra Negativa o a la Izquierda
Se da cuando en una distribucin la minora de los datos est en la parte izquierda de
la media. Este tipo de distribucin presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribucin de los datos tiene a la izquierda una cola ms larga
que a la derecha. Tambin se dice que una distribucin es simtrica a la izquierda o
tiene sesgo negativo cuando el valor de la media aritmtica es menor que la mediana y
ste valor de la mediana a su vez es menor que la moda, en smbolos x < Md < Mo.
b) Simtrica
Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad
de los datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se
representa por una curva normal en forma de campana llamada campana de Gauss
(matemtico Alemn 1777-1855) o tambin conocida como de Laplace (17491827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica,
su mediana y su moda son iguales, en smbolos x = Md = Mo.
c) Asimetra Positiva o a la Derecha
Se da cuando en una distribucin la minora de los datos est en la parte derecha de
la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia
la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga
que a la izquierda. Tambin se dice que una distribucin es simtrica a la derecha o
tiene sesgo positivo cuando el valor de la media aritmtica es mayor que la mediana y
ste a valor de la mediana a su vez es mayor que la moda, en smbolos smbolos x >
Md > Mo .
Se caracteriza el grado de asimetra de una distribucin alrededor de su media. La
asimetra positiva indica una distribucin con una cola asimtrica que se extiende
hacia ms valores positivos. La asimetra negativa indica una distribucin con una cola

25

asimtrica que se extiende hacia ms valores negativos.


Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:
As= (n/((n-1)(n-2))( (xi- x) /n)3
Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:
As= (n/((n-1)(n-2))( f(xi- x)/n)3
Para datos agrupados en intervalos se emplea la siguiente frmula:
As= (n/((n-1)(n-2)) (f(xm- x)/n)3
Donde:
Xi = cada uno de los valores
n = nmero de datos
x = media aritmtica
f = frecuencia absoluta
3 = cubo de la desviacin estndar poblacional
xm = marca de clase
Nota:
Si As < 0 Indica que existe presencia de la minora de datos en la parte izquierda de
la media, aunque en algunos casos no necesariamente indicar que la distribucin sea
asimtrica negativa
Si As = 0 la distribucin ser simtrica
Si As > 0 Indica que existe presencia de la minora de datos en la parte derecha de
la media, aunque en algunos casos no necesariamente indicar que la distribucin sea
asimtrica positiva
Realizar el siguiente ejercicio: 6, 9, 9, 12, 12, 12, 15 y 17
Ejercicio. Calcule empleando las frmulas y mediante Excel el dadas las siguientes
distribuciones.
a) 4, 4, 8, 14, 14, 16, 18 y 20
b) 6, 8, 10, 12, 14, 16, 18 y 20
Curtosis
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin
a la distribucin normal, es decir, mide cun puntiaguda es una distribucin. La
curtosis determina el grado de concentracin que presentan los valores en la regin

26

central de la distribucin. As puede ser:


a) Leptocrtica.- Existe una gran concentracin.
b) Mesocrtica.- Existe una concentracin normal.
c) Platicrtica.- Existe una baja concentracin.

Esto explica una forma de la distribucin de frecuencias con colas muy elevadas y con
un centro muy apuntado.
La curtosis o apuntalamiento es una medida de forma que mide cun escarpada o
achatada est una curva o distribucin. Este coeficiente indica la cantidad de datos
que hay cercanos a la media, de manera que a mayor grado de curtosis, ms
escarpada (o apuntada) ser la forma de la curva.

Ejercicio. Revisar la pgina http://www.yahoo.com. De lado izquierdo de la pgina


selecciona Bienes Races. Selecciona un estado. Selecciona casas en venta y elige
una colonia. Elige el precio de 20 casas. Determina la media y la mediana de los
precios de venta de las casas. Una de estas medidas de tendencia central resulta ser
ms representativa?
Calcula la media, la mediana y la moda del nmero de recmaras. Una de estas
medidas de tendencia central resulta ser ms representativa que las otras?

27

Los ejercicios los debes enviar en un documento en Word a mi correo y el reporte en


Excel adjuntarlo en una hoja del archivo que entregars al finalizar al sesin.
Principios de probabilidad
Los primeros mdulos se centraron en la estadstica descriptiva. Ahora la atencin se
dirigir al estudio de la segunda faceta de la estadstica, que es el clculo de la
posibilidad de que algo ocurra en el futuro: a la estadstica Inferencial.
La base de la estadstica Inferencial es la probabilidad, por lo que a partir de la
siguiente lectura, definirs probabilidad, describirs los enfoques clsico, emprico y
subjetivo de la probabilidad, definirs los trminos experimento, evento y resultado,
explicars los conceptos de probabilidad condicional y probabilidad conjunta, aplicars
las reglas de adicin y multiplicacin en el clculo de probabilidades, usars un
diagrama de rbol para organizar y evaluar probabilidades y calculars una
probabilidad utilizando el teorema de Bayes.
La Estadstica Inferencial se ocupa de obtener conclusiones acerca de una poblacin
basndose en una muestra. Debido a que existe una incertidumbre considerable al
tomar decisiones, resulta importante que se evalen en forma cientfica todos los
riesgos implcitos conocidos. Es de gran ayuda en esta evaluacin la Teora de la
Probabilidad.
Como los conceptos de probabilidad son tan importantes en el campo de la Estadstica
Inferencial iniciaremos con el lenguaje bsico de probabilidad.
La probabilidad es una medida de la posibilidad relativa de que un evento ocurra en
el futuro.
Una probabilidad puede asumir valores entre cero y uno inclusive. Un valor cercano a
cero significa que es poco probable que el evento suceda. Un valor cercano a uno
significa que es altamente probable que el evento suceda. Hay tres definiciones de
probabilidad: clsica, emprica y subjetiva.

Un experimento es un proceso que conduce a que ocurra una (y solamente una) de


varias observaciones posibles.
Un resultado es un suceso particular proveniente de un experimento.

28

Un evento es un conjunto de uno o ms resultados de un experimento.


Experimento
Todos los posibles resultados

Algunos eventos posibles

Tirar un dado
Obtener un 1
Obtener un 2
Obtener un 3
Obtener un 4
Obtener un 5
Obtener un 6
Obtener un nmero par
Obtener un nmero > 4
Obtener un nmero 3

En ocasiones se abordarn eventos que son mutuamente excluyentes y con eventos


independientes. Por ello es importante definirlos.
Los eventos son mutuamente excluyentes si la ocurrencia de cualquiera significa
que ninguno de los otros eventos puede ocurrir al mismo tiempo: Al lanzar un dado si
cae un nmero par no puede caer un nmero non.
Los eventos son independientes si la ocurrencia de un evento no afecta la ocurrencia
de otro: Los dos primeros hijos de un matrimonio son varones.
A continuacin se presentan ejemplos de los tipos de probabilidad.
Ejemplo:
Se va a sacar una carta al azar de un juego de barajas de 52 cartas. Cul es la
probabilidad de que la carta sea una reina? Qu enfoque de probabilidad se emplea
para contestar a esta pregunta?
El enfoque que se emplea para contestar es el de probabilidad clsica. Para ello se
usa la definicin de probabilidad clsica:
La probabilidad de un evento es igual a:
Nmero de resutlados favorables
4
=
= 0.07
Nmero de resutlados posibles
52

Ejemplo:
La Secretara de Salud reporta que de 833 muertos, 24 mueren debido a un accidente
automovilstico, 182 mueren de cncer y 333 de enfermedades cardacas. Cul es la
probabilidad de que una muerte en particular se deba a un accidente automovilstico?
Qu enfoque de probabilidad usas para responder?
El enfoque que se emplea para contestar es el de probabilidad emprica. Para ello se
usa la definicin de probabilidad emprica:
La probabilidad de un evento es igual a:
Nmero de veces que ocurri el evento en el pasado
=
Nmero de observacio nes
24
= 0.027
833

29

Ejemplo:
En el departamento acadmico del profesor Lpez, se le han asignado a un total de
186 estudiantes la calificacin de 10 de entre un total de 1,200 estudiantes. Cul es
la probabilidad de que un estudiante de su seccin este semestre reciba una
calificacin de 10?
Este es un ejemplo de la definicin emprica de probabilidad.
Encuentre la probabilidad de seleccionar un estudiante con calificacin 10:
P(A) = 186/1,200 = 0.155
Reglas bsicas de probabilidad
Si dos eventos A y B son mutuamente excluyentes, la regla especial de la adicin
indica que la probabilidad de que ocurra uno u otro de los eventos, es igual a la suma
de sus probabilidades. P(A o B) = P(A) + P (B)
Ejemplo:
La oficina de vuelos de Aeromxico tiene registrada la siguiente informacin en su
bitcora de vuelos entre Ciudad de Mxico y Acapulco.
Llegadas

Frecuencia

Temprano
A tiempo

100
800

Tarde
Cancelado

75
25

Total

1000

Si A es el evento de que el vuelo llegue temprano, entonces:


P(A) = 100/1000 = 0.10
Si B es el evento de que el vuelo llegue tarde, entonces:
P (B) = 75/1000 = 0.075
La probabilidad de que el vuelo llegue temprano o tarde es:
P(A o B) = P(A) + P (B) = 0.10 + 0.075 = 0.175
La regla del complemento
La regla del complemento es utilizada para determinar la probabilidad de que un
evento ocurra, restando a 1 la probabilidad de que no ocurra dicho evento.
Si P(A) es la probabilidad de un evento A y P (~A) es la probabilidad del complemento
de A,
P(A) + P (~A) = 1 o P(A) = 1 P (~A)

30

Un diagrama de Venn ilustrando la regla del complemento se apreciara as:







A
A





Si se retoma el ejemplo anterior, usando la regla del complemento para encontrar la
probabilidad de un evento (A) temprano o un evento (B) tarde tenemos:
Si C es el evento de que el vuelo llegue a tiempo, entonces P(C) = 800/1000 = 0.8
Si D es el evento de que el vuelo se cancele, entonces P (D) = 25/1000 = 0.025
P(A o B) = 1 - P(C o D) = 1 - [.8 +.025] =0.175

C .8

D .25

(C o D)=(A o B)=0.175

La regla general de la adicin


Si A y B son dos eventos que no son mutuamente excluyentes, entonces P(A o B) es
dada por la siguiente frmula: P(A o B) = P(A) + P (B) - P(A y B)
El diagrama de Venn ilustra esta regla:

A y B

31

Ejemplo:
En una muestra de 500 estudiantes, 225 afirmaron tener un estreo, 175 dijeron tener
una TV, y 100 afirmaron tener ambos.

T V 175
ambos 100

Estreo 225
Si un estudiante es seleccionado al azar, cul es la probabilidad de que el estudiante
tenga slo un estreo? Slo una TV? Ambos?
P(S) = 225/500 = 0.45
P (T) = 175/500 = 0.35
P(S y T) = 100/500 = 0.20
Si un estudiante es seleccionado al azar, cul es la probabilidad de que tenga un
estreo o una TV en su cuarto?
P(S o T) = P(S) + P (T) - P(S y T) = 0.45 + 0.35 - 0.20 = 0.60
Probabilidad conjunta
Mide la posibilidad de que dos o ms eventos ocurran en forma simultnea.
Ejemplo:
Cul es la probabilidad de que una carta escogida al azar de una baraja americana
sea un rey o un corazn?
Carta

Probabilidad de
ocurrrencia

Explicacin

Rey

P(A)=4/52

Hay 4 reyes en una baraja de 52 cartas

Corazn

P(B)=13/52

Rey de
corazones

P(A y B)=1/52

Hay 13 corazones en una baraja de 52


cartas
Hay 1 rey de corazones en una baraja
de 52 cartas

P(A o B) = P(A) + P(B) P(A y B)=

32

Regla especial de la multiplicacin


La regla especial de la multiplicacin requiere que dos eventos A y B sean
independientes.
Recuerda que dos eventos A y B son independientes si la ocurrencia de uno no afecta
la probabilidad de que ocurra el otro.
Esta regla se escribe:
P(A y B) = P(A) P (B)
Ejemplo:
Cristina tiene acciones en IBM y GE. La probabilidad de que las acciones de IBM
aumenten de valor el prximo ao es 0.5, y la probabilidad de que las acciones de GE
aumenten su valor el prximo ao es 0.7. Suponga que las acciones de ambas
empresas son eventos independientes. Cul es la probabilidad de que las acciones
de ambas empresas incrementen su valor el prximo ao?
P (IBM y GE) = (0.5) (0.7) = 0.35
Cul es la probabilidad de que al menos una de estas acciones aumente su valor
durante el prximo ao?
P(al menos una) = (0.5) (0.3) + (0.5)(0.7) + (0.7)(0.5) = 0.15 + 0.35 +0.35 = 0.85
Probabilidad condicional
La probabilidad condicional es la probabilidad de que ocurra un evento determinado,
dado que otro evento ya haya ocurrido.
La probabilidad de que ocurra el evento A dado que el evento B ha ocurrido se escribe
P(A | B).
Regla general de la multiplicacin
La regla general de la multiplicacin es utilizada para encontrar la probabilidad
conjunta de que dos eventos ocurran.
La regla establece que dados dos eventos A y B, la probabilidad conjunta de que
ambos ocurran se encuentra multiplicando la probabilidad de que suceda A, por la
probabilidad condicional de que ocurra el evento B.
La probabilidad conjunta P(A y B) est dada por la siguiente frmula:
P(A y B) = P(A) P (B/A) o P(A y B) = P (B) P(A/B)
Ejemplo:
El director de la Escuela de Negocios de la Universidad Nacional, recopil la siguiente
informacin acerca de estudiantes no graduados en su escuela:

33

Especialidad
Contadura
Finanzas
Mercadotecnia
Administracin
Total

Hombre
170
120
160
150
600

Mujer
110
100
70
120
400

Total
280
220
230
270
1000

Si un estudiante es seleccionado al azar, cul es la probabilidad de que el estudiante


sea una mujer (F) pasante de contadura (A)?
P(A y F) = 110/1000
Dado que el estudiante es una mujer, cul es la probabilidad de que ella sea pasante
de contadura?
P(A|F) = P(A y F)/P (F) = [110/1000]/[400/1000] = 0.275
Diagrama de rbol
El diagrama de rbol es una representacin grfica til para organizar clculos que
abarcan varias etapas. Cada segmento en el rbol es una etapa del problema. Las
probabilidades escritas cerca de las ramas son las probabilidades condicionales del
experimento.
Ejemplo:
En una bolsa que contiene 7 chips rojos y 5 chips azules, usted selecciona dos chips
uno despus del otro sin reemplazarlo. Elabore un diagrama de rbol mostrando esta
informacin.

Teorema de Bayes
La interpretacin ms importante del Teorema de Bayes se basa en el uso de las
probabilidades subjetivas. Por ejemplo, supongamos que una persona tiene
determinadas creencias sobre la posible rentabilidad de un ttulo en particular (suceso
B). En este contexto, la probabilidad P (B) se denomina probabilidad a priori.
Posteriormente se entera que un analista experto recomienda el mismo ttulo (suceso
A), dependiendo de la confianza que la persona tiene en los juicios del experto se

34

podran modificar sus creencias inciales. Dado que se sabe que A ha ocurrido, la
probabilidad relevante correspondiente a B es ahora la probabilidad condicional de B
dado A, que se denota probabilidad a posteriori.
Desde este punto de vista, se puede interpretar el Teorema de Bayes como un mtodo
que nos permite actualizar una probabilidad a priori cuando se conoce la informacin
adicional de que el suceso A ha tenido lugar. El Teorema sostiene que la actualizacin
se realiza multiplicando la probabilidad a priori por P(A|B)/P(A).
La frmula que se utiliza al aplicar el Teorema de Bayes es:

P(A1 | B) =

P(A1)P(B I A 1)

P(A1)P(B I A 1) + P(A 2 )P(B I A 2 )

Ejemplo:
Una embotelladora de refresco de cola recibi varias denuncias acerca del bajo
contenido de sus botellas. Una denuncia fue recibida hoy, pero el gerente de
produccin no puede identificar cul de las dos plantas en Aguascalientes (A o B) llen
estas botellas. Cul es la probabilidad de que las botellas defectuosas provengan de
la planta A?
La siguiente tabla resume la experiencia de produccin de dicha embotelladora:
% del total de produccin
55
45

A
B

P( A | U ) =

% de botellas defectuosas
3
4

P( A) P(U I A)
(0.55)(0.03)
=
= 0.4783
P( A) P(U I A) + P( B) P(U I B) (0.55)(0.03) + (0.45)(0.04)

La probabilidad de que las botellas fueran llenadas en la planta A se redujo de 0.55 a


0.4783.
Ejercicio.
a) Sesenta por ciento de los estudiantes de la Universidad Nacional conducen su
automvil para asistir a clases y 30% tiene transporte escolar. El 10 % de los
estudiantes tiene transporte y manejan a clase. Si seleccionamos un estudiante al
azar, cul es la probabilidad de que el estudiante tenga transporte o maneje a clase?
b) Hay 18 jugadores en la lista del equipo de bisbol de la preparatoria nacional. De
los 18 jugadores 8 estn actualmente registrados en la preparatoria. El entrenador
decide nombrar tres capitanes y seleccionarlos al azar. El nombre de los jugadores
estn puestos en viejas gorras de bisbol y tres se seleccionan al azar. Cul es la
probabilidad de que ninguno de los seleccionados sean estudiantes de la
preparatoria?
Autoevaluacin
1. Cul de los siguientes enunciados es correcto en probabilidad?
A.
B.

Vara de 0 a 1.
Debe asumir valores negativos.

35

C. Debe ser mayor a 1.


D. Puede reportarse nicamente con un decimal.
E. Todas las anteriores.
2.

Un experimento es:
A.
B.
C.
D.
E.

3.

Cul de las siguientes no es un tipo de probabilidad?


A.
B.
C.
D.

4.

E.

Eventos independientes.
Eventos mutuamente excluyentes
Eventos cuya suma es mayor a 1.00.
Eventos basados en probabilidad subjetiva
La unin de probabilidades.

Cuando la probabilidad de un evento se encuentra al restar uno a la probabilidad


de no ocurrencia, estamos usando:
A.
B.
C.
D.
E.

8.

Eventos independientes.
Eventos mutuamente excluyentes
Eventos cuya suma es mayor a 1.
Eventos basados en probabilidad subjetiva
La unin de probabilidades.

Usamos la Regla General de la Multiplicacin para combinar:


A.
B.
C.
D.
E.

7.

En virtud de haber ocurrido uno el otro no puede ocurrir.


La probabilidad de que ocurra es mayor a 1.
No podemos contar los posibles resultados.
La probabilidad de que uno de los eventos ocurra no afecta a la probabilidad
de que tambin el otro ocurra.
Ninguna de las anteriores.

La regla especial de la Adicin se usa para combinar:


A.
B.
C.
D.
E.

6.

Subjetiva
Independiente
Emprica
Clsica

Dos eventos son independientes si:


A.
B.
C.
D.

5.

Un conjunto de eventos.
Un conjunto de resultados.
Siempre mayor a 1.
El acto de tomar medidas de la observacin de alguna actividad.
Ninguna de las anteriores.

Probabilidad subjetiva
La regla del complemento.
La regla general de la adicin.
La regla especial de la multiplicacin
Unin de probabilidades

El Teorema de Bayes

36

A. Es un ejemplo de probabilidad subjetiva


B. Asume valores menores a 0.
C. Es usado para revisar una probabilidad basndonos en informacin nueva o
adicional.
D. Se determina usando la regla del complemento.
E. Ninguna de las anteriores.
9.

En una compaa compran aparatos elctricos de dos proveedores. 60% son


comprados en Elctrica Mayo, y el resto en Productos Harmon. El nivel de calidad
de Elctrica Mayo es mejor que el de Productos Harmon. 5% de los aparatos
comprados en Elctrica Mayo necesitan mantenimiento adicional, mientras que
8% de los de Productos Harmon lo necesitan. Un aparato elctrico fue
seleccionado al azar y se encontr defectuoso. Cul es la probabilidad de que
haya sido comprado en Productos Harmon?

10. Hay 600 empleados en una tienda departamental de Guadalajara con la direccin
general en Monterrey. Observe la siguiente clasificacin.
Gnero
Hombre
Mujer
Total

No estudiante
25
75
100

Estudiante
225
275
500

Total
250
350
600

Un empleado es seleccionado al azar.


Cul es la probabilidad de que el empleado sea mujer?
Cul es la probabilidad de que sea mujer o estudiante?
Cul es la probabilidad de que el empleado sea estudiante dado un empleado
femenino?
Distribuciones de probabilidad discreta
Una distribucin de probabilidad es similar a una distribucin de frecuencias relativas.
Sin embargo, en vez de describir el pasado, describe que tan probable es un evento
futuro. Se utiliza la media, varianza y desviacin estndar.
Una distribucin de probabilidad indica en una lista todos los valores que pueden
presentarse como resultado de un experimento junto con la probabilidad
correspondiente a cada uno de ellos.
Cmo se puede generar una distribucin de probabilidad?
Supn que se quiere saber cuntas guilas se pueden obtener al lanzar al aire tres
veces una moneda. Este es el experimento. Los posibles resultados son: cero, una,
dos y tres guilas. Cul es la distribucin de probabilidad del nmero de guilas?
Resultado
posible
1
2
3
4
5

Primero
S
S
S
S
A

Lanzamientos de moneda
Segundo
Tercero
S
S
S
A
A
S
A
A
S
S

Nmero
guilas
0
1
1
2
1

de

37

6
7
8

A
A
A

S
A
A

A
S
A

2
2
3

Observa que tenemos 8 resultados posibles. Fjate que slo existe un caso en el que
no obtengas ninguna guila. Hay tres casos en los que puedes obtener una, y tambin
tres casos en los que puedes obtener dos. nicamente un caso en el que obtengas
tres. Con estas observaciones se llena la siguiente tabla.
Nmero de guilas,
X
0
1
2
3
Total

Probabilidad del resultado,


P(x)
1/8=0.125
3/8=0.375
3/8=0.375
1/8=0.125
8/8=1

Grficamente tenemos:

Probabilidad

3/8
0
2/8
1/8
0
0

1
2
3
Nmero de guilas

Ahora conviene observar dos caractersticas importantes:


1. La probabilidad de un resultado especfico va desde cero hasta uno.
2. La suma de las probabilidades de todos los valores mutuamente
excluyentes es 1.00
Algunos conceptos importantes.
A continuacin veremos algunos conceptos importantes del tema.
Variable aleatoria: Cantidad resultado de un experimento, y que debido al azar,
puede tomar valores diferentes.
Variable aleatoria discreta: Variable que slo puede tomar ciertos valores, que
guardan siempre la misma distancia entre ellos.
Si se organiza un conjunto de valores posibles de una variable aleatoria discreta, en
una distribucin de probabilidades, la distribucin se denomina distribucin de
probabilidad discreta.

38

Media, varianza y desviacin estndar de una distribucin de probabilidad


A la media de una distribucin de probabilidad se le conoce tambin como su
valor esperado. Esta medida es un promedio ponderado en que los valores posibles
se ponderan mediante sus probabilidades correspondientes de ocurrencia.
La media se calcula con la frmula:

= [ xP( x)]
Donde representa la media, y P(x) es la probabilidad de que x asuma algn valor.
La varianza de una distribucin de probabilidad discreta mide el tamao de la
dispersin de una distribucin.
La varianza de una distribucin discreta es representada por la letra griega (sigma
cuadrada). La desviacin estndar es la raz cuadrada de 2.
2

La varianza de una distribucin de probabilidad discreta se calcula con la siguiente


frmula:

2 = [(x ) 2 P( x)]
Ahora veremos un ejemplo.
Ejemplo:
David Ramrez, dueo de un negocio de servicios de pintura, estudi sus registros de
las ltimas 20 semanas y reporta el siguiente nmero de casas pintadas por semana:
# de casas
pintadas

semanas

10
11
12
13

5
6
7
2

El total de semanas es de 20. En las primeras 5 semanas la probabilidad es de 0.25,


ya que 5/20=0.25, en las 6 es: 6/20=0.30 y as sucesivamente.
Distribucin de probabilidad:
# de casas
pintadas

Probabilidad
P(x)

10
11
12
13
Total

0.25
0.30
0.35
0.10
1.00

Calcule el nmero medio de casas pintadas por semana:

= E ( x) = [ xP( x)]
= (10)(.25) + (11)(.30) + (12)(.35) + (13)(.10)
= 11.3

39

Calcule la varianza del nmero de casas pintadas por semana:

2 = [( x ) 2 P( x)]
= (10 11.3) 2 (.25) + ... + (13 11.3) 2 (.10)
= 0.4225 + 0.0270 + 0.1715 + 0.2890
= 0.91
Despus de haber revisado el tema de este mdulo, te invito a revisar el siguiente
esquema de evaluacin. En l encontrars las actividades que debes de realizar para
evaluar el aprendizaje logrado hasta el momento.
Ejercicio.
1) De acuerdo con informacin reciente publicada en los peridicos, 36% de los
hogares en Mxico tiene televisin, 47% tiene dos televisiones, 15% tiene 3, y 2%
tiene 4.
a) Cul es la media de televisiones por hogar?
b) Cul es la varianza del nmero de televisiones por hogar?
Autoevaluacin
1. Qu es una distribucin de probabilidad?
A.

Una distribucin de probabilidad indica en una lista todos los valores que
pueden presentarse como resultado de un experimento junto con la
probabilidad correspondiente a cada uno de ellos.
B. Una distribucin de probabilidad indica en una lista todos los valores que
pueden presentarse como resultado de un experimento.
C. Una distribucin de probabilidad indica en una lista los valores que no pueden
presentarse como resultado de un experimento junto con la probabilidad
correspondiente a cada uno de ellos.
D. Una distribucin de probabilidad indica los valores que pueden presentarse al
calcular las medidas de tendencia central.
E. Todas las anteriores.
2. Qu es una variable aleatoria?
A.

Cantidad resultado de un experimento, y que debido al azar, puede tomar


valores diferentes.
B. Un conjunto de resultados.
C. Siempre mayor a 1.
D. El acto de tomar medidas de la observacin de alguna actividad.
E. Ninguna de las anteriores.
3.

Qu es una variable aleatoria discreta?


A.

Cantidad resultado de un experimento, y que debido al azar, puede tomar


valores diferentes.
B. Un conjunto de resultados.
C. Un conjunto de eventos.
D. Cantidad que slo puede tomar ciertos valores que guardan siempre la misma
distancia entre ellos.

40

E.
4.

A la media de una distribucin de probabilidad se le conoce tambin como:


A.
B.
C.
D.
E.

5.

Ninguna de las anteriores.

Media probable.
Probabilidad media.
Posibles resultados.
Valor esperado.
Ninguna de las anteriores.

La media de una distribucin de probabilidad es:


A.

Un promedio ponderado en que los valores posibles se ponderan mediante su


desviacin estndar.
B. Un promedio ponderado en que los valores posibles se ponderan mediante su
varianza.
C. Un promedio ponderado en que los valores posibles se ponderan mediante sus
probabilidades correspondientes de ocurrencia.
D. Un promedio en el que los valores posibles se calculan mediante una regla de
tres.
E. Todas las anteriores.
6.

Las tres tablas presentadas a continuacin muestran variables aleatorias y sus


probabilidades. Sin embargo, slo una de las tres es realmente una distribucin
de probabilidad. Cul es?
x
5
10
15
20

P(x)
0.3
0.3
0.2
0.4

x
5
10
15
20
x
5
10
15
20

P(x)
0.1
0.3
0.2
0.4

P(x)
0.5
0.3
-0.2
0.4

7.

Calcule la media, la varianza y la desviacin estndar de la distribucin del


ejercicio anterior.

8.

Un ejemplo de una variable aleatoria discreta es:


A.

El tiempo que transcurre entre un y otro cliente que llega a un cajero de un


banco.
B. La temperatura del da de hoy.
C. La cantidad de combustible del tanque de una motocicleta.
D. El nmero de clientes de una esttica.
E. Todas las anteriores.

Distribuciones de probabilidad discreta.

41

Distribucin binomial y de poisson.


La distribucin de probabilidad binomial es un ejemplo de una distribucin de
probabilidad discreta.
La distribucin binomial tiene las siguientes caractersticas:
1. El resultado de cada ensayo de un experimento se clasifica en una de dos
categoras mutuamente excluyentes, a saber: xito o fracaso.
2. La variable aleatoria cuenta el nmero de xitos en una cantidad fija de
ensayos.
3. La probabilidad de un xito permanece igual en todos los ensayos. Lo mismo
sucede con la probabilidad de un fracaso.
4. Los ensayos son independientes.
Tal vez sea conveniente en este momento darte algunos ejemplos de la distribucin de
probabilidad binomial:

La respuesta verdadera o falsa en algn ejercicio de un examen. Los


resultados son mutuamente excluyentes, lo cual significa que la respuesta a
una pregunta no puede ser verdadera y falsa al mismo tiempo.
Un departamento de control de calidad clasifica un producto como aceptable o
no aceptable.
Una persona puede ser calificada como empleada o desempleada.

Frecuentemente se clasifican los dos resultados posibles como xito o fracaso.


Esta clasificacin no implica que necesariamente un resultado sea bueno y el otro
malo. Esta es la primera caracterstica de la distribucin binomial que mencionamos
antes.
La segunda caracterstica se refiere a que por ejemplo, en el caso del departamento
de control de calidad, se cuentan todos los productos aceptados.
Con respecto a la tercera caracterstica, y usando el mismo ejemplo del
departamento de control de calidad, la probabilidad de que el primer producto revisado
sea aceptado es de , este sera el primer ensayo. La probabilidad de que el segundo
producto sea aceptado tambin es de , la probabilidad de tener xito en el tercer
ensayo tambin es de , y as sucesivamente.
La cuarta caracterstica, la ltima, significa que los resultados no siguen un patrn.
Retomando el mismo ejemplo del departamento de control de calidad, si el primer
producto fue aceptado, no tienen que ser aceptados el segundo, el terceo y as
sucesivamente.
Cmo se calcula una distribucin de probabilidad binomial?
La distribucin de probabilidad binomial puede describirse utilizando la frmula:

P( x)= n C x x (1 ) n x
En donde:
C
n
x

es una combinacin.
es el nmero de ensayos.
es el nmero de xitos.

42

es la probabilidad de xito en cada ensayo.

Voy a recurrir a un ejemplo para explicar la aplicacin de la frmula. Hay que observar
que no es la constante matemtica, representa un parmetro.
Ejemplo:
El departamento del trabajo de Alabama registra que el 20% de la fuerza de trabajo en
Mobile est desempleada. Para una muestra de 14 trabajadores, calcule las siguientes
probabilidades:
Exactamente 3 estn desempleados.
Al menos 3 estn desempleados.
Al menos 1 est desempleado.

Para calcular la probabilidad de exactamente 3 sustituimos en la frmula:


n=14
x=3
P (3)=14C33 (1- )

143

Primero vamos a calcular: 14C3, para ello vamos a usar la frmula de combinaciones:
nC x=

El smbolo ! se llama factorial y nos indica que el nmero que se encuentra antes del
smbolo, debe ser multiplicado por todos los nmeros menores a l hasta llegar al uno.
En este ejemplo 14!= (14)(13)(12)(11)(10)(9)(8)(7)(6)(5)(4)(3)(2)(1) = 87178291200
14 C 3 =

=364

P (3)= (364) 3 (1- ) 14-3=0.2501


Para calcular la probabilidad de al menos 3, sustituimos x=3, x=2, x=1 y x=0.

P( x 3)=14 C3 ( ) 3 (1 )11 + ...+14 C14 ( )14 (1 ) 0


= .250 + .172 + ... + .000 = .551
Para calcular la probabilidad de al menos 1:

P( x 1) = 1 P(0)
= 114 C 0 ( ) 0 (1 )14
= 1 .044 = .956
Media y varianza de la distribucin binomial
Si deseas calcular la media de una distribucin binomial lo puedes hacer de manera
rpida mediante:

= n
43

Ahora bien, si lo que desea es calcular la varianza debes usar:

2 = n (1 )
Voy aplicar las frmulas de media y varianza en el ejemplo anterior, entonces
tenemos:
La media es: = n = 2.8
La varianza es: 2 = n (1 ) = 2.24
Distribucin de probabilidad de Poisson
La distribucin de probabilidad de Poisson describe la cantidad de veces que
ocurre un evento en un intervalo determinado. El intervalo puede ser de tiempo,
distancia, rea o volumen.
Esta distribucin se basa en dos supuestos:

La probabilidad es proporcional a la extensin del intervalo. Es decir, cuanto


mayor sea la magnitud o extensin del intervalo, tanto mayor ser la
probabilidad.
Los intervalos son independientes.

Esta distribucin tambin es una forma lmite de la distribucin binomial, cuando la


probabilidad de xito es muy pequea y n es grande.
Esta distribucin tiene muchas aplicaciones. Se utiliza como modelo para describir la
distribucin de errores en la captura de datos; en el nmero de ralladuras y otras
imperfecciones en el tablero de los autos recin pintados; en la cantidad de partes
defectuosas en embarques de salida; en el nmero de clientes en espera de servicio
en un restaurante, en espera de entrar a un parque de diversiones, en espera de
entrar a un antro y tambin en el nmero de accidentes en la carretera en un tiempo
determinado.
La distribucin de Poisson puede describirse matemticamente utilizando la
siguiente frmula:

P( x) =

x e u
x!

Donde:

e
x
P(x)

es la media del nmero de ocurrencias (xitos) en un intervalo especfico.


es la constante 2.71828 (base del sistema logartmico neperiano).
es el nmero de xitos.
es la probabilidad que se va a calcular para un valor dado de x.

La media del nmero de xitos puede determinarse en una situacin binomial as:
n, donde n es el nmero de ensayos y es la probabilidad de xito.
La varianza de una distribucin Poisson es tambin n (1 ).

44

Veamos un ejemplo en el que espero puedas comprender mejor la utilidad de esta


distribucin.
Ejemplo:
La Sra. Bonilla est encargada de los prstamos en el banco del centro de Peralillo.
Con base en sus aos de experiencia, estima que la probabilidad de que un solicitante
no sea capaz de pagar su prstamo, es 0.025. El mes pasado realiz 40 prstamos.
Cul es la probabilidad de que 3 prstamos no sean pagados a tiempo?
= n = 40(.025) = 1
P (3) = 13e-1/3! = 0.0613
Despus de haber revisado el tema de este mdulo, te invito a revisar el siguiente
esquema de evaluacin. En l encontraras las actividades que debes de realizar para
evaluar el aprendizaje logrado hasta el momento.
Ejercicio
De un grupo particular de contribuyentes, 25% de los interesados son auditados. Seis
contribuyentes del grupo son elegidos al azar.
a) Cul es la probabilidad de que dos sean auditados?
b) Cul es la probabilidad de que dos o ms sean auditados?
Autoevaluacin
1.
A.
B.
C.
D.

Cul de las siguientes no es una caracterstica de la distribucin binomial?


La probabilidad de xito es constante.
Slo hay dos posibles resultados en cada ensayo de un experimento.
Una cantidad fija de ensayos.
La probabilidad de xito es la misma de un ensayo a otro.

2.
A.
B.
C.
D.

Para una distribucin binomial


n ser un nmero entre 1 y 20 o 25.
p debe ser un mltiplo de 0.10.
Por lo menos debe haber tres posibles resultados.
Ninguna de las anteriores.

3.
A.
B.
C.
D.

Para elaborar una distribucin binomial se necesita:


El nmero de ensayos y la probabilidad de xito de cada uno.
Todos los resultados posibles en cada ensayo.
Siete resultados posibles en cada ensayo.
Todas las anteriores.

4.

La distribucin de probabilidad de Poisson describe la cantidad de veces que


ocurre un evento en:
A. Siete ensayos.
B. Valores de probabilidad mayores a la unidad.
C. un intervalo determinado.
D. Ninguna de las anteriores.
5.

La probabilidad de que un estudiante conteste un examen es de 0.4. Supongamos


que el examen tiene que ser contestado por dos estudiantes cuyas decisiones de

45

contestar son independientes. Por medio de la frmula para la distribucin


binomial, construye la distribucin de probabilidad del nmero de personas que
estarn dispuestas a contestar el examen.
6.

El equipo de ftbol Cruz Azul tiene 2/5 de probabilidad de ganar cuando juega. Si
realiza cuatro partidos, hallar la probabilidad de que el equipo CA gane a) 2
partidos, b) por lo menos un partido, c) ms de la mitad de los partidos.

7.

Si la probabilidad de un remache defectuoso es 0.1 hallar a) la media, b) la


desviacin estndar para la distribucin de remaches defectuosos de un total de
400.

8.

La probabilidad de que una persona se recupere de una infeccin estomacal es


0.8 Supongamos que 20 personas han contrado tal padecimiento.
a) Cul es la probabilidad de que se recuperen exactamente 14?
b) Cul es la probabilidad de que al menos 10 se recuperen?
c) Cul es la probabilidad de que al menos 14, pero no ms de 18, se
recuperen?
d) Cul es la probabilidad de que a lo ms 16 se recuperen?

Distribucin de probabilidad normal


El mdulo anterior nos dedicamos a dos familias de distribucin de probabilidad
discreta: la distribucin Binomial y la distribucin de Poisson. Estas distribuciones se
basan en variables aleatorias discretas, que slo pueden tomar valores especficos.
Un ejemplo sera el nmero de respuestas correctas en un examen de 10 preguntas.
No puede haber un nmero negativo de respuestas correctas. Para que el ejemplo sea
adecuado vamos a supones que tampoco puede haber 71/4 de respuestas correctas.
En este mdulo vamos a continuar viendo distribuciones de probabilidad, pero ahora
veremos una distribucin de probabilidad continua: la distribucin normal.
Una variable aleatoria continua, como ya hemos visto, puede tomar un nmero
infinito de valores dentro de un intervalo. Generalmente, es el resultado de medir algo,
como por ejemplo el peso de una persona.
Las distribuciones de probabilidad de las expectativas de vida de algunos productos,
como son: bateras, llantas, focos. Tambin es el caso de: el peso de las cajas de
cereal, la longitud de los tienden a seguir un patrn normal.
En este mdulo iniciaremos examinando las caractersticas principales de una
distribucin de probabilidad normal y de la curva normal.
Caractersticas de la distribucin de probabilidad normal y de la curva normal:

La curva normal es acampanada y presenta slo un pico en el centro de la


distribucin.
La media aritmtica, la mediana y la moda de la distribucin son iguales y estn
localizadas en el pico. De esta forma, la mitad del rea bajo la curva se encuentra
por arriba de este punto central, y la otra mitad por abajo.
La distribucin de probabilidad normal es simtrica con respecto a su media.
La curva normal decrece uniformemente en ambas direcciones a partir del valor
central. Es asinttica, esto significa que la curva se acerca cada vez ms al eje x,

46

pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva se
extienden indefinidamente en ambas direcciones.
La curva normal es simtrica.
Media, mediana y moda son iguales
La curva normal es simtrica
Tericamente la curva se
Extiende infinitamente

La media, la mediana y la moda


Tienen el mismo valor
No existe slo una distribucin de probabilidad normal, sino que hay una familia de
ellas. Por ejemplo:

Distribucin de probabilidad normal para los aos de


la planta de Campeche, en la que la media es 20
aos.
Distribucin de probabilidad normal para los aos de
Yucatn, en la cual =20 y =3.9.
Distribucin de probabilidad normal para los aos de
Morelos, en la cual =20 y =5.

servicio de los empleados de


aos y la desviacin es 3.1
servicio de los empleados de
servicio de los empleados de

En el siguiente diagrama se muestran 3 distribuciones normales, en donde las medias


de las tres son iguales, pero su desviacin estndar es distinta.

=3.1Planta de Campeche

=3.9 Planta de Yucatn


=5 Planta de Morelos

=20
Distribuciones de probabilidad normal con medias iguales pero desviaciones
estndar diferentes.
En el diagrama siguiente se muestran los pesos de tres cereales diferentes. Los pesos
estn distribuidos en forma normal, con medias diferentes, pero desviaciones estndar
idnticas.

47

Cereal 1
=1.6 gramos

=283 gramos
gramos

Cereal 2
=1.6 gramos

Cereal 3
=1.6 gramos

=301 gramos

=321

Distribuciones de probabilidad normal con medias diferentes pero desviaciones


estndar iguales.
En el diagrama siguiente se muestran la distribucin de la resistencia de un cable a la
tensin. Las resistencias estn distribuidas en forma normal, con medias diferentes y
desviaciones estndar diferentes.
= 26 lb/in2

= 41lb/in2
= 52 lb/in2

=2,000lb/in2

=2,107lb/in2

=2,186lb/in2

La distribucin de probabilidad normal estndar


Como acabamos de ver hay una familia de distribuciones normales. Por fortuna se
puede utilizar, en todos los casos en los que se puede aplicar la distribucin normal,
un miembro de esta familia que tiene una media de cero y una desviacin estndar de
1.
La distribucin normal estndar es una distribucin normal con media cero y
desviacin estndar de 1. Tambin es llamada distribucin z.
Cualquier distribucin normal puede convertirse en la distribucin normal estndar
restando la media a cada observacin y dividiendo entre la desviacin estndar.
Primero se convierte la distribucin que se tiene, en la distribucin normal estndar
utilizando un valor z. Un valor z es la distancia entre un valor seleccionado llamado x, y

48

la media de la poblacin , dividida entre la desviacin estndar . Expresado en una


frmula es: Z = (x )/.
Al determinar el valor z mediante la frmula se puede obtener el rea o la probabilidad
bajo cualquier curva normal mediante una tabla.
Voy a darte un ejemplo.
Ejemplo:
El salario inicial de los primeros dos meses de los recin graduados de MBA siguen la
distribucin normal con una media de $2,000 y una desviacin estndar de $200.
Cul es el valor z para un salario de $2,200?
z = (x )/s = (2,200 2,000)/200 = 2.00
Cul es el valor z de $1,700?
z = (x )/ = (1,700 2,000)/200 = -1.50
Un valor z de 1 indica que el valor de $2,200 es una desviacin estndar arriba de la
media de $2,000.
Un valor z de -1.50 indica que $1,700 es 1.5 desviacin estndar debajo de la media
de $2,000.
Para el valor de z=2, cul es el rea bajo la curva normal entre la media y el valor de
2,200? En la tabla se encuentra el valor de 0.4772. Significa que 47.72% es la
probabilidad de que una observacin se encuentre entre un valor de z=0 y z=2.
reas bajo la curva normal
A continuacin se considerarn tres reas bajo la curva normal que son muy
utilizadas. Tambin se conocen como la Regla Emprica.
1.
2.
3.

Aproximadamente 68% del rea bajo la curva normal est entre la media ms una
y menos una desviaciones estndar, y se expresa +- 1.
Alrededor de 95% del rea bajo la curva normal est entre la media ms dos y
menos dos desviaciones estndar, lo que se expresa +- 2.
Prcticamente toda el rea bajo la curva normal est entre la media y tres
desviaciones estndar (a uno y otro lados del centro), es decir +- 3.

Ejemplo:
El uso diario de agua por persona en Vista Bella, Naucalpan, est distribuido
normalmente con una media de 20 galones y una desviacin estndar de 5 galones.
Cuntos galones de agua consumen aproximadamente 68% de ellos?
Aproximadamente 68% del uso diario de agua cae entre 15 y 25 galones.
Cul es la probabilidad de que una persona de Vista Bella seleccionada al azar
consuma entre 20 y 24 galones por da?
z= (x )/ = (20 20)/5 = 0.00
z = (x )/ = (24 20)/5 = 0.80

49

El rea bajo la curva normal entre un valor z de cero y un valor z de 0.80 es 0.2881.
Concluimos que 28.81% de los residentes consumen entre 20 y 24 galones de agua
por da.
Observa el siguiente diagrama.

Qu porcentaje de la poblacin consume entre 18 y 26 galones por da?


z = (x )/ = (18 20)/5 = 0.40
z = (x )/ = (26 20)/5 = 1.20
El rea asociada con un valor z de 0.40 es de .1554.
El rea asociada con un valor z de 1.20 es de .3849.
Sumando estas reas, el resultado es .5403.
Concluimos que 54.03% de los residentes consumen entre 18 y 26 galones de agua
por da.
Ejemplo:
El profesor Velasco ha determinado que las calificaciones en su curso de estadstica,
estn aproximadamente distribuidas en forma normal con una media de 72 y
desviacin estndar de 5. l avisa a la clase que el 15% ms alto obtendr una
calificacin de A. Cul es la puntuacin lmite ms baja que obtendr calificacin de
A?
Para comenzar, sea x la puntuacin que separa una A de una B.
Si el 15% de los estudiantes tienen puntuacin superior a x, entonces el 35% deber
estar entre la media de 72 y x.
El valor z asociado correspondiente al 35% es 1.04.
Tomamos z = 1.04 y resolvemos la ecuacin de la normal estndar para x. El
resultado es la puntuacin que separa a los estudiantes que separan una A de
aquellos que ganaron una B.
1.04 = (x 72)/5 = 72 + 5.2 = 77.2
Aquellos cuya puntuacin sea de 77.2 o ms ganarn una A.

50

La aproximacin normal a la binomial


La distribucin normal (una distribucin continua) proporciona una buena aproximacin
de la distribucin binomial (una distribucin discreta) para valores grandes de n.
La distribucin de probabilidad normal es generalmente una buena aproximacin para
la distribucin de probabilidad binomial cuando n y n (1 ) son ambos mayores que
5.
Recordemos que para un experimento con una distribucin de probabilifdad binomial:

Slo existen dos resultados mutuamente excluyentes: xito y fracaso.


La distribucin es el resultado de contar el nmero de xitos en una cantidad fija
de ensayos.
Cada ensayo es independiente.
La probabilidad, , permanece igual de un ensayo a otro.

Factor de correccin de continuidad


El valor 0.5 se resta o se suma, dependiendo de la situacin, a un valor seleccionado
cuando una distribucin de probabilidad continua se aproxima a una distribucin de
probabilidad discreta.
Ejemplo:
Un estudio reciente de una firma de estudios de mercado mostr que 15% de
residentes americanos son propietarios de una videocmara. Para una muestra de 200
hogares, cuntos de los hogares esperara que tengan videocmara?

= n = (.15)(200) = 30
Esta es la media de una distribucin binomial.
Cul es la varianza?

2 = n (1 ) = (30)(1 .15) = 25.5


Cul es la desviacin estndar?

= 25.5 = 5.0498
Cul es la probabilidad de que menos de 40 hogares en la muestra tengan
videocmaras?
Usamos el factor de correccin, por lo tanto x es 39.5.
El valor z es 1.88
z = (x )/ = (39.5 40)/5.0498 = 1.88

En esta tabla el rea entre 0 y 1.88 en la escala z es .4699.


Por lo tanto, el rea a la izquierda de 1.88 es .5000 + .4699 = .9699.

51

La probabilidad de que menos de 40 de los 200 hogares tengan videocmara es


aproximadamente 97%.
Actividad
1. La vida de cierto tipo de refrigerador es distribuida normalmente con una media de
7.2 aos y con una desviacin estndar de 1.9 aos.
a) Qu fraccin de refrigeradores dura ms de 10 aos?
b) Qu fraccin de refrigeradores dura entre 6 y 10 aos?
c) Qu fraccin de refrigeradores dura ms de 8 aos, pero menos de 10?
d)
Suponga que el fabricante quiere establecer una garanta, as que slo
aproximadamente el 15% de los refrigeradores necesitarn ser reparados bajo la
garanta. Cul es el punto de separacin entre aquellos que recibirn reparacin
bajo garanta y los que no?
Autoevaluacin
Elige la respuesta correcta
1.

La distribucin normal es una


A.
B.
C.
D.

2.

Cules de las siguientes son caractersticas de la distribucin normal?


A.
B.
C.
D.

3.

Es una distribucin simtrica.


Tiene forma acampanada.
Es asinttica.
Todas las anteriores.

Cules de los siguientes enunciados son correctos para una distribucin normal?
A.
B.
C.
D.

4.

Distribucin discreta
Distribucin Continua.
Distribucin con sesgo positivo
Ninguna de las anteriores.

No puede tomar valores negativos.


Se define con su media y su desviacin estndar.
Todas las distribuciones normales tienen una varianza de al menos de 1.
Todas las anteriores.

Cules de los siguientes enunciados son correctos para una distribucin normal
estndar?
A.
B.

Tambin se llama distribucin z


Cualquier distribucin normal puede ser convertida a una distribucin normal
estndar
C. La media es 0 y la desviacin estndar es 1.
D. Todas las anteriores.
5.

El rea bajo la curva normal entre 0 y -1.75 es


A. .0401
B. .9599
C. .4599

52

D. Ninguna de las anteriores.


6.

El rea bajo la curva normal menor que 1.75 es


A.
B.
C.
D.

7.

.0401
.9599
.4599
Ninguna de las anteriores.

El factor de correccin de continuidad se usa cuando


A.
B.
C.
D.

8.

El tamao de la muestra es al menos de 5.


Ambos, n y n (1 - ) son al menos de 30.
Una distribucin continua se usa para aproximar una distribucin discreta
Se aplica una distribucin normal estndar.

En una distribucin normal la relacin entre la media, mediana, y la moda es


A.
B.
C.
D.

9.

Son iguales
La media es la ms grande
La mediana es la ms grande.
Ninguna de las anteriores.

La aproximacin de la distribucin normal a una distribucin binomial se usa


cuando.
A.
B.
C.
D.

El tamao de la muestra es al menos de 30.


Ambos, n y p n (1 - p) son al menos de 5.
La media y la varianza son iguales.
El valor z es ms grande que 0.

10. En la distribucin estndar normal, cul es la probabilidad de encontrar un valor z


entre -1.25 y -1.00?
A.
B.
C.
D.

0.3944
0.3413
0.7357
0.0531

Muestreo
Para determinar cundo y cmo usar diversas tcnicas de muestreo, a partir de una
lectura y de ejemplos, explicars por qu una muestra es la nica forma posible de
tener conocimientos acerca de una poblacin, describirs los diversos mtodos para
seleccionar una muestra y definirs y producirs una distribucin de muestreo de
medias muestrales.

Muestreo aleatorio simple


MUESTREO

Muestreo aleatorio sistemtico


Muestreo aleatorio estratificado
Muestreo por conglomeracin

53

Para iniciar este mdulo volveremos a definir el trmino poblacin y el trmino


muestra:
La poblacin es el grupo completo de individuos u objetos de estudio.
La muestra es una parte o subgrupo de esa poblacin.
Una muestra es un medio utilizado para inferir algo acerca de una poblacin, en
muchos casos, es la nica forma de hacerlo. Algunas de las principales razones por
las que el muestreo es necesario son:

La imposibilidad fsica de revisar a todos los integrantes de la poblacin.


El costo que representa el estudiar a todos los integrantes de una poblacin.
Lo confiable de los resultados de la muestra.
Entrevistar a toda la poblacin exigira mucho tiempo.
La naturaleza destructiva de ciertas pruebas no permiten probar todos los
artculos, o no quedara nada para la venta.

Muestra probabilstica
Una muestra probabilstica se selecciona de modo que cada integrante de la
poblacin en estudio tenga una probabilidad conocida (pero distinta de cero) de ser
incluido en la muestra.
Mtodos de muestreo de probabilidad

Muestreo aleatorio simple: Muestra seleccionada de manera que cada


integrante de la poblacin tenga la misma probabilidad de quedar incluido.

Muestra aleatoria sistemtica: Los integrantes o elementos de la poblacin se


ordenan en alguna forma. Se selecciona al azar un punto de partida, y despus
se elige para la muestra cada k- simo elemento de la poblacin.

Muestreo aleatorio estratificado: Una poblacin se divide en subgrupos,


denominados estratos, y se selecciona una muestra de cada uno.

Muestreo por conglomeracin: Una poblacin primero se divide en unidades


primarias y despus las muestras son seleccionadas de las unidades primarias.

En una muestra no probabilstica la inclusin de un integrante de la poblacin en la


muestra se basa en el juicio de la persona que selecciona la muestra.
El error de muestreo es la diferencia entre un valor estadstico (de muestra) y su
parmetro (de poblacin) correspondiente.
Distribucin de muestreo de medias muestrales
La distribucin de muestreo de medias muestrales es una distribucin de probabilidad
que consta de todas las medias muestrales posibles de un tamao de muestra dado.

54

Ejemplo:
Una firma de abogados tiene 5 socios. Para su junta semanal de socios cada uno
report el nmero de horas con los clientes para sus servicios de la semana pasada.

1.

Socios
Snchez

horas
22

2.

Gmez

26

3.
4.

Rivera
Sandoval

30
26

5.

Ruiz

22

Si dos socios son seleccionados al azar, cuntas muestras diferentes son posibles?
Esta es la combinacin de 5 objetos tomando 2 al mismo tiempo.
Esto es:
5 C2

5!
= 10
2! (5 2)!

Existe un total de 10 muestras diferentes.


Socios

Total

Media

1, 2

48

24

1, 3

52

26

1, 4

48

24

1, 5

44

22

2, 3

56

28

2, 4

52

26

2, 5

48

24

3, 4

56

28

3, 5

52

26

4, 5

48

24

Organice la media muestral en una distribucin de muestreo.


Media muestral
22
24
26
28

Frecuencia
1
4
3
2

Relativa probabilidad
de frecuencia
1/10
4/10
3/10
2/10

55

Calcule la media de la media muestral. Comprela con la media poblacional.


La media de la media muestral es 25.2 horas.

X =

22(1) + 24(2) + 26(3) + 28(2)


= 25.2
10

La media de la poblacin tambin es 25.2 horas.


22 + 26 + 30 + 26 + 22
= 25.2
5
Observa que la media de la media muestral es igual a la media de la poblacin.

Muestreo aleatorio simple.


El tipo de muestreo ms utilizado es el que se denomina muestreo aleatorio simple. La
muestra es seleccionada de manera que cada integrante de la poblacin tiene la
misma probabilidad de quedar incluido.
Para ilustrar el muestreo aleatorio simple supongamos que tenemos una poblacin de
845 empleados. Se desean seleccionar 52. Una forma de asegurar que todos los
trabajadores tengan la misma oportunidad de ser elegidos es mediante una rifa
colocando cada uno de sus nombres en una tmbola. Un mtodo ms adecuado es
usar el nmero de identificacin de cada empleado y emplear una tabla de nmeros
aleatorios. Como su nombre lo indica, los nmeros de la tabla han sido seleccionados
en forma aleatoria, por ejemplo, por una computadora. Luego se elige un nmero para
iniciar, por ejemplo en base a la hora, y despus se contina en cualquier direccin en
la tabla.
Muestreo aleatorio sistemtico.
Los integrantes de la poblacin se ordenan en alguna forma, por ejemplo
alfabticamente, luego se selecciona al azar un punto de partida y se elige una
muestra de la poblacin.
Muestreo aleatorio estratificado
En el muestreo aleatorio estratificado una poblacin se divide en subgrupos,
denominados estratos, y se selecciona una nuestra de cada uno.
La seleccin puede ser proporcional o no proporcional. Un procedimiento de muestreo
proporcional requiere que el nmero de elementos en cada estrato tenga la misma
proporcin que se encuentra en la poblacin.
Ejemplo:
Estrato
1
2
3
4
5
Total

Ganancia
(dividendos)
30% o superior
20 hasta 30%
10 hasta 20%
0 hasta 10%
Dficit

Nmero de
empresas
8
35
189
115
5
352

Porcentaje del
total
2
10
54
33
1
100

Cantidad
muestreada
1
5
27
16
1
50

Nota que el 2% de 50 es 1, el 10% de 50 son 5 y as sucesivamente.

56

Muestreo por conglomeracin


En este muestreo se divide una regin extensa en reas menores. Con frecuencia se
denomina a stas unidades primarias. Supongamos que se divide a la regin en 12
unidades primarias, despus se seleccionan al azar cuatro reas menores.

Despus de haber revisado el tema de este mdulo, te invito a revisar el siguiente


esquema de evaluacin. En l encontraras las actividades que debes de realizar para
evaluar el aprendizaje logrado hasta el momento.
Actividad
Un estudio reciente de una revista de automviles, indica que de aquellos que
compraron un auto nuevo se esperaba dentro del prximo ao el pago de la media de
$29,500 por auto. Asuma que este valor es la media de la poblacin y la desviacin
estndar de la poblacin es de $6,500.
a) Cul es la probabilidad de seleccionar una muestra de 30 compradores de autos y
encontrar la muestra media dentro de $1,000 de la poblacin media?
b) Cul es la probabilidad de seleccionar una muestra de 50 compradores de autos
y encontrar la muestra de la media dentro de $1,000 de la media de la poblacin?
c) Cul es la probabilidad de seleccionar una muestra de 50 compradores de autos
y encontrar la muestra de la media para ser ms de $30,700?
Autoevaluacin
Elige la respuesta correcta
1.

Una muestra
A.
B.
C.
D.

2.

De los siguientes enunciados, cul no corresponde a una razn para usar una
muestra?
A.
B.
C.
D.

3.

Es una parte de la poblacin.


Se constituye con ms de 30 observaciones.
Comnmente se identifica con N.
Todas las anteriores.

La naturaleza destructiva de algunas pruebas.


La imposibilidad fsica de revisar todos los elementos de la poblacin.
La exactitud en el uso de la muestra.
Todas las anteriores son razones para usar una muestra.

Cul de los siguientes mtodos no es un mtodo de muestreo de probabilidad?

57

A.
B.
C.
D.
4.

Muestreo aleatorio
Muestreo sistemtico
Muestreo estratificado
Todos los anteriores son mtodos de muestreo probabilstico.

En el muestreo aleatorio simple


A.
B.

Cada k- simo elemento se selecciona para ser parte de la muestra.


Todos los integrantes tienen la misma probabilidad de ser parte de la
muestra.
C. No todos los integrantes tienen la misma probabilidad de ser parte de la
muestra.
D. Todas las anteriores.
5.

Supn que una poblacin tiene 20 elementos. Cuntas muestras de n = 3 son


posibles?
A.
B.
C.
D.

6.

La diferencia entre la media muestral y la media poblacional se llama:


A.
B.
C.
D.

7.

Sern siempre iguales.


tendrn siempre una distribucin normal.
Sern caracterizadas por el error estndar de la media.
Ninguna de las anteriores.

Supn una poblacin con distribucin normal. Cules de los siguientes


enunciados son correctos con respecto a la distribucin de las medias
muestrales?
A.
B.
C.
D.

9.

Media poblacional.
Desviacin estndar poblacional.
Error estndar de la media.
Error muestral.

La media de todas las medias muestrales y la media poblacional:


A.
B.
C.
D.

8.

6840
1140
20
120

Nunca se conoce la deviacin estndar de la poblacin.


La distribucin de las medias muestrales es uniforme.
La distribucin de las medias muestrales es una distribucin normal.
Ninguna de las anteriores.

El error estndar de la media:


A.

Es la desviacin estndar de la distribucin muestral de las medias


muestales.
B. Siempre tiene una distribucin normal.
C. Es a veces menor que 0.
D. Ninguna de las anteriores.

58

Estimacin e intervalos de confianza


Para poder estimar parmetros de poblaciones individuales, a partir de lecturas y
ejemplos, definirs una estimacin puntual, interpretars el nivel de confianza,
construirs un intervalo de confianza para la media poblacional cuando se conoce la
desviacin estndar poblacional y cuando no se conoce, construirs un intervalo de
confianza para una proporcin poblacional y determinars el tamao de la muestra
para el muestreo por atributos y variables.

Estimacin puntual
ESTIMACIN E INTERVALOS DE
CONFIANZA

Intervalos de confianza
Tamao de muestra apropiado

En el mdulo anterior se habl de muestreo. Se hizo nfasis en las razones por las
cuales a veces no se puede trabajar con la poblacin y se requiere emplear una
muestra.
Hemos hablado en mdulos anteriores de la media y la desviacin estndar de la
poblacin. En los negocios, la mayor parte de las veces no se conoce esta
informacin. Precisamente el propsito del muestreo es estimar estos valores. As por
ejemplo, se toma una muestra de una poblacin y se usa la media de la muestra para
estimar la media de la poblacin.
Este mdulo considera varios aspectos importantes del muestreo, y comienza con el
estudio de las estimaciones puntuales.
Una estimacin puntual es un valor que se usa para estimar un valor poblacional.
Por ejemplo, se toma una muestra de 50 ejecutivos y se les pregunta cuntas horas
trabajaron la semana pasada. Se calcula la media y se utiliza el valor de la media
muestral, como una estimacin puntual de la media poblacional que no se conoce.
Una estimacin puntual es slo un estadstico que se usa para estimar un parmetro
poblacional. Vamos a dar otro ejemplo con la intencin de que te quede ms claro.
Imagnate que trabajas en una empresa que fabrica radios. Y que quieres estimar la
edad promedio de las personas que compran uno. Tomas una muestra aleatoria de 50
compradores recientes, determinas la edad de cada uno y calculas la edad promedio.
La media de la muestra es una estimacin puntual de la media de la poblacin. La
media muestral no es el nico valor que podras usar para estimar la media
poblacional. Tambin podras usar la mediana muestral. Aunque no te lo recomendara
ya que no es tan eficiente, pues hay ms dispersin en la distribucin de las medianas
muestrales que en la de las medias muestrales.
Ejemplos de estimacin puntual son la media muestral, la desviacin estndar
muestral, la varianza muestral, y la proporcin muestral.
Si la poblacin sigue la distribucin normal, la distribucin muestral de la media
muestral seguir tambin la distribucin normal.

59

Para determinar la probabilidad de que una media muestral est dentro de una regin
particular, puedes utilizar:

z=

X
n

Si la poblacin no sigue la distribucin normal, pero la muestra es de al menos 30


observaciones, la media muestral seguir la distribucin normal.
Ejemplo:
Suponga que la media del precio de venta de un galn de gasolina en Mxico es de
$1.30. Adems, asuma que la distribucin est posiblemente inclinada, con una
desviacin estndar de $0.28. Cul es la probabilidad de seleccionar una muestra de
35 estaciones de gasolina y encontrar una media muestral dentro de $.08?
El primer paso es encontrar los valores z correspondiente a $1.22 (1.30 - 0.08) y $1.38
(1.30 + 0.08). Existen dos puntos dentro de $0.08 de la media de la poblacin.

z=

z=

X
s

$1.38 $1.30
$0.28

35

$1.22 $1.30
$0.28

35

= 1.69

= 1.69

Despus determinamos la probabilidad de los valores z entre -1.69 y 1.69. Esto es:

P(1.69 z 1.69) = 2(.4545) = .9090


La probabilidad de que la media muestral est dentro de $0.08 de la media de la
poblacin es del 91%.
Una estimacin puntual es un slo valor. Una estimacin en la que se da ms
informacin implica dar un intervalo de valores, en el que se espera se encuentre el
parmetro poblacional. A este intervalo de valores se le llama intervalo de confianza.
Los hechos que determinan la amplitud de un intervalo de confianza son:
1. El tamao de la muestra, n
2. La variabilidad de la poblacin. normalmente estimada por s.
3. El nivel de confianza deseado.
Si la desviacin estndar de la poblacin es conocida o la muestra es mayor que 30
utilizamos la distribucin z.

X z

s
n

Si la desviacin estndar de la poblacin es desconocida y la muestra es menor que


30 utilizamos la distribucin t

X t

s
n
60

Un intervalo de estimacin establece el rango en el cual se encuentra el parmetro de


poblacin.
Un intervalo en el cual se espera se encuentre el parmetro poblacional se llama
intervalo de confianza.
Por ejemplo, se estima que en una determinada regin el ingreso anual medio de los
trabajadores de la construccin es de $65,000.00 (dlares). El intervalo de esta
estimacin puede ser de $61,000.00 a $69,000.00. Podemos saber que tan seguros
podemos estar que la media poblacional se encuentre en este intervalo con una
probabilidad. Por ejemplo, podemos tener una seguridad del 90% de que el salario
anual medio de los trabajadores de la construccin en esa regin est en ese
intervalo.
Los dos intervalos de confianza que son ms utilizados son de 95% y 99%.
Para un intervalo de confianza de 95%, aproximadamente 95% de los intervalos
construidos contendrn igualmente el parmetro inicial. Tambin el 95% de la media
muestral, para un tamao especfico de muestra, se encontrar dentro del 1.96 de la
desviacin estndar de la media poblacional.
Para un intervalo de confianza de 99%, 99% de la media muestral, para un tamao de
especfico de muestra, se encontrar dentro del 2.58 de la desviacin estndar de la
media poblacional.
Cmo se calcula un intervalo de confianza del 95%?
Supn que realizas una investigacin en la que quieres determinar el salario inicial de
los egresados de tu licenciatura con mucha experiencia y muy buenas relaciones.
Calculas la media muestral y es de $27,000.00. y la desviacin estndar muestral es
de$200.00. Tu muestra fue de por lo menos 30 observaciones. El intervalo de
confianza de 95% est entre $26,608.00 y $27,392.00, lo que se obtiene de
$27,000.001.96 (200). Si tomaras 100 muestras del mismo tamao, de la misma
poblacin, y se calcularan los 100 intervalos de confianza, se espera que la media
poblacional se encontrara en 95 de los 100 intervalos de confianza.
Error estndar de la media muestral
El error estndar de la media muestral es la desviacin estndar de la distribucin de
las medias muestrales.
Se calcula como:

sx =
sx
s
n

n
es el smbolo para el error estndar de la media muestral.
es la desviacin estndar de la poblacin.
es el nmero de observaciones.

Si s no se conoce y n 30, la desviacin estndar de la muestra, designada s, se


aproxima a la desviacin estndar de la poblacin.
El 95% intervalos de confianza para se da como:

X 1.96

El 99% intervalos de confianza para se da como:

X 2.58

s
n
s
n

61

En general, un intervalo de confianza para la media se calcula como:

X z

s
n

Ejemplo:
El director de una escuela de negocios quiere estimar la cantidad media de horas que
los estudiantes trabajan por semana. De una muestra de 49 estudiantes mostr una
media de 24 horas con una desviacin estndar de 4 horas. Cul es la media de la
poblacin?
El valor de la media de la poblacin no es conocida. Nuestra mejor estimacin de este
valor es la muestra media de 24.0 horas. Este valor es llamado estimacin puntual.
Encuentre el intervalo de confianza con el 95% para la media de la poblacin.
El rango lmite de confianza es de 22.88 a 25.12.
X 1.96

s
n

= 24.00 1.96

4
49

= 24.00 1.12

Aproximadamente el 95% de los intervalos construidos incluyen el parmetro de


poblacin.
El intervalo de confianza para la proporcin de la poblacin se estima como:
Ejemplo:

pz

p (1 p )
n

De una muestra de 500 ejecutivos que tienen casa propia 175 revelaron planear
vender sus casas y cambiarse a Arizona. Desarrolle un intervalo de confianza con el
98% para la proporcin de ejecutivos que planean vender sus casas y cambiarse a
Arizona.
.35 2.33

(.35)(.65)
= .35 .0497
500

Factor de correccin de la poblacin-finita


Una poblacin que tiene un determinado lmite superior es finita. Por ejemplo, hay
21,736 estudiantes inscritos en una Universidad, hay 40 empleados en una empresa,
una fbrica de automviles ensambl 936 jeeps, ayer hubo 32 accidentes en la
autopista.
Para una poblacin finita, donde el nmero total de objetos es N y la magnitud de la
muestra es n, al error estndar de la media muestral de la proporcin muestral se le
aplica el siguiente ajuste:
Error estndar de la media muestral, usando un factor de correccin:

x =

N n
N 1

Error estndar de la proporcin muestral, utilizando un factor de correccin:


p =

p(1 p)
n

N n
N 1

62

A este ajuste se le llama factor de correccin para una poblacin finita.


Por qu es necesario aplicar un factor de correccin y cul es su efecto?
Supn que la muestra es de 100 y la poblacin es de 1000. La raz cuadrada del
cociente (N-n)/(n-1)=0.9492. La multiplicacin de este factor de correccin por el error
estndar lo reduce en aproximadamente un 5%. Esta reduccin genera un intervalo
menor de valores al estimar la media poblacional. Si duplicamos la muestra, el error
estndar se reduce en ms de un 10%.
Si la muestra es inferior al 5% de la poblacin, el impacto del factor de correccin es
muy pequeo por lo que, si n/N < .05, el factor de correccin de la poblacin finita se
ignora.
Ejemplo:
Utilizaremos el ejemplo anterior, para construir un intervalo de confianza del 95% para
la cantidad media de horas que los estudiantes trabajan por semana, si tan slo son
500 estudiantes en el campus.
Porque n/N = 49/500 = .098 el cual es mayor que 05, utilizamos el factor de correccin
de la poblacin-finita

24 1.96(

4
49

)(

500 49
) = 24.00 1.0648
500 1

Eleccin del tamao de muestra apropiado


Existen 3 factores que determinan el tamao de la muestra, ninguno tiene relacin
con el tamao de la poblacin. stos son:

El nivel de confianza deseado.


El mximo error permisible.
La variacin en la poblacin.

Variacin en la poblacin
Para encontrar el tamao de la muestra para una variable:

z s
n =

Donde:
E es el error permisible,
z es el valor z correspondiente al nivel de confianza seleccionado
s es la desviacin de la muestra del estudio piloto.

63

Ejemplo:
Un grupo de consumidores quiere estimar la media del cargo mensual de energa de
julio de una casa comn, con un error permisible de $5.00 y utilizando 99% de nivel de
confianza. Basado en estudios similares, la desviacin estndar se estima debe ser
$20.00. Cuntas muestras son requeridas?
2

(2.58)(20)
n =
= 107
5

Tamao de la muestra para proporciones


La frmula para determinar el tamao de la muestra en el caso de una proporcin es:
Z
n = p(1 p)
E

Donde:

p es la proporcin estimada basada en la experiencia anterior o de un estudio piloto


z es valor z asociado con el grado de confianza seleccionado
E es el mximo error permisible que el investigador tolerar.
Ejemplo:
Un club quiere estimar la proporcin de nios que tiene un perro como mascota. Si el
club quisiera estimarlo dentro del 3% de la proporcin de la poblacin, cuntos nios
necesitaran contactar? Asuma 95% de nivel de confianza y que el club estima que un
30% de los nios tienen un perro como mascota.
2

1.96
n = (.30)(.70)
= 897
.03
Despus de haber revisado el tema de este mdulo, te invito a revisar el siguiente
esquema de evaluacin. En l encontraras las actividades que debes de realizar para
evaluar el aprendizaje logrado hasta el momento.
Actividad
Una muestra al azar de 20 residentes retirados de Florida revel que escuchan la radio
en promedio (media) 40 minutos al da con una desviacin estndar de 8.6 minutos.
Desarrolle un intervalo de confianza del 95% para la poblacin media del tiempo que
escucha la radio.
Autoevaluacin
1.

Una estimacin puntual es:


A.
B.
C.
D.

2.

Siempre una estimacin de la media poblacional.


Siempre igual a l valor poblacional.
Una estimacin de algn parmetro de la poblacin.
Ninguna de las anteriores.

Un intervalo de confianza
A.

Siempre incluye el parmetro de la poblacin.

64

B. Su ancho se reduce al incrementar el tamao de la muestra.


C. No puede ser 0.
D. Ninguna de las anteriores.
3.

Si deseamos reducir el ancho de un intervalo de confianza, no debemos:


A.
B.
C.
D.

4.

Para obtener un intervalo de confianza para una proporcin


A.
B.
C.
D.

5.

Incrementar el tamao de la muestra.


Reducir el tamao de la poblacin.
Reducir el nivel de confianza.
Ninguna de las anteriores.

Necesitamos conocer las condiciones binomiales.


La muestra debe ser al menos de 100.
p debe ser al menos de 0.05.
Ninguna de las anteriores.

El factor de correccin de poblacin finita se usa cuando:


A.
B.
C.
D.

n > 30.
N > 1000.
np > 5.
n/N > 0.05.

6. Se realiz una encuesta para determinar la media de los ingresos de familias en la


ciudad de San Luis Potos. El patrocinador de la encuesta quiere un estimado
alrededor de $100 con un 95% de nivel de confianza. La desviacin estndar del
ingreso se estim en $400. Cuntas muestras se requieren?
7. Como parte de la misma encuesta del problema anterior, el patrocinador desea
estimar la proporcin de trabajadores que tienen dos empleos. El estimado ser
dentro del 2% con un 96% de nivel de confianza. El director estima que el 30% de
los trabajadores en San Luis Potos tiene dos empleos. Cuntas muestras se
requieren?

La referencia bibliogrfica se encuentra en el documento original que puede ser


consultado en www.ceaamer.edu.mx/new/.../Estadistica_probabilidad_2do_Negocios_....

65