Vous êtes sur la page 1sur 112

ANALISIS CUNTITATIVO I

DESARROLLO DE CLASES
LA IMPORTANCIA DE LA ESTADISTICA Y QUIEN LA UTILIZA.
Es comn en nuestro pas, cada vez que vamos a elecciones
presidenciales, diputados, alcaldes, or decir a ciertas personas, cual x
o y candidato tiene posibilidades de ganar la eleccin, en ese momento,
eventualmente presentar proyecciones de intencin de voto al momento
de practicarse las elecciones quien puede ganar, como x candidato va
perdiendo posibilidades de ganar o a la inversa. Otro aspecto importante
es, que en esas predicciones se habla de un margen de error.

Nos hacemos las preguntas siguientes:


Qu quiere decir margen de error?
Quin realizo el sondeo?
A cuntas personas se entrevisto y cuantas Debi ser?
Es confiable el informe?

Esta es en esencia el uso de la estadstica, poder predecir un evento


futuro con cierto grado de certeza. Esto hace de la estadstica un gran
negocio.

En las casas de apuestas es comn el uso de la estadstica, para poder


inferir cuanto se puede pagar en una apuesta. Ustedes han odo decir
que x equipo su apuesta esta 10 a 1.

La estadstica abarca todos los campos de la actividad humana, como


cuantos hondureos seremos al 2020, cuantas mujeres, que se espera
de las variables macroeconmicas, probabilidad que un porcentaje de
la poblacin tenga cncer, las probabilidades de xito de un nuevo
producto, cantidad de consumidores, determinar el parque vehicular,
etc.

La palabra estadstica significa cosas diferentes para personas


diferentes, dependiendo de la actividad que realice. Un deportista, un
entrenador, el gerente de una compaa, el Banco Central de Honduras,
etc.

HACER VARIOS EJEMPLOS.

1
Existen tres tipos de mentiras: mentiras ordinarias, las grandes mentiras
y la estadstica, porque en la vida se dan varios fracasos estadsticos si
se usa incorrectamente. (Dar un ejemplo)

HISTORIA
Palabra italiana estatista que significa estadstica. Se empez a utilizar
entre los aos 1719-1772.

La estadstica oficial es tan vieja como la historia registrada


(levantamiento de censos) de poblacin y recursos. Es a travs del
tiempo que su usos se fue incorporando (Romanos, Babilonia, etc.)

SUBDIVISION DE LA ESTADISTICA
La estadstica se divide en dos grandes categoras:

Estadstica descriptiva. Supongamos que en esta clase se calcula la


calificacin promedio de uno de sus grupos. Lo que se esta evaluando
es el desempeo del grupo El proceso de estimacin de tal promedio
seria un problema concerniente a la estadstica inferencial. En este caso
se tendra que evaluar si las afirmaciones son verdaderamente validas.

La Estadstica Inferencial. Se puede utilizar tambin como una rama


de la estadstica conocida como Teora de Decisiones. Es la toma de
decisiones en condiciones de incertidumbre.

AGRUPACION Y PRESENTACION DE DATOS PARA EXPRESAR


SIGNIFICADOS:TABLAS Y GRAFICAS
Los datos son obtenidos de cualquier cantidad de observaciones
relacionadas. Se puede recolectar informacin, de cuantos alumnos
asisten a clases todos los das y podemos llamar a esta informacin
como datos. La coleccin de datos se le cono ce como Conjunto de
Datos. Debe considerarse que un solo dato es un dato puntual.

COMO PODEMOS ORDENAR LOS DATOS


Para que los datos sean tiles, necesitamos organizar las
observaciones de modo que podamos distinguir patrones y llegar a
conclusiones lgicas.

2
En primera instancia es necesario aplicar tcnicas para tabular y graficar
para organizacin de datos y posteriormente mostraremos como usar
nmeros para describir datos.

RECOLECCION DE DATOS
Hay que seleccionar las observaciones de manera que todos los grupos
relevantes estn representados en los datos. Si se hace un estudio de
mercado, debe estar seguro de que el grupo seleccionado incluya las
personas que representan las distintas variables como nivel de
ingresos, raza, nivel educativo, vecindario, etc.

DAR EJEMPLOS

Los datos pueden provenir de observaciones reales o de registros


elaborados con otros propsitos. DAR EJEMPLOS.

Los datos pueden ayudar al responsable de la toma de decisiones,


sobre las posibles causas y los probables efectos que producir su
decisin.

Cuando los datos se ordenan de manera compacta y til, los


responsables de tomar decisiones pueden obtener informacin
confiable y le faciliten la toma de daciones inteligentes.

Se debe tener mucho cuidado de que los datos empleados estn


basados en suposiciones e interpretaciones correctas. Para poder
determinar la confiabilidad los autores sugieren que se haga uno las
siguientes preguntas:
1. De dnde vienen los datos? La fuente es tendenciosa? Es
posible que exista inters en proporcionar datos que conduzcan a
ciertas conclusiones ms que otra?
2. Los datos apoyan o contradicen otras evidencias que se tienen?
3. Hace falta algunas evidencias cuya ausencia podra ocasionar
que se llegue a una conclusin diferente?
4. Cuntas observaciones se tienen? Representan a todos los
grupos que se desea estudiar?
5. La conclusin es lgica? Se ha llegado a conclusiones que los
datos no confirman?

3
Al final debemos determinar si los datos vale la pena usarlos o debemos
esperar y recabar mas informacin antes de actuar. Un ejemplo clsico
es enfocar la publicidad a segmentos de mercado que no corresponden.
DAR EJEMPLOS

DIFERENCIA ENTRE MUESTRAS Y POBLACIONES


Cuando se hace un estudio, se pueden recoger datos de una muestra y
utilizar la informacin para hacer inferencias sobre la poblacin que
representa esa muestra. En trminos generales la poblacin es
representada por el todo y una muestra es una fraccin significativa del
todo.

Estudiar las muestras es significativamente importante para describir la


poblacin EJEMPLOS.

Se debe considerar que el estudio de una muestra es ms sencillo que


el de una poblacin completa, en funcin de costo y tiempo. DAR
EJEMPLOS

Una poblacin es el conjunto de todos los elementos que estamos


estudiando, de la cual tratamos de sacar conclusiones. Debe estar claro
que elementos pertenecen o no a esta poblacin. Ejemplo: El estudio
se hace a mujeres, pero son todas o de terminado sector, ingresos,
casadas, etc.

Una muestra es una coleccin de algunos elementos de la poblacin,


no de toda. Pero esa muestra debe ser representativa de esa poblacin.
Una muestra representativa es buena en la medida que represente
relevantemente en las proporciones de la poblacin.

BUSQUEDA DE UN PATRON SIGNIFICATIVO EN LOS DATOS


Los datos se pueden organizar de diferentes maneras. Se pueden
simplemente recolectarlos y mantenerlos en orden. Si son numricos
podemos ordenarlos de mayor a menor o viceversa. Pero si nos
referimos a colores, sexo, etc. Tenemos que organizarlos de manera
diferente, tal vez alfabticamente.

La finalidad de organizarlos es poder determinar algunas caractersticas


de los datos recolectados, como, patrones evidentes, frecuencia en que
se repiten, etc.

4
Cuando ms informacin podamos obtener de la muestra, mejor
podremos entender la poblacin de la cual proviene, y mejor ser
nuestra toma de decisiones.

EJEMPLO DE DATOS SIN PROCESAR


La informacin obtenida, antes de organizarla y analizarse, se denomina
Datos sin Procesa, en vista que son no han sido manejados mediante
un mtodo estadstico.

ORDENAMIENTO DE DATOS EN ARREGLOS DE DATOS Y


DISTRIBUCION DE FRECUENCIAS

Supongamos que obtenemos los precios de la libra de azcar en el


mercado. La muestra que se obtuvo es la siguiente:
16.20 15.80 15.80 15.80 16.30 15.60
15.70 16.00 16.20 16.10 16.80 16.00
16.40 15.20 15.90 15.90 15.90 16.80
15.40 15.70 15.90 16.00 16.30 16.00
16.40 16.60 15.60 15.60 16.90 16.30

Observe que los datos recolectados son datos sin arreglar, y no


podemos sacar ninguna conclicion al respecto sobre los precios.

Si ordenamos los datos de una forma sencilla, ordenndolos de forma


ascendente podremos obtener algunas ventajas.

Procedemos a ordenarlos as:

15.20 15.70 15.90 16.00 16.20 16.40


15.40 15.70 15.90 16.00 16.30 16.60
15.60 15.80 15.90 16.00 16.30 16.80
15.60 15.80 15.90 16.10 16.30 16.80
15.60 15.80 16.00 16.20 16.40 16.90
Las conclusiones que podemos sacar son:
1. Podemos idntica fcilmente cual es el menor precio y cul es el
mayor. En este caso podemos decir que el menor precio es L
15.20 y el mayor precio es L. 16.90
2. Es fcil dividir los datos en secciones. La mitad de precios
inferiores de datos los precios estn entre L 15.20 y L 16.00. De
5
igual manera podemos dividirlos en tercios y los precios inferiores
estn entre L 15.20 y L 15.80 y as sucesivamente.
3. Podemos ver si algunos valores aparecen ms de una vez en el
arreglo. Se puede observar que 9 precios se repite ms de una
vez y cuales se repiten con mayor frecuencia.
4. Podemos observar la diferencia de precios en los datos sucesivos.
Por ejemplo entre el precio mayor y el menor. 16.90 15.20 =
1.70. Los precios fluctan en L 1.70 en el mercado.

En este caso estamos recolectando apenas 30 datos. Si la cantidad de


datos es bastante grande es sumamente incomodo analizarlos. Se
requiere resumir los datos sin que pierda su utilidad para la
interpretacin y la toma de decisiones. Cmo hacerlo?

LA DISTRIBUCION DE FRECUENCIAS
Una manera de compactar datos es mediante una Tabla de Frecuencias
o distribucin de frecuencias.

Estas son las existencias promedios de 20 tiendas de autoservicio en


millones de lempiras. Los datos estn ordenados de menor a mayor.
2.0 3.8 4.1 4.7 5.5
3.4 4.0 4.2 4.8 5.5
3.4 4.1 4.3 4.9 5.5
3.8 4.1 4.7 4.9 5.5

Para construir la tabla de frecuencias se debe seguir los siguientes


pasos:

1. Supongamos que construiremos 6 clases, donde el valor mayor y


el menor este comprendido.
2. Cada clase est comprendida entre un nmero mayor y menor. A
este se le conoce como intervalo de clase)
3. Luego determinamos con qu frecuencia los datos estn
comprendidos en cada clase.
El resultado es el siguiente cuadro:

6
Clase (grupo de valores parecidos Frecuencia (Numero de
de datos puntuales. observaciones que hay en cada
clase)
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4
Que informacin podemos obtener se esta tabla:
1. Perdimos algo de informacin al construir la tabla de frecuencias.
No podemos saber cmo se repite puntualmente el 5.5.
2. Podemos observar que 8 tiendas tiene un promedio de existencias
entre 3.8 y 4.3.
3. No es usual encontrar existencias entre 2.6 y 3.1.
4. Las existencias entre 2.0 y 3.7 son las que no prevalecen.
5. Podremos construir diferentes tablas con cantidades de clases
diferentes.

DEFINICION DE DISTRIBUCION DE FRECUENCIAS RELATIVAS


En el ejercicio anterior aprendimos a construir una tabla de frecuencias.
Partiendo de ella podemos construir una tabla de frecuencias relativas
(fraccin o porcentaje)
Consideremos los siguientes pasos:
1. La suma de las frecuencias son igual a 1 o 100%
2. Se procede a dividir cada frecuencia entre el total de frecuencias.
Se obtiene la fraccin
3. Cada fraccin se multiplica x 100 y se obtiene el %.
4. Se obtiene el siguiente cuadro.

Clase Frecuencia(f) Fraccin % relativo


2.0 a 2.5 1 0.05 5
2.6 a 3.1 0 0.00 0.00
3.2 a 3.7 2 0.10 10
3.8 a 4.3 8 0.40 40
4.4 a 4.9 5 0.25 25
5.0 a 5.5 4 0.20 20
Totales 20 1.00 100

7
Podemos observar que las tiendas que tienen existencias entre 3.8 y
4.3 representan el 40% y as podemos hacer muchos anlisis.

Observaciones:
1. El nmero de clases uno lo determina, y para calcular el intervalo
se usa la siguiente frmula:
5.52.0
Intervalo de clase = = = 0.50 en el
+1 6+1
caso anterior

2. No hay traslape de nmeros entre las clases. En la distribucin de


frecuencias no es posible. La primera clase termina en 2.5 y la
siguiente comienza en 2.6
3. Si los datos son en base a 1 decimal las clases tendrn que ser
de 1 decimal.
4. Si los datos son enteros las clases debern ser enteros
generalmente.
5. Lo que determina los decimales es la aplicacin de la formula
anterior.

REPRESENTACION GRAFICA DE DISTRIBUCION DE


FRECUENCIAS
La distribucin de frecuencias puede graficarse en un diagrama de dos
dimensiones. El eje horizontal podemos mostrar los valores de la
variable (la caracterstica que estamos midiendo) y en el je vertical
colocaremos la frecuencia que tiene cada variable.

La tcnica que se utiliza es el Histograma

HISTOGRAMA
Son una serie de rectngulos, cuyo ancho es proporcional al rango de
los valores que se encuentran dentro de una clase y la altura es
proporcional al nmero de elementos que caen dentro de la clase. Si las
clases son iguales en su ancho, todas las barras tendrn el mismo
ancho.

Puede construirse un Histograma con las frecuencias relativas y la


figura ser igual, y solo cambiara el eje vertical que se expresara en
trminos de %. Se conoce como Histograma de Frecuencias Relativas.

8
Clase Frecuencia
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4

1.2

0.8

0.6

0.4

0.2

POLIGONOS DE FRECUENCIAS
Se Utiliza menos, pero es otra forma de presentar grficamente tanto
de frecuencias como frecuencias relativas. Son lo mismo que el
Histograma. Lo nico es que se traza una lnea usando como referencia
el punto medio de cada clase as:

Punto Medio Frecuencia


1.75 0
2.25 1
2.85 0
3.45 2
4.05 8

9
4.65 5
5.25 4
5.8 0

Frecuencia
9
8
7
6
5
4 Frecuencia
3
2
1
0
1 2 3 4 5 6 7 8

Observe que se introdujeron una clase antes y otra despus, con


un valor de cero para que la lnea toque el eje x en ambos lados.
Los puntos medios son la suma del nmero mayor y nmero
menor dividido entre 2. Ejemplo: 2 + 2.5 = 4.5/2 = 2.25

Ventajas del Uso del Polgono


1. Es ms sencillo que su histograma correspondiente.
2. Bosqueja con ms claridad un perfil del patrn de los datos.
3. El polgono se vuelve cada vez ms suave y parecido a una
curva conforme aumenta el nmero de clases y el nmero
de observaciones.

OJIVA
Una distribucin de frecuencias acumuladas nos permite ver
cuntas observaciones estn por encima de ciertos valore, en

10
lugar de hacer un mero registro del nmero de elementos que
hay dentro de los intervalos.
El procedimiento es construir una tabla de frecuencias menores
que y se muestra en la siguiente tabla:

Clase Frecuencia Acumulada


Menos que 2.5 0
Menos que 3.1 1
Menos de 3.7 1
Menos de 4.3 3
Menos de 4.9 11
Menos de 5.5 16
Menos de 6.00 20

Con esta tabla de distribucin de frecuencias acumulada se puede


hacer la grafica as:

Menor de 2.5 0
Menor de 3.1 1
Menor de 3.7 1
Menor de 4.3 3
Menor de 4.9 11
Menor de 5.5 16
Menor de 6.0 20

25

20

15

10 Series1

0
Menor Menor Menor Menor Menor Menor Menor
de 2.5 de 3.1 de 3.7 de 4.3 de 4.9 de 5.5 de 6.0

11
Observe que a partir de un inventario de 4.3 son ms las tiendas que
tienen un inventario mayor.

MEDIDAS DE TENDENCIA CENTRAL


En parte anterior aprendimos como se recolectan datos sin procesar y
como estos se ordenan en una forma lgica que nos permita ilustrar
tendencias o patrones de los datos, pero eso no basta es necesario
contar con medias ms exactas. En estos casos podemos usar los
nmeros que constituyen la estadstica sumaria para describir las
caractersticas del conjunto de datos.

Dos de estas caractersticas son de particular importancia para los


responsables de tomar decisiones: La tendencia Central y la dispersin.

Tendencia Central. Se refiere a un punto medio de una distribucin. Se


les conoce como medidas de posicin.

La curva de distribucin puede tomar diferentes formas, y a cada una


de las curvas le corresponder un punto igual si est distribuida
normalmente, caso contrario el punto medio cambiara si la distribucin
tiene inclinacin para uno de los dos lados.

Observemos la siguiente grafica:

Distribucion C
Distribucion A
Eje X

Eje X

Distribucion B

12
Observe que la distribucin A es no es igual a la Distribucin pero estn
perfectamente distribuidas, por lo tanto les corresponde igual punto
medio. Sin embargo la distribucin C el punto medio esta sesgado hacia
la derecha.

Dispersin. La dispersin se refiere a la separacin de los datos que


proporcionan informacin til: El sesgo y la curtosis.

El estudio de esto es no est incluida en el programa de estudio, es


necesario tener un conocimiento general de estos:

Sesgo. Los datos puntuales de un conjunto de datos pueden ser


simtricos o sesgados. La simtrica es cuando la lnea vertical divide la
distribucin en dos partes iguales. Cada parte es igual a la otra.
Esto se puede observar en las distribuciones A y B.

Sin embargo la grfica C son curvas sesgadas en vista que esta


inclinada hacia la derecha (positiva). Puede ser que si analizamos estas
curvas como inventario, a medida que avanza el tiempo se est
consumiendo el inventario. Ejemplo de grafica de 12 meses de un ao.

Curtosis. Cuando medimos la curtosis de una distribucin, estamos


midiendo que tan puntiaguda es. Si observamos las grafica A y B
podemos observar que la grfica A es ms puntiaguda, no obstante que
su media es igual.

UNA MEDIDA DE TENDENCIA CENTRAL: La Media Aritmtica.


Casi siempre cuando nos referimos a un promedio estamos hablando
de la Media Aritmtica. Ejemplo: el promedio de ingresos de una
persona en un ao, la temperatura promedio en el ao de una ciudad,
las notas promedio de la clase, etc.

Si observamos las ventas de una empresa durante el ao 2008 estas


fueron:
MILLONES
Mes En Fe Ma Ab Ma Ju Ju Ag Se Oc No Di
e b r r y n l t p t v c
Valo 7 23 4 8 2 12 6 13 9 4 16 22
r

13
Podemos calcular la media de las ventas considerando que son datos
no agrupados o sea datos simples.

La frmula para el clculo considerando que son datos que


corresponden a la poblacin (datos totales) es:

7+23+4+8+2+12+6+13+9+4+16+22
= = = 10.5
12

Observe lo siguiente:
= smbolo de la media de una poblacin.
x = suma de los valores de todas las observaciones o datos
N = nmero de elementos de la poblacin. Por eso N es mayscula

Para el clculo de la media de una muestra, el procedimiento es el


mismo, solo que la simbologa cambia. Observe que n es minscula.

CALCULO DE LA MEDIA A PARTIR DE DATOS AGRUPADOS


Una distribucin de frecuencias consta de datos agrupados en clases.
Como cada observacin cae dentro de una de las clases, no conocemos
el individual de cada observacin y es necesario calcular el valor medio
de los datos, el procedimiento es el siguiente:
1. Se encuentra el punto medio de cada clase.
2. Se multiplica ese punto medio por la frecuencia de cada clase.
3. Se suman todos los resultados anteriores.
4. La suma de estos valores se divide entre el total de las
observaciones o datos.
La frmula es la siguiente:
( )
=

El siguiente ejemplo es los saldos de cuentas de ahorro, de una muestra
de 600 clientes:

Se elabora el cuadro siguiente:


Clase( L) Punto Frecuencia (f) F*x
Medio X
0 49.99 25.00 x 78 = 1,950

14
50.00 99.99 75.00 x 123 = 9,225
100.00 149.99 125.00 x 187 = 23.375
150.00 199.99 175.00 x 82 = 14,350
200.00 249.99 225.00 x 51 = 11,475
250.00 299.99 275.00 x 47 = 12,925
300.00 349.00 325.00 x 13 = 4,225
350.00 399.99 375.00 x 9 = 3,375
400.00 449.99 425.00 x 6 = 2,550
450.00 499.99 475.00 x 4 = 1,900
TOTALES 600 85,350
Ff (f * x)
85,350
= = L 142.25 es la media de la muestra.
600

CODIFICACION
En los casos de no tener disponible una computadora y sea necesario
realizar las operaciones a mano, se puede simplificar el clculo de la
media aritmtica de datos agrupados, con la tcnica de Codificacin.
Podemos eliminar el problema de tener puntos medios muy grandes o
inconvenientes. La tcnica consiste en asignar enteros consecutivos de
valores pequeos, llamados cdigos, a cada uno de los puntos medios.
El entero 0 se le puede asignar a cualquier punto medio, o sea a la mitad
de la distribucin o el ms cercano al punto medio.

Ejemplo:
Clase Cdigo
1-5 -4
6-10 -3
11-15 -2
16-20 -1
21-25 0
26-30 1
31-35 2
36-40 3
41-45 4

15
La ubicacin del punto medio, cuando las clases son impares es mas
fcil.

Los estadsticos usan X0, para representar el punto medio al que se le


asigna el valor =, y al punto medio codificado.

Formula:
()
= X0 + w

Donde:
= media de la muestra
X0 = valor del punto medio al que se le asigno el cdigo 0
W = Ancho numrico del intervalo de clase
= cdigo asignado a cada punto medio de la clase
f = frecuencia o numero de observaciones de cada clase
n = nmero total de observaciones de la muestra

Ejemplo de cuando las clases son un numero par (6)


Este caso es de un grupo de alumnos y sus edades.
Punto
Medio Cdigo Frecuencia
Clase (X) (u) (f) U*f
0-7 3.5 -2 x 2 = -4
8-15 11.5 -1 x 6 = -6
16-23 19.5 0 x 3 = 0
=X0
24-31 27.5 1 x 5 = 5
32-39 35.5 2 x 2 = 4
40-47 43.5 3 x 2 = 6

16
total 20 5
f =n (u * f)
Desarrollo formula:
5
= 19.5 + 8( ) = 21.5 Si nos referimos a edades esta seria la edad
20
promedio de un grupo x.

VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMETICA


Ventajas:
1. Es un concepto muy familiar entre las personas.
2. Cada conjunto de datos tiene una media y es nica.
3. Es til para llevar a cabo procedimientos estadsticos que
permiten comparar varios conjuntos de datos.
Desventajas:
1. Si bien es cierto que toma todos los valores del conjunto, los datos
extremos tienden a distorsionarla.
2. En los casos que suceda de contar datos extremos, lo mejor es
eliminarlos.
3. Cuando la cantidad de datos es numeroso, es mejor usar datos
agrupados, que la convierte en una media aproximada.
4. Es imposible calcular la media cuando se tiene clases extremas
abiertas. Ejemplo menores de 10 o mayores de 50

MEDIA PONDERADA
Al calcular la Media Aritmtica se asume que los datos del conjunto son
iguales en importancia. En algunos casos es evidente que algunas
observaciones son ms importantes que otras. Ejemplo clsico son el
ndice acadmico de los alumnos, unas clases tienen un valor de 5
unidades valorativas y otras 4 unidades. Otro ejemplo son los exmenes
parciales que no tienen el mismo peso. Esto es lo que considera la
media ponderada, asignarle a cada observacin su valor relativo.

Ejemplo:
Las notas de cada parcial estn valuadas en 25, 35 y 40%
respectivamente.

El alumno obtuvo las siguientes notas: 60%, 80% y 70%

Para obtener la nota final, se usa la media ponderada as:

17
Formula:

w =

Donde:
= es la media ponderada.

X = es la observacin individual.
W = el peso o ponderacin asignada a cada observacin.

Calculo con la tabla siguiente:

Nota (X) Peso (w) xw


60 .25 15
80 .35 28
70 .40 28
Totales 1.00 71
La nota final del alumno es 71%. Esta es una nota bajo el mtodo de
media ponderada.

MEDIA GEOMETRICA
Muestra los cambios porcentuales de una serie de nmeros positivos.
Tiene aplicacin en los negocios y la economa, debido a que con
frecuencia se est interesado en establecer el cambio porcentual en las
ventas, en el producto nacional bruto o en cualquier serie econmica.

La Media Geomtrica proporciona una medida precisa de un cambio


porcentual promedio en una serie de nmeros.

Un gerente desea establecer la tasa de crecimiento promedio de sus


ventas en base a los datos histricos que tiene. Considere que la tasa
de crecimiento del sector econmico es de 10%. En la siguiente tabla
estn los datos Histricos y como se calcula la tasa geomtrica:

Porcentaje sobre ao
AO VENTAS anterior
2004 50,000 -
2005 55,000 55/50 = 1.10
2006 66,000 66/55 = 1.20
2007 60,000 60/66 = 0.91
18
2008 78,000 78/60 = 1.30

Observe que los porcentajes son calculados dividiendo el ao que


estamos calculado, entre el ao inmediato anterior.
4
(1.10)(1.20)(0.91)(1.3) = 11.79
% :

MG = 1.1179 o sea 11.79% promedio anual

Si hacemos el clculo con la media aritmtica nos da:


1.10+1.20+0.91+1.3
= = 1.1275
4

Observe que en ambos casos se divide entre 4 porque el primer ao


solo sirve de base para calcular los siguientes aos.

Si usamos a media aritmtica para comprobar cul de los dos ndices


es ms exacto, calculamos:

50,000 X 1.1275 = L 56,375


56,375 X 1.1275 = 63,563
63,563 X 1.1275 = 71,667
71,667 X 1.1275 = 80,805
Si comparamos el ltimo resultado con el resultado real que fue de L
78,000, la diferencia es de L 80,805 78,000 = 2,805

Ahora usemos la media geomtrica


50,000 X 1.1179 = 55,895
55,895 X 1.1179 = 62,485
62,485 X 1.1179 = 69852
62,852 X 1.1179 = 78,088
Si lo comparamos con el resultado real tendremos 78,088 78,000 =
88.
Esto muestra que la media geomtrica es ms til en estos casos,
porque pondera los cambios en el tiempo. En el caso que la tasa de
crecimiento sea igual, se pude aplicar cualquiera de los mtodos.

Lo importante es que puedo seguir proyectando en los aos


subsiguientes:

19
Ejemplo:
Proyectar los aos 2009 y 2010 as:
2009 78,088 X 1.1179 = L 87,295
2010 87,295 X 1.1179 = 97,587

LA MEDIANA
Es diferente a las anteriores. La mediana es solo el valor del conjunto
de datos que mide la observacin central del conjunto. Es la
observacin que est ms centrada. La mitad estn por arriba de ella y
la otra mitad de datos estn por debajo ella.

Es en esencia la observacin de la mitad despus que se han colocado


los datos en una serie ordenada.

CALCULO DE LA MEDIANA A PARTIR DE DATOS NO AGRUPADOS


+1
Mediana = ( )
2
Donde n = nmero
de elementos del arreglo

Ejemplo:
Los costos en millones de varios aos se muestran abajo:
45,52,56,67,67

La posicin del valor de la medina es:


5+1
Posicin de la Mediana = = 3 o sea la tercera posicin es el valor de
2
L 56. Esa es la media de los costos de esos aos. Mediana = 56

Observe que la cantidad de datos es un nmero impar.

En el caso que los datos sean un nmero par los dos datos centrales se
suman y se dividen entre 2

Ejemplo:
35,45,52,56,67,67: La posicin de la Mediana es:

20
6+1
Posicin de la Mediana = = 3.5
2

El valor de la mediana ser la suma de los valores 3 y 4 dividido entre


2.
52+56
Mediana = = 54
2

MEDIANA PARA DATOS AGRUPADOS


Para calcular la media de datos agrupados, se supone que las
observaciones en cada clase son iguales al punto medio de la clase.
Esto porque se hace el supuesto de que si bien algunos datos estarn
por arriba del punto medio, otros estarn por debajo de ese punto.
Basado en esto debe considerarse los puntos medios de cada clase y
sus respectivas frecuencias.

Formula:


2
Mediana = Lmd + ( )

Donde:
Lmd = el lmite inferior de la clase de la mediana.
F = es la frecuencia acumulada de la clase que antecede a la clase de
la mediana.
F = la frecuencia de la clase mediana.
C = intervalo de la clase mediana.

La siguiente tabla muestra los jubilados por edades:

Edad (clase) f Frecuencia Acumulada


50-59 3 3
60-69 7 10
70-79 18 28
80-89 12 40
90-99 8 48
100-109 2 50

1. Acumular las frecuencias tal como se muestra en el cuadro


anterior.

21
2. Encontrar la clase mediana cuya frecuencia acumulada es mayor
o igual a n/2
3. Aplicar la formula.
Clase modal = n/2 = 50/2 = 25. La mayor frecuencia acumulada que
comprende a 25 es 28, por lo tanto la clase modal ser 70-79
50
10
2
Mediana= 70 + ( )10 = 78.33
18

Se puede concluir que la mitad de los jubilados sern menores de 78


aos y al revs la otra mitad tendr una edad mayor a 78 aos.

Ventajas y Desventajas de la Mediana.


Ventajas
1. Los datos extremos no la afectan tanto como la media.
2. Es fcil de entender y se puede calcular a partir de cualquier tipo
de datos, incluso a partir de datos agrupados con clases extremas
abiertas, a menos que este entre una clase de extremos abierto.
3. Podemos encontrarla la mediana incluso cuando nuestros datos
sean descripciones cualitativos como color, nitidez, en lugar de
nmero.
Desventajas
1. Ciertos procedimientos estadsticos son ms complejos que los
que utiliza la media aritmtica.
2. Debido a su posicin media, debe ordenarse los datos, para hacer
el clculo.
3. Si lo utilizamos como parmetro de la poblacin, la media es ms
fcil de usar.

LA MODA
Es diferente a la media, pero parecida a la medina. Es el valor que ms
se repite en el conjunto de datos.

Es importante organizar los datos, y es usual que algunos datos no se


repitan para ser el valor ms frecuente y es por eso que raramente se
usa.

Ejemplo:
Despus de organizar los datos estos se muestran como ejemplo de
viajes que hacen un grupo de personas:

22
1,1,2,2,4,4,5,5,6,6,7,7,8,12,15,15,15,19

La Moda para datos no agrupados es este caso es 15 porque se repite


3 veces.

En los casos que varios datos se repitan al igual, en este caso se dice
que la distribucin de datos tiene 2 modas. Se dice que es Bimodal. En
los casos que sean ms de dos, se dice que es Multimodal.

CALCULO DE LA MODA EN DATOS AGRUPADOS


Cuando los datos estn agrupados, se supone que la Moda est en la
clase que contiene el mayor nmero de elementos (frecuencia). Para
determinar en un solo valor para la Moda a partir de esa clase modal, la
frmula es:
1
Mo = Lmo + ( )w
1+2

Donde:
Lmo = Lmite inferior de la clase modal.
d1 = Frecuencia de la clase que se encuentra inmediatamente menor
que ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase
inmediatamente mayor que ella.
W = Ancho del intervalo de la clase modal.

Ejemplo:
No.
Entregas 0-3 4-7 8-11 12 o mas
Frecuencia 6 8 1 5
Clase Modal
Si deseamos saber no solo la clase modal que es 4-7 entregas,
deseamos conocer La Moda, aplicamos la formula as:
86 2
Mo = 4 + ((86)+1 =4 + 0.6667 o =4.667 entregas
3

VENTAS Y DESVENTAJAS DE LA MODA


Ventajas
1. Es igual a la medina, se puede utilizar como una posicin central
para los datos cualitativos como cuantitativos.
23
2. Los valores extremos no la afectan.
3. No importa el tamao de los datos y la dispersin de los mismos.
4. Se pueden usar no importa si alguno o ambos extremos estn
abiertos.
Desventajas
1. No se utiliza tan a menudo como la medina y la moda.
2. Muchas veces no existe una clase modal.
3. Es intil en la mayora de casos.
4. Cuanto tiene ms de una moda es difcil interpretarlos y
comprenderlo.

COMPARACION DE LA MEDIA, MEDIANA Y MODA


Cuando se trabaja con problemas estadsticos, debemos decidir qu
medida usar. Las distribuciones simtricas que solo contienen una sola
moda, siempre tienen el mismo valor para todas. Cualquiera.

En una distribucin con sesgo positivo (la derecha), la moda se


encuentra en el punto ms alto de la distribucin, la mediana est a la
derecha de la moda y la media se encuentra todava ms a la derecha
de la moda y mediana.

En una distribucin con sesgo negativo (izquierda), la mediana sigue


siendo el punto ms alto y est siempre entre la moda y la media.

En trminos generales no existe una regla para aplicar cualquier medida


de tendencia central

DISPERSION: PORQUE ES IMPORTANTE


Nos hemos referido anteriormente a la dispersin. Cuando aplicamos
una medida de tendencia central, solo tenemos una parte de las
caracterizas de los datos. Para aumentar nuestro entendimiento del
patrn de los datos, debemos medir su dispersin, separacin o
variabilidad.

Es importante medir la dispersin porque:


1. Proporciona informacin adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos
estn muy dispersos, la posicin central es menos representativa
de los datos, como un todo, que cuando estos se agrupan ms
cerca alrededor del a media.

24
2. Ya que existen problemas caractersticos para datos muy
dispersos, se debe ser capaz de reconocer esa dispersin amplia
para poder abordar el problema.
3. Quiz se desee comparar las dispersiones de diferentes
muestras.

Un analista financiero se preocupa cuando las utilidades se dispersan,


es decir a veces demasiado altas y otras demasiado bajas.

RANGOS: MEDIDAS DE DISPERSION UTILES.


La dispersin se puede medir en trmino de dos valore seleccionados
del conjunto de datos. Para efecto de clases se estudiaran las medidas
llamadas de distancia: el rango, el rango interfractil y el rango
intercuartil.

RANGO
Es la diferencia entre el valor ms alto y ms pequeo de los valores
observados.

Rango = Valor de la observacin mas grade valor de la observacin mas pequea


Ejemplo:

Las ventas ms altas de una empresa fue L 5,700,000 y la ms baja es


de L 3,400,00, entonces:

Rango = 5,700,000 3,400,000 = L 2,300,000

Es fcil de calcular y entender, pero su utilidad es muy limitad. Porque


ignora la naturaleza de la variacin y tiene una influencia los datos
extremos. En lo sucesivo puede registrar variaciones diferentes y si se
trata de distribuciones con extremos abiertos no es posible su clculo.

RANGO INTERFRACTIL
Es una distribucin de frecuencias, una fraccin o proporcin dada de
los datos cae en un fractil o debajo de este. La media por ejemplo, es el
fractil 0.5, porque la mitad del conjunto de datos es menor o igual a ese
valor. Ejemplo el 25% de los datos estar en el fractil 0.25.

Ejemplo:
Estos son los pagos al seguro social por mes:

25
Primer Tercio Segundo Tercio Ultimo Tercio
863 1,138 1,698
903 1,204 1,745
957 1,354 1,802
1,041 1/3 fractil 1,624 2/3 fractil 1,883 ultimo fractil

Al dividir la tabla anterior en tres fractiles, es porque deseamos conocer


el rango entre estos:

Podemos concluir que el 33.33% de los elementos estn en 1,041 o


debajo de este valor, el 66.66% restante estn arriba de 1,041. As
podemos hacer cualquier anlisis.

RANGO INTERCUARTIL
El rango Intercuartil mide aproximadamente que tan lejos de la medina
debemos ir en cualquiera de las dos direcciones antes de recorrer una
mitad de los valore del conjunto de datos.
1. Dividimos nuestros datos en cuatro parte (25% de los datos en
cada bloque)
2. Los valores ms altos de cada una de las cuatro partes.
3. El rango intercuartil es la diferencia entre los valores del primero
y el tercer cuartil.

Rango intercuartil = Q3 Q1

Ejemplo:
Los datos son los siguientes:
59 65 6768 71 72 75 79 81 83 85 87 88 91 92 93 94 95 100 100
Son 20 los datos y si los dividimos en cuatro partes, a cada cuartil ser
de 5 datos:
Esto quiere decir que los datos de cada cuartil sern:
1er Cuartil = 59,65,67,68,71
2do Cuartil = 72,75,79,81,83
3er Cuartil = 85,87,88,91,92
4to Cuartil = 93,94,95,100,100

Diferencia =Q3 Q1 = 92 71 = 21

El ejemplo es si dividimos los datos en cuartiles, pero uno puede dividir


los datos en cualquier forma.
26
Ejemplo si nos dicen sobre el dato 16, podemos decir que su valor es
93 y es un percentil 16/20 = 80

Supongamos que el rango = 20,300 = 16,700 millas


Rango intercuartil = Q3 Q1 = 12,700 8,100 = 4,600 millas

DISPERSION: MEDIDAS DE DESVIACION PROMEDIO


Es la dispersin que los datos estn con respecto a su medida de
tendencia central. Dos medidas son importantes: la varianza y la
desviacin estndar. Las dos proporcionan la distancia promedio de
cada observacin o dato del conjunto respecto a la media de
distribucin.

VARIANZA DE POBLACION
Cada poblacin tiene una varianza, su smbolo es 2 (sigma cuadrada)
1. Se calcula la media del conjunto.
2. Se resta la media y cada dato del conjunto.
3. Como algunos datos del inciso anterior resultan negativos, se
elevan al cuadrado estos para convertirlos en positivos.
4. La suma de todos estos valores son la varianza de la poblacin

Formula:

()2 2
2 = = - 2

Donde:
2 = varianza de la poblacin
X = elementos u observaciones.
= media de la poblacin.
N = nmero total de elementos de la poblacin
()2
= suma de todos los valores para calcular 2

Los resultados que se obtengan, estn expresados en las mismas


unidades de los datos. Ejemplo Lempiras al Cuadrado. Como se podr
comprender no es una medida fcil de comprender. Es necesario hacer
un cambio significativo a la varianza y para calcular una medida til de

27
la desviacin y que sea menos confusa. Esta medida se le conoce como
desviacin estndar y es la raz cuadrada de la varianza.
Esto nos dara como resultado las mismas unidades que los datos
originales.
Ejemplo:
El SANAA, realiza un anlisis del agua para encontrar impurezas en la
misma. Se extraen 15 muestras y los resultados fueron:
Desviacin
al Observaciones
Impurezas Media Desviacin Cuadrado al cuadrado
2 2
(x) u=2.49/15 (x-u) ( ) ( )
0.04 0.166 - -0.126 = 0.016 0.0016
0.06 0.166 - -0.106 = 0.011 0.0036
0.12 0.166 - -0.046 = 0.002 0.0144
0.14 0.166 - -0.026 = 0.001 0.0196
0.14 0.166 - 0.026 = 0.001 0.0196
0.15 0.166 - 0.016 = 0.000 0.0225
0.17 0.166 - 0.004 = 0.000 0.0289
0.17 0.166 - 0.004 = 0.000 0.0289
0.18 0.166 - 0.014 = 0.000 0.0324
0.19 0.166 - 0.024 = 0.001 0.0361
0.21 0.166 - 0.044 = 0.002 0.0441
0.21 0.166 - 0.044 = 0.002 0.0441
0.22 0.166 - 0.054 = 0.003 0.0484
0.24 0.166 - 0.074 = 0.005 0.0576
0.25 0.166 - 0.084 = 0.007 0.0625
2.49 0.051 0.4643
x ( )2
2

0.051
2 = = 0.0034
15
= 0.0034 = 0.058%

Si usamos la otra formula


0.4643
2 = = 0.0034
15
Independientemente de la formula el resultado es igual.

USO DE LA DESVIACION ESTANDAR


La desviacin estndar nos permite, con un buen grado de precisin,
donde esta localizados los valores de una distribucin de frecuencias
con relacin a la media. Usando el ejemplo anterior y basado en el
teorema del ruso P.L. Chebysheb, establece que independientemente
de la forma de la distribucin, al menos 75% de los valores caen dentro
28
de 2 desviaciones estndar a partir de la media de la distribucin, y al
menos 89% de los valores caen dentro de 3 desviaciones estndar a
partir de la media.

Podemos medir aun con ms precisin el % de observaciones que caen


dentro de un rango especfico de una curva simtrica con forma de
campana.
1. Aproximadamente el 68% de los valores de la poblacin cae
dentro de 1 desviacin estndar.
2. Aproximadamente 95% de los valores estar dentro de 2
desviaciones estndar a partir de la media.
3. Aproximadamente 99% de los valores estar dentro de 3
desviaciones estndar a partir de la media.

Si analizamos el problema los 15 muestras de agua, tiene una impureza


de 0.166 y una desviacin estndar de 0.058%
El teorema nos dice nos dice que al menos el 75% de los valores (15 x
75% = 11 muestras estn entre 0.166 2(0.058) = 0.050 y 0.166 +
2(0.058) = 0.282. De hecho, 93% de las observaciones (14 de 15
muestras) estn en el intervalo. Ntese que la distribucin que la
distribucin es razonablemente simtrica y el 93% es muy secano al
95% terico para un intervalo de 2 desviaciones estndar a partir de
la media de una curva en forma de campana.

La desviacin estndar es til para describir cuanto se apartan las


observaciones individuales de una distribucin de la media misma. Una
medida que se conoce como Resultado Estndar nos da el nmero de
desviaciones estndar que una observacin en particular ocupa por
debajo o por encima de la media. Si x simboliza la observacin,
entonces el resultado estndar calculado a partir de los datos de la
poblacin es:

Resultado estndar de la poblacin =

Donde:
x = observacin tomada de la poblacin
u = media de la poblacin
= desviacin estndar de la poblacin.

Supongamos una impureza de 0.108%

29
0.1080.166
Resultado estndar = = -1
0.058

Una impureza observada del 0.28% tendra un resultado estndar de


2
0.2820.166
Resultado estndar = =2

Para finalizar podemos decir que una impureza del 0.282% se desva
de la media en 2(0.058) = 0.116 unidades, que es igual a + 2, en
trminos de del numero de desviaciones estndar alejado de la media.

CALCULO DE LA VARIANZA Y LA DESVIACION ESTANDAR


UTILIZANDO DATOS AGRUPADOS.

La frmula es:

()2 2
2 = = - 2

= 2

Ejemplo:
Punt Frecuenci
Clase o af f*x Media x- u ( )2 f( 2 )
Medi
o
700-799 750 4 3,000 1,250 -500 250,000 1,000,000
800-899 850 7 5,950 1,250 -400 160,000 1,120,000
900-999 950 8 7,600 1,250 -300 90,000 720,000
1,000-1,099 1,050 10 10,500 1,250 -200 40,000 400,000
1,100-1,199 1,150 12 13,800 1,250 -100 10,000 120,000
1,200-1,299 1,250 17 21,250 1,250 0 0 0
1,300-1,399 1,350 13 17,550 1,250 100 10,000 130,000
1,400-1,499 1,450 10 14,500 1,250 200 40,000 400,000
1,500-1,599 1,550 9 13,950 1,250 300 90,000 810,000
1,600-1,699 1,650 7 11,550 1,250 400 160,000 1,120,000
1,700-1,1,799 1,750 2 3,500 1,250 500 250,000 500,000
1,800-1,899 1,850 1 1,850 1,250 600 360,000 360,000
100 125,000 6,680,000

125,000
2 = = 1,250 millones (media)
100

30
6,680,000
2 = = 66,800 millones (Varianza)
100

= 66,800 = 258.5 millones (Desviacin Estndar)

DESVIACION ESTANDAR DE UNA MUESTRA


Es lo mismo solo que se sustituye las letras donde se sustituye 2 a 2 ,
a u y n N

Formula:

( )2 2 2
2 = = - Varianza
1 1 1

S = 2 Desviacin estndar

Donde:
2 = Varianza de la muestra
s = Desviacin estndar de la muestra
x = valor de cada una de las n muestras
= media de la muestra
n-1 = Numero de observaciones de la muestra menos 1

Ejemplo:
Estos son los gastos en publicidad de una empresa
Gasto (x)
Media () x- 2
( ) 2
863 1,351 -488 238,144 744,769
903 1,351 -448 200,704 815,409
957 1,351 -394 155,236 915,849
1,041 1,351 -310 96,100 1,083,681
1,138 1,351 -213 45,369 1,295,044
1,204 1,351 -147 21,609 1,449,616
1,354 1,351 3 9 1,833,316
1,624 1,351 273 74,529 2,637,376
1,698 1,351 347 120,409 2,883,204
1,745 1,351 394 155,236 3,045,025
1,802 1,351 451 203,401 3,247,204
1,883 1,351 532 383,024 3,545,689

31
1,593,770 23,496,182
(
)2 2
1,593,770
2 = = 144,888 miles de lempiras Varianza
11

s = 144,888= 380.64 miles de lempiras Desviacin estndar

DISPERSION RELATIVA: EL COEFICIENTE DE VARIACION


La desviacin estndar es una medida absoluta de la dispersin que
expresa la variacin de las mismas unidades de los datos originales. Si
uno tiene los clculos de dos o ms conjuntos, estos no pueden ser
comparados.

Se requiere una medida relativa que nos proporcione una estimacin de


la magnitud de las desviaciones respecto a la magnitud de la media. La
unidad de medida es el % en vez de unidades de los datos originales.
La respuesta es el Coeficiente de variacin.

Formula:

Coeficiente de variacin de una poblacin = (100)

Ejemplo:
Un tcnico A realiza 40 reparaciones con una desviacin estndar de 5.
El tcnico B realiza 160 reparaciones con una desviacin estndar de
15. Cul de los dos tcnicos muestran menos variabilidad?
Ambos realizan actividades diferentes
Para el tcnico A
5
Coeficiente de variacin = (100) = 12.5% de variacin
40

Para el tcnico B
15
Coeficiente de variacin = (100) = 9.4 % de variacin
160

El tcnico a tiene una variacin absoluta menor, pero tiene una variacin
relativa menor.
32
ANALISIS EXPLORATORIO DE DATOS (AED)
Una de las tcnicas ms tiles del anlisis exploratorio, la grfica de
tallo y hoja, resuelve este problema de manera muy efectiva.
Proporciona el orden de calificaciones de los elementos del conjunto de
datos y la forma de distribucin.

Son las notas de alumnos:


79 78 78 67 76 87 85 73 66
99 84 72 66 57 94 84 72 63
51 48 50 61 71 82 93 100 89

Se construye la tabla de frecuencias:

40-49 1
50-59 3
60-69 5
70-79 8
80-89 6
90-99 3
Mayor 99 1

Para producir una grfica de tallos y hoja, se hace una lista vertical del
primer nmero de cada una de las clases.

4
5
6
7
8
9
10

Despus se dibuja una lnea vertical a la derecha de los tallos y se listan


las hojas (el siguiente digito para cada tallo) a la derecha de la lnea en
el orden en que aparecen el conjunto de datos originales.
4| 8
5| 710
6| 76631
7| 98863221
33
8| 754429
9| 943
10| 0

Por ltimo se ordenan todas las hojas en cada rengln en el orden de


clasificacin

4| 8
5| 017
6| 136
7| 12236889
8| 244579
9| 349
10| 0

Cada rengln de la grfica de tallos y hoja obtenida corresponde a un


tallo, y cada valor en ese tallo es una hoja. El rengln 9| 3 4 9, significa
que hay tres elementos en este conjunto de datos que comienzan con
9 (93,94 y 99). Si se gira este cuadro lo que muestra es un histograma.

ANALISIS CUANTITATIVO I
2DO PARCIAL
PROBABILIDAD
Fue aplicada en los juegos de azar, y posteriormente en el estudio de
problemas sociales y econmicos. Las compaas de seguros que
surgen en el siglo XIX, requera de un conocimiento preciso sobre los
riesgos de perdidas, con el fin de calcular las primas.

Medio siglo despus, muchos centros de aprendizaje estaban


estudiando la probabilidad como herramienta para el entendimiento de
los fenmenos sociales. En la actualidad, la teora matemtica de la
probabilidad es la base de las aplicaciones estadsticas, tanto en
investigaciones sociales como la teora de las decisiones.

34
Desde el momento que actuamos bajo incertidumbre, la toma de
decisiones requiere de la teora de probabilidades, sea no algo muy
complejo. Todos los das omos que existe un 70% de probabilidad que
llueva, que x equipo tiene ms probabilidades de ganar, que un
candidato tiene 60% de preferencias en las elecciones, etc.

No olvidemos que vivimos en un mundo incapaz de predecir el futuro


con total certidumbre. Es por eso que nos lleva a estudiar y utilizar la
teora de probabilidad. Aprendemos a organizar la informacin y
considerarla de manera sistemtica, seremos capases de reconocer
muestras suposiciones, comunicar nuestro razonamiento a otras
personas y tomar una decisin ms solida que la que tomaramos si solo
diramos palos a ciegas.

TERMINOLOGIA BASICA EN PROBABILIDAD


En general la teora de probabilidad, es que algo pase o no. La
probabilidad se expresa como fraccin (,,,) o como un decimal
(0.167, 0.500, 0.889) que estn entre 0 y 1. Tener una probabilidad de
cero significa que algo nunca va suceder, y 1 que siempre va a suceder.

UN EVENTO. Es una o ms posibilidades de hacer algo. La posibilidad


de lanzar una moneda, si cae cara es un evento, si cae cruz es otro
evento. Elegir un estudiante entre diez que externe una opinin, la
posibilidad de tener un accidente de trnsito, etc.

UN EXPERIMIENTO. La actividad que origina uno de dichos eventos,


se conoce como experimento. Es un experimento de lanzar una moneda
Cul es la probabilidad del evento cara? Y desde luego, si la moneda
no est cargada y tiene la misma probabilidad de caer en cualquiera de
los dos lados (sin probabilidad de caer parada), podemos responder,
que la probabilidad es 2 o 0.5. Al conjunto de todos los posibles
resultados de un experimento se le llama espacio muestral del
experimento. Es el de lanzar una moneda, el espacio muestra es:

S = {cara, cruz}

El experimento de sacar una carta, en un espacio muestral de 52 cartas,


o la probabilidad de tomar un avin a tiempo, las posibilidades de
conseguir un trabajo. La preocupacin es la posibilidad o probabilidad
de que ciertos eventos sucedan.
35
EVENTOS MUTUTUAMENTE EXCLUYENTES. Se dice que los
eventos son mutuamente excluyentes si uno de ellos puede tener lugar
a un tiempo. En la moneda solo hay dos resultados posibles, cara y cruz.
En cualquier lanzamiento obtendremos una cara o una cruz, nunca
ambos. Igual sucede si el nacimiento de un hijo, este puede ser hembra
o varn. Se deduce que en estos casos son eventos mutuamente
excluyentes. Lo fundamental es contestarse Pude ocurrir dos o ms
de tales eventos al mismo tiempo? Si la respuesta es afirmativa, los
eventos no son mutuamente excluyentes.

LISTA COLECTIVAMENTE EXHAUTIVA. Cuando una lista incluye


todos los eventos que pueden resultar de un experimento, se dice que
la lista es colectivamente exhaustiva. La lista de posibles candidatos a
la presidencia no es colectivamente exhaustiva si no se conoce si habr
candidaturas independientes, pero una vez conocidos todos los
candidatos es colectivamente exhaustiva.

TIPOS DE PROBABILIDADES.
Existen 3 maneras bsicas de clasificar las probabilidades, stas
representan planteamientos conceptuales bastante diferentes para el
estudio de la teora de probabilidad, los expertos no se ponen de
acuerdo sobre cul es el planteamiento ms apropiado. Empecemos
definiendo
1. El planteamiento clsico.(probabilidad)
2. El planteamiento de frecuencia relativa.
3. El planteamiento subjetivo.

PROBABILIDAD CLASICA
El planteamiento clsico define la probabilidad de que un evento ocurra
como:

Probabilidad de un evento =

Se debe destacar el hecho de que, con el fin de que la formula anterior


sea vlida, cada uno de los resultados debe ser igualmente posible.
Esta es una manera bastante complicada de definir algo que nos puede
parecer intuitivamente obvio, pero podemos utilizar la definicin para

36
escribir los ejemplos de lanzamiento de la moneda y de los dados de
una manera simblica. Primero plantearemos la pregunta Cul es la
probabilidad de obtener una cara en un solo lanzamiento? Como
1
P (cara) = = 0.5 = 50% donde 1 es el de obtener cara; el dos es todos
2
los posibles resultados.

Sabemos que un dado tiene 6 caras, numeradas de 1 a 6

P (1) = = 0.16666 = 16.67% donde 1 es la pobabilidad e obtener un uno


y 6 son los posibles resultados CS= {1,2,3,4,5,6}.

A la probabilidad clsica se le denomina probabilidad a priori, porque


podemos establecer los resultados posibles a priori, sin necesidad de
realizar un evento. En lugar de experimentos podemos llegar a
conclusiones, basados en el razonamiento lgico.

Limitaciones del planteamiento. Tiene serios problemas cuando


intentamos aplicarla a problemas de tomas de decisiones menos
predecibles, como en la administracin. Encontrar una comida x en un
viaje a un lugar inhspito. La clsica presupone un mundo con simetra.
Nuestro mundo es asimtrico, o sea llenos de problemas, desordenada,
etc.

FRECUENCIA RELATIVA DE PRESENTACION


Si nos hacemos preguntas ms complejas como Si salgo de la
universidad a las 9 pm, a qu hora llegare a mi casa? Las respuestas
pueden ser mltiples, dependiendo de lo que suceda en el camino. Es
difcil emitir una respuesta por adelantado, sin hacer algo de
experimentacin, sobre cules son las probabilidades.

En la actualidad, este planteamiento se le llama frecuencia relativa de


presentacin de un evento y define la probabilidad como:
1. La frecuencia relativa observada de un evento durante un gran
nmero de intentos o;
2. La fraccin de veces que un evento se presenta a la larga, cuando
las condiciones son estables.

37
Los eventos pasados se convierten en una probabilidad. Determinamos
que tan frecuentemente ha sucedido algo en el pasado y usamos una
cifra para predecir la probabilidad de que suceda de nuevo en el futuro.

HACER EJERCICIO

Si se lleva un registro cada vez que llego a la casa, encontrare que


existe una hora que se da con mayor frecuencia, dentro de la
inestabilidad que muestre una grfica se la realizo.

DAR UN EJEMPLO DE GRAFICA.

Una segunda caracterstica de las probabilidades por la frecuencia


relativa de presentacin de un evento se vuelve estable conforme la
cantidad de llegadas a mi casa son registradas, y el grado de precisin
se vuelva ms constante. Esta precisin no es definitiva, porque
tenemos que contar con el tiempo y costo que implica tener ms
observaciones.

Hacer una encesta de qu candidato ganara las prximas elecciones,


no le garantizan ganar, porque las personas pueden cambiar de opinin.

Para tener una probabilidad ms precisa se requiere de una evaluacin


con un nmero suficiente de resultados.

PROBABILIDAD SUBJETIVA
Est basada en las creencias de las personas que efectan la
estimacin de probabilidades. Se define como la probabilidad asignada
a cada evento por parte de un individuo, basado en las evidencias que
tenga disponible. Esta evidencia puede presentarse en forma de
frecuencias relativas de presentacin d eventos pasados o pude tratarse
de una creencia mediata. Ejemplo clsico es cuando salen las
candelillas, se dice que comienzan las lluvias. Es ampliamente flexible
que los otros conceptos analizados anteriormente. El tomador de
decisiones puede hacer uso de cualquier evidencia que tenga a mano y
mezclarla con los sentimientos personales sobre la situacin.

Se debe usar esta, cuando sucede una nica vez o el nmero de veces
es muy reducido.

38
REGLAS DE PROBABILIDAD
La mayora de los administradores que utilizan la probabilidad se
preocupan por dos condiciones:
1. El caso en que un evento u otro se presente.
2. La situacin en que dos o ms eventos se presenten al mismo
tiempo.

Ejemplos de la situacin 1.
Cul es la probabilidad que realizar mi boda el viernes y hay estado de
sitio a partir de las 9pm?
Cul es la probabilidad que se realice el examen el prximo domingo,
en las actuales condiciones?

Existen varias condiciones para que se de este evento.

Existen algunos mtodos para determinar las respuestas a estas


preguntas bajo una variedad de condiciones.

Algunos smbolos, definiciones y reglas de uso comn


Smbolos para una probabilidad marginal. En la teora de
probabilidades, utilizamos smbolos para simplificar la presentacin de
ideas.

P(A) = la probabilidad de que el evento A suceda

Una probabilidad sencilla quiere decir que solo un evento puede llevarse
a cabo. Se le conoce como Probabilidad Marginal o Incondicional.
En las elecciones del 29 de noviembre existen 6 candidatos. Cualquiera
puede calcular la probabilidad de que 1 candidato sea electo:
1
P (Ganar) = = 0.16666 = 16.67% al no conocerse la intencin de boto,
6
ni se tiene percepcin que suceder.

Se tiene la certeza porque los eventos son mutuamente excluyentes, es


decir solo un candidato puede ser electo.

39
El diagrama de Venn puede ilustrar esto:

Evento

Event Event Event Event


o o o o

A B A B
Dos eventos mutuamente Dos eventos no
Excluyentes Excluyentes
(a) (b)
Observe que el caso A, existen dos conjuntos que no tienen elementos
en comn, por lo tanto o es A o es B, por eso son mutuamente
excluyentes. Si observamos el caso b, los dos conjuntos se
interceptan, por lo tanto hay elementos de ambos conjuntos que son
comunes. Este caso es tratado en la siguiente regla.

REGLA DE LA ADICION PARA EVENTOS MUTUAMENTE


EXCLUYENTES.
Algunas veces estamos interesados en la probabilidad de una cosa u
otra suceda. Si estos dos eventos son mutuamente excluyentes,
podemos expresar que esta regla est usando la regla de adicin para
eventos mutuamente excluyentes y se expresa as:

P (A o B) = la probabilidad de que A o B suceda

Supongamos que ninguno de los candidatos alcanza los votos


necesarios para ganar, y la ley establece que se realizara una
segunda ronda con los dos candidatos ms botados. En este caso y
considerando al inicio del proceso de votacin, la probabilidad de que
1
1 candidato ser electo es de , pero cul es la probabilidad de que 2
6
pases a la segunda ronda seria:
1 1 2
P (A o B) = + = = 0.3333 = 33.33%
6 6 6

40
Si calculamos una vez ms la probabilidad de que sucedan dos o ms
eventos. El tamao de una familia de un pueblo es necesario conocer
la probabilidad que cada familia tenga 4, 5, 6 o ms miembros.

P (4, 5,6 o ms) = P (4) +P (5) + P (6 o ms)= 0.15+0.10+0.05) = 0.30

Observe algo interesante, como caso especial que, para cualquier


evento A, tenemos que ste suceda o no suceda. De modo que los
eventos A y no A son mutuamente excluyentes y exhaustivos.

Otra forma de calcular la probabilidad de algo suceda o no, podemos


hacerlo as:

Cul es la probabilidad que los restantes candidatos no sean


electos?
Sabemos que la suma de todas las probabilidades es igual a 1 o
100%, entonces:

P (2, 3, 4, 5, 6) = P(no 1) + P (A) = 1 esto es igual a decir P (no 1) = 1


P (1)
Por lo tanto:
1 5
P (no 1) = 1 - = = 0.83333 o 83.33%
6 6

REGLA DE ADICION PARA EVENTOS QUE NO SON


MUTUAMENTE EXCLUYENTES.
Si dos eventos no son mutuamente excluyentes, es posible que se
presenten al mismo tiempo. Este caso requiere modificar la regla de
adicin.

Supngase que el candidato electo pueda ser una mujer

Probabilidad de que A suceda Probabilidad que A y C sucedan


juntos

P (A o B) = P (A) + P (B) P (AB)

Probabilidad de que se presente A o B Probabilidad que suceda B


Cuando A y B no son mutuamente excluyentes

41
Un naipe tiene 52 cartas, distribuidos en 4 ajuares (corazn negro,
corazn rojo, trbol y diamante) es decir 13 cartas de cada ajuar.

Cul es la probabilidad que sea as y corazn?


4
La probabilidad que sea as
52
13
La probabilidad que sea corazn
52
1
La probabilidad que sea as y corazn
52

4 13 1 16 4
P (A o B) = + - = =
52 52 52 52 13

PROBABILIDADES BAJO CONDICIONES DE INDEPENDENCIA


ESTADISTICA
Cuando se presentan 2 eventos, el resultado del primero puede, o no
tener efecto en el resultado del segundo. Esto es, los eventos pueden
ser dependientes o independientes. Comenzaremos con los que son
estadsticamente independientes, es decir, aquellos en donde la
presentacin de uno no tiene efecto sobre la probabilidad de la
presentacin de cualquier otro. Existen tres tipos de probabilidades que
se presentan bajo la independencia estadstica.

1. Marginal.(probabilidad)
2. Conjunta.
3. Condicional.

PROBABILIDAD MARGINAL BAJO CONDICIONES DE


INDEPENDENCIA ESTADISTICA.
Una probabilidad marginal o incondicional, es la probabilidad simple de
presentacin de un evento. Al lazar una moneda no cargada las
probabilidades son .50 para cara y cruz respectivamente. No importa
cuntos lanzamientos se realicen, la probabilidad ser siendo igual, no
importa los resultados anteriores. Cada lanzamiento es nico y no hay
manera de conectarlo con ningn otro. Es por eso que es un evento
estadsticamente independiente de los resultados de cualquier otro
lanzamiento de moneda.

42
PROBABILIDAD CONJUNTA BAJO CONDICIONES DE
INDEPENDENCIA ESTADISTICA.
La probabilidad de que dos o ms eventos independientes se presenten
juntos o en sucesin es producto de sus probabilidades marginales.
Matemticamente se describe como:

P (AB) = P (A) x P (B)


Donde P (AB) = probabilidad de que los eventos A y B se presenten
juntos o en sucesin; se le conoce como probabilidad marginal.
P (A) = probabilidad marginal de que se presente el evento A
P (B) = probabilidad marginal de que se presente el evento B
La probabilidad de que en dos lanzamientos se tenga cara seria:
P (H1H2) = probabilidad de H1 x Probabilidad de H2 = 0.5 x 0.5 = 0.25
La probabilidad que en dos lanzamientos consecutivos obtenga A es
0.25, por ser estadsticamente independientes. As sucesivamente 3 o
ms lanzamientos se va multiplicando 0.50 x n veces.

Si una moneda estuviera cargada, donde al lanzar la moneda sea cara


su probabilidad es 0.80, entonces en 2 lanzamientos seria su
probabilidad sera:

P (H1H2) = (0.80 x 0.80) = 0.64 = 64%

Observe que los resultados no suman 1, porque no se toma en cuenta


los dos posibles resultados: En este caso la probabilidad de que sea
cruz los dos lanzamientos es 1 0.64 = 0.36.

El siguiente rbol de probabilidades ejemplariza el resultado:

0.
P(H) = 0.50 0.2
P(H)=0.5 5 P(H)55= 0.5 012
P(H)= 0.5
55
5
0.2
55
P(H)=0.5 0.12
5
P(T)= 0.5 0.
5.
Esta red muestra los 5cambios que experimenta la probabilidad a media
de se proyecta un nuevo lanzamiento.

43
El P(H)= 0.5 es la probabilidad conjunta de obtener una de las dos cara
en cada lanzamiento. El P(H1) para cada una de las posibilidades en el
segundo lanzamiento es la probabilidad marginal y as sucesivamente
en cada lanzamiento adicional.

PROBABILIDAD CONDICIONAL BAJO INDEPENDENCIA


ESTADISTICA
La probabilidad condicional se escribe como:

P(B/A) = P(B)

La probabilidad de que se presente el evento B, dado que el evento A


se ha presentado.

Para eventos estadsticamente independientes, la probabilidad


condicional de que suceda el evento B dado que el evento A se ha
presentado es simplemente la probabilidad de B.

Pareciera ser contradictorio, pero recuerde que son estadsticamente


independientes, solo est condicionado a que el evento A s de, para
que el evento B cumpla su condicin.

En el caso de las monedas seria:

P(CARA/CRUZ) = P(CARA) = 0.5

El primer resultado no tiene nada que ver con el segundo evento.

PROBABILIDAD BAJO CONDICIONES DE DEPENDENCIA


ESTADISTICA
La dependencia estadstica existe cuando la probabilidad de que se
presente algn evento dependiendo o se ve afectada por la
presentacin de algn otro. Los tipos son al igual que los
independientes:
1. Condicional
2. Conjunta
3. Marginal

44
PROBABILIDAD CONDICIONAL BAJO DEPENDENCIA
ESTADISTICA
La probabilidad condicional y conjunta bajo condiciones de dependencia
estadstica es ms complicada que la probabilidad marginal en estas
mismas circunstancias. Se analiza primero las probabilidades
condicionales, ya que la probabilidad conjunta se ilustra mejor si
utilizamos la probabilidad condicional como base.

Ejemplo 1:
En una caja hay 10 bolas distribuidas as:

Tres son de color y tienen puntos


Una es de color y tiene franjas
Dos son grises y tienen puntos
Cuatro son grises y tiene franjas
Donde:
Color ( C )
Gris (G)
Con Puntos (D)
Con franjas (S)
La probabilidad de sacar cualquier bola es de 0.10 al ser 10 bolas con
igual probabilidad de ser elegida.

La probabilidad de sacar una bola de color es (3 + 1)*0.10 = 0.40


La probabilidad de sacar una bola gris = (2 +4) * 0.10 = 0.60
La probabilidad de sacar una de color y tiene puntos = 3 x 0.10 = 0.30
La probabilidad de que tengan puntos = (3+2) * 0.10 = 0.50
La probabilidad de que tenga puntos y rayas = (3+1+2+4) = 1.0

Ejemplo 2:
Cuando utilizamos el ejemplo de las bolas de color y grises,
respondemos a las preguntas, Cul es la probabilidad de P(D|G), es
decir que de las bolas grises tengan puntos y P(S|G), que de las grises
tengan franjas?
Donde:
D = Son grises y tienen puntos
G = grises
() 0.2 1
Solucin: P(D/G) = = =
() 0.6 3
Donde:

45
SG = grises y tiene franjas
G = Grises
() 0.4 2
P(S/G) = = =
() 0.6 3
Se debe considerar que si la bola que sali es gris solo es posible con
franjas o puntos.

Ejemplo No. 3
Calcule P(G|D) y P(C|D)

(|) 0.2
P(G|D) = = = 0.4
() 0.5

() 0.3
P(C|D) = = = 0.6
() 0.5
Total 1.0

Ejemplo No. 4
() 0.4
P(C|S) = = = 0.8
() 0.5
Total 1.0

PROBABILIDAD CONJUNTA BAJO CONDICIONES DE


DEPENDENCIA ESTADISTICA
Hemos mostrado que la frmula para calcular la probabilidad
condicional bajo dependencia estadstica es:
()
P(B|A) =
()
Si de esta ecuacin despejamos P(BA) mediante una multiplicacin,
obtendremos la frmula para probabilidad conjunta bajo condiciones de
dependencia estadstica.

Probabilidad conjunta de los Probabilidad de que suceda


el evento B
Eventos B y A se presentan al mismo dado que ya se present A
Tiempo o en sucesin.

P(BA) = P(B|A) x P(A)

46
Probabilidad de que se presente el evento A

Observe que esta frmula no es P(BA) = P(B) x P(A) y en trminos de


color (C), gris (G), con puntos (D) y con franjas (S), tendremos P(CD) =
P(C|D) x P(D)
O P(CD) = 0.6 x 0.5 = 0.3. Aqu 0.6 es la probabilidad de obtener una
bola de color, dado que sta tiene puntos (calculada en el ejemplo 3
anterior y 0.5 es la probabilidad de obtener una bola con puntos
(tambin calculada en el ejemplo 3)

El resultado, P(CD) = 0.3 puede verificarse en los datos originales en la


que llegamos a la probabilidad por inspeccin: tres bolas de q0 son de
color y con puntos.

P(CS) = P(C|S) x P(S) = 0.2 x 0.5 = 0.1


P(GD) = P(G|D) x P(D) = 0.4 x 0.5 = 0.2
P(GS) = P(G|S) x P(S) = 0.8 x 0.5 = 0.4

PROBABILIDAD MARGINAL BAJO CONDICIONES DE


DEPENDENCIA ESTADISTICA.

Las probabilidades marginales en condiciones de dependencia


estadstica se calculan mediante la suma de las probabilidades de todos
los eventos conjuntos en los que se presenta el evento sencillo. En el
ejemplo anterior, podemos calcular la probabilidad marginal del evento
bola de color mediante la suma de la probabilidad de los eventos
conjuntos en los que aparece una bola de color.

P(C) = P(CD) + P(CS) = 0.3 + 0.1 = 0.4

De manera parecida, la probabilidad marginal del evento bola dris se


puede calcular sumando la probabilidad de los dos eventos conjuntos
en los que aparece una bola de color.

P(G) = P(GD) + P(GS) = 0.2 + 0.4 = 0.6

47
Igualmente, podemos calcular la probabilidad marginal del evento bola
con puntos mediante la suma de las probabilidades de los eventos
conjuntos en los que se tiene una bola con puntos.

P(D) = P(CD) + P(GD) = 0.3 + 0.2 = 0.5

Y por ltimo, la probabilidad marginal de un evento bola con franjas se


puede calcular mediante la suma de las probabilidades de los eventos
conjuntos en los que se presenta una bola con franjas:

P(S) = P(CS) + P(GS) = 0.1 + 0.4 = 0.5

Estos resultados pueden inspeccionarse en la tabla original.

Resumen de las formulas desarrolladas.

Sugerencia: distinga entre probabilidad condicional y probabilidad


conjunta mediante el uso cuidadoso de los trminos dado que y
ambos y P(A|B) es la probabilidad de que A ocurra dado que ocurra
B y P(AB) es la probabilidad de que amos, A y B ocurran. La
probabilidad de que ocurra A, sucede B o no.

Formula bajo Formula bajo


Tipo de Probabilidad independencia dependencia
Smbolo estadstica estadstica
Margina P(A) P(A) Suma de las
probabilidades de
los eventos
conjuntos en los que
A ocurre
Conjunta P(AB) P(A) x P(B) P(A|B) x P(B)
O P(BA) P(B) x P(A) P(B|A) x P(A)
Condicional P(A|B) P(B) ()
O P(A|B) P(A) ()
()
()

REVISION DE LAS ESTIMACIONES ANTERIORES DE


PROBABILIDADES: TEOREMA DE BAYES.
En el mundo de los negocios se presenta la incertidumbre, por ejemplo
si el negocio seguir comportndose de forma similar, porque pueden
presentarse situaciones no controladas.

48
Las probabilidades son alteradas despus que uno obtiene informacin
adicional. Las nuevas probabilidades se conocen como probabilidades
revisadas o posteriores. Como estas pueden revisarse en la medida que
hay ms informacin, la teora de las probabilidades adquiere una gran
importancia para la toma de decisiones.

Fue Tomas Bayes quien formul este concepto. La frmula bsica para
la probabilidad condicional en circunstancias de dependencia es:

()
P(B|A) = se conoce como teorema de Bayes.
()

El teorema de Bayes ofrece un potente mtodo estadstico para evaluar


nueva informacin y revisar nuestras estimaciones anteriores (basado
solo en informacin limitada) de la probabilidad de que las cosas se
encuentren en un estado o en otro. Si es utilizado de manera correcta,
se hace innecesario reunir grandes cantidades de datos en un
periodo grande con el fin de tomar mejores decisiones, basadas en
las probabilidades.

CALCULO DE PROBABILIDADES POSTERIORES


Supongamos que tenemos al nacer un nio (sesgado) en un hospital.
La mitad de estos fueron varones y se presenta 40% de veces o sea 0.4
(de 100 nacimientos 40 fueron varones. La otra mitad de estas fueron
mujeres y se presenta el 70% de las veces (de 100 nacimientos 70
fueron mujeres. Si se espera el siguiente nacimiento el resultado es una
mujer. Cul es la probabilidad de que el siguiente nacimiento sea
varn? Sabiendo que el nacimiento de un nio puede ser varn o mujer,
1
podemos contestar incorrectamente que la probabilidad es de , pero
2
podemos hacer una mejor estimacin. Para responder a la pregunta de
manera correcta, debe construirse una tabla:

Probabilidad P(Sexo| evento P(Sexo, evento


Evento del evento elemental elemental*
Elemental elemental
Varn 0.5 0.4 0.4 x 0.5=0.20
Mujer 0.5 0.7 0.7x0.5=0.35
49
1.0 0.55
* Se utiliza la coma para separar los eventos conjuntos. Podemos poner
junta letras individuales para indicar, sin que haya confusin, eventos
conjuntos (AB), pero al poner juntas palabras completas, produciramos
eventos de apariencia extraa (sexo evento elemental), que podra
ocasionar confusin.

Si observamos la 3era columna la suma no es el resultado 1.0,


simplemente porque la probabilidad condicional del nacimiento de un
nio, est dada es la realidad de lo que sucedi. Lo que se hace es
ajustar la probabilidad de cada uno de acuerdo al evento realizado. As
podemos calcular la probabilidad si:

0.20
P(varn) = = = 0.364 o 36.4%
0.55

0.35
P(mujer) = = = 0.636 o 63.6%
0.55

La ltima columna nos muestra la probabilidad de que el nio que nace


tiene una probabilidad de 0.20 y que sea mujer es 0.35 y la probabilidad
conjunta es de 0.55, es la probabilidad marginal de un nacimiento.

Con la informacin adicional, hemos sido capaces de alterar o revisar


nuestra estimacin anterior de probabilidad.

La suma de las probabilidades de los eventos elementales (de que el


nio sea varn y mujer) es 1.0, por tener solo 2 sexos. Las dos clases
de sexo constituyen una lista mutuamente excluyente y colectivamente
exhaustiva.

PROBABILIDAD POSTERIOR CON MS INFORMACION


Si al revisar los resultados de un evento, necesitamos obtener
informacin adicional, esto requerira de realizar los eventos otras
veces, pero la toma de decisiones se torna ms complicada y lleva ms
tiempo.

Supongamos que deseamos realizarlo, el siguiente cuadro muestra los


clculos:

50
Probabilida
P1(sexo P2( P(2 sexo,
Evento d del
|evento sexo|evento evento
Element evento
elemental) elemental) elemental)
al elemental
0.16x0.5=
Varn 0.5 0.4 0.16
0.080
Mujer 0.5 0.7 0.49 0.49x0.5=0.245
P(2
1.0
bola)=0.325
Nota: la tercera columna es la segunda elevada al cuadrado. Ejemplo
0.4 x 0.4 = 0.16 y 0.7 x 0.7 = 0.49
Podemos obtener informacin adicional sobre los nacimientos.
Supongamos que realizo nuevamente el evento Cul es la
probabilidad de el nio que nazca sea varn?

La tabla anterior muestra los resultados, con una nueva columna, de la


realizacin del segundo evento. As que despus de realizarlo, la
probabilidad de que sea varn es de 8% y la probabilidad de que sea
mujer es de 24.5%

Ahora podremos ser capaces de calcular la probabilidad de que el nio


que nazca sea varn o mujer as:
0.08
P(varn) = = = 0.246 o 24.6%
0.325

0.245
P(mujer) = = = 0.754 0 75.4%
0.325
Esto se debe que si uno observa en un hospital da a da cambia la
cantidad de nacimientos, en algunos casos nacen mas varones y otros
ms mujeres o en cantidades similares. Hay factores que producen este
fenmeno.

UN PROBLEMA RELACIONADO CON TRES ELEMENTOS DE


INFORMACION
Supongamos que una cajera de banco el 85% de las operaciones es
correcta cuando tiene un ambiente tranquilo, pero cuando esta
presionada solo alcanza un 35% de operaciones incorrectas. La
experiencia indica que el 75% de las veces tiene un ambiente tranquilo.

51
Cul es la probabilidad que la cajera tenga operaciones correctas? El
cuadro siguiente muestra los clculos.

P(evento,
Evento P(evento) P(ambiente|evento) P(3|evento)
3)
0.6141 x
Correctas 0.75 0.85 0.6141 0.75 =
0.4606
0.0429 x
Incorrectas 0.25 0.35 0.0429 0.25 =
0.0107
1.0 0.4713
Nota. La segunda columna se eleva al cubo = 0.85 x 0.85 x 0.85 =
0.6141

Podemos calcular la probabilidad que el siguiente da, realice


operaciones correctas:
0.4606
P(correcta) = = = 0.977 = 97.7%
0.4713

0.0107
P(incorrecta) = = = 0.023 = 2.3%
0.4713

La probabilidad cambio de 75% a 97.7% basado en tres das de


operaciones.

PROBABILIDADES POSTERIORES CON RESULTADOS


INCONSISTENTES.
Muchas veces se tiene resultados inconsistentes. La siguiente tabla
muestra 5 resultados distintos:

P(evento P(evento,sbbbb
Evento P(S|evento) P(sbsss|evento)
) )
.85x0.15x0.85x0.8 0.07830x0.75 =
Correcta 0.75 0.85
5x.85 = 0.07830 0.05873
Incorrect 0.35x0.65x0.35x0. 0.00975x0.25 =
0.25 0.35
a 35x0.35 = 0.0095 0.00244
P(sbsss) =
0.06117

52
0.05873
P(correcta) = = = 0.9601 o 96%
0.06117

VALOR ESPERADO
CONBINACION DE PROBABILIDADES Y VALORES MONETARIOS
Esto es aplicable ms a productos perecederos.
Ejemplo:
Una caja de frambuesas cuesta L 20 y el vendedor recibe L 50 por ella.
Este no puede especificar el nmero de cajas que un cliente en
cualquier da dado, pero su anlisis de registros pasados ha producido
la informacin que se presentan en la siguiente tabla:

Probabilidad de
Nmero de das de
Ventas Diarias ventas de cada
venta
cantidad
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25
Totales 100 1.00

El vendedor en ese tipo de productos puede sufrir dos tipos de perdidas:


1. Perdidas por obsolescencia. Producto que se daa
2. Perdidas de oportunidad. Por no tener existencia.

En el siguiente cuadro muestra las perdidas condicionales. Cada valor


en ella est condicionado a un nmero especfico de cajas que se
encuentran en existencia y a un nmero especfico de solicitudes. Los
valores que se tienen es esta tabla incluyen no solamente las perdidas
por las frutas descompuestas, sino tambin las que se derivan de los
ingresos perdidos cuando el vendedor no es capaz de suministrar un
pedido.

Opciones de existencia
Posibles
Peticiones
10 11 12 13
de
frambuesas
10 L0 L 20 L 40 L 60

53
11 30 0 20 40
12 60 60 30 0

Cuando el nmero de cajas en existencia en un da cualquiera es igual


al nmero de cajas solicitadas, el vendedor no sufre ninguna perdida.

Si miramos la primera fila de la matriz podemos construirla as:

Si la peticin es de 10 cajas y la existencia es de 10, no pierde nada.


Si la peticin es de 10 cajas y la existencia es de 11, perdera 1 o sea L
20
Si la peticin es de 10 cajas y la existencia es de 12, perdera 2 o sea L
40
Si la peticin es de 10 cajas y la existencia es de 13, perdera 3 o sea L
60

As sucesivamente se hace con cada fila, para determinar las prdidas


que tendra.

Las perdidas condicionales de la siguiente tabla, se toma la primera


columna de la tabla anterior si se tiene una existencia de 10, 11, 12, 13
cajas de frambuesa. En la segunda columna se anota la perdida
condicional que tendra, o sea la segunda columna de la tabla anterior.
La tercera columna se anota la probabilidad o sea la ltima columna del
primer cuadro y la ltima columna (perdida condicional) ser la
multiplicacin de la perdida condicional por la probabilidad que se
tengan estas solicitudes.

Se procede a calcular la perdida esperada por niveles de existencia.

Se se tiene una existencia de 10 cajas


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 0 X 0.15 = 0.00
11 30 X 0.20 = 6.00
12 60 X 0.40 = 24.00
13 90 X 0.25 = 22.50
54
1.00 52.50
Con existencia de 10 cajas, la perdida mnima estimada seria de L 52.50

Si se tiene una existencia de 11 cajas.


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 20 X 0.15 = 3.00
11 0 X 0.20 = 0.00
12 30 X 0.40 = 12.00
13 60 X 0.25 = 15.00
30.00
Con existencia de 11 cajas la prdida mnima seria de L 30.00

Si se tiene una existencia de 12 cajas


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 40 X 0.15 = 6.00
11 20 X 0.20 = 4.00
12 0 X 0.40 = 0.00
13 30 X 0.25 = 7.50
17.50
Con 12 cajas de existencia la perdida mnima seria de L 17.50

Si se tiene una existencia de 13 cajas


Probabilidad
de que se
tengan

55
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 60 X 0.15 = 9.00
11 40 X 0.20 = 8.00
12 20 X 0.40 = 8.00
13 0 X 0.25 = 0.00
25.00
Al tener una existencia de 13 cajas, las perdidas mnimas serian de L
25.00

La menor perdida esperada mnima seria con un nivel de existencia de


12 cajas con L 17.50 de perdida.

CALCULO DE GANACIAS CONDICIONALES

GANACIA MAXIMA

Probabilidad de cada
Ventas Diarias No. De das que se nmero que se venda
venden
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25

Tabla de ganancias condicionales:


Posibles Inventarios
Demanda Posible 10 Cajas 11 Cajas 12 Cajas 13 cajas
10 300 280 260 240
11 300 330 310 290
12 300 330 360 340
13 300 330 360 390

Si se almacena 10 cajas cada da, la ganancia esperada es de L 300.00


Si se almacena 11 cajas cada da, la ganancia esperada es de L 322.50
Si se almacena 12 cajas cada da, la ganancia esperada es de L 335.00
Si se almacena 13 cajas cada da, la ganancia esperada es de L 327.50

Ganancia esperada al tener 10 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 300 X 0.15 = 45
11 330 X 0.20 = 60
12 330 X 0.40 = 120
13 330 x 0.25 = 75

56
1.00 300

Ganancia esperada al tener 11 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 280 X 0.15 = 42.00
11 330 X 0.20 = 66.00
12 330 X 0.40 = 132.00
13 330 x 0.25 = 82.50
1.00 322.50

Ganancia esperada al tener 12 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 260 X 0.15 = 39.00
11 310 X 0.20 = 62.00
12 360 X 0.40 = 144.00
13 360 x 0.25 = 90.00
1.00 335.00

Ganancia esperada al tener 13 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 240 X 0.15 = 36.00
11 290 X 0.20 = 58.00
12 340 X 0.40 = 136.00
13 390 x 0.25 = 97.5
1.00 327.50

57
TERCER PARCIAL
DISTRIBUCION DE PROBABILIDADES

DISTRIBUCION BINOMIAL
Una distribucin de probabilidad de variable aleatoria discreta
ampliamente utilizada en la distribucin Binomial. Es una variedad de
procesos de inters para los administradores. Los datos discreto, no
continuos, que son resultados de un experimento conocido como
proceso de Bernoulli. El xito o fracaso de las solicitudes de empleo,
entrevistados para pruebas de aptitudes, puede ser descrito como un
proceso Bernoulli. Si medimos la duracin de focos mediante una escala
continua de tiempo y no se podra clasificar como una distribucin
Binomial.

USO DEL PROCESO DE BERNOULLI.


Se puede utilizar el lanzamiento de la moneda y el proceso puede ser
descrito as:

58
1. Cada intento (cada lanzamiento, es este caso) tiene solamente
dos resultados posibles: cara o cruz, si o no, xito o fracaso.
2. La probabilidad del resultado de cualquier intento permanece fijo
con respecto al tiempo. Al no estar alterada la probabilidad de
ambas es 0.5, independientemente del nmero de veces que se
lance la moneda.
3. Los intentos son estadsticamente independientes, es decir, el
resultado de un lanzamiento no afecta el resultado de cualquier
otro.

Cada proceso Bernoulli tiene su propia probabilidad caracterstica. Si se


considera, siete dcimas partes de todas las personas que soliciten
cierto tipo de trabajo, aprueben el examen de aptitud. Digamos que, en
este caso, la probabilidad caracterstica es de 0.7, pero podramos
describir el resultado del examen como de Bernoulli solo si tenemos la
certeza de que la fraccin de los que aprueban el examen (0.7)
permanece constante en el tiempo. Desde luego que las caractersticas
del proceso de Bernoulli tambin deben cumplirse. Cada examen
tendra que tener solamente dos resultados (xito o fracaso) y los
resultados de cada prueba deberan ser estadsticamente
independientes.

Para la evaluacin el smbolo p representa la probabilidad de tener xito


(0.70) y el smbolo q (q = 1-p) es la probabilidad que resulte un fracaso
(0.30). Para presentar un cierto nmero de xitos, se utiliza el smbolo
r, y para representan el nmero total de intentos o de ensayos se utiliza
el smbolo n. En las situaciones que se analiza, el nmero de ensayos
esta fijo desde antes de empezar el experimento.

Si calculamos la probabilidad de obtener dos caras en tres lanzamientos


de una moneda no alterada, y expresamos los valores de la forma
siguiente:

p = probabilidad caracterstica o probabilidad de tener xito = 0.5


q = 1-p = probabilidad de fracaso (1-0.5) = 0.5
r = nmero de xitos deseados = 2
n = nmero de intentos hechos = 3

59
! 3!
Probabilidad de r xitos en n intentos = =
!()! 2!(32)!
2 1
(0.5 )(0.5 )
321
= (21)(11) (0.25)(0.5) = 0.375

Por lo tanto existe la probabilidad de 0.375 o 37.5% de obtener dos


caras en tres lanzamientos de una moneda no alterada.

Otro ejemplo es cada 10 refrescos 8 estn bien llenados, si queremos


obtener la probabilidad de 3 refrescos de 6 estn llenos correctamente:

p = 0.8
q = 0.2
r=3
n=6
6!
Probabilidad de r xitos de n intentos = (0.8)3 (0.2)3 0.08192 =
3!(63)!
8.19%

Este problema sustituye al rbol de probabilidades que se vio


anteriormente.
Si se utiliza el rbol de probabilidades con datos muy extensos, sera
difcil, por lo que este proceso simplifica los clculos.

ALGUNAS PRESENTACIONES GRAFICA DE LA DISTRIBUCION


BINOMIAL
Hasta este momento solo hemos aprendido a utilizar la formula, y los
posibles resultados pueden mostrarse grficamente:

La probabilidad de que un empleado llegue tarde es de 0.4. Se desea


representar grficamente la probabilidad que 0, 1, 2, 3 0 4 empleados
lleguen simultneamente tarde.
5!
P(0) = ( 0.4)0 (0.65 ) = 0.07776
0!(50))!

5!
P(1) = (0.4)1 (0.6)4 = 0.2592
0!(51)!

60
5!
P(2) = (0.4)2 (0.6)3 = 0.3456
0!(52)!

5!
P(3) = (0.4)3 (0.6)2 = 0.2304
3!(53)!

5!
P(4) = (0.4)4 (0.6)1 = 0.0768
4!(54)!

5!
P(5) = (0.4)5 (0.6)0 = 0.01024
5!(55)!

0.4

0.35

0.3

0.25

0.2
Series1
0.15

0.1

0.05

0
1 2 3 4 5 6

Note que a medida que cambia p y q se ubican a cada lado de la


distribucin. Si observamos La grafica anterior tiende a subir y luego a
bajar y bajo esta situacin podemos hacer las siguientes afirmaciones:

1. Cuando p es pequeo (0.1) la distribucin Binomial esta sesgada


hacia la derecha.
2. Conforme p aumenta (0.3), el sesgo es menos notable
3. Cuando p = 0.5, la distribucin Binomial es simtrica
4. Cuando p es mayor que 0.5, la distribucin esta sesgada hacia la
izquierda.
5. La probabilidad para 0.3, por ejemplo, son las mismas para 0.7,
excepto que los valores de p y q estn invertidos. Esto se aplica a
cualquier pareja de valores.
Note que a medida aumenta n, se forma una campana.

USO DE TABLAS BINOMIALES


61
Resulta un tanto prolongado calcular las probabilidades Binomial cundo
n es un numero grande. Afortunadamente, podemos utilizar la Tabla 3
del apndice para determinar con rapidez la probabilidad Binomial.

Cul es la probabilidad de que 8 de 15 votantes liberales en el padrn


electoral no pueda votar en las elecciones, si la probabilidad de que
cualquier individuo no pueda votar es de 0.30, y si las personas decidan
de manera independiente si votan o no?
Lo primero es determinar los elementos de este problema en notacin
de distribucin Binomial:
n = 15 nmero de demcratas en el padrn electoral
p = 0.30 probabilidad de que cualquier individuo vote.
r = 8 nmero de individuos que no van a votar

Como son 15 ensayos, se busca en la tabla correspondiente a n=15.


Como la probabilidad de que un individuo no vote es 0.30. Nos
desplazamos despus hacia debajo de la columna hasta que estamos
opuestos a la columna r =8 en donde tenemos la respuesta 0.0348. Esta
es la probabilidad

El diseo de la tabla se muestra as:


n r
Probabilidad (p)
0.19 0.20 0.23 0.24 0.25 0.30 .n
15 0.0348
8

Supngase que no se ha podido encontrar la probabilidad de que ocho


o ms votantes empadronados no boten. Podramos haber buscado en
la columna de 0.30 y sumar las probabilidades desde 8 hasta el fondo
de la columna, de esta manera:
8 0.0348
9 0.0116
10 0.0030
11 0.0006
12 0.0001
13 0.0000
Total 0.0501

62
La respuesta es que la probabilidad de que 8 o ms votantes
empadronados no voten es de 0.0501.

Igual situacin se hace cuando se solicita de 8 o menos, solo que la


suma es la inversa.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERCION PARA LA


DISTRIBUCION BINOMIAL.
Analizamos el concepto de valor esperado o media de una distribucin
de probabilidades. La distribucin Binomial tiene un valor esperado o
media (u) y una desviacin estndar (); veremos la forma en que
ambas medidas estadsticas se pueden calcular.

Simblicamente se puede representar la media de una distribucin


Binomial como:

u = np
donde:
n = nmero de ensayos.
P = probabilidad de tener xito

Podemos calcular la desviacin estndar de una distribucin Binomial


con la frmula:
=
n = nmero de ensayos
p = probabilidad de xito
q = probabilidad de fracaso = 1-p

Una fbrica produce el 20% de unidades defectuosas. Podemos


calcular la media y la desviacin estndar si se toma una muestra de 10
unidades as:

u = np = (10)(0.2) = 2 es la media
= = (10)(0.20)(0.80) = 1.265 desviacin estndar

CUMPLIMIENTO DE LAS CONDICIONES PARA EMPLEAR EL


PROCESO DE BERNOULLI

63
Usar la distribucin Binomial, se debe estar seguro que cumpla con las
3 condiciones necesarios, especialmente la 2 y 3. La 2 establece que
cualquier intento la probabilidad debe ser fija, situacin difcil de cumplir
y la 3 que sea estadsticamente independiente, es decir, que el
resultado de un evento no dependa del resultado de otros.

LA DISTRIBUCION DE POISSON
Existen muchas distribuciones de probabilidades discretas, pero el
anlisis se centra en la Binomial y la Poisson.
Se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribucin de las llamadas telefnicas a un conmutador,
las solicitudes de pacientes que requieren un servicio, los automviles
que llegan a una caseta de peaje. Todos tiene en comn que pueden
ser descritos mediante una variable aleatoria discreta que toman valores
enteros (0, 1 ,2, 3, ..n)

CARACTERISTICAS DE LOS PROCESOS QUE PRODUCEN UNA


DISTRIBUCION DE PROBABILIDAD DE POISSON
El nmero de vehculos que pasan por una caseta de peaje en una hora
pico, ilustra las caractersticas de la distribucin de probabilidades de
Poisson.

1. El promedio (media) del nmero de vehculos que llegan por hora


pico puede estimarse a partir de datos sobre trfico que se tengan
disponibles.
2. Si dividimos la hora pico en periodos (intervalos) de un segundo
cada uno, encontramos que las siguientes afirmaciones son
verdaderas:
a. La probabilidad de que exactamente un vehculo llegue a
una caja por segundo es muy pequea y es constante para
cada intervalo de un segundo.
b. La probabilidad de que dos o ms vehculos lleguen en un
intervalo de un segundo es tan pequea que le podemos
asignar el valor cero.
c. El nmero de vehculos que llegan en un intervalo dado de
un segundo es independiente del momento en que dicho
intervalo se presenta en la hora pico.

64
d. El nmero de llegadas en cualquier intervalo de un segundo
no depende del nmero de llegadas en cualquier otro
intervalo de un segundo.
Se puede generalizar a partir del ejemplo de una caseta de peaje y
aplicar esta caracterstica a otros procesos. Si estos nuevos procesos
cumplen con las mismas condiciones, entonces podemos utilizar la
distribucin de probabilidad de Poisson para describirlos.

CALCULO DE LA PROBABILIDAD DE POISSON UTILIZANDO LA


TABLA 4TA. DEL APENDICE DEL LIBRO.

La probabilidad de Poisson, como se mostro, tiene que ver con ciertos


procesos que pueden ser descritos por una variable aleatoria discreta.
Generalmente, la letra x representa a esta variable discreta y pude
tomar valores enteros (0, 1, 2, 3, .n). Se utiliza la mayscula X para
representar la variable aleatoria, y la minscula x para sealar un valor
especifico que dicha variable puede tomar. La probabilidad de tener
exactamente x ocurrencias de Poisson se calcula con la frmula:

P(x) =
!

Lambada (el nmero medio de presentaciones por e o 2.71828 (base de los logaritmos
Intervalos de tiempo) elevada a la x potencia neperianos o naturales) elevados a la
Lambada potencia negativa


P(x) =
!

Probabilidad de tener exactamente x ocurrencias factorial

El siguiente ejercicio se refiere a la seguridad de una intercesin


peligrosa. Las estadsticas indican 5 accidentes por mes. Se quiere
encontrar la probabilidad de que ocurra ningn accidente y 2 accidentes.

Que no ocurra ningn accidente


(5)0 ()5
P(x) = = 0.00674
0!
Que ocurra 2 accidentes

65
(5)2 ( 5 )
P(2) = = 0.08425
2 1
Igual situacin se presenta si queremos saber que probabilidad hay
que ocurra 2 o menos accidente:
P(0) = 0.00674
P(1) = 0.03370
P(2) = 0. 08425
TOTAL 0.12469
BUSQUEDA DE PROBABLIDADES DE POISSON UTILIZANDO LA
TABLA 4b DEL APENDICE.
Es utilizar la tabla 4a en las mismas condiciones que la tabla de
distribucin Binomial.

Se puede realizar la misma grafica con los datos.

Ejemplo:
X= nmero de P(x) = Probabilidad de tener exactamente este
accidentes nmero de accidentes.
0 0.00674
1 0.03370
2 0.08425
3 0.14042
4 0.17552
5 0.17552
6 0.14627
7 0.10448
8 0.06530
9 0.03628
10 0.01814
11 0.00824
TOTAL 0.99486 probabilidades de tener de 0 a 11
accidentes.
0.00514 probabilidad de tener 12 o mas accidentes
TOTAL 1.00000

66
1.2

0.8

0.6

0.4

0.2

0
1 2 3 4 5 6 7 8 9 10 11 12

Al igual que la distribucin Binomial, las mayores probabilidades estn


dadas de 5 y 6 accidentes.

LA DISTRIBUCION POISSON COMO UNA APROXIMACION DE LA


DISTRIBUCION BINOMIAL.
Si deseamos ahorrarnos tiempo y deseamos calcular las distribuciones
Binomial de probabilidades, podemos utilizar la distribucin Poisson.
Esta puede ser razonablemente aproximada a la Binomial, pero solo
bajo ciertas condiciones. Esto se da cuando n es grande y p es pequea
o sea cuando el nmero de ensayos es grande y la probabilidad es
pequea. Esto es cuando n es igual o mayor que 20 y p es igual o menor
a 0.05.

La sustitucin de la formula queda as:

()
P(x) =
!
Ejemplo:
En un hospital hay 20 aparatos para dilisis y que la probabilidad de que
cualquiera de las maquinas no funcione bien durante un da cualquiera
es de 0.02. Cul es la probabilidad de que exactamente tres maquinas
estn fuera de servicio?

(20 0.02)3 (20 0.02)


P(3) = = 0.00715 Probabilidad por Poisson
3!

67
20!
P(3) = (0.2)3 (0.98)17 = 0.0065 Probabilidad Binomial
3!(203)!

Se puede ver que la diferencia entre ambas es muy pequea, de solo


10% de error.

LA DISTRIBUCION NORMAL: DISTRIBUCION DE UNA VARIABLE


ALEATORIA CONTINUA.
Las anteriores han sido anlisis de las distribuciones de probabilidades
discretas. Esta sirve para analizar distribuciones de variables que
pueden asumir cualquier valor.

La distribucin normal es conocida tambin como distribucin gaussina.

Son dos las razones fundamentales para que la distribucin normal


ocupe un lugar predominante en la estadstica:
1. Su propiedad la hace aplicable a un gran nmero de situaciones
en la que es necesario hacer inferencia mediante la toma de
muestras.
2. Casi se ajusta a la distribucin de frecuencias reales observadas
en muchos fenmenos, incluyendo caractersticas humanas
(peso, altura, coeficiente intelectual), resultados de procesos
fsicos (dimensiones y rendimientos, y muchas medidas de inters
para los administradores, tanto pblicos como privados.

CARACTERISTICAS DE LA DISTRIBUCION NORMAL DE


PROBABILIDADES
1. La curva solo tiene un pico; por lo tanto, es unimodal. Tiene la
forma de campana.
2. La media de una poblacin distribuida normalmente cae en el
centro de la curva normal.
3. Debido a la simetra de la distribucin normal de probabilidad, la
mediana y la moda de la distribucin estn en el centro; en
consecuencia, para la curva normal, la mediana, la media y la
moda tienen el mismo valor.
4. Las dos colas de distribucin normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal (desde luego es
difcil de mostrarlo grficamente)

68
La siguiente grafica muestra estas caractersticas:
Curvas de frecuencia para la distribucin normal de probabilidades
Curvas de

Media
Mediana
Moda

La distribucin normal de
Probabilidad es simtrica con
Respecto a una lnea vertical
La cola izquierda se Que pase por la media
Extiende de manera
Indefinida y nunca toca
El eje horizontal

La cola derecha se extiende


De manera indefinida pero
Nunca toca el eje horizontal

La mayor parte de poblaciones reales no se extienden de manera


indefinida en ambas direcciones: pero para estas poblaciones, la
distribucin normal es una aproximacin conveniente. No hay una sola
curva normal. Para definir una distribucin normal de probabilidades
necesitamos definir nicamente dos parmetros: la media (u) y la
desviacin estndar (). La siguiente tabla, cada una de las poblaciones
esta descrita solamente por la media y su desviacin estndar, y cada
una tiene una curva normal especifica.
DIFERENTES DISTRIBUCIONES NORMALES DE
PROBABILIDADES
Su
Naturaleza de la poblacin Su media desviacin
estndar
Ingresos anuales de los empleados
de una planta L 17,000 L 1,000
anuales
Longitud de viguetas estndar 8 8 0.05
Contaminacin del aire en 750 partculas
partculas en una comunidad 2,500 por milln
partculas
Ingreso per cpita de un pas en
desarrollo L 1,400 L 300
Delitos violentos por ao en una 8,000 900
ciudad

69
La siguiente grafica muestra tres distribuciones normales de
probabilidades, cada una de las cuales tiene la misma media, pero
diferentes desviaciones estndar. Aunque estas curvas difieren en
apariencia, las tres son curvas normales.
La curva A tiene una desviacin
Estndar muy pequea

= 1
La curva B tiene una desviacin
Estndar mas grade

LA Curva C tiene una desviacin = 5


Estndar muy grande

= 10

U = 50

La siguiente grafica muestra una familia de curvas normales, todas con


la misma desviacin estndar, pero con diferentes medias.

La curva A tiene la La curva B tiene una media entre


Media mas pequea La curva A y la C La curva C tiene la
Media mas grade

Dsviacion = 5 Desviacion = 5 Desviacion =5

Por ltimo, en la siguiente grafica podremos ver 3 distribuciones


normales de probabilidades, con medias diferentes y desviaciones
estndar diferentes:

70
La curva A tiene una La curva B tiene una La Curva C tiene una
Media y una desviacin Media y desviacin Media y una desviacin
Estndar pequea. Estndar mas grande Estndar muy grande

AREAS BAJO LA CURVA NORMAL


No importa cules sean los valores de u y para una distribucin de
probabilidades normal, el rea bajo la curva es 1.00, de manera que
podemos pensar en el rea bajo la curva, como si fueran
probabilidades. Matemticamente es verdad que:

1. Aproximadamente el 68% de todos los valores de una poblacin


normalmente distribuida se encuentra dentro de 1 desviacin
estndar de la media.
2. Aproximadamente el 95.5% de todos los valores de una poblacin
normalmente distribuida se encuentra dentro de 2 desviaciones
estndar de la media.
3. Aproximadamente el 99.7% de todos los valores de una poblacin
distribuida normalmente se encuentra a 3 desviaciones
estndar.

GRAFICA PARA UNA DESVIACION ESTANDAR

16% del area 68% del area 16% del area

71
GRAFICA PARA 2 DESVIACIONES ESTANDAR

2.25% del rea 95.5% del area 2.5% del rea

2 2

GRAFICA PARA 3 DESVIACIONES ESTANDAR

0.15% del rea 99.7% del rea 0.15% del rea

3 3

Es de hacer notar que en las aplicaciones que se hacen de la


distribucin normal de probabilidades implican intervalos exactamente
iguales Qu hacemos en estos casos? La existencia de tablas
estadsticas est construida para estas situaciones. Las tablas indican
porciones del rea bajo la curva normal que estn contenidas dentro de
cualquier nmero de desviaciones estndar (ms o menos) a partir de
la media.

No es posible construir ni necesario tener una tabla distinta para cada


curva normal posible. E lugar de ello podemos utilizar una distribucin
de probabilidades normal estndar para encontrar reas bajo cualquier
curva normal. Con las tablas se determina el rea o la probabilidad de
que las variables aleatorias distribuidas normalmente estn dentro de
72
cierta distancia a partir de la media. Estas distancias estn definidas en
trminos de desviacin estndar.

USO DE TABLAS DE DISTRIBUCION DE PROBABILIDADES


NORMAL ESTANDAR

La tabla 1 del apndice del libro se muestra el rea bajo la curva normal
entre la media y cualquier variable aleatoria distribuida. Observe en esta
tabla la localizacin de la columna identificada como z. El valor de z se
calcula:

z=

x = valor de la variable aleatoria que nos preocupa.
u = media de la distribucin de la variable aleatoria.
= Desviacin estndar de la distribucin.
z = Numero de desviaciones estndar que hay desde x a la media de
distribucin.

Porque utilizar z en vez nmero de desviaciones estndar?


Las variables aleatorias distribuidas normalmente tienen muchas
unidades distintas de medicin (lempiras, kilogramos, horas, etc.).

La tabla est organizada en trminos de unidades estndar, o valores


de z. Da los valores de nicamente la mitad del rea bajo la curva
normal, en vista que los datos estn distribuidos normalmente y una
parte es igual a la otra.

Datos para ejemplos: El programa para entrenamiento de docentes,


es un sistema auto administrado, por lo que cada docente requiere
diferentes cantidades de horas para terminarlo. Un estudio revela que
los participantes anteriores, requirieron de 500 horas en promedio, con
una desviacin estndar de 100 horas.

Ejemplo No. 1. Cul es la probabilidad de que un participante elegido


al azar requiera ms de 500 horas?

La siguiente figura muestra que la mitad del rea de la curva est a


ambos lados de la media de 500 horas. Por lo tanto, podemos deducir
73
que la probabilidad de que la variable aleatoria tome un valor mayor a
500 horas es de 0.5.
U = 500 horas
= 100 horas

u=200 P(>500)= 0.5

Ejemplo 2. Cul es la probabilidad de que un candidato elegido al azar


se tome entre 500 y 650 horas?

Nos interesa conocer el valor z de 650 horas:


650500
z= = = 1.5 desviaciones estndar
100

Si buscamos en la tabla 1 del apndice del libro, encontramos una


probabilidad de 0.4332 por lo tanto la probabilidad de que un candidato
escogido al azar requiere entre 500 y 650 horas para terminar el
programa es de 43%.

Ejemplo de la tabla
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
1.5 o.4332
Note que se usa la columna 0.00 por no estimar ningn margen de error.

La grafica es:

74
U = 500 horas
= 100 horas

U=500 650
P(500
a 600)

Ejemplo No. 3. Cul es la probabilidad de que un candidato elegido al


azar se tome ms de 700 horas en completar el programa?

Esta situacin es diferente. Sabemos que despus de 500 horas la


probabilidad es de 0.5. Necesitamos calcular la probabilidad de 700 y
luego restrsela de 0.5 as:
700500
z(700) = = 2 desviaciones estndar.
100

En la tabla 2 desviaciones estndar con 0.00 de error es 0.4772

Como la probabilidad de ser mayor de 500 es 0.5 y la probabilidad de


que sea mayor de 700, a la probabilidad total se le resta la probabilidad
que no ocurra de 500 a 700.
Probabilidad total 0 .5000
-Probabilidad de 500 a 700 0.4772
Probabilidad que se tarde ms de 700 horas 0.0228 = 2.28%

La grafica es:

75
U = 500 horas
= 100 horas

u = 500 700

P(ms de 700 = 0.0228

Ejemplo No. 4 Supongamos que se desea conocer la probabilidad que


se tarde entre 550 horas y 650 horas?

En este caso primero debo conocer la probabilidad de 650 horas y


despus conocer la probabilidad de 550 horas. Como la de 550 est
comprendida en la probabilidad de 650 horas, debemos restarlas.
650500
P(650) = = 1.5 desviaciones estndar.
100

En la tabla su valor es 0.4332, luego para


550500
P(550) = = 0.5 desviaciones estndar
100

En la tabla es 0.1915

Entonces:
P(650 550) = 0.4332 0.1915 = 0.2417

La probabilidad de completar el curso entre 550 horas y 650 horas es


24.17%

76
La Grafica se muestra as:

U = 500 horas
= 100 horas

u =500 550 650


P(550-
650=0.2417
Ejemplo No. 5. Cul es la probabilidad de que un candidato elegido al
azar se tomara menos de 580 horas para completar el curso?

Sabemos que de 500 a menos la probabilidad es de 50%, luego nos


falta conocer la probabilidad de 500 a 580, luego que la conocemos,
tenemos que sumarlas as:
580500
z(580) = = 0.8 desviaciones estndar.
100

En la tabla toma el valor de 0.2882

Entonces,

z(0 580) = 0.2881 + 0.5 = 0.7881

La probabilidad de que el escogido este entre 0 y 580 horas es de


78.81%

77
U = 500 horas
= 100 horas

u= 500 580

Ejemplo no. 6 Cul es la probabilidad de que el candidato elegido al


azar se tome entre 420 y 570 horas?

Aqu el problema es singular. Ambos lados tiene una probabilidad de .5

En primer lugar encontrar la probabilidad de 420 y luego encontrar la


probabilidad de 570 y sumarlas.
570500
P(570) = = 0.7 desviaciones estndar.
100

En la tabla el valor es 0.2580


420500
P(420) = = - 0.8
100

En la tabla es 0.2881

Entonces,

P(420-500) = 0.2580 + 0.2881 = 0.5461

78
La probabilidad que se tarden entre 420 y 580 horas es de 54.61%

LIMITACIONES DE LA DISTRIBUCION NORMAL DE


PROBABILIDADES

Una de las reglas es que nunca toca el eje horizontal, y significa que
siempre existir una probabilidad aunque sea muy pequea de que la
variable aleatoria tome un valor grande y por consiguiente muy alejado
de la media como por ejemplo una persona que pese 2,000 kilogramos
y esto significa que las desviaciones estndar serian muy grades (50) y
tendra una probabilidad de 250 ceros justo despus del punto decimal,
pero debemos estar claros que podemos asignar valores imposibles en
la prctica.

LA DISTRIBUCION NORMAL COMO UNA APROXIMACION DE LA


DISTRIBUCION BINOMIAL

Aunque la distribucin normal es continua, resulta interesante hacer


notar que algunas veces puede utilizarse para aproximar distribuciones
discretas.

Supongamos que nos gustara saber la probabilidad de obtener 5, 6, 7


u 8 en 10 lanzamientos de una moneda no alterada. Utilicemos la tabla
3, podremos encontrar la probabilidad de la siguiente manera:
P(r = 5, 6, 7 u 8) = 0.2461 + 0.2051 + 0.1172 + 0.0439 = 0.6123
Al usar los factores de correccin de continuidad, vemos que la
probabilidad Binomial de obtener 5, 6, 7 u 8 caras pude ser aproximada
1
por el rea bajo la curva normal entre 4.5 y 8.5. Los que se restaron y
2
sumaron son el factor de ajuste Si calculamos los valores de z de 4.5 y
8.5:
4.55
Ax = = -0.32 desviacin estndar.
1.581
En la tabla es 0.1255
8.55
Ax = = 2.21 desviacin estndar.
1.581
Si sumamos los dos nos dara 0.1255 + 0.4864 = 0.6119
SELECCIN DE LA DISTRIBUCION DE PROBABILIDADES
CORRECTAS
Se debe escoger con cuidado. Recuerde que aplicar la distribucin de
probabilidades Binomial es cuando el nmero de ensayos es fijo y que

79
cada ensayo es independiente y pude tener dos resultados mutuamente
excluyentes (xito, fracaso, etc.)

Aunque la distribucin normal es la nica continua, debemos conocer


que existen otras distribuciones continuas tiles. Estas se estudiaran en
la asignatura continua.

INTRODUCCION AL MUESTREO
Algunas veces es posible y practico examinar a cada persona o
elemento de la poblacin que deseamos describir. Esta accin se
conoce enumeracin completa o censo. Se recurre al muestreo cuando
no es posible o medir todos los elementos de la poblacin.

Los especialistas en estadstica usan la palabra poblacin para referirse


no solo a personas sino a los elementos que han sido escogidos para
su estudio. Los especialistas en estadstica emplean la palabra muestra
para describir una porcin escogida de la poblacin.

ESTADISTICA Y PARAMETROS
Matemticamente, podemos describir muestras y poblaciones al
emplear mediciones como la media, la mediana, la moda y la desviacin
estndar. Cuando estos trminos describen las caractersticas de una
muestra, se denominan estadsticas. Cuando describen las
caractersticas de una poblacin, se llama parmetros. Una estadstica
es una caracterstica de una muestra y un parmetro es una
caracterstica de una poblacin.

Supongamos que la estatura media de los estudiantes de esta


universidad es de 1.65 metros. En este caso 1.65 es una caracterstica
de la poblacin (todos los alumnos) y se puede considerar como
parmetro. Pero si tomas como muestra los alumnos de la Facultad de
Ciencias Econmicas podemos decir que es una caracterstica de la e
de alumnos de la facultad de Ciencias Econmicas. En este caso sera
una estadstica. Si consideramos que esta muestra es una estimacin
exacta de la estatura promedio de toda a universidad, podemos usar la
estadstica de muestra, para estimar el parmetro de la poblacin
estudiantil universitaria, sin tener que mediar a todos la poblacin
estudiantil.

80
Los especialistas en estadstica emplean literal letras latinas minsculas
para representar estadstica de muestras. Y literales griegas o latinas
maysculas para representar parmetros de la poblacin. El siguiente
cuadro muestra la simbologa a emplear:
Poblacin Muestra
Definicin Coleccin de elementos Parte o porcin de la poblacin
considerados. seleccionada para su estudio
Caractersticas Parmetros Estadsticas
Smbolos Tamao de la poblacin = N Tamao de la Muestra = n
Media de la poblacin = u Muestra de la Poblacin =
Desviacin estndar de la Desviacin estndar de la muestra = s
poblacin =

TIPOS DE MUESTREO
Existen des mtodos para seleccionar muestras de una poblacin:
1. El muestreo no aleatorio o de juicio.
2. El muestreo aleatorio o de probabilidades.
En el probabilstico, todos los elementos de la poblacin tienen la
oportunidad de ser escogidos para la muestra. El muestreo de juicio, se
emplea el conocimiento y la opinin personal para identificar a los
elementos de la poblacin que deben incluirse en la muestra.

Un muestreo de juicio se hace con los que uno considera especialistas


de la poblacin. Un ejemplo, hacer una encuesta de cmo mejor
determinada rea de estudios de la carrera, no escoger una muestra
de todos los docentes de la carrera, ms bien de los especialistas
reconocidos de esta rea. En algunos casos la muestra de juicio se
emplea como gua o muestra tentativa para como tomar una muestra
aleatoria ms adelante. Una muestra aleatoria no puede ser afectada
con muestras de juicio. Lo importantes es tener presente que una
muestra por juicio es acosta de perder un grado de importancia de
representatividad, la comodidad puede cobrar un precio muy alto.

MUESTRAS SESGADAS.
Para ejemplarizar, lo que sucede con los periodistas en los problemas
actuales. Debo consultar a determinados periodistas para mostrar una
opinin de la poblacin. Definitivamente la muestra de opinin estar
sesgada, basada en la inclinacin que tienen la mayora de periodistas.
Igual situacin se presenta si yo quiero formarme una opinin poltica,
basado en lo que externan las personas que escuchan determinado

81
programa. Normalmente quienes escuchan esa emisora, son los que
quieren or lo que esperan. Definitivamente esta sera una muestra
sesgada.

MUESTREO ALEATORIO
En una muestra aleatoria o de probabilidad conocemos las posibilidades
de que un elemento de la poblacin se incluya o no en la muestra. Como
resultado de lo anterior, es posible determinar objetivamente las
estimaciones de las caractersticas de la poblacin que resultan de una
muestra dada, es decir, se puede describir matemticamente que tan
objetivas son las estimaciones correspondientes. Comencemos a
analizar este proceso introduciendo cuatro mtodos del muestro
aleatorio.

1. Muestreo aleatorio simple.


2. Muestreo sistemtico.
3. Muestreo estratificado.
4. Muestreo de racimos.

MUESTREO ALEATORIO SIMPLE


El muestreo aleatorio simple selecciona muestras mediante mtodos
que permitan que cada posible muestra tenga una igual probabilidad de
ser seleccionado y que cada elemento de la poblacin total tenga una
oportunidad igual de ser incluido en la muestra. Un ejemplo es que
tengo que seleccionar 2 estudiantes de una poblacin finita de 4 que
tengo presente. N indica cuantos elementos hay en la poblacin.
Ciertamente, si muestreamos sin remplazar al estudiante, pronto
agotaremos el pequeo grupo de la poblacin. Si muestreamos con
remplazo (eliminamos el alumno escogido antes de escoger el
segundo), la misma persona puede ser escogida por segunda vez.

La siguiente tabla muestra la probabilidad de seleccionar dos


estudiantes de una poblacin de 4 alumnos:

Estudiantes A, B, C y D
Muestras posibles de dos personas: AB, AC, AD, BC, BD, CD
La probabilidad de extraer esta muestra de dos personas debe ser
1
P(AB) = 6
1
P(AC) = 6

82
1
P(AD) = 6 solo hay dos muestras posibles de dos
personas
1
P(BC) =
6
1
P(BD) = 6
1
P(CD) = 6

3 1
P(A) = P(AB) + P(AC) + P(AD) = =
6 2

Una poblacin infinita es aquella en la que es tericamente imposible


observar todos los elementos. Muchas poblaciones parecen ser
excesivamente grandes realmente no existe una poblacin realmente
infinita de objetivos fsicos. Despus de todo, con recursos y tiempos
ilimitados, podemos enumerar cualquier poblacin finita, incluso los
granos de arena de las costas de Honduras. En trminos prcticos,
entonces, utilizaremos el trmino poblacin infinita cuando hablemos de
una poblacin que no podra enumerarse en un periodo razonable de
tiempo. De esta manera, utilizamos el concepto terico de poblacin
infinita como una aproximacin de una poblacin finita enorme., como
se uso el concepto terico de variable continua con una aproximacin
de una variable aleatoria discreta que pudiera asumir muchos valores
estrechamente cercanos.

COMO HACER UN MUESTREO ALETORIO.


La forma ms fcil de seleccionar una muestra de manera aleatoria es
mediante el uso de nmeros aleatorios. Se pude generar programada
para resolver nmeros o mediante una tabla de nmeros aleatorios,
que, propiamente, debera llamarse Tabla de Dgitos Aleatorios.

La siguiente tabla parcial muestra un ejemplo:


158192239 206857798 826213089 837485604 463756748
6 4 2 9 8
092810558 729508857 958611165 705550876 647238293
2 9 2 7 4
411207755 344067248 188241296 684012006 093314791
6 6 3 4

Esta tabla es muy limitada pero nos permite ejemplarizar:

83
Supngase que tengo que escoger de 100 empleados 10. Como es de
2 dgitos, me remito a la tabla y voy escogiendo de la primera columna
los diez posibles candidatos, tomando de la primera columna los dos
primeros dgitos y estos seria: 15, 09, 41. Como se agot la tabla hacia
abajo, procedo a escoger los siguientes dos dgitos, estos seria: 81, 28
y 12, y continuo con los siguientes dos dgitos as: 92, 10, 07 y por ultimo
para completar los diez seria de los otros dgitos: 23.

Otra forma es por ejemplo, poner todos los nombres en un recipiente y


seleccionar los diez sacando uno por uno.

MUESTREO SISTEMATICO
En el muestreo sistemtico, los elementos son seleccionados de la
poblacin dentro de un intervalo uniforme que se mide con respecto al
tiempo, al orden o al espacio. Si tuviera la lista de alumnos de la carrera
escogera aleatoriamente el primero con el nmero 20 y as
sucesivamente 40, 60, etc.

En el muestreo sistemtico, existe un problema de introducir un error un


error en el muestreo. Por ejemplo que si los ordenamos por cdigo,
pudiera ser que lleguen al momento de la matricula los ms afines a
determinado conocimiento que deseo saber.

Pero tiene sus ventajas, este mtodo puede requerir menos tiempo y un
costo menor.

MUSTREO ESTRATIFICADO
Para utilizar el muestreo estratificado, dividimos la poblacin en grupos
relativamente homogneos, llamados estratos. Despus se utiliza
cualquiera de los dos planteamientos: o se selecciona aleatoriamente,
en cada estrato, el nmero especfico correspondiente a la proporcin
de la poblacin de cada estrato, o se extrae el mismo nmero de cada
estrato y despus ponderamos los resultados considerando la
proporcin que el estrato representa de la poblacin.

El muestreo estratificado resulta muy til, cuando la poblacin ya est


dividida en grupos de diferentes tamaos y se desea tomar en cuenta
esta decisin.

84
La ventaja de las muestras estratificadas es que, cuando se disea
adecuadamente, refleja de manera ms precisa las caractersticas de la
poblacin de la cual fue elegida, en comparacin con otro tipo de
muestras.

MUESTREO DE RACIMOS
En el muestreo de racimo dividimos la poblacin en grupos, o racimos,
y luego seleccionamos una muestra aleatoria de estos racimos,
asumiendo que cada uno de ellos es representativo de la poblacin. Por
ejemplo establecer el promedio de televisores por casa en una ciudad
grande, podemos usar un mapa de la ciudad para dividir el territorio en
manzanas y luego escoger un cierto nmero de estas (racimos) para
entrevistar a los habitantes. Un muestreo de racimos bien diseado
puede producir una muestra mas precisa a un costo considerable menor
que un muestreo aleatorio simple.

Se puede usar el mtodo estratificado cuando cada grupo tiene una


pequea variacin dentro de si mismo, pero hay una amplia variacin
de un grupo de otro.

Caso contrario se usa el muestreo de racimos, cuando hay variaciones


considerables dentro de cada grupo, pero los grupos son
considerablemente similares entre s.

BASE DE LA INFERENCIA ESTADISTICA: EL MUESTREO


ALEATORIO SIMPLE
El maestreo sistemtico, el estratificado y el de racimos intentan
aproximarse al muestreo aleatorio simple. Todos son mtodos que han
sido desarrollados por su precisin, su economa o su factibilidad.

El principio del muestreo aleatorio simple son la base de la inferencia


estadstica, es decir, del proceso de hacer inferencia acerca de
poblaciones a partir de informacin contenida en muestras.

DISEO DE EXPERIMENTOS.
En el desarrollo de la clase, en las probabilidades se habla de
experimento. Se defini que evento como uno o ms resultados posibles
de hacer algo, y un experimento como la actividad que tendra como
resultado tales eventos.

85
Planeacin de experimentos. Si queremos resultados significativos,
es necesario un buen diseo de estos experimentos, basado en lo visto
anteriormente.

Fases del diseo experimental. Solo se proporciona una idea general,


por ser un tema complejo.

Objetivo. Es el punto de partida. Si se quiere probar determinada


situacin, hay que identificar las caractersticas principales que me
garantice una determinada caracterstica de calidad (tiempo de vida,
tamao, peso, costo, et.)

Lo que se medir. La caracterstica que deseamos medir tambin se


le conoce la variable de respuesta. Si deseo medir el peso de un
producto, este sera la variable a medir. Si deseo medir la preferencia
de un producto, tambin es la variable a medir.

Tamao de la muestra. La muestra debe ser lo suficientemente grande


para validar lo que afirmamos o confirmar un supuesto. A mayor tamao
de la muestra, esta situacin disminuye la posibilidad de un error.

Conduccin del experimento. Las condiciones deben ser


controlables, se debe estar seguro de estar midiendo lo requerido,
evitando distorsiones. La preferencia de un candidato debe ser el tema
central y evitar distorsionar la situacin con preguntas dirigidas.

Anlisis de datos. Todo resultado debe estar sujeto a una hiptesis (en
el trascurso del siguiente curso) Prueba de Hiptesis.

Reaccin a las afirmaciones experimentales. Constantemente omos


afirmaciones basados en estudios realizados, como, El tabaco produce
cncer, basado no en experimentos, ms bien en estudios estadsticos
realizados. Como demos reaccionar ante tales afirmaciones. Por lo
general el consumidor debe ser un tanto escptico.

Otras opciones abiertas. Ante un grado de preocupacin sobre la


percepcin del consumidor, si fuera el caso, es un efectivo control sobre
la variable que se est midiendo, pero no garantizan realmente la
solucin de un problema, si fuera el caso. En vez de invertir recursos en
intentos de eliminar variaciones experimentales, se elige una ruta

86
completamente diferente. Lo que sigue como es posible lograr lo
anterior.

EXPERIMENTOS FACTORIALES.
Se plantea la fabricacin de dos bateras de carro, identificadas como A
y B, sometidas a tres pruebas. 1) Temperatura, 2) edad del motor, 3)
condiciones del cable de la batera. Podemos introducir el concepto de
experimentos factoriales usando esta notacin:

H = temperatura caliente N= motor nuevo G= Cable nuevo


C = temperatura fra O=motor viejo W=cable desgastado

Es natural que existan ms condiciones en cada una de las variables,


pero para efecto del ejercicio, se simplifica.

Tenemos 2 posibles temperaturas, 2 posibles estado de motores y dos


posibles condiciones de los cables. Esto significa que hay 2x2x2x2 = 16
combinaciones posibles.
Con todas estas posibles combinaciones podemos elaborar la siguiente
tabla:
Condicin Condicin
Prueba Bateras Temperatura del motor del cable
1 A H N G
2 A H N W
3 A H O G
4 A H O W
5 A C N G
6 A C N W
7 A C O G
8 A C O W
9 B H N G
10 B H N W
11 B H O G
12 B H O W
13 B C N G
14 B C N W
15 B C 0 G
16 B C 0 W
Logro de mayor eficiencia en el diseo experimental

87
Con el ejercicio anterior y con cuatro factores, se requieren 16 pruebas,
para compartir todos los niveles con todos los factores. Si se requiere
comprobar las mismas dos bateras con 5 niveles de temperatura, 4
condiciones de motor y tres mediciones de condiciones de cable de
batera, se necesitan 2x5x4x3 = 120 pruebas para un experimento
factorial completo.

Los especialistas han reducido en nmero de casos como este.


Imagnese una compaa que desea comprobar el consumo de un
dentfrico en cuatro ciudades, con cuatro tipos de empaques y cuatro
pautas de publicidad. Un anlisis factorial completo seria 4x4x4 = 64
pruebas. Si hacemos una planificacin adecuada, podemos hacerlo con
menos pruebas, 16 para ser precisos.

Usemos la notacin:
A = Ciudad 1 I = Empaque 1 1 = Pauta publicitaria 1
B = Ciudad 2 II = Empaque 2 2 = Pauta publicitaria 2
C = Ciudad 3 III = Empaque 3 3 = Pauta publicitaria 3
D = Ciudad 4 IV = Empaque 4 4 = Pauta Publicitaria 4

Con base a esto podemos hacer el siguiente diseo:

Pauta publicitaria
1 2 3 4
I C B D A
II B C A D
III D A B C
IV A D C B
Empaques Ciudades

INTRODUCCION A LAS DISTRIBUCIONES DE MUESTREO


En las clases anteriores se introdujo el concepto de utilizar datos de
muestras, para calcular estadsticos como la media y la desviacin
estndar. Hemos visto como tomar muestras de una poblacin. Las
estadsticas resultantes para cada muestra no necesariamente serian
iguales, y lo ms probable es que varen de una muestra a otra.

Si se toma una muestra de 10 mujeres de 25 aos residentes en una


ciudad de 100,000 habitantes (una poblacin infinita, de acuerdo con la
terminologa que se ha planteado. Al calcular la estatura media y la
88
desviacin estndar correspondiente en cada una de estas muestras,
veramos rpidamente que la media y la desviacin estndar de cada
muestra serian diferentes. Una distribucin de probabilidad de todas
las medias posibles de las muestras en una distribucin de las
medias de las muestras. Los especialistas en estadstica la
conocen como distribucin de muestreo de la media.

Tambin es posible obtener una distribucin de muestreo de una


proporcin. Si determinamos la fraccin de pinos infectados de
escarabajos en muestras de 100 rboles, escogidos de un bosque muy
grande. Hemos tomado un gran nmero de tales muestras de 100
elementos. Si trazamos una distribucin de probabilidades de las
proporciones posibles de rboles infectados en todas estas muestras,
obtenemos una distribucin de las proporciones de las muestras.
En estadstica, a esto se conoce como distribucin de muestreo de
proporciones (fraccin de rboles infectados)

Descripcin de las distribuciones de muestreo. Cualquier


distribucin de probabilidad (o cualquier distribucin de muestreo)
puede ser descrita parcialmente por su media y su desviacin estndar.

El siguiente cuadro muestra los ejemplos de poblaciones, muestras,


estadsticas de muestreo y distribucin de muestreo.
Estadstica de Distribucin
Poblacin Muestra muestreo de muestreo
Agua de un rio Recipientes con Nmero medio de Distribucin de
10 galones de partes de mercurio muestreo de la
agua por milln de media.
partes de agua.
Todos los equipos Grupo de 5 Estatura media. Distribucin de
profesionales de jugadores. muestreo de la
basquetbol media.
Todas las partes 50 partes Proporcin Distribucin de
producidas por un defectuosa muestreo de la
proceso de proporcin.
fabricacin.

Cada uno de los casos, la distribucin de muestreo de la media puede


ser descrita parcialmente por su media y su desviacin estndar, lo
mismo que por la distribuciones.

89
Concepto de error estndar. En vez de decir la desviacin estndar
de la distribucin de las medias de la muestra para describir una
distribucin de medias de la muestra, los especialistas en estadstica se
refieren al error estndar de la media. Igual situacin la desviacin
estndar de la distribucin de proporciones se les denomina error
estndar de la proporcin. El termino error estndar se utiliza porque
da a entender un significado especifico. Un ejemplo ayudara a explicar
el porqu de su nombre. Deseamos conocer sobre la estatura de los
estudiantes universitarios. Podemos tomar una serie de muestras y
calcular la estatura media de cada muestra. Es improbable que las
medias de las muestras sean iguales, es de esperarse que se muestre
una variabilidad entre ellas. En estadstica eso se conoce como error
de muestreo debido al azar, debido nicamente a los elementos que
decidimos escoger para las muestras.

La desviacin estndar de la distribucin de medias de las muestras


mide el grado hasta el cual es esperar que varen las medias de las
diferentes muestras, debido a este error cometido en el proceso de
muestreo.

El error estndar mide no solo el tamao del error al azar que se ha


cometido, sino tambin la probable precisin que puede obtenerse al
utilizar una estadstica de muestra para estimar un parmetro de
poblacin. Un error pequeo, constituye una buena estimacin de la
media de la poblacin, o al contrario indica que esta ampliamente
dispersa.

Un uso del error estndar.


Para poder establecer que los estudiantes de una universidad obtiene
mejores calificaciones que otras, pareciera ser una afirmacin bastante
clara, por lo tanto es una mejor propuesta de matricula.

Pero siempre que usemos pruebas, tenemos que considerar el error


estndar. Esto nos dara que tan grande tendra que ser la diferencia en
las calificaciones de una universidad para que fuera estadsticamente
significativa. Si fuera un anuncio no ofrece datos; solo afirma que sus
egresados lo hacen mejor.

DISTRIBUCION DE MUESTREO A DETALLE

90
Se ha visto una serie de conceptos, y es necesario no solo
comprenderlos conceptualmente, sino aprenderlos a manejarlos de
manera operacional.

Base conceptual para muestrear distribuciones. Las siguientes


graficas nos permiten comprender las distribuciones de muestreo

La grafica nuestra los Conceptos de distribucin de poblacin,


distribuciones de muestra y distribucin de muestreo.
a)

La distribucin de poblacin
Esta es la distribucin de las horas de operacin de todos los filtos.
Tiene:
u = la media de esta distribucin
= la desviacin estndar de esta distribucin

u
Si de alguna manera pudiramos tomar todas las muestras
Posibles de un tamao dado de esta distribucin de poblacin,
Dichas muestras estaran representadas grficamente por
Por estas cuatro muestras que vienen a continuacin. Auque
Solo hemos mostrado cuatro de tales muestras, en realidad
Habra un numero grande de ellas.

b)

Ahora bien, si pudiramos tomar las medias de todas las distribuciones


de muestra y producir una distribucin de estas medias, se veran as:
c)

91
Texto Texto Texto Texto Texto Texto

Ttulo


La distribucin de muestreo de la media:
Esta distribucin es la distribucin de todas las medias de muestra y
tiene:

= media de la distribucin de muestreo de las medias conocida como


mu X barra subndice

= error estndar de la media (desviacin estndar de la distribucin


de muestreo de la media) conocida como sigma X barra subndice

Base Conceptual para muestrear distribuciones


La figura anterior fue dividida en 3 secciones a) b) y c). La figura a)
. ()
una desviacin estndar (sigma).

Supongamos que tomamos 10 muestras. Para cada muestra


tendramos que calcular la media y la desviacin estndar para cada
una de las muestras (grafica b). Cada muestra tendra su propia media
( y su propia desviacin estndar (s). Ninguna de las medias de la
muestra individual seria la misma que la media de la poblacin, pero
tenderan a estar cerca de la media de la poblacin, pero raramente
quedaran en ese valor.
La grafica c) ilustra la distribucin de todas las muestras, conocida como
distribucin de muestreo de la media. Esta tendra su propia media y
su propia desviacin o error estndar

92
La grafica c) es un ejemplo de este tipo. Basado en lo anterior los
especialistas han diseado frmulas que permiten estimar las
caractersticas de estas distribuciones tericas del muestreo, haciendo
innecesarias la recoleccin de grandes nmeros de muestras. Los
responsables de la toma de decisiones, solo requieren una muestra de
la poblacin, calculan la estadstica para esta muestra y de esta infieren
algo sobre los parmetros para toda la poblacin.

Muestreo de poblaciones normales


Se extrae una muestra de una poblacin normalmente distribuida con
una media de 100 y una desviacin estndar de 25, y comenzamos a
extraer muestras de cinco elementos, y calculamos sus medias. La
primera media podra ser 95, la segunda 105, la tercera 101. Igual
oportunidad hay de que la media de la muestra este por encima o por
debajo de la media poblacional (100). Debido a que se est
promediando 5 elementos para obtener cada media, se promediaran
hacia abajo valores muy grandes de la muestra y hacia arriba valores
muy pequeos.

Si se aumenta el tamao de la muestra de 5 a 20. Esto no cambiara la


desviacin estndar de los elementos de la poblacin original, pero con
una muestra de 20, se incrementa el efecto de promediar en cada
muestra y podra esperarse, incluso, una dispersin menor entre las
cuentas de ahorro individuales estn normalmente distribuidas con una
media de L 2,000 y una desviacin estndar de L 600. Si el banco toma
una muestra aleatoria de 100 cuentas, Cul es la probabilidad de que
la media de la muestra caiga entre L 1,900 y L 2,050?

Primero hay que calcular el error estndar de la media. Utilizaremos la


ecuacin para el error estndar de la media pensando que la poblacin
es infinita (posteriormente se ver sobre poblaciones finitas)

Error estndar de la media =


Donde:
= desviacin estndar de la poblacin
n = tamao de la muestra.

93
600
= = L 60 error estndar de la media
100
Luego utilizamos la tabla no. 1 de los valores de z y la ecuacin de
clculo de z y podremos calcular la probabilidad de que la media de la
muestra se encuentre entre L 1,900 y L 2,050.
1,900 2,000
z(1,900) = = = 1.67 desviacin estndar de la
60
media de una distribucin de probabilidad normal estndar.
2,0502,000
z(2,050) = = 0.83 desviacin estndar de la media de
60
una distribucin de probabilidad normal estndar.

En la Tabla 1, los valores serian 0.425 y o.2967 y su suma seria 0.7492

Muestreo con poblaciones no normales


Como tratar poblaciones que no estn distribuidas normalmente

Teorema del lmite central


La media de la distribucin de muestreo de la media ser igual a la
media de la poblacin, sin importar el tamao de la muestra, incluso si
la poblacin no es normal. Al incrementar el tamao de la muestra, la
distribucin de la media se acercara a la normalidad, sin importar La
forma de la distribucin de la poblacin.

La relacin entre la forma de la distirbucion de la poblacin y la forma


de la distribucin de muestreo se denomina teorema del limie central.
Es el mas importante de toda la inferencia estadstica, pues asegura
que la distribucin de muestreo de la media se aproxima a la normalidad
al incrementarse el tamao de la muestra. Una muestra no
necesariamente debe ser muy grande para que el muestreo se acerque
a lo normal. Lo importante es que se puede hacer inferencia con
respecto a los parmetros de poblacin, sin saber sobre la forma de la
distribucin de frecuencia de esa poblacin ms que lo que podemos
obtener de la muestra.

Una distribucin tiene una media de L 19,000 y una desviacin estndar


de L 2,000. Si se extrae una muestra aleatoria de 30 cajeros Cul es
la probabilidad de que sus ganancias promedien L 19,750

94
Primero hay que calcular el error estndar de la media de la desviacin
estndar de la poblacin, as:
2,000
= = = L 365.16 error estndar de la media
30

Para utilizar la tabla 1 debemos encontrar el valor de z


19,75019,000
z = = 2.05 desviaciones estndar de la media de una
365.16
distribucin normal estndar de probabilidad.

Las areas serian 0.4798 y como la mitad del area es 0.5, podemos
calcular la probabilidad as:
o.5 0.4798 = 0.0202 es la probabilidad que el ingreso promedio sea
mayor a L 19,500.

Una consideracin operacional en el muestreo: la relacin entre el


tamao de la muestra y el error estndar
Si la dispersin disminuye, los valores tomados por la media de la
muestra tienden a agruparse ms cercanamente alrededor se .

Cuando n= 10
100
= 31.63 error estndar de la media
10

Y cuando n = 100
100
= = 10 error estndar de la media
100

Se puede ver que a medida que aumenta el tamao de la muestra el


error estndar tiende a disminuir.

Ahora si la poblacin es finita la frmula es:

20
= x
1

El nuevo trmino que aparece al lado derecho de la ecuacin se conoce


como multiplicador de poblacin finita.
95
Estamos interesados en una poblacin de 20 compaas textiles del
mismo tamao, todas estas fbricas experimentan una produccin
excesiva de trabajo. Nuestro estndar indica que la desviacin estndar
de la distribucin de la produccin anual es igual a 75 empleados. Si
muestreamos 5 compaas textiles, sin remplazo, y deseamos calcular
el error estndar de la media, as:

75 205
= x = 29.8 error estndar de la media de la poblacin finita.
5 201

ANALISIS DE ARBOL DE DECISIONES


Es el modelo grafico de un proceso de decisin. Podemos introducir
probabilidades al anlisis de decisiones complejas que involucran
muchas opciones y condiciones futuras que no se conocen, pero que
pueden especificarse en un conjunto de probabilidades que no se
conocen.

Ejemplo:
Se recibe una oferta de una cadena de hoteles para operar en invierno,
garantizando una ganancia de L 45,000; por otro lado, ha estado
considerando la renta de equipo de fabricacin de nieve para la
temporada. Si renta el equipo, la estacin podra operar a tiempo
completo, sin importar la cantidad de nieve que caiga. Si decide usar
nieve fabricada para completar las nevadas naturales, su ganancia de
la temporada ser L 120,000, menos el costo de rentar y operar el
equipo de fabricacin de nieve. El costo de operacin ser de L 10,000
si cae ms de 40 pulgadas de nieve natural, L 50,000 si cae entre 20 y
40 pulgadas y L 90,000 si cae menos de 20 pulgadas
Distribucin de nevadas y ganancias
Cantidad de nieve Ganancias Probabilidad ocurrencia
Ms de 40 pulgadas 120,000 0.4
De 20 a 40 pulgadas 40,000 0.2
Menos de 20 pulgadas -40,000 0.4

Dejar que la cadena opere


L 45,000

96
0.4 >40 de nieve
L 120,000

L 40,000
Opere ella 0.2 20-40 de nieve
L 40,000
Sin fabricar nieve
58,000
0.4 <20 de nieve
L -40,000

L 98,000
L 58,000

Operar ella L 58,000

Con fabricacin de nieve

L 18,000
El administrador tiene 3 alternativas:
a) Darla en arrendamiento y tendra una ganancia de L 45,000
b) Operar ella sin fabricacin de nieve, sus posibles resultados
estn dados en la tabla.
c) Operar ella con fabricacin de nieve.

Tenemos que e todas las alternativas ambas alternativas as:


1. Si da en administracin su ganancia seria de L 45,000
2. Si ella opera la estacin y no usa equipo de fabricacin de
nieve, su ganancia esperada seria
Nivel de nieve Ganancia Probabilidad Ganancia esperadas
Ms de 40 120,000 0.4 48,000
De 20 a 40 40,000 0.20 8,000
Menos de 20 -40,000 0.40 -16,000
Ganancias esperadas 40,000

3. En el caso de nieve con ms de 40 pulgadas:


(Utilidad esperada costo renta costo operacin) x probabilidad
(120,000 12,000 10,000) 0.4 = L 39,200

En el caso de 20 a 40 pulgadas
(120,000 12,000 50,000) x 0.2 = L 11,600

En el caso de menos de 20 pulgadas:


(120,000 12,000 90,000) x 0.4 = L 7,200

97
Resumen:
Mas de 40 L 39,200
De 20 a 40 11,600
Menos de 20 7,200
Total ganancia esperada 58,000

ESTIMACIONES
Constantemente estamos haciendo estimaciones, quien ganara las elecciones,
podre cursar la asignatura, etc.

En el mundo de los negocios, es igual, necesitamos hacer estimaciones rpidas, y


pueden afectar la organizacin de manera tan seria.

Al final se cuenta con la esperanza de que las estimaciones, se hacer que se


acerque lo ms posible a la realidad. Es la toma de decisiones sobre cierto grado
de certidumbre.

Lo que se busca es la racionalizacin de las decisiones sin contar con la informacin


pertinente completa y con un alto grado de incertidumbre sobre el futuro que nos
depara.

La teora de las probabilidades que hemos visto, son la base de la inferencia


estadstica, que nos permite manejar la incertidumbre en la toma de decisiones.

La carrera necesita estimar el nmero de matriculados en las diferentes asignaturas


para poder estimar el nmero de horas profesor que necesita.

Tipos de estimaciones
En trminos generales, uno puede realizar dos tipos de estimaciones, la puntual y
la por intervalos.

La puntual es solo un nmero que se utiliza para estimar un parmetro de poblacin


desconocida. Si mediante un anlisis de una muestra representativa, se logra
establecer que el promedio de personas en una familia son 5, podemos afirmar que
las familias hondureas tiene en promedio 5 miembros. Es un nico nmero, por lo
tanto es una estimacin puntual.

Generalmente una estimacin puntual es a menudo insuficiente, basado en que el


resultado es correcto o incorrecto, y no se sabe que tan correcto es la afirmacin o
que tan confiables es.

Una estimacin por intervalos es rango de valores que se utiliza para estimar un
parmetro de la poblacin. Un ejemplo tpico, es cuando un estudiante dice que la

98
nota que estima obtener esta entre un 60 y 70%. Es muy probable que dentro de
eses rango este acertado.

Estimador y estimaciones
Cualquier estadstico de la muestra que se utilice para estimar un parmetro de la
poblacin se conoce como estimador, es decir un estimador es un estadstico de vla
muestra utilizado para estimar un parmetro poblacional. La media de la muestra
puede ser un estimador se la media de la poblacin , y la proporcin de la muestra
se pude utilizar como un estimador de la proporcin de la poblacin. Tambien es
posible aplicar el rango de la poblacin.
El siguiente ejemplo ilustra lo anterior.
Poblacin en que Parmetro de Estadstico de la Estimacin que
estamos poblacin que muestra que realizamos
interesados deseamos estimar utilizaremos como
estimador
Alumnos de la Promedio de los Promedio de 56% de
carrera de que aprueban alumnos que aprobacin por
administracin aprueban por ao.
periodo
Poblacin que Proporcin de Proporcin de la 64% de los
estudian en la U mujeres en la muestra de 500 estudiantes son
muestra mujeres

Criterios para seleccionar un buen estimador


1. Insesgado. Lo que se busca es que la distribucin muestral de las medias de las
muestras tomadas en la misma poblacin es igual a la media de la poblacin,
misma. Esto es factible si, en promedio, tiende a tomar valores que estn arriba del
parmetro de la poblacin que se est estimando con la misma frecuencia y la
misma extensin con las que tiende a asumir valores abajo del parmetro
poblacional que se est estimando.

2. Eficiencia. Se refiere al tamao del error estndar del estadstico. Si se comparan


dos estadsticos de una muestra del mismo tamao y tratamos de decir cul de ellas
es un estimador ms eficiente. Se debe escoger el estadstico que tenga menor
error estndar o menor desviacin estndar de la distribucin muestral.

3. Consistencia. Si al aumentar el tamao de la muestra, se tiene casi la certeza de


que el valor del estadstico, se aproxima bastante al valor del parmetro poblacional.
Se vuelve ms confiable al tener mayor tamao de muestra ms grandes. Si es
consistente, se perder el tiempo.

4. Suficiencia. Si se utiliza tanta informacin de la muestra que ningn otro


estimador puede extraer informacin adicional acerca del parmetro de poblacin
que se est estimando.

ESTIMACIONES PUNTUALES

99
La media de la muestra es el mejor estimador de la media de la poblacin. Es
insesgada, consistente, eficiente y siempre y cuando el tamao de la muestra sea
lo suficientemente grande, su distribucin muestral puede ser aproximada por medio
de la distribucin normal.

Si se conoce la distribucin muestral de podemos obtener cualquier conclusin a


partir de ella.

Un ejemplo prctico es la preferencia de un grupo de personas (muestra) sobre la


preferencia sobre x perfume, podemos afirmar que toda la poblacin tiene la misma
preferencia sobre dicho perfume.

La frmula para la estimacin puntual es la que vimos en el contenido del primer


parcial as:

Al usar la media de la muestra, como un estimador, la estimacin puntual de la


media de la poblacin ser la misma.

Estimacin puntual de la varianza y la desviacin estndar de la poblacin


Tambin se vio en la primera unidad del programa y como recordatorio, la frmula
es:


(
=

Estimacin puntual de la proporcin de la poblacin


La proporcin de unidades de una poblacin dada que tiene una caracterstica
particular se denota por p. Si conocemos la proporcin de unidades de una muestra
que tiene las mismas caractersticas (denotadas por podemos utilizar este como
un estimador de p y que tiene todas las caractersticas deseables como insesgada,
consistente, eficiente y suficiente.

Si a travs de la muestra estimamos que el 0.08 de la muestra usa una marca


especifica de perfume, podemos estimar que el mismo porcentaje de la poblacin
usa esa marca.

Un ejemplo simplifica la compresin de este tema.

La comisin de instalaciones deportivas, estudia la posibilidad de ampliar la


capacidad del Estadio Nacional, pero requiere conocer el promedio de personas
que asisten al mismo, as como la variabilidad de este nmero. Los datos que se
muestran abajo son las asistencias en miles a 9 eventos, que fueron seleccionados
al azar. Calcule la media puntual y la varianza de la poblacin de la que se tom la
muestra. La capacidad actual es de 30,000 personas.

100
8.8 14.0 21.3 7.9 12.5 20.6 16.3 14.1 13.0

2 = 8.82 +14.02 +21.32 + 7.92 +12.52 +20.62 +16.32 +14.12 +13.02 = 2,003.65

x = (8.8+14+21.3+7.9+12.5+20.6+16.3+14.1+13 = 128.5

N=9
128.5
= x/n = = 14,278 personas
9

1 2,003.659(14.278)2
2 = ( 2 - n 2 ) = = 21,119 personas
1 8

No hay necesidad de ampliar las instalaciones.

Estimaciones de intervalo: Conceptos bsicos.


Si decidimos tomar una muestra es conocer alguna caracterstica de la poblacin.
La estimacin puntual que vimos es uno de los mtodos, pero tambin existe la
estimacin por intervalos. Esto significa que podemos describir un rango de valores
dentro del cual es posible que este el parmetro de la poblacin.

El jefe de la carrera de administracin, desea estimar los aos promedio de


graduacin de los alumnos de la carrera. Se seleccion una muestra aleatoria de
200 graduados y de los archivos se obtuvo el promedio de aos que resulto de 8
aos.

Podemos utilizar la estimacin puntual. Pero existe la incertidumbre de esta


estimacin, es decir, una afirmacin sobre el intervalo dentro del cual es probable
que este la media de la poblacin desconocida. Para proporcionar tal afirmacin,
necesitamos encontrar el error estndar de la media.

Si seleccionamos y graficamos un nmero grande de medias de muestra de una


poblacin, la distribucin de estas medias se aproxima a una curva normal.
Supongamos que el tamao de nuestra muestra es suficientemente grande para
poder explicar el teorema central del lmite.

Para medir la dispersin de nuestras medias mustrales, podemos utilizar la


siguiente frmula:

1.5
= = = 0.071
200

Supongamos que la desviacin estndar de la poblacin es de 1.5 aos

101
Ahora podemos informar al jefe de la carrera que la permanencia de un estudiante
estar entre = 8 0.071 = LS = 8.071 aos y LI = 7.929 aos

Probabilidad de que el verdadero paramento poblacional caiga dentro de la


estimacin del intervalo.
Como lo vimos anteriormente, que porciones especficas bajo la curva normal estn
localizadas entre ms o menos cierto nmero de desviaciones estndar a partir de
la media.

La probabilidad es de 0.955 que la media de la muestra de los aos de permanencia


de los 200 graduados estn entre 2 errores estndar de la media de la poblacin.
Tericamente si seleccionamos 1,000 muestras al azar y luego construimos un
intervalo de 2 errores estndar alrededor de la media de cada muestrea, cerca de
955 de estos intervalos incluirn a la media de la poblacin

Nuestra mejor estimacin sobre la permanencia de los alumnos de la carrera, con


los siguientes niveles de confianza:

Con un 68% de nivel de confianza sern 8 1(0.071) = LS= 8.071 y LI = 7.929 aos
Con un 95.5% de nivel de confianza ser 82(.071) = LS= 8.142 LI = 7.858 aos
Con un 99.7 de nivel de confianza ser 83(0.71) = LS = 8.213 y 7.787 aos

Ejemplo:
Un estudiante, est interesado en comprar un auto usado. Selecciona 125 anuncios
al azar, y establece que el precio promedio de esta muestra es de $ 3,250. El conoce
que la desviacin estndar de los precios es de $ 615.
a) Establezca una estimacin por intervalos para el precio promedio de un automvil
de manera que el estudiante tenga una seguridad del 68.3% de que la media de la
poblacin est dentro de este intervalo.
b) Establezca una estimacin de intervalo para el precio promedio de un auto de
modo que el estudiante tenga el 95.5% de certeza que la media de la poblacin est
dentro de este intervalo.

615
= 615 n= 125 = 3,250 = = = 55.01
125
a) = 3,250 55.01 = LS 3,194.99 y LI 3,305.01 A UNA DESVIACION
ESTANDAR
b) 2 = 3,250 2(55.01) = LS = 3,139.98 y LI 3,360.02

ESTIMACION DE INTERVALO E INTERVALOS DE CONFIANZA


Cuando utilizamos estimaciones de intervalo no nos limitamos a 1, 2, 3 errores
estndar. La tabla 1 1.64 errores estndar, por ejemplo, incluyen
aproximadamente el 90% del rea bajo la curva y, as, 0.4495 del rea de ambos
lados de la media es una distribucin normal, y as sucesivamente.

102
En estadstica, la probabilidad que asociamos con un una estimacin de intervalo
se conoce como nivel de confianza. Esta probabilidad indica que tanta confianza
tenemos de que la estimacin de intervalo incluya al parmetro poblacional. Una
probabilidad ms elevada implica mayor confianza porque el rango se ampla.

Los ms frecuentemente usados son 90, 95 y 99%

Si tenemos un nivel de confianza de que la media de la poblacin de ingreses de


personas que viven en Tegucigalpa estn entre 8,000 24,000, entonces el rango es
de 8,000 24,000. Este es nuestro intervalo de confianza. Por lo general lo
expresamos en trminos de errores estndar, ms que con valores numricos.

Relacin entre nivel de confianza e intervalo de confianza


El usar un alto nivel de confianza produce intervalos de confianza grandes, dando
estimaciones bastante imprecisas

Uso del muestreo y estimacin de intervalos de confianza


Hemos hablado de un gran nmero de medias muestrales de una poblacin. En la
prctica, a menudo es difcil o costoso tomar ms de una muestra de una poblacin.
Con base a una sola muestra estimamos el parmetro poblacional. Debemos tener
cuidado al interpretar los resultados.

CALCULO DE ESTIMACIONES DE INTERVALOS DE LA MEDIA A PARTIR DE


MUESTRAS GRANDES
Un fabricante desea estimar la vida til de un repuesto en condiciones normales. El
fabricante ha establecido que la desviacin estndar de la vida til es de 6 meses.
Supongamos que seleccionamos una muestra aleatoria de 100 repuestos. Y
obtuvimos los siguientes resultados:

N= 100 Tamao de la muestra


= 21 meses Media de la muestra
= 6 meses Desviacin estndar de la poblacin
Se pide una estimacin de intervalo con un nivel de confianza de 95% y la muestra
mayor a 30, de manera que el teorema central del limite nos permite usar la
distribucin normal

6
= = = 0.6 meses
100

Como el nivel de confianza es 95%, las tablas muestran solo el 50% de la


distribucin, la probabilidad esta en 95/2 = 47.5% de probabilidad. Buscando en la
tabla esta probabilidad est a 1.96 desviaciones estndar entonces:

+ 1.96 = 21 + 1.96(0.6) = 22.18 meses LIMITE SUPERIOR DE


CONFIANZA
- 1.96 = 21 - 1.96(0.6) = 19.82 meses LIMITE INFERIR DE CONFIANZA

103
Cuando no se conoce la desviacin estndar de la poblacin.
Una estimacin ms compleja, por no conocer la desviacin estndar de la
poblacin

Se nos pide estimar el ingreso medio anual de 700 familias que viven en
determinado lugar. Se extrae una muestra de 50 persona escogidas al azar.

N = 50 tamao de la muestra
= L 11,800
S = L 950 desviacin estndar de la muestra
Parte del problema es que desconocemos la desviacin estndar de la poblacin.
Es necesario partir de la desviacin estndar de la muestra para estimar la
desviacin estndar de la poblacin as:

( )2
= s =
1

El valor de L 950 es nuestra estimacin de la desviacin estndar de la poblacin.


El smbolo para representarla es
(sigma gorro)

Ahora podemos estimare el error estndar de la media. Como tenemos un tamao


de poblacin finita y la muestra constituye ms del 5% de la poblacin, utilizaremos
la frmula para derivar el error estndar de la media de poblaciones finitas:


950 70050
= X = X = L 129.57
1 50 7001

Como se pide un nivel de confianza de 90%, se busca en la tabla 90/2 = 0.45 y las
desviaciones estndar es 1.64 errores estndar

As podemos calcular los rangos as:

+ 1.64 = 11,800 + 1.64(129.57) = L 12,012.50 LIMITE DE CONFIANZA


SUPERIOR
- 1.64 = 11,800 - 1.64(129.57) = L 11,587.50 LIMITE DE CONFIANZA
INFERIR

CALCULO DE ESTIMACIONES DE INTERVALO DE LA PROPORCION A


PARTIR DE MUESTRAS GRANDES
Normalmente se utilizan las muestras para estimar la proporcin de ocurrencia de
un evento en una poblacin. Se puede estimar mediante un procedimiento de
muestreo, el ndice de desempleo, tambin, las dos frmulas para derivar la media
y la desviacin estndar de la distribucin Binomial.

104
Como vimos la Binomial trabaja con datos discretos, no continuos y las frmulas
que utilizamos para encontrar la media y la desviacin estndar de la misma son:

= np

Donde:
N= nmero de ensayos o intentos
P= probabilidad de xito
Q= probabilidad de falla (1-p)

Tericamente, la distribucin Binomial es la correcta a utilizar en la distribucin de


intervalos de confianza para estimar una proporcin de la poblacin.

Debido a que el clculo Binomial es tedioso, el clculo de intervalos es complicado.


Si tomamos en cuenta que a medida que la muestra aumenta, la distribucin
Binomial se aproxima a una distribucin normal apropiada, que podemos utilizar
para aproximar la distribucin muestral. Los tcnicos recomiendan que en la
estimacin, n sea lo suficientemente grande para que tanto np como nq sean al
menos 5 cuando se utiliza la distribucin normal, como sustituta de la Binomial.

La proporcin de xito de una muestra podemos expresarla como . Debemos


modificar la frmula para derivar la media de la distribucin de muestreo de la
proporcin de xito. En palabras = np muestra que la media de la distribucin
Binomial es igual al producto del numero de 3ensayos, n, por la probabilidad de
obtener un xito; esto es, np es igual al numero medio de xitos. Para cambiar este
nmero de xitos a la proporcin de xitos, dividimos np entre n y obtenemos un
solo valor de p. La media, que se encuentra al lado izquierdo de la ecuacin se
convierte en , es decir, en la media de la distribucin de muestreo de la proporcin
de xito.

= p

Igual situacin podemos derivar la frmula de la desviacin estndar que podemos


aplicar en la estimacin de intervalos as:

Si hacemos una investigacin de que los alumnos vengan el viernes a recibir clases,
Tomando una pequea muestra aleatoria de 75 alumnos y encontramos que el 0.4
de ellos estn interesados en recibir clases los viernes. Los resultados son:
n = 75 Tamao de la muestra
= 0.4 Proporcin de los que vendran los viernes
= 0.6 Proporcin de los que no vendrn

105
Utilizando un intervalo de confianza de 99%, procedemos a encontrar el error
estndar de la proporcin as:


(0.4)(0.6)
= = = 0.057 error estndar estimado de la proporcin
75
Con un nivel de confianza de 99%, usando la tabla buscamos la probabilidad 99/2
es igual a 0.495 y localizamos este nmero en la tabla y podemos establecer que
representa 2.58 desviaciones estndar de la media.

As podemos encontrar los intervalos de confianza de este problema:

+ 2.58 = 0.4 + 2.58(0.057) = 0.547 LIMITE SUPERIOR DE CONFIANZA


- 2.58 = 0.4 - 2.58(0.057) = 0.253 LIMITE INFERIOR DE CONFIANZA

Podemos decir que con un nivel de confianza de 99% creemos que la proporcin
de la poblacin estudiantil que desea clases el viernes esta entre 0.253 y 0.547.

ESTIMACION DE INTERVALOS CON LA DISTRIBUCION T


Cuando de trabaja con un tamao de muestra menor de 30, en este caso la
distribucin normal no es la adecuada.

Para estos casos existe la distribucin T, pero no solo se requiere que el tamao de
muestra sea 30 o menos, adems se requiere que la desviacin estndar se
desconozca. Adems de lo anterior debemos suponer que la poblacin es normal o
aproximadamente normal.

Grados de Libertad
Se afirma que existe una distribucin t diferente para cada tamao de la muestra,
es decir existe una distribucin t distinta para cada uno de los grados de libertad

Lo que estamos tratando de decir que los grados de libertad es el nmero de valores
que podemos escoger libremente.

Si consideramos que a+b, tiene una media de 18, tanto a y b pueden asumir
cualquier valor, siempre y cuando sumen 36/2 = 18

Si sabemos que a = 10, podemos calcular el valor de b as:


10+
= 18 por lo tanto b = 26
2

Cuando hay dos elementos en una muestra y conocemos su media muestral,


entonces somos libres de especificar solo uno de los elementos, para que el otro
este supeditado que al sumarlos y dividirlos entre 2 sea igual a la media muestral.
En lenguaje estadstico podemos definir que tenemos 1 grado de libertad.

106
Si tenemos 7 elementos en la muestra y sabemos que la media de ellos es 16.

En este caso tenemos la libertad de asignar valores a 7-1 = 6, porque el 7mo


elemento depender de los valores que asuma los otros 6, de tal manera que al
sumarlos y dividirlos entre 7, el resultado ser 16.

Podemos definir que los grados de libertad sern gl = n -1

Uso de la tabla de distribucin t


Es la tabla No. 2, difiere de su construccin, difiere en su construccin que la tabla
z. La tabla t es ms compacta y muestra valores de t solo para algunos porcentajes
(10%, 5%, 2% y 1%). Debido a que hay una distribucin t para cada uno de los
grados de libertad, esta sera muy grande y solo comprende los que ms se utilizan.

La segunda diferencia de la tabla t no se concentra en la probabilidad de que el


parmetro de poblacin que se est estimando se encuentre dentro del intervalo de
confianza. En lugar de ello, mide la probabilidad de que el parmetro de poblacin
que estamos estimando no est dentro de nuestro intervalo de confianza(es decir la
probabilidad que este fuera).

Supongamos que hacemos una estimacin con un nivel de confianza de 90%, para
buscar en la tabla seria 100-90 = 10% que es la probabilidad de error, denotado con
el smbolo.

La tercera situacin es que se debe especificar los grados de libertad que se


manejan.

La UNAH desea estimar los intervalos de consumo de energa y quiere estar con un
95% seguro que el consumo de energa media, se encuentra dentro de dicho
intervalo. Si utilizamos la distribucin t, porque el tamao de la muestra es menor
que 30, no se conoce la desviacin estndar de la poblacin y se considera que la
poblacin es aproximadamente normal. Los datos son:

n= 10 meses Tamao de la muestra


gl = 10-1 = 9 Grados de libertad
= 11,400 Kw Media de la muestra
s = 700 Kw Desviacin estndar de la muestra

= s = 700 KW

Estimacin de la desviacin estndar de la media de la poblacin infinita


700
= = = 221.38 KW error estndar estimado de la media de una poblacin
10
infinita.

107
Buscando en la tabla 2 en la columna de 0.05 (100%-95%) y en el regln de 9 grados
de libertad encontramos que el valor t es 2.262.

Podemos establecer los lmites de confianza as:

+ 2.262 = 11,400 + 2.262(221.38) = 11,901 KW


- 2.262 = 11,400 2.262(221.38) = 10,899 KW

Se puede afirmar un un nivel de confianza de 95% que el consumo medio mensual


de energa esta entre 11,901 y 10,899 KW

TAMAO DE LA MUESTRA EN ESTIMACION


En todos los ejercicios nos hemos referido al tamao de la muestra Qu tan grande
debe ser la muestra? Ni tan pequea ni tan grande en funcin de obtener un
estimado confiable si es muy pequea y muy grande por su costo.

Tamao de la muestra para estimar una media


La UNAH est estimando el ingreso anual de los estudiantes de ltimo ao. Se sabe
por experiencia, que la desviacin estndar de los ingresos anuales de la poblacin
completa (1,000 estudiantes) es alrededor de L 1,500. Que tan grande debe ser
la muestra que debe tomar la universidad con el fin de estimar el ingreso anual de
estudiantes graduados en ao pasado, dentro de ms o menos L 500 y con un nivel
de confianza de 95%.

Si z = 500 entonces z = 1.96

Entonces 1.96 =500


500
Y =1.96 = L 255 error estndar de la poblacin

Si recordamos

= podemos sustituir los valores conocidos

1,500
255 =

Por lo tanto n = 34.6 alumnos

Por lo tanto el tamao de la muestra debe ser 36 alumnos

Tamao de la muestra para estimar la proporcin


Son muy similares a los empleados para estimar una media de la poblacin.

Se desea cambiar el modelo de evaluacin. Nos gustara tener un tamao de


muestra que nos permita tener una certeza del 90% de que estamos estimando la

108
proporcin verdadera de la poblacin de 40,000 estudiantes a favor del nuevo
sistema de evaluacin, mas menos 0.02

El primer paso es buscar en la Tabla el valor de z correspondiente al nivel de


confianza de 90%. Este valor es de 1.64 errores estndar a partir de la media.
Queremos que nuestra estimacin este dentro de 0.02

Si z = 0.02

Y z = 1.64

Entonces 1.64 = 0.02

Procedemos a sustituir el valor que se tiene para


1.64 = 0.02

Encontramos que pq = 0.0001488



Entonces n= 0.00014884

Necesitamos encontrar el valor de p y q

Si p = 0.50 y q= 0.5

Podemos encontrar n

(0.5)(0.5)
N= 0.00014884 = 1,680 estudiantes Tamao de la muestra

Generalmente cuando no se conoce la proporcin lo ms conservador es 0.5 para


cada uno.

El tamao de la muestra puede variar dependiendo del valor que asuma p

Ejemplo de que p = 0.2

Entonces el tamao de la muestra ser:

(0.2)(0.8)
= 1075 alumnos
0.00014884

Cada vez que p sea menor o mayor de 0.5 el tamao de la muestra ser menor. Por
lo tanto usar 0.5 es donde se obtiene el tamao de muestra mayor.

109
RESUMEN DE FORMULAS
BINOMIAL
!
Probabilidad de r xitos en n intentos
!()!
Donde:
r = nmero de xitos deseados
n = nmero de intentos realizados
p = probabilidad de tener xito
q = probabilidad de fallar (1-p)

MEDIA DE UNA DISTRIBUCION BINOMIAL


= np

DESVIACION DE UNA DISTRIBUCION BINOMIAL


=

PROBABILIDAD QUE UNA VARIABLE ALEATORIA DEISCRETA SE PRESENTE EN


UNA DISTRIBUCION POISSON

P(X) =
!

= La probabilidad de tener x ocurrencias

e = 2.71828

PROBABILIDAD DE POISSON COMO UNA APROXIMACION A LA


DISTRIBUCION BINOMIAL
()
P(x) =
!

110
ENCONTRAR UNA PROBABILIDAD EN LA TABLA 1

z=

Donde:

X = valor de la variable aleatoria en la cual estamos interesados

u = media de la distribucin de esta variable aleatoria

= desviacin estndar de esta distribucin

Z = nmero de desviaciones estndar desde x hasta la media de la


distribucin

RESUMEN DE FORMULAS PARA LIMITES DE CONFIANZA EN LA ESTIMACION


DE LA MEDIA Y LA PROPORCION

Estimacin de u (La media de la poblacin)

Cuando la (desviacin estndar de la poblacin se conoce)

Si la poblacin es finita y n/N > 0.05 la frmula que se aplica es:


Limite Superior = + z X
1


Lmite Inferior = - z X
1

Si la poblacin es infinita o n> 0.05



Limite Superior = + z


Limite Superior = - z

Cuando (la desviacin estndar de la poblacin) se desconoce

Cuando n (tamao de la muestra) es mayor que 30

Si la poblacin es finita

111


Limite Superior = + z X
1



Lmite Inferior = - z X
1

Si es infinita


Limite Superior = + z



Lmite Inferior = - z

Cuando n (tamao de la muestra) es 30 o menos y la poblacin es normal o


aproximadamente normal.


Lmite Superior = + t



Lmite Inferior = - t

Los gl (grados de libertad es n-1

Estimacin de p (la proporcin de la poblacin) cuando n (el tamao de la


muestra) es mayor de 30

Solo se aplica a poblaciones infinitas

Limite Superior = + z

Lmite Inferior = - z

112

Vous aimerez peut-être aussi