Académique Documents
Professionnel Documents
Culture Documents
ndice general
1. Estadistica Descriptiva e Inferencial 1.1. Introduccin . . . . . . . . . . . . . . . . 1.2. Estadstica . . . . . . . . . . . . . . . . 1.2.1. Estadstica y tipos de estadsticas 1.2.2. Estadstica Descriptiva . . . . . . 1.2.3. Estadstica Inferencial . . . . . . 1.2.4. Poblacin y muestra . . . . . . . 1.3. Variables . . . . . . . . . . . . . . . . . 1.3.1. Tipos de variables . . . . . . . . 1.3.2. Escalas de medicin . . . . . . . 2. Distribuciones de Frecuencia 2.1. Estadstica descriptiva . . . . . 2.2. Construccin . . . . . . . . . 2.2.1. Representacin Grca 2.3. Problemas . . . . . . . . . . . 3 3 3 3 4 4 4 4 5 6 7 7 7 9 10 11 11 11 12 12 12 12 13 13 14 14 14 14 15 16 16 16 16 19
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3. Medidas de tendencia central 3.1. La Media . . . . . . . . . . . . . . . . . . 3.1.1. La Media Geomtrica . . . . . . . 3.1.2. La Media Aritmtica . . . . . . . . 3.1.3. Propiedades de la media aritmtica . 3.1.4. Desventajas de la media aritmtica . 3.1.5. La media para datos no agrupados . 3.1.6. La media de la poblacin . . . . . . 3.2. La mediana . . . . . . . . . . . . . . . . . 3.2.1. Propiedades de la mediana . . . . . 3.3. La moda . . . . . . . . . . . . . . . . . . . 3.3.1. Propiedades de la moda . . . . . . 3.3.2. Desventajas de la moda . . . . . . . 3.4. Problemas . . . . . . . . . . . . . . . . . . 4. Medidas de Variabilidad 4.1. Introduccin . . . . . . . . . . . . . . 4.2. Variabilidad . . . . . . . . . . . . . . 4.2.1. Varianza y desviacin estndar 4.3. Problemas . . . . . . . . . . . . . . . 1
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
NDICE GENERAL
5. Probabilidad 5.1. Deniciones y ejemplos . . . . . . . . . . . . . . 5.2. Operaciones entre eventos . . . . . . . . . . . . 5.3. Denciones de probabilidad . . . . . . . . . . . 5.3.1. Concepto Clsico de Probabilidad . . . . 5.3.2. Concepto frecuentista de probabilidad . . 5.3.3. Probabilidad subjetiva . . . . . . . . . . 5.3.4. Concepto axiomtico de probabilidad . . 5.4. Teoremas de Probabilidad . . . . . . . . . . . . . 5.4.1. Teorema 1: Regla de la Adicin . . . . . 5.4.2. Teorema 2: Regla de la complementacin 5.4.3. Teorema 3: Regla de Diferenciacin . . . 5.4.4. Probabilidad Condicional . . . . . . . . 5.4.5. Teorema 4: Reglas de Multiplicacin . . 5.5. Problemas . . . . . . . . . . . . . . . . . . . . . 6. Variables aleatorias 6.1. Deniciones y ejemplos . . . . . 6.2. Distribucin de probabilidad . . 6.2.1. Distribuciones discretas 6.2.2. Distribuciones continuas 6.3. Esperanza, varianza y momentos 6.3.1. Esperanza . . . . . . . . 6.3.2. Varianza . . . . . . . . . 6.3.3. Distribucin binomial . 6.3.4. Distribucin Poisson . . 6.3.5. Distribucin Normal . .
2
20 20 21 22 22 23 23 24 24 24 25 25 26 26 28 29 29 30 30 30 30 31 31 31 33 35
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
1.2. Estadstica
1.2.1. Estadstica y tipos de estadsticas
Denicin 1.2.1 : Estadstica Es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, 3
1.3. VARIABLES
y de la realizacin de inferencias acerca de las poblaciones de las que stas proceden. Es la ciencia que estudia los fenmenos aleatorios.
1.3. Variables
Denicin 1.3.1 : Variables Es una caracterstica que puede tomar diferentes valores. Las variables son caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en categoras. Variable es un aspecto especico de la realidad referido a la unidad del anlisis y puede ser medidos o cuanticados. La variable adquiere un valor determinado en cada unidad de anlisis. Si una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas diferentes, se dice que esta caracterstica es variable, es decir la caracterstica no es la misma cuando se observa en diferentes poseedoras de ellas.
1.3. VARIABLES
Ejemplo 1.3.1 Las siguientes caractersticas son ejemplos de variables Estatura de las personas Edad de los nios El precio y la demanda de un producto Denicin 1.3.2 : Variables Aleatorias
Cuando los valores obtenidos de la variable son el resultado de factores fortuitos o al azar.
1.3. VARIABLES
Note que cada una de estas variables puede valer un nmero entero (por ejemplo: 1,2,3, etc.) pero no puede valer nmeros fraccionarios (por ejemplo: 1,5). Tpicamente, las variables discretas resultan de un conteo. Denicin 1.3.6 : Variables Continuas Las variables continuas pueden asumir todos los valores dentro de un rango especco (valores dentro de un intervalo) Ejemplo 1.3.5 Las siguientes caractersticas son ejemplos de variables continuas presin del aire en una llanta el tiempo que se toma en viajar de It a San Lorenzo el peso de los jugadores de ftbol del club Cerro Porteo Tpicamente, las variables continuas resultan de medir algo, y lgicamente dependen de la exactitud del instrumento de medicin.
2.2. Construccin
Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las cuales se muestra el nmero de observaciones que contiene cada categora. Los pasos para la construccin de una distribucin de frecuencias son mejor explicados con un ejemplo. Ejemplo 2.2.1 Los siguientes datos son el nmero de meses de duracin de una muestra de 40 bateras para coche. 22 34 25 33 47 41 16 43 31 38 35 31 34 37 32 45 33 36 44 26 7 32 38 29 32 39 37 31 33 41 30 30 47 39 19 42 26 37 31 34 35
2.2. CONSTRUCCIN
Ordenacin de datos, que puede ser en orden ascendente o descendente El rango (amplitud) Rango = Dato mayor - Dato menor = 47 - 16 = 31 Nmero tentativo de los intervalos de clase (nic) El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo a la frmula : 2nic En este ejercicio, puesto que tenemos 40 datos el nic sera de 6. Tambin al nic le podemos calcular de la siguiente manera: nic = 1 + 3, 322log10 N = 1 + 3, 3222log10 40 = 6, 32 6 Tamao de los intervalos de Clase (tic) tic =
Rango nic
31 6
Para facilitar la clasicacin de los datos, el tic se redondea siempre al entero posterior. Lmite inferior (LI) Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en este ejemplo es 16. El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande. Lmite superior (LS) El lmite superior se calcula con la siguiente frmula LS = LI + tic 1 Lmite Superior Real (LSR) Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites reales son el punto medio entre el lmite superior (LS) y el lmite inferior del siguiente intervalo ( LS + LIsig ) (LIsig), entonces LSR = 2 Marca de clase (X) La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms LI + LS representativo de los valores del intervalo. Con lo cual X = Clasicacin de los datos 2 y conteo de frecuencias Clasicar las observaciones en los intervalos. La prctica usual es marcar con una lnea ( / ) que representa una observacin. En el ejemplo la observacin 22 se clasica en el intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasicados todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase. Distribucin de frecuencia relativa (FR) Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir una distribucin de frecuencia en una distribucin de frecuencia relativa cada una de las frecuencias de clase ( F) Distribuciones de frecuencia se dividen entre el nmero total de observaciones FR = n acumulada
2.2. CONSTRUCCIN
Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuantas observaciones, o que porcentaje de observaciones estn debajo de cierto valor. La distribucin de frecuencia acumulada (FA) de cierto intervalo se calcula sumando las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del intervalo de inters. Si queremos la frecuencia acumulada del intervalo 25 - 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7. La distribucin de frecuencia relativa acumulada (FAR) de cierto intervalo se calcula dividiendo la frecuencia acumulada entre el nmero total de observaciones FA FRA = n LI LS 16 21 22 27 28 33 34 39 40 45 46 51 LSR 21,5 27,5 33,5 39,5 45,5 51,5 X 18,5 24,5 30,5 36,5 42,5 48,5 cuenta // //// ///// ///// /// ///// ///// /// ///// / // F FR 2 0,05 4 0,1 13 0,325 13 0,325 6 0,15 2 0,05 FA FRA 2 0,05 6 0,15 19 0,475 32 0,8 38 0,95 40 1
Polgono de frecuencia El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados por la interseccin de las marcas de clase y las frecuencias de clase.
2.3. PROBLEMAS
10
2.3. Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas grcas: 1. Los resultados siguientes representan las calicaciones del examen nal de un curso de estadstica elemental. 23 80 52 41 60 34 60 77 10 71 78 67 79 81 64 83 89 17 32 95 75 54 76 82 57 41 78 64 84 69 74 65 25 72 48 74 52 92 80 88 84 63 70 85 98 62 90 80 82 55 81 74 15 85 36 76 67 43 79 61
2. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana. El nmero de cambios de aceite en la sucursal de la calle Roble en los pasados 20 das son: 66 98 55 62 79 59 51 90 72 56 70 62 66 80 94 79 63 73 71 85
3.1. La Media
3.1.1. La Media Geomtrica
La media geomtrica es til para encontrar el promedio de porcentajes, proporciones, ndices, o tasas de crecimiento. Tiene mucha aplicacin en el comercio y la economa porque nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos econmicos como el producto nacional bruto. La media geomtrica de un conjunto de "n"nmeros enteros positivo se dene como la n-sima raz del producto de los n valores es decir: n X1 , X2 , . . . , Xn Ejemplo 3.1.1 Suponga que usted recibe un 5 % de aumento en su salario este ao y un 15 % de aumento el ao prximo y quiere saber cual es el incremento porcentual promedio. Si tiene un aumento del 5 % entonces su salario es 1,05 y si tiene un aumento del 15 % su salario es de 1,15 entonces calculando la media geomtrica se obtiene (1, 05)(1, 15) = 1, 09886, por lo que el aumento promedio anual es del 9, 886 %. Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron 3 %, 2 %, 4 % y 6 %. Cul es la media de las ganancias? Por lo que la media de ganancias obtenidas por Atkins Construction Company en los cuatro proyectos esta dada por 4 (0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464 o sea 3,464 %
11
3.1. LA MEDIA
12
i=1
Xi
n
i=1
n : es el nmero de elementos de la muestra Ejemplo 3.1.3 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la media aritmtica de estas observaciones?
3.2. LA MEDIANA
13
X=
i=1
Xi
n =
i=1
Xi
N
i=1
3.2. La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la media aritmtica no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana. La mediana es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos. Ejemplo 3.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la mediana de las observaciones muestreadas? 85,9 85,4 85,4 84,3 84,0 = 85, 4 Por lo que la mediana es X Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?
3.3. LA MODA
14
25 29 30 32 35 35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales = 30 + 32 = 31 X 2
3.3. La moda
La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal y nominal. Es el valor de la observacin que aparece ms frecuentemente.
3.4. PROBLEMAS
15
3.4. Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento mensual (en pulgadas) de muestras de maz recien plantados 0,4 1,9 0,9 0,7 1,5 0,9 0,9 0,7 0,3 0,7 1,6 1,5 0,4 0,5 1,5 1,5 1,2 1,7 0,8 1,8
a) Organice los datos en un ordenamiento ascendente b) calcula las medidas de tendencia central considerando los a datos como simples 2. Un fabricante de neumticos quiere determinar el dimetro interior de cierto grado de los neumticos. Idealmente el dimetro sera 570mm. Los datos son los siguientes: 572 572 573 568 569 575 565 570 Encuentre las medidas de tendencia central y analice la relacin entre ellas
4.2. Variabilidad
4.2.1. Varianza y desviacin estndar
La varianza y la desviacin estndar sirven para cuanticar la variabilidad de una muestra midiendo su dispersin alrededor de la media. Varianza Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media. Desviacin estndar Es la raz cuadrada de la varianza. 16
4.2. VARIABILIDAD
17
Varianza y desviacin estndar para datos no agrupados Las frmulas de la varianza de una poblacin y de una muestra son ligeramente diferentes. Las frmulas son:
i=1
(Xi )2
N
n
i=1
Xi2
N
n
(4.2.1)
i=1
(Xi X )2
n =
i=1
Xi2
n
(4.2.2)
Las desviaciones estndar de la poblacin y muestra se calculan simplemente sacando la raz cuadrada a la respectiva varianza. = 2 (4.2.3) desviacin estndar de una poblacin y S= desviacin estndar de una muestra Ejemplo 4.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4; 85,3; 84,9; 85,4; y 84,0. Cul es la varianza y la desviacin estndar de las observaciones muestreadas? X 85,4 85,3 84.9 85.4 84.0 Xi = 425, 0 Con lo cual la media de la muestra es X= entonces la varianza est dada por 425, 0 = 85 5 X2 7293,16 7276,09 7208,01 7293.16 7056.00 2 X = 36126, 42 S2 (4.2.4)
S2 =
i=1
Xi2
n
X =
4.2. VARIABILIDAD
18
Varianza y desviacin estndar para datos agrupados Si los datos estn agrupados en una distribucin de frecuencia, la varianza y la desviacin estndar de la muestra se pueden aproximar sustituyendo S fi Xi2 por SXi2 y S fi Xi por SXi . Las frmulas quedaran de la siguiente manera:
2 =
i=1
fi (Xi )2 N =
N
i=1
fiXi2
N
(4.2.5)
i=1
fiXi
N
n i=1
,y
S2 =
i=1
fi (Xi X )2 n =
n
fiXi2
n
(4.2.6)
i=1
fiXi
n
Al igual que en la situacin anterior las desviaciones estndar de la poblacin y muestra se calculan sacando la raz cuadrada a la respectiva varianza. = 2 (4.2.7) desviacin estndar de una poblacin y S= desviacin estndar de una muestra Ejemplo 4.2.2 Calcular la varianza y la desviacin estndar de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche. duracin de las bateras (meses) 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 Nmero de bateras 2 1 4 15 10 5 3 S2 (4.2.8)
fi Xi2
Primeramente, calculamos la marca de clase, para despus calcular los productos fi Xi y para proceder nalmente a calcular las sumatorias fi Xi y fi Xi2 y aplicar las frmulas.
4.3. PROBLEMAS
19
LI LS 15 19 20 24 25 29 30 34 35 39 40 44 45 49
X 17 22 27 32 37 42 47
fi 2 1 4 15 10 5 3 n =40
fiXi2
X =
S = 6, 881814804
4.3. Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene estos datos: Fumadores No fumadores 69,3 56,0 28,6 25,1 22,1 26,4 47,6 53,2 34,9 29,8 48,1 38,5 52,7 34,4 30,2 30,6 60,2 31,8 43,8 41,6
a) Encuentre las medidas de tendencia central para cada grupo b) Encuentre la varianza y desviacin estndar de cada grupo c) Diga cual de los dos grupos de datos est ms concentrada 2. La compaa National Tire tiene fondos de reserva en valores negociable a corto plazo. El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables en lapso de dos semanas es el que mostramos a continuacin Semana 1 1973 Semana 2 1969 1970 1972 1892 1893 1975 1976 1887 1895
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados obtenidos. b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeciente de variacin de cada grupo. c) Diga cual de los grupos tiene mejor concentracin
Captulo 5 Probabilidad
5.1. Deniciones y ejemplos
Denicin 5.1.1 Experimento: Es cualquier procedimiento mediante el cual obtenemos una observacin. En particular, para el estudio de la probabilidad nos interesa observar aquellos experimentos cuyos resultados no son pronosticables con certeza , esto es aquellos experimentos tales que cuando se les repite bajo las mismas condiciones iniciales, el resultado que se obtiene no siempre es el mismo, es decir aquellos en que existe aleatoriedad. Este tipo de experimento se denomina experimentos aleatorios simbolizado por . Ejemplo 5.1.1 A continuacin presentamos algunos ejemplos posibles de experimentos Lanzamiento de una moneda Tomar un punto de un circulo Elegir un alumno en el campus para preguntarle cuntos libros ha solicitado a prstamo en la biblioteca universitaria durante el ltimo mes. Contar el nmero de cabellos en la cabeza de una persona. Medir la resistencia elctrica de un componente electrnico Denicin 5.1.2 Espacio Muestral: Es el conjunto de todos los resultados individuales que puede tener un experimento aleatorio. El espacio muestral simbolizado por puede no ser nico. A cada uno de los elementos del espacio muestral se le llama punto muestral. Denicin 5.1.3 Evento: Es cualquier resultado posible al realizar un experimento aleatorio. Si un evento tiene un nico elemento, se le llama evento simple. En general, a cualquier subconjunto del espacio muestral se le llama evento compuesto. Ejemplo 5.1.2 Si un experimento aleatorio consiste en lanzar un dado y observar el nmero que aparece en la cara superior, entonces claramente el espacio muestral es el conjunto = {1; 2; 3; 4; 5; 6}. Como ejemplo de un evento para este experimento podemos denir el conjunto A = {2; 4; 6}, que corresponde al suceso de obtener como resultado un nmero par. Si al lanzar el dado una vez se obtiene el nmero 4, decimos entonces que se observ la ocurrencia del evento A, y si se obtiene por ejemplo el resultado 1, decimos que no se observ la ocurrencia del evento A. 20
21
Ejemplo 5.1.3 Considere el experimento aleatorio de participar en un juego de lotera. Suponga que hay un milln de nmeros en esta lotera y un jugador participa con un boleto. Cul es un posible espacio muestral para este experimento?. Naturalmente al jugador le interesa conocer su suerte en este juego y puede proponer como espacio muestral el conjunto = {ganar; perder}. Sin embargo puede tambin tomarse como espacio muestral el conjunto que contiene a todos los posibles nmeros de esta lotera, es decir, = {1; 2; :::; 1000000}. Este ejemplo sencillo muestra que el espacio muestral de un experimento aleatorio no es nico y depende del inters del observador. Puesto que los conceptos de espacio muestral y evento involucran forzosamente la terminologa de conjuntos, recordaremos a continuacin algunas operaciones entre estos objetos, y algunas propiedades que nos seran de utilidad en el estudio de la probabilidad y la estadtica.
Unin La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El smbolo de la unin es . Complemento El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento es .
22
Diferencia Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el signo "menos"().
en donde el smbolo #A denota la cardinalidad o nmero de elementos del conjunto A. Claramente esta denicin es slo vlida para espacios muestrales nitos, pues forzosamente necesitamos suponer que el nmero de elementos en es nito. El espacio muestral debe ser equiprobable como ya se mencion, pues para calcular la probabilidad de un evento A dado, nicamente necesitamos contar cuntos elementos tiene A respecto del total, sin importar exactamente qu elementos particulares sean. Ejemplo 5.3.1 El experimento consiste en el lanzamiento de un dado. Cul es la probabilidad de que se obtenga como resultado un dos? Las caras del dado estn numeradas del 1 al 6, entonces hay solo una posibilidad de entre un total de seis de que el resultado del experimento sea el nmero 2, entonces la probabilidad de obtener el nmero 2 es 1 P(cae 2) = = 0, 16667 6
23
La principal dicultad que presenta esta interpretacin de la probabilidad es que se basa en sucesos equiprobables (todos los posibles resultados tienen la misma probabilidad de ocurrencia ), siendo fcil para problemas sencillos, como los de cartas, dados o urnas, es casi imposible para problemas ms complejos.
24
Segn este enfoque la probabilidad de que un evento en particular suceda es asignada basndose en cualquier informacin disponible, como intuicin, opiniones etc. Ejemplo 5.3.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prximo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o cualquier otra condicin externa, son elementos que slo algunas personas conocen y que podran darnos una idea ms exacta de esta probabilidad.
)=
n=1
n=1
P(Ai)
25
La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente: 2 1 3 1 y P(B) = = P(A) = = 6 2 6 3 Para aplicar este teorema es necesario conocer la probabilidad de la interseccin de estos dos eventos, para as poder conocer la probabilidad de la unin, o de manera inversa, conociendo la probabilidad de la unin se puede calcular la probabilidad de la interseccin. En este caso queremos saber la probabilidad de la unin conociendo la probabilidad de la interseccin, entonces es necesario conocer la interseccin de estos dos eventos, que es nmero par y menor de 3, con lo cual A B = {2} por lo que P(A B) = 1 6 Si aplicamos la regla de adicin: P(A B) = P(A) + P(B) P(A B) P(A B) = 1 1 1 2 + = 2 3 6 3
Y la probabilidad de que caiga un nmero menor que tres pero no sea par es: P(B A) = P(B) P(AB) =
26
1 10
27
Para dos eventos A y B, donde A depende de la ocurrencia de B, la probabilidad de que sucedan ambos eventos est dada por la frmula: P(A B) = P(B) P(A|B) Ejemplo 5.4.6 Cierto departamento de una compaa esta compuesto por 8 hombres y 4 mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistar a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, cual es la probabilidad de que las dos personas entrevistadas sean mujeres? Denamos entonces los siguientes eventos A = {el primer entrevistado es mujer} B = {el segundo entrevistado es mujer} La probabilidad de que suceda el evento A = {el primer entrevistado es mujer} es: P(A) = 4 1 = 12 3
La probabilidad de que suceda el evento B = {el segundo entrevistado es mujer} dado que ya sucedi A, y solo hay tres mujeres de 11 elementos es: P(B|A) = 3 11
Segn el teorema de multiplicacin, la probabilidad de que los dos eventos ocurran es: P(A B) = P(A) P(B|A) = 1 1 3 = 3 11 11
5.5. PROBLEMAS
28
5.5. Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoriamente a) tenga alguno de estos dos malos hbitos? b) no tenga ninguno de estos dos psimos hbitos? c) fume pero no tome? d) tome pero no fume? e) No fume? f) Fume dado que toma? g) Toma dado que fuma? h) No tenga alguno de estos nefastos hbitos? 2. Se realiz una encuesta sobre preferencias en materia de peridicos, de 350 personas entrevistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos peridicos. Encontrar la probabilidad de los siguientes eventos: a) Lee alguno de estos dos peridicos b) No lee ninguno de estos dos peridicos c) Lee el Diario pero el Heraldo no d) Lee el Heraldo pero el Diario no e) Lee el Heraldo dado que lee el Diario f) Lee el Diario dado que lee el Heraldo g) No lee alguno de estos dos Peridicos
30
31
6.3.1. Esperanza
Denicin 6.3.1 Esperanza La esperanza de una variable aleatoria X es un nmero real denotado por E (X ) y que se calcula como sigue: 1. Si X es una variable aleatoria discreta con funcin de probabilidad f (x), entonces: E (X ) = x f (x)
x
en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable aleatoria X , y se dene cuando esta suma sea absolutamente convergente, es decir, E (X ) = |x| f (x)
x
El nmero de sumandos puede ser nito o innito dependiendo del conjunto de valores de la variable aleatoria. 2. Si X es una variable aleatoria continua con funcin de densidad de probabilidad f (x), entonces la esperanza es
E (X ) =
x f (x)dx
E (X ) =
|x f (x)|dx
6.3.2. Varianza
Denicin 6.3.2 (Varianza) La varianza de una variable aleatoria X , denotada por Var(X ), se dene como la siguiente esperanza, si sta existe, [x E (X )]2 f (x) si X es una v.a. discreta x Var(X ) = E [X E (X )]2 = [x E (X )]2 f (x)dx si X es una v.a. continua
32
Construccin de la distribucin binomial Suponga que se realizan n ensayos idnticos independientes de Bernoulli en donde la probabilidad de xito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad de xito igual a p y la del fracaso igual a 1 p, con p (0, 1). El espacio muestral de este experimento consiste de todas las posibles sucesiones de longitud n de xitos y de fracasos, esto es = {(EEE . . . E ), (FEE . . . E ), (FFE . . . E ), . . . , (FFF . . . FE ), (FFF . . . F )} Usando el principio multiplicativo, es fcil ver que este conjunto tiene 2n elementos. Si ahora se dene la variable aleatoria X como el nmero de xitos en cada una de estas sucesiones, esto es X (EEE . . . E ) = n, X (FEE . . . E ) = n 1, . . . , X (FFF . . . EF ) = 1, X (FFF . . . F ) = 0 entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribucin binomial con parmetros n y p. Se escribe X bin(n, p), y su funcin de probabilidad es f (x) = n! px (n p)1x si x = 0, 1, . . . , n x!(n x)! 0 para otro caso
Proposicin 6.3.1 Sea X bin(n, p), entonces tenemos que a) E (X ) = np b) Var(X ) = n(1 p) c) MX (t ) = (1 p + pet )n Ejemplo 6.3.1 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la de obtener un fracaso es tambin 0,50. a) Cul es la probabilidad de no obtener caras en los cuatro lanzamientos? b) Cul es la probabilidad de obtener dos caras en los cuatro lanzamientos? c) Haga una distribucin de probabilidad binomial d) Calcular la media, la desviacin estndar y la funcin generadora de momentos de esta distribucin binomial Esta distribucin binomial tiene por funcin de probabilidad a la siguiente funcin ( 1 )x ( 1 )4x 4! si x = 0, 1, 2, 3, 4 x!(4 x)! 2 2 f (x) = 0 para otro caso
33
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es, ( 1 )4 4! 1 P(X = 0) = = 0!(4 0)! 2 16 b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es, ( 1 )4 4! 6 3 P(X = 2) = = = 2!(4 2)! 2 16 8 c) La distribucin de probabilidad est dada por la siguiente tabla x 0 1 p(x) 1/16 4/16 2 3/8 3 1/4 4 1/16
c) Teniendo en cuenta la proposicin 7.1.1 tenemos que la esperanza, la varianza y la funcin generadora de momentos son respectivamente 1 =2 2 1 1 Var(X ) = 4 = 1 2 2 ( 1 1 t )4 1 MX (t ) = 1 + e = (et + 1)4 2 2 16 E (X ) = 4
34
Relacin con la distribucin binomial La distribucin de Poisson puede ser vista como un caso lmite de la distribucin binomial, es decir, una distribucin binomial en la que n y p 0 se puede aproximar por una distribucin de Poisson de parmetro = np. Ejemplo 6.3.2 En una central telefnica automtica la probabilidad de que una llamada sea conectada errneamente es 103 . a) Para un da donde son conectadas 2000 llamadas independientes, hallar el valor aproximado de la probabilidad que se efecten 4 conexiones errneas. b) Cul es el nmero mnimo de llamadas independientes que se requieren para asegurar con probabilidad 0,9 que por lo menos una de las llamadas sea conectada errneamente? Desarrollo a) Sea X la v.a que represente el nmero de llamadas telefnicas conectadas errneamente en un da determinado. Entonces la funcin de probabilidad de X est dada por: P(X = x) = enp (np)x x!
donde p = 103 y n = 2000 segn las condiciones de este problema. Entonces np = 2 y e2 (2)4 P(X = 4) = = 0, 09 4! b) Si X es nuevamente el nmero de llamadas conectadas errneamente en un da determinado entonces X Poisson(np). Segn la informacin P(X 1) 0, 9 y considerando que P(X 1) = 1 P(X < 1) = 1 P(X = 0) entonces: enp (np)0 1 0, 9 0! 0, 1 enp ln|0, 1| np n 2303 llamadas
35
< x <
en donde R y > 0 son los parmetros. Escribimos entonces X N (, 2 ). La grca de esta funcin de densidad tiene forma de campana como se puede apreciar en la Figura 7.5, en donde se muestra adems el signicado geomtrico de los dos parmetros. No es inmediato pero es posible demostrar que E (X ) = , y ello signica que la campana esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede demostrarse que Var(X ) = 2 , y que la distancia del punto a cualquiera de los dos puntos en donde la funcin tiene puntos de inexin es , por lo tanto la campana se abre o se cierra de acuerdo a la magnitud de este parametro. Caractersticas de la distribucin de probabilidad normal La distribucin de probabilidad normal con su curva tiene las siguientes caractersticas: 1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin. 2. La distribucin de probabilidad normal es simtrica alrededor de su media. Por o tanto, la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El rea total bajo la curva es igual a 1. 3. La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja de la media en cualquier direccin. Esto signica que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar. La familia de la distribucin de probabilidad normal La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grca es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntalamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en
36
torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por lo tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin. Como se deduce, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de sus medias y sus varianzas. Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas estarn centradas en la misma posicin y tendrn diferentes formas; tal como lo muestra la Figura 7.6. La distribucin normal estndar En particular, decimos que la variable aleatoria X tiene una distribucin normal estndar si tiene una distribucin normal con parmetros E (X ) = = 0 y Var(X ) = 2 = 1. En este caso la funcin de densidad se reduce a la siguiente expresin
x2 1 f (x) = e 2 2
Para facilitar los clculos se decidi tabular las diferentes probabilidades para variable aleatoria que sigue una distribucin normal. Pero, puesto que sera imposible tener una tabla para cada posible distribucin normal, se elabor solamente una, la tabla de la distribucin normal estndar. De esta manera solo se tiene que transformar o estandarizar una distribucin normal especca, se revisa la tabla, y se conoce la probabilidad. Para la estandarizacin se debe realizar la siguiente operacin. Proposicin 6.3.3 Sea X una variable aleatoria con distribucin normal con parmetros y 2 . Entonces la siguiente variable aleatoria tiene una distribucin normal estndar Z= x (6.3.1)
37
reas bajo la curva normal Una caracterstica que tiene cualquier distribucin normal es que el rea bajo la curva, que representa la probabilidad de que la variable aleatoria tome ciertos valores X x, se distribuye siempre en la misma proporcin. En la tabla de la distribucin normal estndar, estn registradas las reas bajo la curva normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se necesita transformar la distribucin normal de inters en una distribucin normal estndar mediante la frmula, y el rea a la derecha del valor z ser el mismo que el rea a la derecha de x, esto es P(X x) = P(Z z). Ejemplo 6.3.3 Los coecientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que: a) tenga un coeciente mayor de 120 b) tenga un coeciente menor de 100 c) tenga un coeciente menor de 122 d) tenga un coeciente entre 115 y 125 e) tenga un coeciente entre 90 y 105 Desarrollo Segn las condiciones del problema la v.a. X representa el coeciente intelectual del estudiante elegido y adems X N (115, 144) Para calcular las probabilidades de los distintos itens debemos transformar esta distribucin normal en una distribucin normal estndar (con media cero y desviacin estndar 1), x 115 para lo cual hay que cambiar el valor de x por un valor z con la frmula z = . Entonces 12 la probabilidad de que:
(
La distribucin ya transformada queda as: Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal estandar, que es el valor 0,1591 . Y como el rea a la derecha del valor z = 0, 41 es el rea que buscamos, entonces este es el resultado, es decir, la probabilidad de que un aspirante a la universidad tenga un coeciente intelectual mayor de 120 es P(X > 120) = P(Z > 0, 41) = 0, 5 0, 1591 = 0, 3409 b) tenga un coeciente menor de 100 es: ( 100 115 ) P(X < 100) = Z < = P(Z < 1, 25) 12 La distribucin ya transformada queda as: En la tabla de reas bajo la curva normal estandar no se tabularon valores z negativos, pero como la curva normal es simtrica,
38
el rea entre cero y el valor z = 1, 25 smbolizado por A(1, 25); es del mismo tamao que el rea entre cero y el valor z = 1, 25 dada por A(1, 25), por lo que solo se necesita buscar en la tabla el rea correspondiente al valor positivo de z. Como el rea que se busca esta a la izquierda de z = 1, 25, se tiene que: P(X < 100) = P(Z < 1, 25) = 0, 5 A(1, 25) = 0, 5 0, 3944 = 0, 1056 c) tenga un coeciente menor de 122 es: ( 122 115 ) = P(Z < 0, 58) P(X < 122) = Z < 12 La distribucin ya transformada queda as: Se busca el valor del rea para 0 Z 0, 58 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el rea que buscamos, entonces el resultado a buscar es: P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190 d) tenga un coeciente entre de 115 y 125 es: P(115 < X < 125) = ( 115 115 12 <Z< 125 115 ) = P(0 < Z < 0, 83) 12
Se busca el valor del rea para 0 Z 0, 83 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83, entonces el resultado a buscar es: P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967 e) tenga un coeciente entre de 90 y 105 es: P(90 < X < 105) = ( 90 115 12 <Z< 105 115 ) = P(2, 08 < Z < 0, 83) 12
Se busca el valor del rea para 2, 08 Z 0, 83 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83, entonces el resultado a buscar es: P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
39