Vous êtes sur la page 1sur 40

Estadistica Descriptiva e Inferencial

LIC. ERNESTO SILVERO LAZAGA 27 de marzo de 2012

ndice general
1. Estadistica Descriptiva e Inferencial 1.1. Introduccin . . . . . . . . . . . . . . . . 1.2. Estadstica . . . . . . . . . . . . . . . . 1.2.1. Estadstica y tipos de estadsticas 1.2.2. Estadstica Descriptiva . . . . . . 1.2.3. Estadstica Inferencial . . . . . . 1.2.4. Poblacin y muestra . . . . . . . 1.3. Variables . . . . . . . . . . . . . . . . . 1.3.1. Tipos de variables . . . . . . . . 1.3.2. Escalas de medicin . . . . . . . 2. Distribuciones de Frecuencia 2.1. Estadstica descriptiva . . . . . 2.2. Construccin . . . . . . . . . 2.2.1. Representacin Grca 2.3. Problemas . . . . . . . . . . . 3 3 3 3 4 4 4 4 5 6 7 7 7 9 10 11 11 11 12 12 12 12 13 13 14 14 14 14 15 16 16 16 16 19

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

3. Medidas de tendencia central 3.1. La Media . . . . . . . . . . . . . . . . . . 3.1.1. La Media Geomtrica . . . . . . . 3.1.2. La Media Aritmtica . . . . . . . . 3.1.3. Propiedades de la media aritmtica . 3.1.4. Desventajas de la media aritmtica . 3.1.5. La media para datos no agrupados . 3.1.6. La media de la poblacin . . . . . . 3.2. La mediana . . . . . . . . . . . . . . . . . 3.2.1. Propiedades de la mediana . . . . . 3.3. La moda . . . . . . . . . . . . . . . . . . . 3.3.1. Propiedades de la moda . . . . . . 3.3.2. Desventajas de la moda . . . . . . . 3.4. Problemas . . . . . . . . . . . . . . . . . . 4. Medidas de Variabilidad 4.1. Introduccin . . . . . . . . . . . . . . 4.2. Variabilidad . . . . . . . . . . . . . . 4.2.1. Varianza y desviacin estndar 4.3. Problemas . . . . . . . . . . . . . . . 1

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

NDICE GENERAL
5. Probabilidad 5.1. Deniciones y ejemplos . . . . . . . . . . . . . . 5.2. Operaciones entre eventos . . . . . . . . . . . . 5.3. Denciones de probabilidad . . . . . . . . . . . 5.3.1. Concepto Clsico de Probabilidad . . . . 5.3.2. Concepto frecuentista de probabilidad . . 5.3.3. Probabilidad subjetiva . . . . . . . . . . 5.3.4. Concepto axiomtico de probabilidad . . 5.4. Teoremas de Probabilidad . . . . . . . . . . . . . 5.4.1. Teorema 1: Regla de la Adicin . . . . . 5.4.2. Teorema 2: Regla de la complementacin 5.4.3. Teorema 3: Regla de Diferenciacin . . . 5.4.4. Probabilidad Condicional . . . . . . . . 5.4.5. Teorema 4: Reglas de Multiplicacin . . 5.5. Problemas . . . . . . . . . . . . . . . . . . . . . 6. Variables aleatorias 6.1. Deniciones y ejemplos . . . . . 6.2. Distribucin de probabilidad . . 6.2.1. Distribuciones discretas 6.2.2. Distribuciones continuas 6.3. Esperanza, varianza y momentos 6.3.1. Esperanza . . . . . . . . 6.3.2. Varianza . . . . . . . . . 6.3.3. Distribucin binomial . 6.3.4. Distribucin Poisson . . 6.3.5. Distribucin Normal . .

2
20 20 21 22 22 23 23 24 24 24 25 25 26 26 28 29 29 30 30 30 30 31 31 31 33 35

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

Captulo 1 Estadistica Descriptiva e Inferencial


1.1. Introduccin
La Estadstica se divide en dos grandes reas (descripcin de datos y realizacin de inferencias) que reejan la propia historia del desarrollo de esta ciencia. La Estadstica actual es el producto del encuentro de dos ramas distintas del saber, la antigua estadstica y el clculo de probabilidades, que se encontraron en el siglo XIX. Etimolgicamente, la palabra estadstica procede de la palabra estado, ya que desde la antigedad los romanos hicieron recolecciones de datos que posteriormente tenan que resumir de una forma comprensiva y que permitiera proporcionar informaciones tiles. Este tipo de estudios dio lugar a la estadstica descriptiva cuya misin consiste en describir situaciones y procesos dados; para ello se sirve de tablas, representaciones grcas, proporciones, nmeros ndice y medidas tpicas. Sin embargo las conclusiones extradas se agotan en el propio conjunto de datos observados, pues el objetivo consista en hacerse una idea clara de lo que haba, y lo que haba se contaba y se meda. Lo que posibilit el clculo de probabilidades fue, precisamente, el desarrollo de un conjunto de mtodos para extrapolar las conclusiones a entidades no observadas. Es decir, proporcion el instrumento adecuado para poder hacer inferencias acerca de grandes cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Estas tcnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su aplicacin por Galton a los problemas de herencia, etc. Sin embargo los autnticos fundadores de estas tcnicas fueron Karl Pearson (1857-1936) y Sir Ronald Fisher (1890-1962). As se ha desarrollado la estadstica analtica o inferencial basada en la teora de probabilidades que trata de obtener leyes generales a partir de la observacin de algunos datos. Precisamente este fundamento probabilstico condiciona el que los resultados obtenidos se vean sujetos a unos mrgenes de error. Ahora se puede dar una denicin de Estadstica en la que aparecen algunos trminos no denidos lo cual no impedir entender su signicado.

1.2. Estadstica
1.2.1. Estadstica y tipos de estadsticas
Denicin 1.2.1 : Estadstica Es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, 3

1.3. VARIABLES

y de la realizacin de inferencias acerca de las poblaciones de las que stas proceden. Es la ciencia que estudia los fenmenos aleatorios.

1.2.2. Estadstica Descriptiva


La primer parte de la denicin de estadsticas, es comnmente conocida como Estadstica Descriptiva. La denicin es la siguiente: Es el conjunto de procedimientos utilizados para organizar, resumir y presentar grupos de datos numricos. Los grupos de datos numricos no organizados son de poca utilidad. Sin embargo, tcnicas estadsticas estn disponibles para organizar estos datos en distribuciones de frecuencia, presentarlos en grcas, resumirlos en promedios y medidas de variabilidad o dispersin.

1.2.3. Estadstica Inferencial


Otra faceta de las estadsticas es la estadstica inferencial tambin llamada estadstica inductiva. La principal utilidad de la estadstica inferencial es conocer algo acerca de una poblacin basndose en una muestra tomada de esa poblacin. La denicin es la siguiente: Es el conjunto de mtodos utilizados para obtener conclusiones relativas a una poblacin, basndose en el conocimiento de las caractersticas de una muestra. Una poblacin puede consistir de individuos, tales como todos los estudiantes de la universidad, todos los estudiantes que estudian Estadsticas o todos los internos de la penitenciaria. Una poblacin puede tambin consistir de objetos, tales como todos los motores producidos por la planta Ford o todas las truchas en un estanque. Una poblacin tambin puede consistir en un grupo de medidas, tales como las estaturas equipo de bsquetbol "Dorados de Chihuahua".

1.2.4. Poblacin y muestra


Denicin 1.2.2 : Poblacin Es el conjunto de todos los individuos (personas, objetos, animales, etc.) que portan informacin sobre el fenmeno que se estudia. Para inferir algo acerca de una poblacin, usualmente tomamos una muestra de ella. Denicin 1.2.3 : Muestra Es un subconjunto de la poblacin de inters.

1.3. Variables
Denicin 1.3.1 : Variables Es una caracterstica que puede tomar diferentes valores. Las variables son caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en categoras. Variable es un aspecto especico de la realidad referido a la unidad del anlisis y puede ser medidos o cuanticados. La variable adquiere un valor determinado en cada unidad de anlisis. Si una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas diferentes, se dice que esta caracterstica es variable, es decir la caracterstica no es la misma cuando se observa en diferentes poseedoras de ellas.

1.3. VARIABLES
Ejemplo 1.3.1 Las siguientes caractersticas son ejemplos de variables Estatura de las personas Edad de los nios El precio y la demanda de un producto Denicin 1.3.2 : Variables Aleatorias

Cuando los valores obtenidos de la variable son el resultado de factores fortuitos o al azar.

1.3.1. Tipos de variables


Denicin 1.3.3 : Variable Cualitativa Cuando la variable estudiada es no numrica es decir una caracterstica que no puede ser medido sino solo catalogarse, esta es llamada variable cualitativa tambin llamada atributo. Ejemplo 1.3.2 Las siguientes caractersticas son ejemplos de variables cualitativas lugar de nacimiento religin color de ojos Denicin 1.3.4 : Variable Cuantitativa Cuando la variable estudiada puede expresarse en forma numrica es decir puede ser medido, esta es llamada variable cuantitativa. Las variables cuantitativas pueden ser discretas o continuas. Ejemplo 1.3.3 Las siguientes caractersticas son ejemplos de variables cualitativas el saldo de una cuenta bancario, la duracin de una batera, la velocidad de los automviles en el perifrico de la juventud Denicin 1.3.5 : Variables Discretas Las variables discretas pueden asumir solo ciertos valores, y hay usualmente huecos entre los valores (valores puntuales). Ejemplo 1.3.4 Las siguientes caractersticas son ejemplos de variables discretas nmero de cuartos en una casa nmero de carros en el estacionamiento del claustro nmero de estudiantes en la clase de estadsticas.

1.3. VARIABLES

Note que cada una de estas variables puede valer un nmero entero (por ejemplo: 1,2,3, etc.) pero no puede valer nmeros fraccionarios (por ejemplo: 1,5). Tpicamente, las variables discretas resultan de un conteo. Denicin 1.3.6 : Variables Continuas Las variables continuas pueden asumir todos los valores dentro de un rango especco (valores dentro de un intervalo) Ejemplo 1.3.5 Las siguientes caractersticas son ejemplos de variables continuas presin del aire en una llanta el tiempo que se toma en viajar de It a San Lorenzo el peso de los jugadores de ftbol del club Cerro Porteo Tpicamente, las variables continuas resultan de medir algo, y lgicamente dependen de la exactitud del instrumento de medicin.

1.3.2. Escalas de medicin


La estadstica no realiza sus funciones directamente sobre las modalidades observadas, sino que stas se representan por nmeros, y la estadstica realiza sus funciones sobre esos nmeros. Se llama medicin al proceso de atribuir nmeros a las caractersticas. La medicin estudia las condiciones de construccin de representaciones numricas, y los modelos desarrollados para la medicin se llaman escalas. Por lo tanto los datos se pueden clasicar de acuerdo con niveles de medicin. Hay cuatro escalas de medicin que son: nominal, ordinal, de intervalo y de razn. Denicin 1.3.7 : Escala Nominal El trmino nivel nominal es normalmente usado para referirse a datos que solamente pueden clasicarse en categoras. Es la escala de medicin ms bajo o ms primitiva. Sin embargo, no hay mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de medicin el orden en que estn acomodadas las categoras es totalmente arbitrario. Denicin 1.3.8 : Escala Ordinal Este tipo de nivel de medicin tiene caractersticas similares al nivel nominal con la diferencia de que en el nivel ordinal las categoras indican que unas son ms que las otras.

Captulo 2 Distribuciones de Frecuencia


2.1. Estadstica descriptiva
Como su nombre lo indica, la estadstica descriptiva es la parte de la estadstica que describe y resume una serie de datos. La estadstica descriptiva hace nfasis en tres aspectos: 1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una herramienta llamada distribucin de frecuencia y presenta la informacin por medio de tablas y grcas. 2. Las medidas de tendencia central: que resumen la informacin a una cifra que es representativa de la serie de datos. 3. Las medidas de variabilidad: que nos indican que tan variables son los datos respecto a las medidas de tendencia central. En este captulo se presenta una manera de elaborar una distribucin de frecuencia, en las secciones siguientes se abordarn los temas de medidas de tendencia central y medidas de variabilidad.

2.2. Construccin
Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las cuales se muestra el nmero de observaciones que contiene cada categora. Los pasos para la construccin de una distribucin de frecuencias son mejor explicados con un ejemplo. Ejemplo 2.2.1 Los siguientes datos son el nmero de meses de duracin de una muestra de 40 bateras para coche. 22 34 25 33 47 41 16 43 31 38 35 31 34 37 32 45 33 36 44 26 7 32 38 29 32 39 37 31 33 41 30 30 47 39 19 42 26 37 31 34 35

2.2. CONSTRUCCIN

Ordenacin de datos, que puede ser en orden ascendente o descendente El rango (amplitud) Rango = Dato mayor - Dato menor = 47 - 16 = 31 Nmero tentativo de los intervalos de clase (nic) El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo a la frmula : 2nic En este ejercicio, puesto que tenemos 40 datos el nic sera de 6. Tambin al nic le podemos calcular de la siguiente manera: nic = 1 + 3, 322log10 N = 1 + 3, 3222log10 40 = 6, 32 6 Tamao de los intervalos de Clase (tic) tic =
Rango nic

31 6

= 5,16 que se redondea a 6

Para facilitar la clasicacin de los datos, el tic se redondea siempre al entero posterior. Lmite inferior (LI) Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en este ejemplo es 16. El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande. Lmite superior (LS) El lmite superior se calcula con la siguiente frmula LS = LI + tic 1 Lmite Superior Real (LSR) Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites reales son el punto medio entre el lmite superior (LS) y el lmite inferior del siguiente intervalo ( LS + LIsig ) (LIsig), entonces LSR = 2 Marca de clase (X) La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms LI + LS representativo de los valores del intervalo. Con lo cual X = Clasicacin de los datos 2 y conteo de frecuencias Clasicar las observaciones en los intervalos. La prctica usual es marcar con una lnea ( / ) que representa una observacin. En el ejemplo la observacin 22 se clasica en el intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasicados todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase. Distribucin de frecuencia relativa (FR) Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir una distribucin de frecuencia en una distribucin de frecuencia relativa cada una de las frecuencias de clase ( F) Distribuciones de frecuencia se dividen entre el nmero total de observaciones FR = n acumulada

2.2. CONSTRUCCIN

Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuantas observaciones, o que porcentaje de observaciones estn debajo de cierto valor. La distribucin de frecuencia acumulada (FA) de cierto intervalo se calcula sumando las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del intervalo de inters. Si queremos la frecuencia acumulada del intervalo 25 - 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7. La distribucin de frecuencia relativa acumulada (FAR) de cierto intervalo se calcula dividiendo la frecuencia acumulada entre el nmero total de observaciones FA FRA = n LI LS 16 21 22 27 28 33 34 39 40 45 46 51 LSR 21,5 27,5 33,5 39,5 45,5 51,5 X 18,5 24,5 30,5 36,5 42,5 48,5 cuenta // //// ///// ///// /// ///// ///// /// ///// / // F FR 2 0,05 4 0,1 13 0,325 13 0,325 6 0,15 2 0,05 FA FRA 2 0,05 6 0,15 19 0,475 32 0,8 38 0,95 40 1

2.2.1. Representacin Grca


Las grcas que nos ayudarn a representar grcamente una distribucin de frecuencias son el histograma, el polgono de frecuencia y la ojiva de frecuencia acumulada. El histograma El histograma es una de las grcas ms ampliamente utilizadas y una de las mas fciles de entender. Un histograma describe una distribucin de frecuencia utilizando una serie de rectngulos adyacentes donde la altura de cada rectngulo es proporcional a la frecuencia de clase que representa.

Figura 2.1: Representacin grca de un histograma de frecuencia

Polgono de frecuencia El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados por la interseccin de las marcas de clase y las frecuencias de clase.

2.3. PROBLEMAS

10

Figura 2.2: Representacin grca de un polgono de frecuencia

2.3. Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas grcas: 1. Los resultados siguientes representan las calicaciones del examen nal de un curso de estadstica elemental. 23 80 52 41 60 34 60 77 10 71 78 67 79 81 64 83 89 17 32 95 75 54 76 82 57 41 78 64 84 69 74 65 25 72 48 74 52 92 80 88 84 63 70 85 98 62 90 80 82 55 81 74 15 85 36 76 67 43 79 61

2. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana. El nmero de cambios de aceite en la sucursal de la calle Roble en los pasados 20 das son: 66 98 55 62 79 59 51 90 72 56 70 62 66 80 94 79 63 73 71 85

Captulo 3 Medidas de tendencia central


Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propsito de una medida de tendencia central es indicar con toda precisin el centro de un conjunto de observaciones.

3.1. La Media
3.1.1. La Media Geomtrica
La media geomtrica es til para encontrar el promedio de porcentajes, proporciones, ndices, o tasas de crecimiento. Tiene mucha aplicacin en el comercio y la economa porque nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos econmicos como el producto nacional bruto. La media geomtrica de un conjunto de "n"nmeros enteros positivo se dene como la n-sima raz del producto de los n valores es decir: n X1 , X2 , . . . , Xn Ejemplo 3.1.1 Suponga que usted recibe un 5 % de aumento en su salario este ao y un 15 % de aumento el ao prximo y quiere saber cual es el incremento porcentual promedio. Si tiene un aumento del 5 % entonces su salario es 1,05 y si tiene un aumento del 15 % su salario es de 1,15 entonces calculando la media geomtrica se obtiene (1, 05)(1, 15) = 1, 09886, por lo que el aumento promedio anual es del 9, 886 %. Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron 3 %, 2 %, 4 % y 6 %. Cul es la media de las ganancias? Por lo que la media de ganancias obtenidas por Atkins Construction Company en los cuatro proyectos esta dada por 4 (0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464 o sea 3,464 %

11

3.1. LA MEDIA

12

3.1.2. La Media Aritmtica


La medida de tendencia central mas ampliamente usada es la media aritmtica, usualmente abreviada como media. La media aritmtica de un conjunto de n valores (observaciones) es el resultado de la suma de todos ellos dividido entre n.

3.1.3. Propiedades de la media aritmtica


1. Puede ser calculada en distribuciones con escala relativa e intervalar. 2. Todos los valores son incluidos en el cmputo de la media. 3. Una serie de datos solo tiene una media. 4. Es una medida muy til para comparar dos o ms poblaciones. 5. Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

3.1.4. Desventajas de la media aritmtica


1. Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media no es el promedio apropiado para representar la serie de datos. 2. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

3.1.5. La media para datos no agrupados


Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores dividido entre el nmero total de valores. Para encontrar la media de una muestra se usa la siguiente frmula:

X= Donde: X : es la media de la muestra


n

i=1

Xi
n

i=1

Xi : es la suma de todos los valores de la muestra

n : es el nmero de elementos de la muestra Ejemplo 3.1.3 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la media aritmtica de estas observaciones?

3.2. LA MEDIANA

13

X=

i=1

Xi
n =

85, 4 + 85, 3 + 84, 9 + 85, 4 + 84, 0 = 85, 0 5

3.1.6. La media de la poblacin


Las medidas caractersticas de una muestra son llamadas estadsticos y las medidas caractersticas de una poblacin se denominan parmetros. La media de la poblacin se calcula de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente notacin:

= Donde: : es la media de la poblacin

i=1

Xi
N

i=1

Xi : es la suma de todos los valores de la poblacin

N : es el nmero de elementos de la poblacin

3.2. La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la media aritmtica no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana. La mediana es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos. Ejemplo 3.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la mediana de las observaciones muestreadas? 85,9 85,4 85,4 84,3 84,0 = 85, 4 Por lo que la mediana es X Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?

3.3. LA MODA

14

25 29 30 32 35 35

En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales = 30 + 32 = 31 X 2

3.2.1. Propiedades de la mediana


1. Hay solo una mediana en una serie de datos. 2. No es afectada por los valores extremos ( altos o bajos ) 3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra en el intervalo abierto. 4. Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.

3.3. La moda
La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal y nominal. Es el valor de la observacin que aparece ms frecuentemente.

3.3.1. Propiedades de la moda


1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y relativa). 2. La moda tiene la ventaja de no ser afectada por valores extremos. 3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

3.3.2. Desventajas de la moda


1. En muchas series de datos no hay moda porque ningn valor aparece ms de una vez. 2. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual es el valor representativo de la serie de datos? Ejemplo 3.3.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la moda de las observaciones muestreadas? La moda de esta secuencia de observaciones es X=85,4

3.4. PROBLEMAS

15

3.4. Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento mensual (en pulgadas) de muestras de maz recien plantados 0,4 1,9 0,9 0,7 1,5 0,9 0,9 0,7 0,3 0,7 1,6 1,5 0,4 0,5 1,5 1,5 1,2 1,7 0,8 1,8

a) Organice los datos en un ordenamiento ascendente b) calcula las medidas de tendencia central considerando los a datos como simples 2. Un fabricante de neumticos quiere determinar el dimetro interior de cierto grado de los neumticos. Idealmente el dimetro sera 570mm. Los datos son los siguientes: 572 572 573 568 569 575 565 570 Encuentre las medidas de tendencia central y analice la relacin entre ellas

Captulo 4 Medidas de Variabilidad


4.1. Introduccin
Qu son las medidas de variabilidad? Las medidas de variabilidad de una serie de datos, muestra o poblacin, permiten identicar que tan dispersos o concentrados se encuentran los datos respecto a una medida de tendencia central. Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida de variabilidad pequea indica que los datos estn agrupados muy cerca, digamos, de la media. La media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una gran medida de variabilidad indica que la media no es muy representativa de los datos. Una segunda razn para estudiar la variabilidad de una serie de datos es para comparar como estn esparcidos los datos en dos o ms distribuciones. Por ejemplo, la calicacin promedio de dos estudiantes, A = {90, 80, 75, 75} y B = {90, 55, 85, 90}, es de 80. Basados en esto podramos pensar que sus calicaciones son idnticas. Pero si revisamos el detalle de sus calicaciones vemos que esta conclusin no es correcta.

4.2. Variabilidad
4.2.1. Varianza y desviacin estndar
La varianza y la desviacin estndar sirven para cuanticar la variabilidad de una muestra midiendo su dispersin alrededor de la media. Varianza Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media. Desviacin estndar Es la raz cuadrada de la varianza. 16

4.2. VARIABILIDAD

17

Varianza y desviacin estndar para datos no agrupados Las frmulas de la varianza de una poblacin y de una muestra son ligeramente diferentes. Las frmulas son:

2 = para la varianza de una poblacin y

i=1

(Xi )2
N
n

i=1

Xi2
N
n

(4.2.1)

S2 = para la varianza de una muestra.

i=1

(Xi X )2
n =

i=1

Xi2
n

(4.2.2)

Las desviaciones estndar de la poblacin y muestra se calculan simplemente sacando la raz cuadrada a la respectiva varianza. = 2 (4.2.3) desviacin estndar de una poblacin y S= desviacin estndar de una muestra Ejemplo 4.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85,4; 85,3; 84,9; 85,4; y 84,0. Cul es la varianza y la desviacin estndar de las observaciones muestreadas? X 85,4 85,3 84.9 85.4 84.0 Xi = 425, 0 Con lo cual la media de la muestra es X= entonces la varianza est dada por 425, 0 = 85 5 X2 7293,16 7276,09 7208,01 7293.16 7056.00 2 X = 36126, 42 S2 (4.2.4)

S2 =

i=1

Xi2
n

X =

36126, 42 852 = 0, 284 5

la cual arroja una desviacin estndar muestral de S = 0, 595818764

4.2. VARIABILIDAD

18

Varianza y desviacin estndar para datos agrupados Si los datos estn agrupados en una distribucin de frecuencia, la varianza y la desviacin estndar de la muestra se pueden aproximar sustituyendo S fi Xi2 por SXi2 y S fi Xi por SXi . Las frmulas quedaran de la siguiente manera:

2 =

i=1

fi (Xi )2 N =
N

i=1

fiXi2
N

(4.2.5)

para la varianza de una poblacin, en donde =

i=1

fiXi
N
n i=1

,y

S2 =

i=1

fi (Xi X )2 n =
n

fiXi2
n

(4.2.6)

para la varianza de una muestra, en donde X =

i=1

fiXi
n

Al igual que en la situacin anterior las desviaciones estndar de la poblacin y muestra se calculan sacando la raz cuadrada a la respectiva varianza. = 2 (4.2.7) desviacin estndar de una poblacin y S= desviacin estndar de una muestra Ejemplo 4.2.2 Calcular la varianza y la desviacin estndar de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche. duracin de las bateras (meses) 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 Nmero de bateras 2 1 4 15 10 5 3 S2 (4.2.8)

fi Xi2

Primeramente, calculamos la marca de clase, para despus calcular los productos fi Xi y para proceder nalmente a calcular las sumatorias fi Xi y fi Xi2 y aplicar las frmulas.

4.3. PROBLEMAS

19

LI LS 15 19 20 24 25 29 30 34 35 39 40 44 45 49

X 17 22 27 32 37 42 47

fi 2 1 4 15 10 5 3 n =40

fi Xi 34 22 108 480 370 210 141 fi Xi = 1365 1365 = 34, 125 40

fi Xi2 588 484 2916 15360 13690 8820 6627 2 fi Xi = 48475

Entonces la media de la muestra es X= con lo cual la varianza muestral es S2 =


i=1 n

fiXi2

n que arroja una desviacin estndar de

X =

48475 (34, 125)2 = 47, 359375 40

S = 6, 881814804

4.3. Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene estos datos: Fumadores No fumadores 69,3 56,0 28,6 25,1 22,1 26,4 47,6 53,2 34,9 29,8 48,1 38,5 52,7 34,4 30,2 30,6 60,2 31,8 43,8 41,6

a) Encuentre las medidas de tendencia central para cada grupo b) Encuentre la varianza y desviacin estndar de cada grupo c) Diga cual de los dos grupos de datos est ms concentrada 2. La compaa National Tire tiene fondos de reserva en valores negociable a corto plazo. El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables en lapso de dos semanas es el que mostramos a continuacin Semana 1 1973 Semana 2 1969 1970 1972 1892 1893 1975 1976 1887 1895

a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados obtenidos. b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeciente de variacin de cada grupo. c) Diga cual de los grupos tiene mejor concentracin

Captulo 5 Probabilidad
5.1. Deniciones y ejemplos
Denicin 5.1.1 Experimento: Es cualquier procedimiento mediante el cual obtenemos una observacin. En particular, para el estudio de la probabilidad nos interesa observar aquellos experimentos cuyos resultados no son pronosticables con certeza , esto es aquellos experimentos tales que cuando se les repite bajo las mismas condiciones iniciales, el resultado que se obtiene no siempre es el mismo, es decir aquellos en que existe aleatoriedad. Este tipo de experimento se denomina experimentos aleatorios simbolizado por . Ejemplo 5.1.1 A continuacin presentamos algunos ejemplos posibles de experimentos Lanzamiento de una moneda Tomar un punto de un circulo Elegir un alumno en el campus para preguntarle cuntos libros ha solicitado a prstamo en la biblioteca universitaria durante el ltimo mes. Contar el nmero de cabellos en la cabeza de una persona. Medir la resistencia elctrica de un componente electrnico Denicin 5.1.2 Espacio Muestral: Es el conjunto de todos los resultados individuales que puede tener un experimento aleatorio. El espacio muestral simbolizado por puede no ser nico. A cada uno de los elementos del espacio muestral se le llama punto muestral. Denicin 5.1.3 Evento: Es cualquier resultado posible al realizar un experimento aleatorio. Si un evento tiene un nico elemento, se le llama evento simple. En general, a cualquier subconjunto del espacio muestral se le llama evento compuesto. Ejemplo 5.1.2 Si un experimento aleatorio consiste en lanzar un dado y observar el nmero que aparece en la cara superior, entonces claramente el espacio muestral es el conjunto = {1; 2; 3; 4; 5; 6}. Como ejemplo de un evento para este experimento podemos denir el conjunto A = {2; 4; 6}, que corresponde al suceso de obtener como resultado un nmero par. Si al lanzar el dado una vez se obtiene el nmero 4, decimos entonces que se observ la ocurrencia del evento A, y si se obtiene por ejemplo el resultado 1, decimos que no se observ la ocurrencia del evento A. 20

5.2. OPERACIONES ENTRE EVENTOS

21

Ejemplo 5.1.3 Considere el experimento aleatorio de participar en un juego de lotera. Suponga que hay un milln de nmeros en esta lotera y un jugador participa con un boleto. Cul es un posible espacio muestral para este experimento?. Naturalmente al jugador le interesa conocer su suerte en este juego y puede proponer como espacio muestral el conjunto = {ganar; perder}. Sin embargo puede tambin tomarse como espacio muestral el conjunto que contiene a todos los posibles nmeros de esta lotera, es decir, = {1; 2; :::; 1000000}. Este ejemplo sencillo muestra que el espacio muestral de un experimento aleatorio no es nico y depende del inters del observador. Puesto que los conceptos de espacio muestral y evento involucran forzosamente la terminologa de conjuntos, recordaremos a continuacin algunas operaciones entre estos objetos, y algunas propiedades que nos seran de utilidad en el estudio de la probabilidad y la estadtica.

5.2. Operaciones entre eventos


Interseccin La interseccin de dos eventos dados A y B de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que pertenece a los dos eventos dados. El smbolo de la interseccin es .

Figura 5.1: Representacin grca de la interseccin de dos eventos

Unin La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El smbolo de la unin es . Complemento El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento es .

5.3. DEFINCIONES DE PROBABILIDAD

22

Diferencia Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el signo "menos"().

5.3. Denciones de probabilidad


La teora de la probabilidad es la parte de las matemticas que se encarga del estudio de los fenmenos o experimentos aleatorios. La probabilidad de un evento A, es un nmero real en el intervalo [0; 1] que denotaremos por P(A), y representa una medida de la frecuencia con la que se observa la ocurrencia del evento A cuando se efecta el experimento aleatorio en cuestin. Existen al menos cuatro deniciones de probabilidad las cuales explicamos a continuacin.

5.3.1. Concepto Clsico de Probabilidad


El primero en dar una denicin clsica de probabilidad fue Jakob Bernoulli en 1713, reformulada despus por Abraham De Moivre como: una fraccin; en la que el numerador es igual al nmero de apariciones del suceso dado y el denominador es igual al nmero total de casos en los que es suceso pueda o no pueda ocurrir. Tal fraccin expresa la probabilidad de que ocurra el suceso dado. El enfoque clsico de la probabilidad est basado en la suposicin de que todos los resultados del experimento son igualmente posibles o tienen el mismo peso. La denicin clsica de la probabilidad es la siguiente: Sea A un subconjunto de un espacio muestral de cardinalidad nita. Se dene la probabilidad del evento A como el cociente: P(A) = lo que usualmente se expresa como P(A) = nmero de casos favorables al evento A nmero total de resultados posibles del experimento #A # (5.3.1)

en donde el smbolo #A denota la cardinalidad o nmero de elementos del conjunto A. Claramente esta denicin es slo vlida para espacios muestrales nitos, pues forzosamente necesitamos suponer que el nmero de elementos en es nito. El espacio muestral debe ser equiprobable como ya se mencion, pues para calcular la probabilidad de un evento A dado, nicamente necesitamos contar cuntos elementos tiene A respecto del total, sin importar exactamente qu elementos particulares sean. Ejemplo 5.3.1 El experimento consiste en el lanzamiento de un dado. Cul es la probabilidad de que se obtenga como resultado un dos? Las caras del dado estn numeradas del 1 al 6, entonces hay solo una posibilidad de entre un total de seis de que el resultado del experimento sea el nmero 2, entonces la probabilidad de obtener el nmero 2 es 1 P(cae 2) = = 0, 16667 6

5.3. DEFINCIONES DE PROBABILIDAD

23

La principal dicultad que presenta esta interpretacin de la probabilidad es que se basa en sucesos equiprobables (todos los posibles resultados tienen la misma probabilidad de ocurrencia ), siendo fcil para problemas sencillos, como los de cartas, dados o urnas, es casi imposible para problemas ms complejos.

5.3.2. Concepto frecuentista de probabilidad


Bernoulli resolvi la cuestin de cmo hallar la probabilidad de ocurrencia de un suceso aun siendo imposible contar los casos favorables: Aqu hay otro camino disponible para alcanzar el resultado deseado. Lo que no se puede hallar a priori se puede obtener a posteriori, es decir, mediante la observacin mltiple de los resultados de pruebas similares. De esta manera, Bernoulli introdujo el concepto de probabilidad frecuentista o estadstica que consiste en asignar como probabilidad de un suceso, el resultado que se obtendra si el proceso se repitiera en condiciones similares un nmero grande de veces. Por lo tanto supongamos que se realizan n repeticiones de un cierto experimento aleatorio y sea A un evento cualquiera. Denotemos por n(A) el nmero de veces que ocurre el evento A en las n realizaciones del experimento. Se dene entonces la probabilidad frecuentista de A como indica el siguiente lmite n(A) P(A) = l m n n En este caso, debemos hacer notar que no es humanamente posible llevar a cabo una innidad de veces el experimento aleatorio, de modo que en la prctica no es posible encontrar mediante este mecanismo la probabilidad de un evento cualquiera. Esta limitacin hace que esta denicin de probabilidad no sea enteramente formal, pero tiene algunas ventajas. Ejemplo 5.3.2 Se quiere saber si una moneda est cargada. Para determinar la probabilidad de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cay cara. Si aplicamos la frmula 25 P(cae cara) = = 0, 4167 60 Algunas dicultades que presenta este enfoque de la probabilidad es que no dice cual es el nmero grande de observaciones necesario, o que se entiende por condiciones similares, porque si las condiciones son las mismas los resultados sern tambin los mismos.

5.3.3. Probabilidad subjetiva


En el segundo cuarto del siglo XX surgi una nueva interpretacin de la probabilidad llamada subjetiva, segn la cual la probabilidad mide el grado de creencia de un individuo en la verdad de una proposicin, variando entre 0 (el individuo cree que es falso) a 1 (cree que es cierto), es decir de lo que el observador conoce del fenmeno en estudio. Esta interpretacin fue propuesta por primera vez por el lsofo Frank P. Ramsey. Para los subjetivistas la probabilidad de un suceso debe variar en funcin de la nueva informacin recibida respecto del suceso.

5.4. TEOREMAS DE PROBABILIDAD

24

Segn este enfoque la probabilidad de que un evento en particular suceda es asignada basndose en cualquier informacin disponible, como intuicin, opiniones etc. Ejemplo 5.3.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prximo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o cualquier otra condicin externa, son elementos que slo algunas personas conocen y que podran darnos una idea ms exacta de esta probabilidad.

5.3.4. Concepto axiomtico de probabilidad


En la denicin axiomtica de la probabilidad no se establece la forma explcita de calcular las probabilidades sino nicamente se proponen las reglas que el clculo de probabilidades debe satisfacer. Esta teora axiomtica de la probabilidad fue desarrollada por el matemtico ruso Andrei N. Kolmogorov basandose como dijimos en la introduccin de este captulo en la teora de la medida estructurada por H. Lebesgue. El modelo matemtico propuesto por Kolmogorov en el ao 1933 para estudiar los experimentos aleatorios es el llamado espacio de probabilidad . Axiomas de Probabilidad Axioma 1: P(A) 0, con A Axioma 2: P() = 1 / , con i distintos de j, entonces Axioma 3: Si A1 , A2 , , tales que Ai A j = 0 P(

)=

n=1

n=1

P(Ai)

5.4. Teoremas de Probabilidad


5.4.1. Teorema 1: Regla de la Adicin
La probabilidad de que alguno de dos eventos pertenecientes a un mismo espacio muestral ocurra se determina mediante la siguiente ecuacin: P(A B) = P(A) + P(B) P(A B) Ejemplo 5.4.1 Si el experimento es lanzar un dado una vez, el espacio muestral es: S = {1, 2, 3, 4, 5, 6} Si el evento A es el resultado es un nmero par entonces A = {2, 4, 6} Si el evento B es el resultado es un nmero menor de 3 B = {1, 2} Cul ser la probabilidad de que suceda alguno de estos dos eventos?

5.4. TEOREMAS DE PROBABILIDAD

25

La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente: 2 1 3 1 y P(B) = = P(A) = = 6 2 6 3 Para aplicar este teorema es necesario conocer la probabilidad de la interseccin de estos dos eventos, para as poder conocer la probabilidad de la unin, o de manera inversa, conociendo la probabilidad de la unin se puede calcular la probabilidad de la interseccin. En este caso queremos saber la probabilidad de la unin conociendo la probabilidad de la interseccin, entonces es necesario conocer la interseccin de estos dos eventos, que es nmero par y menor de 3, con lo cual A B = {2} por lo que P(A B) = 1 6 Si aplicamos la regla de adicin: P(A B) = P(A) + P(B) P(A B) P(A B) = 1 1 1 2 + = 2 3 6 3

5.4.2. Teorema 2: Regla de la complementacin


La probabilidad de que el complemento de un evento A ocurra est dada por la siguiente ecuacin: P(A) = 1 P(A) Ejemplo 5.4.2 Si A es cae cara en el experimento consistente en lanzar un moneda, entonces la probabilidad de que no caiga cara es: P(A) = 1 P(A) = 1 1 1 = 2 2

5.4.3. Teorema 3: Regla de Diferenciacin


La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B pertenecientes al mismo espacio muestral est dada por P(A B) = P(A) P(A B) Ejemplo 5.4.3 Si el evento A es cae un nmero par y si el evento B es cae un nmero menor de 3, ambos pertenecientes al espacio muestral = {1, 2, 3, 4, 5, 6} que resulta del experimento aleatorio consistente en el lanzamiento de un dado, entonces la probabilidad de que caiga un nmero par pero no es menor que tres es: P(A B) = P(A) P(A B) = 3 1 = 0, 3333 6 6 2 1 = 0,167 6 6

Y la probabilidad de que caiga un nmero menor que tres pero no sea par es: P(B A) = P(B) P(AB) =

5.4. TEOREMAS DE PROBABILIDAD

26

5.4.4. Probabilidad Condicional


La probabilidad condicional, es la probabilidad de que un evento dado ocurra dado que otro evento ocurre. El operador de la probabilidad condicional es el signo |, esto es, la probabilidad condicional del evento A dado que ha ocurrido el evento B, denotada por P(A|B), se dene como sigue: P(A B) P(A|B) = P(B) Ejemplo 5.4.4 Considere el experimento de extraer un naipe de un mazo de 40 (baraja espaola), sean los eventos A = {se extrae un as} y B = {el naipe extraido es de copas}. Calcular P(A|B) Como en el mazo de 40 barajas hay un solo as de copas y 10 naipes de copas en total se tiene que 1 10 1 P(A B) = y P(B) = = 40 40 4 entonces la probabilidad de que ocurra A dado que se sabe que ocurri B es P(A B) P(A|B) = = P(B)
1 40 1 4

1 10

5.4.5. Teorema 4: Reglas de Multiplicacin


Regla de multiplicacin para eventos independientes Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de ocurrencia del otro. Para dos eventos independientes A y B, la probabilidad de que ambos eventos sucedan es encontrada mediante la multiplicacin de sus respectivas probabilidades, esto es P(A B) = P(A) P(B) Ejemplo 5.4.5 Una maquina empaca vegetales en una bolsa de plstico. Experiencias anteriores revelan que en ocasiones los paquetes tienen menos del peso correcto, y en otras ms, pero la mayora de las veces tiene el peso satisfactorio. Como muestra la siguiente tabla: Peso Probabilidad debajo del correcto 0,025 correcto 0,900 arriba del correcto 0,075 Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los tres pesen correctamente. Establezcamos los siguientes eventos: A = {el primer paquete pesa correctamente} B = {el segundo paquete pesa correctamente} C = {el tercer paquete pesa correctamente}

5.4. TEOREMAS DE PROBABILIDAD


La probabilidad de cada uno de estos eventos independientes es: P(A) = 0, 900 P(B) = 0, 900 P(C) = 0, 900 Segn el teorema de multiplicacin la probabilidad de que los tres eventos ocurran es: P(A B C) = P(A) P(B) P(C) = (0, 900) (0, 900) (0, 900) = 0, 729 Regla de multiplicacin para probabilidad condicional

27

Para dos eventos A y B, donde A depende de la ocurrencia de B, la probabilidad de que sucedan ambos eventos est dada por la frmula: P(A B) = P(B) P(A|B) Ejemplo 5.4.6 Cierto departamento de una compaa esta compuesto por 8 hombres y 4 mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistar a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, cual es la probabilidad de que las dos personas entrevistadas sean mujeres? Denamos entonces los siguientes eventos A = {el primer entrevistado es mujer} B = {el segundo entrevistado es mujer} La probabilidad de que suceda el evento A = {el primer entrevistado es mujer} es: P(A) = 4 1 = 12 3

La probabilidad de que suceda el evento B = {el segundo entrevistado es mujer} dado que ya sucedi A, y solo hay tres mujeres de 11 elementos es: P(B|A) = 3 11

Segn el teorema de multiplicacin, la probabilidad de que los dos eventos ocurran es: P(A B) = P(A) P(B|A) = 1 1 3 = 3 11 11

5.5. PROBLEMAS

28

5.5. Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoriamente a) tenga alguno de estos dos malos hbitos? b) no tenga ninguno de estos dos psimos hbitos? c) fume pero no tome? d) tome pero no fume? e) No fume? f) Fume dado que toma? g) Toma dado que fuma? h) No tenga alguno de estos nefastos hbitos? 2. Se realiz una encuesta sobre preferencias en materia de peridicos, de 350 personas entrevistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos peridicos. Encontrar la probabilidad de los siguientes eventos: a) Lee alguno de estos dos peridicos b) No lee ninguno de estos dos peridicos c) Lee el Diario pero el Heraldo no d) Lee el Heraldo pero el Diario no e) Lee el Heraldo dado que lee el Diario f) Lee el Diario dado que lee el Heraldo g) No lee alguno de estos dos Peridicos

Captulo 6 Variables aleatorias


6.1. Deniciones y ejemplos
Denicin 6.1.1 Una variable aleatoria es aquella que toma un conjunto de valores numricos asociados a los resultados de nuestro inters que produce un experimento aleatorio, es decir una funcin que asocia a cada evento del espacio muestral un nmero real. La denicin anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio muestral asociado a dicho experimento, una variable aleatoria es una transformacin X del espacio de resultados (espacio muestral) al conjunto de nmeros reales, esto es, asigna a cada elemento , un nmero real X (). La expresin matemtica est dada por: X : R A menudo se escribe simplemente v.a. en lugar del trmino variable aleatoria. En sentido estricto una variable aleatoria es una funcin de en R que satisface adems cierta condicin de medibilidad, pero omitiremos tales tecnicismos pues no son de utilidad para los propsitos de este curso. Suponga entonces que se efecta el experimento aleatorio una vez y se obtiene un resultado en R. Al transformar este resultado con la variable aleatoria X se obtiene un nmero real X () = x. Podemos entonces suponer que los posibles resultados del experimento aleatorio son los diferentes nmeros reales x que la funcin X puede tomar. Haremos aqui la siguiente observacin importante. Seguiremos la notacin usual de usar la letra mayscula X para denotar una variable aleatoria cualquiera, es decir, X es una funcin de en R, mientras que la letra minscula x denota un nmero real y que es un posible valor de la variable aleatoria. En general, las variables aleatorias se denotan usando las ltimas letras del alfabeto en maysculas, U , V, W , X , Y , Z , y para un valor cualquiera de ellas se usa la misma letra pero en minscula. Denicin 6.1.2 Una variable aleatoria es continua cuando toma todos los valores dentro de un intervalo (a, b) R. Ejemplo 6.1.1 En el ejemplo del lanzamiento de un dardo en un tablero circular de radio uno, el espacio muestral (Figura 6.1) es innito no numerable, las variables X , Y , Z , V y W denidas all son todas variables aleatorias continuas. Si se dibujan crculos concntricos alrededor del origen y si se asignan premios asociados a cada una de las regiones resultantes, puede obtenerse un ejemplo de una variable aleatoria discreta sobre este espacio muestral. 29

6.2. DISTRIBUCIN DE PROBABILIDAD

30

6.2. Distribucin de probabilidad


En esta seccin vamos a estudiar a las dos funciones que se asocian a cada variable aleatoria y que adems nos provean de informacin acerca de las caractersticas de dicha variable aleatoria. Una de estas funciones es llamada funcin de distribucin y se asocia a una variable continua o discreta, la otra depende del tipo de variable estudiada, en el caso continuo se denomina funcin de densidad de probabilidad y en caso discreto simplemente funcin de probabilidad. Estas funciones nos permiten representar a un mismo tiempo tanto los valores que pueden tomar la variable aleatoria como las probabilidades de los distintos eventos involucrados. Entonces en primer trmino deninamos primero la funcin de probabilidad para una variable aleatoria discreta, despus la funcin de densidad para una variable continua, y nalmente denamos la funcin de distribucin para ambos tipos de variables aleatorias.

6.2.1. Distribuciones discretas


Las distribuciones de variables aleatorias discretas ms importantes son las siguientes: a) Distribucin binomial b) Distribucin binomial negativa c) Distribucin Poisson d) Distribucin geomtrica e) Distribucin hipergeomtrica

6.2.2. Distribuciones continuas


Las distribuciones de variable continua ms importantes son las siguientes: a) Distribucin ji cuadrado b) Distribucin exponencial c) Distribucin t-student d) Distribucin normal e) Distribucin Gamma f) Distribucin Beta Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con curvas.

6.3. Esperanza, varianza, momentos y Distribuciones


Todos los seres humanos tenemos caractersticas numricas que nos identican y nos distinguen de otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiramos considerar la totalidad de todos estos nmeros para una persona en particular, la identicaramos de manera nica. Algo similar sucede con las variables aleatorias. En esta seccin estudiaremos algunas caractersticas numricas asociadas a las variables aleatorias.

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

31

6.3.1. Esperanza
Denicin 6.3.1 Esperanza La esperanza de una variable aleatoria X es un nmero real denotado por E (X ) y que se calcula como sigue: 1. Si X es una variable aleatoria discreta con funcin de probabilidad f (x), entonces: E (X ) = x f (x)
x

en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable aleatoria X , y se dene cuando esta suma sea absolutamente convergente, es decir, E (X ) = |x| f (x)
x

El nmero de sumandos puede ser nito o innito dependiendo del conjunto de valores de la variable aleatoria. 2. Si X es una variable aleatoria continua con funcin de densidad de probabilidad f (x), entonces la esperanza es

E (X ) =

x f (x)dx

suponiendo que esta integral es absolutamente convergente, es decir,


E (X ) =

|x f (x)|dx

6.3.2. Varianza
Denicin 6.3.2 (Varianza) La varianza de una variable aleatoria X , denotada por Var(X ), se dene como la siguiente esperanza, si sta existe, [x E (X )]2 f (x) si X es una v.a. discreta x Var(X ) = E [X E (X )]2 = [x E (X )]2 f (x)dx si X es una v.a. continua

6.3.3. Distribucin binomial


La distribucin binomial fue desarrollada por suizo Jakob Bernoulli (1654-1705), es la principal distribucin de probabilidad discreta. La variable aleatoria binomial y su distribucin estn basadas en un experimento que satisface las condiciones citadas a continuacin.

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

32

Construccin de la distribucin binomial Suponga que se realizan n ensayos idnticos independientes de Bernoulli en donde la probabilidad de xito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad de xito igual a p y la del fracaso igual a 1 p, con p (0, 1). El espacio muestral de este experimento consiste de todas las posibles sucesiones de longitud n de xitos y de fracasos, esto es = {(EEE . . . E ), (FEE . . . E ), (FFE . . . E ), . . . , (FFF . . . FE ), (FFF . . . F )} Usando el principio multiplicativo, es fcil ver que este conjunto tiene 2n elementos. Si ahora se dene la variable aleatoria X como el nmero de xitos en cada una de estas sucesiones, esto es X (EEE . . . E ) = n, X (FEE . . . E ) = n 1, . . . , X (FFF . . . EF ) = 1, X (FFF . . . F ) = 0 entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribucin binomial con parmetros n y p. Se escribe X bin(n, p), y su funcin de probabilidad es f (x) = n! px (n p)1x si x = 0, 1, . . . , n x!(n x)! 0 para otro caso

Proposicin 6.3.1 Sea X bin(n, p), entonces tenemos que a) E (X ) = np b) Var(X ) = n(1 p) c) MX (t ) = (1 p + pet )n Ejemplo 6.3.1 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la de obtener un fracaso es tambin 0,50. a) Cul es la probabilidad de no obtener caras en los cuatro lanzamientos? b) Cul es la probabilidad de obtener dos caras en los cuatro lanzamientos? c) Haga una distribucin de probabilidad binomial d) Calcular la media, la desviacin estndar y la funcin generadora de momentos de esta distribucin binomial Esta distribucin binomial tiene por funcin de probabilidad a la siguiente funcin ( 1 )x ( 1 )4x 4! si x = 0, 1, 2, 3, 4 x!(4 x)! 2 2 f (x) = 0 para otro caso

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES


= ( 1 )4 4! si x = 0, 1, 2, 3, 4 x!(4 x)! 2 0 para otro caso

33

a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es, ( 1 )4 4! 1 P(X = 0) = = 0!(4 0)! 2 16 b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es, ( 1 )4 4! 6 3 P(X = 2) = = = 2!(4 2)! 2 16 8 c) La distribucin de probabilidad est dada por la siguiente tabla x 0 1 p(x) 1/16 4/16 2 3/8 3 1/4 4 1/16

c) Teniendo en cuenta la proposicin 7.1.1 tenemos que la esperanza, la varianza y la funcin generadora de momentos son respectivamente 1 =2 2 1 1 Var(X ) = 4 = 1 2 2 ( 1 1 t )4 1 MX (t ) = 1 + e = (et + 1)4 2 2 16 E (X ) = 4

6.3.4. Distribucin Poisson


Construccin de una distribucin de Poisson Supongamos que deseamos observar el nmero de ocurrencias de un cierto evento dentro de un intervalo de tiempo dado, por ejemplo, el nmero de clientes que llegan a un cajero automtico durante la noche, o tal vez deseamos registrar el nmero de accidentes que ocurren en cierta avenida durante todo un da. Para modelar este tipo de situaciones podemos denir la variable aleatoria X como el nmero de ocurrencia de este evento en el intervalo de tiempo dado. Es claro entonces que X puede tomar los valores 0, 1, 2, . . . , y en principio no ponemos una cota superior para el nmero de observaciones del evento. Adicionalmente supongamos que conocemos la tasa media de ocurrencia del evento de inters, que denotamos por la letra (lambda). El parmetro es positivo y se interpreta como el nmero promedio de ocurrencias del evento, por unidad de tiempo. La probabilidad de que la variable aleatoria X tome un valor entero x 0 se denir a continuacin. Decimos que X tiene una distribucin Poisson con parmetro > 0, y escribimos X Poisson() cuando: e x si x = 0, 1, 2, . . . x! f (x) = 0 para otro caso

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES


Proposicin 6.3.2 Sea X Poisson(), entonces tenemos que a) E (X ) = b) Var(X ) = c) MX (t ) = e(e 1)
t

34

Relacin con la distribucin binomial La distribucin de Poisson puede ser vista como un caso lmite de la distribucin binomial, es decir, una distribucin binomial en la que n y p 0 se puede aproximar por una distribucin de Poisson de parmetro = np. Ejemplo 6.3.2 En una central telefnica automtica la probabilidad de que una llamada sea conectada errneamente es 103 . a) Para un da donde son conectadas 2000 llamadas independientes, hallar el valor aproximado de la probabilidad que se efecten 4 conexiones errneas. b) Cul es el nmero mnimo de llamadas independientes que se requieren para asegurar con probabilidad 0,9 que por lo menos una de las llamadas sea conectada errneamente? Desarrollo a) Sea X la v.a que represente el nmero de llamadas telefnicas conectadas errneamente en un da determinado. Entonces la funcin de probabilidad de X est dada por: P(X = x) = enp (np)x x!

donde p = 103 y n = 2000 segn las condiciones de este problema. Entonces np = 2 y e2 (2)4 P(X = 4) = = 0, 09 4! b) Si X es nuevamente el nmero de llamadas conectadas errneamente en un da determinado entonces X Poisson(np). Segn la informacin P(X 1) 0, 9 y considerando que P(X 1) = 1 P(X < 1) = 1 P(X = 0) entonces: enp (np)0 1 0, 9 0! 0, 1 enp ln|0, 1| np n 2303 llamadas

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

35

6.3.5. Distribucin Normal


La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la campana de Gauss. La distribucin de una variable normal est completamente determinada por dos parmetros, su media smbolizada por y su desviacin estndar simbolizada por . La distribucin continua de probabilidad ms importante de toda la estadstica es la distribucin de probabilidad normal. Denicin 6.3.3 Decimos que una v.a. X tiene distribucin de probabilidad normal si su funcin de densidad de probabilidad est denida por la siguiente ecuacin:
1 x 2 1 f (x) = e 2 ( ) , para 22

< x <

en donde R y > 0 son los parmetros. Escribimos entonces X N (, 2 ). La grca de esta funcin de densidad tiene forma de campana como se puede apreciar en la Figura 7.5, en donde se muestra adems el signicado geomtrico de los dos parmetros. No es inmediato pero es posible demostrar que E (X ) = , y ello signica que la campana esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede demostrarse que Var(X ) = 2 , y que la distancia del punto a cualquiera de los dos puntos en donde la funcin tiene puntos de inexin es , por lo tanto la campana se abre o se cierra de acuerdo a la magnitud de este parametro. Caractersticas de la distribucin de probabilidad normal La distribucin de probabilidad normal con su curva tiene las siguientes caractersticas: 1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin. 2. La distribucin de probabilidad normal es simtrica alrededor de su media. Por o tanto, la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El rea total bajo la curva es igual a 1. 3. La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja de la media en cualquier direccin. Esto signica que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar. La familia de la distribucin de probabilidad normal La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grca es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntalamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

36

torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por lo tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin. Como se deduce, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de sus medias y sus varianzas. Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas estarn centradas en la misma posicin y tendrn diferentes formas; tal como lo muestra la Figura 7.6. La distribucin normal estndar En particular, decimos que la variable aleatoria X tiene una distribucin normal estndar si tiene una distribucin normal con parmetros E (X ) = = 0 y Var(X ) = 2 = 1. En este caso la funcin de densidad se reduce a la siguiente expresin
x2 1 f (x) = e 2 2

Para facilitar los clculos se decidi tabular las diferentes probabilidades para variable aleatoria que sigue una distribucin normal. Pero, puesto que sera imposible tener una tabla para cada posible distribucin normal, se elabor solamente una, la tabla de la distribucin normal estndar. De esta manera solo se tiene que transformar o estandarizar una distribucin normal especca, se revisa la tabla, y se conoce la probabilidad. Para la estandarizacin se debe realizar la siguiente operacin. Proposicin 6.3.3 Sea X una variable aleatoria con distribucin normal con parmetros y 2 . Entonces la siguiente variable aleatoria tiene una distribucin normal estndar Z= x (6.3.1)

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

37

reas bajo la curva normal Una caracterstica que tiene cualquier distribucin normal es que el rea bajo la curva, que representa la probabilidad de que la variable aleatoria tome ciertos valores X x, se distribuye siempre en la misma proporcin. En la tabla de la distribucin normal estndar, estn registradas las reas bajo la curva normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se necesita transformar la distribucin normal de inters en una distribucin normal estndar mediante la frmula, y el rea a la derecha del valor z ser el mismo que el rea a la derecha de x, esto es P(X x) = P(Z z). Ejemplo 6.3.3 Los coecientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que: a) tenga un coeciente mayor de 120 b) tenga un coeciente menor de 100 c) tenga un coeciente menor de 122 d) tenga un coeciente entre 115 y 125 e) tenga un coeciente entre 90 y 105 Desarrollo Segn las condiciones del problema la v.a. X representa el coeciente intelectual del estudiante elegido y adems X N (115, 144) Para calcular las probabilidades de los distintos itens debemos transformar esta distribucin normal en una distribucin normal estndar (con media cero y desviacin estndar 1), x 115 para lo cual hay que cambiar el valor de x por un valor z con la frmula z = . Entonces 12 la probabilidad de que:
(

a) tenga un coeciente mayor de 120 es: P(X > 120) = P Z >

120 115 ) = P(Z > 0, 41) 12

La distribucin ya transformada queda as: Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal estandar, que es el valor 0,1591 . Y como el rea a la derecha del valor z = 0, 41 es el rea que buscamos, entonces este es el resultado, es decir, la probabilidad de que un aspirante a la universidad tenga un coeciente intelectual mayor de 120 es P(X > 120) = P(Z > 0, 41) = 0, 5 0, 1591 = 0, 3409 b) tenga un coeciente menor de 100 es: ( 100 115 ) P(X < 100) = Z < = P(Z < 1, 25) 12 La distribucin ya transformada queda as: En la tabla de reas bajo la curva normal estandar no se tabularon valores z negativos, pero como la curva normal es simtrica,

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

38

el rea entre cero y el valor z = 1, 25 smbolizado por A(1, 25); es del mismo tamao que el rea entre cero y el valor z = 1, 25 dada por A(1, 25), por lo que solo se necesita buscar en la tabla el rea correspondiente al valor positivo de z. Como el rea que se busca esta a la izquierda de z = 1, 25, se tiene que: P(X < 100) = P(Z < 1, 25) = 0, 5 A(1, 25) = 0, 5 0, 3944 = 0, 1056 c) tenga un coeciente menor de 122 es: ( 122 115 ) = P(Z < 0, 58) P(X < 122) = Z < 12 La distribucin ya transformada queda as: Se busca el valor del rea para 0 Z 0, 58 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el rea que buscamos, entonces el resultado a buscar es: P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190 d) tenga un coeciente entre de 115 y 125 es: P(115 < X < 125) = ( 115 115 12 <Z< 125 115 ) = P(0 < Z < 0, 83) 12

Se busca el valor del rea para 0 Z 0, 83 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83, entonces el resultado a buscar es: P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967 e) tenga un coeciente entre de 90 y 105 es: P(90 < X < 105) = ( 90 115 12 <Z< 105 115 ) = P(2, 08 < Z < 0, 83) 12

Se busca el valor del rea para 2, 08 Z 0, 83 en la tabla de reas bajo la curva normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83, entonces el resultado a buscar es: P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967

6.3. ESPERANZA, VARIANZA, MOMENTOS Y DISTRIBUCIONES

39

Vous aimerez peut-être aussi