Vous êtes sur la page 1sur 137

UNIVERSIDAD CENTRAL DEL ECUADOR

SEDE SANTO DOMINGO

CARRERA DE COMERCIO Y ADMINISTRACION

ESTADISTICA APLICADA

Tercero A

AUTORA: Gabriela Elizabeth Rosero TUTOR : MSc. Nelson Landzuri

Santo Domingo, Enero 2012

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

INDICE
INTRODUCCION .................................................................................. 5

UNIDAD I .............................................................................................. 6 OBJETIVOS ........................................................................................ 6 CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVA . 7

Medidas de posicin: media, moda, mediana............................... 12 Medidas de variacin: varianza y desviacin tpica. .................... 23 ACTIVIDADES .................................................................................... 27 EVALUACION ..................................................................................... 29

UNIDAD II PROBABILIDAD ................................................................................ 30 OBJETIVOS ....................................................................................... 30

Definicin: probabilidad, eventos, experimentos y resultados ...... 31 Espacio y punto muestral ............................................................. 32 Propiedades ................................................................................. 33 Probabilidad excluyente, condicional e independiente ............... 33 Esperanza matemtica ................................................................. 34 Tabla de probabilidad y de contingencias .................................... 35 Anlisis combinatorio: permutacin y combinacin ...................... 36 ACTIVIDADES .................................................................................... 38 EVALUACION ..................................................................................... 39

UNIDAD III OBJETIVOS ....................................................................................... 40 DISTRIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUAS....................................................................................... 41 2

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Variables aleatorias. .................................................................... 42 Distribuciones discretas y continuas de probabilidad. ................. 46 Distribuciones empricas: la media, desviacin estndar y la varianza ................................................................................. 62 Teorema de chebischev ............................................................... 69 Varianza covarianza (ANOVA) .................................................... 71 Distribucin uniforme discreta ..................................................... 73 Distribucin binorial y multinorial ................................................. 74 Distribucin hipergeomtrica ........................................................ 76 Distribucin posson ...................................................................... 79 Distribucin normal. ..................................................................... 82 Distribucin exponencial ............................................................... 85 ACTIVIDADES ................................................................................... 89 EVALUACION ..................................................................................... 91

UNIDAD IV PRUEBAS DE HIPOTESIS ................................................................ 92 OBJETIVOS ....................................................................................... 92

Prueba de hiptesis para media poblacional ................................ 93 Prueba de hiptesis de la varianza. ............................................. 93 Prueba Ji cuadrada ..................................................................... 97 ACTIVIDADES .................................................................................... 99 EVALUACION ................................................................................... 100

UNIDAD V DISTRIBUCIONES DE MUESTREO ................................................ 101 OBJETIVO ........................................................................................ 101

Muestreo aleatorio ...................................................................... 102 3

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribuciones mustrales........................................................... 107 Distribuciones mustrales de medias. ...................................... 112 Distribucin t de student ............................................................. 113 Distribucin F.............................................................................. 125 ACTIVIDADES .................................................................................. 135 EVALUACION ................................................................................... 136

BIBLIOGRAFIA ................................................................................. 137

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

INTRODUCCION

La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin. En este caso la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin. Aplicada a la investigacin cientfica, tambin infiere cuando provee los medios matemticos para establecer si una hiptesis debe o no ser rechazada. La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc.

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD I
CONTENIDOS CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVA

Medidas de posicin: media, moda, mediana Medidas de variacin: varianza y desviacin tpica.

OBJETIVOS: Conocer sobre la Estadstica Descriptiva y describir sus caractersticas principales. Determinar cuales son las Medidas de Posicion y Variacion; sus caracteristicas y para que sirven. Realizar ejercicios practicos, mediante la modelacin matemtica y estadstica

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVA


INTRODUCCIN Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin. La Estadstica Descriptiva es la parte que conocemos desde los cursos de educacin primaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as evitar malentendidos, tergiversaciones o errores. Estadstica Descriptiva e Inferencial Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, poblacin, partiendo de lo especfico, muestra. las cuales llevan implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadstica inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener informacin de un

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

colectivo mediante un metdico procedimiento del manejo de datos de la muestra. En sus particularidades la Inferencia distingue la Estimacin y la Contrastacin de Hiptesis. Es estimacin cuando se usan las caractersticas de la muestra para hacer inferencias sobre las caractersticas de la poblacin. Es contrastacin de hiptesis cuando se usa la informacin de la muestra para responder a interrogantes sobre la poblacin. Anlisis estadstico El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e interpretacin de datos para realizar inferencias. Representacin de tronco y hoja

Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos estadsticos tradicionales, y que adems proporciona informacin rpida, visual y es relativamente nueva, es la representacin grfica de tronco y hoja. Esta representacin se basa en la ordenacin de los datos a manera de grfico, pero sin llegar a ello, utilizando las decenas y las unidades. Esta tcnica se puede encontrar en el libro de Freund y Simon, pero comentaremos su uso a travs del siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemticas:
78 66 93 73 61 76 100 81 70 83 83 64 88 91 74 70 97 77 72 86

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir, el nmero 51 se ver como 5 | 1. De esta manera las decenas se pondrn en una columna, en forma vertical, y las unidades a su derecha:
6 7 8 9 10 1 8 3 3 0 6 0 8 7 4 4 2 3 6 0 7 1 3 6 1

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66 y 64.

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Esta es la representacin grfica tronco y hoja, donde cada rengln es una posicin de tronco y cada dgito de la derecha es una hoja. El procedimiento para realizarla es primero empezar con los troncos, es decir la columna de la izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical, en el tronco correspondiente. Adems, si se desean tener los datos ordenados, y hay gente que lo prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede como sigue:
6 7 8 9 10 1 0 1 1 0 4 0 3 3 6 2 3 4 6 7 8 3 6 8 7

En realidad una representacin de tronco y hojas presenta la misma informacin que la lista original de datos, pero de una manera mucho ms compacta (especialmente si la lista de datos es ms grande) y manejable. Sin embargo, informacin ms compleja resulta un poco ms difcil de manejar, por lo que en ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u otras posiciones de los nmeros para las troncos. En cada uno de esos casos conviene hacer alguna anotacin, o poner una nota, a fin que los lectores puedan identificar las adecuaciones realizadas y as poder interpretar lo que se quiere transmitir. Para mostrar la informacin de manera ms clara, es posible modificar el nmero de posiciones del posiciones del tronco, aumentndola o disminuyndola de acuerdo a las necesidades particulares de cada problema. Por ejemplo, con los datos del examen anterior, se pueden dividir en dos cada posicin del tronco, utilizando la primera posicin para disponer las hojas 0, 1, 2, 3 y 4, y la segunda posicin para las hojas restantes. De esta manera, se obtiene la representacin grfica de doble tronco:
66+ 77+ 88+ 99+ 101 6 0 6 1 6 1 7 0 4 0 2 3 4 7 8 3 3 8 3

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Con esto se han duplicado el nmero de posiciones del tronco, con la intencin de buscar una mayor claridad en la presentacin. Esta manera de representacin inicial de los datos no la profundizaremos ms, sino que la utilizaremos ms adelante en algunos casos para, precisamente, presentar una representacin inicial de la informacin obtenida.

Poblacin Y Muestra

Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o generalizar resultados de una muestra a una poblacin. Se estudia en particular a un reducido nmero de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la poblacin de la cual esa muestra procede. Este proceso de inferencia se efecta por medio de mtodos estadsticos basados en la probabilidad. La poblacin representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogneo que rene unas caractersticas determinadas. La muestra es el conjunto menor de individuos (subconjunto de la poblacin accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la poblacin ). El individuo es cada uno de los componentes de la poblacin y la muestra. La muestra debe ser representativa de la poblacin y con ello queremos decir que cualquier individuo de la poblacin en estudio debe haber tenido la misma probabilidad de ser elegido. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar 3: a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. b. Como consecuencia del punto anterior ahorraremos costes. c. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. d. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales que si las tuvisemos que realizar a una poblacin. e. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al indicar los criterios de inclusin y/o exclusin.

10

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Tipo de datos

Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensin arterial sistlica, etctera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos adems concretar la escala de medida que aplicaremos a cada variable. La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms apropiado para abordar su anlisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos tipos 3-5: variables cuantitativas o variables cualitativas. a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numricamente. Las variables cuantitativas pueden ser de dos tipos: o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numrico determinado (edad, peso, talla). o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (nmero de hijos, nmero de partos, nmero de hermanos, etc).

b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categoras. La situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo, profesin, etctera). En el proceso de medicin de estas variables, se pueden utilizar dos escalas:
o

Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos, sexo, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera). Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarqua entre las categoras (grados de disnea, estadiaje de un tumor, etc.).

11

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIDAS DE POSICION

Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin de stos dentro de un contexto de valores posible. Una vez definidos los conceptos bsicos en el estudio de una distribucin de frecuencias de una variable, estudiaremos las distintas formas de resumir dichas distribuciones mediante medidas de posicin (o de centralizacin), teniendo presente el error cometido en el resumen mediante las correspondientes medidas de dispersin. Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribucin de frecuencias mediante algunos valores numricos, eligiendo como resumen de los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable Son medidas estadsticas cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama "Medidas de Tendencia Central ". Las m ed id a s d e p osici n dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las med id a s de po sici n es necesario que los d a t o s estn ordenados. Supongamos que queremos describir de una forma breve y precisa los resultados obtenidos por un conjunto de alumnos en un cierto examen; diramos: a) La nota media de la clase es de 6,5. b) La mitad de los alumnos han obtenido una nota inferior a 5. c) La nota que ms veces se repite es el 4,5. En la expresin a) se utiliza como medida la media aritmtica o simplemente la media. En la b) se emplea como medida la mediana, que es el valor promedio que deja por debajo de ella la mitad de las notas y por encima de ella la otra mitad. Y en la c) se usa el valor de la nota que ms veces se ha repetido en ese examen, este valor es la moda.

12

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIA ( X )
Media aritmtica o simplemente media; es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi. Propiedades de la media aritmtica 1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a la media de la misma igual a cero.

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 = = 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la media aritmtica queda aumentada en dicho nmero. 4. Si todos los valores de la variable se multiplican por un mismo nmero la media aritmtica queda multiplicada por dicho nmero. Media aritmtica para datos no agrupados Podemos diferenciar la frmula del promedio simple para datos poblaciones y muestrales:

13

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica el tamao de la poblacin, mientras que n el de la muestra). Ejemplo: El profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,0 3,1 3,5 2,4 3,8 4,0 4,2 3,5 4,0

Cul es el promedio de notas de los alumnos de la clase? SOLUCIN Aplicando la frmula para datos no agrupados tenemos: Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica comparada con las dems, que estn ubicadas entre 3,0 y 4,2. Media aritmtica para datos agrupados Cuando los datos se agrupan en tablas tipo A, la media aritmtica es igual a la divisin de la sumatoria del producto de las clases por la frecuencia sobre el nmero de datos. La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el ltimo (Nc), siendo Xi la clase del intervalo i. Cuando los datos se agrupan en tablas de frecuencias tipo B, el clculo de la media vara un poco, ya que existe una prdida de informacin en el momento en que se trabaja con intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno de ellos).

14

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Las marcas de clases (Mc) cumple la funcin de representar los intervalos de clase. Ejemplo: media aritmtica para datos agrupados en tablas tipo A La siguiente tabla de frecuencia muestra el nmero de preguntas de 81 encuestados sobre un Test que consta de solo seis preguntas.

Preguntas Buenas 1 2 3 4 5 6

Personas 15 13 8 19 21 5

SOLUCIN

PASO 1:

Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta. Para efectos del clculo de la media, deberamos sumar 15 veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la ltima clase:

PASO 2: Dividir la sumatoria sobre el nmero total de datos.


En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3,41) preguntas buenas.

Ejemplo: media aritmtica para datos agrupados en tablas tipo B Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:

15

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ni 1 2 3 4 5 6 7 8

Lm 40,0 48,1 56,1 64,1 72,1 80,1 88,1 96,1

Ls 48,1 56,1 64,1 72,1 80,1 88,1 96,1 104,0

f 3 8 11 32 21 18 14 1

Mc 44,1 52,1 60,1 68,1 76,1 84,1 92,1 100,1

SOLUCIN Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores exactos que estn dentro de dicho intervalo.

PASO 1: Realizar la sumatoria del producto resultante entre las marcas


de clase por su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el nmero total de datos.


Ejemplo: comparativa entre el clculo de la media aritmtica para datos no agrupados y datos agrupados en tablas tipo B Calcular la media aritmtica a los siguientes datos sin agrupar y agrupndolos en una tabla de frecuencia tipo B (suponga que los datos son poblacionales): 47,8 18,6 18,6 12,8 33,6 23,1 11,0 21,0 43,1 40,9 12,4 32,0 26,3 18,1 15,2 35,4 12,4 11,1 38,1 33,2 44,0 49,4 21,4 16,8 48,2 26,2 41,4 30,6 12,4 37,0

16

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

SOLUCIN Calculemos la media para los datos sin agrupar: Luego construyamos la tabla tipo B y calculemos su media aritmtica con el fin de comparar ambos resultados:

Ni 1 2 3 4 5 6

Lm 11,00 17,41 23,81 30,21 36,61 43,01

Ls 17,41 23,81 30,21 36,61 43,01 49,40

f 8 6 2 5 4 5

Mc 14,21 20,61 27,01 33,41 39,81 46,21

Total

30

PASO 1: Realizar la sumatoria del producto resultante entre las marcas


de clase por su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el nmero total de datos.


Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la tabla tipo B existe una perdida de informacin, al agrupar los datos en los intervalos de clase. El valor de la media exacta es el calculado para los datos no agrupados, pero dada la proximidad de la media para los datos agrupados, se tomar esta ltima como cierta.

17

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIANA (Me)
Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.

Caractersticas de la mediana
1. No est definida algebraicamente 2. Cuando la localizacin del elemento central puede ser determinada y los lmites de clase mediana son conocidos, la mediana para la distribucin de frecuencias puede ser calculada por interpolacin, no importando que sta contenga intervalos abiertos, cerrados, iguales o diferentes. 3. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la mediana es mnimo. Clculo de la mediana 1. Ordenamos los datos de menor a mayor. 2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. Ej. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

18

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5

Clculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Me = mediana Li = es el lmite inferior de la clase donde se encuentra la mediana.

=es la semisuma de las frecuencias absolutas. nb =numero de observaciones bajo el intervalo critico. nd = numero de observaciones dentro del intervalo critico. i = intervalo ic = intervalo critico por el cual pasa la mediana. La mediana es independiente de las amplitudes de los intervalos.

Ejemplo: Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

19

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

X 115-129 100-114 85-99 70-84 total

fi 1 4 8 2 15

Fa 15 14 10 2

xm

N/2 = 100 / 2 = 50
129.5

Li = 84.5
114.5

nb = 2
99.5 84.5

nd = 8 i= 15

[ ] Me= 84.5+15(0.6875) Me= 84.5+10.31 Me= 94.81

MODA (Mo)
Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene por qu ser nica.

Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. 20

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Caractersticas de la Moda. 1. Representa ms elementos que cualquier otro valor 2. La moda no permite conocer la mayor parte de los datos 3. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente. 4. Puede usarse para datos cuantitativos como cualitativos 5. Cuando se tienen dos o ms modas es difcil su interpretacin. Clculo de la moda para datos simples Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Hallar la moda de los siguientes datos:


12-12-13-13-15-14-16-18-19-14-16-12-15-14-15-12-15-14-18

Mo = 12 Clculo de la moda para datos agrupados: Todos los intervalos tienen la misma amplitud.

21

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:
X [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) total fi 5 18 42 27 8 100 Xm 61.5 64.5 67.5 70.5 73.5

Mo= 67.5

22

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIDAS DE VARIACION
Las medidas de variacin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

VARIANZA
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza

para

datos

agrupados

23

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin para datos simples:


9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla para datos agrupados:


xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

24

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DESVIACION TIPICA
Concepto estadstico. La desviacin tpica (DT) o desviacin estndar es la medida ms til de la variabilidad de los resultados de una muestra. La DT es una medida de la magnitud en que se desvan las diversas puntuaciones obtenidas de su valor medio. Si las puntuaciones se agrupan estrechamente en torno a la media, la DT er relativamente pequea; si se extienden en todas direcciones, la DT ser relativamente grande. Para calcular la desviacin tpica primero calculamos el valor medio; a continuacin, hallamos las diferencias entre los valores observados y el valor medio; despus, elevamos al cuadrado estas diferencias y las sumamos; dividimos el resultado entre el nmero de elementos de los que hemos obtenido una medida, y, finalmente, extraemos la raz cuadrada. La desviacin tpica es la raz cuadrada de la varianza. FORMULA:

Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

Ecuacin 5-8

Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa de alimentos desea saber que 25

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es:

La varianza sera:

Por lo tanto la desviacin estndar sera:

Propiedades de la desviacin tpica 1. La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2. Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3. Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Observaciones sobre la desviacin tpica La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

26

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADES
1) Buscar la media, la mediana y la moda de los siguientes nmeros: 25 15 28 29 25 26 21 26 2) En un estudio que se realiz en un asilo de ancianos, se tom las edades de los envejecientes que pueden caminar sin dificultades. Buscar la media, la mediana y la moda de las siguientes edades. 69 73 65 70 71 74 65 69 60 62 3) Se escogi un saln de clases de cuarto grado, con un total de 25 estudiantes, y se les pidi que calificaran del 1 al 5 un programa televisivo. (5 = Excelente 4 = Bueno 3 = Regular 4 = No muy bueno 1 = Fatal) Estos fueron los resultados: 1334122251451535141221235 Buscar la media, la moda y la mediana. 4) Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 nios de su consulta en el momento de andar por primera vez. Hallar la Varianza

Meses

Nios

10

11

12

16

13

11

14

15

27

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

5)

En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones recogidas en la siguiente tabla:
Calificaciones [0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) [7,8) [8,9) [9,10) N alumnos 2 2 3 6 7 6 1 1 1 1

Halla la varianza y la desviacin tpica.

6)

Hallar la media, moda, mediana, varianza y desviacion tipica con los siguientes datos.

X
120 110 100 95 80 70 50 1 20 18 32 20 15 10

X
6 - 10 11 15 16 20 21 25 26 30

f
4 11 7 3 6

28

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION
1) CUALES SON DESCRIPTIVA. LAS CARACTERISTICAS DE LA ESTADISTICA

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 2) CUALES SON LAS MEDIDAS DE POSICION _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 3) CUALES SON LAS MEDIDAS DE VARIACION _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 4) QUE ES LA VARIANZA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 5) QUE ES LA DESVIACION TIPICA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 6) CUALES SON LAS PROPIEDADES DE LA DESVIACION TIPICA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________

29

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD II
CONTENIDOS PROBABILIDAD

Definicin: probabilidad, eventos, experimentos y resultados Espacio y punto muestral Propiedades Probabilidad excluyente, condicional e independiente Esperanza matemtica Tabla de probabilidad y de contingencias Anlisis combinatorio: permutacin y combinacin

OBJETIVOS: Conocer sobre la probabilidad y sus caractersticas Determinar cules son las propiedades de la probabilidad Realizar ejercicios prcticos para mediante la modelacin matemtica y estadstica

30

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

PROBABILIDAD
DEFINICION La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro. Con este fin introduciremos algunas definiciones. La probabilidad de un suceso es un numero comprendido entre 0 y 1que indica las posibilidades que tiene de verificarse cuando se realiza un experimento aleatorio. Probabilidad de eventos Para calcular la probabilidad de eventos es necesario que stos se comporten de una manera ms o menos estable. Precisamente, se echa mano de la regularidad estadstica, que es la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el nmero de repeticiones de un experimento en condiciones prcticamente constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. Sin embargo, al momento de definir la probabilidad de un evento podemos tomar en cuenta los siguientes criterios: 1. La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su carcter de subjetividad no se considera con validez cientfica, aunque en la vida diaria es de las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los conocimientos previos, y no en resultados estadsticos. 2. La probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estadstica. Esta definicin sera la ms real, pero proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Adems, los resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo. 3. La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el nmero de eventos elementales que componen al evento E, entre el nmero de eventos elementales que componen el espacio muestral:

31

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Probabilidad de experimentos Son los experimentos de los que podemos predecir el resultado antes de que se realicen. Ejemplo. Si dejamos caer una piedra desde una ventana sabemos sin lugar a dudas que la piedra bajara. Si la arrojamos hacia arriba sabemos que subir durante un determinado intervalo de tiempo: pero despus bajara

ESPACIO Y PUNTO MUESTRA PUNTO MUESTRAL Cada uno de los resultados de un experimento aleatorio. ESPACIO MUESTRAL

La totalidad de los puntos mustrales. Ejemplo: consideremos el experimento aleatorio E que consiste en arrojar dos monedas balanceadas, siendo c = cara y x = seca. El espacio mustral ser: S = {(c; c), (c; x), (x; c), (x, x)} El espacio muestral es un conjunto de puntos tal que cada punto representa uno y slo uno de los resultados posibles de un experimento aleatorio.
Espacio muestral discreto:

Si contiene un nmero finito o infinito numerable de puntos mustrales. Ejemplo: se tiene una urna con bolillas del 1 al 20. Se extrae una. S = {1, 2, 3..., 20} (finito)
Espacio muestral continu:

Si contiene una infinidad no numerable de puntos mustrales. Ejemplo: su utiliza una balanza de precisin para pesar partculas metlicas. S= { X: 0 < X < infinito) 32

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

PROPIEDADES DE LA PROBABILIDAD 1 La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso contrario es:

2 Probabilidad del suceso imposible es cero.

Probabilidad condicional En esta seccin examinaremos como la probabilidad de ciertos eventos depende o se ve influida por la ocurrencia de otros. Para ello veremos algunos ejemplos. Ejemplo 1: Consideremos dos cajas, la caja 1 contiene 3 esferitas blancas y 4 rojas y la caja 2 contiene 8 blancas y 4 rojas. Se selecciona una caja al azar y luego se extrae una esfera al azar. Hallar la probabilidad de que la esfera sea blanca. Solucin: Sea A el evento de seleccionar la caja 1 y AC el evento de seleccionar la caja 2, entonces P(A) = P(AC) = 1/2 ya que cualquiera de las dos cajas tiene la misma probabilidad de ser extrada. Sea B el evento de seleccionar una esfera blanca, entonces P(B/A) = 3/7 ya que en la caja 1 hay 3 esferas blancas en un total de 7 y P(B/AC) = 8/12 porque en la caja 2 hay 8 esferas blancas en un total de 12. Ahora bien, por la proposicin 3.5 tenemos:

Probabilidad Independiente La independencia de dos eventos AyB quiere decir que el saber que A sucedi no modifica la probabilidad de que B tambin haya sucedido. Como consecuencia saber que A no sucedi tampoco puede afectar a la probabilidad B. Hacemos una demostracin formal en el pizarrn. Podemos poner esto diciendo que 33

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Si A y B son independientes, tambin lo son las tres siguientes pares: A y B : A y B. A y B (estamos usando el apostrofe para denotar complemento). Cuando se tiene tres eventos se puede presentar una situacin muy curiosa. Puede pasar que A y B sean independientes y A y C sean independientes y B y C tambin sean independientes Pero A,B y CON sean independientes El ejemplo clsico es el de un experimento resultados igualmente probables: 1, 2,3 y 4. Si el resultado es 1. A gana y nadie mas. Si el resultado es 2. B gana y nadie mas. Si el resultado es 3. C gana y nadie mas pero si el resultado es 4. Los tres A, B y C ganan. Usted puede calcular las probabilidades para darse cuenta que: P(A Y B) = P (A) P (B) P(A Y C)= P(A) P P(B Y C) = P(B) P Pero P(A Y BY C) no es igual a P(A) P(B) P aleatorio con cuatro posibles

ESPERANZA MATEMTICA
En estadstica la esperanza matemtica (tambin llamada esperanza, valor esperado, media poblacional o media) de una variable aleatoria X, es el nmero que formaliza la idea de valor medio de un fenmeno aleatorio.

Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado nmero de veces. Cabe decir que el valor que toma la esperanza matemtica en algunos casos 34

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

puede no ser "esperado" en el sentido ms general de la palabra - el valor de la esperanza puede ser improbable o incluso imposible. Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos hacer el clculo

y cabe destacar que 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los sucesos son de igual probabilidad, la esperanza es igual a la media aritmtica. Una aplicacin comn de la esperanza matemtica es en las apuestas o los juegos de azar. Por ejemplo, la ruleta americana tiene 38 casillas equiprobables. La ganancia para acertar una apuesta a un solo nmero paga de 35 a 1 (es decir, cobramos 35 veces lo que hemos apostado y recuperamos la apuesta, as que recibimos 36 veces lo que hemos apostado). Por tanto, considerando los 38 posibles resultados, la esperanza matemtica del beneficio para apostar a un solo nmero es: Que es -0,0526 aproximadamente. Por lo tanto uno esperara, en media, perder unos 5 cntimos por cada euro que apuesta, y el valor esperado para apostar 1 euro son 0.9474 euros. En el mundo de las apuestas, un juego donde el beneficio esperado es cero (no ganamos ni perdemos) se llama un "juego justo". Nota: El primer parntesis es la "esperanza" de perder tu apuesta de $1, por eso es negativo el valor. El segundo parntesis es la esperanza matemtica de ganar los $35. La esperanza matemtica del beneficio es el valor esperado a ganar menos el valor esperado a perder.

TABLAS DE PROBABILIDAD Y DE CONTINGENCIA


Tablas de Contingencia Un mtodo til para clasificar los datos obtenidos en un recuento es mediante las tablas de contingencia. 35

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual podemos determinar unas probabilidades conociendo otras de la tabla. Ejemplo Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de automviles. De ellos, 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide: 1 Cul ser la probabilidad de que le toque el viaje a un hombre soltero? 2 Si del afortunado se sabe que es casado, cul ser la probabilidad de que sea una mujer?

ANLISIS DE COMBINACIONES Y PERMUTACIONES


As que en matemticas usamos un lenguaje ms preciso: Si el orden no importa, es una combinacin. Si el orden s importa es una permutacin.

36

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Permutaciones con repeticin Son las ms fciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las permutaciones posibles son: n n ... (r veces) = nr (Porque hay n posibilidades para la primera eleccin, DESPUS hay n posibilidades para la segunda eleccin, y as.) Por ejemplo en la cerradura de arriba, hay 10 nmeros para elegir (0,1,...,9) y eliges 3 de ellos: 10 10 ... (3 veces) = 103 = 1000 permutaciones As que la frmula es simplemente: nr donde n es el nmero de cosas que puedes elegir, y eliges r de ellas (Se puede repetir, el orden importa).

COMBINACIONES
Tambin hay dos tipos de combinaciones (recuerda que ahora el orden no importa): 1. Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10) 2. Sin repeticin: como nmeros de lotera (2,14,15,27,30,33) Combinaciones sin repeticin As funciona la lotera. Los nmeros se eligen de uno en uno, y si tienes los nmeros de la suerte (da igual el orden) entonces has ganado! La manera ms fcil de explicarlo es:

imaginemos que el orden s importa (permutaciones), despus lo cambiamos para que el orden no importe.

Volviendo a las bolas de billar, digamos que queremos saber qu 3 bolas se

37

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADES
RESOLVER LOS SIGUIENTES PROBLEMAS 1. En una ciudad el 60 % de sus habitantes son aficionados al ftbol, el 30 % son aficionados al baloncesto y el 25 % a ambos deportes. a) Son independientes los sucesos ser aficionado al ftbol y ser aficionado al baloncesto?. b) Si una persona no es aficionada al ftbol, cul es la probabilidad de que no sea aficionada al baloncesto? c) Si una persona no es aficionada al baloncesto, cul es la probabilidad de que sea aficionada al ftbol? 2. De 150 pacientes, 90 tienen una enfermedad cardiaca, 50 tienen cncer y 20 tienen ambas enfermedades. a) Determinar la probabilidad de que una persona tomada al azar tenga una sola de las dos enfermedades. (Indicacin: si transformas los datos dados a porcentaje el problema se asemeja mucho al resto)

3. En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un da asisten 45 alumnos, encontrar la probabilidad de que un alumno: a. Sea hombre. b. Sea mujer morena. c. Sea hombre o mujer.

4. Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: a. 1La probabilidad de que salga el 7. b. 2La probabilidad de que el nmero obtenido sea par. c. 3La probabilidad de que el nmero obtenido sea mltiplo de tres

38

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION

1)

QUE ES LA PROBALDAD.

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 2) ESCRIBIR CUALES SON LAS PROPIEDADES DE LA PROBABILIDAD

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 3) QUE SE NECESITA PARA CALCULAR LA PROBABILIDAD DE EVENTOS _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 4) QUE ES LA PROBABILIDAD DE EXPERIMENTOS

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 5) QUE ES LA ESPERANZA MATEMATICA

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________

39

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD IIi
CONTENIDOS
DISTRIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUAS Variables aleatorias. Distribuciones discretas y continuas de probabilidad. Distribuciones empricas: la media, desviacin estndar y la varianza Teorema de chebischev Varianza covarianza (ANOVA) Distribucin uniforme discreta Distribucin binorial y multinorial Distribucin hipergeomtrica Distribucin posson Distribucin normal. Distribucin exponencial ACTIVIDADES EVALUACION

OBJETIVOS: Conocer sobre la distribucin de probabilidades discretas y continuas, para su respectivo estudio. Analizar sobre las caractersticas de cada una de la distribucin de probabilidades. Resolver los diferentes ejercicios, para su respectiva comprencion.

40

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUAS


Una distribucin de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento. Una distribucin de probabilidad es similar al distribucin de frecuencias relativas .Sin embargo, en vez de describir el pasado, describe la probabilidad que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede disear un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenmenos naturales. Las decisiones estadsticas basadas en la estadstica inferencial son fundamentales en la investigacin que son evaluadas en trminos de distribucin de probabilidades.

La distribucin Normal suele conocerse como la "campana de Gauss".

Qu es una distribucin de probabilidad? Muestra todos los resultados posibles de un experimento y la probabilidad de cada resultado. Supongamos que se quiere saber el nmero de caras que se obtienen al lanzar cuatro veces una moneda al aire? Es obvio que, el hecho de que la moneda caiga de costado se descarta. Los posibles resultados son: cero caras, una cara, dos caras, tres caras y cuatro caras. Si realizamos el experimento obtenemos el siguiente espacio muestral:

41

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

NUMERO FRECUENCIA DISTRIBUCIN DE DE PROBABILIDADES CARAS 0 1 2 3 4 1 4 6 4 1 1/16 4/16 6/16 4/16 1/16

VARIABLES ALEATORIAS
Una Variable es cualquier caracterstica que puede tomar distintos valores. Por ejemplo: Temperatura, Presin, Coeficiente Intelectual, Peso, Estatura, etc. Se dice que una Variable es Aleatoria porque involucra la probabilidad de los resultados del espacio muestral, y dicha variable es una funcin definida sobre el Espacio Muestral, de manera que transforma todos los posibles resultados del espacio muestral en cantidades numricas. En trminos ms precisos, VARIABLE ALEATORIA: Es una funcin que asigna un nmero real a cada resultado del Espacio Muestral de un Experimento Aleatorio.

Por ejemplo, se sacan dos pelotas en sucesin, sin reemplazo, de una urna que contiene 4 pelotas rojas y 3 negras. La Variable aleatoria X esta definida como: Nmero de pelotas rojas. 42

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

El Espacio muestral de este experimento ser: S = {RR, RN, NR, NN} Puesto que el elemento RR contiene 2 pelotas rojas, se le asigna una valor numrico de 2. Los elementos RN y NR contienen 1 pelota roja, entonces se le asigna un valor de 1 y a NN se le asigna un valor de 0. Los resultados posibles y los valores de la Variable aleatoria X, donde X es el nmero de pelotas rojas, son:S S RR NN RN NR X 2 0 1 1

X Con frecuencia se utilizar la abreviatura VA, en lugar de Variable aleatoria. Las VA suelen representarse con letras Maysculas X, Y, Z, etc. del alfabeto y con letras Minsculas x, y, z, etc. se representa cierto valor particular de la VA correspondiente. El conjunto de los posibles valores de la VA X se denomina rango de X. DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE ALEATORIA La distribucin de probabilidad de una v.a. X, tambin llamada funcin de distribucin de X es la funcin FX(x), que asigna a cada evento definido sobre X una probabilidad dada por la siguiente expresin:

y de manera que se cumplan las siguientes tres condiciones: 1. y 2. Es continua por la derecha. 3. Es montona no decreciente. La distribucin de probabilidad de una variable aleatoria, describe tericamente la forma en que varan los resultados de un experimento aleatorio. Intuitivamente se tratara de una lista de los resultados posibles de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

43

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

FUNCION DE DENSIDAD DE UNA VARIABLE ALEATORIA CONTINUA La funcin de densidad de probabilidad (FDP) o, simplemente, funcin de densidad, representada comnmente como f(x), se utiliza con el propsito de conocer cmo se distribuyen las probabilidades de un suceso o evento, en relacin al resultado del suceso. La FDP es la derivada (ordinaria o en el sentido de las distribuciones) de la funcin de distribucin de probabilidad F(x), o de manera inversa, la funcin de distribucin es la integral de la funcin de densidad:

La funcin de densidad de una v.a. determina la concentracin de probabilidad alrededor de los valores de una variable aleatoria continua. FUNCIONES DE VARIABLES ALEATORIAS

Sea

una

variable

aleatoria

sobre

una funcin

medible

de

Borel , entonces ser tambin una variable aleatoria sobre , dado que la composicin de funciones medibles es tambin es medible a no ser que g sea una funcin medible de Lebesgue. El mismo procedimiento que permite ir de un espacio de probabilidad a puede ser utilizado para obtener la distribucin de de probabilidad acumulada de es . La funcin

Si la funcin g es invertible, es decir g-1 existe, y es montona creciente, entonces la anterior relacin puede ser extendida para obttener

y, trabajando de nuevo bajo las mismas hiptesis de invertibilidad de g y asumiendo adems diferenciabilidad, podemos hallar la relacin entre las funciones de densidad de probabilidad al diferenciar ambos trminos respecto de y, obteniendo

. Si g no es invertible pero cada y tiene un nmero finito de races, entonces la relacin previa con la funcin de densidad de probabilidad puede generalizarse como

44

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

donde xi = gi-1(y). Las frmulas de densidad no requieren que g sea creciente. PARAMETROS DE UNA VARIABLE ALEATORIA La funcin de densidad o la distribucin de probabilidad de una v.a. contiene exhaustivamente toda la informacin sobre la variable. Sin embargo resulta conveniente resumir sus caractersticas principales con unos cuantos valores numricos. Estos son, fundamentalmente la esperanza y la varianza. Esperanza La esperanza matemtica (o simplemente esperanza) o valor esperado de una v.a. es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmtica. Para una variable aleatoria discreta con valores posibles y sus probabilidades representadas por la funcin de probabilidad p(xi) la esperanza se calcula como:

Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la funcin de densidad :

o La esperanza tambin se suele simbolizar con El concepto de esperanza se asocia comnmente en los juegos de azar al de beneficio medio o beneficio esperado a largo plazo. Varianza La varianza es una medida de dispersin de una variable aleatoria respecto a su esperanza . Se define como la esperanza de la transformacin : o bien CLASIFICACIN VARIABLE:

45

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

1. VARIABLE ALEATORIA DISCRETA: Es aquella variable que puede tomar un nmero de valores finito o infinito contable, y stos pueden arreglarse en una secuencia que corresponde con los enteros positivos. Generalmente las VA discretas representan datos que se cuentan, tales como: nmero de artculos defectuosos de una muestra de k artculos, nmero de accidentes por ao en una va rpida. En el ejemplo anterior de las bolas rojas y negras, dado que los valores posibles de X eran 0, 1 y 2, se dice que X es una VA discreta. 2. VARIABLE ALEATORIA CONTINUA: Es aquella cuyo conjunto de valores abarca todo un intervalo de valores en la recta numrica. Generalmente la VA continuas representan datos medidos, tales como: alturas, pesos, temperaturas, distancias o periodos de vida. Tanto las variables aleatorias Discretas como Continuas pueden asumir cada uno de sus valores con una cierta probabilidad.

DISTRIBUCIN DISCRETA Y CONTINUA DE PROBABILIDAD

DISTRIBUCION DISCRETA DE PROBABLIDAD Una distribucin de probabilidades para una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultados numricos posibles para esa variable aleatoria tal que una probabilidad especfica de ocurrencia se asocia con cada resultado. El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los posibles resultados, donde las ponderaciones son las probabilidades asociadas con cada uno de los resultados.

Donde: Xi = i-simo resultado de X, la variable discreta de inters. P(Xi) = probabilidad de ocurrencia del i-simo resultado de X La varianza de una variable aleatoria discreta (s 2) se define como el promedio ponderado de los cuadros de las diferencias entre cada resultado posible y su media (los pesos son las probabilidades de los resultados posibles).

46

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Donde: Xi = i-simo resultado de X, la variable discreta de inters. P(Xi) = probabilidad de ocurrencia del i-simo resultado de X Las distribuciones de probabilidades discretas ms importantes son: 1. Distribucin Binomial, y 2. Distribucin de Poisson 1. Distribucion binomial La distribucin binomial es una distribucin de probabilidades que surge al cumplirse cinco condiciones: 1. Existe una serie de N ensayos, 2. En cada ensayo hay slo dos posibles resultados, 3. En cada ensayo, los dos resultados posibles son mutuamente excluyentes, 4. Los resultados de cada ensayo son independientes entre si, y 5. La probabilidad de cada resultado posible en cualquier ensayo es la misma de un ensayo a otro.
Cuando se cumple estas condiciones, la distribucin binomial proporciona cada resultado

posible de los N ensayos y la probabilidad de obtener cada uno de estos resultados. Para este tipo de distribucin de probabilidad, la funcin matemtica es la siguiente:

Donde: P(X) = probabilidad de X xitos dados los parmetros n y p n = tamao de la muestra p = probabilidad de xito 1 p = probabilidad de fracaso X = numero de xitos en la muestra ( X = 0, 1, 2, .. n) El trmino indica la probabilidad de obtener X xitos de n

observaciones en una secuencia especfica. En trmino indica cuantas combinaciones de los X xitos entre n observaciones son posibles. Entonces dado el nmero de observaciones n y la probabilidad de xito p, la probabilidad de X xitos es: P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia especifica) 47

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Por eso que llegamos a la funcin matemtica que representa esta distribucin. Veamos un ejemplo: Supngase que en cierta poblacin el 52 por ciento de todos los nacimientos que se registraron son varones. Si aleatoriamente se escogen cinco registros de nacimientos dentro de esa poblacin, cul es la probabilidad de que exactamente tres de ellos pertenezcan a varones? Tenemos los siguientes datos: N = 5 X = 3 p = 0.52 Este problema los solucionamos con el Excel. Vamos a insertar funcin:

Escogemos en Seleccionar una categora, a las Estadsticas. Y dentro de las estadsticas, escogemos a la DISTR.BINOM. Ingresamos la informacin del problema y listo. P(X=3) = 0.3239

48

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

2. Distribucion de poisson Se dice que existe un proceso de Poisson si podemos observar eventos discretos en un rea de oportunidad un intervalo continuo (de tiempo, longitud, superficie, etc.) de tal manera que si se reduce lo suficiente el rea de oportunidad o el intervalo, 1. La probabilidad de observar exactamente un xito en el intervalo es constante. 2. La probabilidad de obtener ms de un xito en el intervalo es 0. 3. La probabilidad de observar un xito en cualquier intervalo es estadsticamente independiente de la de cualquier otro intervalo. Esta distribucin se aplica en situaciones como: El numero de pacientes que llegan al servicio de emergencia de un hospital en un intervalo de tiempo. El numero de radiaciones radiactivas que se recibe en un lapso de tiempo, El numero de glbulos blancos que se cuentan en una muestra dada. El numero de partos triples por ao Su utilidad en el rea de la salud es muy amplia. La expresin matemtica para la distribucin de Poisson para obtener X xitos, dado que se esperan l xitos es:

Donde: P(X) = probabilidad de X xitos dado el valor de l l = esperanza del nmero de xitos. 49

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

e = constante matemtica, con valor aproximado 2.711828 X = nmero de xitos por unidad La distribucin de Poisson se considera una buena aproximacin a la distribucin binomial, en el caso que np < 5 y p < 0.1 n > 100 y p < 0.05 y en ese caso l = np. El interes por sustituir la distribucin Binomial por una distribucin de Poisson se debe a que esta ultima depende unicamente de un solo parmetro, l , y la binomial de dos, n y p. Veamos un ejemplo: Si en promedio, llegan tres pacientes por minuto al servicio de emergencia del hospital del Nio durante la hora del almuerzo. Cul es la probabilidad de que en un minuto dado, lleguen exactamente dos pacientes? Y Cul es la probabilidad de que lleguen ms de dos pacientes en un minuto dado? Datos: l = 3 pacientes por minuto P(X=2) = ? Para resolver esto utilizamos al Excel. De las funciones estadsticas, seleccionamos la funcin POISSON.

Ingresamos la informacin que tenemos: y listo, tenemos el resultado: P(X=2) = 0.2240

50

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para resolver la segunda parte del problema P(X>2) = ? Con el Excel encontraremos P(X 2) y hacemos el siguiente clculo: P(X > 2 ) = 1 - P(X 2) Utilizando nuevamente el Excel:

51

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Entonces: P(X>2) = 1 0.4232 = 0.5768

DISTRIBUCIN CONTINUA DE PROBABILIDAD

Una distribucin de probabilidad continua, la distribucin normal. En teora de la probabilidad una distribucin de probabilidad se llama continua si su funcin de distribucin es continua. Puesto que la funcin de distribucin de una variable aleatoria X viene dada por , la definicin implica que en una distribucin de probabilidad continua X se cumple P[X = a] = 0 para todo nmero real a, esto es, la probabilidad de que X tome el valor a es cero para cualquier valor de a. Si la distribucin de X es continua, se llama a X variable aleatoria continua. En las distribuciones de probabilidad continuas, la distribucin de probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Mientras que en una distribucin de probabilidad discreta un suceso con probabilidad cero es imposible, no se da el caso en una variable aleatoria continua. Por ejemplo, si se mide la anchura de una hoja de roble, el resultado 3,5 cm es posible, pero tiene probabilidad cero porque hay infinitos valores posibles entre 3 cm y 4 cm. Cada uno de esos valores individuales tiene probabilidad cero, aunque la probabilidad de ese intervalo no lo es. Esta aparente paradoja se resuelve por el hecho de que la probabilidad de que X tome algn valor en un conjunto infinito como un intervalo, no puede calcularse mediante la adicin simple de probabilidades de valores individuales. Formalmente, cada valor tiene una probabilidad infinitesimal que estadsticamente equivale a cero. Existe una definicin alternativa ms rigurosa en la que el trmino "distribucin de probabilidad continua" se reserva a distribuciones que tienen funcin de 52

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

densidad de probabilidad. Estas funciones se llaman, con ms precisin, variables aleatorias absolutamente continuas (vase el Teorema de RadonNikodym). Para una variable aleatoria X absolutamente continua es equivalente decir que la probabilidad P[X = a] = 0 para todo nmero real a, en virtud de que hay un incontables conjuntos de medida de Lebesgue cero (por ejemplo, el conjunto de Cantor). Una variable aleatoria con la distribucin de Cantor es continua de acuerdo con la primera definicin, pero segn la segunda, no es absolutamente continua. Tampoco es discreta, ni una media ponderada de variables discretas y absolutamente continuas. En aplicaciones prcticas, las variables aleatorias a menudo ofrece una distribucin discreta o absolutamente continua, aunque tambin aparezcan de forma natural mezclas de los dos tipos. Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de ellos se pueden definir infinitos valores ms. En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable; como se puede hacer en el caso de va discretas, pero es posible calcular la probabilidad acumulada hasta un cierto valor (funcin de distribucin de probabilidad), y se puede analizar como cambia la probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro concepto: la funcin de densidad. En el caso de variable continua la distribucin de probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Sea X una va continua, una distribucin de probabilidad o funcin de densidad de probabilidad (FDP) de X es una funcin f(x) tal que, para cualesquiera dos nmeros a y b siendo .

La grfica de f(x) se conoce a veces como curva de densidad, la probabilidad de que X tome un valor en el intervalo [a,b] es el rea bajo la curva de la funcin de densidad; as, la funcin mide concentracin de probabilidad alrededor de los valores de una variable aleatoria continua.

rea bajo la curva de f(x) entre a y b

Para que f(x) sea una FDP (FDP = f(x)) sea legtima, debe satisfacer las siguientes dos condiciones: 53

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

1. f(x)

0 para toda x.

2.

Ya que la probabilidad es siempre un nmero positivo, la FDP es una funcin no decreciente que cumple: 1. Es decir, la probabilidad de todo el espacio muestral es 1. 2. Es decir, la probabilidad del suceso nulo es cero. Distribuciones continuas Las distribuciones de variable continua ms importantes son las siguientes: Distribucin Beta Distribucin exponencial Distribucin F Distribucin Gamma Distribucin ji cuadrado Distribucin normal Distribucin t de Student

DISTRIBUCIN BETA En estadstica la distribucin beta es una distribucin de probabilidad continua con dos parmetros a y b cuya funcin de densidad para valores 0 < x < 1 es

Aqu es la funcin gamma. El valor esperado y la varianza de una variable aleatoria X con distribucin beta son

Un caso especial de la distribucin beta con a = 1 y b = 1 es la distribucin uniforme en el intervalo [0, 1]. 54

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para relacionar con la muestra se iguala E[X] a la media y V[X] a la varianza y de despejan a y b. DISTRIBUCIN EXPONENCIAL En estadstica la distribucin exponencial es una distribucin de probabilidad continua con un parmetro > 0 cuya funcin de densidad es:

Su funcin de distribucin es:

Donde e representa el nmero e. El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son:

Ejemplo Ejemplos para la distribucin exponencial es la distribucin de la longitud de los intervalos de variable continua que transcuren entre la ocurrencia de dos sucesos "raros", que se distribuyen segn la distribucin de Poisson. Calcular variables aleatorias Se pueden calcular una variable aleatoria de distribucin exponencial x por medio de una variable aleatoria de distribucin uniforme u = U(0,1):

o, dado que (1 u) es tambin una variable aleatoria con distribucin U(0,1), puede utilizarse la versin ms eficiente:

55

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Relaciones La suma de k variables aleatorias independientes de distribucin exponencial con parmetro es una variable aleatoria de distribucin gamma. DISTRIBUCIN F Usada en teora de probabilidad y estadstica, la distribucin F es una distribucin de probabilidad continua. Tambin se la conoce como distribucin F de Snedecor (por George Snedecor) o como distribucin F de FisherSnedecor. Una variable aleatoria de distribucin F se construye como el siguiente cociente:

donde U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad respectivamente, y U1 y U2 son estadsticamente independientes. La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica, especialmente en el anlisis de varianza. Vase el test F. La funcin de densidad de una F(d1, d2) viene dada por

para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta. La funcin de distribucin es

donde I es la funcin beta incompleta regularizada.

Distribuciones relacionadas es una distribucin ji-cuadrada cuando . 56 para

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribucin gamma En estadstica la distribucin gamma es una distribucin de probabilidad continua con dos parmetros k y cuya funcin de densidad para valores x > 0 es

Aqu e es el nmero e y es la funcin gamma. Para valores la aquella es (k) = (k 1)! (el factorial de k 1). En este caso - por ejemplo para describir un proceso de Poisson - se llaman la distribicin distribucin Erlang con un parmetro = 1 / . El valor esperado y la varianza de una variable aleatoria X de distribucin gamma son

E[X] = k / = k V[X] = k / 2 = k2
Relaciones El tiempo hasta que el suceso nmero k ocurre en un Proceso de Poisson de intensidad es una variable aleatoria con distribucin gamma. Eso es la suma de k variables aleatorias independientes de distribucin exponencial con parmetro .

Distribucin o Ji cuadrado En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria

donde Zi son variables aleatorias normales independientes de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: . Es conveniente tener en cuenta que la letra griega se transcribe al latn como chi1 y se pronuncia en castellano como ji.2 3 PROPIEDADES Funcin de densidad 57

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Su funcin de densidad es:

Donde es la funcin gamma. Funcin de distribucin acumulada Su funcin de distribucin es

Donde es la funcin gamma incompleta. El valor esperado y la varianza de una variable aleatoria X con distribucin son, respectivamente, k y 2k. Relacin con otras distribuciones La distribucin es un caso especial de la distribucin gamma. De hecho, Como consecuencia, cuando k = 2, la distribucin es una distribucin exponencial de media k = 2. Cuando k es suficientemente grande, como consecuencia del teorema central del lmite, puede aproximarse por una distribucin normal:

Aplicaciones La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student. 58

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .

Distribucin normal En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son: caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc. La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos test estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas 59

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Propiedades Algunas propiedades de la distribucin normal son: 1. Es simtrica respecto de su media, ; Distribucin de probabilidad alrededor de la media en una distribucin N(, ). 2. La moda y la mediana son ambas iguales a la media, ; 3. Los puntos de inflexin de la curva se dan para x = y x = + . 4. Distribucin de probabilidad en un entorno de la media: 1) En el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el 68,26% de la distribucin; 2) En el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3) Por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar. 5. Si X ~ N(, 2) y a y b son nmeros reales, entonces (aX + b) ~ N(a+b, a22). 6. Si X ~ N(x, x2) e Y ~ N(y, y2) son variables aleatorias normales independientes, entonces: Su suma est normalmente distribuida con U = X + Y ~ N(x + y, x2 + y2) (demostracin). Recprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crmer). Su diferencia est normalmente distribuida con . Si las varianzas de X e Y son iguales, entonces U y V son independientes entre s. La divergencia de Kullback-Leibler,

7. Si e son variables independientes normalmente distribuidas, entonces:


o

aleatorias

Su producto XY sigue una distribucin con densidad p dada por

donde K0 es una funcin de Bessel modificada de segundo tipo. 60

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Su cociente sigue una distribucin de Cauchy con X / YCauchy(0,X / Y). De este modo la distribucin de Cauchy es un tipo especial de distribucin cociente. 8. Si son variables normales estndar independientes, entonces libertad. 9. Si sigue una distribucin con n grados de son variables normales estndar independientes, y la varianza

entonces la media muestral

muestral son independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qu el test-F no es robusto respecto a la no-normalidad). Distribucin t de Student En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. Caracterizacin La distribucin t de Student es la distribucin de probabilidad del cociente

donde Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes

Si es una constante no nula, el cociente es una variable aleatoria que sigue la distribucin t de Student no central con parmetro de no-centralidad . Aparicin y especificaciones de la distribucin t de Student Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media y varianza 2. Sea la media muestral. Entonces 61

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

sigue una distribucin normal de media 0 y varianza 1. Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi un cociente relacionado,

donde

es la varianza muestral y demostr que la funcin de densidad de T es

donde es igual a n 1. La distribucin de T se llama ahora la distribucin-t de Student. El parmetro representa el nmero de grados de libertad. La distribucin depende de , pero no de o , lo cual es muy importante en la prctica. Intervalos de confianza derivados de la distribucin t de Student El procedimiento para el clculo del intervalo de confianza basado en la t de Student consiste en estimar la desviacin tpica de los datos S y calcular el error estndar de la media , siendo entonces el intervalo de confianza

para la media = . Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye tambin normalmente, la distribucin t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero. para efectos prcticos el valor esperado y la varianza son: E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3

DISTRIBUCINES EMPIRICAS
La distribucin emprica asociada a una muestra es la ley de probabilidad sobre el conjunto de las modalidades, que afecta a cada observacin con el peso . La idea es la siguiente. Supongamos que queremos aumentar artificialmente la cantidad de datos. La forma ms simple sera sacar aleatoriamente nuevos valores a partir de los valores ya observados, 62

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

respetando sus frecuencias. En otras palabras, se simulara la distribucin emprica.

Sean los . Para

una muestra, denotamos:

los diferentes valores que toman

el nmero de veces que el valor

aparece o sea el efectivo del valor

. La

distribucin emprica de la muestra es la ley de probabilidad conjunto , tal que:

sobre el

La media, la varianza y la desviacin estndar pueden ser vistas como carctersticas probabilistas de la distribucin emprica. La media de la muestra es la esperanza de su distribucin emprica. Para un carcter discreto, la moda de la distribucin emprica es el valor que tiene la frecuencia ms alta. Para un carcter continuo agrupado en clases de amplitudes iguales, hablamos de clase modal. Una distribucin emprica se llama unimodal si la frecuencia maximal es significativamente mayor que las otras. Puede ser bimodal o multimodal en otros casos. Para estudiar una distribucin emprica, la primera etapa consiste en ordenar los datos en orden creciente, es decir escribir sus estadgrafos de orden. Distribucion Normal Una de las distribuciones tericas mejor estudiadas en los textos de bioestadstica y ms utilizada en la prctica es la distribucin normal, tambin llamada distribucin gaussiana. Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos siguen, aproximadamente, esta distribucin. Caracteres morfolgicos (como la talla o el peso), o psicolgicos (como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una distribucin normal. 63

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . Con esta notacin, la densidad de la normal viene dada por la ecuacin:

Ecuacin 1:

Que determina la curva en forma de campana. As, se dice que una caracterstica denota como Ecuacin 1. sigue una distribucin normal de media y varianza , y se , si su funcin de densidad viene dada por la

Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: A. Tiene una nica moda, que coincide con su media y su mediana. B. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1. C. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. D. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad. E. El rea bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a 64

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . F. La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin. Como se deduce de este ltimo apartado, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1. As, la expresin que define su densidad se puede obtener de la Ecuacin 1, resultando:

Es importante conocer que, a partir de cualquier variable X que siga una distribucin , se puede obtener otra caracterstica Z con una distribucin normal estndar, sin ms que efectuar la transformacin:

Ecuacin 2:

Distribucin Bimodal Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

65

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del

intervalo, que verifiquen que: Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

LA MEDIA, DESVIACIN ESTNDAR Y LA VARIANZA.


La desviacin estndar () mide cunto se separan los datos. La frmula es fcil: es la raz cuadrada de la varianza. As que, "qu es la varianza?" Varianza: la varianza (que es el cuadrado de la desviacin estndar: 2) se define as: Es la media de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos pasos: 1. Calcula la media (el promedio de los nmeros) 2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Ahora calcula la media de esas diferencias al cuadrado. (Por qu al cuadrado?) Ejemplo T y tus amigos habis medido las alturas de vuestros perros (en milmetros):

66

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm. Calcula la media, la varianza y la desviacin estndar. Respuesta: 600 + 470 + 170 + 430 + 300 Media = 5 = 5 1970 = 394

as que la altura media es 394 mm. Vamos a dibujar esto en el grfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media: 2062 + 762 + (-224)2 + 362 + (-94)2 Varianza: 2 = 5 As que la varianza es 21,704. Y la desviacin estndar es la raz de la varianza, as que: DESVIACIN ESTNDAR: = 21,704 = 147 67 = 5 108,520 = 21,704

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Y lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a distancia menos de la desviacin estndar (147mm) de la media:

As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es normal, o extra grande o extra pequeo VARIANZA : Mide la variabilidad de los datos. Es el segundo momento respecto a la media. La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. L a va ria n za se re pre se n t a p o r .

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

68

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Calcular la varianza de la distribucin de la tabla: xi 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

[10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80)

TEOREMA DE CHEBISCHEV
Si una variable aleatoria tiene una varianza o desviacin estndar pequea, esperaramos que la mayora de los valores se agrupan alrededor de la media. Por lo tanto, la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo alrededor de la media es mayor que para una variable aleatoria similar con una desviacin estndar mayor si pensamos en la probabilidad en trminos de una rea, esperaramos una distribucin continua con un valor grande de que indique una variabilidad mayor y, por lo tanto, esperaramos que el rea este extendida. Sin embargo, una desviacin estndar pequea debera tener la mayor parte de su rea cercana a . Podemos argumentar lo mismo para una distribucin discreta. En el histograma de probabilidad. El rea se extiende mucho ms que. Lo cual indica una distribucin mas variable de mediciones o resultados el matemtico ruso P. L. Chebyschev (18211894) descubri que la fraccin de rea entre cualesquiera dos valores simtricos alrededor de la media esta relacionada con la desviacin estndar. Como el rea bajo una curva de distribucin de probabilidad, o de un histograma de probabilidad, suma 1, el rea entre cualesquiera dos nmeros es la probabilidad de que la variable aleatoria tome un valor entre estos nmeros. El siguiente teorema, debido a Chebyshev da una estimacin conservadora de la probabi8lidad de que una variable aleatoria tome un valor dentro de desviaciones estndar de su media para cualquier numero real proporcionaremos la demostracin solo para el caso continuo y se deja el caso discreto como ejercicio. 69

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Teorema de Chebyshev: La probabilidad de que cualquier variable aleatoria X, tome un valor dentro de la desviaciones estndar de la media es al menos 1 1 / 2. Es decir P ( - < X < + ) 1 12. Prueba: por nuestra definicin anterior de la varianza de X escribimos 2 = E [ (X - )2] = - (x + )2 (x) dx = - - k (x + )2 (x) dx + - k + k (x + )2 (x) dx + + k (x + )2 (x) dx - - k (x + )2 (x) dx + + k (x + )2 (x) dx Ya que la segunda de las tres integrales es no negativa as como | x - | k , para cualquier x + k o x - k tenemos que (x - )2 k2 2 en ambas integrales restantes se sigue que 2 - - k k2 2 (x) dx + + k k2 2 (x) dx Y que - - k (x) dx + + k (x) dx 1_2. De aqu P ( - < X < + ) = - k + k (x) dx 1 1_2. Por lo cual queda establecido el teorema. Para k = 2 el teorema establece que la variable aleatoria x tiene una probabilidad de al menos 1 1 /22 = 3/4 de caer dentro de dos desviaciones estndar de la media, es decir tres cuartos o mas de las observaciones de cualquier distribucin yacen en el intervalo una 2 . De manera similar, el teorema que al menos ocho novenos de las observaciones de cualquier distribucin caen en el intervalo 3 . El teorema de Chebyshev tiene una valides para cualquier distribucin de observaciones y, por esta razn los resultados son generalmente dbiles el valor que el teorema proporciona es solo un limite inferior. Es decir, sabemos que la probabilidad de una variable aleatoria que cae dentro de dos desviaciones estndar de la media no puede ser menor que 3/4, pero nunca sabemos cuanto podra ser en realidad nicamente cuando se conoce la distribucin de probabilidad podemos determinar probabilidades exactas. Por esta razn llmanos al teorema resultado de distribucin libre cuando se supongan distribuciones especficas. El uso del teorema de Chebyshev se restringe a situaciones donde se desconoce la forma de la distribucin.

70

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EJEMPLO: 1.- Una variable aleatoria X tiene una media = 8 una varianza 2 = 9, y distribucin de probabilidad desconocida. Encuentre a) P (4 < X < 20). b) P (| X - 8 | 6). Solucin a) P (4 < X < 20) = P[ 8 (4) (3) < X < 8 + (4) (3) ] 15/14 b) P (| X - 8 | 6) = 1 P (| X - 8 | < 6) = 1 P (- 6 < X - 8 < 6) = 1 P [8 (2) (3) < X < 8 + (2) (3)] 8 < 6) .

VARIANZA COVARIANZA (ANOVA)


En estadstica la covarianza es dos variables estadsticas. DEFINICION La covarianza SXY (a veces tambin denotada Cov(X,Y) ) de dos variables aleatorias X e Y es: una medida de dispersin conjunta de

donde es el operador esperanza. Para distribuciones discretas la frmula anterior se concreta en

. Cuando las variables e aleatorias X e Y son , n-dimensionales, su matriz es de decir, covarianzas XY es:

INTERPRETACION DE LA COVARIANZA

Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y. 71

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relacin lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeos valores. PROPIEDADES Si X, Y, W, y V son variables aleatorias y a, b, c, d son constantes ("constante"en este contexto significa no aleatorio), se cumple que:

, la varianza de X

Frmula que suele emplearse en la prctica para calcular la covarianza. Estas propiedades se deducen de manera casi directa de la definicin de la covarianza. En otras palabras la covarianza trata de explicar que tan relacionadas se encuentran dos variables entre s, que tanto se mueve una cuando la otra se mueve otro tanto. Ejemplo, si la variable X se mueve 1, supongamos que la variable Y se mueve 2, entonces podemos decir que la variable Y se mueve positivamente el doble de lo que se movera la variable X. NO CORRELACION E INDEPENDENCIA Si X e Y son independientes, entonces su covarianza es cero. Esto ocurre por la propiedad de independencia, Lo opuesto, sin embargo, generalmente no es cierto: algunos pares de variables aleatorias tienen covarianza cero pese a que no son independientes. Bajo algunas hiptesis adicionales, la covarianza de valor cero implica independencia, como por ejemplo en el caso de la distribucin normal multivariante. RELACION CON EL PRODUCTO ESCOLAR La mayora de las propiedades de la covarianza se deducen de las del producto escalar: 1. Bilinealidad: para las constantes a y b, y las variables aleatorias X, Y, y U, Cov(aX + bY, U) = a Cov(X, U) + b Cov(Y, U) 72

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

2. Simetra: Cov(X, Y) = Cov(Y, X) 3. Es un operador positivo definido: Var(X) = Cov(X, X) 0; adems, si Cov(X, X) = 0 entonces X es una variable aleatoria constante. De hecho, la covarianza es un producto interior sobre el espacio cociente de las variables aleatorias de momentos finitos iguales salvo constante.

DISTRIBUCIN UNIFORME DISCRETA

En teora de la probabilidad, la distribucin uniforme discreta es una distribucin de probabilidad que asume un nmero finito de valores con la misma probabilidad. PROPIEDADES Si la distribucin asume los valores reales probabilidad es , su funcin de

Y su funcin de distribucin la funcin escalonada

Su media estadstica es

Y su varianza

EJEMPLOS Para un dado perfecto, todos los resultados tienen la misma probabilidad 1/6. Luego, la probabilidad de que al lanzarlo caiga 4 es 1/6. Para una moneda perfecta, todos los resultados tienen la misma probabilidad 1/2. Luego, la probabilidad de que al lanzarla caiga cara es 1/2.

73

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTRIBUCIN BINOMIAL Y MULTINORIAL


DISTRIBUCION BINOMIAL Un experimento sigue el modelo de la distribucin binomial o de Bernoulli si: 1. En cada prueba del experimento slo son posibles dos resultados: el suceso A (xito) y su contrario . 2. La probabilidad del suceso A es constante, es decir, que no vara de una prueba a otra. Se representa por p. 3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente. Variable aleatoria binomial La variable aleatoria binomial, X, expresa el nmero de xitos obtenidos en cada prueba del experimento. La variable binomial es una variable aleatoria discreta, slo puede tomar los valores 0, 1, 2, 3, 4,..., n suponiendo que se han realizado n pruebas. Ejemplo k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

Distribucin binomial La distribucin binomial se suele representar por B(n, p). n es el nmero de pruebas de que consta el experimento. p es la probabilidad de xito. La probabilidad de es 1 p, y la representamos por q.

n es el nmero de pruebas k es el nmero de xitos p es la probabilidad de xito q es la probabilidad de fracaso

El nmero combinatorio

74

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTRIBUCIN MULTINOMIAL La distribucin multinomial es una generalizacin de la distribucin binomial. En este caso, en un experimento interesa estudiar no la ocurrencia de un nico suceso o la de su contrario, sino la de varios sucesos (tres o ms). La distribucin multinomial, M(n,p1,,pn) proporciona probabilidades de obtener, en m repeticiones independientes de un experimento, x1 veces el suceso A1, x2 veces el suceso A2,, xn veces el suceso An, donde dichos sucesos forman una particin del espacio muestral, es decir, tal que para y donde , por tanto, se cumple . As, considerando que Xi es el nmero de veces que se presenta el suceso Ai en las m repeticiones tenemos que la variable n-dimensional (X1, X2, , Xn) sigue una distribucin multinomial de parmetros n, p1, , pn y su funcin de probabilidad es para con . Hay que tener en cuenta que si (X1, X2, , Xn) es una variable multidimensional entonces existe una relacin lineal entre sus componentes ya que X1+ X2+ + Xn = m, por lo que, una de las variables, por ejemplo Xn, se puede poner como combinacin lineal del resto, Xn=m-X1- X2- - Xn-1. Por tanto, el fenmeno que describe la variable (X1, X2, , Xn) queda igualmente descrito por una variable de una dimensin menor, (X1, X2, , Xn-1), sin que esta prdida de dimensin suponga una prdida de informacin. Por ejemplo, una variable multinomial de dimensin dos (X1, X2), M(n,p1,p2), se puede describir considerando una cualquiera de sus componentes que tiene una distribucin binomial, por lo que en realidad esta variable es unidimensional y no bidimensional. Adems, cada una de las n variables, Xi, que forman una multinomial M(n,p1,,pn) siguen distribuciones binomiales B(m,pi), es decir, las distribuciones marginales de una multinomial son binomiales, por tanto, la esperanza y la varianza de cada una de estas variables es, E[Xi]=mpi y Var(Xi)=mpi(1-pi). Adems la covarianza entre dos cualesquiera de sus componentes es, . Estos momentos de las variables componentes de una multinomial se pueden agrupar en forma de matriz dando lugar a las denominadas matriz de esperanzas y matriz de varianzas-covarianzas, que recogen las caractersticas tericas principales de la distribucin multinomial (medias, varianzas y covarianzas) Ejemplo: El entrenador de un equipo de baloncesto opina que los jugadores A, B y C tienen similares aptitudes para ser titulares del equipo en la posicin de base. As, determina que juegen el mismo nmero de minutos cada partido. Se sabe que el 40% de las canastas son de C, mientras que A y B consiguen un 75

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

30% de encestes. Calcular la probabilidad de que en un partido con 9 encestes de dos puntos, A consiguiera dos, B tres y C cuatro. Sea la variable tridimensional que recoge el nmero de encestes de A, de B y de C, respectivamente. Dicha variable es una multinomial con n=9, p1=0.3, p2=0.3 y p3=0.4.

DISTRIBUCIN HIPERGEOMTRICA
En teora de la probabilidad la distribucin hipergeomtrica es una distribucin discreta relacionada con muestreos aleatorios y sin reemplazo. Supngase que se tiene una poblacin de N elementos de los cuales, d pertenecen a la categora A y N-d a la B. La distribucin hipergeomtrica mide la probabilidad de obtener x ( ) elementos de la categora A en una muestra de n elementos de la poblacin original. Ejemplos La funcin de probabilidad de una variable aleatoria con distribucin hipergeomtrica puede deducirse a travs de razonamientos combinatorios y es igual a donde N es el tamao de poblacin, n es el tamao de la muestra extrada, d es el nmero de elementos en la poblacin original que pertenecen a la categora deseada y x es el nmero de elementos en la muestra que pertenecen a dicha categora. La notacin hace referencia al coeficiente binomial, es decir, el nmero de combinaciones posibles al seleccionar b elementos de un total a.

El valor esperado de una variable aleatoria X que sigue la distribucin hipergeomtrica es y su varianza En la frmula anterior, definiendo

Y se obtiene

76

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el nmero esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es as cuando N es grande y el tamao relativo de la muestra extrada, n/N, es pequeo. Propiedades La funcin de probabilidad de una variable aleatoria con distribucin hipergeomtrica puede deducirse a travs de razonamientos combinatorios y es igual a

Donde N es el tamao de poblacin, n es el tamao de la muestra extrada, d es el nmero de elementos en la poblacin original que pertenecen a la categora deseada y x es el nmero de elementos en la muestra que pertenecen a dicha categora. La notacin hace referencia al coeficiente binomial, es decir, el nmero de combinaciones posibles al seleccionar b elementos de un total a. El valor esperado de una variable aleatoria X que sigue la distribucin hipergeomtrica es

Y su varianza,

En la frmula anterior, definiendo

77

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Se obtiene

La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el nmero esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es as cuando N es grande y el tamao relativo de la muestra extrada, n/N, es pequeo. Ejemplo: En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, cul es la probabilidad de obtener x objetos defectuosos? Solucin: Luego;

p( x , n )

C x* N a C n x N Cn

Dnde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados


a

C x * N a C n x

muestras de n objetos en donde hay x que son defectuosos y n-x

buenos todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral
N

Cn

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, cul es la probabilidad de que 2 sean defectuosos? Solucin: N = 10 objetos en total a = 3 objetos defectuosos n = 4 objetos seleccionados en muestra x = 2 objetos defectuosos deseados en la muestra

78

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

p( x 2 ,n 4 )

C2*10 3 C4 2 10 C4

3! 7! * C* C ( 3 2 )!2! ( 7 2 )!2! 3 2 7 2 10! 10 C4 ( 10 4 )!4!

3! 7! 3x 2 x1! 7 x6 x5! * * 1!2! 5!2! 1!2! 5!2! 3x 2 x7 x6 * 4! 10! 10 x9 x8 x7 x6! 10 x9 x8 x7 2!2! 6!4! 6!4!
Dnde:
3 x 2 x7 x6 10 x9 x8 x7 Probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes
4! 2!2! Formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos

Como se observa en el desarrollo de la solucin del problema, la pretensin es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sera:

3x 2 x7 x6 4! 252 24 6048 * * 0.30 10 x9 x8 x7 2!2! 5040 4 20160

DISTRIBUCIN POSSON

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado nmero de eventos durante cierto periodo de tiempo. Fue descubierta por Simon-Denis Poisson, que la dio a conocer en 1838 en su trabajo Recherches sur la probabilit des jugements en matires criminelles 79

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

et matire civile (Investigacin sobre la probabilidad de los juicios en materias criminales y civiles).

PROPIEDADES La funcin de masa de la distribucin de Poisson es donde

k es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento suceda precisamente k veces). es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribucin de Poisson con = 104 = 40. e es la base de los logaritmos naturales (e = 2,71828 ...)

Tanto el valor esperado como la varianza de una variable aleatoria con distribucin de Poisson son iguales a . Los momentos de orden superior son polinomios de Touchard en cuyos coeficientes tienen una interpretacin combinatoria. De hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces segn la frmula de Dobinski, el n-simo momento iguala al nmero de particiones de tamao n. La moda de una variable aleatoria de distribucin de Poisson con un no entero es igual a , el mayor de los enteros menores que (los smbolos representan la funcin parte entera). Cuando es un entero positivo, las modas son y 1. La funcin generadora de momentos de la distribucin de Poisson con valor esperado es

Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente divisibles. La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parmetro 0 a otra de parmetro es

80

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

RELACIONES CON OTRAS DISTRIBUCIONES Sumas de variables aleatorias de Poisson La suma de variables aleatorias de Poisson independientes es otra variable aleatoria de Poisson cuyo parmetro es la suma de los parmetros de las originales. Dicho de otra manera, si son N variables aleatorias de Poisson independientes, entonces

. Distribucin binomial La distribucin de Poisson es el caso lmite de la distribucin binomial. De hecho, si los parmetros n y de una distribucin binomial tienden a infinito y a cero de manera que se mantenga constante, la distribucin lmite obtenida es de Poisson. Aproximacin normal Como consecuencia del teorema central del lmite, para valores grandes de , una variable aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente

Converge a una distribucin normal de media nula y varianza 1. Distribucin exponencial Supngase que para cada valor t > 0, que representa el tiempo, el nmero de sucesos de cierto fenmeno aleatorio sigue una distribucin de Poisson de parmetro t. Entonces, los tiempos discurridos entre dos sucesos sucesivos sigue la distribucin exponencial. Ejemplos Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas usamos la distribucin de Poisson. En este caso concreto, k es 5 y , , el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es

Este problema tambin podra resolverse recurriendo a una distribucin binomial de parmetros k = 5, n = 400 y =0,02. PRCESOS DE POISSON 81

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio. Ejemplos de estos eventos que pueden ser modelados por la distribucin de Poisson incluyen:

El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente distantes de los semforos) durante un periodo definido de tiempo. El nmero de errores de ortografa que uno comete al escribir una nica pgina. El nmero de llamadas telefnicas en una central telefnica por minuto. El nmero de servidores web accedidos por minuto. El nmero de animales muertos encontrados por unidad de longitud de ruta. El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad de radiacin. El nmero de ncleos atmicos inestables que decayeron en un determinado perodo en una porcin de sustancia radiactiva. La radiactividad de la sustancia se debilitar con el tiempo, por lo tanto el tiempo total del intervalo usado en el modelo debe ser significativamente menor que la vida media de la sustancia. El nmero de estrellas en un determinado volumen de espacio. La distribucin de receptores visuales en la retina del ojo humano. La inventiva de un inventor a lo largo de su carrera.

DISTRIBUCIN NORMAL.
En estadstica y probabilidad se llama distribucin normal, distribucin Gauss o distribucin gaussiana, a una de las distribuciones probabilidad de variable continua que con ms frecuencia aparece fenmenos reales. de de en

La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso 82

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal.1 Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianzaconocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas. DEFINICION NORMAL Hay varios modos de definir formalmente una distribucin de probabilidad. La forma ms visual es mediante su funcin de densidad. De forma equivalente, tambin pueden darse para su definicin la funcin de distribucin, los momentos, la funcin caracterstica y la funcin generatriz de momentos, entre otros. FUNCION DE DENCIDAD Se dice que una variable aleatoria continua X sigue una distribucin normal de parmetros y y se denotaX~N(, ) si su funcin de densidad est dada por:

83

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

donde (miu) la varianza).5

es

la media y (sigma)

es

la desviacin

tpica (2 es

Se llama distribucin normal "estndar" a aqulla en la que sus parmetros toman los valores = 0 y = 1. En este caso la funcin de densidad tiene la siguiente expresin:

Su grfica se muestra a la derecha y con frecuencia se usan ...tablas para el clculo de los valores de su distribucin.

FUNCION DE DISTRIBUCION La funcin de distribucin de la distribucin normal est definida como sigue:

Por tanto, la funcin de distribucin de la normal estndar es:

Esta funcin de distribucin puede expresarse en trminos de una funcin especial llamada funcin error de la siguiente forma:

Y la propia funcin de distribucin puede, por consiguiente, expresarse as:

El complemento de la funcin de distribucin de la normal estndar, 1 (x), se denota con frecuencia Q(x), y es referida, a veces, como simplemente funcin Q, especialmente en textos de ingeniera.6 7 Esto representa la cola de probabilidad de la distribucin gaussiana. Tambin se usan ocasionalmente otras definiciones de la funcin Q, las cuales son todas ellas transformaciones simples de .8 La inversa de la funcin de distribucin de la normal estndar (funcin cuantil) puede expresarse en trminos de la inversa de la funcin de error: 84

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Y la inversa de la funcin de distribucin puede, por consiguiente, expresarse como:

Esta funcin cuantil se llama a veces la funcin probit. No hay una primitiva elemental para la funcin probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal funcin. Existen varios mtodos exactos para aproximar la funcin cuantil mediante la distribucin normal (vase funcin cuantil). Los valores (x) pueden aproximarse con mucha precisin por distintos mtodos, tales como integracin numrica, series de Taylor, series asintticas y fracciones continuas.

DISTRIBUCIN EXPONENCIAL
En estadstica la distribucin exponencial es una distribucin de probabilidad continua con un parmetro > 0 cuya funcin de densidad es:

Su funcin de distribucin es:

Donde e representa el nmero e. El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son:

EJEMPLO Ejemplos para la distribucin exponencial es la distribucin de la longitud de los intervalos de variable continua que transcuren entre la ocurrencia de dos sucesos "raros", que se distribuyen segn la distribucin de Poisson. 85

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

CALCULAR LA VARIABLE ALEATORIA Se pueden calcular una variable aleatoria de distribucin exponencial x por medio de una variable aleatoria de distribucin uniforme u =U(0,1):

O, dado que (1 u) es tambin una variable aleatoria con distribucin U(0,1), puede utilizarse la versin ms eficiente:

RELACIONES La suma de k variables aleatorias independientes de distribucin exponencial con parmetro es una variable aleatoria de distribucin gamma. En estadstica la distribucin exponencial es una distribucin de probabilidad continua con un parmetro > 0 cuya funcin de densidad es:

Su funcin de distribucin es:

Donde e representa el nmero e. El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son:

Ejemplo Ejemplos para la distribucin exponencial es la distribucin de la longitud de los intervalos de variable continua que transcurren entre la ocurrencia de dos sucesos "raros", que se distribuyen segn la distribucin de Poisson. 86

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ejemplos de este tipo de distribuciones son:

El tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por ejemplo, la datacin de fsiles o cualquier materia orgnica mediante la tcnica del carbono 14, C14; El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente; En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un modelo probabilstico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida importante. , es tal que su

Concretando, si una v.a. continua X distribuida a lo largo de funcin de densidad es se dice que sigue una distribucin exponencial de parmetro .

Figura: Funcin de densidad, f, de una

Un clculo inmediato nos dice que si x>0,

87

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Luego la funcin de distribucin es:

Figura: Funcin de distribucin, F, de

calculada como el rea que deja por debajo de s la funcin de densidad.

Para calcular el valor esperado y la varianza de la distribucin exponencial, obtenemos en primer lugar la funcin caracterstica

Para despus, derivando por primera vez

Y derivando por segunda vez,

88

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Entonces la varianza vale

ACTIVIDADES
RESOLVER LOS SIGUIENTES EJERCICIOS 1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos en una ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. 2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal con varianza una varianza muestral: , tenga

1. Mayor que 9.1 2. Entre 3.462 y 10.745 3. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compaa, suponga una poblacin normal. 4. En un taller de reparacin de automviles recojo datos sobre los das de permanencia de los vehculos a reparar en l, y obtengo: Das de estancia N de coches 1 23 2 12 3 7 4 10 5 3 8 2 15 1

a) Calcula el nmero medio de das de permanencia y una medida de su representatividad. b) Cuantos das como mximo permanecen en el taller el 75% de los automviles, que menos permanecen en el taller? c) Calcula la mediana y la moda. 5. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de calcio en el agua potable, el cual se efecta como parte del control de calidad, se analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. 89

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Estimar la varianza de los resultados de la poblacin para este estndar, usando un nivel de confianza del 90%. 6. A una heladeria llegan clientes de tres tipos distintos: normal, golozo y premium, y el nmero de clientes de cada tipo (que llega en una hora) son Poisson con tasa _n = 100, _g = 50 y _p = 20. Si se sabe que el nmero total de clientes que lleg en una hora es de 500 personas, calcular la probabilidad de que hayan llegado ms de 200 clientes premium. 7. La probabilidad de que un jugador de golf haga hoyo en un lanzamiento a una cierta distancia es 0,3. Si lo intenta 5 veces, calcular la probabilidad de que: a) no acierte ninguna; b) acierte alguna; c) acierte 2. 8. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narctico en una botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) Cul es la probabilidad de que el viajero sea arrestado por posesin de narcticos?, b) Cul es la probabilidad de que no sea arrestado por posesin de narcticos?.

90

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION
1) QUE ES UNA DISTRIBUCION DE PROBABILIDAD __________________________________________________________ __________________________________________________________ 2) CMO GENERAMOS UNA DISTRIBUCIN DE PROBABILIDAD __________________________________________________________ __________________________________________________________ 3) QUE ES UNA VARIABLE ALEATORIA __________________________________________________________ __________________________________________________________ 4) CUANTAS CLASES DE VARIABLE ALEATORIA HAY Y CUALES SON: __________________________________________________________ __________________________________________________________ 5) CUALES SON LAS DISTRIBUCIONES DE PROBABILIDADES DISCRETAS MS IMPORTANTES: __________________________________________________________ __________________________________________________________ 6) CUALES SON LAS DISTRIBUCIONES DE PROBABILIDADES CONTINUAS MS IMPORTANTES: __________________________________________________________ __________________________________________________________ __________________________________________________________ __________________________________________________________ 7) EN QUE CONSISTE EL TEOREMA DE CHEBISCHEV __________________________________________________________ __________________________________________________________ 8) QUE ES LA COVARIANZA __________________________________________________________ __________________________________________________________ 9) QUE ES UNA DISTRIBUCIN UNIFORME DISCRETA __________________________________________________________ __________________________________________________________ 10) CUAL ES LA DIFERENCIA ENTRE UNA DISTRIBUCION BINOMIAL CON MULTINOMIAL __________________________________________________________ __________________________________________________________ 11) EN QUE CONSISTE UNA DISTRIBUCIN HIPERGEOMTRICA __________________________________________________________ __________________________________________________________ 12) QUE ES LA DISTRIBUCION DE POISSON __________________________________________________________ __________________________________________________________ 13) EN QUE CONSISTE LA DISTRIBUCION NORMAL Y LA EXPONTENCIAL __________________________________________________________ __________________________________________________________ 91

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD IV
CONTENIDOS PRUEBAS DE HIPOTESIS Prueba de hiptesis para media poblacional Prueba de hiptesis de la varianza. Prueba Ji cuadrada ACTIVIDADES EVALUACION

OBJETIVOS Conocer sobre cuales y que son las pruebas de hiptesis, para su respectivo estudio. Analizar las pruebas de hiptesis, con sus respectivos ejemplos, para tener asi una adecuada comprensin.

92

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

PRUEBAS DE HIPOTESIS

PRUEBA DE HIPTESIS PARA MEDIA POBLACIONAL


El promedio aritmtico poblacional es un indicador muy importante, por lo tanto, frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o ha disminudo. A travs de la prueba de hiptesis se determina si la media poblacional es significativamente mayor o menor que algn valor supuesto. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : H1 : =k k

- Prueba de hiptesis a una cola superior H0 : =k H0 : H1 : >k k

H1 : >k

- Prueba de hiptesis a una cola inferior H0 : =k H0 : H1 : < k k

H1 : < k

En las distribuciones en el muestreo se vi que para el caso de la media, hay tres situaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestos de la poblacin y del tamao de la muestra.

PRUEBA DE HIPTESIS DE LA VARIANZA.


Es frecuente que se desee comprobar si la variacin o dispersin de una variable ha tenido alguna modificacin, lo cual se hace con la prueba de hiptesis para la varianza. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: 93

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

- Prueba de hiptesis a dos colas H0 : H1 : =k k

- Prueba de hiptesis a una cola superior H0 : H1 : =k >k H0 : H1 : k >k

- Prueba de hiptesis a una cola inferior H0 : H1 : =k <k H1 : H1 : k <k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( expresin (1.4): ) la estadstica de trabajo es la

(3.6) Si se utiliza la varianza corregida, la estadstica de trabajo es la expresin (1.5):

(3.7) REGLA DE DECISION - Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.8

94

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Figura 3.8 Regla de decisin para una prueba de hiptesis a dos colas y pertenecen a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si <T< no se rechaza H0. - Si se ha planteado la hiptesis alternativa como: H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, vease figura

Figura 3.9 Regla de decisin para una prueba de hiptesis a una cola superior Z1- pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, vease figura 3.10

95

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Figura 3.10 Regla de decisin para una prueba de hiptesis a una cola inferior Z pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T >Z no se rechaza H0. EJEMPLO Se supone que los dimetros de cierta marca de vlvulas estn distribudos normalmente con una varianza poblacional de 0,2 pulgadas 2 , pero se cree que ltimamente ha aumentado. Se toma una muestra aleatoria de vlvulas a las que se les mide su dimetro, obtenindose los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7 Con sta informacin pruebe si lo que se cree es cierto. Solucin Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto: H0 : H1 : = 0,2 > 0,2

Para realizar esta prueba de hiptesis se utiliza la expresin 3.6

Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribucin chi-cuadrado con 9 grados de libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura 3.11, el valor de la estadstica de trabajo 96

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

se ubica en la zona de no rechazo de la hiptesis nula, por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.

PRUEBA JI CUADRADA
En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria

donde Zi son variables aleatorias normales independientes de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: . Es conveniente tener en cuenta que la letra griega se transcribe al latn como chi1 y se pronuncia en castellanocomo ji.2 3

PROPIEDADES Funcin de densidad Su funcin de densidad es:

donde es la funcin gamma.

Funcin de distribucin acumulada

Su funcin de distribucin es

97

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

donde

es la funcin gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribucin son, respectivamente, k y 2k.

RELACION CON OTRAS DISTRIBUCIONES La distribucin es un caso especial de la distribucin gamma. De hecho, Como consecuencia, cuando k = 2, la distribucin es una distribucin exponencial de media k = 2. Cuando k es suficientemente grande, como consecuencia del teorema central del lmite, puede aproximarse por una distribucin normal:

APLICACIONES La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student. Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .

98

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADES
RESOLVER LOS SIGUIENTES EJERCICIOS 1. La Concejala de la Juventud de un Ayuntamiento maneja el dato de que la edad a la que los hijos se independizan de sus padres es una variable normal con media 29 aos y desviacin tpica 3 aos. Aunque la desviacin tpica no plantea dudas, si se sospecha que la media ha descendido, sobre todo por la politica de ayuda al empleo que ha llevado a cabo el Ayuntamiento. As de un estudio reciente sobre 100 jvenes que se acaban de independizar, se ha obtenido una media de 28,1 aos de edad. a) Con un nivel de significacin del 1%, puede defenderse que la edad media no ha disminuido, frente a que si lo ha hecho como parecen indicar los datos? Plantea el contraste o test de hiptesis y resulvelo. b) Explicar en el contexto del problema, en qu consisten cada uno de los errores de tipo I y II. 2. Una empresa consultora desea determinar la variablidad existente en la opinin pblica sobre el desempeo del Gobierno del Estado; histricamente la varianza ha sido de 2 en los puntos de calificacin que le otorga la ciudadana al gobierno; en el ltimo muestreo se detecto una varianza de 3 tomando como referencia rpida 20 personas; hay elementos estadsticos suficientes para asegurar que la varianza ha AUMENTADO? Realice la prueba de hiptesis para contestar la pregunta anterior con un alfa = 0.1. Realice: a) Redaccin de la prueba de hiptesis, indicando si debe ser prueba de una o dos colas. b) Determine mediante el estadstico de prueba ji cuadrada si se acepta o rechaza la hiptesis nula y cul sera la consecuencia del resultado obtenido para la pregunta.

99

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION
1. QUE DETERMINA POBLACIONAL: LA PUEBA DE HIPOTESIS EN LA MEDIA

____________________________________________________________ ____________________________________________________________ 2. CUANTOS TIPOS DE HIPOTESIS SE PUEDE PLANTEAR Y CUALES SON: _____________________________________________________________ ___________________________________________________________ 3. QUE SE PUEDE PROBAR CON LA HIPOTESIS DE LA VARIANZA: _____________________________________________________________ ___________________________________________________________ 4. QUE ES UNA PRUEBA Ji CUADRADA _____________________________________________________________ ___________________________________________________________ 5. CUALES SON LAS PROPIEDADES DE LA Ji CUADRADA _____________________________________________________________ ___________________________________________________________

100

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD V
CONTENIDOS DISTRIBUCIONES DE MUESTREO Muestreo aleatorio Distribuciones mustrales Distribuciones mustrales de medias. Distribucin t de student Distribucin F ACTIVIDADES EVALUACION

OBJETIVOS Conocer sobre las distribuciones de muestreo Analizar sobre las distribuciones de muestreso, para realizar

adecuadamente los ejercicios. Realizar las actividades de la Unidad para su mayor comprension

101

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTRIBUCIONES DE MUESTREO
MUESTREO ALEATORIO
Muestreo en el que la seleccin de los elementos de la muestra se hace de forma aleatoria y, por tanto, sin que en su composicin influya la opinin o preferencia de la persona que la selecciona. En las muestras no aleatorias, en cambio, la seleccin de las unidades mustrales no es nunca completamente independiente de las preferencias e incluso manas de la persona que hace la seleccin. Al primer tipo de muestreo, el nico verdaderamente cientfico, tambin se le denomina muestreo estadstico, y el segundo, muy utilizado en las ciencias sociales, es el llamado muestreo opintico. La seleccin al azar o aleatoria de una muestra se hace generalmente mediante el uso de una tabla de nmeros aleatoria, pero tambin se puede seleccionar haciendo uso de una urna, lotera o cualquier otro artificio que genere nmeros aleatorios. Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de seleccin muestreo aleatorio. El muestreo aleatorio se puede plantear bajo dos puntos de vista:

Sin reposicin de los elementos; Con reposicin.

Muestreo aleatorio sin reposicin Consideremos una poblacin E formada por N elementos. Si observamos un elemento particular, en un muestreo aleatorio sin reposicin se da la siguiente circunstancia:

La probabilidad de que e sea elegido en primer lugar es ; Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de ), la probabilidad de que sea elegido en el segundo intento es de

en el (i+1)-ensimo intento, la poblacin consta de N-i elementos, con lo cual si e no ha sido seleccionado previamente, la probabilidad de que lo sea en este momento es de . 102

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Si consideramos una muestra de elementos, donde el orden en la eleccin de los mismos tiene importancia, la probabilidad de eleccin de una muestra cualquiera es

Lo que corresponde en el sentido de la definicin de probabilidad de Laplace a un caso posible entre las VN,n posibles n-uplas de N elementos de la poblacin. Si el orden no interviene, la probabilidad de que una muestra

Sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir

Muestreo aleatorio con reposicin Sobre una poblacin E de tamao N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extrado es repuesto al total de la poblacin. De esta forma un elemento puede ser extrado varias veces. Si el orden en la extraccin de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es:

103

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Si el orden no interviene, la probabilidad de una muestra cualquiera, ser la suma de la anterior, repitindola tantas veces como manera de combinar sus elementos sea posible. Es decir, Sea n1 el nmero de veces que se repite cierto elemento e1 en la muestra; Sea n2 el nmero de veces que se repite cierto elemento e2; Sea nk el nmero de veces que se repite cierto elemento ek, De modo que muestra . Entonces la probabilidad de obtener la

Es

Es decir,

El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que

cada elemento de la poblacin tiene la misma probabilidad de ser elegido, y las observaciones se realizan con reemplazamiento. De este modo, cada observacin es realizada sobre la misma poblacin (no disminuye con las extracciones sucesivas).

Sea X una v.a. definida sobre la poblacin E, y f(x) su ley de probabilidad.

104

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

En una muestra aleatoria simple, cada observacin tiene la distribucin de probabilidad de la poblacin: Adems todas las observaciones de la v.a. son independientes, es decir Las relaciones (7.1)-(7.2) caracterizan a las muestras aleatorias simples. La seleccin de una muestra aleatoria puede realizarse con la ayuda de #.#> Tablas de nmeros aleatorios: Lotera Nacional Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los nmeros de Lotera Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dgito tiene la misma probabilidad de ser elegido, y su eleccin es independiente de las dems extracciones. Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de nmeros aleatorios de k=5 cifras (00000-99.999), una poblacin de N=600individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso ordenamos a toda la poblacin (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un nmero del 1 al 600. En segundo lugar nos dirigimos a la tabla de nmeros aleatorios, y comenzando en cualquier punto extraemos un nmero t, y tomamos como primer elemento de la muestra al elemento de la poblacin:

El proceso se repite tomando los siguientes nmeros de la tabla de nmeros aleatorios, hasta obtener la muestra de 10 individuos.

Las cantidades Pueden ser consideradas como observaciones de una v.a. U, que sigue una distribucin uniforme en el intervalo [0,1]

Mtodo de Montecarlo El mtodo de Montecarlo es una tcnica para obtener muestras aleatorias simples de una v.a. X, de la que conocemos su ley de probabilidad (a partir de 105

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

su funcin de distribucin F). Con este mtodo, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad es: 1. Usando una tabla de nmeros aleatorios7.1 se toma un valor u de una v.a. . 2. Si X es continua tomar como observacin de X, la cantidad x=F-1(u). En el caso en que X sea discreta se toma x como el percentil de X, es decir el valor ms pequeo que verifica que .

Este proceso se debe repetir n veces para obtener una muestra de tamao n. Ejemplo Si queremos extraer n=10 muestras de una distribucin podemos recurrir a una tabla de nmeros aleatorios de k=5cifras, en las que observamos las cantidades (por ejemplo)

A partir de ellas podemos obtener una muestra de tabla de la distribucin normal:

usando una

Nmeros aleatorios Muestra ti 76.293 31.776 50.803 71.153 20.271 33.717 0'76 0'32(=1-0'68) 0'51 0'71 0'20(=1-0'80) 0'34(=1-0'66) 106

Muestra xi = F-1(ui) 0'71 -0'47 0'03 0'55 -0'84 -0'41

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

17.979 52.125 41.330 95.141

0'18(=1-0'82) 0'52 0'41(=1-0'59) 0'95

-0'92 0'05 -0'23 1'65

Obsrvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la esperanza matemtica de . Por otra parte, esto no implica que el valor medio de la muestra sea necesariamente . Sin embargo como sabemos por el teorema de Fisher que

Su dispersin con respecto al valor central es pequea, lo que implica que probablemente el valor medio estar muy prximo a 0, como se puede calcular:

Obsrvese que si el problema fuese el inverso, donde nicamente conocisemos las observaciones xi y que el mecanismo que gener esos datos hubiese sido una distribucin normal de parmetros desconocidos, con obtenida hubisemos tenido una buena aproximacin del ``parmetro desconocido . Sobre esta cuestin volveremos ms adelante al abordar el problema de la estimacin puntual de parmetros.

DISTRIBUCIONES MUSTRALES
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones 107

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas mustrales. Como el anlisis de las distribuciones asociadas con los estadsticos mustrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias mustrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar mustrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:

108

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ejemplo 1.6 Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: , la media poblacional. , la desviacin estndar poblacional.
x, la x,

media de la distribucin muestral de medias.

la desviacin estndar de la distribucin muestral de medias.

Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias. Solucin: a. La media poblacional es:

109

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

De aqu que podamos deducir que: Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

110

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribuciones mustrales Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la distribucin muestral de medias sea aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.

111

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTRIBUCIONES MUSTRALES DE MEDIAS

La distribucin de medias mustrales tiende hacia una distribucin normal, aunque las muestras procedan de una distribucin no normal. Incrementando el nmero de muestras extradas de la poblacin, la distribucin de sus medias tiende a normalizarse. (N > 30) Vamos a obtener experimentalmente la distribucin de las medias muestrales. Para ello consideremos la siguiente poblacin:

Consideremos todas las muestras de tamao 2 posibles, mediante muestreo aleatorio simple (con reemplazamiento). Hallamos la distribucin de probabilidad de la media muestral

112

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Como se puede observar:

Si la poblacin es finita y la extraccin simultnea o sin reposicin, la desviacin tpica va multiplicada por la siguiente expresin:

Donde N = tamao de la poblacin y n = tamao de la muestra

DISTRIBUCIN T DE STUDENT
En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. Caracterizacin 113

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La distribucin t de Student es la distribucin de probabilidad del cociente

Donde

Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes

Si es una constante no nula, el cociente es una variable aleatoria que sigue la distribucin t de Student no central con parmetro de no-centralidad . Aparicin y especificaciones de la distribucin t de Student Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media y varianza 2. Sea

La media muestral. Entonces

Sigue una distribucin normal de media 0 y varianza 1. Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi un cociente relacionado,

Donde

Es la varianza muestral y demostr que la funcin de densidad de T es

114

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Donde

es igual a n 1.

La distribucin de T se llama ahora la distribucin-t de Student. El parmetro representa el nmero de grados de libertad. La distribucin depende de , pero no de o , lo cual es muy importante en la prctica. Intervalos de confianza derivados de la distribucin t de Student El procedimiento para el clculo del intervalo de confianza basado en la t de Student consiste en estimar la desviacin tpica de los datos S y calcular el error estndar de la media para la media = , siendo entonces el intervalo de confianza .

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye tambin normalmente, la distribucin t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero. Para efectos prcticos el valor esperado y la varianza son: E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3 Historia La distribucin de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fbrica de cerveza, Guinness, que prohiba a sus empleados la publicacin de artculos cientficos debido a una difusin previa de secretos industriales. De ah que Gosset publicase sus resultados bajo el seudnimo de Student. Distribucin t de Student

115

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La Distribucin t de Student, tiene por funcin de densidad:

Donde el parmetro n de

, se denomina grados de libertad de la distribucin.

La distribucin t de Student existe para todos los valores de x reales, y es simtrica respecto al eje y. La distribucin de probabilidad de esta funcin para valores menores de un x dado, que representamos por

Donde:

Para el clculo de esta integral existen distintos tipos de Tabla de distribucin t de Student, en la que para distintos valores de n y de x se puede buscar su probabilidad acumulada p, veamos una de esas tablas. La tabla En esta tabla hay dos entradas, en la fila superior estn los valores de n para los que se ha calculado la probabilidad, en la columna de la izquierda los de x, para x igual o mayor que cero, en incrementos de 0,05, para cada valor de n y de la x correspondiente tenemos la probabilidad acumulada, expresada con tres cifras decimales. Ejemplo. Cul es la probabilidad acumulada de una Distribucin t de Student de 9 grados de libertad, de que x < 0,25. 116

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Esto es:

Buscando en la tabla en la columna del 9, y la fila de 0,25 tenemos que:

Para otros valores En la tabla anterior se puede buscar los valores de la probabilidad t de Student:

para valores de x mayores o iguales a cero, obteniendo el resultado directamente, como el ejemplo anterior, hay ms casos que se pueden resolver, empleando esta misma tabla, veamos algunos: Para valores de x de signo negativo.

En la tabla solo podemos encontrar probabilidades para x mayor que cero, para saber:

Como se puede ver en la tabla no hay valor de x negativas, estos valores no son necesarios dado que la funcin t de Student es simtrica respecto al eje y, con lo que se pueden calcular partiendo de los valores para x positivas. Para ello nos basamos en dos principios:

La suma de probabilidades acumulada menor y mayor que x es 1. La simetra de la distribucin t de Student.

Como se puede ver:

117

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Hay que tener en cuenta que la suma de la probabilidad de que una variable estadstica sea menor que un valor x, ms la probabilidad de que sea mayor que ese valor x, es uno:

Despejando:

Como se puede ver en la figura, esta afirmacin es cierta para podas las funciones de distribucin y para todos los valores de x.

Adems sabiendo que la funcin t de Student es simtrica respecto al eje x = 0, la probabilidad acumulada a la izquierda de -x es igual a la probabilidad acumulada a la derecha de x:

Sustituyendo en la expresin anterior, nos da el resultado:

Donde el valor:

Se busca en la tabla.

118

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ejemplo Cul es la probabilidad de que una variable t de Student de 6 grados de libertad deja a la izquierda de -1,45:

Los valores negativos no vienen en la tabla, pero segn lo anterior:

En la tabla encontramos:

Por tanto:

Con lo que obtenemos:

Probabilidad de t > x y x > 0

Para calcular la probabilidad acumulada a la derecha de una abscisa x dada:

Como en el caso anterior partimos de:

Despejando:

Donde el valor:

119

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Se busca en la tabla. Ejemplo Cul es la probabilidad acumulada a la derecha de 2,45, en una variable t de Student de 15 grados de libertad.

Segn lo anterior:

Por la tabla tenemos que:

Que sustituyndolo en la expresin, resulta:

Que da como resultado:

Probabilidad de t > x y x < 0

Para calcular la probabilidad acumulada a la derecha de un valor negativo:

Partimos de la simetra de la funcin t de Student:

Y sustituyendo:

120

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Tenemos que:

Ordenando los trminos:

Grficamente este resultado es obvio si rotamos la grfica de la funcin respecto a su eje y. Ejemplo Cul es la probabilidad: Segn lo anterior:

Buscando el valor en la tabla, tenemos que:

Probabilidad de x1 < t < x2 Para calcular la probabilidad de que la variable se encuentre entre dos valores x1 y x2, siendo x1 < x2 se tiene en cuenta que:

Los valores de cada una de estas probabilidades se buscan en la tabla por separado, o se calculan segn el caso, por los mtodos anteriores. Ejemplo Cul es la probabilidad acumulada de una variable t de Student de 25 grados de libertad, se encuentre entre: 0,75 y 1,25.

121

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Segn lo anterior, tenemos:

En la tabla las probabilidades, tenemos los valores:

Sustituyendo tenemos:

Realizando la operacin:

Que es el resultado de esta probabilidad acumulada. Interpolacin lineal Cuando el valor de x es de mayor precisin que los contenidos en la tabla, el mtodo de calcular la probabilidad es empleando interpolacin lineal.

La expresin:

Nos permite calcular la probabilidad para los valores no contenidos en la tabla. Esta expresin siempre aade un cierto error, al sustituir la funcin y = f(x) por la recta que pasa por dos puntos conocidos y = r(x), por eso es conveniente que los puntos x1 y x2 estn lo ms prximos posible.

122

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ejemplo Calcular la probabilidad acumulada a la izquierda de 0,87 de una variable t Student de 10 grados de libertad:

El valor 0,87 no viene en la tabla, pero los valores 0,85 y 0,90 s:

Segn la expresin:

Sustituyendo los valores numricos, tenemos:

Operando:

Esto es:

Dando como resultado:

Que es la solucin al problema planteado:

Tabla inversa, de distribucin t de Student

123

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La forma inversa de tabla de distribucin t de Student, en la cual los valores de bsqueda son los grados de libertad y la probabilidad acumulada, de la expresin:

En este tipo de tablas se parte de los valoras conocidos n y p, y se obtiene x, de forma inversa a lo visto anteriormente, lo que resulta interesante pera responder a la pregunta: Para una distribucin t de Student de n grados de libertad, cual es el valor de x que deja a su izquierda una probabilidad p. Este tipo de problema en la prctica, suele ser ms usual, la tabla es ms compacta y tambin nos permite calcular la probabilidad como con la tabla directa. En la tabla tenemos en la fila superior las probabilidades p, en la columna de la izquierda los grados de libertad n, donde se cruzan la fila y la columna correspondientes el valor de x, con seis cifras decimales separadas de tres en tres para facilitar la lectura, que en una funcin t de Student de n grados de libertad, deja a su izquierda una probabilidad p. Ejemplo Cul es la abscisa de una distribucin t de Student de 5 grados de libertad que deja a su izquierda una probabilidad del 99%. esto es:

Consultando la tabla en la columna del 0,99 y en la fila del 5, tenemos que;

Para valores de n grandes Cuando el valor de n se hace suficientemente grande se puede tener en cuenta que el lmite de la distribucin t de Student, cuando n tiende a infinito es la distribucin normal de media 0 y desviacin tpica 1, 124

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Por lo tanto, podemos hacer una aproximacin de la distribucin t de Student de n grande, por la distribucin normal tipificada, realizando el clculo numrico con la tabla distribucin normal tipificada.

DISTRIBUCIN F
Usada en teora de probabilidad y estadstica, la distribucin F es una distribucin de probabilidad continua. Tambin se la conoce como distribucin F de Snedecor (por George Snedecor) o como distribucin F de FisherSnedecor. Una variable aleatoria de distribucin F se construye como el siguiente cociente:

Donde

U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad respectivamente, y U1 y U2 son estadsticamente independientes.

La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica, especialmente en el anlisis de varianza. Vase el test F. La funcin de densidad de una F(d1, d2) viene dada por

Para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta. La funcin de distribucin es

Donde I es la funcin beta incompleta regularizada. 125

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribuciones relacionadas

es una distribucin ji-cuadrada cuando XF(1,2).

para

DISTRIBUCION "F" FISHER La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un profesor universitario con la de otro.

Intuitivamente, podramos comparar las varianzas de dos poblaciones,

, utilizando la razn de las varianzas mustrales s21/s22. Si s21/s22 es casi igual a 1, se tendr poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeo para s 21/s22, proporcionar evidencia de una diferencia en las varianzas de las poblaciones. La variable aleatoria F se define como el cociente de dos variables aleatorias jicuadrada independiente, cada una dividida entre sus respectivos grados de libertad. Esto es,

Donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad


1

respectivamente.

Sean U y V dos variables aleatorias independientes que tienen distribucin ji cuadradas con grados de libertad, respectivamente. Entonces la

distribucin de la variable aleatoria

est dada por:

126

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Y se dice que sigue la distribucin F con y grados de libertad en el denominador.

grados de libertad en el numerador

La media y la varianza de la distribucin F son:

Para

para La variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La distribucin F tiene una apariencia muy similar a la distribucin jicuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parmetros proporcionan una flexibilidad adicional con respecto a la forma de la distribucin. Si s12 y s22 son las varianzas muestrales independientes de tamao n 1 y n2 2 2 tomadas de poblaciones normales con varianzas y 1 2 , respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F. Las tablas tienen la siguiente estructura:

127

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

P 6 0.0005 0.001 0.005 . . 0.9995

1 2 3 . .. 500

30.4

El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos graficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos variables que son los grados de libertad. Ejemplos: 1. Encontrar el valor de F, en cada uno de los siguientes casos: a. El rea a la derecha de F, es de 0.25 con b. El rea a la izquierda de F, es de 0.95 con c. El rea a la derecha de F es de 0.95 con con d. El rea a la izquierda de F, es de 0.10 con con =24 Solucin: =4 y =15 y =6 y =24 y =9. =10. =8.

128

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

a. Como el rea que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de libertad dos que son 9, luego un rea de 0.75 con 4 grados de libertad uno.

b. En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos grados de libertad.

c. Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha de F de 0.95.

d. Se busca directamente el rea de 0.10, con sus respectivos grados de libertad.

129

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

1. Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaos n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s12/s22 2.42). Solucin: Primero se establecen los grados de libertad. Como en el numerador est la poblacin uno y en el denominador la poblacin dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19. Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no estn, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedara:

Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente: rea 0.90 0.95 2.09 2.59

Al interpolar entre estos dos valores nos queda un rea de 0.933. Se procede a hacer lo mismo pero con 20 grados de libertad dos: rea 0.95 0.975 2.39 2.84

Al interpolar entre estos dos valores nos queda un rea de 0.9516. Ahora ya se tienen las dos reas referentes a los grados de libertad dos, por lo que se interpolar para ver cunto le corresponde a los grados libertad dos con un valor de 19. rea 130

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

15 20

0.933 0.9516

Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el rea a la izquierda es de 0.9478.

2. Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamao n1= 25 y n2 = 31, tomadas de poblaciones 2 normales con varianzas 1 =10 y
2 2

= 15, respectivamente, encuentre P(s12/s22 > 1.26).

Solucin: Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad uno. Cuando se est en esta posicin se busca adentro de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un rea de 0.95, pero esta rea correspondera a la probabilidad de que las relaciones de varianzas mustrales fueran menor a 1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.

Intervalo de Confianza Distribuciones Normales

para

el

Cociente

de

Varianzas

de

Dos

131

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Supngase que se tienen dos poblaciones normales e independientes con 2 2 varianzas desconocidas y 1 2 , respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaos n 1 y n2, respectivamente, sean s12 y s22 las dos varianzas mustrales. Se desea conocer un intervalo de confianza del 100( ) por ciento para el cociente 2 2 de las dos varianzas, 1 / 2 . Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadstico F. Ejemplos: 1. Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran en la tabla: Mtodo 1 n1 = 31 s12 = 50 Mtodo 2 n2 = 25 s22 = 24
2 1 / 2 2 .

Construya un intervalo de confianza del 90% para Solucin:

Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

al despejar:

F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

132

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

y Estos resultados los podemos interpretar de la siguiente manera: Con un nivel de confianza del 90% se sabe que la relacin de varianzas 2 2 1 / 2 est entre 1.07 y 3.93. Esto supondra que la varianza de la poblacin 1 es mayor a la varianza de la poblacin 2 entre 1.07 y 3.93. Una compaa fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustara seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviacin estndar s1 = 4.7 micro pulgadas, y una muestra aleatoria de n 2=12 partes del segundo proceso, la cual tiene una desviacin estndar s 2 = 5.1 micro pulgadas. Se desea encontrar un intervalo de confianza del 90% para el 2 cociente de las dos varianzas 1 / Suponga que los dos procesos son independientes y que la rugosidad de la superficie est distribuida de manera normal. Solucin: Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

Al despejar:

En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

133

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

y Estos resultados los podemos interpretar de la siguiente manera: Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las desviaciones estndar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.

134

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADES

1. Un autobs de una empresa de transporte de viajeros recorre por trmino medio 300 Km. Diarios, con una desviacin estndar de 2 Km; Si observamos una muestra aleatoria simple del mismo de 100 recorridos diarios, calcular la probabilidad de que el recorrido medio est comprendido entre 296 y 304 Km 2. Un fabricante de tabaco asegura que el contenido de nicotina de cada cigarrillo sigue una distribucin normal, con un contenido de nicotina de 1,1 mg. y una desviacin de 0,1 mg. As mismo, asegura que el contenido medio de alquitrn es de 15 mg. su desviacin tpica de 1 mg. y su distribucin normal. Las inspecciones realizadas por el Ministerio de Sanidad rechazan un paquete de 20 cigarrillo, si el contenido de nicotina es superior a 1,15 mg. por cigarrillo, o si el contenido medio de alquitrn del paquete es superior a 15,5 mg. por cigarrillo Calcular el porcentaje de paquetes rechazados por exceso de alquitrn o por exceso de nicotina. 3. Si en el ejercicio anterior el fabricante insiste en que las inspecciones se realicen sobre un lote de 5 paquetes de tabaco. Qu probabilidad hay de que se rechace el lote de cinco paquetes por exceso de alquitrn? 4. Si el inspector del Ministerio de Sanidad acepta la condicin de inspeccionar los lotes de cinco paquetes, pero quiere que la probabilidad de rechazar el lote por contenido de alquitrn, siga siendo la misma, dnde tiene que poner el lmite de contenido de alquitrn? 5. Supongamos que los sueldos anuales, en millones de unidades monetarias, de los directivos de una gran empresa se distribuyen segn la normal N( lO, 1), mientras que los del resto del personal siguen una N(4, 2). Si se extrae una muestra aleatoria simple de 10 directivos y otra de 20 empleados no directivos, se pide: a. Calcular la probabilidad de que el sueldo anual medio de la muestra de 10 directivos supere los 11 millones de unidades monetarias. b. Calcular la probabilidad de que el sueldo anual medio de la muestra de 20 empleados no directivos supere los cinco millones. c. Cul es la probabilidad de que el sueldo anual de los 10 directivos supere al de los 20 empleados en ms de cinco millones?

135

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION 1. QUE ES EL MUESTREO ALEATORIO _____________________________________________________________ ___________________________________________________________ 2. QUE ES LA DISTRIBUCION MUESTRAL _____________________________________________________________ ___________________________________________________________ 3. COMO SE GENERA LAS DISTRIBUCIONES MUESTRALES _____________________________________________________________ ___________________________________________________________ 4. QUE ES UNA DISTRIBUCION T DE STUDENT _____________________________________________________________ ___________________________________________________________ 5. EN QUE AO FUE DESCRITA LA DISTRIBUCION DE STUDENT Y POR QUIEN _____________________________________________________________ ___________________________________________________________ 6. QUE ES UNA DISTRIBUCION F _____________________________________________________________ ___________________________________________________________

136

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

BIBLIOGRAFIA
http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva http://www.stadcenterecuador.com/contenidos/estadisticadescriptiva.html http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp http://www.google.com.ec/url?sa=t&rct=j&q=estadistica%20descriptiva&s ource=web&cd=4&sqi=2&ved=0CEMQFjAD&url=http%3A%2F%2Fwww. dspace.espol.edu.ec%2Fbitstream%2F123456789%2F6917%2F12%2F CAPITULO%2520I.doc&ei=HyUiTLFDsqqgwfisazjCA&usg=AFQjCNHlaUhI2KiMHkzVU_KSrB6Cf5SSiQ http://www.slideshare.net/produceideas/estadistica-descriptivapresentation http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-uindice.html http://www.vitutor.com/estadistica/descriptiva/a_a.html http://www.vitutor.com/estadistica/inferencia/inferenciaActividades.html http://www.uned.es/111044/examenes/EJERESUS01.htm http://www.vitutor.com/estadistica/descriptiva/a_16.html http://www.economia48.com/spa/d/desviacion-tipica/desviaciontipica.htm http://www.slideshare.net/hfunes/distribuciones-muestrales-presentation http://maralboran.org/wikipedia/index.php/Distribuciones_muestrales._Te orema_central_del_l%C3%ADmite http://html.rincondelvago.com/distribuciones-muestrales.html http://www.monografias.com/trabajos17/pruebas-de-hipotesis/pruebasde-hipotesis.shtml http://www.monografias.com/trabajos30/prueba-de-hipotesis/prueba-dehipotesis.shtml

137