Vous êtes sur la page 1sur 18

Estadstica aplicada Contenido

Introduccin.................................................................................................................................................................... 2 Conceptos bsicos......................................................................................................................................................... 2 Definicin de estadstica ....................................................................................................................................... 2 Tipo de datos ............................................................................................................................................................. 2 Estadstica descriptiva ................................................................................................................................................ 3 Medidas de tendencia central ............................................................................................................................. 3 Medidas de dispersin ........................................................................................................................................... 4 Medidas de posicin y de forma ........................................................................................................................ 5 Distribuciones de probabilidad .............................................................................................................................. 5 Distribucin de probabilidad discreta: distribucin binomial .............................................................. 5 Distribucin continua: distribucin normal ................................................................................................. 6 Distribuciones de muestreo ..................................................................................................................................... 9 Teorema del lmite central ................................................................................................................................... 9 Estadstica inferencial ................................................................................................................................................. 9 Estimaciones por intervalo .................................................................................................................................. 9 Intervalo de confianza para , conocida ............................................................................................. 10 Intervalo de confianza para , desconocida pero muestra grande .......................................... 10 Intervalo de confianza para , desconocida y muestra pequea .............................................. 11 Intervalo de confianza para la proporcin (muestras grandes) ................................................... 11 Tamao muestral .................................................................................................................................................. 13 Tamao muestral (media) ............................................................................................................................ 13 Tamao muestral (proporcin) ................................................................................................................. 13 Pruebas de hiptesis ............................................................................................................................................ 14 Conceptos bsicos ............................................................................................................................................ 14 Pasos para una prueba de hiptesis ........................................................................................................ 14 Prueba de hiptesis para , con conocida .......................................................................................... 15 Prueba de hiptesis para , con desconocida ................................................................................... 17 Prueba de hiptesis para la proporcin ................................................................................................. 18

Introduccin Evaluacin Tres tareas Proyecto final Examen final 30% 40% 30% 100%

Conceptos bsicos Definicin de estadstica


Es la disciplina que organiza, resume, analiza y presenta datos. Nos permite hacer conclusiones con respecto a una fuente de datos Estadstica descriptiva: organiza, resume y presenta informacin Estadstica inferencial: es la que permite realizar inferencias acerca de una poblacin con base en una muestra

Poblacin: es un conjunto de elementos que tienen una caracterstica que deseamos analizar. Muestra: es un subconjunto de la poblacin Parmetros: aquello que describe a una poblacin Estadstico: describe a una muestra La estadstica inferencial consiste en realizar inferencias respecto a la poblacin (parmetros), con base en estadsticos calculados a partir de muestras

Tipo de datos Cualitativos: no tienen significado matemtico, representan cualidades o categoras Por escala de medicin: Nominales: representan slo la etiqueta de la categora. P. ej. gnero (hombre, mujer), estado civil (soltero, casado, viudo, unin libre, divorciado) Ordinales: son aquellos que tienen un orden natural. P. ej. Nivel de educacin (primaria, secundaria, preparatoria, profesional, etc.) Cuantitativos: tienen significado matemtico.

Por escala de medicin De intervalo: slo tiene sentido operaciones de suma y resta, no existe un punto de partida (el 0 no representa ausencia). P. ej. temperatura en grados Celsius, ao. De razn: se pueden aplicar todas las operaciones algebraicas, el 0 s representa ausencia. P. ej. ingreso en pesos, nmero de personas que asisten a un evento. Los datos cuantitativos tambin se pueden clasificar como: Discretos: aquellos que se pueden contar Continuos: aquellos que se pueden medir

Estadstica descriptiva Tabulacin de datos: tablas de frecuencia, consiste en crear intervalos o clases y realizar el conteo de frecuencias. Medidas numricas: permiten representar con un valor las caractersticas principales de un conjunto de datos. o Medidas de tendencia central o Medidas de dispersin o Medidas de posicin y forma Mtodos grficos: histograma, grfico de pastel, diagramas de barras, pictogramas.

Medidas de tendencia central o Media (media aritmtica). Es el promedio y se calcula dividiendo la sumatoria total entre el nmero de observaciones Media poblacional Media muestral

o Mediana: es el valor que separa el 50% de los datos ordenados del restante 50%. o Moda: el valor que ms se repite en un conjunto de datos. o Relacin entre media, mediana y moda: Si la distribucin de los datos es simtrica, la media, la mediana y moda coinciden. Si la media est a la derecha de la mediana, existe un sesgo hacia la derecha Si la media est a la izquierda de la mediana, existe un sesgo a la izquierda. Comentario: si la distribucin de los datos es muy asimtrica, conviene usar la mediana, esto es porque la media es altamente influenciable por valores extremos Media Mediana Moda Nominales X Ordinales x x De intervalo x x X De razn x x x Medidas de dispersin o Rango: diferencia entre el valor mximo y el valor mnimo o Desviacin estndar Desv. Est. Poblacional Desv. Est. Muestral ( ) ( )

Caractersticas: est en las mismas unidades que la variable original, entre ms grande indica mayor dispersin, que representa un promedio de las distancias con respecto a la media. o Varianza: es el cuadrado de la desviacin estndar Varianza Poblacional Varianza Muestral ( ) ( )

Medidas de posicin y de forma o Cuartiles 1er. Cuartil: es el valor que separa el 25% de los datos ordenados, del restante 75% de los datos. 3er. Cuartil: es el valor que separa el 75% de los datos ordenados, del restante 25% de los datos. 2do. Cuartil: mediana o Percentiles: el k-simo percentil es el que separa la ksima parte de los datos ordenados del restante. Distribuciones de probabilidad En una representacin de todos los posibles resultados de un proceso aleatorio junto con su probabilidad de ocurrencia. Esta representacin puede ser una tabla o una funcin. Distribucin de probabilidad discreta: distribucin binomial La distribucin binomial se basa en un proceso aleatorio con las siguientes caractersticas: - Slo hay dos resultados posibles (xito y fracaso) - Hay n repeticiones independientes. - La probabilidad de xito permanece constante La funcin de distribucin binomial tiene la siguiente forma: Dado: n: nmero de ensayos (repeticiones) x: nmero de xitos p: probabilidad de xito ( ) ( ) ( )

Ejemplo:

1) Si lanzamos una moneda al aire, cul es la probabilidad de que, en 5 lanzamientos, caigan 3 guilas? n=5, x=3, p=0.5, donde x: cantidad de guilas P(X=3) =DISTR.BINOM(C6,5,0.5,0)= 0.3125 2) Se sabe que en una tienda el 25% de los clientes compra ms de $500 pesos. Si seleccionamos al azar a 6 clientes a. Cul es la probabilidad de que exactamente 2 clientes compren ms de $500. b. Cul es la probabilidad de que al menos 2 compren ms de $500. c. Cul es la probabilidad de que cuando mucho 2 compren ms de $500. X: el nmero de clientes que compran ms de $500 pesos N=6, p=0.25

Ejercicio Considere n=5 y p=0.6. Calcule a) b) c) d) P(x=3) = P(x<2) = P(X=0)+P(X=1) = P(x1) = P(x4) = P(X=4)+P(X=5)= 1-P(x3) = P(x>2) = P(X=3)+P(X=4)+P(X=5)= 1-P(x2) =

Distribucin continua: distribucin normal Est representada por la curva de Gauss, es una distribucin cuyo grfico tiene forma de campana. Se utiliza para modelar errores y es la base de la estadstica inferencial Cuando una distribucin normal tiene media igual a 0 y varianza igual a 1 se le conoce como distribucin normal estndar.

Si X~N(,), cada valor de x tiene su equivalente en un valor de z, donde Z~N(0,1) dado por: ( Ejemplo: Calcule las siguientes probabilidades, donde Z~N(0,1) a) P(Z>1)=1-P(Z<1) b) P(Z<-2)= )

c) P(Z>3) =1-P(Z<3) Ejercicio Las pruebas para medir el coeficiente intelectual (C.I.) estn diseadas para tener una media de 100 unidades y una desviacin estndar de 16 unidades. Considerando la transformacin calcule:

a) La probabilidad de que una persona elegida al azar tenga un C.I mayor a 110 b) La probabilidad de que una persona elegida al azar tenga entre 95 y 105 puntos de C.I. c) Si obtuvieras un puntaje de 118 qu proporcin de la poblacin tendra un C.I. superior al tuyo? Respuesta: X: Coeficiente intelectual de las personas X~N(media = 100, desviacin estndar = 16) a) ( )

( ( b) P(95<x<105) ( ( ( c) P(x>118) ( ( ) ) ) ) )

Con base en datos del ejercicio anterior, a partir de qu C.I. se puede considerar que alguien est en el 2% superior de la distribucin? P( X > ?) =0.02 Respuesta: Utilizando la expresin DISTR.NORM.ESTAND.INV(0.98) el valor z asociado a esa probabilidad es de 2.054. Aplicando la transformacin correspondiente tenemos que

Por tanto: ( Ejercicio La demanda de un producto en una tienda es de 542 unidades a la semana en promedio, con una desviacin estndar de 13 unidades. Asuma una distribucin normal. Cuntas unidades deber tener en inventario para garantizar que en el 95% de los casos tenga suficientes unidades para cubrir la demanda semanal? P( x < ?)=0.95 )

Respuesta: 563 unidades

Distribuciones de muestreo La distribucin de muestreo describe la distribucin de los estadsticos de todas las posibles muestras del mismo tamao obtenidas de una poblacin. Distribucin de la media muestral Si X~N(, ) entonces ( )

Donde: se conoce como error estndar

Teorema del lmite central Conforme el tamao de la muestra aumenta, la distribucin de la media muestral se aproximar a una distribucin normal.

Estadstica inferencial Estimaciones por intervalo Intervalo de confianza para la media Intervalo de confianza para la media, conocida Intervalo de confianza para la media, desconocida pero muestra grande Intervalo de confianza para la media, desconocida y muestra pequea

Intervalo de confianza para , conocida El I.C. para la media, con un nivel 1- de confianza est dado por: Donde:

) )=

es el valor tal que P(Z>

Requisito: x tiene una distribucin normal, o n es grande. Ejemplo: Se desea conocer el ingreso promedio en una poblacin. Para calcular este dato se obtuvo una muestra de 256 personas. La media muestral fue de $11,230 y se sabe que la desviacin estndar poblacional es de $1,112. Con un 95% de confianza, calcule un estimado del valor promedio del ingreso en esa poblacin. X: ingreso , , n=256, =1112

Intervalo de confianza para , conocida

) (

) ( )

Con un 95% de confianza, el valor de la media poblacional, est entre 11093.7825 y 11366.2275 Intervalo de confianza para , desconocida pero muestra grande

(Se sustituye el valor de por el valor muestral de la desviacin estndar) Ejemplo

Se desea conocer cul es el gasto promedio en leche de los hogares en Veracruz. Con base en una muestra de 183 hogares, se obtuvo una media $477.27 y una desviacin estndar de $631.89. Calcule un intervalo de confianza del 95% para el gasto promedio en leche de los hogares en Veracruz. Datos:

385.72< <568.82 Con un nivel de confianza del 95%, el gasto promedio en leche de los hogares en Veracruz est entre $385.72 y $568.82

Intervalo de confianza para , desconocida y muestra pequea Ejemplo Se desea conocer el rendimiento promedio de la gasolina en un modelo de automvil. En una muestra de 18 automviles se obtuvo una media 8 kilmetros por litro, y una desviacin estndar de 1 kilmetro por litro. Con un nivel de confianza del 90% calcule el valor de la media poblacional.

Intervalo de confianza para la proporcin (muestras grandes) Suponga una muestra de tamao n donde se observan x xitos. El intervalo de confianza para la proporcin de xitos en la poblacin, con un nivel 1- de confianza, est dado por: ( ) ( )

Donde: Ejemplo

y el margen de error es:

En una encuesta aplicada a 183 hogares se encontr que en 20 casos la vivienda es rentada. Con un nivel de confianza del 90% calcule la proporcin de hogares que viven en una vivienda rentada. Datos: n=183, x=20, =.10, ( ) )( ( )

( .0714<p<.1472

)(

Con un 90% de confianza podemos decir que la proporcin real de hogares que viven en una vivienda rentada est entre 7.14% y 14.72%

Ejercicio Conforme a la ENIGH 2006, con datos de Veracruz, se observ que de 183 hogares, en 74 hogares el gasto en alimentos represent ms del 30% del gasto total. Con un 95% de confianza calcule la proporcin de hogares que gastan ms del 30% del gasto total en alimentos. Datos X: nmero de hogares cuyo gasto en alimentos representa ms del 30% del gasto total

Tamao muestral Tamao muestral (media) ( Ejemplo: Se sabe que el proceso de llenado de unas botellas en una fbrica tiene una desviacin estndar de 20 mililitros. Se desea estimar el valor promedio de llenado con un margen de error de 15 mililitros, con un nivel de confianza del 99%, de cuntas botellas se deber tomar la muestra? ( ) ( ( )( ) ) )

Ejercicio Se desea estimar el gasto promedio en comidas fuera del hogar con un margen de error de $100, para los hogares veracruzanos. En la encuesta previa se obtuvo un valor estimado para la desviacin estndar de $2,902. Cul deber ser el tamao muestral si se desea tener un nivel de confianza del 98%?

Tamao muestral (proporcin) ( )

Si no se tiene un estimado de p se utiliza p=.5 Se desea estimar la proporcin de votantes que prefieren determinado candidato. Cuntas personas debern entrevistar si se desea un margen de error mximo de 3% con un nivel de confianza del 95%? ( ) ( ) ( )( )

Pruebas de hiptesis Conceptos bsicos Prueba de hiptesis: procedimiento para probar una aseveracin acerca de una propiedad de una poblacin Hiptesis: una aseveracin o afirmacin acerca de una propiedad de una poblacin Mtodos para evaluar hiptesis o Mtodo tradicional o Mtodo del p-valor Valor p: es la probabilidad de obtener un valor del estadstico de prueba al menos tan extremo como el obtenido, si la hiptesis nula es cierta. o Intervalo de confianza Prueba de dos colas: la regin crtica se encuentra en las dos regiones extremas bajo la curva Prueba de cola derecha: La regin crtica se encuentra en el extremo derecho Prueba de cola izquierda: La regin crtica se encuentra en el extremo izquierdo

Pasos para una prueba de hiptesis Seleccionar un nivel de significancia o Nivel de significancia: es la probabilidad de rechazar una hiptesis nula cuando esta es cierta (Error Tipo I) Plantear hiptesis nula y alternativa o Hiptesis nula: es la afirmacin de que el valor de un parmetro de la poblacin es igual a un valor aseverado. o Hiptesis alternativa: es la afirmacin de que el parmetro tiene un valor que difiere de la hiptesis nula Calcular el estadstico de prueba o Estadstico de prueba: es un valor que se utiliza para tomar la decisin sobre la hiptesis nula. Establecer regla de decisin

o Valor crtico: cualquier valor que separa la regin crtica de los valores que no conducen al rechazo de la hiptesis nula o Regin crtica (o regin de rechazo): es el conjunto de todos los valores del estadstico que pueden provocar que rechacemos la hiptesis nula. Prueba de hiptesis para , con conocida Requisitos: que la variable original tenga una distribucin normal o la muestra sea grande Prueba de hiptesis para , conocida (bilateral): Estadstico de prueba es Valor crtico es La regla de decisin: Si |z| >

se rechaza la hiptesis nula

Ejemplo En una encuesta a 183 hogares se encontr que el gasto promedio en comidas fuera del hogar fue de $1450. Con un nivel de significancia del 5% pruebe la afirmacin de que el gasto promedio en comidas fuera de casa es de $1500. Asuma una desviacin estndar poblacional de $2,900. Datos: Estadstico de prueba es

Valor crtico es La regla de decisin: Si |z| > se rechaza la hiptesis nula. Puesto que |-.2332|<1.959, no se rechaza la hiptesis nula. Conclusin: no se rechaza la afirmacin de que el gasto promedio en comidas fuera de casa es de $1500. Prueba de hiptesis para , conocida (unilateral: cola izquierda) Estadstico de prueba es Valor crtico es La regla de decisin: Si z< Ejemplo:

se rechaza la hiptesis nula

El gerente de una empresa afirma que el tiempo promedio de traslado de sus empleados es menor a 25 minutos. En una muestra de 16 empleados se encontr que el tiempo promedio fue de 22 minutos. Asumiendo una desviacin estndar poblacional de 5 minutos, evale la afirmacin del gerente con un nivel de significancia del 1%. Prueba de hiptesis para , conocida (unilateral: cola derecha) Estadstico de prueba es Valor crtico es La regla de decisin: Si z>

se rechaza la hiptesis nula

Ejemplo: Un fabricante de automviles afirma que cierto modelo rinde ms de 15 kilmetros por litro de gasolina. En una muestra de 45 observaciones se encontr una media de 16.2 kilmetros por litro. Asuma que la desviacin estndar para el rendimiento de este modelo es de 2.3 kilmetros por litro. Con un nivel de significancia del 10% pruebe la afirmacin del fabricante Nota: Si es desconocida, pero la muestra es grande se utiliza como una aproximacin el valor de s en lugar de .

Ejemplo: El gerente de una aerolnea afirma que el tiempo que tarda un pasajero en recoger su equipaje es menor a 20 minutos. En una muestra aleatoria de 115 pasajeros, se encontr que el tiempo promedio fue de 17 minutos con una desviacin estndar de 5 minutos. Con un 1% de significancia Existe evidencia estadstica que apoye la afirmacin del gerente? Resuelto Libreta

Prueba de hiptesis para , con desconocida Requisitos: la poblacin siga una distribucin normal Prueba bilateral (de dos colas): Estadstico de prueba es Valor crtico Regla de decisin: si t < Prueba de cola izquierda Estadstico de prueba es Valor crtico Regla de decisin si t < Prueba de cola derecha Estadstico de prueba es Valor crtico Regla de decisin si t >

t>

se rechaza

se rechaza

se rechaza

Ejemplo: La secretaria de turismo en un municipio afirma que la cantidad promedio de dinero gastado por cada turista es mayor a $3,000.00. En un encuesta a 25 turistas elegidos al azar se encontr que gastaron en promedio $3,120.00 con una desviacin estndar de $654.00 existe evidencia suficiente para apoyar la afirmacin de la secretaria de turismo? Utilice una significancia del 5%. Libreta

Ejemplo: Se desea probar contra la ; una muestra de tamao 10 dio una media de 103 y una desviacin estndar de 12. Por lo tanto, con un nivel de significancia del 5% Cul sera la conclusin? Libreta

Prueba de hiptesis para la proporcin Requisitos: que la muestra sea grande. Prueba bilateral: Estadstico de prueba es

Valor crtico es y La regla de decisin: Si z<Prueba de cola izquierda Estadstico de prueba es Valor crtico es La regla de decisin: Si z< Prueba de cola derecha Estadstico de prueba es Valor crtico es La regla de decisin: Si z> Ejemplo:

z>

se rechaza la hiptesis nula

se rechaza la hiptesis nula


se rechaza la hiptesis nula

En un muestra de 300 estudiantes de posgrado en el rea de negocios, se encontr que son 150 son mujeres. Con un nivel de insignificancia del 5% pruebe la afirmacin de que la proporcin de mujeres es de 42%

Libreta

Ejemplo: En una empresa rechazara un lote de productos si mas del 5% resultan defectuosos. En una muestra de 400 unidades se encontr que 24 estaban defectuosas. Considerando un nivel de significancia del 1% se deber rechazar ese lote de productos? Libreta

Vous aimerez peut-être aussi