Vous êtes sur la page 1sur 11

Prof.

MARIA ADRIANA LOBO D PREVENCIN DE PRDIDAS SEMESTRE A-2013

UNIDAD 1: CONCEPTOS BASICOS DE INFERENCIA ESTADISTICA


CONCEPTO DE INFERENCIA ESTADSTICA:
El trabajo de un investigador no ha llegado a su fin cuando ha concluido con la funcin descriptiva. Por el contrario, esta frecuentemente mas cerca del principio, que del fin de su tarea. La razn de esta afirmacin es obvia cuando consideramos que el propsito de la investigacin es a menudo explorar hiptesis de naturaleza general, ms que simplemente comparar unas cuantas muestras. Hasta los momentos de acuerdo a lo estudiado en la materia de Estadstica Aplicada en la estadstica descriptiva se trabaja siempre con todos los datos sin compararlos con la poblacin objeto de estudio, eso hemos hecho al calcular los distintos parmetros centrales y de dispersin. Sin embargo, la estadstica se caracteriza por tratar con enormes cantidades de datos. Los fenmenos naturales son demasiados multiformes, demasiado extensos o demasiados inaccesibles para permitir una observacin completa. No podemos medir la temperatura en cada instante y en todos los puntos de la geografa nacional o mundial; no podemos ensayar un nuevo medicamento en todas las personas; para ensayar una reforma de la enseanza a un determinado nivel, no podemos utilizar a todos los estudiantes de dicho nivel. Por lo tanto, hemos de concntranos en utilizar muestras, es decir, algunos ejemplares de la poblacin que queremos estudiar. Casi siempre le interesa a uno una muestra determinada en tanto en cuanto es capaz de revelar algo acerca de la poblacin de la que ha sido extrada. La Estadstica Inferencial tiene como objetivo, precisamente, el de extender a toda la poblacin el comportamiento de un determinado carcter estudiado solamente en una muestra extrada de dicha poblacin. (Biblioteca de Recursos Didcticos Hacer Estadstica). Pero, para que esta extensin o extrapolacin sea correcta, dentro de ciertos mrgenes de error, es necesario tomar una serie de precauciones, tanto en lo que respecta al nmero de elementos de la muestra como, sobre todo, en lo concerniente a la manera de elegir los elementos que la componen. La rama ms importante de la Estadstica tanto econmica como cientficamente es la Inferencial que se completa o termina con la toma decisiones y esta presente cada da ms en todas las ramas de la ciencia, ya que deriva su importancia al proporcionarnos herramientas para evitar, en lo posible y siempre bajo un cierto riesgo, los errores. Es decir, el campo de la inferencia estadstica est formado por los mtodos utilizados para tomar decisiones o para obtener conclusiones sobre una poblacin. Estos mtodos utilizan la informacin contenida en una muestra de la poblacin para obtener conclusiones. La Inferencia Estadstica puede dividirse en dos grandes reas: 1. Estimacin de parmetros: Estimacin Puntual y Estimacin por Intervalos. 2. Prueba de Hiptesis: Distribucin t-Student, Distribucin Chi Cuadrada y Distribucin de Fisher.

REAS DE LA INFERENCIA ESTADSTICA: 1.- Estimacin de Parmetros:


La estimacin de parmetros es un procedimiento que nos permite calcular los valores de los parmetros poblacionales a travs de datos muestrales y se clasifican en: a) Estimacin Puntual: es cuando se expresa por medio de un solo nmero, es decir, es un valor numrico de la estadstica: media, varianza y desviacin estndar. En muchas situaciones, la estimacin puntual no proporciona informacin suficiente sobre un parmetro. Por ejemplo, si se tiene inters en estimar la resistencia promedio a la tensin de los elementos estructurales, entonces es probable que un solo nmero no sea tan significativo como un intervalo, dentro del cual se espera encontrar el valor de este parmetro. b) Estimacin por Intervalos: es cuando el parmetro se encuentra comprendido entre dos valores y ofrece la ventaja de informar el grado de exactitud del parmetro (intervalos de confianza). Este intervalo depende de una probabilidad y los lmites de estos intervalos se conocen como lmites de confianza, es decir,
Lmites de Confianza Lmites de Confianza

_______________________________________
-3 -2 - 2 3 b.1.- Intervalos de Confianza para una Media y Varianza Conocida : Supnganse que se tiene una poblacin con media desconocida y varianza conocida 2 . De esta poblacin se toma una muestra aleatoria x 1, x2, x3, ....., xn de tamao n. La media muestral x es un estimador puntual razonable de la media desconocida . Puede obtenerse un intervalo de confianza del 100 (1 - ) por ciento para al considerar la distribucin de muestreo de la media muestral x. P ( x - ( z /2 * x ) x + ( z /2 * x )) = 1 - Lmite Inferior Lmite Superior P = Probabilidad x = Media Muestral z /2 = Multiplicador de Confianza = Nivel de Significacin x = Error Muestral = Media Poblacional 1 - = Coeficiente de Confianza Ejemplo: El ingreso mensual de los habitantes de una regin se distribuyen con una media poblacional desconocida y varianza de Bs. 480; si se toma una muestra aleatoria formada por 5000 habitantes y se sabe que el ingreso promedio anual es de Bs. 2500. Calcule el intervalo para un coeficiente de confianza del 96%. Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.) Pgina 2

=? 2 = 480Bs. n = 5000 habitantes x = 2500Bs. 1 - = 96% /2 = 0,04/2 = 0,0200

= 21,91Bs. = 1 0,96 = 0,04 z/2 = 2,06 (Se busca en la tabla 8 un valor menor o igual a 0,0200, con 4 decimales). En la estimacin no se toma en cuenta el signo.

/2 = 0,02

0,96 1-

/2 = 0,02

________________________________________________ 2499,36 2500 2500,64 x = n = 21,91 5000 = 21,91 70,71 = 0,3099

P ( x - ( z /2 * x ) x + z /2 * x )) = 1 - P ( 2500 ( 2,06 * 0,3099) 2500 (2,06 * 0,3099)) = 96% P ( 2499,36 2500,64 ) = 96% El ingreso mensual de la poblacin est comprendido entre los valores de 2499,36 y 2500,64, con una probabilidad del 96%, esto implica que cuando las diferencias son pequeas entre los dos valores, la estimacin es ms significativa. b.2.- Intervalo de Confianza para una Proporcin: A menudo es necesario construir un intervalo de confianza para una proporcin ( ). Supnganse que se toma una muestra aleatoria de tamao n de una poblacin grande (posiblemente infinita) y que las observaciones de esta muestra pertenecen a una clase de inters. Entonces es un estimador puntual de la proporcin de la poblacin que pertenece a esta clase. P ( ( z /2 * ) < < + ( z /2 * )) = 1 - Lmite Inferior Lmite Superior P = Probabilidad = Proporcin Muestral z /2 = Multiplicador de Confianza = Nivel de Significacin = Error de la proporcin = Proporcin poblacional 1 - = Coeficiente de Confianza Ejemplo:

Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.)

Pgina 3

Se tiene una muestra aleatoria de 500 ambulatorios del pas donde hay que realizarles una evaluacin de daos (EDAN), de los cuales se estudiarn solamente 300 de ellos, durante este ao. Calcule el intervalo con un coeficiente de confianza del 92%. =? n = 500 casas x = 300 casas 1 - = 92% = 1 0,92 = 0,08 /2 = 0,08/2 = 0,0400 z/2 = 1,76 (Se busca en la tabla 8 un valor menor o igual a 0,0400, con 4 decimales). En la estimacin no se toma en cuenta el signo.

0,92 /2 = 0,04 1- /2 = 0,04 ________________________________________ 0,5615 0,60 0,6385 = x n = = 300 500 = 0,60

(( * ( 1 - )) = 0,60 * (1 0,60) = 0,0219 n) 500 P ( ( z /2 * ) < < + ( z /2 * )) = 1 - P ( 0,60 ( 1,76 * 0,0219 ) 0,60 + ( 1,76 * 0,0219 )) = 0,92 P ( 0,5615 0,6385 ) = 0,92

La proporcin poblacional de los ambulatorios a evaluar los daos est comprendida entre los valores: 56,15% y 63,85%, considerando para la muestra solamente el 60% de los ambulatorios que representan 300, para la poblacin los ambulatorios a evaluar estn entre 281 y 319, con una probabilidad del 92%.

2.- PRUEBA DE HIPTESIS:


Las Pruebas de Hiptesis tambin llamadas Pruebas de Significacin o Normas de Decisin: son recursos de clculos para verificar el grado de validez de la induccin estadstica, es decir, hasta donde son ciertos los valores estimados de la media y desviacin estndar de la poblacin o universo, mediante muestras sucesivas, para poder generalizar las conclusiones. En otras palabras, existen muchos problemas de ingeniera, ciencia y administracin, que requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro, donde esta proposicin recibe el nombre de hiptesis y el procedimiento de toma de decisin se conoce como prueba de hiptesis. Para la toma de decisiones deben tomarse en cuenta ciertas cualidades en la poblacin, considerando primero formular hiptesis estadsticas (es una proposicin sobre los parmetros de una o ms poblaciones) para luego constatar su validez, ya sea mediante la experimentacin o el clculo. El investigador debe seleccionar dos hiptesis: 1. Hiptesis Nula (Ho): que especifica valores hipotticos para uno o ms de los parmetros de la poblacin. Es decir, la hiptesis estadstica no tiene que ajustarse netamente a la Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.) Pgina 4

lgica deductiva, al extremo de que es usual que se formule una hiptesis descabellada, con el deliberado propsito de ms tarde, desvirtuar su realidad al verificar que es falsa o hiptesis nula. Por lo tanto, afirma la ausencia de efecto alguno alegado para determinada accin o tratamiento, y siempre para ser rechazada. La hiptesis nula suele ser nica. En relacin a cualquier experimento, la hiptesis nula nunca se prueba, ni se establece, pero es posible rechazarla en el transcurso de la investigacin. Se puede decir que cada experimento existe solamente con el propsito de dar a los hechos una oportunidad de rechazar la hiptesis nula. 2. Hiptesis Alterna (H1): afirma que el parmetro de la poblacin es algn valor diferente al hipottico, o sea, toda hiptesis que difiera de una dada: H 1, H2, etc. Las alternas pueden ser varias y se acepta cuando rechazamos la hiptesis nula. Por lo general H 1 se expresa en forma no especfica como: > < = Docimasias de una cola o unilaterales

Docimasia de dos colas o bilateral

y se utilizarn de acuerdo a la naturaleza del problema de decisin de que se trate. Y es que va a definir como dirigir el grfico. Se debe establecer un criterio de decisin o regla, con el propsito de rechazar o aceptar Ho. Ello supone la divisin de la distribucin muestral del estadstico a dcimar en dos partes: Regin de Aceptacin: Es un conjunto de valores posibles del estadstico muestral que hace que se acepte la Ho. Regin de Rechazo: Es un conjunto de valores posibles del estadstico muestral que hace que se descarte la Ho. Una vez formulada la hiptesis estadstica hemos de verificar su validez, ya sea mediante la experimentacin o el clculo. La hiptesis nula es la que se quiere verificar o someter a prueba. Cuando resulta rechazada se supone que se aceptan otras hiptesis alternas, propuestas de antemano. En las pruebas de hiptesis podemos conseguir un error de muestreo (). Frmula General:

zc = x x

El empleo de Zc como estadstico a docimar es especialmente conveniente si la distribucin muestral es normal, ya que entonces zc tiene distribucin normal estandarizada. Para poder verificar hasta donde son ciertos los valores estimados de la media y la desviacin estndar de la poblacin o universo, es conveniente estudiar tres tipos de distribuciones:

a. Distribucin de t Student (t):


A principios de siglos un estadstico llamado William Gosset, quin escriba bajo el seudnimo de Student, advirti que la aproximacin de s es sobre todo para las muestras pequeas. La mayor contribucin de Gosset a la estadstica consisti en la descripcin de una distribucin o mejor dicho, de una familia de distribuciones, que nos permiten la prueba de hiptesis con muestras obtenidas de poblaciones normalmente distribuidas, cuando es desconocida. Estas Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.) Pgina 5

distribuciones se conocen como Distribuciones t t de Student . El cociente empleado en la prueba de hiptesis se conoce como cociente t, donde o es el valor de la media de la poblacin bajo Ho. Frmula General: tc = x o x

_______________________________
-t 0 +t Se expresan como la desviacin de la media de la muestra con respecto a la media de la poblacin en trminos del error estndar de la media. Para el estadstico t existen una familia de distribuciones que varan en funcin de los grados de libertad. Los Grados de Libertad se refiere al nmero de valores que estn libres para variar despus de haber impuesto ciertas restricciones a nuestros datos. Tambin se puede definir como: Nmero de elementos que se pueden elegir libremente. Nmero de elementos con posibilidades de variacin en un conjunto. Nmero de variables con plena libertad de variacin. Nmero de variables independientes en un conjunto muestral. Nmero de observaciones independientes en el conjunto muestral. Tamao n de la muestra, menos el nmero k de parmetros, que deben hallarse por estimacin. v=nk v= n -1 k ser siempre el nmero de elementos muestrales dependientes, o sea, que no podrn variar libremente, sino que tomarn valores que dependern de los que tomen las variables independientes. Es decir, parmetros de la poblacin, que debe ser estimado a partir de observaciones muestrales. La curva de la distribucin de student resulta algo plticurtica, o sea, ms chata o aplanada que lo normal, asentndose la diferencia cuantos menores sean los grados de libertad. Los valores de t coincidirn con los valores de z c cuando los grados de libertad tiendan al infinito, a partir de v > 30. La hiptesis alterna (Hi) define el grfico dependiendo si la docimasia es de una cola o de dos colas, quedando definido el grfico como se demuestra a continuacin: Docimasias de una cola o unilaterales

H1: >
Regin de Aceptacin Regin de Rechazo

_______________________________
- +tt +

Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.)

Pgina 6

H1: <
Regin de Rechazo Regin de Aceptacin

_______________________________
- -tt +

Docimasia de dos colas o bilateral H1: =


Regin de Rechazo Regin de Rechazo _______________________________ Regin de Aceptacin

-tt

+ tt

Ejemplo: Un fabricante de artculos deportivos ha inventado una cuerda especial para escalar que tiene una resistencia media de 180Kgs., a la ruptura y una desviacin estndar de 25Kgs. Pruebe la hiptesis de que la media poblacional es igual contra su alternativa, si se toma una muestra aleatoria de 121 cuerdas y se encuentra que su resistencia media a la ruptura es de 183Kgs. Use un nivel de significacin del 2%. = 180 Kgs. = 25 Kgs. n = 121 cuerdas. x = 183 Kg. = 2% = 0,02 Hiptesis:

v = 121 1 = 120

Ho: = 180 Kgs. H1: 180 Kgs. (Siempre es la contraria de la Ho) x = n = 25 121 = 25 11 = 2,2727

tc = 183 180 = 1,32 2,2727 tt = 2,358 (Deben observar la tabla 9, existe Q (una cola) y 2Q (dos colas), la hiptesis H1 define cual utilizar, en este caso es 2Q. En esta fila buscamos donde este el 0,02 (2% del nivel de significacin) en relacin con los v que es 120, obteniendo 2,358. El signo es por el grfico + y -. Cuando el v no este se busca en )

Regin de Rechazo

Regin de Aceptacin

Regin de Rechazo

Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.)

Pgina 7

______________________________
+tt=+2,358 + 0 tc = 1,32 Como el tc esta en la regin de aceptacin se acepta Ho y se rechaza la hiptesis alterna, por lo tanto, la resistencia media de la cuerda especial para escalar es igual a 180 Kgs. con un = 2%. b. Distribucin de Chi Cuadrada ( X2 ): El estadstico chi cuadrada (X 2) mide el grado de desviacin entre las frecuencias observadas con respecto a las frecuencias tericas de ms de dos grupos. Sirve as, para definir la magnitud de las discrepancias entre las observaciones reales y las hipotticas. De all su enorme importancia en el anlisis estadstico, aplicado a los estudios biolgicos, sociolgicos y todos aquellos fenmenos, donde los datos se representen en la forma de frecuencias, al extremo de indicarnos si alguna cierta discrepancia observada, con respecto a los valores hipotticos, se deben al azar o a una falsa hiptesis. El chi cuadrado (X2) es un estadstico no paramtrico, porque no sigue una distribucin normal, sino una distribucin libre. Se utiliza para el estudio comparado de frecuencias absolutas, relativas o porcentuales. Se cuenta con un nmero de observaciones n y se determinan las frecuencias observadas fi que ocurren en cada clase de la muestra y despus calculamos las frecuencias esperadas F i que debemos esperar, en la hiptesis de nuestros experimentos y sus finalidades puedan explicar y justificar las variaciones de las observaciones. Frmula General: X2 = ( Fi fi )2 Fi Fi = Frecuencia terica o estimada de la poblacin. fi = Frecuencia observada, real o de la muestra. - -tt=-2,358

Regin de Aceptacin

Regin de Rechazo

_______________________
0 X2t + Para un cierto nmero de v, el valor de X 2 ser tanto mayor, cuanto mayores sean las desviaciones entre la distribucin observada en la realidad y distribucin terica de la poblacin. Al momento de interpretar la X2 se considera: a. Cuanto mayor sean las diferencias existentes entre los valores tericos y los muestrales, mayor valor tendr X2. b. El valor de X2 tambin aumentar con el nmero de grupos contrastados, pudiendo variar desde cero hasta . c. X2 tender a cero, cuando exista perfecta coincidencia entre las frecuencias tericas y las observadas en las muestras. Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.) Pgina 8

d. El valor de la X2 no significa nada, si no se conocen el nmero de grupos y caractersticas a que se refieren. e. Cuando los v se aproximan a 30, la distribucin X 2 tiende hacia la distribucin normal. Permite una constatacin inmediata de la validez de una hiptesis, al comparar los valores obtenidos con los que hubiesen estimado mediante el clculo. Es decir, verifica la homogeneidad entre la hiptesis y la realidad que nos aporta el muestreo estadstico. Dentro de las restricciones que representa la chi cuadrada (X 2) tenemos: Cuando la frecuencia estimada o esperada F sea menor que 5, los datos deben reunirse en grupo. Cuando las frecuencias se consideren en forma porcentual, el resultado debe multiplicarse por n/100. Ejemplo: El Cuerpo de Bomberos del Estado estudia si su capacidad de atencin a las comunidades es suficiente con las cantidades de camiones cisternas que tiene. Para este estudio se plantea las siguientes solicitudes esperadas de diversos sectores: Milla: 34%; El Llano: 28% y La Hechicera: 38%. Supongamos que se consider una muestra aleatoria de 650 solicitudes, tomadas completamente al azar y de los cuales se obtuvieron los siguientes resultados: Milla: 220; El Llano: 175 y La Hechicera: 180, con un coeficiente de confianza del 99,50%. Compruebe la aceptacin o rechazo de la hiptesis planteada. Ho: La cantidad de camiones cisternas del Cuerpo de Bomberos del Estado son suficientes para la atencin a las comunidades. H1: La cantidad de camiones cisternas del Cuerpo de Bomberos del Estado no son suficientes para la atencin a las comunidades. 1 2 3 Solicitudes Milla El Llano La Hechicera TOTAL Fi 34% 28% 38% 100% Fi 221 182 247 650 fi 220 175 255 650 (Fi fi)2 1 49 64 (Fi fi)2/Fi 0,0045 0,2692 0,2591 X2c = 0,5328

Los resultados de las frecuencias deben estar expresadas en la misma medida por eso se transforma el % a solicitudes esperadas, y adems estar dadas en valores enteros. Una vez que se obtienen las frecuencias, se puede aplicar la frmula. Para obtener el X2t nos dirigimos a la Tabla 10 que relaciona los v con respecto al . v=31=2 (el 3 es el nmero de casos en estudio) 1 - = 1 - 0,9950 = 0,005 X2t = 10,5966

Regin de Aceptacin

Regin de Rechazo

___________________________________ 0 X2t =10,5966 + 2 X c = 0,5328

Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.)

Pgina 9

Como el X2c da en el rea de aceptacin, entonces se acepta la Ho y se rechaza la H 1, lo que implica que las ambulancias existentes en el Cuerpo de Bomberos del Estado son suficiente para la atencin de las comunidades. c. Distribucin F: La Distribucin de frecuencias F llamada as por su autor Fisher, es la razn geomtrica 9 divisin) entre dos varianzas poblacionales estimadas. Frmula General: Fc = 12 22 = Varianza Poblacional

Tambin puede definirse como el coeficiente de dividir las razones geomtricas de dos medias muestrales ( x ) y sus respectivos grados de libertad (v) Frmula General: Fc = x1 /v1 x2 /v2 (media de 1 entre grados de libertad de 1) (media de 2 entre grados de libertad de 2)

Regin de Aceptacin

____________________________ 0 Ft +
Este estadstico puede ser til en la comprobacin de dos tipos de hiptesis. Homogeneidad de dos varianzas estimadas segn muestreo. Homogeneidad de tres o ms medias aritmticas poblacionales, estimadas tambin segn las muestras. El estadstico F tiene las siguientes propiedades y caractersticas: 1) Puede tomar valores desde cero hasta ms infinito. 2) Nunca resultar negativo, debido a que resulta del cociente de dos cuadrados. 3) La curva de la distribucin F es siempre asimtrica positiva y toma su forma de acuerdo a los grados de libertad. 4) En la medida que aumentan los grados de libertad, la curva de la Distribucin F tiende a la simetra. 5) Guarda estrecha relacin con la distribucin z 6) Tambin guarda relacin con la distribucin t Student, en el sentido de que t 2 tiene una distribucin de frecuencias igual a F, con uno y n-1 grados de libertad.

Ejemplo: Se someten dos productos a pruebas de resistencia donde se quiere averiguar si la resistencia de ambos son iguales, con desviacin estndar de 378 y 346; tamao de las muestras de 61 y 30 respectivamente, con un coeficiente de confianza del 90%. Ho: La resistencia de ambos productos son iguales. Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.) Pgina 10

H1 : La resistencia de ambos productos son diferentes. Fc = (378)2 (346)2 = 1,19

Ft = 1,55 (Este valor sale de la tabla 11, deben observar donde aparece uper 10 percent point (es el nivel de significacin lo hay para 10, 5, 2.5 y 1) en este caso es del 10% porque el coeficiente de confianza es de 90%. Luego se dirigen a donde aparece v1 ( 61 1 = 60 ) y v2 ( 30 1 = 29 ) relacionan ambos y consiguen el 1,55)

Regin de Aceptacin

Regin de Rechazo

_____________________________ 0 Ft=1,55 +
Fc=1,19 Por lo tanto se acepta Ho que implica que la resistencia de ambos productos son iguales.

Prevencin de Prdidas (2013) Unidad 1 (Prof. M.A.L.D.)

Pgina 11

Vous aimerez peut-être aussi