Vous êtes sur la page 1sur 12

TRABAJO COLABORATIVO 2 UNIDAD 2

GRUPO: 100403_9

Tutor: DANYS BRITO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS BASICAS, TECNOLOGIA E INGENIERIA

INFERENCIA ESTADSTICA
INTRODUCCION

Presentamos en esta oportunidad nuestro segundo trabajo colaborativo en este interesante curso de Inferencia Estadstica en el que el grupo ha participado activamente presentando sus diferentes aportes y puntos de vista sobre la problemtica propuesta. El tema que nos ocupa en trminos generales se refiere a las pruebas y modelos paramtricos y no paramtricos en las pruebas de hiptesis. Un manejo adecuado de esta temtica deber llevarnos a tomar determinaciones acertadas cuando nos corresponda analizar diferentes hiptesis o alternativas frente a una situacin determinada. El desarrollo de estas actividades ha de permitirnos afianzar nuestros conocimientos y adquirir destrezas en el manejo de informacin que har parte de nuestro desempeo profesional y cotidiano.

OBJETIVOS

Apropiar y llevar a la prctica conceptos fundamentales sobre las pruebas de hiptesis y los diferentes mtodos para esta actividad. Conocer y comprender los diferentes elementos conceptuales propios de la Inferencia Estadstica. Intercambiar conocimientos y experiencias que nos permitan enriquecer nuestro aprendizaje. Evidenciar el nivel de apropiacin de conceptos y conocimientos vistos en la segunda unidad de Inferencia Estadstica.

DESARROLLO DE PREGUNTAS 1. Establezca la diferencia entre: Nivel de significacin y potencia de una prueba; pruebas paramtricas y pruebas No paramtricas Diferencias Nivel de significancia Potencia de una prueba La probabilidad de equivocarnos se La potencia de una prueba llama nivel de significancia y se estadstica es la probabilidad de simboliza . rechazar la hiptesis nula H0 Es la probabilidad de rechazar la cuando la hiptesis alternativa es hiptesis nula cuando en realidad verdadera, potencia = 1- . es verdadera tambin se denomina Es la probabilidad de rechazar nivel de riesgo, y es el riesgo de correctamente una hiptesis nula rechazar un planteamiento cuando La potencia es una medida de la en realidad es cierto. sensibilidad de una prueba Tradicionalmente se ha escogido estadstica un nivel de significancia del 0.05 (5%) para proyectos de investigacin de consumo, el 0.01 (1%) para control de calidad y el 0.10 (10%) para encuestas polticas.

2. Para tomar la decisin en un contraste de hiptesis se puede comparar el PValor con el nivel de significacin. Explique cules son las condiciones en trminos de magnitud de estos factores para rechazar una hiptesis unilateral derecha o unilateral izquierda. El p-valor Es el mnimo nivel de significancia en el cual Ho sera rechazado cuando se utiliza como procedimiento de prueba especfico con un conjunto dado de informacin. Si el pvalor es menor que el nivel de significancia, la hiptesis nula se rechaza. El nivel de significatividad es comnmente representado por el smbolo griego (alpha). Son comunes los niveles de significatividad del 0,05, 0,01 y 0,1. Si un contraste de hiptesis proporciona un valor P inferior a , la hiptesis nula es rechazada, siendo tal resultado denominado 'estadsticamente significativo'. Cuanto menor sea el nivel de

significatividad, ms fuerte ser la evidencia de que un hecho no se debe a una mera coincidencia (al azar).

3. Qu significan el error tipo I y el error tipo II. Explique su interpretacin con un ejemplo. EL ERROR DE TIPO I Tambin mal llamado error de tipo alfa (alfa es la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza la hiptesis nula (Ho) siendo sta verdadera en la poblacin. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusin de que existe una diferencia entre las hiptesis cuando en realidad no existe. Es equivalente a encontrar un resultado falso Positivo, porque el investigador llega a la conclusin de que existe una diferencia entre las hiptesis cuando en realidad no existe. Se relaciona con el nivel significancia estadstica. Ejemplo Se considera que una persona esta contagiada del VIH cuando en verdad no tiene el virus. Se condena Culpable de un crimen a una persona que es inocente. EL ERROR DE TIPO II Tambin llamado error de tipo beta (aunque beta es la probabilidad de que exista ste error), se comete cuando el investigador no rechaza la hiptesis nula siendo sta falsa en la poblacin. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusin de que ha sido incapaz de encontrar una diferencia que existe en la realidad. 4. Explique cules son los supuestos de homogeneidad, homocedasticidad, independencia y Normalidad, que deben cumplirse para validar un anlisis de varianzas. Algunos supuestos que han de cumplirse: La variable dependiente debe medirse al menos a nivel de intervalo. La distribucin de los residuales debe ser normal. Independencia de las observaciones. Homocedasticidad : homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal) SSTotal = SSError + SSFactores El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma enque la distribucin chi-cuadrado describe la suma de cuadrados asociada. glTotal = glError + glFactores

5. Comprueben a partir de dos muestras independientes de igual tamao de hombres y mujeres, la opinin de acuerdo o desacuerdo con algn tema de su inters, a travs del contraste de una hiptesis, en la se establezca si existen diferencias de opinin entre los hombres y mujeres sobre el tema de inters consultado. Interprete los resultados a que diere lugar este caso. Para dar respuesta a este caso utilice los pasos para el contraste de una hiptesis. Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones, que puede ser cierta o no. Las hiptesis estadsticas se pueden contrastar con la informacin extrada de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La hiptesis formulada con intencin de rechazarla se llama hiptesis nula y se representa por H0. Rechazar H0 implica aceptar una hiptesis alternativa (H1). La situacin se puede esquematizar: H0cierta H0 rechazada H0 no rechazada Error tipo I (a ) Decisin correcta H0 falsa H1 cierta Decisin correcta (*) Error tipo II (b )(*) Decisin correcta que se busca a = p(rechazar H0|H0 cierta) b = p(aceptar H0|H0 falsa) Potencia=1-b = p(rechazar H0|H0 falsa) Detalles a tener en cuenta 1 a y b estn inversamente relacionadas.2 Slo pueden disminuirse las dos, aumentando n. Los pasos necesarios para realizar un contraste relativo a un parmetro q son: Establecer la hiptesis nula en trminos de igualdad Establecer la hiptesis alternativa, que puede hacerse de tres maneras, dependiendo del inters del investigador, en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2 caso, o izquierdo en el 3) o una col

Elegir un nivel de significacin: nivel crtico para a 4. Elegir un estadstico de contraste: estadstico cuya distribucin muestral se conozca en H0 y que est relacionado con q y establecer, en base a dicha distribucin, la regin crtica: regin en la que el estadstico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadstico cayera en la misma, se rechazara H0. Obsrvese que, de esta manera, se est ms seguro cuando se rechaza una hiptesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisin se toma en base a la distribucin muestral en H0, por eso es necesario que tenga la igualdad. 5. Calcular el estadstico para una muestra aleatoria y compararlo con la regin crtica, o equivalentemente, calcular el "valor p" del estadstico (probabilidad de obtener ese valor, u otro ms alejado de laH0, si H0 fuera cierta) y compararlo con a.

6. Establezca las consideraciones que deben hacerse para seleccionar entre un modelo paramtrico o su correspondiente No paramtrico. Los mtodos no paramtricos tienen ventajas sobre los paramtrico. Los mtodos paramtricos en muchas ocasiones no cumplen con los supuestos acerca de la forma funcional del conjunto de variables aleatorias de las cuales provienen los datos, produciendo as modelos no muy confiables que generan sesgos y deterioran la calidad de los pronsticos. En el campo no paramtrico se evita este problema al permitir una forma funcional flexible, y no un conjunto pequeo de modelos rgidos como lo hacen los paramtricos. Consideraciones de las pruebas no paramtricas sobre las pruebas paramtricas: Por lo general, son fciles de usar y entender. Eliminan la necesidad de suposiciones restrictivas de las prueba paramtricas. Se pueden usar con muestras pequeas. Se pueden usar con datos cualitativos. Consideraciones de las pruebas paramtricas sobre las pruebas no paramtricas: A veces, ignoran, desperdician o pierden informacin. No son tan eficientes como las paramtricas. Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error de tipo II). Por lo general, las pruebas paramtricas son ms poderosas que las pruebas no paramtricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramtricas no hacen suposiciones sobre la distribucin de la poblacin que se muestrea, muchas veces se apoyan en distribuciones mustrales como la normal o la ji cuadrada.

7. Una de las opciones que tiene la estadstica para realizar inferencia sobre los parmetros de una poblacin es la prueba de hiptesis. Explique las ventajas y desventajas con respecto al otro mtodo de estimacin.

En primer lugar recordemos en qu consisten las pruebas de hiptesis. Una hiptesis estadstica se define como un supuesto hecho sobre algn parmetro de la poblacin. Dicho de otra manera es una teora o suposicin sobre un caso determinado la cual es susceptible de ser verificada y en consecuencia de dicha verificacin, ser entonces aceptada o rechazada. Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste involucra la toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no una hiptesis en favor de la otra. Una hiptesis estadstica se denota por H y son dos: - Ho: hiptesis nula - H1: hiptesis alternativa VENTAJAS: No incorporan los supuestos restrictivos de las pruebas paramtricas. No requieren que la poblacin subyacente est normalmente distribuida. El uso de rangos permite menos errores. Permite precisar con mucha exactitud la estatura de cada caso. Por lo general, son fciles de usar y entender. Eliminan la necesidad de suposiciones restrictivas de las pruebas paramtricas. Se pueden usar con muestras pequeas. Se pueden usar con datos cualitativos.

DESVENTAJAS El uso de pruebas no paramtricas con datos que pueden manejarse con pruebas paramtricas, produce un desperdicio de informacin. La aplicacin de algunas pruebas no paramtricas puede ser muy laboriosa y complicarse para el caso de grandes muestras. Consume tiempo y espacio para representar y observar el comportamiento de los datos. A veces, ignoran, desperdician o pierden informacin. No son tan eficientes como las paramtricas. Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa (incurriendo en un error de tipo II).

8. Los dos mtodos No paramtrico para realizar una bondad de ajuste de los datos de una variable con respecto a una distribucin de probabilidad son: El de Chi-cuadrado y el de Kolmogorov - Smirnov. Explique en qu condiciones debe usarse cada uno de ellos. Mtodo No paramtrico Chi-cuadrado:

Es otro tipo de prueba que se utiliza para contrastar hiptesis, usada en aquellos casos en que se asume que la distribucin de datos no se ajusta a la distribucin normal, y por lo tanto no es significativo usar t de Student. Se asume que cuanto menor sea el valor de chi-cuadrado calculado ms se aproximan entre si los comportamientos de las dos muestras (cuando son dos), o mejor se aproxima el comportamiento de una sola muestra al valor hipottico de la media asumido para la poblacin. Mtodo No paramtrico Kolmogorov Smirnov: Debe usarse cuando la variable de anlisis es continua. Sin embargo, si la prueba se usa cuando la distribucin de la poblacin no es continua, el error que ocurre en la probabilidad resultante est en la direccin segura. Es decir, cuando se rechaza la hiptesis nula, tenemos verdadera confianza en la decisin. Tambin puede aplicarse para tamaos de muestra pequeos, lo que no sucede con la chi-cuadrado.

9. El anlisis de varianza es una tcnica estadstica utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones realizadas una experimentacin. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta tcnica. 1. Cada conjunto de datos debe ser independiente del resto. 2. Los resultados obtenidos para cada conjunto deben seguir una distribucin normal. 3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. Cuando se utiliza la tcnica anova se deben cumplir los siguientes supuestos: a. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. b. La varianza de los subgrupos debe ser homognea. c. Las muestras que constituyen los grupos deben ser independientes. A menos de que las muestras sean independientes, y que por lo tanto, generen estimaciones de varianza independientes, la razn de las varianzas inter e intra no adoptar la distribucin F.

10. Existen dos tipos de modelo de anlisis de varianza: de efectos fijos y de efectos aleatorios. Explique el significado cada uno de ellos en un anlisis de varianza. Los modelos de regresin de datos anidados, realizan distintas hiptesis sobre el comportamiento de los residuos, el ms elemental y el ms consistente es el de Efectos Fijos. Este modelo es el que implica menos suposiciones sobre el comportamiento de los residuos. Los niveles de estos efectos (fijos) incluyen la totalidad de las posibilidades y se definen por el experimentador (que es quien decide, qu tratamientos se comparan. En los modelos de efectos aleatorios, los niveles de cada efecto son resultado de una seleccin al azar. Por ejemplo, el efecto Hospital en la evaluacin de un tratamiento puede incluir tres hospitales seleccionados al azar entre los hospitales de una determinada comunidad

CONCLUSIONES Los diferentes mtodos de prueba de hiptesis nos permiten tomar determinacin es acertadas frente a situaciones que tengan que ver con el contraste de diferentes alternativas delas cuales debamos elegir la ms adecuada para el propsito que nos ocupe. La aplicacin de un mtodo paramtrico o no paramtrico depende entre otras cosas del tamao y caractersticas de la muestra y de los requerimientos que originen la investigacin. El trabajo en equipo permite complementar la informacin aportada por cada integrante y enriquecer los conocimientos y experiencias frente a un te,a determinado.

BIBLIOGRAFA

JORGE ELIECER RONDON DURAN y DANIS BRITO ROSADO, Mdulo Inferencia Estadistica, Universidad Nacional Abierta Y A Distancia Unad-, Facultad De Ciencias Bsicas E Ingeniera, UNIDAD DE CIENCIAS BSICAS, Bogot, Mayo 2008 http://web.udl.es/Biomath/Bioestadistica/Dossiers/Temas%20especiales/ANOVA/ Modelos%20con%20efectos%20aleatorios.pdf http://argo.urv.es/quimio/general/anovacast.pdf http://www.ucm.es/info/socivmyt/paginas/D_departamento/materiales/analisis_da tosyMultivariable/19nparam_SPSS.pdf