La inferencia estadstica por medio de un razonamiento que procede de lo particular a
lo general. Este razonamiento inductivo permite extraer conclusiones de la forma que presenta una poblacin o alguno de sus parmetros tomando como referencia la informacin que contiene una muestra particular tomada de esa poblacin. Bsicamente las herramientas usadas en la estadstica inferencial consiste en comparaciones y el estudio de relaciones con los datos mustrales y el traslado de esos resultados o efectos observados (comparaciones y relaciones) a las poblaciones donde proceden los datos. Las estrategias metodolgicas son la estimacin de parmetros (media, proporcin, varianza, correlacin) y el contraste de hiptesis. El contraste de hiptesis Evaluar una hiptesis con datos empricos se debe a K. Pearson (1901). Pero R. Fisher (1925) fue quien present formalmente un mtodo para realizar una prueba de significacin (solo us H0, se tiene una solo hiptesis). A la propuesta de Fisher, en 1928 J. Neyman y E. Pearson realizaron sus aportes (adems de H0 emplearon H1, se elige entre dos hiptesis rivales a partir de un nivel de significancia prefijado) y aunque en la actualidad este tema debate activo, se puede decir que es una mezcla de los aportes de Fisher, y de Neyman-Pearson. Contraste de hiptesis (hypothesis test) o prueba de significacin (significance test). Es una estrategia diseada para la toma de decisiones en la que una afirmacin formulada sobre algn parmetro poblacional o forma de la poblacin en trminos estadsticos es puesta en relacin con los datos empricos para determinar si es o no compatible con ellos. Es decir, esta estrategia permite decidir si una afirmacin sobre la poblacin (a partir de la evidencia emprica) se puede rechazar o no la proposicin planteada. La afirmacin estadstica sobre la cual se desea tomar una decisin se llama hiptesis nula (H0) y siempre se refiere a la forma de una o varias distribuciones
poblacionales o al valor de uno o ms parmetros de esas distribuciones. La hiptesis
nula es la hiptesis que se pone a prueba en el contraste de hiptesis. Se plantea en trminos de no diferencia o no relacin. Es decir en trminos de diferencia o relaciones nulas. El contrate de hiptesis se basa en el argumento deductivo lgico modus tollens (si a, entonces b; no b, luego no a) la negacin de enunciados es concluyente, en tanto que la corroboracin de los mismos no lo es. Por ejemplo: la hiptesis cientfica: los tratamientos antidepresivos A y B son igualmente eficientes; pero se pone a prueba es una hiptesis estadstica. En trminos estadsticos Ma=Mb; es decir la media de la variable depresin en la poblacin de pacientes que han recibido el tratamiento A es igual al B. Formulada la hiptesis estadstica se busca evidencia emprica (un valor numrico que se conoce como estadstico del contraste, valor muestral) capaz de informar si la hiptesis se puede sostener o no. Si la evidencia emprica o resultado muestral difiere de la firmacin establecida en H0 pueden estar ocurriendo dos cosas: 1. La hiptesis no es cierta y por tanto, es incapaz de ofrecer predicciones correctas. 2. La hiptesis es cierta y la discrepancia observada entre H0 y los datos es debida a la variabilidad propia de los datos muestrales. La clave de este argumento ests, precisamente, en poder discernir cundo una discrepancia entre lo que afirma H0 y lo que dicen los datos es bastante grande como para poder considerar que el resultado muestral observado es incompatible con H0. Es decir bastante grande como para considerar que la discrepancia entre H0y los datos no es explicable por la variabilidad debida al azar muestral sino por el hecho de que la hiptesis plateada es realmente falsa. Se debe tomar una decisin en funcin de la teora de la probabilidad. El hecho de trabajar con nuestras en lugar de poblaciones introduce variabilidad en los datos y obliga a recurrir a la inferencia y a establecer una regla para decidir en
trminos de probabilidad. Se obtienen nmeros entre 0 y 1 al que se conoce como
nivel crtico o valor p. la cual representa la probabilidad asociada a los datos observados si se asume que la H0 es cierta o verdadera. Un valor p alto, significa alta compatibilidad entre hiptesis datos; un valor p bajo indica baja compatibilidad. Para decidir cundo un valor p es alto o bajo, se toma lo que la comunidad cientfica a denominado como punto de corte (0,05) o nivel de significacin. Rechazar o mantener H0 implica: el rechazo de H0 implica afirmar lo que H0 niega. La afirmacin complementaria de H0 se le llama hiptesis alternativa y se representa mediante H1. Qu significa rechazar y no rechazar la H0 La distribucin muestral del estadstico del contraste de H0 se divide en dos zonas: zonas exclusivas (zona de rechazo o crtica, la probabilidad asociada a esta zona es alfa o nivel de significacin) y exhaustivas (zona de aceptacin, datos son compatibles con H0, la probabilidad asociada a esta zona es el nivel de confianza 1-alfa.). Una vez establecida las zonas de rechazo y de aceptacin se aplica la siguiente regla de decisin (con base en H0): Rechazar H0 cuando el estadstico del contraste toma un valor perteneciente a la zona de rechazo o crtica; mantener H0 cuando el estadstico del contraste toma un valor perteneciente a la zona de aceptacin. Nivel crtico (nivel de significacin observado) mediante valor p P= nivel crtico=P(D/H0) (D=datos) Rechazar H0 si p<alfa; mantenerla en caso contrario. Cuando se decide no rechazar H0 se est asumiendo que el efecto observado (diferencias, relacin) puede explicarse sin necesidad de recurrir a factores distintos de la variabilidad debida al azar muestral. Cuando se decide rechazar una
H0 se est descartando el azar como nica explicacin del efecto observado y, en
consecuencia con ello, se est asumiendo que el efecto realmente existe en la poblacin. Por lo tanto, no rechazar H0 significa que la cuantificacin del efecto se encuentra en el rango de valores esperados para el azar cuando se asume que H0 es verdadera. Esto no indica que H0 sea verdadera, solo que no se encontraron evidencias empricas suficientes para el rechazo de H0, esto se puede deber (mal diseo, falta de potencia, sensibilidad para determinar el efecto). El argumento deductivo modus tollens (si a, entonces b; no b, luego no a) de tipo probabilstico: Si H0 es verdadera (si a), entonces muy probablemente, los datos sern compatibles con ella (entonces, muy probablemente, b); los datos no son compatibles con H0 (no b); luego, muy probablemente, H0 no es verdadera (luego, muy probablemente, no a): Algo ms tcnico sera Si H0 es verdadera, entonces, muy probablemente, el estadstico del contraste tomar un valor de la zona de aceptacin (si a, entonces muy probablemente, b); el estadstico del contraste no toma un valor de la zona de aceptacin (no b); luego, muy probablemente, H0 no es verdadera (luego, muy probablemente, no a). El estadstico del contraste cae en la zona de aceptacin (entonces b); luego, muy probablemente, H0 es verdadera (luego, muy probablemente, a), entonces se comete un error lgico llamado falacia de la afirmacin del consecuente, pues el estadstico del contraste puede haber tomado un valor de la zona de aceptacin por razones diferentes de las contenidas en H0. Ejemplo: buscar un efecto es como buscar un objeto en un cuarto trastero. Cuando se busca algo y se
encuentra se puede afirmar que estaba. Cuando se busca algo y no se
encuentra no es posible afirmar que no est; puede ocurrir, desde luego, que realmente no est, pero tambin puede ocurrir que no se haya buscado bien. Contrastes bilaterales y unilaterales Esto permite dividir la distribucin muestral en zona de rechazo y zona de aceptacin. El caso bilateral se usa cuando no se tiene informacin de la direccin en la que pueden aparecer resultados incompatibles con H0. Esto ocurre cuando por ejemplo se desea probar si un determinado parmetro toma o no un determinado valor, o si dos grupos difieren en alguna variable, o si dos variables son independientes. Se ponen algunos ejemplos El caso unilateral se tiene idea previa sobre la direccin en la que se encuentran los resultados incompatibles con H0. Ejemplo cuando se desea comprobar si el valor un parmetro ha aumentado, o si un grupo supera a otro en alguna variable; o si dos variables se encuentran positivamente relacionadas Poner ejemplos Errores tipo I y II, y potencia de un contraste Toda decisin de contraste resulta en mantener o no a H0. Pero H0 puede ser verdadera o falsa. Error tipo I: se comete cuando rechazamos H0; cuando es verdadera. La probabilidad de cometer este error es alfa (en su definicin interviene la distribucin definida por H0). Error tipo II: se comete cuando se decide mantener H0, cuando es falsa. La probabilidad de cometer este error es beta (en su definicin interviene la distribucin definida por H0 y por H1) As tenemos: probabilidad alfa (nivel de significancia); la probabilidad 1-alfa (nivel de confianza) y la probabilidad 1-beta (potencia).
Se puede construir una tabla 2x2 para los posibles resultados de un contraste de hiptesis.