Académique Documents
Professionnel Documents
Culture Documents
Prueba de hiptesis
Prueba de hiptesis
Wayne, WD (2008) Bioestadstica para el anlisis de las
ciencias de la salud. Wiley, 4 Edicin (en espaol). Cap 7
Un evento observable
[American Heritage Dictionary of the English Language]
De investigacin o cientfica
Estadstica
Lectura recomendada:
Castillo Bautista, R.: La hiptesis en investigacin, Contribuciones a las
Ciencias Sociales, abril 2009
www.eumed.net/rev/cccss/04/rcb2.htm
Enlace vigente a 16-Nov-2015.
MUY recomendada y est en espaol
http://www.sciencebuddies.org/blog/2010/02/a-strong-hypothesis.php
Enlace vigente a 16-Nov-2015.
Algunos consejos sobre como formular una hiptesis
pero es ms comn:
Hiptesis nula simple
Hiptesis alternativa compuesta
* Salvo el paso 2.
(c) 2012-6 Dr. Felipe Orihuela
33
Espina
Prueba de hiptesis
Hiptes Hiptesis
is alternativa
cientfi
ca (c) 2012-6 Dr. Felipe Orihuela
Espina
35
Prueba de hiptesis
De la hiptesis de investigacin a la
hiptesis estadstica.
Ejemplo:
Supongamos un experimento para determinar el
efecto de 2 metodologas de enseanza.
El primer mtodo implica clases con un profesor y
seminarios, el segundo involucra nicamente las clases
con el profesor.
Lectura recomendada:
http://statisticalsage.wordpress.com/2011/09/21/di
fficult-concepts-research-hypotheses-vs-statistica
l-hypotheses/
Enlace vigente a 13-Nov-2016.
Por tanto:
Hiptesis nula: H0: i=0 (no hay relacin)
Hiptesis alternativa: Ha: i0 (existe una relacin
genuina)
Ejemplos:
H0: 1=0
H0: 1+2=0
H0: 1=2=0
H0: 2+3=1
(c) 2012-6 Dr. Felipe Orihuela
44
Espina
Prueba de hiptesis
Del anlisis de regresin a la prueba
estadstica.
En el contexto de un modelo de regresin, la
hiptesis alternativa siempre es compuesta.
[UrielE2012]
Ejemplos:
H0: 10 (de dos colas)
H0: 1<0 (de una cola)
H0: 1>0 (de una cola)
(c) 2012-6 Dr. Felipe Orihuela
45
Espina
Prueba de hiptesis
Hypothesis Test for the Slope of a Regression Line (EjemploEste
con
video
una prueba t) utiliza
algunos
concept
os que
an no
hemos
visto
pero que
veremos
en
breve.
Video:
10:46 mins
Largo pero
merece la
pena.
http://www.youtube.com/watch?v=q_ma0FtFp04
(c) 2012-6 Dr. Felipe Orihuela
46
Enlace vigente a 13-Nov-2016. Espina
Prueba de hiptesis
Del anlisis de regresin a la prueba
estadstica.
Observaciones finales:
Cada vez que aplicamos una prueba estadstica,
de forma implcita estamos asumiendo un modelo
aunque a menudo esto es transparente
Recuerda:
Proceso de prueba de hiptesis
(informal)
1. Definir las hiptesis nula y alternativa
2. Tomar datos
3. Elegir la prueba estadstica apropiada
4. Calcular el valor del test (score -t,F,2)
5. Decidir si rechazar o no la hiptesis nula
basndose alguna regla de decisin
(c) 2012-6 Dr. Felipe Orihuela
49
Espina
Nivel de significancia ()
y poder estadstico (1-)
La probabilidad de
cometer cada uno de
los tipos de errores
ser;
mayor cuanto ms se
solapen las
distribuciones real o
control A y modelada
B
menor cunto menos
se solapen Figura de: [http://1.bp.blogspot.com/-
_OLIOItvoUE/VEuAQZV9nXI/AAAAAAAAD4E/E8KEI
eBW4jA/s1600/javiertouron.es_effectsize.png]
El tamao de efecto
importa y mucho ;)
de hecho es crtico, y
si no lo crees, lee
Por qu importa el tamao de efecto? [Ioannidis JPA (2005)
Why Most Published
Por que en presencia de la misma dispersin, este
Research Findings Are
False. PLoS Med 2(8):
El tamao de efecto
describe la magnitud
de la separacin de
las distribuciones.
En otras palabras,
expresa la fuerza de
una relacin sin
declarar si dicha
relacin refleja una
relacin poblacional
Figura de: [https://www.psychometrica.de/effect_size.html]
y la forma de calcularlo
depende de
El tipo de variable (continua o
de ratio, categrica inc.
dicotmica, de intervalo o
rankeada, etc)
La estadstica usada (e.g. el
score de la prueba de
hiptesis)
Tabla: [Rosenthal R (1994) Parametric measures of effect size. Chapter
16 of The Handbook of Research Synthesis, Ed. Cooper H and Hedges,
LV (1994), pgs 231-244(c)
] 2012-6 Dr. Felipe Orihuela 55
Espina
Tamao de efecto
Ejemplo:
Sean las distribuciones real
o control A con tendencia
central A y dispersin A y
modelada B con tendencia
central B y dispersin B,
de la que se conocen sus
estimados muestrales
A~(A,sA) y B~(B,sB)
La familia d o directos o
direccionales
Incluye entre otros el popular d
de Cohen, as como el g de
Hedges, o el de Glass.
Tabla: [Rosenthal R (1994) Parametric measures of effect size. Chapter
16 of The Handbook of Research Synthesis, Ed. Cooper H and Hedges,
LV (1994), pgs 231-244(c)
] 2012-6 Dr. Felipe Orihuela 57
Espina
Tamao de efecto
Es conveniente distinguir entre:
El tamao de efecto real (a.k.a. true effect)
que es la verdadera diferencia que se
hubiese observado entre las poblaciones, y
Si sc rechazar H0
sino (s<c) no rechazar H0
En el proceso de prueba
de hiptesis quizs la parte
ms subjetiva es la
Decisin \ H0 H0 falsa / Ha determinacin a priori de
Realidad verdadera verdadera nivel de significancia ()
/ Ha falsa
Aceptar Correcto Error de La probabilidad de cometer
H0; (p=1-) Tipo II
()
errores de tipo I se puede
Rechazar
Ha decrementar alterando el
nivel de significancia ()
Rechazar Error de Correcto
H0; Tipo I (1-) Desafortunadamente, esto
Aceptar Ha (p=) conlleva el incremento del
riesgo de cometer errores de
tipo II, y viceversa
Intuitivo:
El valor p, o p-valor (o si se me permite el
anglicismo, p-value) representa la probabilidad de
error que conlleva aceptar nuestros resultados como
vlidos.
Regla de decisin:
Funcin de potencia
Informal:
La funcin de potencia
de una prueba de
hiptesis indica la
probabilidad de rechazar
la hiptesis nula en
funcin del valor real del
parmetro sobre el que se
ha definido la hiptesis.
Ejemplo:
Funcin de potencia Probabilidad de
rechazo de la
hiptesis nula;
Si la hiptesis nula est definida sobre la i.e. el poder
media (H0: =0), la funcin de potencia de un estadstico.
test estadstico es la probabilidad de rechazar
H0 dado que la media es .
Observa que la
curva NO
siempre es
creciente
Ni siquiera
tiene que ser
simtrica o
bonita
Esta es la
funcin de
potencia de los
test RESET y
FRESET
Otros recursos:
http://people.stern.nyu.edu/churvich/Regress/Handouts/Chapt6.pdf
Enlace vigente a 21-Nov-2016.
La que tiene el lenguaje ms llano sin sacrificar exactitud
http://www.uv.es/ceaces/tex1t/6%20para/potencia/CHIPOTES.htm
Enlace vigente a 21-Nov-2016.
En espaol; Este es ms formal
https://onlinecourses.science.psu.edu/stat414/node/305
Enlace vigente a 21-Nov-2016.
Contiene 3 ejercicios resueltos y una explicacin ms visual
(c) 2012-6 Dr. Felipe Orihuela
93
Espina
Poder estadstico
Algunas cosas que afectan al poder
estadstico de una prueba de
hiptesis:
Tamao de la muestra
Cuanto mayor sea el tamao muestral,
menor ser el error estndar, y por ende,
menor la dispersin de las medias
muestrales, y en consecuencia, mayor ser
la potencia estadstica de un estudio.
Es por ello que en los estudios con muestras
muy grandes se detectan como significativas
diferencias poco relevantes (overpowering), y
en los estudios con muestras menores es
ms fcil obtener resultados falsamente
negativos.
Variabilidad de la respuesta
Cuanto mayor sea la variabilidad en la respuesta,
ms difcil ser detectar diferencias entre los grupos
que se comparan y menor ser el poder estadstico
de la investigacin. Es por tanto recomendable
estudiar grupos lo ms homogneos posibles.
Notese que a mayor variabilidad, menor tamao de
efecto.
Nivel de significancia
Si se disminuye el valor de
tambin se disminuye el
poder de la prueba. Es decir,
si disminuimos la
probabilidad de cometer un
error de tipo I aumentamos
simultneamente la
probabilidad de un error de
tipo II
Figure: [Krzywinski M y Altman N (2013) Nature Methods, 10(12):1139-
(c) 2012-6 Dr. Felipe Orihuela
97
Espina
Poder estadstico
Algunas cosas que afectan al poder
estadstico de una prueba de hiptesis:
Nmero de grupos
El poder el ms alto cuantos menos grupos haya
[Larson MG (2008) Circulation 117:115-121]
(c) 2012-6 Dr. Felipe Orihuela
98
Espina
Poder estadstico
pero tambin
Direccionalidad o tipo de hiptesis
Independencia de las muestras (pareamiento)
Paramtricas vs no paramtricas
Nmero de factores del modelo
Fuente: [http://www.ats.ucla.edu/stat/mult_pkg/faq/general/tail_tests.htm]
Figura de: [http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/reference/reference_manual_0
(c) 2012-6 Dr. Felipe Orihuela
102
Espina
Pareamiento
Independencia de las observaciones
Pareada: Existe una relacin biyectiva entre las observaciones de
las variables. Cada observacin en una variable tiene su par en la
otra variable.
Si las observaciones de un grupo se reorganizan, entonces tambin deben
reorganizarse de forma anloga las observaciones de la otra variable.
Ejemplos:
Experimentos de bloque aleatorizados con dos unidades por bloque
Estudios con controles emparejados de forma indivdual
Experimentos de tipo intra-sujeto con repetidas observaciones sobre el mismo
individuo
1 86 88
2 71 77
3 77 76
Dr. Felipe Orihuela
(c) 2012-6 Ejemplo
adaptado de [DinovI2005
105
Espina
N 87 72 Figura de: [www.trinity.edu]
Pruebas paramtricas y no-paramtricas
Decisin H0 H0 falsa /
\ verdader Ha
Realida a / Ha verdadera
d falsa
Aceptar
TotalH0; Total
Negativ
Rechazar TN
Positivo FN
Ha
os s
Rechazar
(c) 2012-6 Dr. Felipe Orihuela
EspinaH0;
110
FP TP
Anlisis ROC
Decidir que tan bueno o malo (el rendimiento)
de nuestro estimador o prueba a la vista de la
tabla de contingencia es difcil
en el sentido que hay 4 valores que tener en
cuenta a la vez
Total
Negativos
Total
Total Negativo
Positivos s
La grfica de dispersin
presenta la relacin entre el
ratio de falsos positivos
(FPR=1-Especificidad) y el
ratio de verdaderos positivos
(TPR=Sensitividad).
Figura
(c) 2012-6 Dr. Felipe Orihuela de: [csb.stanford.edu]
120
Espina
Anlisis ROC
Intuitivamente; un
punto en el espacio
ROC es mejor que
otro si est situado
hacia el noroeste del
segundo (es decir,
tiene un mayor TPR,
y un menor FPR, o
ambos) [Fawcett
T2006]
es la representacin de 1-
(|)
se construye variando el
umbral de discriminacin
(nivel de significancia).
a veces se
resume/describe mediante el
valor del rea bajo la curva
Recuerda:
Proceso de prueba de hiptesis
(informal)
1. Definir las hiptesis nula y alternativa
2. Tomar datos
3. Elegir la prueba estadstica apropiada
4. Calcular el valor del test (score -t,F,2)
5. Decidir si rechazar o no la hiptesis nula
basndose alguna regla de decisin
(c) 2012-6 Dr. Felipe Orihuela
128
Espina
De una estadstica al p-valor
Sea la distribucin de una estadstica cualquiera.
Selecciona la
direccionalidad
1 acorde a tu
hiptesis
alternativa
Busca la columna
2 acorde al nivel de
significancia
escogido
Selecciona la fila 4
acorde a los
3
grados de libertad
Encuentra tu valor
4 t en la
interseccin de 3
fila y columna
Recuerda:
Proceso de prueba de hiptesis
(informal)
1. Definir las hiptesis nula y alternativa
2. Tomar datos
3. Elegir la prueba estadstica apropiada
4. Calcular el valor del test (score -t,F,2)
5. Decidir si rechazar o no la hiptesis nula
basndose alguna regla de decisin
(c) 2012-6 Dr. Felipe Orihuela
151
Espina
Qu prueba debo aplicar?
La seleccin de la prueba estadstica apropiada
depende de varios aspectos de los datos y del
diseo experimental:
Tamao de la muestra (pequeo <30; grande >30)
Independencia de las observaciones (pareadas o no)
Nmero de grupos (variables) que van a ser
comparados
Tipos de las variables (categricas, ordinales,
discretas, etc)
Distribucin/es asumida/s
Tipo de hiptesis alternativa (una cola, dos colas).
Fuente: [http://dc281.4shared.com/doc/HRgHf_KM/preview001.png]
(c) 2012-6 Dr. Felipe Orihuela
153
Espina
Qu prueba debo aplicar?
Doble
cola
Doble
cola
Desviaci
Error
n
estndar donde: estndar
de la
de la
diferencia
diferencia
Loftus GR y Masson ME (1994) Using confidence intervals in within subjects designs Psychonomic
Bulletin &Review 1(4):476-490
Newcombe RG (1998) Two-sided confidence intervals for the single proportion: comparison of seven
methods Statistics in Medicine 17:857-872
Morris JA y Gardner MJ (1988) Calculating confidence intervals for relative risks (odds ratios) and
standardised ratios and rates BMJ 296:1313-1316
Kragten, J (1994) Calculating Standard Deviations and Confidence Intervals with a Universally
Applicable Spreadsheet Technique Analyst 119:2161-2165
Brookmeyer R y Crowley J A confidence interval for the median survival time Biometrics 38:29-41
Mehta CR et al (1985) Computing an exact confidence interval for the common odds ratio in several
22 contingency tables Journal of the American Statistical Association 80(392):969-973
Intervalos de confianza:
ms estrechos, representan una mayor confianza en los
resultados
ms amplios, indican que se debieran tomar ms muestras
antes de hacer alguna afirmacin sobre el parmetro.
Nota 1: La solucin original en la fuente (mathtrench) es correcta pero confusa; utiliza intervalos
de confianza basados en z, pero usa el valor t para la regla de decisin. Aqu lo resolveremos
utilizando slo la distribucin t, lo que lleva a pequeas diferencias numricas.
Nota 2: En este ejercicio se requiere el uso de tablas precalculadas (
http://easycalculation.com/statistics/t-distribution-critical-value-table.php) o de una calculadora de la
distribucin t en lnea (http://stattrek.com/online-calculator/t-distribution.aspx - Ojo! es 1-tail).
para la regla de
decisin de dos colas:
Extraemos el valor
de t asociado para
un nivel de confianza
al 95% y
considerando 2 colas
(con n1+n2-2=69
grados de libertad):
t=1.9950
Valor t obtenido de la tabla (demasiado grande; no cabe en esta
diapositiva):
http://
easycalculation.com/statistics/t-distribution-critical-value-table.php
(c) 2012-6 Dr. Felipe Orihuela
Enlace vigente a 27-Nov-2016 178
Espina
Intervalos de confianza
Solucin:
2) Calculamos el valor t de la diferencia
Recuerda:
Sea la diferencia:
Donde:
Finalmente; SE = SEdiff
(c) 2012-6 Dr. Felipe Orihuela
179
Espina
Intervalos de confianza
Solucin:
2) Calculamos el valor t de la diferencia
Concordancia
El plot de Bland y Altman presenta
el promedio de las (dos)
evaluaciones en el eje de abscisa
contra la diferencia entre (dos)
anotadores en cada observacin,
la diferencia media y los lmites de
acuerdo sobre el eje de ordenadas.