Académique Documents
Professionnel Documents
Culture Documents
NOTAS DE CLASE
INFERENCIA ESTADÍSTICA
Asignaturas: BIOESTADÍSTICA
INVESTIGACIÓN
Elaborado por:
Claudia Patricia Mora
MSc en Epidemiología Universidad del Valle
claudia.mora@correounivalle.edu.co
1
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
2
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
PRESENTACIÓN
OBJETIVOS
General
Propender porque los futuros magister en enfermería desarrollen las competencias
para la aplicación de la estadística y la probabilidad en ejercicios de la vida real.
1. Diferenciar el diverso tipo de estimadores puntuales que se pueden obtener
de una población.
2. Estimar e interpretar los intervalos de confianza que acompañan las
estimaciones a través de muestras aleatorias de una población.
3
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
3. Aplicar herramientas como tablas de distribuciones de probabilidad y
software para el desarrollo de cálculos.
Contenidos
4
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
TEMA 1 - ESTIMACIÓN DE PARÁMETROS
En todos los ejemplos anteriores, se puede tener información sobre muestras para
establecer con ella el valor de interés.
Promedio muestral:
∑1
Varianza muestral:
∑
Al tomar una muestra de n = 200 pacientes con cáncer tratados con el fármaco, se
obtuvo un promedio de supervivencia de 58,5 meses y una desviación estándar de
23,1 meses.
6
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
A su vez cada estimador puntual debe tener un intervalo de confianza que con
cierta probabilidad de certeza al investigador de que su estimación se encuentra
cerca del valor verdadero es decir el parámetro en la población.
Los intervalos de confianza tienen un nivel de confianza que se denota como (1-α),
a su vez α “alfa” es el nivel de significancia que se ha propuesto desde un principio
el investigador, dependiendo de la naturaleza del fenómeno o experimento que
este analizando.
7
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
2.1. Estimación intervalo de confianza para el promedio
σ σ
x − zα / 2 n , x + zα / 2
n
Como el nivel de confianza es 95%, debemos calcular Z de tal manera que entre –Z
y +Z bajo la curva normal quede un área de 0.95. De la tabla se obtiene el valor Z =
1.96
23.1 23.1
IC µ 95% =[48.5 − 1.96 × ;48.5 + 1.96 × ]
200 200
[48.5 - 3.2 ; 48.5 + 3.2]
[45.3 ; 51,7]
O sea que e = Zσ x
σ
e=Z
n
− ;
Intervalo de confianza ( +
Recuerde que si tiene una variable X con distribución Binomial, usted conoce los
parámetros número de experimentos (n), probabilidad de éxito (p) y probabilidad
de fracaso (q=1-p).
pq
Como el error estándar de las proporciones muestrales es σ pˆ =
n
P es la probabilidad de éxito, puede ser la prevalencia de una enfermedad en la
población, por lo general este valor es el que se quiere estimar, obviamente no se
conoce, por lo cual se usa el valor de la proporción de la muestra que se denota
como p̂ , es decir, proporción muestral. La expresión para el error estándar de las
p̂ q̂
proporciones muestrales es σ p̂ = .
n
9
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
p̂ q̂
p̂ ± z
n
Ejemplo. Se desea estimar la proporción de personas que no cumplen con las citas
médicas, pero que no la cancelan previamente. Se escoge una muestra de 80
pacientes que han pedido cita médica (medicina general). Encontramos que 12 de
los pacientes del estudio no cumplen con la cita pero tampoco la cancelan.
Construya un intervalo de confianza del 90% para la estimación deseada.
0.15(0.85)
IC<P>95% = 0.15 m 1.65
80
±0.0659
IC<P>95% =0.15±
IC<P>95% =[0.0841 ; 0.2158]
pq
e=z
n
z 2 pq
n=
e2
Obsérvese que para estimar p nos dieron el nivel de confianza 1 - α = 0.99; además
el error máximo en la estimación e = 0.02, pero no dieron información acerca del
valor de p.
2.58 2 (0.2)(0.8)
n= = 2662.56
0.02 2
Por tanto el tamaño de muestra en este caso es de 2663 (nótese la reducción del
tamaño muestral).
11
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Si aún este tamaño resulta demasiado elevado (costos y tiempo) podemos reducir
el nivel de confianza deseado, por ejemplo pasarlo del 99% al 95%. El nuevo
tamaño de muestra es:
1.96 2 (0.2)(0.8)
n= = 1536.64
0.02 2
1.96 2 (0.2)(0.8)
n= = 384.16
0.04 2
12
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
peso a las personas. El interés radica en analizar para cada persona si el peso
disminuyó y como estos cambios se dieron a lo largo de todos los individuos
participantes del estudio. En este caso se trabaja con la diferencia de los valores en
cada individuo y se construye un intervalo para dicha diferencia.
13
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
14
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
2
zσ
n=
e
2
1.96 • 15600
n= = 37.396
5000
15
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
es el mínimo para poder cumplir con las condiciones de confianza y error máximo.
Cualquier disminución al tamaño no permitiría cumplir con dichas condiciones.
n0
n=
n
1+ 0
N
En donde no es el tamaño de la muestra calculado sin tener en cuenta el tamaño
poblacional.
16
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Distribución T Student.
s
x ±t
n
x : La media de la muestra.
t: valor obtenido de la tabla de distribución t, para un área de cola y cierto tamaño
de muestra.
s: desviación estándar de la muestra
n: Tamaño de la muestra
Ejemplo. Los tiempos (en minutos) que se gastaron en determinada cirugía fueron
registrados: 90; 65; 75; 100; 105; 85; 90; 80 y 95. Determinar el intervalo de
confianza del 95% para el tiempo promedio que los cirujanos gastan en la cirugía
específica.
Sólo disponemos de los datos de la muestra. n = 9. De la muestra obtenemos la
media y la desviación estándar x = 87.22; s = 12.53
El valor de t se obtiene así: como n = 9 entonces los grados de libertad gl = 8.
Como el nivel de confianza es 95% el área de cola superior será 0.025. De la tabla
de distribución t leemos t = 2.306. Así la expresión quedaría:
12.53 12.53
µ
IC ( )95% = (87.22 − 2.306 9 ;87.22 + 2.306 9 )
[77.59; 96.85]
18
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Intervalo de confianza para la varianza
IC ( (1-α)%= ; "
!
α
! α
19
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
TEMA 2
PRUEBA DE HIPÓTESIS
En un estudio para analizar las posibles diferencias de microfiltrado entre dos tipos
de sellantes dentales.
• La hipótesis nula sería: No hay diferencia entre los dos sellantes en relación
a su microfiltrado.
En el caso de comparar dos grupos, la hipótesis nula plantea que no hay diferencia
entre los grupos. Se quiere saber si la crema dental A es mejor que la crema B para
prevenir la caries dental.
p1 = p2
20
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
La hipótesis alterna. Plantea la negación de la hipótesis nula y puede tener una de
dos presentaciones:
p1< p2
o
p1> p2
Para poner a prueba una hipótesis nula, se utiliza una muestra y los resultados de
la muestra se comparan con los que se obtendrían si la hipótesis nula fuera
verdadera.
21
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
La manera de comparar los resultados de una muestra con los que se esperarían si
la hipótesis nula fuera verdadera, es calculando la probabilidad de obtener
resultados como los de la muestra o incluso más alejados del valor de la hipótesis
nula. Este valor se representa por P.
Si P es muy pequeño, menor del 5% o aún mejor, menor del 1%, podemos decir
que el resultado de esta muestra es muy improbable si la hipótesis nula fuera
verdadera. Esto nos lleva a decidir el “rechazo de la hipótesis nula” y a aceptar la
hipótesis alterna.
22
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
23
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Rechazo Ho
785 − 800
z= = −2.05
40
30
Con el Z=-2,05 se verifica cual es la probabilidad que acumula este valor de Z, esa
probabilidad es a lo que se denomina p-valor, en este caso es P = 0.02018
x−µ
t= con gl=(n−1)
s
n 24
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
25
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Se pueden distinguir dos situaciones: para un diseño de muestras independientes
o para un diseño de muestras pareadas.
– Ho: µ1 = µ2
– H1 : µ1>µ2
4
Criterio de decisión y distribución.
26
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
( x1 − x2 ) − ( µ1 − µ 2 )
tp =
1 1
sp +
n1 n2
n1 + n2 − 2
p
Sp= 28.8
27
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Interpretación:
Cuando no se rechaza la Ho, se dice que no hay suficiente evidencia estadística
para rechazar la hipótesis nula.
28
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
2.4.2. Comparación de dos promedios usando muestras apareadas
Se desea valorar el efecto de una dieta para perder peso. Se toman 10 pacientes, se
les mide su peso (antes de la dieta), a continuación se los somete a la dieta
destinada a rebajar peso y después de un período semejante para cada persona, se
les vuelve a medir su peso (después de la dieta)
Este es un diseño de muestras apareadas.
29
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
El procedimiento implica obtener para cada sujeto la diferencia entre sus dos
mediciones y finalmente de lo que se trata es de analizar una muestra (la de
diferencias). Calculemos diferencias:
Sistema de hipótesis:
– H0: δ = 0
– H1 : δ> 0
Criterio de decisión y distribución de probabilidad:
2.1 t
Nivel de significancia α = 0.05
– Distribución t con gl = n – 1
30
C. Mora. Notas de clase Bioestadística,
%−μ'
Universidad
Universidad del Valle, Colombia 2018
#$
( /√
Donde,
%, es promedio de la variable diferencia de X1 y X2
µ0, es la media poblacional de no contarse con el valor se asume como
cero.
( , la desviación estándar de la variable Y (diferencia de X1 y X2)
n, es el tamaño de muestra inicial.
3.0 − 0
#$ 4.29
2.21/√10
Se rechaza si p-value<α
31
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Considere que hay dos hipótesis una nula Ho y una Alterna Ha, así;
Se debe considerar que así como en la normal α defina una zona de rechazo, en la
Chi-cuadrado también hay que definirlo como
1
2
;
α
Con los datos del problema hay que calcular el valor calculado o experimental de
la Chi-cuadrado, se denota como3 , se calcula como:
Donde, Oi son los valores observados de las variables y Ei son los valores esperados
de la variable.
Ejemplo:
En un estudio realizado en escolares en el cual se tiene la variable Sexo y la
variable: “Se ha sentido hostigado por sus compañeros”, se contó con una muestra
32
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
n=424 estudiantes y los datos obtenidos se presentan en la siguiente tabla de
contingencia
Sexo
H M Total
Siempre 21 78 99
Hostigado en
su escuela
Solución:
4
;','6
7,81
33
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
34
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
35
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Sexo
H M Total
Siempre 21 78 99
Hostigado en
su escuela
Sexo
H M Total
Siempre 19,6 79,4 99
Hostigado en
su escuela
H M
Hostigado en
Chi2 4,489
3 4,489
36
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
Como el valor calculado es inferior al valor de 7,81 no hay suficiente evidencia para
rechazar la Ho, es decir, el hostigamiento escolar es independiente del sexo de la
víctima.
El valor de P = 0.2132 no permite rechazar la hipótesis de independencia entre el
hostigamiento y el género a un nivel del 5% de significancia. Ósea que en esta
muestra no se encuentra asociación entre el hostigamiento y el género.
https://www.youtube.com/watch?v=Dntc_MxPdVY
37
C. Mora. Notas de clase Bioestadística,
Universidad
Universidad del Valle, Colombia 2018
BIBLIOGRAFÍA.
Sánchez, Ismael. Notas de Clase Estadística. Universidad Carlos III. Madrid. Año
2016.
38