Vous êtes sur la page 1sur 44

Dr.

José Luis Soto Velásquez


investigacionjls@gmail.com
INFERENCIA ESTADÍSTICA
ESTADÍSTICA INFERENCIAL
Si quisiéramos conocer las características de los enfermos renales en cuanto a
calidad de vida, tipo de tratamiento, edad de aparición de la enfermedad,
sexo, variables que incluyen en el éxito de un trasplante,..., difícilmente
podremos acceder a todos y cada uno de los enfermos renales que existen (será
la población en estudio), pero posiblemente podremos conseguir a través de
algunos hospitales o centros de hemodiálisis los datos de una cantidad
determinada de este tipo de enfermos (por ejemplo n = 200 enfermos). Nuestro
objetivo no será conocer las características de esos 200 enfermos en concreto,
pero utilizáramos el conocimiento sobre estos 200 enfermos para obtener
conclusiones sobre todos los enfermos renales (nuestra población a estudio). Este
proceso es lo que se conoce como inferencia estadística.
deducir

POBLACIÓN Representativa y
probabilística

MUESTRA
Parámetro
Estadístico

inducir

Conceptos básicos Estimar (calcular) un


parámetro a partir de
• Parámetro: Es la cantidad numérica calculada sobre una población. un estadístico
• Estadístico: Es la cantidad numérica calculada sobre una muestra.

• Cuando el estadístico se calcula en una muestra con idea de hacer inferencia sobre la misma característica
en la población, se le llama estimador.

La inferencia estadística pretende aproximarse a los parámetros de la población a partir de los estimadores de la
muestra.
ESTADÍSTICA INFERENCIAL
Conceptos básicos

• Población: También llamado universo, es el conjunto total de elementos existentes en un espacio y tiempo
determinado.

• Muestra: Subconjunto de elementos de la población que habitualmente utilizaremos para realizar un estudio
estadístico.

• Tamaño Muestral: Es el número de elementos que componen la muestra y se representa con la letra minúscula
n.

• El propósito será llegar a conocer ciertas características de la población a partir de la muestra que
dispongamos. A este proceso le llamamos inferencia

• Muestreo: estudia la relación entre una población y las posibles muestras tomadas de ella. Es el procedimiento
de selección de una porción de la población para hacer inferencia sobre alguna de sus características.
ESTADÍSTICA INFERENCIAL
Conceptos básicos
Para distinguir los estimadores (valores muéstrales) de los parámetros (valores poblacionales) los
representaremos a partir de ahora con diferentes símbolos:

Característica Muestra Población


(Estadístico) (Parámetro)
Variable Cuantitativa
Media x μ

Desviación típica s σ

Varianza s2 σ2
Variable Categórica
Porcentaje p P
EL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
¿Cuándo calcular un Tamaño muestral o
Tamaño de la muestra? “n”

Generalmente, existe la necesidad de calcular un tamaño de muestra


cualquiera de las tres razones siguientes:

Cuando la población es desconocida (No conozco


el marco muestral, la cantidad de sujetos/objetos que integran mi
población)
¿En todos los niveles de investigación
Cuando la población es inalcanzable (No puedo
se trabaja de la misma manera el
estudiar a toda mi población por ser demasiada grande, por cálculo del tamaño de la muestra?
cuestión de recursos/tiempo) No necesariamente, existen criterios
particulares para ello.
Cuando la población es inaccesible (No puedo
estudiar a toda mi población porque la agoto y ello es perjudicial
para la misma)
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

La población de estudio debe estar bien definida, tanto en concepto como en


número, aunque esto ultimo no siempre es posible de determinar.

El autor de la investigación debe tener contacto directo con su población de


estudio.

Cuando la población es Desconocida, Inalcanzable o Inaccesible, es que recién


se plantea el estudio de una muestra.

Para calcular el tamaño de la muestra, es necesario identificar con qué tipo de


variable se está trabajando (categórica o numérica) y si la población es
conocida o desconocida. Estos dos criterios nos llevarán a la elección del
algoritmo adecuado.
Formulas de cálculos de muestra según el tipo de
variables
Dicotómicas
𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁

Categóricas
Nominales 𝑛= 2
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Politómicas
𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛=
Ordinales 𝑑2

Variables

𝑍2 ∗ 𝑆2 ∗ 𝑁
𝑛= 2
Discretas 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2
Numéricas

𝑍2 ∗ 𝑆2
𝑛=
𝑑2
Continuas
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA
V. Categórica, P. Conocida V. Numérica, P. Conocida

𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁 𝑍2 ∗ 𝑆2 ∗ 𝑁
𝑛= 2 𝑛= 2
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2

V. Categórica, P. Desconocida V. Numérica, P. Desconocida

𝑍2 ∗ 𝑝 ∗ 𝑞 𝑍2 ∗ 𝑆2
𝑛= 𝑛=
𝑑2 𝑑2

Para determinar el tamaño de muestra para las comparaciones, no


es necesario saber el tamaño de la población de estudio.
V. Categórica
2
𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
𝑛= 2
𝑃1 − 𝑃2
V. Numérica

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 ) (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )


𝑛= 𝑛=
(𝑋1 −𝑋2 )2 𝑑2
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
1.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA
PREVALENCIA O PARÁMETROS CATEGÓRICOS EN POBLACIONES
INFINITAS (SIN MARCO MUESTRAL)

Calcular el tamaño de la muestra para el estudio de la prevalencia de Chagas en la


población de los Valles Cruceños.

Con un nivel de confianza del 95% (Z=1,96) y un error de muestreo (precisión o distancia)
igual al 5% (0,05). Siendo que, no se conoce el tamaño de la población y la prevalencia
de Chagas en un estudio preliminar fue calculada en 35%.
Usar:
Solución:
𝑍2 ∗ 𝑝 ∗ 𝑞 p = 0,35 (1,96)2 ∗ 0,35 ∗ 0,65
𝑛= q = 1 - 0,35 = 0,65 𝑛=
𝑑2 0,052
Z = 1,96
d = 0,05 𝑛 = 349,59
Redondear al número mayor siempre
𝑛 = 350
1.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA
PREVALENCIA O PARÁMETROS CATEGÓRICOS EN POBLACIONES
INFINITAS (SIN MARCO MUESTRAL)

Se desea conocer la prevalencia de diabetes en una ciudad de Santa Cruz de la Sierra


¿A cuántas personas se debe estudiar? Se debe tener en cuenta que la prevalencia
aproximada en la población es de alrededor del 10,7%, se desea tener una precisión del
5% y un nivel de confianza del 95% (Z=1,96).

Solución:
𝑍2 ∗ 𝑝 ∗ 𝑞 p= 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥
𝑛= q=1- p= 𝑛=
𝑑2
Z = 1,96
d= 𝑛=
Redondear al número mayor siempre
𝑛=
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
2.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA
PREVALENCIA O PARÁMETROS CATEGÓRICOS EN POBLACIONES
FINITAS (CON MARCO MUESTRAL)

Calcular el tamaño de la muestra para el estudio de la prevalencia de parasitosis


intestinales en el colegio Independencia.
Con un nivel de confianza del 95% (Z=1,96) y un error de muestreo (precisión) igual a 0.05.
Siendo que en el colegio Independencia hay 490 alumnos matriculados en el 2018 y la
prevalencia de parasitosis en un estudio previo resultó ser el 15%. Usar:

𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁 (1,96)2 ∗ 0,15 ∗ 0,85 ∗ 490


𝑛= 2 𝑛=
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞 0,052 ∗ 490 − 1 + (1,96)2 ∗ 0,15 ∗ 0,85
Solución:
N = 490 𝑛 = 140,16
p = 0,15
q = 1-0,15 = 0,85 Redondear al número mayor siempre
Z = 1,96 𝑛 = 141
d = 0,05
2.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA
PREVALENCIA O PARÁMETROS CATEGÓRICOS EN POBLACIONES
FINITAS (CON MARCO MUESTRAL)

Suponiendo que la población de un distrito Cruceño es de alrededor de 15.000 habitantes,


se quiere determinar los casos de Hipertensión Arterial, con una seguridad del 95% (Z=1,96) y
un margen de error del 5%, sabiendo que la prevalencia de Hipertensión es del 30,7%. ¿A
cuántas personas se debe estudiar?
𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥
𝑛= 2 𝑛=
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Solución:
N= 𝑛=
p=
q = 1- p = Redondear al número mayor siempre
Z=
𝑛=
d=
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
3.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA
O PARÁMETROS NUMÉRICOS EN POBLACIONES INFINITAS (SIN
MARCO MUESTRAL)

Calcular el tamaño de la muestra para el estudio del Anemia en niños menores de 5 años
en la provincia Cordillera en el 2018.
Con un nivel de significancia 95% (Z=1,96) y la precisión (d) es igual a 0.15.
Siendo, que no se conoce el tamaño de la población y la desviación estándar en un
estudio preliminar fue calculada en 1,20.
Usar:

Solución:
𝑍2 ∗ 𝑆2 Z = 1,96 (1,96)2 ∗ (1,20)2
𝑛= S=8 𝑛=
𝑑2 0,152
d = 2,5
𝑛 = 245,86
Redondear al número mayor siempre
𝑛 = 246
3.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA
O PARÁMETROS NUMÉRICOS EN POBLACIONES INFINITAS (SIN
MARCO MUESTRAL)

Se desea conocer la media de la glucemia basal en mujeres embarazadas, con una


seguridad del 95% (Z=1,96), con una precisión de 3,0 mg/dl y sabiendo por estudios
anteriores que la varianza es de 250 md/dl. ¿A cuántas embarazadas se debe estudiar?

Solución:
𝑍2 ∗ 𝑆2 Z= 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥
𝑛= S= 𝑛=
𝑑2
d=
𝑛=
Redondear al número mayor siempre
𝑛=
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛=
NUMÉRICA

(𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
4.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR UNA
PROPORCIÓN O PARÁMETROS NUMÉRICOS EN POBLACIONES
FINITAS (CON MARCO MUESTRAL)

Calcular el tamaño de la muestra para el estudio del valor medio del cociente intelectual
en estudiantes del colegio Josefina Bálsamo.
Con un nivel de confianza del 95% y la precisión (d) igual a 1.
Siendo que, hay 450 alumnos matriculados en el mencionado colegio y la desviación
estándar en un estudio preliminar fue calculada en 5.
Usar:
𝑍2 ∗ 𝑆2 ∗ 𝑁 (1,96)2 ∗ (5)2 ∗ 450
𝑛= 2 𝑛= 2
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 1 ∗ 450 − 1 + (1,96)2 ∗ (5)2
Solución:
N = 450 𝑛 = 79,29
Z = 1,96
S=5 Redondear al número mayor siempre
d=1 𝑛 = 80
4.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR UNA
PROPORCIÓN O PARÁMETROS NUMÉRICOS EN POBLACIONES
FINITAS (CON MARCO MUESTRAL)

Se desea conocer el tamaño de muestra para analizar la glucemia basal de los alumnos
de los diferentes colegios de convenio Josefina Bálsamo, sabiendo que la población es
de 3000 alumnos, el nivel de confianza es del 95%, se desea una precisión de 3 mg/dl y se
sabe por estudios anteriores que la varianza es de 250 mg/dl. ¿A cuántas personas se
debe estudiar?

𝑍2 ∗ 𝑆2 ∗ 𝑁 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥
𝑛= 2 𝑛=
𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2
Solución:
N= 𝑛=
Z=
S2 = Redondear al número mayor siempre
d=
𝑛=
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛= (𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


NUMÉRICA
(Una media)

(Desconocida) 𝑑2 𝑛=
(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
5.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA COMPARAR
PROPORCIONES O FRECUENCIAS EN DOS POBLACIONES
Se desea evaluar si un nuevo tratamiento (T1) es mejor que el tratamiento habitual (T2) para aliviar el
dolor. Para lo cual se diseña un ensayo clínico. Sabiendo que por datos previos la eficacia del
fármaco habitual está alrededor del 70% y se considera clínicamente relevante si el nuevo fármaco
alivia el dolor en 90%. El nivel de riesgo es 0,05 y se desea un poder estadístico de 80%.
2
𝑃1 + 𝑃2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
𝑝= 𝑛= 2
2 𝑃1 − 𝑃2
Solución: 2
p1 = 0,7 1,96 ∗ 2 ∗ 0,8 1 − 0,8 + 0,84 ∗ 0,7 1 − 0,7 + 0,9 (1 − 0,9)
𝑛= 2
p2 = 0,9 0,7 − 0,9
Z𝛼 = 1,96
Z𝛽 = 0,84 𝑛 = 61,53

0,7 + 0,9 Redondear al número mayor siempre


𝑝=
2 𝑛 = 62
𝑝 = 0,8
5.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA COMPARAR
PROPORCIONES O FRECUENCIAS EN DOS POBLACIONES
Calcular el tamaño de la muestra para calcular la prevalencia de migraña en estudiantes de
enfermería y medicina
Con un nivel de confianza del 95% (Zα = 1.96)
Una potencia de prueba del 80% (Zβ = 0.84)
Siendo que en unos estudios preliminares se encontró que la prevalencia de migraña en estudiantes de
medicina es del 12% y en estudiantes de enfermería es del 7%.
Usar: 2
𝑃1 + 𝑃2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
𝑝= 𝑛= 2
2 𝑃1 − 𝑃2
Solución: 2
1,96 ∗ 2 ∗ 0,095 1 − 0,095 + 0,84 ∗ 0,12 1 − 0,12 + 0,07(1 − 0,07)
p1 = 0,12 𝑛=
0,12 − 0,07 2
p2 = 0,07
Z𝛼 = 1,96 𝑛 = 538,06
Z𝛽 = 0,84
Redondear al número mayor siempre
0,12 + 0,07
𝑝= 𝑛 = 539
2
𝑝 = 0,095
DEFINICIÓN DEL TAMAÑO DE LA MUESTRA

ESTIMAR PARÁMETROS COMPARAR DOS GRUPOS


UN GRUPO
Población 𝑍2 ∗ 𝑝 ∗ 𝑞 Dos Proporciones
Variable Cualitativa
CATEGÓRICA
(Una proporción)
Infinita 𝑛=
(Desconocida) 𝑑2 𝑍𝛼 ∗ 2𝑃 1 − 𝑃 + 𝑍𝛽 ∗ 𝑃1 1 − 𝑃1 + 𝑃2 (1 − 𝑃2 )
2

𝑛= 2
Población 2 𝑃1 − 𝑃2
𝑍 ∗𝑝∗𝑞∗𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑝 ∗ 𝑞
Población Dos Medias
𝑍2 ∗ 𝑆2
Variable Cuantitativa

Infinita 𝑛= (𝑍1−𝛼/2 + 𝑍1−𝛽 )2 ∗ (𝑆12 + 𝑆22 )


NUMÉRICA

(Desconocida) 𝑑2 𝑛=
(Una media)

(𝑋1 −𝑋2 )2
Población 𝑍2 ∗ 𝑆2 ∗ 𝑁
Finita 𝑛= 2
(Conocida) 𝑑 ∗ 𝑁 − 1 + 𝑍2 ∗ 𝑆2 (𝑍𝛼 + 𝑍𝛽 )2 ∗ (𝑆12 + 𝑆22 )
𝑛=
𝑑2
Finita = Marco muestral Z1- α = Nivel de confianza p1 = Prevalencia en el grupo de estudio
conocido Z1- β = Potencia de Prueba p2 = Prevalencia en el grupo control
Infinita= Marco muestral P = Prevalencia de la enfermedad S12 = Varianza del grupo 1
desconocido q = 1-p S22 = Varianza del grupo 2
n = Tamaño de la muestra S2 = Varianza X1 = Media en el grupo 1
N = Tamaño de la Población d = Precisión o error estadístico X2 = Media en el grupo 2
α = Error tipo I
β = Error tipo II
6.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA COMPARAR
PROMEDIOS EN DOS GRUPOS O POBLACIONES
Deseamos utilizar un nuevo fármaco antidiabético y consideramos que seria clínicamente eficaz si
lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por
estudios previos sabemos que la desviación típica de la glucemia en pacientes que reciben el
tratamiento habitual
es de 16 mg/dl. Aceptamos un nivel de confianza del 95% (Zα = 1.96) y deseamos un poder estadístico
de 80% (Zβ = 0.84) para detectar diferencias si es que existen.

2(𝑍𝛼 + 𝑍𝛽 )2 ∗ 𝑆 2
Solución: 𝑛=
𝑑2
d = 15
S = 16 2(1,96 + 0,84)2 ∗ 162
Z𝛼 = 1,96 𝑛=
152
Z𝛽 = 0,84
𝑛 = 8,92

Redondear al número mayor siempre


𝑛=9
6.- CALCULO DEL TAMAÑO DE LA MUESTRA PARA COMPARAR
PROMEDIOS EN DOS GRUPOS O POBLACIONES
Calcular el tamaño de la muestra para comparar la hemoglobina media de mujeres gestantes y no
gestantes.
Con un nivel de confianza del 95% (Zα = 1.96)
Una potencia de prueba del 80% (Zβ = 0.84)
Siendo que en un estudio previo se calculó la desviación estándar en 1,5 (S2 = 2,25) y la diferencia
propuesta para este estudio es de 1.5 mg%.

2(𝑍𝛼 + 𝑍𝛽 )2 ∗ 𝑆 2
Solución: 𝑛=
𝑑2
d = 1,5
S = 1,5 2(1,96 + 0,84)2 ∗ 1,52
Z𝛼 = 1,96 𝑛=
1,52
Z𝛽 = 0,84
𝑛 = 15,70

Redondear al número mayor siempre


𝑛 =16
n
Calculo del TAMAÑO DE LA MUESTRA mediante el Plan de
muestreo por CONGLOMERADOS y ESTRATIFICADOS
Se desea realizar un estudio sobre Parasitosis intestinal en niños de Nidito, Primero y Segundo de
primaria de la Unidad Educativa Padre Lucas, los cuales cuentan en total con 471 niños. Determinar el
tamaño de la muestra si el nivel de confiabilidad es del 95% (Z=1,96) y un margen de error o distancia
del 5%.
Población escolar (N): 471
𝑍2∗𝑝∗𝑞∗𝑁 Tamaño de la muestra (n): 212
𝑛=
𝑑2 ∗ 𝑁 − 1 + 𝑍 2 ∗ 𝑝 ∗ 𝑞
Frecuencia Muestra por
Curso N° niños relativa (A) Muestra (B) Curso (AxB)
(1,96)2 ∗0,50 ∗ 0,50 ∗ 471 Nidito 40 0,085 212 18
𝑛=
0,052 ∗ 471 − 1 + (1,96)2 ∗ 0,50 ∗ 0,50 Primero 203 0,431 212 91
Segundo 228 0,484 212 103
𝑛 = 212 Aleatorio simple Totales 471 1,000 212

Conglomerados Estratificado
DEFINICIÓN DEL MÉTODO ESTADÍSTICO

• “Cajita” de la estadística con 2 compartimientos

RESUMIR GENERALIZAR
DEFINICIÓN DEL MÉTODO ESTADÍSTICO

• “Cajita” de la estadística con 3 compartimientos

RESUMIR GENERALIZAR
7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO

• “Cajita” de la estadística Inferencial

- Valora parámetros poblacionales a partir de la muestra.


- Ej. El promedio, , la varianza, 2 , el total, T, la proporción, P, etc.
- Los parámetros poblacionales deben ser estimados a partir de las
observaciones realizadas en la muestra, lo cual están asociadas
a errores.
- Su principal desafío es evaluar el error de estimación.

- Agrupa a herramientas cuyo propósito es aceptar o rechazar la


hipótesis planteada en la investigación.
-La hipótesis es una respuesta anticipada a una pregunta de inves
tigación.
-Se plantea una hipótesis cuando existen dudas y no cuando los
resultados son evidentes
DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• “Cajita” de la estadística con 3 compartimientos

ESTIMACIÓN
Estimación puntual

Intervalos de confianza

RESUMIR GENERALIZAR
Estadística Inferencial
ESTIMACIÓN
Estimación puntual
Se usan las medidas de la muestra para calcular un único valor numérico que es la estimación puntual del
parámetro poblacional.

Intervalos de Confianza IC
Las medidas de la muestra pueden también usarse para calcular dos valores numéricos que definen un
intervalo el cual, con un cierto nivel de confianza, se considera que incluye al parámetro.

● Una muestra debe incluir al parámetro.


● A veces el parámetro no se halla en el intervalo cuando la muestra no es representativa.
● La probabilidad de que una estimación por intervalo incluya el parámetro se denomina nivel de
confianza

Límite Límite
Inferior LI Superior LS

IC 95% (LS;LI)
ESTIMACIÓN DE LOS ÍNTERVALOS DE CONFIANZA

Intervalos de Se llama a un par o varios pares de números entre los cuales


confianza se estima que estará cierto valor desconocido con una
determinada probabilidad de acierto.

-1,96 EE +1,96 EE

5% 10% 15%

Intervalos de confianza para los datos 95%: IC  x  1,96 * s

Intervalos de confianza para la media 95%: IC  x  1,96 * EE


Tablas de Intervalos de confianza para los DATOS (95%) Variables Numéricas

Calculando los ESTADÍSTICOS de la muestra

Tabla N° 1.- Intervalos de confianza para los DATOS (95%)

Intervalos de Confianza
Desv.
Media Límite inferior Límite superior
Estadísticos Desviación
Edad = 67,73 14,858 38,61 96,85
Peso = 66,48 12,808 41,38 91,59
Talla = 1,514 0,083 1,35 1,68
IMC = 28,972 4,945 19,28 38,66

Fuente.- Elaboración propia, 2018

IC  x  1,96 * s
Intervalos de confianza para los datos 95%:
Tablas de Intervalos de confianza para la MEDIA (95%) Variables Numéricas

Calculando los PARÁMETROS de la población

Tabla N° 1.- Intervalos de confianza para la MEDIA (95%)

Intervalos de confianza
Parámetros Media Error estándar Límite inferior Límite superior

Edad = 67,73 1,215 65,19 70,27


Peso = 66,48 1,298 64,29 68,67
Talla = 1,514 0,008 1,499 1,527
IMC = 28,972 0,395 28,127 29,817
Fuente.- Elaboración propia, 2018

IC  x  1,96 * EE
Intervalos de confianza para la media 95%:
Tablas de Intervalos de confianza para la MEDIA (95%) Variables Numéricas

Gráfico N° 1.- Intervalos de confianza para la MEDIA (95%) (Gráficas de Barras de error)
Tablas de Intervalos de confianza para PREVALENCIAS(95%) Variables Categóricas

Calculando los PARÁMETROS de la población

Tabla N° 1.- Intervalos de confianza para la PREVALENCIA (95%)


Univariado Error
Muestra Prevalencia 1-Prevalencia Intervalos de confianza 95%
Estándar EE
Límite Límite
Parámetros n p q inferior superior

Aplicativo Diabetes = 134 0,1343 0,8657 0,0295 0,0766 0,1921


Obesidad = 134 0,3731 0,6269 0,0418 0,2912 0,4550
Predictivo
HTA = 134 0,6119 0,3881 0,0421 0,5294 0,6945
Explicativo Colesterol = 134 0,1940 0,8060 0,0342 0,1271 0,2610

Relacional Triglicérido = 134 0,2164 0,7836 0,0356 0,1467 0,2861

Descriptivo Fuente.- Elaboración propia, 2018

IC  Pr evalencia  1,96 * EE
Intervalos de confianza para la prevalencia 95%:
CASO PRACTICO N° 10

Estimación puntual e
intervalos de confianza

Vous aimerez peut-être aussi