Académique Documents
Professionnel Documents
Culture Documents
Bioestadística Elemental
en el Área de la Salud
1
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
INTRODUCCIÓN
JUSTIFICACION
3
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
CONTENIDO
Distribuciones muestrales
Inferencia Estadística
Análisis de Varianza
Regresión y Correlación 4
Estadística no Paramétrica
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
INTRODUCCION
El conocimiento que se imparte en la materia permitirá desarrollar habilidades a
los alumnos en áreas específicas como Control de calidad de las materias
primas, Control de Procesos y Productos terminados, Establecimiento de
Normas y Sistemas, Interpretación
Interpretación de datos generados por pruebas rutinarias
de laboratorio, o más general, por las ciencias de la Salud, así como
proporcionarles las bases para Diseñar Experimentos, crear nuevos productos o
para mejorar los procesos nuevos o ya existentes.
5
Se requiere
e del desarrollo de un pensamiento matemático, necesita de la
comprensión, de la habilidad para el Procesamiento de información, del
Razonamiento, de la capacidad de Análisis e interpretación de resultados.
UBICACIÓN DE LA MATERIA
La materia de Bioestadística
Bioestadística se encuentra insertada en el cuarto semestre del
plan de estudios de la carrera de Químico Farmacobiólogo de la Facultad de
Ciencias Químicas de la Universidad Autónoma de Chiapas. El plan de estudios
consta de 9 semestres.
El contenido de la materia
materia es de formación básica de orden práctico y que
tienen como objetivo principal el de enlazar conocimientos para que se
apliquen en las materias de especialización de las dos carreras. Le anteceden
la materia de Estadística, donde se estudió la parte descriptiva
descriptiva de la materia.
ESTRATEGIAS DIDÁCTICAS SUGERIDAS
El curso será implantado a partir del aprendizaje grupal y se combinarán las
sesiones teóricas con las prácticas de taller, así como eventualmente trabajos
de investigación o de campo. En las dos pr primeras,
imeras, la resolución de problemas
tipo será interactiva. El avance del programa será determinado por la clase, de
acuerdo al entendimiento de los temas.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
OBJETIVO GENERAL
Al finalizar el curso, el alumno será capaz de aplicar diferentes técnicas de
Inferencia estadística para el análisis de información experimental.
UNIDADES TEMÁTICAS
UNIDAD I.- INFERENCIA ESTADÍSTICA
Objetivo Específico: Al finalizar la unidad, el alumno generalizará sobre
poblaciones a partir de datos muéstrales, empleando para ello los métodos
inferenciales de la estimación y de las hipótesis.
1.1 Conceptos de Inferencia Estadística
1.2 Técnicas de Inferencia Estadística
1.2.1 Estimadores y sus propiedades
1.2.2 Estimación puntual y por intervalo
1.2.3 factor de confianza y error estándar
1.2.4 Estimación de Medias Poblacionales
1.2.5 Estimación de Proporciones Poblacionales
1.2.6 Estimación de Varianzas Poblacionales
1.1.7 Estimación del Tamaño Muestral
1.3 Hipótesis
1.3.1 Planteamiento de Hipótesis
6
1.3.2 Tipos de Hipótesis
1.3.3 Decisión estadística
1.3.4 Errores tipo I y II
1.3.5 Hipótesis sobre las Medias Poblacionales
1.3.6 Hipótesis sobre las Proporciones Poblacionales
1.3.7 Hipótesis sobre las Varianzas Poblacionales
1.3.8 Pruebas de Bondad, Independencia y Homogeneidad
Tiempo Estimado: 16 hrs.
UNIDAD II.- ANÁLISIS DE VARIANCIA
Objetivo Específico: Al finalizar la unidad, el alumno detectará diferencias
significativas entre mas de dos poblaciones, mediante la técnica de análisis de
la VARIANCIA.
2.1 Conceptos de Diseño de experimentos
2.2 Comparación de mas de dos poblaciones
2.2.1 Diseños experimentales
2.2.1.1 Modelo matemático
2.2.1.2 Suposiciones
2.2.1.3 Cuadro de ANDEVA
2.2.2 Pruebas de diferencias significativas entre pares de medias
Tiempo Estimado: 12 hrs.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Práctica Nombre
1 Repaso del manejo del Statgraphics
2 Estimación por intervalo
3 Hipótesis
4 Tamaño de la muestra
5 Microstat
6 Ajuste de modelos
7 Regresión no lineal
8 Estadística no paramétrica
9 Análisis de varianza
Tiempo Estimado: 29 hrs.
BIBLIOGRAFÍA
• BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE
EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS.
• DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA.
• ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA.
•
MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V.
JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS.
8
• MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS
QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL.
• MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA
SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL.
• PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS,
TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V.
• SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO
INTERAMERICANO.
• STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS,
MÉXICO, ED. MC GRAW HILL,
• WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED.
MCGRAW-HILL.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Capitulo I:
Distribuciones Muestrales
POBLACION Y MUESTRA
Población
Se le llama así al conjunto de unidades que poseen la característica en estudio.
“El conjunto de elementos que poseen la variable por investigar, que han llenado las
condiciones de inclusión y que se encuentran disponibles para la investigación en
tiempo y espacio”
Existen 2 tipos de poblaciones: 1) Finita 2) Infinita
Muestra
9
Es aquella porción o subconjunto de elementos de la población en el cual el número
(tamaño) y calidad de los elementos representan fielmente a la población.
Mientras la población es más homogénea se requerirá de una muestra menor y si la
población es más heterogénea se necesitara mayor muestra.
Unidad de Aná
Análisis: Está definida como el elemento que se examina y del que se
busca la información dentro de la unidad de investigación.
TIPOS DE MUESTREO
Cuando seleccionamos algunos elementos
elementos con la intención de averiguar algo sobre
una población determinada, nos referimos a este grupo de elementos como muestra.
Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
población en su conjunto.
La exactitud de la información
información recolectada depende en gran manera de la forma en
que fue seleccionada la muestra.
Cuando no es posible medir cada
uno de los individuos de una
población, se toma una muestra
representativa de la misma.
La muestra descansa en el
principio de que las partes
representan al todo y, por tal, 10
refleja las características que
definen la población de la que fue
extraída, lo cual nos indica que es representativa.
Por lo tanto, la validez de la generalización depende de la validez y tamaño de la
muestra.
LEYES
LEYES DEL MÉTODO DE MUESTREO
El método de muestreo se basa en ciertas leyes que le otorgan su fundamento
científico, las cuales son:
• Ley de los grandes números: si en una prueba, la probabilidad de un
acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la
relación entre las veces que se produce el suceso y la cantidad total de pruebas
(es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.
• Cálculo de probabilidades: La probabilidad de un hecho o su suceso es la relación
entre el número de casos favorables (p) a este hecho con la cantidad de casos
posibles, suponiendo que todos los casos son igualmente posibles. El método de
establecer la probabilidad es lo que se denomina cálculo de probabilidad.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
MARCO MUESTRAL
Es el proceso de definir y enumerar los elementos sobre los cuales se realizan las
inferencias estadísticas en el muestreo probabilístico. Es importante la construcción
de un marco muestral lo más perfecto posible a fin de que exista una
11
correspondencia biunívoca entre las unidades muestrales poblacionales y las listas
físicas que lo conforman. Entre los factores que contribuyen a distorsionar la
calidad de un buen marco muestral están: a) Elementos faltantes, b) Unidades
ocultas por estar pareadas con otras, c) Unidades muestrales repetidas y d)
Elementos extraños.
TIPOS DE MUESTREO
Muestreo Probabilí
Probabilístico: Es cuando se puede determinar de antemano la
probabilidad de selección de cada uno de los elementos de la población siendo esta
distinta de cero. Este muestreo está basado en la teoría de la aleatoriedad o del
azar, en la cual se fundamenta la estadística matemática. Algunos tipos de
muestreo son:
- Aleatorio simple
- Estratificado
- Por conglomerado
- Sistemático
- Proporcional al tamaño de cada grupo
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Muestreo
Muestreo Aleatorio Simple: La forma más común de obtener
una muestra es la selección al azar. es decir, cada uno de los
individuos de una población tiene la misma posibilidad de ser
elegido. Si no se cumple este requisito, se dice que la muestra
es viciada. Para
Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitución
una tabla de números aleatorios o una tómbola de números
aleatorios.
Muestreo Estratificado: Una muestra es estratificada cuando los elementos de la
muestra son proporcionales a su presencia en la población. La presencia de un
elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo,
se divide a la población en varios grupos
grupos o estratos con el fin de dar
representatividad a los distintos
factores que integran el universo de
estudio. Para la selección de los
elementos o unidades
representantes, se utiliza el método
de muestreo aleatorio, tomando
elementos de cada estrato.
Muestreo
Mu estreo Por Conglomerado: Este método divide a toda la 12
población en “K” muestras conteniendo “n” unidades
originales, posteriormente se escoge una muestra de manera
aleatoria de las “K” muestras realizadas al inicio.
Muestreo Sistemático: Es un proceso diferente
erente a los anteriores. Si la población
tiene “N” unidades, estos se enumeran del 1 a “N” en algun orden (tamaño,
edad, pesos, etc..). Para seleccionar una muestrade “n” unidades, tomamos una
unidad al azar de las primeras “K” unidades y de ahí en adelante
adelant cada K-esima
unidad.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
variables
estratificadoras
se refiere.
Conglomerado Se realizan varias • Es muy • El error
fases de muestreo eficiente estándar es
sucesivas (polietápico) cuando la mayor que en
La necesidad de población es el muestreo
listados de las muy grande aleatorio
unidades de una etapa y dispersa. simple o
se limita a aquellas • No es preciso estratificado.
unidades de muestreo tener un • El cálculo del
seleccionadas en la listado de error estándar
etapa anterior. toda la es complejo.
población,
sólo de las
unidades
primarias de
muestreo.
Muestreo No Probabilí
Probabilístico: Es aquel utilizado en forma empírica, es decir, no se
efectúa bajo normas probabilística de selección, por lo que sus procesos intervienen
opiniones y criterios personales del investigador o muestrista o no existe norma 14
bien definida o validada. Normalmente se acude a este tipo de muestreo cuando es
difícil enumerar, listar o precisar el universo objeto de estudio o cuando no existen
registros de los datos. Algunos de estos tipos de muestreo son:
- Por cuotas
- Por criterio
- Accidental
Muestreo por Cuotas: Se divide a la población en estratos o categorías, y se
asigna una cuota para las diferentes categorías y, a juicio del investigador, se
selecciona las unidades de muestreo. La muestra debe ser proporcional a la
población, y en ella deberán tenerse en cuenta las diferentes categorías. El
muestreo por cuotas se presta a distorsiones, al quedar a criterio del
investigador la selección de las categorías.
Muestreo Intencionado: También recibe el nombre de sesgado. El investigador
selecciona los elementos que a su juicio son representativos, lo que exige un
conocimiento previo de la población que se investiga.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Muestreo Mixto:
Se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las
unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas.
Muestreo Tipo:
La muestra tipo (master simple) es una aplicación combinada y especial de los tipos
de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al
disponer de tiempo, la muestra se establece empleando procedimientos sofisticados;
y una vez establecida, constituirá el módulo general del cual se extraerá la muestra
definitiva conforme a la necesidad específica de cada investigación.
TIPOS DE ERRORES
Error Estándar: La desviación estándar de una distribución, en el muestreo de un
estadístico, es frecuentemente llamada el error estándar del estadístico. Por
ejemplo, la desviación estándar de las medias de todas la muestras posibles del
mismo tamaño, extraídas de una población, es llamada el error estándar de la
media.
De la misma manera, la desviación estándar de las proporciones de todas las
muestras posibles del mismo tamaño, extraídas de una población, es llamada el 15
error estándar de la proporción. La diferencia entre los términos "desviación
estándar" y "error de estándar" es que la primera se refiere a los valores originales,
mientras que la última está relacionada con valores calculados. Un estadístico es un
valor calculado, obtenido con los elementos incluidos en una muestra.
Error Muestral
Muestral o Error de Muestreo: La diferencia entre el resultado obtenido de
una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la
población (el parámetro correspondiente) se llama el error muestral o error de
muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la
encuesta completa de la población, sino que se toma una muestra para estimar las
características de la población. El error muestral es medido por el error estadístico,
en términos de probabilidad, bajo la curva normal.
El resultado de la media indica la precisión de la estimación de la población basada
en el estudio de la muestra. Mientras más pequeño el error de las muestras, mayor
es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en
una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no
determinadas, no son considerados como errores muéstrales. Los errores no
muéstrales pueden también ocurrir en una encuesta completa de la población.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
TAMAÑO DE MUESTRA
MUESTRA
Esta va a variar en relación al tipo de estudio y de los objetivos a alcanzar
1.-- Promedios
1. 2.-- Proporción de una
2.
población
3.--
3. Asociación entre
variables
Como esta asociación se
determina por medio del
estadístico de prueba X2, el
tamaño se estima en
función al número de
elementos en cada casilla
(deberán de ser de 5 o más)
16
TIPOS DE VARIABLES
TIPOS DE ESTUDIOS
CUESTIONARIO PROCESAMIENTO DE LA
INFORMACION
Es el instrumento por medio del cual,
el investigador recoge la información Recolección de Datos
de la realidad; dicho instrumento Observación
cuenta con 2 tipos de preguntas: a) Experimentación
abiertas y b) cerradas Encuestas
Organización de Datos
Ordenación
Tabulación
Clasificación
Presentación de Datos
Gráficos
Cuadros
Descripción
Análisis e Interpretación
Conclusiones y
Recomendaciones
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
18
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Capitulo II
II:
Inferencia Estadística
La inferencia Estadística, es
es el procedimiento mediante el cual se toman decisiones
sobre una población en base al estudio de una muestra extraída de ella.
19
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
DISTRIBUCIÓN NORMAL
20
Función de Distribución
• Puede tomar cualquier valor ((- α, + α)
• Son más probables los valores cercanos a uno central que llamamos media
(µ)
• Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de
igual forma a derecha e izquierda (es simétrica).
• Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de
forma más o menos rápida dependiendo de un parámetro σ , que es la
desviación típica.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Tipificación
௫ିఓ
Si la variable X tiene ~N (µ, σ) entonces la variable tipificada de X es ܼ ൌ y
ఙ
sigue una distribución normal pero con µ =0 y σ =0, es decir ~N(0,
N(0, 1)
22
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
INTERVALOS DE CONFIANZA
Se llama intervalo de confianza en estadística a un intervalo de valores alrededor
de un parámetro poblacional (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nive
nivell de confianza, y se denota 1-. α, en donde α
es la probabilidad de equivocarnos,
equivocarnos y se le conoce como nivel de significancia.
Generalmente
ralmente se
construyen intervalos con
confianza al 95% es decir
que se tiene una
significancia del 5%. Menos
frecuentes son los
intervalos del 10% y el 1%.
σ
Formula para calcular el intervalo de confianza: µ = x ± Zα
2 n
Z 0.01 = 2.58
2
σ 84.3 ± 2.58(3.10)
x ± Zα
2 n 84.3 ± 8.0
84.3 − 8 = 76.3
84.3 + 8 = 92.3
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
pˆ qˆ
Formula para calcular el intervalo de confianza: P = pˆ ± Z α
2
n
(0.41)(0.59)
P = 0.41 ± 1.96
300
24
P = 0.41 ± 0.05 0.41 − 0.05 = 0.36
0.41 + 0.05 = 0.46
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se desea estimar el volumen
medio de todos los recipientes que contienen este ácido, considerando que los
valores tienen una distribución normal.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
s 10 ± 2.447(0.107 )
x ± tα 10 ± 0.26
2 n
10 − 0.26 = 9.74
10 + 0.26 = 10.26
(9)(0.286) (9)(0.286)
P= <σ 2 < = 1−α
19.023 2.70
PRUEBAS DE HIPÓTESIS
Por lo que, para cada tipo de prueba de hipótesis se debe calcular una prueba
estadística apropiada. Además de que los datos deben de mostrar una distribución
normal para que se pueda a proceder a la verificación de una hipótesis.
Tipos de planteamientos
1.- Ho: µ = µo Ha: µ ≠ µo
27
Z 0.99 => p = 2.33
Z 0.95 => p = 1.65
X − µo 84.3 − 90 − 5.7
Z= = = = −1.84
σ 12 3.10
N 15
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
X − µo
Formula: t=
S
n
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se estima que el volumen
medio de todos los recipientes que contienen este ácido es diferente de 11lts,
considerando que los valores tienen una distribución normal.
X − µ o 10 − 11
t= = = −9.35
S 0.283
n 7
( x1 − x2 )
Z=
σ 12 σ 22
+
n1 n2
(4.5 − 3.4)
Z= = 2.82
1 1
+
12 15
Varianzas Iguales
Con Varianzas Con Varianzas
Varianzas Diferentes
( x1 − x2 ) − ( µ1 − µ 2 ) ( x1 − x2 )
t= 2 2
t=
S S S12 S 22
p
+ p
+
n1 n2 n1 n2
Ho: Las medias son iguales Ha: Las medias son diferentes
( x1 − x2 ) (120 − 96)
t= 2 2
t= = 1.88
S S 1450 1450
p
+ p +
n1 n2 15 22
30
La “t” de tablas 2.301 (se acepta Ho para medias)
( x1 − x2 ) (62.6 − 47.2)
t= 2 2
t= = 1.41
S S (33.8) 2 (10.1) 2
1
+ 2
+
n1 n2 10 20
T(28)0.05/2=2.0484
-2.0484 < 1.41 < 2.0484
Se acepta Ho.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
( x1 − x2 ) (6800 − 5450)
Z= Z= = 15.17
σ σ (600)2 + (500)2
2 2
1
+ 2
n1 n2 75 80
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
d
t=
Sd
n
Una población con distintas mediciones
d − 2.2 − 2 .2
t= t= = = 4.42
Sd 1.983 0.4977
n 8
t0.05/2,7 = 2.841 como tc > t0.05/2,7 ==> Se rechaza Ho
t0.01/2,7 =4.029 como tc > t0.01/2,7 ==> Se rechaza Ho
x 123
p) = = = 0.41
n 300
33
Prueba de Hipótesis para: Proporciones –dos Poblaciones–
Poblaciones–
Sus formulas son:
x1 + x2 78 + 90
p= p= = 0.84
n1 + n2 100 + 100
p (1 − p ) p (1 − p ) (.84)(.16) (.84)(.16)
σ) p) − p) = + σ) p) − p) = + = .0518
1 2
n1 n2 1 2
100 100
Capitulo III
III
II::
Análisis de Varianza
ESQUEMA DE MUESTREO
En el esquema de muestreo se tiene:
σ σ
µ yi 0 εi
La importancia del modelo,
modelo, reside en la representación de la variable yi como la
suma de un parámetro µ y una variable aleatoria no observable εi, dando origen a 35
una ecuación que pretende explicar el comportamiento de la variable aleatoria yi.
Para el análisis estadístico del modelo puede utilizarse el método del Análisis de la
Varianza (ANVA), el cual es un procedimiento aritmético, que consiste en
descomponer la Suma de Cuadrados Total (Variación Total) en fuentes de variación
reconocidas, incluyendo la variación que no se ha podido medir, que es el ERROR
EXPERIMENTAL.
EXPERIMENTAL
SUPUESTOS DE APLICACION
En la aplicación
icación del ANVA se suponen:
1. Los efectos de los tratamientos y los ambientales son aditivos.
2. El Error Experimental constituye un elemento al azar, normal e
independiente, con una distribución normal con una media 0 y una varianza
σ2 .
CONCEPTOS DE APLICACIÓN
3. Dos conceptos en la aplicación del ANVA.
4. Grados de Libertad (G.L.): Es el número de contrastes o comparaciones
ortogonales (datos independientes) menos el número de restricciones (son las
medias de las hipótesis) impuestas que se realiza en un grupo de datos.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
n( y − µ )
2
REGLA DE DESICION
La regla de decisión para la prueba con un nivel de significancía α es de:
Rechazar Ho si Fo > F1n-1, α
F1n α la de tablas
Siendo Fo la calculada y la F1n-1,
(y - y ) Σ (y - y ) /n-1]
Error n-1
Σni=1 i 2
[Σ n
i=1 i 1] =S 2 2
Total N Σni=1(yi-µ
µo)2
EJEMPLO:
En un estudio de sobre los niveles de hemoglobina de una comunidad que abita
sobre los 1000 m.s.n.m se cuantificaron los niveles de Hb de 28 personas que
participaron de manera voluntaria
voluntaria,, siendo los valores obtenidos:
FV GL SC CM Fo
Media 1 37.67 37.67 4.39*
Error 27 231.66 8.58
Total 28 269.33
FV GL SC CM Fo
Media 1 n(ÿ-µµ o)
2
n(ÿ-µµ) /1
2
µ) /S2
n(ÿ-µ 2
DISEÑOS
DISEÑOS EXPERIMENTALES
Diseño Completamente al Azar
Es el tipo de arreglo más sencillo; los tratamientos están asignados completamente
al azar a las unidades experimentales; por lo que la variabilidad
vari total de las
observaciones del experimento se divide en:
• Una debido al efecto de los tratamientos
• Otra debido al error experimental
El análisis de la varianza contiene únicamente dos fuentes de variación y se
caracteriza por:
• Puede aplicarse cuando se estudian dos o más tratamientos
• Las unidades experimentales deben ser homogéneas
• Los tratamientos deben asignarse a las unidades experimentales totalmente
al azar.
Ventajas:
• Puede utilizarse cuando las repeticiones por tratamiento son diferentes
Cuando sea probable que parte del experimento, ya sean unidades
•
experimentales o tratamientos se pierdan o se rechacen por alguna razón.
38
• El análisis estadístico que se desarrolla es fácil
• En experimentos pequeños, se tiene mayor precisión, ya que
qu contiene más
grados de libertad para estimar el error experimental.
Desventajas:
• Cuando las unidades experimentales son heterogéneas pierde precisión.
• La variación que existe entre las unidades experimentales forma parte del
error experimental.
Tratamientos
1 2 3 ... ... ... t
Y11 Y21 Y31 ... ... ... Yt1
Y12 Y22 Y32 ... ... ... Yt2
Y13 Y23 Y33 ... ... ... Yt3
... ... ... ... ... ... ...
Y1n1 Y2n2 Y3n3 ... ... ... Ytnk
Yi. Σn1j=1Y1j Σ j=1Y2j Σ j=1Y3j ...
n2 n3
... ... Σnkj=1Ytj Σti=1Σnkj=1Yij=Y..
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
La tabla del ANVA, para cuando se tiene diferente número de repeticiones por
tratamiento es la siguiente: 39
40
En la tabla, se tiene que las observaciones se denotan con una letra con dos
subíndices, el primero indica el tratamiento ( i ) y el segundo el bloque ( j ).
Ventajas:
• Es más preciso que el DCA cuando hay un factor que causa variación en las
U.E.
• Es flexible, debido a que puede tener cualquier número de tratamientos y de
bloques (mínimo dos)
• Es posible estimar datos perdidos
Desventajas: 42
• Cuando el número de tratamientos es muy grande, es difícil mantener la
homogeneidad dentro de bloques, se pierde precisión.
• Estima el Error Experimental con menos grados de libertad que el D.C.A.
Diseño gl
DCA t (r-1)
DBA (t-1) (r-1)
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
FV GL SC CM Fc
Tratam. t-1 Σti=1(Yi.)2/r 2
- (Y..) /rt S.C. Trat./t-1
Trat./t C.M. Trat/
C.M. Error
Bloques r-1 Σti=1(Y.j)2/t - (Y..)2/rt S.C. Bloq/r
oq/r-1 C.M. Bloq./
C.M. Error
Error (t-1) S.C.Tot.-S.C.Tr.-S.C.Bl. S.C.Err./t--1 r-1
(r-1)
Total rt-1 Σti=1Σrj=1Y2ij - (Y..)2/rt
Para
ara Tratamientos Fc > Ft0.05 y Fc > Ft0.01
Para Bloques Fc < Ft0.05 y Fc < Ft0.01
Se rechaza Ho1 para tratamientos. Hay diferencias altamente significativas entre
los tratamientos. Algunas dosis funcionan mejor que otras del complemento.
Se acepta Ho2.
Ho2. No hay diferencias significativas entre bloques.
47
Capitulo IV
IV:
Correlación y Regresión
Ecuaciones de curvas
Línea recta Y = ao + a1X
Parábola (curva cuadratica)Y = ao + a1X + a2X2
Curva cúbica Y = ao + a1X + a2X2 + a3X3
Curva Cuartica Y = ao + a1X + a2X2 + a3X3 + a4X4
Curva de grado n Y = ao + a1X + a2X2 + …… + anXn
Curva exponencial Y = abx
Curva geométrica Y = aXb
1
Hiperbola Y = -----------------------
ao + a1X
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Gráficas de Funciones
49
REGRESIÓN LINEAL SIMPLE
En este modelo, se considera a la variable “X” como la variable independiente
independiente, ya
que se encuentra bajo el control del investigador,, es decir los valores de “X” son
seleccionados para obtener valores de “Y”,
“Y”, por lo que se le conoce como variable
dependiente; por lo que se habla de una regresión de “Y” sobre “X”.
L Linealidad
I Independencia
N Normalidad
I Igualdad de varianzas
50
Formulas
(∑ xi )
2
(∑ y ) b ∑ xi −
2 2 2
n
n
b ∑ xi −
22 (∑ xi )
2
n∑ xy − (∑ x )(∑ y )
SCT
b=
n∑ x 2 − (∑ x )
2
a=
∑ y − b∑ x
n
x y x2 y2 xy
51
Totales
Capitulo V:
V:
Estadística No Paramétrica
HIPÓTESIS
Ho: La mediana de la población es de 5
Ha: La mediana de la población es diferente de 5
α = 0.05
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Ejemplo: Se desea conocer si existe diferencia entre los niveles de ac. Úrico de
hombres y mujeres habitantes de la ciudad de San Cristóbal de las Casas.
HIPÓTESIS
Ho: Las medianas de la población de hombres y mujeres son iguales
Ha: Las medianas de la población de hombres y mujeres son di
diferentes
α = 0.05
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
X Y signo
♀ ♂ 11 C0 (0.5) 0 (0.5)11−0 +
1.5 2 -
11 C1 (0.5)1 (0.5)11−1 +
2 2 0
C2 (0.5) 2 (0.5)11−2 +
3.5 4 - 11
56
PRUEBA DE WILCOXON de calificación con signo
Cuando los datos para el análisis son medidos al menos en una escala de intervalos,
la prueba del SIGNO no es la más aconsejable; debido a que se desperdicia mucha
información contenida en los datos.
En estos casos la prueba de WILCOXON puede ser más adecuada, debido a que
utiliza las magnitudes de las diferencias entre las mediciones y un parámetro de
ubicación dada por una HIPÓTESI
HIPÓTESIS S en lugar de los signos de las diferencias.
Esta prueba se basa en las siguientes suposiciones sobre los datos:
1.- La muestra es aleatoria
2.- La variable es continua
3.- Los datos se distribuyen simétricamente alrededor de la MEDIA.
4.-La
La escala de medición es al menos de intervalos
Ejemplo: En una investigación en varones con problemas de calvicie, se les midio los
niveles de androsterona la cual tiene valores de referencia de (2.0-5.0
(2.0 mg/dl). Se
sospecha que estas personas tienen niveles altos de la hormona por lo que se
considera que tienen niveles de 5.05. Los resultados obtenidos fueron los siguientes:
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
4.10 -0.95 7 -7
6.74 1.69 10 10
7.27 2.22 13 13
7.42 2.37 14 14 T+ = 86 T- = 34 T=34
7.50 2.45 15 15 El valor en tabla con n=15 y α/2= 0.0240 (es
el valor más cercano en la tabla) es de 25
6.56 1.51 9 9
4.64 -0.41 3 -3 Por lo que 34 > 25 y no se rechaza Ho
5.98 0.93 6 6
3.14 -1.91 12 -12
3.23 -1.82 11 -11
5.80 0.75 5 5
6.17 1.12 8 8
5.39 0.34 2 2
57
5.77 0.72 4 4
PRUEBA DE MANN-
MANN-WHITNEY
Esta prueba utiliza una mayor cantidad de información inherente a los datos y se
basa en los rangos de las observaciones.
Los supuestos de esta prueba son:
1.- Las muestras (n y m) son extraídas de manera independiente y aleatoria.
2.- La escala de medición es por lo menos ordinal.
3.- Si las poblaciones son diferentes, difieren solo en lo que respecta a sus medianas.
n(n + 1) S = suma de los rangos asignados a los valores de “x”
T =S−
2 n = número de observaciones de la muestra “x”.
Ejemplo: Se desea evaluar si existen diferencias entre los niveles de hemoglobina de
personas fumadoras y no fumadoras.
Ho: Mx = My
Ha: Mx ≠ My
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
n(n + 1)
T =S−
2 S = 145
T = 145 −
15(15 + 1)
= 25
58
2
El valor en tablas (k) con n=15, m=10 y
a=0.025 es de 40.
HIPÓTESIS
Ho: mediana x = mediana y
Ha: mediana x ≠ mediana y
PRUEBAS DE ASOCIACIÓN
Este estadístico de prueba, permite evaluar la asociación entre 2 variables
mediante:
Prueba de independencia:
independencia: Prueba hipótesis nula para 2 criterios de clasificación y
ver si son independientes cuando se aplican al mismo conjunto
conjunto de entidades.
Prueba de homogeneidad:
homogeneidad: Se utiliza para evaluar si las muestras extraídas
provienen de poblaciones homogéneas con respecto a algún criterio de clasificación.
(Vo − Ve) 2
X2 =∑
Ve
Vo= Valores Observados
Ve= Valores Esperados:
(Vo − Ve) 2
X2 =∑
Ve
(75 − 70) 2 (25 − 30) 2 (65 − 70) 2 (35 − 30) 2
X2 = + + +
70 30 70 30
X 2 = 0.357 + 0.833 + 0.357 + 0.833 = 2.381
G.L.= (2-1)(2-1)= 1
X20.01/2=7.879 X20.05/2=5.024
Rechazar Ho, si X2calc. ≥ X2tabla
De acuerdo a la regla de decisión, se acepta Ho, por lo que no hay asociación entre el
sexo y la recuperación del paciente.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
MEDICION DE LA ASOCIACION a
Razón de Riesgo RR = ni
c
no
(a )(d )
Razón de Momios RM =
(b)(C )
INDICE DE CONCORDANCIA 60
Po − Pe a+d (mi )(ni ) + (mo)(no)
K= Po = Pe =
1 − Pe N N2
-Escala Kappa-
Kappa-
k
(18)(20) + (40)(43) + (22)(17)
Pe = ∑ x.i xi. Pe = = 0.383
i =1 80 2
9 + 29 + 14
k
Po = ∑ xii Po = = 0.65
i =1 80
Po − Pe 0.65 − 0.383
61
K= K= = 0.433
1 − Pe 1 − 0.383
INDICES DE VALIDEZ
a
Sen. = *100
a+c
d
Esp. = *100
b+d
a
Vp (+) = *100 Sen.= Sensibilidad
a +b
Esp.= Especificidad
d Vp(+)= Valor predictivo positivo
Vp (−) = *100
c+d Vp(-)=
)= Vaor predictivo negativo
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
TABLAS
62
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
63
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
64
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
65
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
EJERCICIOS
• Supóngase que un investigador está interesado en obtener una estimación
del nivel promedio de una enzima en cierta población de seres humanos con un 95%
de confianza. El investigador toma una muestra de 10 individuos, determina el
nivel de la enzima en cada uno de ellos y calcula la media muestral X= 22. Además,
se sabe que la variable de interés sigue una distribución aproximadamente normal
con una varianza de 45. Se desea estimar el valor de µ
• Se desea estimar la concentración media de amilasa en suero de una
población sana. Las mediciones se efectuaron en una muestra de 15 individuos
aparentemente saludables, con una distribución normal. La muestra proporcionó
una media de 96 unidades/100ml y una desviación estándar de 35 unidades/100ml
la varianza poblacional se desconoce.
• Suponiendo que la población de las concentraciones de amilasa en suero, a
partir de la cual se extrajo una muestra de tamaño 15, tiene una distribución
normal. Construir el intervalo de confianza del 95% para σ2, sabiendo que el valor
de s2 = 1225.
• El IMSS realizó investigaciones sobre los tipos de circulación sanguínea en el
miocardio a personas en el ejido el Edén en el que obtuvo datos con una muestra
representativa de n=25 con enfermedad de la arteria coronaria encontrando una
desviación estandar de 1.03, presentando una distribución normal. Construir
66
intervalos de confianza para la desviación estandar poblacional
• Suponer que se conoce que en una población de mujeres el 90% de las que
comienzan su tercer mes de embarazo han tenido algún cuidado prenatal. Si se
extrae de esta población una muestra aleatoria de tamaño 200 con distribución
normal, ¿Cual es la probabilidad que hayan tenido cuidados prenatales?
• Los datos que presentó un laboratorio de análisis clínicos respecto a la
fórmula eritrocitica requieren de parámetros que sean representativos de la
población a la que prestan sus servicios tanto el químico como el médico, ya que de
ello depende que la población reciba la atención y tratamiento adecuado en caso de
ser necesario. Estos parámetros son diferentes para cada población considerando
que cada uno posee características propias como son la estructura socioeconómica,
su educación, su cultura, sus hábitos, sus costumbres y su situación geográfica.
• El recuento de glóbulos blancos de una muestra de 10 hombres con algún
tipo de leucemia produjo una varianza de 25,000,000. Construir los intervalos de
confianza del 95% para δ2 y δ.
• Se midieron las concentraciones de hemoglobina en 16 animales infestados
con garrapata, registrándose los siguientes valores: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0,
17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8, 17.5. Construir los intervalos de
confianza del 95% para δ2 y δ.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
18 160 149
19 146 176
20 181 165
21 174 165
22 151 160
23 165 142
24 185 142
Edad Razas
A B C D
I t1-18 t2-16 t3-12 t4-21
II t4-22 t1-17 t2-18 t3-19
III t3-11 t4-17 t1-19 t2-17
IV t2-19 t3-18 t4-19 t1-20
• ¿Existen diferencias entre las diferentes Vacunas? Explique.
• ¿Existen diferencias entre las diferentes Razas? Explique.
• ¿Existen diferencias entre las diferentes Edades? Explique.
En base a lo anterior concluya.
3. Se evalúan 4 diferentes insecticidas (t1, t2, t3 y t4) durante 4 semanas (I, II,
III y IV) en 4 especies de Triatominos (A, B, C y D). Los resultados obtenidos se
dieron en relación al número de triatominos encontrados muertos, siendo estos:
Semanas Especies
A B C D
I t1-12 t2-9 t3-6 t4-7
II t4-6 t1-14 t2-10 t3-4
III t3-5 t4-7 t1-11 t2-8
IV t2-9 t3-5 t4-7 t1-12 74
• ¿Existen diferencias entre los diferentes Insecticidas? Explique.
• ¿Existen diferencias entre las diferentes Especies? Explique.
• ¿Existen diferencias entre las diferentes Semanas? Explique.
En base a lo anterior concluya.
4. Se evalúan 3 medidas contra la contaminación ambiental (t1, t2, y t3), en
diversas ciudades del país (A, B y C), durante 3 semanas (I, II y III). El parámetro a
medir fue el S02 en g/m3, (Índice recomendado 40g/m3) los resultados obtenidos
fueron los siguientes:
Semanas Ciudad
A B C
I t1-80 t2-69 t3-71
II t3-93 t1-83 t2-72
III t2-85 t3-88 t1-69
• ¿Existen diferencias entre las diferentes Medidas contra la contaminación?
Explique.
• ¿Existen diferencias entre las diferentes Ciudades? Explique.
• ¿Existen diferencias entre las diferentes Semanas? Explique.
En base a lo anterior concluya.
Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
PRUEBAS DE ASOCIACIÓN
1.- Una industria farmacéutica probó Vo curados No
un nuevo fármaco para el control de la curados
fiebre causado por el resfriado en 100 Machos 20 30 50 75
Hembras 28 22 50
ratones. Se está interesado saber si el 48 52 100
sexo influye en el metabolismo del
fármaco, para ello se dividió la población equivalentemente obteniéndose:
BIBLIOGRAFÍA
• BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE
EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS.
• DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA.
• ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA.
MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V.
• JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS.
• MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS
QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL.
• MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA
SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL.
• PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS,
TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V.
• SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO
INTERAMERICANO.
• STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS,
MÉXICO, ED. MC GRAW HILL,
• WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED.
MCGRAW-HILL. 77