Bioestadistica MARF

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano
Bioestadística Elemental
en el Área de la Salud
1
INTRODUCCIÓN
¿Por qué la Bioestadística?
¿Usaron la estadística Galileo, Newton y Einstein?

En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...)
aparece el concepto de experimento aleatorio (experimento que repetido en las
"mismas condiciones" no produce el mismo resultado) y asociado al mismo el de
variable aleatoria.
Una variable no aleatoria (asociada al resultado de una experiencia que sí produce
el mismo resultado) está caracterizada por un valor para cada condición.
Una variable aleatoria está caracterizada por la llamada función densidad de
probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles
valores para cada condición.
De manera general, se considera que la bioestadística, es el conjunto de métodos
científicos ligados a la toma, organización, recopilación, presentación y análisis de
datos, tanto para la deducción de conclusiones como para tomar decisiones 2
razonables de acuerdo con tales análisis.
Arte de la decisión en presencia de incertidumbre.
La Bioestadística es la ciencia que estudia los métodos que permiten realizar los
procesos de encontrar y describir las variables aleatorias de interés y las relaciones
entre ellas, para el problema en estudio. Estos métodos permiten resumir datos y
acotar el papel de la casualidad (azar).
JUSTIFICACION
En el area de la salud y en particular en el trabajo que se realiza en el Laboratorio

Clínico, la Bioestadística es una de las herramientas indispensables en el quehacer
cotidiano del laboratorio.
La interpretación correcta de los resultados se debe en gran medida a la
estandarización de valores de referencia de pacientes sanos y de significancia
diagnóstica. Siendo la bioestadística quien se encarga de ello.
3
CONTENIDO
Distribuciones muestrales
Inferencia Estadística
Análisis de Varianza
Regresión y Correlación 4
Estadística no Paramétrica
Universidad Autónoma de Chiapas

Facultad de Ciencias Químicas
Campus IV
Asignatura Bioestadística Créditos 8
Semestre Cuarto Clave QFDD43020819
Carrera Químico Farmacobiólogo Hrs./Teoría 3
Prerrequisitos Estadística Hrs./Práctica 2
Hrs./Semana 5
Hrs./Semestre 75
Elaborado Mtro. Miguel Ángel Rosales SEPTIEMBRE 2001
por: Guerrero
INTRODUCCION
El conocimiento que se imparte en la materia permitirá desarrollar habilidades a
los alumnos en áreas específicas como Control de calidad de las materias
primas, Control de Procesos y Productos terminados, Establecimiento de
Normas y Sistemas, Interpretación
Interpretación de datos generados por pruebas rutinarias
de laboratorio, o más general, por las ciencias de la Salud, así como
proporcionarles las bases para Diseñar Experimentos, crear nuevos productos o
para mejorar los procesos nuevos o ya existentes.
5
Se requiere
e del desarrollo de un pensamiento matemático, necesita de la
comprensión, de la habilidad para el Procesamiento de información, del
Razonamiento, de la capacidad de Análisis e interpretación de resultados.
UBICACIÓN DE LA MATERIA
La materia de Bioestadística
Bioestadística se encuentra insertada en el cuarto semestre del
plan de estudios de la carrera de Químico Farmacobiólogo de la Facultad de
Ciencias Químicas de la Universidad Autónoma de Chiapas. El plan de estudios
consta de 9 semestres.
El contenido de la materia
materia es de formación básica de orden práctico y que
tienen como objetivo principal el de enlazar conocimientos para que se
apliquen en las materias de especialización de las dos carreras. Le anteceden
la materia de Estadística, donde se estudió la parte descriptiva
descriptiva de la materia.
ESTRATEGIAS DIDÁCTICAS SUGERIDAS
El curso será implantado a partir del aprendizaje grupal y se combinarán las
sesiones teóricas con las prácticas de taller, así como eventualmente trabajos
de investigación o de campo. En las dos pr primeras,
imeras, la resolución de problemas
tipo será interactiva. El avance del programa será determinado por la clase, de
acuerdo al entendimiento de los temas.
OBJETIVO GENERAL
Al finalizar el curso, el alumno será capaz de aplicar diferentes técnicas de
Inferencia estadística para el análisis de información experimental.
UNIDADES TEMÁTICAS
UNIDAD I.- INFERENCIA ESTADÍSTICA
Objetivo Específico: Al finalizar la unidad, el alumno generalizará sobre
poblaciones a partir de datos muéstrales, empleando para ello los métodos
inferenciales de la estimación y de las hipótesis.
1.1 Conceptos de Inferencia Estadística
1.2 Técnicas de Inferencia Estadística
1.2.1 Estimadores y sus propiedades
1.2.2 Estimación puntual y por intervalo
1.2.3 factor de confianza y error estándar
1.2.4 Estimación de Medias Poblacionales
1.2.5 Estimación de Proporciones Poblacionales
1.2.6 Estimación de Varianzas Poblacionales
1.1.7 Estimación del Tamaño Muestral
1.3 Hipótesis
1.3.1 Planteamiento de Hipótesis
6
1.3.2 Tipos de Hipótesis
1.3.3 Decisión estadística
1.3.4 Errores tipo I y II
1.3.5 Hipótesis sobre las Medias Poblacionales
1.3.6 Hipótesis sobre las Proporciones Poblacionales
1.3.7 Hipótesis sobre las Varianzas Poblacionales
1.3.8 Pruebas de Bondad, Independencia y Homogeneidad
Tiempo Estimado: 16 hrs.
UNIDAD II.- ANÁLISIS DE VARIANCIA
Objetivo Específico: Al finalizar la unidad, el alumno detectará diferencias
significativas entre mas de dos poblaciones, mediante la técnica de análisis de
la VARIANCIA.
2.1 Conceptos de Diseño de experimentos
2.2 Comparación de mas de dos poblaciones
2.2.1 Diseños experimentales
2.2.1.1 Modelo matemático
2.2.1.2 Suposiciones
2.2.1.3 Cuadro de ANDEVA
2.2.2 Pruebas de diferencias significativas entre pares de medias
UNIDAD III.- REGRESIÓN Y CORRELACIÓN LINEAL

Objetivo Específico: Al finalizar la unidad, el alumno determinará la asociación
entre variables, mediante las técnicas de regresión y correlación, evaluando la
validez de los modelos propuestos
3.1 Regresión y Correlación Lineal simple
3.2 Modelo matemático
3.2 Predicción por el método de Mínimos Cuadrados
3.3 Pruebas de Validez.
3.3.1 Coeficientes de Relación y Determinación
3.3.2 Análisis de Varianza
3.3.3 Pruebas de Linealidad
3.4 Regresión y Correlación Lineal múltiple
3.5 Modelo Matemático
3.6 Estimación de los Coeficientes
3.7 Pruebas de Hipótesis
UNIDAD IV.- ESTADÍSTICA NO PARAMETRICA
Objetivo Específico: Al finalizar la unidad, el alumno diferenciará las estadísticas
no paramétricas de las paramétricas y hará inferencias sobre datos cualitativos
o de escala de medición débil. 7
4.1 Introducción
4.2 Prueba de Signos
4.4 Prueba de Rangos
4.5 Prueba de Bondad
4.6 Análisis de Varianza por rangos (Kruskal-Wallis y Friedman)
FORMA DE EVALUACIÓN Y ACREDITACIÓN:

Se tomarán en cuenta para la calificación final, los siguientes indicadores
ponderados:
1. EXÁMENES PARCIALES 30%
2. EXAMEN FINAL 30%
3. PRACTICAS DE TALLER 15%
4. TRABAJOS DE INVESTIGACIÓN 10%
5. CALIFICACION CUALITATIVA 15%
100%
RELACION DE PRACTICAS DE BIOESTADÍSTICA
Práctica Nombre
1 Repaso del manejo del Statgraphics
2 Estimación por intervalo
3 Hipótesis
4 Tamaño de la muestra
5 Microstat
6 Ajuste de modelos
7 Regresión no lineal
8 Estadística no paramétrica
9 Análisis de varianza
BIBLIOGRAFÍA
• BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE
EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS.
• DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA.
• ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA.
•
MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V.
JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS.
8
• MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS
QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL.
• MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA
SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL.
• PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS,
TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V.
• SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO
INTERAMERICANO.
• STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS,
MÉXICO, ED. MC GRAW HILL,
• WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED.
MCGRAW-HILL.
Capitulo I:
Distribuciones Muestrales
POBLACION Y MUESTRA
Población
Se le llama así al conjunto de unidades que poseen la característica en estudio.
“El conjunto de elementos que poseen la variable por investigar, que han llenado las
condiciones de inclusión y que se encuentran disponibles para la investigación en
tiempo y espacio”
Existen 2 tipos de poblaciones: 1) Finita 2) Infinita
Muestra
9
Es aquella porción o subconjunto de elementos de la población en el cual el número
(tamaño) y calidad de los elementos representan fielmente a la población.
Mientras la población es más homogénea se requerirá de una muestra menor y si la
población es más heterogénea se necesitara mayor muestra.
UNIDADES ESTADÍSTICAS DE MUESTREO

Unidad de Investigaci
Investigacióón: Es la unidad mínima que mantiene la integridad de los
datos que interesan estudiar y analizar. Es decir, el ente que contiene las partes
que se van a analizar.
Unidades de Muestreo
Muestreo: Son aquellas que contienen las unidades de análisis de la
población y que se utilizarán para confeccionar o seleccionar la muestra. En
general, es la selección de los conjuntos que serán tomados en cuenta para la
conformar la muestra final en la investigación.
Unidad de Observaci
Observacióón: Se denomina a la unidad a través de la cual se obtiene la
información, esta puede o no coincidir con el elemento. También se denomina
unidad respondiente.
Unidad de Aná
Análisis: Está definida como el elemento que se examina y del que se
busca la información dentro de la unidad de investigación.
TIPOS DE MUESTREO
Cuando seleccionamos algunos elementos
elementos con la intención de averiguar algo sobre
una población determinada, nos referimos a este grupo de elementos como muestra.
Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
población en su conjunto.
La exactitud de la información
información recolectada depende en gran manera de la forma en
que fue seleccionada la muestra.
Cuando no es posible medir cada
uno de los individuos de una
población, se toma una muestra
representativa de la misma.
La muestra descansa en el
principio de que las partes
representan al todo y, por tal, 10
refleja las características que
definen la población de la que fue
extraída, lo cual nos indica que es representativa.
Por lo tanto, la validez de la generalización depende de la validez y tamaño de la
muestra.
LEYES
LEYES DEL MÉTODO DE MUESTREO
El método de muestreo se basa en ciertas leyes que le otorgan su fundamento
científico, las cuales son:
• Ley de los grandes números: si en una prueba, la probabilidad de un
acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la
relación entre las veces que se produce el suceso y la cantidad total de pruebas
(es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.
• Cálculo de probabilidades: La probabilidad de un hecho o su suceso es la relación
entre el número de casos favorables (p) a este hecho con la cantidad de casos
posibles, suponiendo que todos los casos son igualmente posibles. El método de
establecer la probabilidad es lo que se denomina cálculo de probabilidad.
De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven

de base más directamente al método de muestreo:
• Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de
un conjunto N, es casi seguro que tenga las características del grupo más
grande.
• Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se
refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía
en una dirección, es probable que una parte igual del mismo grupo, varíe en
dirección opuesta.
• Ley de la permanencia de los números pequeños: si una muestra
suficientemente grande es representativa de la población, una segunda muestra
de igual magnitud deberá ser semejante a la primera; y, si en la primera
muestra se encuentran pocos individuos con características raras, es de esperar
encontrar igual proporción en la segunda muestra
MARCO MUESTRAL
Es el proceso de definir y enumerar los elementos sobre los cuales se realizan las
inferencias estadísticas en el muestreo probabilístico. Es importante la construcción
de un marco muestral lo más perfecto posible a fin de que exista una
11
correspondencia biunívoca entre las unidades muestrales poblacionales y las listas
físicas que lo conforman. Entre los factores que contribuyen a distorsionar la
calidad de un buen marco muestral están: a) Elementos faltantes, b) Unidades
ocultas por estar pareadas con otras, c) Unidades muestrales repetidas y d)
Elementos extraños.
TIPOS DE MUESTREO
Muestreo Probabilí
Probabilístico: Es cuando se puede determinar de antemano la
probabilidad de selección de cada uno de los elementos de la población siendo esta
distinta de cero. Este muestreo está basado en la teoría de la aleatoriedad o del
azar, en la cual se fundamenta la estadística matemática. Algunos tipos de
muestreo son:
- Aleatorio simple
- Estratificado
- Por conglomerado
- Sistemático
- Proporcional al tamaño de cada grupo
Muestreo
Muestreo Aleatorio Simple: La forma más común de obtener
una muestra es la selección al azar. es decir, cada uno de los
individuos de una población tiene la misma posibilidad de ser
elegido. Si no se cumple este requisito, se dice que la muestra
es viciada. Para
Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitución
una tabla de números aleatorios o una tómbola de números
aleatorios.
Muestreo Estratificado: Una muestra es estratificada cuando los elementos de la
muestra son proporcionales a su presencia en la población. La presencia de un
elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo,
se divide a la población en varios grupos
grupos o estratos con el fin de dar
representatividad a los distintos
factores que integran el universo de
estudio. Para la selección de los
elementos o unidades
representantes, se utiliza el método
de muestreo aleatorio, tomando
elementos de cada estrato.
Muestreo
Mu estreo Por Conglomerado: Este método divide a toda la 12
población en “K” muestras conteniendo “n” unidades
originales, posteriormente se escoge una muestra de manera
aleatoria de las “K” muestras realizadas al inicio.
Muestreo Sistemático: Es un proceso diferente
erente a los anteriores. Si la población
tiene “N” unidades, estos se enumeran del 1 a “N” en algun orden (tamaño,
edad, pesos, etc..). Para seleccionar una muestrade “n” unidades, tomamos una
unidad al azar de las primeras “K” unidades y de ahí en adelante
adelant cada K-esima
unidad.
CARACTERISTICAS VENTAJAS INCONVENIENTES
Aleatorio Se selecciona una • Sencillo y de Requiere que se posea

simple muestra de tamaño n fácil de antemano un
de una población de N comprensión. listado completo de
unidades, cada • Cálculo rápido toda la población.
elemento tiene una de medias y Cuando se trabaja con
probabilidad de varianzas. muestras pequeñas es
inclusión igual y • Se basa en la posible que no
conocida de n/N. teoría represente a la
estadística, y por población
tanto existen adecuadamente.
paquetes
informáticos
para analizar los
datos
Sistemático Conseguir un listado • Fácil de aplicar. Si la constante de
de los N elementos de • No siempre es muestreo está asociada
la población necesario tener con el fenómeno de
Determinar tamaño un listado de interés, las
muestral n. toda la estimaciones obtenidas
Definir un intervalo k= población. a partir de la muestra
N/n. • Cuando la pueden contener sesgo
Elegir un número población está de selección
aleatorio, r, entre 1 y k
(r= arranque
ordenada
siguiendo una
13
aleatorio). tendencia
Seleccionar los conocida,
elementos de la lista. asegura una
cobertura de
unidades de
todos los tipos.
Estratificado En ciertas ocasiones • Tiende a • Se ha de conocer la
resultará conveniente asegurar que la distribución en la
estratificar la muestra muestra población de las
según ciertas variables represente variables
de interés. Para ello adecuadamente utilizadas para la
debemos conocer la a la población en estratificación.
composición función de unas
estratificada de la variables
población objetivo a seleccionadas.
hacer un muestreo. • Se obtienen
Una vez calculado el estimaciones
tamaño muestral más precisa
apropiado, este se • Su objetivo es
reparte de manera conseguir una
proporcional entre los muestra lo más
distintos estratos semejante
definidos en la posible a la
población usando una población en lo
simple regla de tres. que a la o las
variables
estratificadoras
se refiere.
Conglomerado Se realizan varias • Es muy • El error
fases de muestreo eficiente estándar es
sucesivas (polietápico) cuando la mayor que en
La necesidad de población es el muestreo
listados de las muy grande aleatorio
unidades de una etapa y dispersa. simple o
se limita a aquellas • No es preciso estratificado.
unidades de muestreo tener un • El cálculo del
seleccionadas en la listado de error estándar
etapa anterior. toda la es complejo.
población,
sólo de las
unidades
primarias de
muestreo.
Muestreo No Probabilí
Probabilístico: Es aquel utilizado en forma empírica, es decir, no se
efectúa bajo normas probabilística de selección, por lo que sus procesos intervienen
opiniones y criterios personales del investigador o muestrista o no existe norma 14
bien definida o validada. Normalmente se acude a este tipo de muestreo cuando es
difícil enumerar, listar o precisar el universo objeto de estudio o cuando no existen
registros de los datos. Algunos de estos tipos de muestreo son:
- Por cuotas
- Por criterio
- Accidental
Muestreo por Cuotas: Se divide a la población en estratos o categorías, y se
asigna una cuota para las diferentes categorías y, a juicio del investigador, se
selecciona las unidades de muestreo. La muestra debe ser proporcional a la
población, y en ella deberán tenerse en cuenta las diferentes categorías. El
muestreo por cuotas se presta a distorsiones, al quedar a criterio del
investigador la selección de las categorías.
Muestreo Intencionado: También recibe el nombre de sesgado. El investigador
selecciona los elementos que a su juicio son representativos, lo que exige un
conocimiento previo de la población que se investiga.
Muestreo Mixto:
Se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las
unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas.
Muestreo Tipo:
La muestra tipo (master simple) es una aplicación combinada y especial de los tipos
de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al
disponer de tiempo, la muestra se establece empleando procedimientos sofisticados;
y una vez establecida, constituirá el módulo general del cual se extraerá la muestra
definitiva conforme a la necesidad específica de cada investigación.
TIPOS DE ERRORES
Error Estándar: La desviación estándar de una distribución, en el muestreo de un
estadístico, es frecuentemente llamada el error estándar del estadístico. Por
ejemplo, la desviación estándar de las medias de todas la muestras posibles del
mismo tamaño, extraídas de una población, es llamada el error estándar de la
media.
De la misma manera, la desviación estándar de las proporciones de todas las
muestras posibles del mismo tamaño, extraídas de una población, es llamada el 15
error estándar de la proporción. La diferencia entre los términos "desviación
estándar" y "error de estándar" es que la primera se refiere a los valores originales,
mientras que la última está relacionada con valores calculados. Un estadístico es un
valor calculado, obtenido con los elementos incluidos en una muestra.
Error Muestral
Muestral o Error de Muestreo: La diferencia entre el resultado obtenido de
una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la
población (el parámetro correspondiente) se llama el error muestral o error de
muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la
encuesta completa de la población, sino que se toma una muestra para estimar las
características de la población. El error muestral es medido por el error estadístico,
en términos de probabilidad, bajo la curva normal.
El resultado de la media indica la precisión de la estimación de la población basada
en el estudio de la muestra. Mientras más pequeño el error de las muestras, mayor
es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en
una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no
determinadas, no son considerados como errores muéstrales. Los errores no
muéstrales pueden también ocurrir en una encuesta completa de la población.
TAMAÑO DE MUESTRA
MUESTRA
Esta va a variar en relación al tipo de estudio y de los objetivos a alcanzar
1.-- Promedios
1. 2.-- Proporción de una
2.
población
3.--
3. Asociación entre
variables
Como esta asociación se
determina por medio del
estadístico de prueba X2, el
tamaño se estima en
función al número de
elementos en cada casilla
(deberán de ser de 5 o más)
16
TIPOS DE VARIABLES
Por su Simple Mide un solo indicador

Estructura Compleja Se requiere de 2 o más indicadores
Nominales (nombres).- Nombra la modalidad
de una característica sin compararla con
grados de intensidad (Ej.: procedencia, religión,
ocupación, etc.).
Cualitativas
Por la Forma Ordinales.- Expresa que elementos pueden
de Medirse poseer características en distintos grados o
intensidades (Ej.: bacterias por campo, color de
orina, grado de estudios, etc.)
Enteras (Ej.: 3, 5, 7, etc.)
Cuantitativas
Fraccionadas (Ej.: 3.1416, 9.7, etc.)
Por Independientes (X)
Dependencia Dependientes (Y)
TIPOS DE ESTUDIOS
CARACTERÍSTICAS DEL ESTUDIO Tipo de estudio
Interferencia Periodo de Evolución del Comparación de

del captación de fenómeno las poblaciones de
Investigador información estudiado estudio
Observacional Prospectivo o Transversal Descriptivo • Encuesta

Retrospectivo Descriptiva
Comparativo • Encuesta
Comparativa
Observacional Retrospectivo Longitudinal Descriptivo • Revisión de
casos
Observacional Retrospectivo Longitudinal Comparativo de • Casos y
Efecto-Causa controles
Observacional Retrospectivo Longitudinal Comparativo de • Perspectiva
Causa-Efecto histórica
Observacional Prospectivo Longitudinal Descriptivo • Estudio de
Comparativo una cohorte
• Estudio de
varias
cohortes
Experimental Prospectivo Longitudinal Comparativo • Experimento 17
CUESTIONARIO PROCESAMIENTO DE LA
INFORMACION
Es el instrumento por medio del cual,
el investigador recoge la información Recolección de Datos
de la realidad; dicho instrumento Observación
cuenta con 2 tipos de preguntas: a) Experimentación
abiertas y b) cerradas Encuestas
Organización de Datos
Ordenación
Tabulación
Clasificación
Presentación de Datos
Gráficos
Cuadros
Descripción
Análisis e Interpretación
Conclusiones y
Recomendaciones
TITULOS DE CUADROS Y GRAFICAS

En el caso de los títulos de cuadros, estos van en la parte superior de estos,
mientras que las figuras lo llevan en la parte inferior
Elementos que debe contener un titulo de cuadros o gráficas:
1.- Naturaleza de la presentación (Cuadro o gráfico)
2.- Número de la presentación
3.- naturaleza de los datos (pesos, tallas, etc..)
4.- Unidades utilizadas (Kg., cm., etc..)
5.- Origen de los datos (personas, cultivos, etc..)
6.- Espacio: lugar de donde se obtuvieron
7.- Tiempo: periodo en el que se obtuvieron los datos
18
Capitulo II
II:
Inferencia Estadística
La inferencia Estadística, es
es el procedimiento mediante el cual se toman decisiones
sobre una población en base al estudio de una muestra extraída de ella.
19
DISTRIBUCIÓN NORMAL
Representación gráfica de esta función de densidad
20
a) Distribuciones normales con distinta b) Distribuciones normales con

desviación estándar e igual media diferentes medias e igual desviación
estándar
Función de Distribución
• Puede tomar cualquier valor ((- α, + α)
• Son más probables los valores cercanos a uno central que llamamos media
(µ)
• Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de
igual forma a derecha e izquierda (es simétrica).
• Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de
forma más o menos rápida dependiendo de un parámetro σ , que es la
desviación típica.
Función de distribución F(x) es el área sombreada de esta gráfica
Tipificación
௫ିఓ
Si la variable X tiene ~N (µ, σ) entonces la variable tipificada de X es ܼ ൌ y
ఙ
sigue una distribución normal pero con µ =0 y σ =0, es decir ~N(0,
N(0, 1)
Representación gráfica la función Z

21
a la variable Z se la denomina variable tipificada de X,, y a la curva de su función de

densidad curva normal tipificada
tipificada.
Característica de la distribución normal tipificada (reducida, estándar)

• No depende de ningún parámetro
• Su media es 0, su varianza es 1 y su desviación típica es 1.
• La curva f(x) es simétrica respecto del eje OY
• Tiene un máximo en este eje
• Tiene dos puntos de inflexión en z =1 y z = -1
Manejo de Tablas —Casos Más Frecuentes—

Frecuentes—
Las ecuaciones consideran que se cuenta con tablas de una sola cola y valores de +Z
22
INTERVALOS DE CONFIANZA
Se llama intervalo de confianza en estadística a un intervalo de valores alrededor
de un parámetro poblacional (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nive
nivell de confianza, y se denota 1-. α, en donde α
es la probabilidad de equivocarnos,
equivocarnos y se le conoce como nivel de significancia.
Generalmente
ralmente se
construyen intervalos con
confianza al 95% es decir
que se tiene una
significancia del 5%. Menos
frecuentes son los
intervalos del 10% y el 1%.
Intervalos de confianza para la Media de una Población

–Varianza Conocida
Conocida–– 23
Ecuación que describe el intervalo de confianza:
  σ   σ  
P =  x − Z α   < µ < x + Zα   = 1−α
 2 n  2 n  
 σ 
Formula para calcular el intervalo de confianza: µ = x ± Zα  
2 n 
EJEMPLO: Un laboratorio desea estimar con el 99% de confianza la media del

Volumen Corpuscular en una población del municipio de Frontera Hidalgo. Se
considera que se tiene una distribución normal y una varianza poblacional de 144.
144
En un muestreo de 15 individuos se obtuvo una media de 84.3µ
84.3µ3.
Z 0.01 = 2.58
2
 σ  84.3 ± 2.58(3.10)
x ± Zα  
2 n 84.3 ± 8.0
84.3 − 8 = 76.3
84.3 + 8 = 92.3
Intervalos de confianza para Proporciones de una Población

  pˆ qˆ   pˆ qˆ  
P =  pˆ − Z α   < P < pˆ + Z α   = 1− α
 2
n  2
n  
 pˆ qˆ 
Formula para calcular el intervalo de confianza: P = pˆ ± Z α  
2
n 
EJEMPLO: Se realiza un estudio sobre el uso del preservativo en jóvenes

universitarios sexualmente activos; para lo cual se tomo una muestra de 300
estudiantes de la Facultad de Ciencias Químicas, encontrándose que ssolo 123 lo
usaban en cada relación. Con un 95% de confianza cual es la proporción de
individuos, que usan el preservativo en cada relación?
Z 0.05 = 1.96 123  pˆ qˆ 
p) = = 0.41 P = pˆ ± Z α  
2 300 2
n 
 (0.41)(0.59) 
P = 0.41 ± 1.96 
 300 
24
P = 0.41 ± 0.05 0.41 − 0.05 = 0.36
0.41 + 0.05 = 0.46
Intervalos de confianza para la Media de una Población con Varianza Desconocida

  S   S  
P =  x − t α   < µ < x + tα   = 1− α
 2 n 2 n  
 s 
Formula para calcular el intervalo de confianza: µ = x ± tα  
2 n
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se desea estimar el volumen
medio de todos los recipientes que contienen este ácido, considerando que los
valores tienen una distribución normal.
t 0.05 = 2.447 x = 10 S = 0.283

2
 s  10 ± 2.447(0.107 )
x ± tα   10 ± 0.26
2 n
10 − 0.26 = 9.74
10 + 0.26 = 10.26
Intervalos de confianza para la Varianza de una Población

  (n − 1) s 2
 (n − 1) s 2 (n − 1) s 2 
P= <σ <
2
 = 1−α x =
2
2
 x1− α xα2  σ2
 2 2 
∴ 25
Formulas para calcular el intervalo de confianza: ( n − 1) s 2
σ2±
x α2
2
EJEMPLO: En el muestreo a 10 persona de la población de Unión

(n − 1) s 2
Juárez se les determino su hematocrito obteniéndose los siguientes σ 2 ±
resultados: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.0. xα2
2
Cual es la variación del hematocrito en esta población con un 95%
de confianza.
S2= 0.286
 (9)(0.286) (9)(0.286) 
P= <σ 2 <  = 1−α
 19.023 2.70 
0.135 < σ 2 < 0.953

PRUEBAS DE HIPÓTESIS
Una prueba de hipótesis estadística es una conjetura sobre un parámetro de una o

más poblaciones. Para tener la certeza sobre una hipótesis, se debe examinar a la
población entera, resultando en la mayoría de las veces difícil de poder hacer; por lo
que se procede a tomar una muestra aleatoria de la población de interés y se
utilizan los datos que contiene la muestra para proporcionar evidencia que confirme
o no la hipótesis. La evidencia encontrada permite la aceptación o el rechazo de la
hipótesis, a través de un estadístico de prueba.
Por lo que, para cada tipo de prueba de hipótesis se debe calcular una prueba
estadística apropiada. Además de que los datos deben de mostrar una distribución
normal para que se pueda a proceder a la verificación de una hipótesis.
La distribución apropiada de la prueba estadística se divide en dos regiones: una

región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última
región no se puede rechazar la hipótesis nula. 26
Antes de continuar, es necesario mencionar que existen muchos tipos de hipótesis,
pero las que competen a este material son las hipótesis estadísticas, las cuales son
2: Hipótesis alterna (Ha) e Hipótesis nula (Ho), siendo en la primera donde el
investigador plantea su idea y la segunda es la que contiene la parte opuesta y
complementaría, siendo la que se utiliza para evaluar de manera indirecta la
hipótesis del investigador (Ha). De manera que contrario a lo que muchos piensan
la primera hipótesis que se debe plantear es la alterna (Ha) por ser ahí donde se
encuentra la idea original del investigador, y sin la formulación de la hipótesis
alterna (Ha) no puede existir la Hipótesis nula (Ho), por esta tan solo el
complemento opuesto dela alterna (Ha).
Tipos de planteamientos
1.- Ho: µ = µo Ha: µ ≠ µo
Z 0.995 => p = 2.58

Z 0.975 => p = 1.96
2.- Ho: µ ≥ µo Ha: µ < µo
Z 0.01 => p = -2.33

Z 0.05 => p = -1.65
3.- Ho: µ ≤ µo Ha: µ > µo
27
Z 0.99 => p = 2.33
Z 0.95 => p = 1.65
Prueba de Hipótesis para: Media Poblacional con Varianza Conocida
EJEMPLO: Un laboratorio estima con el 99% de confianza que la

X −µo
Z= media del Volumen Corpuscular en una población del municipio de
σ Frontera Hidalgo es diferente de 90 µ3. Se considera que se tiene una
distribución normal y una varianza poblacional de 144. 144 En un
n muestreo de 15 individuos se obtuvo una media de 84.3µ
84.3 .
3
Ho: µ = 90 Ha: µ ≠ 90 Z 0.01 = 2.58

2
X − µo 84.3 − 90 − 5.7
Z= = = = −1.84
σ 12 3.10
N 15
Prueba de Hipótesis para: Media Poblacional con Varianza Desconocida
X − µo
Formula: t=
S
n
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se estima que el volumen
medio de todos los recipientes que contienen este ácido es diferente de 11lts,
considerando que los valores tienen una distribución normal.
Ho: µ = 11 Ha: µ ≠ 11 t 0.05 = 2.447 ܺത = 10 S = 0.283

2
X − µ o 10 − 11
t= = = −9.35
S 0.283
n 7
No se acepta Ho, hay evidencia que

indica que la media del volumen de los
recipientes es diferente de 11lts.
28
Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con

Varianzas Conocidas
1.- Ho: µ1 – µ2 = 0 Ha: µ1 – µ2 ≠ 0
2.- Ho: µ1 – µ2 ≥ 0 Ha: µ1 – µ2 < 0
3.- Ho: µ1 – µ2 ≤ 0 Ha: µ1 – µ2 > 0
EJEMPLO: Se realiza un estudio en la comunidad de Mazatán, Chiapas, sobre los

niveles de ac. Úrico en los habitantes de la población; y se considera q
que las
concentraciones de hombres y mujeres no son iguales. Se toman muestras de 12
varones y 15 mujeres encontrándose ambas poblaciones con valores distribuidos
normalmente con una media 4.5 y 3.4 mg/ml, respectivamente.
Ho: µhombres = µmujeres Ha: µhombres ≠ µmujeres
( x1 − x2 )
Z=
σ 12 σ 22
+
n1 n2
(4.5 − 3.4)
Z= = 2.82
1 1
+
12 15
Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con

Varianzas Desconocidas
Antes que nada se debe conocer, si las poblaciones tienen varianzas
29
2
iguales o diferentes por lo que se procede a se una prueba de S mayor
F=
hipótesis para las varianzas con el estadístico de prueba “F”. Siendo 2
S menor
la formula a utilizar:
lizar:
Las hipótesis son:
Ho: Las varianzas son iguales Ha: Las varianzas son diferentes
Dependiendo de la aceptación o no aceptación de la Hipótesis nula (Ho), será la

formula que se utilice:
Varianzas Iguales
Con Varianzas Con Varianzas
Varianzas Diferentes
( x1 − x2 ) − ( µ1 − µ 2 ) ( x1 − x2 )
t= 2 2
t=
S S S12 S 22
p
+ p
+
n1 n2 n1 n2
(n1 − 1) S12 + (n2 − 1) S 22

S p2 =
n1 + n2 − 2
EJEMPLO (Varianzas Iguales):

Iguales) Se realiza un estudio sobre el funcionamiento
hepático de perros y gatos mediante la enzima aminoaspartato transferasa (AST),
contando con 22 perros y 15 gatos, con una media de 120 y 96 U/l respectivamente y
una desviación estándar de 40 y 35 respectivamente. Se puede considerar que
ambas especies de animales tienen los niveles de AST.
Ho: Las varianzas son iguales Ha: Las varianzas
rianzas son diferentes
2 2
S mayor (40)
F= 2 = 2
= 1.3061 La F de Tablas 1.90 (see acepta Ho para varianzas)
S menor (35)
Ho: Las medias son iguales Ha: Las medias son diferentes
(n1 − 1) S12 − (n2 − 1) S 22 21(40) 2 − 14(35) 2

S p2 = S p2 = = 1450
n1 + n2 − 2 22 + 15 − 2
( x1 − x2 ) (120 − 96)
t= 2 2
t= = 1.88
S S 1450 1450
p
+ p +
n1 n2 15 22
30
La “t” de tablas 2.301 (se acepta Ho para medias)
EJEMPLO (Varianzas distintas): En el ganado bovino los niveles de glucosa oscilan

entre los 45 y 75 mg/dl. Un grupo de investigadores desea saber si dos razas
(lechera y productora de carne), difieren con respecto al valor medio de la glucosa.
Se toman 10 animales productores de leche (n1) y 20 productores de carne (n2),
siendo sus medias de 62.6 y 47.2 respectivamente y las desviaciones estándar de
33.8 y 10.1.
Ho: Las medias son iguales Ha: Las medias son diferentes
( x1 − x2 ) (62.6 − 47.2)
t= 2 2
t= = 1.41
S S (33.8) 2 (10.1) 2
1
+ 2
+
n1 n2 10 20
T(28)0.05/2=2.0484
-2.0484 < 1.41 < 2.0484
Se acepta Ho.
Prueba de Hipótesis para: Muestreo a Partir de Poblaciones que no Presentan

Distribución Normal
Cuando el muestreo se
realiza a partir de
poblaciones que no
presentan distribución
normal, es posible
utilizar los resultados
del teorema del limite
central si la magnitud
de las muestras es
grande (n ≥ 30).
Cuando se extraen dos muestras aleatorias simple

independientes de gran magnitud de una población que no ( x1 − x2 )
sigue una distribución normal se pueden utilizar las
Z=
σ 12 σ 22
varianzas poblacionales si se conocen, de lo contrario se +
utilizan como estimaciones las varianzas de las muestras, n1 n2
las cuales necesariamente
necesariam deben de ser grandes.
31
EJEMPLO: Se realiza un estudio en 75 pacientes con infecciones gastrointestinales

con sintomatología teniendo una lectura media de leucocitos de 6800,
68 y 80 pacientes
con infecciones gastrointestinales sin sintomatología aparente con una lectura
media de leucocitos de 5450, con desviaciones estándar de 600 y 500
respectivamente. Se considera que las poblaciones de donde se extraen las muestras
no siguen
en una distribución normal, siendo el muestreo aleatorio e independiente.
¿Se puede considerar que las lecturas de ambas poblaciones es la misma?
Ho: µc/sintomas = µs/sintomas Ha: µc/sintomas = µs/sintomas
( x1 − x2 ) (6800 − 5450)
Z= Z= = 15.17
σ σ (600)2 + (500)2
2 2
1
+ 2
n1 n2 75 80
Prueba de Hipótesis para: Comparaciones por Parejas

Se utiliza cuando las poblaciones a comparar, son dependientes una
de la otra. La formula es: d − µ do
t=
Sd
n
d
t=
Sd
n
Una población con distintas mediciones
EJEMPLO: Se evalúan dos

distintas dietas para ver con
cual se gana más peso peso,
siendo los resultados en kg
ganados:
32
d − 2.2 − 2 .2
t= t= = = 4.42
Sd 1.983 0.4977
n 8
t0.05/2,7 = 2.841 como tc > t0.05/2,7 ==> Se rechaza Ho
t0.01/2,7 =4.029 como tc > t0.01/2,7 ==> Se rechaza Ho
El efecto de las dietas no es el mismo en el incremento de peso de las personas.

Prueba de Hipótesis para: Proporciones –una población–

población–
SU formula es: EJEMPLO: Un estudio para evaluar la eficacia de un nuevo
tratamiento contra la Encefalitis Equina Venezolana, da
p) − po
Z= como resultado que de 300 animales vacunados 123
po qo
presentaron la enfermedad. ¿Es posible concluir a partir de
n estos datos que en la población de animales muestreados, la
proporción de animales que se protegen de la infección no es
del 50%
Ho: p = 0.50 Ha: p ≠ 0.50
x 123
p) = = = 0.41
n 300
0.41 − 0.50 − 0.09

Z= = = −3.11
(0.50)(0.50) 0.0289
300
Se rechaza la Hipótesis nula.
33
Prueba de Hipótesis para: Proporciones –dos Poblaciones–
Poblaciones–
Sus formulas son:
( p)1 − p) 2 ) − ( p1o − p2o ) x1 + x2

Z= ( p)1 − p) 2 ) − ( p1o − p2 o ) p=
σ) ) ) Z= n1 + n2
p1 − p 2
σ) ) ) p1 − p 2
EJEMPLO: Un estudio para comparar la eficacia de un nuevo tratamiento contra la

malaria arroja el resultado de 78 individuos de 100 se alivian, mientras que con la
cloroquina que es el método tradicional se alivia
alivian
n 90 de cada 100.
x1 + x2 78 + 90
p= p= = 0.84
n1 + n2 100 + 100
p (1 − p ) p (1 − p ) (.84)(.16) (.84)(.16)
σ) p) − p) = + σ) p) − p) = + = .0518
1 2
n1 n2 1 2
100 100
( p)1 − p) 2 ) − ( p1o − p2o ) (.90 − .78) .12

Z= Z= = = 2.32
σ) ) )
p1 − p 2
.0518 .0518
Capitulo III
III
II::
Análisis de Varianza
El análisis de la varianza, es un método que es necesario cuando se quieren

comparar más de dos medias.
medias Sin embargo debido a que es un método que permite
comparar varias medias en diversas situaciones; se encuentra ligado, al diseño de
experimentos y, de alguna manera, es la base del análisis multivaria
multivariado.
Los modelos Estadísticos y el Análisis de la Var

Varianza
ianza
Se conoce como Modelo a la representación
epresentación de un fenómeno de la vida real. Y un
modelo matemático
atemático es aquel en el que se relaciona variables. Siendo de dos tipos:
DETERMINÍSTICO: Establece una relación exacta entre las variables
ESTADÍSTICO:: Establece la a relación entre las variables depende del aspecto
aleatorio de los fenómenos –Siendo
Siendo este el modelo con el que trabajaremos este 34
capítulo–.
MODELO MATEMÁTICO BASE DEL ANÁLISIS DE VARIANZA

En el muestreo, las observaciones (yi)
provenientes de una población yi = µ + εi con i = 1, 2, 3,........, n
normal pueden ser representados por:
µ: Es una constante, la cual depende de un conjunto de factores con el mismo efecto
para todos los valores de la población. Es la media de todos los yi de la población
εi: Es la parte aleatoria, la cual depende de un conjunto de factores que influyen en
diferente forma sobre el fenómeno. Es el error de muestreo para cada yi
anterior los εi son

En el modelo anterior,
aleatorios y pueden tomar
valores tanto positivos como
negativos, debido a que los yi
también son aleatorios; y µ es
una constante.
ualquier inferencia sobre µ –media

De manera que cualquier media poblacional dependerá del
modelo probabilístico que se suponga para la variable εi –error
error de muestro
muestro–
ESQUEMA DE MUESTREO
En el esquema de muestreo se tiene:
yi = µ + εi y yi ∼ N (µµ,. σ2) ==> εi ∼ N (0, σ2)

Siendo µ una constante las gráficas yi y εi son:
σ σ
µ yi 0 εi
La importancia del modelo,
modelo, reside en la representación de la variable yi como la
suma de un parámetro µ y una variable aleatoria no observable εi, dando origen a 35
una ecuación que pretende explicar el comportamiento de la variable aleatoria yi.
Para el análisis estadístico del modelo puede utilizarse el método del Análisis de la
Varianza (ANVA), el cual es un procedimiento aritmético, que consiste en
descomponer la Suma de Cuadrados Total (Variación Total) en fuentes de variación
reconocidas, incluyendo la variación que no se ha podido medir, que es el ERROR
EXPERIMENTAL.
EXPERIMENTAL
SUPUESTOS DE APLICACION
En la aplicación
icación del ANVA se suponen:
1. Los efectos de los tratamientos y los ambientales son aditivos.
2. El Error Experimental constituye un elemento al azar, normal e
independiente, con una distribución normal con una media 0 y una varianza
σ2 .
CONCEPTOS DE APLICACIÓN
3. Dos conceptos en la aplicación del ANVA.
4. Grados de Libertad (G.L.): Es el número de contrastes o comparaciones
ortogonales (datos independientes) menos el número de restricciones (son las
medias de las hipótesis) impuestas que se realiza en un grupo de datos.
5. Cuadrado Medio (C.M.): Es el cociente de una suma de cuadrados (SC) entre

su respectivo grado de libertad. [CM = SC / GL]
n( y − µ )
2
Si Ho: µ = µo es cierta, entonces: Fo = ∼ F1n-1

S2
Por lo tanto se utiliza Fo para probar el juego de hipótesis planteado al inicio.
REGLA DE DESICION
La regla de decisión para la prueba con un nivel de significancía α es de:
Rechazar Ho si Fo > F1n-1, α
F1n α la de tablas
Siendo Fo la calculada y la F1n-1,
TABLA DE ANÁLISIS DE VARIANZA

Todo el proceso antes descrito se resume en una tabla llamada Tabla de Análisis de
Varianza (ANVA), que a continuación se detalla:
Fuentes de Grados
os de Sumas de Cuadrado Medio (CM) Fo
Variación (FV) Libertad (GL) Cuadrados (SC) 36
Media 1
n( y -µµ )
o
2
n( y -µµ) /1 2
n( y -µµ) /S
2 2
(y - y ) Σ (y - y ) /n-1]
Error n-1
Σni=1 i 2
[Σ n
i=1 i 1] =S 2 2
Total N Σni=1(yi-µ
µo)2
La estadística Fo, bajo la hipótesis nula, tiene una distribución F1n-

F1n-1, la Regla de
Decisión consiste en: Rechazar Ho si Fo > F n-1, α
1
EJEMPLO:
En un estudio de sobre los niveles de hemoglobina de una comunidad que abita
sobre los 1000 m.s.n.m se cuantificaron los niveles de Hb de 28 personas que
participaron de manera voluntaria
voluntaria,, siendo los valores obtenidos:
12.72 13.38 13.94 17.34 15.74 14.60 19.03
14.11 13.01 17.53 19.25 13.72 12.26 13.29
18.92 17.65 12.13 13.90 10.41 15.03 14.44
13.62 11.49 14.75 13.68 14.81 5.21 17.03

De estudios previos se sabe que de una población parecida

parecida, el porcentaje de
hemoglobina es de 13.23.
a) ¿Cual es la población de interés en este estudio?
b) ¿Se puede considerar que el promedio del porcentaje de hemoglobina es igual a
13.23.. si es así a que nivel de significancía?
Solución:
a) El nivel de hemoglobina de la población de estudio
b) µo=13.23
El juego de hipótesis a probar es: Ho: µ=µo VS Ha: µ≠µo
Como µoo = Porcentaje de proteínas en la leguminosa “Leucaena”
Entonces Ho: µ=13.23 VS Ha: µ≠13.23
Este juego de hipótesis se probará mediante ANVA. En donde la suma de cuadrados
es:
S.C. Media = n(ÿ - µo)2
µ
S.C. Error = Σni=1(yi
ni=1(yi-ÿ)2 = Σni=1y2i- (Σni=1yi)2/n
S.C. Total = Σni=1(yi
ni=1(yi-µo)2 37
De los datos obtenidos tenemos:
n=28 Σy = 402.93 Σy2 = 6029.9671 Σy/n
y/n = ÿ = 14.39
Sustituyendo en las formulas tenemos:
S.C. Media = n(ÿ - µo)
µ 2= 28 (14.39 - 13.23)2 = 37.67
S.C. Error = Σni=1y2i-
i (Σni=1yi)2/n = 6029.9671-(402.93)2/28= 231.66
S.C. Total = Σni=1(yi-µo)
(yi 2 = S.C. Error+S.C. Media = 231.66+37.67= 269.33
FV GL SC CM Fo
Media 1 37.67 37.67 4.39*
Error 27 231.66 8.58
Total 28 269.33
FV GL SC CM Fo
Media 1 n(ÿ-µµ o)
2
n(ÿ-µµ) /1
2
µ) /S2
n(ÿ-µ 2
Error n-1 Σ i=1(yi-ÿ)2

n
Σni=1(yi-ÿ)2/n-1]= S2
[Σ
Total n Σni=1(yi-µµo)2
F127,0.05 = 4.17 Fo > Ft F127,0.01 = 7.56 Fo < Ft
Existe diferencia significativa al 5% por lo que a ese nivel se rechaza Ho. No así al
1% donde se acepta Ho.
DISEÑOS
DISEÑOS EXPERIMENTALES
Diseño Completamente al Azar
Es el tipo de arreglo más sencillo; los tratamientos están asignados completamente
al azar a las unidades experimentales; por lo que la variabilidad
vari total de las
observaciones del experimento se divide en:
• Una debido al efecto de los tratamientos
• Otra debido al error experimental
El análisis de la varianza contiene únicamente dos fuentes de variación y se
caracteriza por:
• Puede aplicarse cuando se estudian dos o más tratamientos
• Las unidades experimentales deben ser homogéneas
• Los tratamientos deben asignarse a las unidades experimentales totalmente
al azar.
Ventajas:
• Puede utilizarse cuando las repeticiones por tratamiento son diferentes
Cuando sea probable que parte del experimento, ya sean unidades
•
experimentales o tratamientos se pierdan o se rechacen por alguna razón.
38
• El análisis estadístico que se desarrolla es fácil
• En experimentos pequeños, se tiene mayor precisión, ya que
qu contiene más
grados de libertad para estimar el error experimental.
Desventajas:
• Cuando las unidades experimentales son heterogéneas pierde precisión.
• La variación que existe entre las unidades experimentales forma parte del
error experimental.
Tratamientos
1 2 3 ... ... ... t
Y11 Y21 Y31 ... ... ... Yt1
Y12 Y22 Y32 ... ... ... Yt2
Y13 Y23 Y33 ... ... ... Yt3
... ... ... ... ... ... ...
Y1n1 Y2n2 Y3n3 ... ... ... Ytnk
Yi. Σn1j=1Y1j Σ j=1Y2j Σ j=1Y3j ...
n2 n3
... ... Σnkj=1Ytj Σti=1Σnkj=1Yij=Y..
Si todos los tratamientos tienen el mismo número de repeticiones entonces:

n1=n2=n3=.....=nk=r.
En la tabla, se tiene que las observaciones se denotan con una letra con dos
subíndices, el primero indica el tratamiento ( i ) y el segundo la repetición ( j ).
La tabla del ANVA, para cuando se tiene diferente número de repeticiones por
tratamiento es la siguiente: 39
Si los tratamientos tienen igual número de repeticiones, entonces el ANVA resulta

ser:
Regla de decisión: Rechazar Ho, si Fc > Ft

Ft--1n.- t(r-1), α
1n.-t ó t(r-
Ejemplo Se evaluó el incremento de tamaño de ratas de

laboratorio, por efecto de tres dosis de una hormona sintética
T4. El experimento se realizo a nivel de laboratorio en donde
las U.E. fueron ratones recién nacidos, después de 30 días se
midió el tamaño de los ratones desde las patas traseras a las
patas delanteras, estirando al ratón sin forzarlo ni lastimarlo.
El resultado de la medición del tamaño de cada ratón se hizo
en Mm. y dio como resultado los valores que en siguiente
cuadro se presentan:
Pruebe la hipótesis de que los incrementos de tamaño de los ratones no se ven
afectados por los diferentes niveles de T4.
Ho: µ1=µ2=µ3 V.S. Ha: al menos un µi es diferente
40
Ft 0.05=3.81 ==> Fc > Ft Ft 0.01=6.70 ==> Fc > Ft
Se rechaza la hipótesis nula. Si hay diferencias altamente significativas en el

crecieminto de los ratones con las tres diferentes dosis de la hormona T4.
Diseño de Bloques al Azar

Este diseño es utilizado cuando las U.E. son
heterogéneas, por lo que la varianza dentro de
los tratamientos es muy alta, la cual está
medida por el cuadrado medio del Error, que en
este caso es grande, por lo que es más difícil
rechazar la hipótesis de igualdad de medias de
tratamientos.
Bajo la situación antes mencionada
mencionada, es conveniente
dividir el material experimental en grupos
(BLOQUES), de tal forma que las U.E. sean
homogéneas dentro de bloques y heterogéneas entre
bloques.
Cada tratamiento a ensayar está representado una
sola vez en cada bloque, estos se asignan al azar a
las U.E. de cada bloque y posteriormente cada bloque
se distribuye al azar en su establecimiento.
Con la asignación de los tratamientos y los bloques al azar, es posible estimar la
varianza entre bloques por separado y tener un Error Experimental pe
pequeño. 41
Características
Las U.E. deben de ser homogéneas dentro de cada bloque, salvo por
pequeñas variaciones aleatorias; puede haber cierta heterogenicidad, el
propósito de los bloques es: absorber en máximo grado la variabilidad del
material experiment
experimental.
Es el más utilizado en trabajos experimentales
Aunque no es particularmente una característica, los grados de libertad para
el Error no debe ser menor de 12
Es fácil de planear y el procedimiento de cálculo es fácil
La disposición de tratamientos y bloques es ortogonal entre sí.
El establecimiento del Diseño en Campo, los Bloques se colocan
perpendicularmente al gradiente de variabilidad.
En la tabla, se tiene que las observaciones se denotan con una letra con dos
subíndices, el primero indica el tratamiento ( i ) y el segundo el bloque ( j ).
Ventajas:
• Es más preciso que el DCA cuando hay un factor que causa variación en las
U.E.
• Es flexible, debido a que puede tener cualquier número de tratamientos y de
bloques (mínimo dos)
• Es posible estimar datos perdidos
Desventajas: 42
• Cuando el número de tratamientos es muy grande, es difícil mantener la
homogeneidad dentro de bloques, se pierde precisión.
• Estima el Error Experimental con menos grados de libertad que el D.C.A.
Diseño gl
DCA t (r-1)
DBA (t-1) (r-1)
FV GL SC CM Fc
Tratam. t-1 Σti=1(Yi.)2/r 2
- (Y..) /rt S.C. Trat./t-1
Trat./t C.M. Trat/
C.M. Error
Bloques r-1 Σti=1(Y.j)2/t - (Y..)2/rt S.C. Bloq/r
oq/r-1 C.M. Bloq./
C.M. Error
Error (t-1) S.C.Tot.-S.C.Tr.-S.C.Bl. S.C.Err./t--1 r-1
(r-1)
Total rt-1 Σti=1Σrj=1Y2ij - (Y..)2/rt
El criterio de decisión es:

Rechazar Ho1, si Fc > Ft-
Ft-1(t 1)(r-1), α
1(t--1)(r- Para tratamientos
Rechazar Ho2, si Fc > Fr- 1)(r-1), α
1(t--1)(r-
Fr-1(t Para Bloques
Ejemplo: Se evalúa la eficiencia de un complemento alimenticio a 4 diferentes dosis

para elevar los niveles del volumen sanguíneo en personas que sufren de anemia
ferropénica e hipovolemía. Dada la variabilidad de
pesos y sexos, se decidió agrupar en bloque de
personas por pesos lo más semejantes posibles. Se 43
les dio el tratamiento durante 4 meses y se procedió
a determinar su volumen sanguíneo dando los
siguientes resultados:
Las hipótesis a probar son:

Ho1: T1=T2=T3=T4
2=T3=T4 VS Ha1: Al menos un tratamiento es diferente
Ho2: B1=B2=B3=B4=B5 VS Ha2: Al menos un bloque es diferente
Para
ara Tratamientos Fc > Ft0.05 y Fc > Ft0.01
Para Bloques Fc < Ft0.05 y Fc < Ft0.01
Se rechaza Ho1 para tratamientos. Hay diferencias altamente significativas entre
los tratamientos. Algunas dosis funcionan mejor que otras del complemento.
Se acepta Ho2.
Ho2. No hay diferencias significativas entre bloques.
Diseño Cuadrado Latino

44
Se utiliza cuando hay dos factores que afectan
sistemáticamente a las unidades experimentales.
Para evitar que el efecto de los factores se acumule
en el error experimental se hace un doble bloqueo.
Esta asignación de ortogonalidad (independencia)
a los efectos de los tratamientos respecto a los dos
factores de variabilidad asociados con el
experimento, requiere que cada tratamiento
aparezca una vez en cada una de esas variantes,
denominados: HILERAS Y COLUMNAS.
Características:
Se genera cuando los tratamientos se agrupan
ag en
bloques homogéneos en dos direcciones: hileras y
columnas quienes constituyen una repetición
completa de los tratamientos.
Cualquier tratamiento aparece una sola vez en la misma columna o en la misma
hilera.
Se impone a las U.E. una restricción de doble bloqueo.
El número de repeticiones es igual al número de tratamientos a evaluar. Esto es, si

hay t tratamientos, el total de U.E. será t2
t2. t es mayor de 2.
Ventajas:
Reduce el error experimental al introducir el doble bloqueo.
El análisis estadístico
estadístico es simple, ligeramente más complicado que DBA.
Puede utilizarse cuando las U.E. forman una línea continua.
Proporciona una comparación más precisa de los efectos de los tratamientos.
Aún con datos perdidos, el análisis estadístico es simple.
Es más preciso que el DBA.
Desventajas:
Es poco flexible, ya que el No. de Hileras o Columnas dependen del No. de
tratamientos.
No se pueden comparar muchos tratamientos, el rango es 4
4-10
Con pocos tratamientos, se tienen demasiados parámetros en el modelo con
pocas
ocas observaciones, siendo ineficiente la estimación de la varianza del error.
45
En la tabla, se tiene que las observaciones se

denotan con una letra con tres subíndices, el
primero indica el tratamiento ( i ), el segundo
el bloque ( j ) y el tercero ( k ) la columna.
El criterio de decisión es:

Rechazar Ho1, si Fc > Ft-
Ft-1(t 1)(t-2), α
1(t--1)(t- Para tratamientos
Rechazar Ho2, si Fc > Fr-
Fr-1(t 1)(t-2), α
1(t--1)(t- Para Hileras
Rechazar Ho3, si Fc > Fr-
Fr-1(t 1)(t-2), α
1(t--1)(t- Para Columnas
Ejemplo: Se desea evaluar en un experimento el efecto en la ganancia de peso de

46
cuatro complementos alimenticios en la dieta de ratones recién nacidos de
diferentes razas. Se pesaron los ratones al nacer y se pesaron después de 15 días de
estarles dando el complemento
alimenticio; obteniendo de la
diferencias de pesos la ganancia del
mismo, obteniéndose los siguientes
resultados en gr.:
Ho1:t1=t2 = t3 VS Ha1:al menos un ti es diferente (ti
(ti≠ti’)
Ho2:H1=H2 H3 VS Ha2:al menos un Hi es diferente (Hi
(Hi≠Hi’)
Ho3:C1=C2 =C3 VS Ha3:al menos un Ci es diferente (Ci
(Ci≠Ci’)
47
No existe diferencia significativa en la ganancia de pesos por efecto de los

complementos alimenticios, ni por las especies y pesos al nacer.
Capitulo IV
IV:
Correlación y Regresión
En la práctica con mucha frecuencia es necesario resolver problemas que implican

conjuntos de variables, cuando se sabe que existe una relación inherente entre ellas.
El aspecto estadístico del problema consiste en lograr la mejor estimación de la
relación entre las variables
El análisis de regresión es útil para encontrar la forma probable de las relaciones

entre las variables , siendo el objetivo final cuando se emplea este método de
análisis, el de predecir o estimar el valor de una variable en función al valor tomado
por otra variable.
El análisis de correlación se refiere a la medición de la intensidad de la relación

entre las variables. Cuando se calculan mediciones de correlación a partir de un
48
conjunto de datos, el interés recae en el grado de correlación entre las variables.
Ecuaciones de curvas
Línea recta Y = ao + a1X
Parábola (curva cuadratica)Y = ao + a1X + a2X2
Curva cúbica Y = ao + a1X + a2X2 + a3X3
Curva Cuartica Y = ao + a1X + a2X2 + a3X3 + a4X4
Curva de grado n Y = ao + a1X + a2X2 + …… + anXn
Curva exponencial Y = abx
Curva geométrica Y = aXb
1
Hiperbola Y = -----------------------
ao + a1X
Gráficas de Funciones
49
REGRESIÓN LINEAL SIMPLE
En este modelo, se considera a la variable “X” como la variable independiente
independiente, ya
que se encuentra bajo el control del investigador,, es decir los valores de “X” son
seleccionados para obtener valores de “Y”,
“Y”, por lo que se le conoce como variable
dependiente; por lo que se habla de una regresión de “Y” sobre “X”.
Supuestos que fundamentan el modelo de Regresión lineal simple

1.- Los valores de “X” son seleccionados previamente por el investigador.
2.- La variable “X” se midce sin error (la magnitud del error en la medición es
insignificante).
3.- Para cada valor de “X” existe una subpoblaciones de valores de “Y”
4.- Los
os valores de “Y” siguen una distribución normal
5.- Todas las varianzas de las subpoblaciones de “Y” son iguales
6.- Todas las medias de las subpoblaciones de “Y” se encuentran sobre la misma
linea recta (supocisión de linealidad). µy/x = α + βx
7.- Los valores
alores de “Y” son estadisticamente independientes entre ellas
L Linealidad
I Independencia
N Normalidad
I Igualdad de varianzas
a: Es el punto donde la recta cruza el eje vertical. Es el

punto de inicio del valor de los datos de la pendiente.
b: Es el valor de la pendiente. Indica la cantidad con la cual
“y” cambia por cada unidad que cambia “X”.
50
Evaluación de la ecuación de regresión

Hipótesis a probar: Ho: β = 0 v.s. Ha: β ≠ 0
Conclusiones:
Fuente de variación g.l. S.C. C.M. F
Si se acepta Ho, el
modelo lineal no Regresión lineal 1 SCR SCR/1 CMR/CMr
proporciona un buen
Residual n-2 SCr SCr/n-2
ajuste para los datos.
Si se rechaza Ho, el Total n-1
modelo lineal
proporciona un buen ajuste para los datos.
Formulas

 (∑ xi ) 
2
(∑ y ) b ∑ xi −
2 2 2
SCT = ∑ yi2 − i  n  SCR

r2 =  =
(∑ yi )
n 2
SCT
∑ i
y 2
−

SCR = b ∑ xi −
2 2 (∑ xi ) 
2

n
 n 
 

b ∑ xi −
22 (∑ xi ) 
2
SCr = SCT − SCR  n 

r=  = SCR
( y)
∑ yi2 − ∑n i
2
n∑ xy − (∑ x )(∑ y )
SCT
b=
n∑ x 2 − (∑ x )
2
a=
∑ y − b∑ x
n
x y x2 y2 xy
51
Totales
CORRELACIÓN LINEAL SIMPLE

En el modelo clasico de regresión solo “y” es la variable dependiente (aleatoria),
siendo “x” una variable fija determinada por el investigador.
Sin embargo, cuando “x” y “y” son variables aleatorias, se tiene lo que se conoce
como modelo de correlación.
Por lo que el análisis de regresión puede llevarse a cabo bajo el modelo de
correlación.
Pudiendo hacerse una regresión de “x” sobre “y”, así como una regresión de “y”
sobre “x”.
El objetivo es únicamente obtener una medida de la intensidad de la relación entre
las 2 variables, no importa que recta se ajuste, ya que la medida que por lo general
se calcula será la misma en cualquier ca
caso.
Supuestos que fundamentan el modelo de Correlación lineal simple

Se supone que “x” y “y”, varian conjuntamente en lo que se conoce como distribución
conjunta, y si además esta distribución sigue una distribución normal,
normal recibe el
nombre de distribución normal bivariada.
1.- Para cada valor de “X” existe una subpoblaciones de valores de “Y” con una
distribución normal.
2.- Para cada valor de “y” existe una subpoblaciones de valores de “x” con una
3.- La distribución conj
conjunta
unta de “x” y “y” es una distribución normal bivariada.
4.- Todas las subpoblaciones de los valores de “Y” tiene la misma varianza
5.- Todas las subpoblaciones de los valores de “X” tiene la misma varianza
r: Coeficiente de correlación. –Mide la intensidad

d de la asociación entre las
variables “X” y “Y”.
r= 0.6 = 60%. Existe una asociación entre las variables del 60%.
r2: Coeficiente de determinación
determinación. – Representa la variación total de los valores
de la variable “Y” que se pueden contabilizar o explicar por
por una relación lineal con 52
los valores de la variable aleatoria “X”.–
“X”.
r2=0.36 = 36%. El 36% de la variación de los valores de “Y”, se deben a una relación
lineal con los valores de “X”.
Capitulo V:
V:
Estadística No Paramétrica
La estadística paramétrica “Estima” o “Prueba Hipótesis” acerca de uno ó más

Parametros de la Población
Población. Necesitandose para esto conocer la forma en que se
distribuye la población de donde se tomarón las muestras para la Inferencia
(aproximadamente normal).
La estadística no paramétrica, estudia procedimientos que no se refieren a
parámetros poblacionales, que además no dependen del conocimiento del
comportamiento de la distribución de la población en estudio. Son procedimientos
que no son afirmaciones acerca de los parámetros de la población.
Ventajas de la estadística no paramétrica

53
1.- Permiten probar hipótesis que no son afirmaciones acerca de valores de los
parámetros poblacionales.
2.- Se pueden utilizar cuando se desconoce la forma de la distribución de la
población muestreada.
3.- Son fáciles de calcular, aplicándose más fácil y rápidamente.
4.- Pueden aplicarse cuando los datos son solo categorías o clasificaciones.
Desventajas de la estadística no paramétrica

1.- Analizar información mediante estadística no parametrica, pudiendo usarse la
estadística parametrica, produce un desperdicio de información.
2.- En muestras grandes la aplicación de la estadística no parametrica puede ser
muy laboriosa.
PRUEBA DEL SIGNO

Esta prueba utiliza a la mediana como medida de tendencia central.
Toma su nombre de la utilización de los signos “+” y “-”
“ ” en lugar de los valores
numéricos.
En esta prueba se deben de evaluar los datos de tal forma que los que sean
superiores a la mediana hipotétic
hipotética
a se les sustituye con el signo “+” y los que sean
inferiores se les sustituye con el signo “-”
“ ” y a los que tienen el exactamente mismo
valor que la mediana se les asigna el valor de “0” (cero). Por lo que los valores “0” se
eliminan del analisis y de la muestra
m -reduciendose
reduciendose el tamaño de la muestra (n).
Las hipótesis alternas que pueden ocurrir son:
Ha: P(+) > P(-)
Ha: P(+) < P(-)
Ha: P(+) ≠ P(-)
Regla de decisión:
). Se rechaza Ho, cuando la probabilidad de observar k, o menos
Ha: P(+) > P(-).
signos menos es menor o igual que α.
Ha: P(+) < P(-).
). Se rechaza Ho, cuando la probabilidad de observar k, o menos 54
signos mas es menor o igual que α.
Ha: P(+) ≠ P(-).
). Se rechaza Ho, cuando la probabilidad de obtener un valor k, tanto o
más extremo como el calculado es menor o igual a α/2.
La probabilidad se calcula mediante la
siguiente formula:
Ejemplo: Se tomó una muestra aleatoria de 10 alumnos que

llevan el curso de verano de bioestadística arrojando los
siguientes resultados
HIPÓTESIS
Ho: La mediana de la población es de 5
Ha: La mediana de la población es diferente de 5
α = 0.05
Alum. Calif. Alum. Calif.

x
1 4 1 - P(k ≤ x / n, p ) = ∑ n Ck p k q n −k
k =0
2 5 2 0
1
3 8 3 + P(k ≤ 1 / 9,0.5) = ∑ 9 Ck p k q 9−k
k =0
4 8 4 +
5 9 5 + P(k ≤ 1/ 9,0.5) =9 C0 (0.5)0 (0.5)9−0 +9 C1 (0.5)1 (0.5)9−1
6 6 6 +
P (k ≤ 1 / 9,0.5) = 0.00195 + 0.01758 = 0.0195
7 10 7 +
8 7 8 +
HIPÓTESIS
9 6 9 +
Ho: mediana = 5
10 6 10 +
Ha: mediana ≠ 5
El valor encontrado cae en la zona de

rechazo de la Hipótesis nula (Ho), por lo
tanto la mediana tiene un valor difrente de 55
5.
Cuando se tienen parejas de datos, el procedimiento funciona asignando un signo

“+” cuando la diferencia “x-y”
“x es mayor y un signo “-”” cuando es menor, y “0” cuando
la diferencia es de cero.
Ejemplo: Se desea conocer si existe diferencia entre los niveles de ac. Úrico de
hombres y mujeres habitantes de la ciudad de San Cristóbal de las Casas.
HIPÓTESIS
Ho: Las medianas de la población de hombres y mujeres son iguales
Ha: Las medianas de la población de hombres y mujeres son di
diferentes
α = 0.05
X Y signo
♀ ♂ 11 C0 (0.5) 0 (0.5)11−0 +
1.5 2 -
11 C1 (0.5)1 (0.5)11−1 +
2 2 0
C2 (0.5) 2 (0.5)11−2 +
3.5 4 - 11
3 2.5 + P (k ≤ 2 / 11,0.5) = 0.0327

3.5 4 - HIPÓTESIS
2.5 3 - Ho: mediana♀
mediana = mediana♂
2 3.5 - Ha: mediana♀
mediana ≠ mediana♂
1.5 3 -
1.5 2.5 -
2 2.5 - La probabilidad cae dentro de la zona de aceptación de la
3 2.5 + hipótesis nula (Ho), por lo que se concluye que los niveles de
ácido úrico de hombres y mujeres son iguales.
2 2.5 -
56
PRUEBA DE WILCOXON de calificación con signo
Cuando los datos para el análisis son medidos al menos en una escala de intervalos,
la prueba del SIGNO no es la más aconsejable; debido a que se desperdicia mucha
información contenida en los datos.
En estos casos la prueba de WILCOXON puede ser más adecuada, debido a que
utiliza las magnitudes de las diferencias entre las mediciones y un parámetro de
ubicación dada por una HIPÓTESI
HIPÓTESIS S en lugar de los signos de las diferencias.
Esta prueba se basa en las siguientes suposiciones sobre los datos:
1.- La muestra es aleatoria
2.- La variable es continua
3.- Los datos se distribuyen simétricamente alrededor de la MEDIA.
4.-La
La escala de medición es al menos de intervalos
Ejemplo: En una investigación en varones con problemas de calvicie, se les midio los
niveles de androsterona la cual tiene valores de referencia de (2.0-5.0
(2.0 mg/dl). Se
sospecha que estas personas tienen niveles altos de la hormona por lo que se
considera que tienen niveles de 5.05. Los resultados obtenidos fueron los siguientes:
Andros. di=xi-µo di di c/signo

4.91 -0.14 1 -1 Ho: µ=5.05 Ha: µ≠5.05
4.10 -0.95 7 -7
6.74 1.69 10 10
7.27 2.22 13 13
7.42 2.37 14 14 T+ = 86 T- = 34 T=34
7.50 2.45 15 15 El valor en tabla con n=15 y α/2= 0.0240 (es
el valor más cercano en la tabla) es de 25
6.56 1.51 9 9
4.64 -0.41 3 -3 Por lo que 34 > 25 y no se rechaza Ho
5.98 0.93 6 6
3.14 -1.91 12 -12
3.23 -1.82 11 -11
5.80 0.75 5 5
6.17 1.12 8 8
5.39 0.34 2 2
57
5.77 0.72 4 4
PRUEBA DE MANN-
MANN-WHITNEY
Esta prueba utiliza una mayor cantidad de información inherente a los datos y se
basa en los rangos de las observaciones.
Los supuestos de esta prueba son:
1.- Las muestras (n y m) son extraídas de manera independiente y aleatoria.
2.- La escala de medición es por lo menos ordinal.
3.- Si las poblaciones son diferentes, difieren solo en lo que respecta a sus medianas.
n(n + 1) S = suma de los rangos asignados a los valores de “x”
T =S−
2 n = número de observaciones de la muestra “x”.
Ejemplo: Se desea evaluar si existen diferencias entre los niveles de hemoglobina de
personas fumadoras y no fumadoras.
Ho: Mx = My
Ha: Mx ≠ My
n(n + 1)
T =S−
2 S = 145
T = 145 −
15(15 + 1)
= 25
58
2
El valor en tablas (k) con n=15, m=10 y
a=0.025 es de 40.
HIPÓTESIS
Ho: mediana x = mediana y
Ha: mediana x ≠ mediana y
Se rechaza Ho. La mediana de la

hemoglobina de fumadores y no
fumadores es diferente.
PRUEBAS DE ASOCIACIÓN
Este estadístico de prueba, permite evaluar la asociación entre 2 variables
mediante:
Prueba de independencia:
independencia: Prueba hipótesis nula para 2 criterios de clasificación y
ver si son independientes cuando se aplican al mismo conjunto
conjunto de entidades.
Prueba de homogeneidad:
homogeneidad: Se utiliza para evaluar si las muestras extraídas
provienen de poblaciones homogéneas con respecto a algún criterio de clasificación.
(Vo − Ve) 2
X2 =∑
Ve
Vo= Valores Observados
Ve= Valores Esperados:
Ha: Hay asociación

Ho: No hay asociación
Rechazar Ho, si X2calc. ≥ X2tabla
Grados de Libertad (g.l.) = (Columnas -1) (Hileras-1) 59
Ejemplo: A 2 grupos de 100 personas de hombres y
mujeres cada uno, con diabetes mellitus, se les
suministra un nuevo medicamento a ambos grupos,
encontrándose en el grupo de los hombres 75
recuperados y en el de las mujeres 65. ¿Existe
asociación entre el sexo y la recuperación?
r
(Vo − Ve) 2
X2 =∑
Ve
(75 − 70) 2 (25 − 30) 2 (65 − 70) 2 (35 − 30) 2
X2 = + + +
70 30 70 30
X 2 = 0.357 + 0.833 + 0.357 + 0.833 = 2.381
G.L.= (2-1)(2-1)= 1
X20.01/2=7.879 X20.05/2=5.024
Rechazar Ho, si X2calc. ≥ X2tabla
De acuerdo a la regla de decisión, se acepta Ho, por lo que no hay asociación entre el
sexo y la recuperación del paciente.
Prueba Exacta de “Fisher”

Cuando las frecuencias esperadas son pequeñas (aunque los estadísticos no se
ponen de acuerdo se recomienda el criterio de menor de 5 o 3 en una celda), no debe
usarse la prueba de chi cuadrada; debiéndose
usar un procedimiento alterno llamado “Prueba (a + b)!(c + d )!(a + c)!(b + d )!
p=
Exacta
ta de Fisher”. Se considera la suposición (a!)(b!)(c!)(d!)(n!)
INDEPENDENCIA, y se utiliza para la tabla de
contingencia de 2x2
MEDICION DE LA ASOCIACION a
Razón de Riesgo RR = ni
c
no
(a )(d )
Razón de Momios RM =
(b)(C )
INDICE DE CONCORDANCIA 60
Po − Pe a+d (mi )(ni ) + (mo)(no)
K= Po = Pe =
1 − Pe N N2
-Escala Kappa-
Kappa-
Ejemplo:: Se realiza una prueba de concordancia entre el

laboratorio A con 14 casos de 100 positivos y el laboratorio B
con 10 casos de 100 positivos. Ambos trabajaron las mismas
muestras. ¿Cual es el nivel de concordancia de los resultados
entre ambos laboratorios?
(mi)(ni) + (mo)(no) a+d Po − Pe

Pe = Po = K=
N2 N 1 − Pe
(14)(10) + (86)(90) 4 + 80 0.84 − 0.788
Pe = = 0.788 Po = = 0.84 K= = 0.245
(100) 2 100 1 − 0.788
Conclusión: La concordancia entre

ambos laboratorios es discreta
INDICE DE CONCORDANCIA -MULTINOMINALES-

MULTINOMINALES-
Ejemplo: Dos patólogos desean saber la concordancia
entre el diagnóstico de ambos, por lo que se procedió a
que con las mismas muestras ambos procedieran a
dar su diagnóstico siendo los resultados los que se
muestran en la tabla:
k
(18)(20) + (40)(43) + (22)(17)
Pe = ∑ x.i xi. Pe = = 0.383
i =1 80 2
9 + 29 + 14
k
Po = ∑ xii Po = = 0.65
i =1 80
Po − Pe 0.65 − 0.383
61
K= K= = 0.433
1 − Pe 1 − 0.383
INDICES DE VALIDEZ
a
Sen. = *100
a+c
d
Esp. = *100
b+d
a
Vp (+) = *100 Sen.= Sensibilidad
a +b
Esp.= Especificidad
d Vp(+)= Valor predictivo positivo
Vp (−) = *100
c+d Vp(-)=
)= Vaor predictivo negativo
TABLAS
62
63
64
65
EJERCICIOS
• Supóngase que un investigador está interesado en obtener una estimación
del nivel promedio de una enzima en cierta población de seres humanos con un 95%
de confianza. El investigador toma una muestra de 10 individuos, determina el
nivel de la enzima en cada uno de ellos y calcula la media muestral X= 22. Además,
se sabe que la variable de interés sigue una distribución aproximadamente normal
con una varianza de 45. Se desea estimar el valor de µ
• Se desea estimar la concentración media de amilasa en suero de una
población sana. Las mediciones se efectuaron en una muestra de 15 individuos
aparentemente saludables, con una distribución normal. La muestra proporcionó
una media de 96 unidades/100ml y una desviación estándar de 35 unidades/100ml
la varianza poblacional se desconoce.
• Suponiendo que la población de las concentraciones de amilasa en suero, a
partir de la cual se extrajo una muestra de tamaño 15, tiene una distribución
normal. Construir el intervalo de confianza del 95% para σ2, sabiendo que el valor
de s2 = 1225.
• El IMSS realizó investigaciones sobre los tipos de circulación sanguínea en el
miocardio a personas en el ejido el Edén en el que obtuvo datos con una muestra
representativa de n=25 con enfermedad de la arteria coronaria encontrando una
desviación estandar de 1.03, presentando una distribución normal. Construir
66
intervalos de confianza para la desviación estandar poblacional
• Suponer que se conoce que en una población de mujeres el 90% de las que
comienzan su tercer mes de embarazo han tenido algún cuidado prenatal. Si se
extrae de esta población una muestra aleatoria de tamaño 200 con distribución
normal, ¿Cual es la probabilidad que hayan tenido cuidados prenatales?
• Los datos que presentó un laboratorio de análisis clínicos respecto a la
fórmula eritrocitica requieren de parámetros que sean representativos de la
población a la que prestan sus servicios tanto el químico como el médico, ya que de
ello depende que la población reciba la atención y tratamiento adecuado en caso de
ser necesario. Estos parámetros son diferentes para cada población considerando
que cada uno posee características propias como son la estructura socioeconómica,
su educación, su cultura, sus hábitos, sus costumbres y su situación geográfica.
• El recuento de glóbulos blancos de una muestra de 10 hombres con algún
tipo de leucemia produjo una varianza de 25,000,000. Construir los intervalos de
confianza del 95% para δ2 y δ.
• Se midieron las concentraciones de hemoglobina en 16 animales infestados
con garrapata, registrándose los siguientes valores: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0,
17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8, 17.5. Construir los intervalos de
confianza del 95% para δ2 y δ.
• En un estudio sobre los tiempos de circulación sanguínea en el miocardio,

obteniéndose los tiempos de circulación aparente en una muestra de 30 pacientes
con patología en la artería coronaria. La varianza de la muestra fue de 1.03.
Construir los intervalos de confianza del 95% para δ2 y δ.
• Se llevo a cabo el estudio en 16 municipios de la costa de Chiapas; se tomó
una población de 30 individuos para cada sexo escogiendo 2 de cada municipio,
prsentando una distribución normal. Las x y la s en la muestra en hombres y
mujeres fueron:
x s SEXO
4.9x106 357,771 Hombres
4.2x106 312,418 Mujeres
Se desea conocer el intervalo de confianza para la población tomando en cuenta los
datos de la muestras en hombres y mujeres (se tiene un 99% de confianza).
• Como parte de una investigación nutricional se desean saber cuales son los
valores en los que se encuentra la media de glucosa, colesterol, triglicéridos y ac.
Urico, en estudiantes de la facultad de Ciencias Químicas. Para lo cual se tomo un
na muestra de 24 personas completamente al azar. Suponiendo que los datos
presentan una distribución normal, ¿cual es el intervalo de confianza para la media
poblacional de cada analito?
glucosa colesterol trigliceridos ac. Urico
67
1 86 187 28 6
2 81 166 115 7
3 80 179 189 6
4 95 197 126 1
5 84 166 150 3
6 99 186 111 5
7 110 145 83 8
8 108 191 80 6
9 102 179 155 5
10 98 184 155 2
11 97 172 47 6
12 103 190 56 1
13 81 193 148 1
14 86 170 18 6
15 96 183 53 7
16 107 144 149 6
17 81 178 61 2
18 87 160 120 4
19 95 146 139 1
20 103 181 150 6
21 108 174 10 8
22 87 151 54 3
23 102 165 24 6
24 86 185 47 1
• El hospital de cancerología en la Ciudad de México ha realizado un estudio

acerca del peso en onzas de tumores malignos extraídos a 37 pacientes, con
distribución normal. Se desea saber si la media poblacional de hombres y la media
poblacional de mujeres son diferentes. Cuando se considera un 95% de confianza y
la σ1 = 4.85 y la σ2 = 2.65, respectivamente.
HOMBRES MUJERES
30 31 32 29 30 33 33 26
35 32 31 31 29 28 32 25
25 25 29 33 27 29 27
28 33 28 27 26 30 28
27 36 30 28 34 31 27
n1 = 20 n2 = 17
• Los pacientes con artritis reumatoide presentan el mayor riesgo de
desarrollar osteoporosis, la razón de ello no se conocen en parte a las dificultades
para evaluar cuantitativamente el metabolismo y contenido mineral del huso.
Weisman y sus colaboradores (1986) midieron los valores de calcitocina humana
(HCT) en varones y mujeres con artritis reumatoide y en sujetos control igualados
en cuanto a edad y sexo que se eligieron entre un grupo de voluntarios sanos. Se
quiere comprobar que la media poblacional de mujeres y la de hombres son
diferentes (ambas presentan distribución normal). 68
HOMBRES MUJERES
33 35 35 35 45 46 46 45
35 31 35 35 45 47 47 48
31 33 34 35 48 48 45 47
33 34 35 47 49 48
32 32 37 45 45 49
35 35 35 45 46 45
34 34 33 48 48 46
31 33 32 48 49 47
31 31 32 49 47 49
35 35 33 47 45 48
n1 = 33 n2 = 33
• En una población se ha padecido, de problemas en niveles sanguíneos
(leucocitos) entre el año 2003 y 2004 dicho mal afecta a jóvenes de 18 – 25 años de
edad, dicho estudio hecho en la ciudad de Tapachula a los márgenes de esta. Se
desea saber si la µ es > a 4000 , con un 95 % de confianza. La población presenta
una distribución normal
Niveles de leucocitos
3500 1500 2500 2500 4500 2500
2500 4500 2500 4500 2500 4500
3500 2500 3500 4500 3500 3500
4500 4500 4500 3500 4500 3500
4500 3500 3500 2500 3500 2500
• A continuación se muestra una tabla indicando la variación de la

Temperatura en algunas regiones del estado de Chiapas de hace varios años a la
fecha la temperatura de la tierra a aumentado su temperatura debido a cambios
externos climáticos como el fenómeno del niño por tal motivo un grupo de
climatólogos predice que la variación de hace unos años al actual de que aumenta.
Las lecturas presentan una distribución normal
• Helmerich y colaboradores (1987) dirigieron un estudio para evaluar el
riesgo de trombosis venosa profunda en relación con el uso de anticonceptivos
orales. Mostraron interés especial en el riesgo relacionado con una dosificación baja
(menos de 50 MG de estrógeno) y circunscribieron sus estudios a 30 mujeres
menores de 50 años de edad, de las cuales 12 presentaron la enfermedad. Los datos
arrojados por la Secretaria de Salud indican que 9 de cada 30 mujeres encuestadas
han presentado la enfermedad. La población presento ua distribución normal
• En trescientos pacientes deseamos investigar los efectos de dos tratamientos
sobre los tiempos medios de recuperación de pacientes con cierta enfermedad. Estos
300 pacientes se dividieron aleatoria mente en 2 grupos iguales, presentandouna
- El primer grupo de 150 pacientes, cuyos elementos recibieron un tratamiento
normal, 110 se recuperaron en un plazo de 5 días.
- El otro grupo de 150 personas que se trato con un nuevo método, 86 se
69
recuperaron en 5 días
• Se estudia a dos poblaciones de diferentes grupos etnicos en el estado de
Chiapas (altos y costa) y se desea saber si sus niveles de colesterol son iguales, para
lo cual se hizo el estudio que arrojo los siguientes resultados
Altos Costa
1 187 194
2 166 155
3 179 172
4 197 140
5 166 181
6 186 141
7 145 179
8 191 188
9 179 156
10 184 152
11 172 170
12 190 171
13 193 174
14 170 174
15 183 173
16 144 168
17 178 168
18 160 149
19 146 176
20 181 165
21 174 165
22 151 160
23 165 142
24 185 142
Diseño Completamente al Azar

1. Los niveles de estrógenos (E4) en mujeres durante la ovulación es de 280
pg/ml en promedio. En un estudio se les determino los niveles de E4 a mujeres de 3
distintas edades (20, 30 y 40 años aprox.), dando como resultado los valores que en
la siguiente tabla se presentan:
20: 437, 380, 400, 420, 350, 370, 400.
30: 250, 300, 320, 325, 290, 270.
40: 122, 180, 200, 150, 190.
¿Influye de alguna forma la edad en la producción de E4? Explique
2. Se evalúa un tratamiento con la hormona T3 en pacientes con problemas de
estatura a 3 diferentes dosis. La población fueron varones con edades de los 18 a los
25 años. se midió en “cm” el aumento de estatura dando como resultado los 70
siguientes datos al año de estar con el tratamiento
T1 5, 7, 4, 5, 5.
T2 4, 4, 5, 6, 6, 4.
T3 4, 5, 7, 6, 7.
¿Existen diferencias significativas en la ganancia de altura entre los
tratamientos? Explique
3. El ruido producido por el motor de un vehículo no debe de exceder los 30
decibeles. 4 compañías indican que sus motores son los que poseen los índices más
bajos de contaminación sonora (ruido), para tal efecto se tomaron muestras de
varios automóviles y los resultados se presentan en la siguiente tabla:
A 40, 45, 48, 36, 32.
B 38, 30, 47, 43.
C 48, 40, 40, 39, 35.
D 42, 41, 47, 48, 40
A que conclusión puede llegar. Explique
4. Se considera que la población joven de los países latinoamericanos se
concentra en los lugares más urbanizados. En un estudio en la República Mexicana,
se seleccionaron 3 sitios al azar siendo estos: Campeche, Guadalajara y Veracruz.
En los cuales se muestreo gente al azar, a la cual se les pregunto su edad, siendo los
resultados:
Guadalajara: 22, 36, 40, 18, 25.

Campeche: 32, 41, 56, 28, 37, 43.
Veracruz: 18, 25, 32, 14, 29.
A que conclusión llega con este estudio. Explique.
5. El promedio de la frecuencia respiratoria es de 12/min. en reposo. Se estudia
a un grupo de personas para determinar si la complexión es un factor en la
frecuencia respiratoria. Se tomaron muestras al azar de los 3 tipos de complexiones
y los resultados fueron los siguientes:
Delgados: 12, 13, 14, 15, 14.
Medianos: 13, 12, 12, 14, 13.
Gruesos: 16, 15, 14, 15.
Cual es su conclusión. Explique.
Diseño de Bloques al Azar

1. Tres empresas (A, B y C) concursan para venderle a la policía un equipo para
la determinación de alcohol en el aliento. Los equipos son de diferentes precios, por
lo que se hace una prueba con un equipo de cada compañía para determinar si
existe diferencia entre estos. La prueba consiste en la medición de metanol (Valor
de Referencia < 0.80 p.p.m.) al personal de oficina de la policía de diferentes
edades. Los resultados obtenidos fueron: 71
Edades Empresas
A B C
I 0.90 0.80 0.70
II 0.70 0.70 0.60
III 0.70 0.60 0.80
IV 0.60 0.70 0.70
• Existen diferencias en las mediciones de metanol con los equipos. Explique
2. El nivel máximo en la atmósfera de dióxido de azufre (SO2) recomendado por
la OMS es de 40 gr/m3. Se considera al Distrito Federal la ciudad más
contaminada del país; para comprobarlo se toman muestras de 4 de las ciudades
con mayor número de habitantes del país (Distrito Federal, Monterrey,
Guadalajara, Tijuana) durante una semana y se obtuvieron los siguientes
resultados:
Días Ciudades
D.F. MTY GDA TJA
1 82 70 67 61
2 90 74 49 53
3 71 82 54 48
4 60 68 72 45
5 75 75 94 67
6 100 90 98 62
7 110 88 85 49
• En base a los resultados obtenidos concluya. Explique
3. La presión arterial promedio de un individuo es de 100 (80-120). Se toman

muestras de las tres zonas del estado (Altos, Centro y Costa) a individuos
seleccionados al azar de diversas edades y se les mide la presión arterial para
determinar si la altitud a la que viven influye en está presión. Los resultados
obtenidos son:
Edades Zonas
ALT CEN COS
I 110 95 100
II 115 98 98
III 105 102 94
IV 108 104 99
V 104 100 92
• ¿Es la altitud un factor que influya en la presión arterial de los individuos?
Explique.
• ¿Es la edad un factor que influya en la presión arterial de los individuos?
Explique.
En base a lo anterior concluya.
4. En la Ciudad de México el número de defunciones por mes atribuidas a la
72
contaminación ambiental son de aproximadamente 1000. Se hace un estudio en tres
ciudades del país (Mérida, Oaxaca y Tijuana) para determinar si el índice de
mortalidad por efecto de la contaminación es el mismo entre las diferentes regiones
del país. Para tal efecto se registraron el número de defunciones (por
contaminación) por mes durante cinco meses, obteniéndose los siguientes datos:
Meses Ciudades
MDA OAX TJA
I 400 357 800
II 300 421 725
III 600 480 1005
IV 457 300 930
V 525 500 915
• ¿Fuera de la Ciudad de México los índices de mortandad son parecidos entre
las diferentes regiones de la República? Explique y concluya.
5. Un experimento sobre adicciones se realizo en una población de adultos
farmacodependientes con diferentes niveles de adicción y de diferentes edades a los
cuales se les retiro la droga para establecer el número de días que lograban
aguantar sin el consumo de esta. Los resultados fueron los siguientes:
Edades Niveles de Adicción

Alt Med Baj
I 12 14 15
II 10 8 13
III 12 10 10
IV 8 8 9
V 4 5 7
• ¿Existe diferencia para aguantar la abstinencia del consumo de droga de
acuerdo a los niveles de adicción? Explique.
• ¿Existe diferencia para aguantar la abstinencia del consumo de droga de
acuerdo a las diferentes edades considerando que se tienen agrupadas de menor a
mayor edad? Explique
Diseño en Cuadrado Latino

1. Se evalúa un nuevo combustible (gasolina + alcohol) para automóviles, por lo
que se hace una evaluación con tres marcas distintas de autos (A, B y C), con tres
diferentes motores (I, II y III) por marca. Para la prueba se usan 3 diferentes
concentraciones (t1, t2 y t3) de alcohol en la gasolina. Obteniéndose los resultados
en rendimiento (km/lt), siendo estos: 73
Motor Marcas
A B C
I t1-12.0 t2-14.0 t3-13.0
II t2-13.5 t3-14.2 t1-13.6
III t3-12.0 t1-10.0 t2-14.2
• ¿Existen diferencias entre las diferentes concentraciones de alcohol en el
rendimiento (km/lt)? Explique.
• ¿Existen diferencias entre las diferentes marcas de los autos en el
rendimiento (km/lt)? Explique.
• ¿Existen diferencias entre los diferentes motores en el rendimiento (km/lt)?
Explique.
2. Se evalúan cuatro vacunas (t1, t2, t3 y t4) contra la brucelosis en ganado
bovino de diferentes razas (A, B, C y D) y edades (I, II, III y IV). Se manejaron lotes
de 25 animales por raza y edad. Se evaluaron al año de la aplicación de las vacunas,
habiendo recibido un manejo Sanitario y Zootécnico normal. Se procedió a
cuantificar el número de animales vacunados que contrajeron la enfermedad,
obteniéndose los siguientes resultados
Edad Razas
A B C D
I t1-18 t2-16 t3-12 t4-21
II t4-22 t1-17 t2-18 t3-19
III t3-11 t4-17 t1-19 t2-17
IV t2-19 t3-18 t4-19 t1-20
• ¿Existen diferencias entre las diferentes Vacunas? Explique.
• ¿Existen diferencias entre las diferentes Razas? Explique.
• ¿Existen diferencias entre las diferentes Edades? Explique.
3. Se evalúan 4 diferentes insecticidas (t1, t2, t3 y t4) durante 4 semanas (I, II,
III y IV) en 4 especies de Triatominos (A, B, C y D). Los resultados obtenidos se
dieron en relación al número de triatominos encontrados muertos, siendo estos:
Semanas Especies
A B C D
I t1-12 t2-9 t3-6 t4-7
II t4-6 t1-14 t2-10 t3-4
III t3-5 t4-7 t1-11 t2-8
IV t2-9 t3-5 t4-7 t1-12 74
• ¿Existen diferencias entre los diferentes Insecticidas? Explique.
• ¿Existen diferencias entre las diferentes Especies? Explique.
• ¿Existen diferencias entre las diferentes Semanas? Explique.
4. Se evalúan 3 medidas contra la contaminación ambiental (t1, t2, y t3), en
diversas ciudades del país (A, B y C), durante 3 semanas (I, II y III). El parámetro a
medir fue el S02 en g/m3, (Índice recomendado 40g/m3) los resultados obtenidos
fueron los siguientes:
Semanas Ciudad
A B C
I t1-80 t2-69 t3-71
II t3-93 t1-83 t2-72
III t2-85 t3-88 t1-69
• ¿Existen diferencias entre las diferentes Medidas contra la contaminación?
Explique.
• ¿Existen diferencias entre las diferentes Ciudades? Explique.
• ¿Existen diferencias entre las diferentes Semanas? Explique.
5. Se prueba una hormona sintética de la somatotropina bovina (STB), la cual

es inductora de la producción de leche. Se prueba en un lote de vacas cebú con
edades de 3, 4 y 5 años y con pesos de 400, 450 y 500 kg a 3 dosis diferentes de la
STB. Los resultados fueron los aumentos en la producción de leche en Kg., siendo
estos:
Edad Pesos
400 450 500
3 t1-0.5 t2-0.8 t3-1.2
4 t3-1.3 t1-1.6 t2-1.8
5 t2-2.0 t3-2.5 t1-2.5
• ¿Existen diferencias entre las diferentes Dosis de STB? Explique.
• ¿Existen diferencias entre las diferentes Edades? Explique.
• ¿Existen diferencias entre los diferentes Pesos? Explique.
PRUEBAS DE ASOCIACIÓN
1.- Una industria farmacéutica probó Vo curados No
un nuevo fármaco para el control de la curados
fiebre causado por el resfriado en 100 Machos 20 30 50 75
Hembras 28 22 50
ratones. Se está interesado saber si el 48 52 100
sexo influye en el metabolismo del
fármaco, para ello se dividió la población equivalentemente obteniéndose:
2.- Un químico realiza la prueba para la Vo Plantas Plantas

certificación de un nuevo agroquímico para logradas no logradass
el control de la plaga de la sigatoca en el EQ-730 219 81 300
plátano de la variedad gran enano. Para ello ZR-1 201 99 300
420 180 600
la comparó con otro agroquímico ya
certificado, el EQ-730. En un sembradío de 300 plantas para cada agroquímico se
arrojaron los siguientes resultados:
3.- Se desea saber si el síndrome de Vo Con Sin

S.Down S.Down
Down está en función del sexo, para ello
Hombres 19 31 50
se realizó un estudio en un hospital de los Mujeres 23 27 50
Estados Unidos de América, 42 58 100
encontrándose que en los nacimientos de
este año:
4.- Se desea saber si la sensibilidad y Rosa de Rivanol

Bengala
especificidad de la prueba de brucelosis,
Positivo Negativo
por el metodo rosa de bengala, Positivo 6 6 12
comparandola con la prueba confirmativa Negativo 2 11 13
de rivanol, los resultados ueron los 8 17 25
siguientes:
5.- Se desea saber la concordancia Huixtla Tapachula

entre el resultado de 2 laboratorios de
Positivo Negativo
patología animal, uno en Tapachula y Positivo 12 6 18
otro en Huixtla, sobre la prueba de Negativo 3 9 12
tuberculosis, los resultados fueron los 15 15 30
siguientes:
Un estudio de 190 embarazos proporcionó los siguientes

datos sobre la relación que existe entre la hipertensión de la
madre y cierta complicación del embarazo.
2.- Una muestra de 150 portadores
de Hepatitis C, y una muestra de 500 no portadores, 76
revelaron la siguiente distribución de los grupos sanguíneos.
3.- A un grupo de 350 adultos, se les con problemas de

sobrepeso se les pregunto si llevaban o no dieta. Las
repuestas en base al sexo son la
las siguientes:
BIBLIOGRAFÍA
• BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE
EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS.
• DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA.
• ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA.
MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V.
• JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS.
• MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS
QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL.
• MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA
SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL.
• PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS,
TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V.
• SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO
INTERAMERICANO.
• STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS,
MÉXICO, ED. MC GRAW HILL,
• WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED.
MCGRAW-HILL. 77

Bioestadistica MARF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Bioestadistica MARF

Transféré par

Droits d'auteur :

Formats disponibles

Bioestadística Elemental en el Área de la Salud

Miguel Ángel Rodríguez Feliciano

Miguel Ángel Rodríguez Feliciano

¿Por qué la Bioestadística?

¿Usaron la estadística Galileo, Newton y Einstein?

En el area de la salud y en particular en el trabajo que se realiza en el Laboratorio

Universidad Autónoma de Chiapas

UNIDAD III.- REGRESIÓN Y CORRELACIÓN LINEAL

FORMA DE EVALUACIÓN Y ACREDITACIÓN:

RELACION DE PRACTICAS DE BIOESTADÍSTICA

UNIDADES ESTADÍSTICAS DE MUESTREO

De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven

CARACTERISTICAS VENTAJAS INCONVENIENTES

Aleatorio Se selecciona una • Sencillo y de Requiere que se posea

Por su Simple Mide un solo indicador

CARACTERÍSTICAS DEL ESTUDIO Tipo de estudio

Interferencia Periodo de Evolución del Comparación de

Observacional Prospectivo o Transversal Descriptivo • Encuesta

TITULOS DE CUADROS Y GRAFICAS

Representación gráfica de esta función de densidad

a) Distribuciones normales con distinta b) Distribuciones normales con

Función de distribución F(x) es el área sombreada de esta gráfica

Representación gráfica la función Z

a la variable Z se la denomina variable tipificada de X,, y a la curva de su función de

Característica de la distribución normal tipificada (reducida, estándar)

Manejo de Tablas —Casos Más Frecuentes—

Intervalos de confianza para la Media de una Población

EJEMPLO: Un laboratorio desea estimar con el 99% de confianza la media del

Intervalos de confianza para Proporciones de una Población

EJEMPLO: Se realiza un estudio sobre el uso del preservativo en jóvenes

Intervalos de confianza para la Media de una Población con Varianza Desconocida

t 0.05 = 2.447 x = 10 S = 0.283

Intervalos de confianza para la Varianza de una Población

EJEMPLO: En el muestreo a 10 persona de la población de Unión

0.135 < σ 2 < 0.953

Una prueba de hipótesis estadística es una conjetura sobre un parámetro de una o

La distribución apropiada de la prueba estadística se divide en dos regiones: una

Z 0.995 => p = 2.58

2.- Ho: µ ≥ µo Ha: µ < µo

Z 0.01 => p = -2.33

3.- Ho: µ ≤ µo Ha: µ > µo

Prueba de Hipótesis para: Media Poblacional con Varianza Conocida

EJEMPLO: Un laboratorio estima con el 99% de confianza que la

Ho: µ = 90 Ha: µ ≠ 90 Z 0.01 = 2.58

Prueba de Hipótesis para: Media Poblacional con Varianza Desconocida

Ho: µ = 11 Ha: µ ≠ 11 t 0.05 = 2.447 ܺത = 10 S = 0.283

No se acepta Ho, hay evidencia que

Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con

EJEMPLO: Se realiza un estudio en la comunidad de Mazatán, Chiapas, sobre los

Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con

Dependiendo de la aceptación o no aceptación de la Hipótesis nula (Ho), será la

(n1 − 1) S12 + (n2 − 1) S 22

EJEMPLO (Varianzas Iguales):

(n1 − 1) S12 − (n2 − 1) S 22 21(40) 2 − 14(35) 2

EJEMPLO (Varianzas distintas): En el ganado bovino los niveles de glucosa oscilan

Prueba de Hipótesis para: Muestreo a Partir de Poblaciones que no Presentan

Cuando se extraen dos muestras aleatorias simple

EJEMPLO: Se realiza un estudio en 75 pacientes con infecciones gastrointestinales

Prueba de Hipótesis para: Comparaciones por Parejas

EJEMPLO: Se evalúan dos

El efecto de las dietas no es el mismo en el incremento de peso de las personas.

Prueba de Hipótesis para: Proporciones –una población–

0.41 − 0.50 − 0.09