Vous êtes sur la page 1sur 51

ESCUELA POLITCNICA DEL EJRCITO

MAESTRA EN GERENCIA HOSPITALARIA


MDULO:

Estadstica - Bioestadstica

1. DATOS INFORMATIVOS DEL MDULO


N de horas de trabajo en el aula:
N de horas de trabajo fuera del aula:
N crditos:
4

32
32

FECHAS
1
2

Sbado 02 y Domingo 03
Junio 2012
Sbado 16 y Domingo 17
Junio 2012

HORARIO
08h00 a 18h00
08h00 a 18h00

2. DATOS INFORMATIVOS DEL DOCENTE


Nombre y Apellidos: SERGIO ALBERTO CASTILLO PAEZ
Formacin acadmica:
- Ingeniero matemtico, mencin Estadstica, Finanzas y Gestin
Empresarial (Escuela Politcnica Nacional)
- Magister en Docencia Universitaria (ESPE)
- Especializacin Superior en Finanzas (Univ. Andina Simn Bolivar)
Experiencia profesional y docente:
- Asesor estadstico y financiero en varios proyectos de ingeniera y medio
ambiente: CCICEV-EPN, DED-GTZ, Tesalia, Fundacin METIS, etc.
- Gerente Tcnico de la Corporacin de Estudios y Desarrollo
Cooperativo, coordinando y ejecutando proyectos de capacitacin
profesional en Panam, Italia, Argentina, Chile, etc.
- Ha colaborado como docente en varias universidades: Universidad
Estatal de Milagro, Universidad Politcnica Salesiana, Universidad
Iberoamericana del Ecuador, Universidad Internacional SEK.
- Actual docente de la ESPE en el departamento de Ciencias Exactas, en
reas de Estadstica.
- Facilitador en temas relacionados a la Investigacin Cientfica y
Estadstica para docentes en UISEK, UNEMI, ESPE, etc.
Telfonos:

022-435-825, 099-319-366

Direccin electrnica: scastillop75@gmail.com


3. PRESENTACIN
1

En toda profesin, en especial en aquellas carreras relacionadas con la salud,


es de imperiosa necesidad un correcto manejo de datos e informacin. Esto a
su vez, implica conocer, manejar y validar aquellas herramientas y tcnicas que
permitan dar confiabilidad, tanto a la recoleccin de informacin como los
resultados que suelen encontrarse en estudios e investigaciones relacionadas
al rea de la salud. La estadstica, es una ciencia que nos ayuda para estos
fines, asegurando un correcto manejo de la informacin y un adecuado anlisis
e interpretacin de la misma, permitiendo a travs de tcnicas estadsticas
confiables, la toma de decisiones y comprobacin de hiptesis altamente
objetiva.
4. OBJETIVOS
GENERAL:
Aplicar eficientemente los conceptos, tcnicas y herramientas estadsticas en
actividades afines la gerencia hospitalaria y a la investigacin en salud.
ESPECFICOS:
- Comprender las nociones estadsticas y su relacin con los procesos de
investigacin cientfica
- Manejar tcnicas estadsticas apropiadas segn el propsito de
investigacin
- Analizar y sistematizar informacin en funcin de los resultados
estadsticos encontrados
5. COMPETENCIAS A DESARROLLAR EN EL POSGRADISTA
El participante al final del mdulo, estar en capacidad de:
-

Entender el proceso estadstico, sus variables y conceptos: y podr


reconocerlos y aplicarlos en problemas de investigacin cientfica y
administracin hospitalaria

Manejar conjuntos grandes de datos y poder resumir la informacin


inherente a los mismos, identificando aspectos relevantes por medio de
tcnicas de representacin de datos.

Utilizar paquetes informticos para la aplicacin eficiente de


herramientas estadsticas que le permitirn asegurar un eficiente control
y validacin de la informacin

Interpretar resultados y tomar decisiones con alto grado de confiabilidad


y transparencia estadstica

6. AGENDA DE TRABAJO

Primer da

CONTENIDOS

HORAS

Sbado 02 de Tema 1: Relacionando los conceptos estadsticos


Junio de 2012
- El proceso estadstico: Parmetro, poblacin, muestra,
estadstico, tipos de datos. La Estadstica Descriptiva e
Inferencial respecto a la Investigacin Cientfica

08h00 a 09h30
(1 hora, 30
minutos)

Tema 2: Organizando la informacin: Las tablas y


grficos estadsticos
- Las tablas de distribucin de frecuencia
- Los histogramas, ojivas y polgonos de frecuencia: su
importancia y caractersticas de uso
- Los grficos circulares: cundo se utilizan?

09h30 a 13h00
(3 hora, 30
minutos)

RECESO

13h00 a 14h00
(1 hora)

Tema 3: Resumiendo la informacin: La estadstica


descriptiva.
- Las medidas de tendencia central como valores
representativos: Promedio, Mediana, Moda. Su seleccin y
anlisis
- Las medidas de dispersin: Rango, Varianza y
Desviacin estndar. Su interpretacin y anlisis

14h00 a 18h00
(4 horas)

Segundo da

HORAS

Domingo 03 de Primera Evaluacin Parcial


Junio de 2012

08h00 a 09h00
(1 hora)

Tema 4: El manejo de la incertidumbre: Las


probabilidades
- Las probabilidades, sus tipos y usos.
- El clculo de probabilidades en funcin de las tablas de
frecuencias.
- Las probabilidades respecto a un conjunto: La
probabilidad marginal, conjunta y condicional

09h00 a 11h00
(2 horas)

Tema 5: Aplicaciones de probabilidades en excel


- Tablas y grficos dinmicos aplicados

11h00 a 13h00
(2 horas)

RECESO

13h00 a 14h00
(1 hora)

Tema 6: Analizando el comportamiento de los datos: 14h00 a 16h00


Introduccin a las distribuciones de probabilidad
(2 horas)
- Que son las distribuciones de probabilidad: ventajas de
analizar el comportamiento global
- Distribucin discretas: Binomial
- Distribuciones continuas: Caractersticas bsicas
Tema 7: La distribucin normal: El comportamiento
comn de los datos por excelencia
16h00 a 18h00
- Vdeo: La distribucin normal
(2 horas)
- La distribucin Normal: aplicaciones y forma de calcular

Tercer da
Sbado 16 de

HORAS
Evaluacin

de

orientacin:

Revisin

de

tareas 08h00 a 08h30

Junio 2012

individuales y grupales

(30 minutos)

Tema 8: De la muestra a la poblacin: las 08h30 a 10h00


distribuciones muestrales
(1 hora, 30
- El comportamiento de los estadsticos muestrales
minutos)
- El teorema del lmite central
- Aplicaciones para la media y la proporcin poblacional
Tema 9: Las estimaciones por intervalo
- Construccin de un intervalo de confianza
- Intervalos de confianza en muestras grandes
- Intervalos de confianza en muestras pequeas
- Intervalos de confianza para proporciones poblacionales

10h00 a 12h00
(2 horas)

Tema 10: Tcnicas de muestreo


- Introduccin al muestreo
- Muestreo probabilstico
- Muestreo no probabilstico

12h00 a 13h00
(1 hora)

RECESO

13h00 a 14h00
(1 hora)

Tema 11: Comprobacin de supuestos: Los contrastes 14h00 a 15h00


de hiptesis
(1 hora)
- La identificacin del proceso estadstico
- El proceso de las pruebas de hiptesis
- Aplicaciones
Tema 12: Pruebas para una poblacin
- Prueba Z: condiciones y anlisis
- Prueba t: condiciones y anlisis
- Pruebas para Proporciones poblacionales
- Pruebas de una y de dos colas

15h00 a 18h00
(3 horas)

Cuarto da

HORAS

Domingo 17 de Segunda evaluacin parcial


Junio de 2012

08h00 a 09h00
(1 hora)

Tema 13: Pruebas de comparacin para dos 09h00 a 13h00


poblaciones
(4 horas)
- Pruebas para muestreos pareados
- Pruebas para muestreos independientes: Caso 1, 2 y 3
- Pruebas de comparacin de proporciones
RECESO

13h00 a 14h00
(1 hora)

Tema 14: Pruebas Ji cuadrada y Anlisis de Varianza


- Prueba Ji cuadrada
- Pruebas F
- Anlisis de varianza de uno y dos factores

14h00 a 16h00
(2 horas)

Tema 15: Anlisis de correlaciones y regresiones


- Correlacin lineal
- Regresin lineal
- Proyecciones

16h00 a 18h00
(2 horas)

7. METODOLOGA
La metodologa estar basada en principios andraggicos con enfoque al
desarrollo de competencias en los tres niveles: cognitivo, procedimental y
actitudinal.
-

Se utilizarn tcnicas como exposiciones magistrales, apoyadas en el


uso de TICs con:
Presentaciones en powerpoint
Videos temticos
Consultas bibliogrficas
Batera de preguntas guas
Trabajos grupales
Resolucin de problemas afines a la temtica del curso
Manejo de Microsoft Excel como paquete informtico estadstico.
Trabajos individuales archivos prediseados para aplicacin especfica
de las tcnicas a estudiar.

8. POLTICAS DE EVALUACIN- ACREDITACIN-CALIFICACIN


Considerando la siguiente escala de evaluacin, sobre una nota total de 10
puntos:
Puntaje entre:
Calificacin
10,0 09,1:
A (Aprobado)
09,0 08,1:
B (Aprobado)
08,0 07,0:
C (Aprobado)
6,99 menos
D (Reprobado)
F (reprobado por inasistencia)
En base a esta escala, se realizarn las siguientes actividades de
evaluacin:
-

Trabajos grupales: Implican la resolucin de casos prcticos en Excel


Trabajos individuales: Es la entrega de consultas y deberes individuales
a realizar.
Pruebas parciales: Se tomar dos pruebas, cada una de 30 minutos.
Trabajo final: Implica la realizacin de un trabajo prctico, con bases de
datos generadas para el efecto.

La ponderacin de cada actividad es la siguiente:


-

Trabajos grupales:
Trabajos individuales:
Pruebas parciales:
Trabajo final:

2 puntos
2 puntos
4 puntos
2 puntos

9. BIBLIOGRAFIA

Rus Daz, Barn Lopez, Snchez y Parras, Bioestadstica: Mtodos y


aplicaciones,Universidad de Mlaga, Espaa
Pardo, Antonio; Ruiz, Miguel ngel y San Martn, Anlisis de datos I en
ciencias sociales y de la salud, 2009
Jack Levin, Fundamentos de Estadstica en la investigacin social,
Oxford University Press, Mxico
Daniel Pea y Juan Romo, Introduccin a la estadstica para las
ciencias sociales, Mc Graw Hill 1997, Espaa
Juan Fernandez Chavesta, Estadstica aplicada: Tcnicas para la
investigacin. Parte I 2da edicin. Editorial San Marcos, 1993, Per.
Juan Fernandez Chavesta, Estadstica aplicada: Tcnicas para la
investigacin. Parte II 2da edicin. Editorial San Marcos, 1993, Per.
Haroldo Elorza, Estadstica para las ciencias sociales y del
comportamiento, 2da edicin, Oxford University Press, Mxico
David Clark-Carter, Investigacin cuantitativa en psicologa, Oxford
University Press, 2002, Mxico
R. Sierra Bravo, Diccionario prctico de estadstica, Edit. Paraninfo,
1991, Espaa

TEMA 1: RELACIONANDO LOS CONCEPTOS ESTADSTICOS

Objetivo del tema a estudiar: Identificar los conceptos bsicos que definen a la Estadstica, el
proceso estadstico y su vinculacin con la investigacin cientfica:
Temas a tratar: El proceso estadstico: Parmetro, poblacin, muestra, estadstico, tipos de
datos. La Estadstica Descriptiva e Inferencial respecto al proceso estadstico
1. Qu es La Estadstica?
Es la ciencia que estudia la ordenacin y anlisis de datos muestrales y de las inferencias que
se puedan realizar sobre la poblacin.
La Estadstica se suele dividir en las siguientes reas de estudio:
- Estadstica Descriptiva: Es el estudio de la informacin obtenida a partir de un
conjunto de datos
- Probabilidades: Es el estudio de la incertidumbre y el comportamiento de los datos
- Estadstica Inferencial: Es el estudio de las comprobaciones de hiptesis y de los
comportamientos muestrales
IDEA: Para entender como funciona la Estadstica es necesario conocer El Proceso
Estadstico
2. PROCESO ESTADSTICO:
Poblacin (Parmetro)
Muestra
Estadstico
Estimador
muestral

Poblacin: Es el conjunto total de datos sobre el cual se


establecen las mediciones o la informacin a conocer. Debe
estar perfectamente delimitado (tiempo, lugar, caractersticas
especficas)
Parmetro: Es la informacin de la poblacin que se desea
conocer
Muestra: Es un subconjunto representativo de la Poblacin
Estimador o estadstico: Es la informacin relativa al
parmetro, obtenida a partir de la muestra
Error muestral: Es la diferencia entre el Parmetro y el
Estadstico

El proceso estadstico se basa en lo siguiente: Queremos conocer cierta informacin respecto a


la poblacin (parmetro), pero no podemos analizar a TODA la poblacin (por cantidad, tiempo,
dinero, etc.) Entonces, debemos tomar una muestra de dicha poblacin y a partir de esa
muestra obtener la informacin que queremos conocer (estadstico).
Pregunta 1: Cul es la informacin que se suele investigar en una poblacin? Existen
varios tipos de parmetros, pero generalmente se trabaja con 2: La media poblacional
(promedios) y la proporcin poblacional (%)
Pregunta 2: Cmo se debe medir la informacin? Para medir la informacin, debemos
identificar el tipo de dato que se va a obtener al realizar el muestreo
TIPOS DE DATOS O VARIABLES
Numricos:
Discretos: Se expresan
por nmero enteros
Se
expresa
por Continuos: Se expresa
medio de nmeros
por nmeros reales
Categricos:
Ordinales:
Son
categoras que tienen un
orden implcito
Se
expresa
por Nominales:
Son
medio de categoras categoras que NO tienen
(se miden por %)
orden implcito

Procesos de conteo: Nro. Enfermos por


paludismo, nro nios desnutridos, etc.
Procesos de medicin: tiempo de reaccin
a una vacuna, peso del paciente, etc.
Implican nombre o categoras de escala:
Ejm: Bueno, Regular, Malo.
Implican nombres o categora sin escala o
priorizacin:
Sexo,
Estado
civil,
Procedencia, etc.

IDEA: El parmetro es quien determina el tipo de dato que debemos utilizar. Por lo general: Si
queremos estimar , se utilizan datos numricos; Si utilizamos datos categricos, por lo
general se trata de estimar .
Estos datos, se obtienen a partir de las muestras, y deben ser organizados, resumidos,
representados grficamente y se debe sistematizar toda su informacin. Las tcnicas que se
utilizan para este proceso provienen de la Estadstica Descriptiva
Pregunta 3: Es la informacin obtenida en una muestra igual a la informacin que
representa a toda la poblacin? La respuesta es NO. Porque no sabemos que tan confiable
es la muestra. La diferencia entre lo que nos dice la muestra y el valor real de la poblacin, es
lo que se conoce como Error Muestral.
Se puede decir que La Estadstica es la ciencia de la incertidumbre, eso significa que nunca
estaremos 100% seguros de nuestros resultados (a menos que trabajemos con toda la
poblacin). Pero la estadstica nos permite acercarnos al valor real de la poblacin, utilizando
tcnicas que aumentan la confiabilidad de los resultados, tomando en cuenta el
comportamiento de los datos de la poblacin.
Pregunta 4: Qu implica conocer el comportamiento de los datos de la poblacin?
Desde el punto de la estadstica, significa determinar que tan probable es haber obtenido la
informacin de la muestra. Las tcnicas para estudiar el comportamiento de una poblacin
provienen de las Probabilidades
Pregunta 5: Si todas las muestras tienen errores, como podemos determinar el
parmetro? Calculando los estadsticos muestrales (con estadstica descriptiva), conociendo el
comportamiento de la poblacin (asignando probabilidades) y controlando los errores
muestrales, podemos estimar o aproximarnos al valor real del parmetro. Las tcnicas para
controlar los errores muestrales y estimar parmetros poblacionales a partir de los estadsticos,
es el objeto de estudio de la Inferencia Estadstica
IDEA: Para un correcto anlisis e interpretacin de resultados, es necesario que en todo
proceso de investigacin se identifiquen todos los elementos del proceso estadstico:
Poblacin, parmetro, muestra, estadstico y tipo de dato utilizado

El primer paso en el estudio de la estadstica, es organizar, resumir y calcular los


estadsticos muestrales de una muestra. Es decir, primero debemos dominar las tcnicas
relativas de la estadstica descriptiva.

TEMA 2: ORGANIZANDO LA INFORMACIN


Objetivo del tema a estudiar:
Manejar tcnicas que permitan resumir y representar grficamente la informacin de una
muestra.
Temas a tratar:
- Las tablas de distribucin de frecuencia
- Los histogramas, ojivas y polgonos de frecuencia: su importancia y caractersticas de uso
- Los grficos circulares y otros grficos especiales: cundo se utilizan?
IDEA: Antes de determinar que tcnica se va a utilizar se debe identificar el tipo de dato:
numrico o categrico

1. TABLAS DE DISTRIBUCION DE FRECUENCIAS


Permiten exponer la informacin recogida en la muestra, de forma resumida o agrupada. Para
esto se deben construir clases:
Clases: Implica agrupar los posibles resultados de una variable en intervalos. Las clases
deben forman un sistema exhaustivo y excluyente

EXHAUSTIVO: No podemos olvidar ningn posible valor de la variable


Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?
EXCLUYENTE: No se pueden presentar dos resultados simultneos:
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

IDEA: Las clases se construyen en relacin a los tems desarrollados en los instrumentos de
recoleccin de informacin (preguntas abiertas, cerradas de encuestas, entrevistas, guas, etc.)
PASOS PARA CONSTRUIR UNA TABLA DE FRECUENCIA PARA VARIABLES
NUMERICAS:
1. Identificar el nmero de clases a construir (nc)
2. Identificar el tamao de la muestra n, y calcular el Mximo y el Mnimo.
3. Calcular el Rango R = max min
4. Calcular el Intervalo de clase IC = R / nc
5. Construir los lmites inferiores de clase:
a. Limite inferior de la 1ra clase = Mnimo
b. Limite de la clase siguiente = Limite de la clase anterior + IC
6. Los limites superiores se calculan tomando en cuenta que los lmites superior e
inferior no se superpongan
7. Para cada clase, se calculan las:
Frecuencias absolutas: Contabilizan el nmero de datos en cada clase
Frecuencias relativas (porcentajes): Idem, pero dividido por el tamao
muestral (n)
Frecuencias acumuladas: Se va acumulando el resultado de la clase actual y
todas las anteriores. Puede acumularse la frecuencia absoluta o la frecuencia
relativa
Lim. Inf.
Min
Min + IC
Min + 2 IC
.

Lim. Sup

Frec. Abs

Frec. Abs. Ac.

Frec. Relat. (%)

Frec. Relat Ac.

Max (aprox)

F1
F2
F3
.

F1
F1 + F2
F1 + F2 + F3
..

%1 = F1/n
%2 = F2/n
%3 = F3/n
..

%1
%1 + %2
%1 + %2 + %3

suma = n
Suma= 100%
IDEA: Las clases en variables categricas estn determinadas por las mismas categoras. No
se calculan limites, pero si las frecuencias
Qu informacin nos dan las frecuencias?
- Las frecuencias absolutas: nos indica cuantos datos pertenecen a cada clase e permite
identificar las clases ms relevantes
- Las frecuencias relativas: expresan en % la composicin de la muestra por clases, y
comparar informacin entre clases
- Las frecuencias acumuladas: permiten observar la acumulacin desde la primera clase.
Es muy buena para observar tendencias de acumulacin. (Principio de Pareto)

2. HISTOGRAMAS, POLIGONOS Y OJIVAS DE FRECUENCIA


Puesto que la tabla o matriz de los datos no muestra las cualidades de los datos, se usan
representaciones grficas que ayudan a captar tendencias, apreciar caractersticas y establecer
modelos probabilsticos de manera global.
Los diagramas y grficos que comnmente son utilizados, para organizar las observaciones de
modo que entendamos mejor la informacin que contienen y apreciemos sus caractersticas se
presentan a continuacin:
El Histograma es un grfico de barras en el que se presentan las frecuencias absolutas o las
relativas (en porcentaje). En el caso de datos numricos, la longitud de cada clase
(subintervalo) es igual a la extensin o rango de los datos dividido para el nmero de clases.

La curva dibujada sobre las barras, se denomina Polgono de frecuencias, y se realiza


uniendo los puntos medios de cada barra por medio de lneas rectas. Permite analizar el
comportamiento de los datos en la muestra.
El segundo grfico observado se denomina La Ojiva de frecuencias, y se construye con las
frecuencias acumuladas (absolutas y relativas). Este grfico permite analizar tendencias como
grupo. Si las clases estn ordenadas de mayor a menor frecuencia, se puede aplicar el
Principio de Pareto.

10

3. GRAFICOS CIRCULARES Y GRAFICOS ESPECIALES


Grfico de pastel: es una forma de resumir un conjunto de datos categricos. Es un crculo
dividido en segmentos, donde el rea de cada uno de los segmentos es proporcional al nmero
de casos en la categora correspondiente.
Cmo se construye? Para conocer el ngulo (medido en grados) podramos aplicar
una simple regla de tres (proporcin): si el nmero total de datos corresponde a 360
grados, el nmero ACUMULADOS de casos en una determinada categora, a cuntos
grados le corresponde?.
Grfico de barras: los datos categricos se exhiben mediante un nmero de rectngulos, del
mismo ancho, cada uno de los cuales representa una categora particular. La longitud (y por lo
tanto el rea) de cada rectngulo es proporcional al nmero de casos en la categora que
representa. Es similar a un histograma, donde cada categora es una clase.
Utilizacin: Se prefiere realizar el grfico con las barras horizontales especialmente
cuando a continuacin se va a representar una pirmide, desagregando la poblacin en
dos categoras, por ejemplo considerando el sexo, es decir la poblacin de hombres a
la izquierda y de mujeres a la derecha.
Pictogramas: son grficos fciles de entender, en donde se deja en evidencia la frecuencia de
cada clase.

11

TEMA 3: RESUMIENDO LA INFORMACION: LA ESTADISTICA


DESCRIPTIVA
Objetivo del tema a estudiar:
Conocer los diferentes estadsticos muestrales y sus propiedades de uso.
Temas a tratar:
- Las medidas de tendencia central como valores representativos: Promedio, Mediana, Moda:
su seleccin y anlisis
- Las medidas de dispersin: Rango, Varianza y Desviacin estndar. Su interpretacin y
anlisis

1. RECORDANDO EL PROCESO ESTADISTICO

Parmetro: Es una cantidad numrica calculada sobre una poblacin


La altura media de los individuos de un pas
La idea es resumir toda la informacin que hay en la poblacin en unos pocos
nmeros (parmetros).

Estadstico: dem (cambiar poblacin por muestra)


La altura media de los que estamos en esta aula.
Somos una muestra (representativa?) de la poblacin.
Si un estadstico se usa para aproximar un parmetro tambin se le suele
llamar estimador.

Normalmente nos interesa conocer un parmetro, pero por la dificultad que conlleva estudiar a
*TODA* la poblacin, calculamos un estimador sobre una muestra y confiamos en que sean
prximos (Nunca son iguales debido al error muestral). Ms adelante veremos como elegir
muestras para que el error sea confiablemente pequeo.
Qu informacin podemos obtener de una muestra?

Medidas de tendencia central: Indica el valor medio o representativo de los datos


Medidas de dispersin: calculan de donde a donde van los datos (mnimos y mximos),
mide concentracin de los datos respecto a su valor representativo
Medidas de Posicin: Dividen a la muestra en sectores con la misma cantidad de individuos.
Medidas de forma: Indican si los distribuciones de los datos (lase frecuencias) tienen una
determinada forma.
IDEA: Para procesos futuros de estimacin de parmetros, se estudiar a mayor profundidad a
las medidas de tendencia central y de dispersin

12

2. MEDIDAS DE TENDENCIA CENTRAL EN UNA MUESTRA


IDEA: Son los valores alrededor de los cuales, los datos tienden a agruparse. Son
estimadores de la media poblacional

Media o Promedio: Es la media aritmtica (promedio) de los valores de una variable.


Suma de los valores dividido por el tamao muestral.

X
i

Media de 2,2,3,7 es (2+2+3+7)/4=3,5


Conveniente cuando los datos se concentran simtricamente con respecto a
ese valor. Muy sensible a valores extremos. (datos atpicos)
Centro de gravedad de los datos

Mediana: Tambin conocida como percentil 50, es el valor en cual el 50% de los datos
estn bajo ella y el otro 50% estn sobre ella. Su posicin se encuentra con la frmula:
Posicin Mediana = (n+1) / 2
Mediana de 1,2,4,5,6,6,8 es 5
Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimtricos. No es sensible a valores
extremos.
Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7!

Moda: Es el/los valor/es donde la distribucin de frecuencia alcanza un mximo. Es el


valor o los valores mas frecuentes. Su uso es restringido porque pueden existir varias
modas o su frecuencia puede ser irrelevante con respecto a la frecuencia de los otros
datos, en especial cuando los datos son de tipo continuo.
Entre promedio mediana y moda escojo el promedio siempre y cuando no haya
datos atpicos o extremos luego escojo la mediana porque es ms estable que el
promedio. Los datos atpicos solo se eliminan si son error o dependiendo de la
naturaleza de la investigacin. La moda puede no existir por lo tanto no se la
utiliza ya que no es estable. Se la utiliza mas como clase modal en variables
cualitativas. Unimodal, bimodal o multimodal.

13

Altura mediana

IDEA: Para identificar los datos atpicos, podemos guiarnos por alguna tcnica grfica
desarrollada en el tema anterior o utilizando las medidas de dispersin.

Cmo identificamos cul medida de tendencia central utilizar? La medida de tendencia


central por excelencia es la media o promedio, siempre y cuando no existan datos atpicos. Si
estos existen, se seleccionar la mediana. La moda tiene mejores aplicaciones en el caso de
datos categricos.

3. MEDIDAS DE DISPERSIN:
3.1. FUENTES DE VARIABILIDAD tiene mas peso que el promedio
Los estudiantes de Odontologa reciben diferentes calificaciones en la asignatura de Anatoma
(variabilidad).
A qu puede deberse? Diferencias individuales en el conocimiento de la materia.
Podra haber otras razones (fuentes de variabilidad)?
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. Las
notas seran las mismas en todos? Seguramente No.
Dormir poco el da del examen, el desayuno estaba envenenado!!!!....
Diferencias individuales en la habilidad para hacer un examen.
El examen no es una medida perfecta del conocimiento.
Variabilidad por error de medida.

14

En alguna pregunta difcil, se duda entre varias opciones, y al azar se elige la mala
Variabilidad por azar, aleatoriedad.
Las medidas de dispersin miden la variabilidad, independientemente de su causa.
3.2. MEDIDAS DE DISPERSIN EN UNA MUESTRA
IDEA: Con estos valores tratamos de estimar el parmetro (sigma) que es la desviacin
estndar de la poblacin, que es una medida de cmo se agrupan los datos de la poblacin
respecto a su media .
Entre las medidas de dispersin muestrales tenemos:
1. R = Rango = Mximo Mnimo
2. S2 = Varianza

X X

n 1

3. S = Desviacion Estndard Varianza

X X

n 1

La varianza se puede entender como el promedio del cuadrado de las distancias de cada
observacin respecto al promedio, y sus unidades estn siempre al cuadrado. La desviacin
estndar o tpica es igual a la raz cuadrada de la varianza, es siempre un valor positivo, y su
unidad de medida es la misma que corresponde a los datos originales.
Para tener una nocin de lo que representa una desviacin estndar en relacin a las
observaciones, se puede comprobar que el intervalo, que va desde la media mas/menos 2
desviaciones estndar, contiene al menos el 90% de los datos. Por tanto, los valores que no
estn dentro de este intervalo se pueden considerar como valores atpicos.
A mayor dispersin de los datos, mayor varianza y por lo tanto menor confiabilidad.
Homocedasticidad significa que las varianzas entre grupos deben ser iguales.
NOTA IMPORTANTE: Las medidas de tendencia central y de dispersin son diferentes si se
trata de una muestra (estadsticos) o de una poblacin (parmetros) (*Tema de consulta)
Adicionalmente se pueden calcular las medidas de posicin y de forma (curtosis,
cuartiles, etc) Estas medidas se pueden calcular directamente en Excel.
VER HOJA DE TAREA UNO

TEMA 4: MANEJO DE LA INCERTIDUMBRE: PROBABILIDADES


Objetivo del tema a estudiar:
Medir la certeza de que un resultado ocurra.
Temas a tratar:
- Las probabilidades, sus tipos y usos.
- El clculo de probabilidades en funcin de las tablas de frecuencias.
- Las probabilidades respecto a un conjunto: La probabilidad marginal, conjunta y condicional

1. INTRODUCCION A LAS PROBABILIDADES


Cul es la probabilidad de aprobar este mdulo?, Qu tan probable es que me
gane el pozo millonario este fin de semana?, Cul es la probabilidad de que una
nia de 7 meses de edad cuyos padres son analfabetos tengan bajo peso?
Para responder estas preguntas es necesario conocer la Teora de probabilidades. Esta teora
analiza el comportamiento de los datos para dar una medida de certeza respecto a la
posibilidad de que cierto suceso (o evento) se presente.

15

IDEA: La idea de probabilidad siempre gira alrededor del concepto de la ocurrencia de un


suceso o evento
Cmo se calculan las probabilidades? Depende del tipo de probabilidad a calcular:

Probabilidad Frecuentista (objetiva): Es la frecuencia relativa (%) de veces que


ocurrira el suceso al realizar un experimento repetidas veces.

PESO (KG) DE NIAS 7 MESES

BAJO
MEDIO

ALTO
TOTAL

F. ABS
F. REL
469
46,9%
467
46,7%
64
6,4%
1000
100 %

Probabilidad Subjetiva (bayesiana): Grado de certeza que se posee sobre un


suceso. Es personal: Cul es la probabilidad de que L.D.U. gane La Copa
Libertadores de Amrica?

2. LOS SUCESOS: SUS TIPOS Y RELACIONES

Cuando se realiza un experimento aleatorio, diversos resultados son posibles. El


conjunto de todos los resultados posibles se llama espacio muestral (E).
o

En un estudio sobre nios con desnutricin, el curso que un estudiante en una


escuela se puede determinar en el conjunto:
E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ao de bsica}

Se llama suceso a un subconjunto de dichos resultados:


o Si Jos est por entrar al bachillerato, por lo tanto, En qu curso est Jos?
J = {Jos} ={10}

Se llama suceso contrario ( o complementario) de un suceso A, A, al formado por


los elementos que no estn en A
o

J = En qu cursos NO est Jos = {1, 2, 3, 4, 5, 6, 7, 8, 9 }

Se pueden hacer operaciones entre sucesos


o

Se llama suceso interseccin de A y B, AB, al formado por los elementos


que estn en A y B al mismo tiempo Significa aquellos resultados que pueden
suceder simultneamente

A = {doctores con 5 aos de experiencia en salud pblica}


B = {doctores con dominio del ingls}
Entonces, para acceder a una beca a una maestra en EEUU, debes
pertenecer al suceso {AB}

16

Se llama suceso unin de A y B, AUB, al formado por los resultados


experimentales que estn en A o en B (incluyendo los que estn en ambos)
Significan aquellos resultados donde se pueden presentar el uno, el otro o
ambos al mismo tiempo

A = {faltar ms del 30% de las clases}


B = {tener una nota final inferior a 14 / 20}
Entonces, un alumno que pierde el mdulo, pertenece al suceso {AUB}

IDEA: Una forma de identificar un suceso es preguntndose de cuantas formas puede ocurrir
dicho suceso

3. PROBABILIDADES: LEYES Y PROPIEDADES


Las probabilidades miden la certeza de que un suceso ocurra. Desde el punto de vista de los
conjuntos, se puede decir que la probabilidad mide el tamao relativo del suceso, respecto al
total del espacio muestral.
Las propiedades de las probabilidades son:
P(E)=1 (la probabilidad de todo el espacio muestral es 1)
0P(A) 1 (la probabilidad de cualquier suceso esta siempre entre 0 y 1)
P(AUB)=P(A)+P(B) si AB= (las probabilidades de las uniones de eventos se
obtienen por sumas, siempre y cuando no hayan sucesos simultneos)
Para calcular las probabilidades, utilizaremos el enfoque de la Probabilidad frecuentista
IDEA: El clculo de una probabilidad implica el mismo proceso de clculo que una frecuencia
relativa, es decir, a partir de una tabla de frecuencias

4. TIPOS DE PROBABILIDADES
Los diferentes tipos de probabilidades dependen respecto a que conjunto estamos midiendo:

Probabilidad de un suceso = frecuencia relativa del suceso especfico respecto al


conjunto total
Probabilidad marginal de un suceso = frecuencia relativa del suceso, sin importar la
forma especfica en que puede ocurrir
Probabilidad conjunta (de interseccin) = frecuencia relativa de eventos simultneos
respecto al total
Probabilidad condicional = frecuencia relativa de eventos simultneos respecto a un
subgrupo del total

IDEA: Para entender los conceptos y aplicacin de las probabilidades, es preferible usar
Tablas de Contingencia

TEMA 5: APLICACIONES DE PROBABILIDADES


Objetivo del tema a estudiar:
Calcular y analizar los diferentes tipos de probabilidades, a partir de una Tabla de Datos
Temas a tratar:
- Construccin de una Tabla de contingencia (Usando Tablas dinmicas en Excel)
- Clculo de probabilidades a partir de una tabla de contingencia (Editando tablas
dinmicas)

17

Representar grficamente las probabilidades como tamaos relativos de los conjuntos


totales (Usando grficos dinmicos)

1. LAS TABLAS DE CONTINGENCIA:


Supngase que usted est realizando una investigacin en salud. Su primer paso es tomar una
muestra, y por medio de algn instrumento de recoleccin de informacin ha construido una
base de datos, que contiene algunas variables a analizar. Usted est interesado en analizar la
posible relacin que existe entre una variable A y una variable B. (por ejemplo, el peso de un
beb versus el nivel acadmico de los padres). En estos casos, podemos construir una Tabla
de contigencia. Por ejemplo:

Frecuencia
s
PESO (A)
EXCELENTE
INSUFICIENT
E
REGULAR
Total general

NIVEL ACADEMICO (B)


ANALFABET
SECUNDARI
Total
O
PRIMARIA
A
SUPERIOR
general
22
8
20
50
9
12
21

16
38

1
6
15

10
40
100

6
26

Como podemos observar, en una tabla de contingencia, se tienen las frecuencias absolutas
(por conteo) de cuantos de los 100 bebs analizados pertenecen a cada categora (cruce de la
tabla)
Hay que observar que existe varia informacin a considerar, por ejemplo:
- De los 100 bebs, 50 tienen peso excelente (Total por fila)
- De los 100 bebs, 15 tienen sus padres nivel acadmico secundaria (Total por
columna)
- De los 100 bebs, 8 tienen peso excelente Y tienen sus padres nivel acadmico
secundaria (valor cruce fila columna respecto al total general)
- De los 50 bebs que tienen peso excelente, 8 tienen sus padres nivel acadmico
secundaria (valor cruce fila-columna, respecto al total de Fila)
Pueden establecer en este punto, la diferencia entre cada tipo de informacin?
IDEA: Si queremos analizar la informacin de una sola variable, utilizamos tablas de
distribucin de frecuencia, para analizar dos variables (cruce de datos) utilizamos tablas de
contingencia
IDEA: Estas tablas son muy fciles de construir utilizando el comando Tablas dinmicas de
Microsoft Excel

2. CALCULO DE PROBABILIDADES EN LAS TABLAS DE CONTINGENCIA:


Sigamos con el ejemplo anterior, si usted considera a los 100 bebs como su grupo total para
analizar. Si dividimos cada uno de los valores de la tabla para el total (100), la tabla anterior se
convierte en una tabla de probabilidades:

Probabilidad
es
PESO

ACADEMIC
O
ANALFABET
O
PRIMARIA

SECUNDARI
A
SUPERIOR

Total
general

18

EXCELENTE
INSUFICIENT
E
REGULAR
Total general

0.00%

22.00%

8.00%

20.00%

50.00%

9.00%
12.00%
21.00%

0.00%
16.00%
38.00%

1.00%
6.00%
15.00%

0.00%
6.00%
26.00%

10.00%
40.00%
100.00%

Qu probabilidades tenemos aqu?:

El 50% del total de bebs, tienen peso excelente (probabilidad marginal por fila)
El 15% del total de bebs, tienen sus padres nivel acadmico secundaria
(probabilidad marginal por columna)
El 8% del total de bebs, tienen peso excelente Y tienen sus padres nivel acadmico
secundaria (probabilidad conjunta de interseccin de fila y columna)

Y las probabilidades condicionales?


Si consideramos como total de anlisis, por ejemplo al PESO (total de fila), se tiene la siguiente
tabla:

Probabilidad
es
PESO
EXCELENTE
INSUFICIENT
E
REGULAR
Total general

ACADEMIC
O
ANALFABET
SECUNDARI
Total
O
PRIMARIA
A
SUPERIOR
general
0.00%
44.00%
16.00%
40.00%
100.00%
90.00%
30.00%
21.00%

0.00%
40.00%
38.00%

10.00%
15.00%
15.00%

0.00%
15.00%
26.00%

100.00%
100.00%
100.00%

El 16% de los bebs con peso excelente, tienen a sus padres con nivel acadmico
secundaria (probabilidad condicional de columna, dada la fila)

Ntese la diferencia entre la tabla anterior y al actual: Qu valor corresponde a nuestro 100%
de anlisis en cada caso?
IDEA: Cuando sucede un evento cuyas probabilidades de ocurrencia son muy bajas
(usualmente menores al 10%) se suele decir que es un evento ESTADISTICAMENTE
SIGNIFICATIVO.. (Tan poco probable Y sin embargo, ocurri!!!!)
Finalmente, cuando se realice un anlisis de porcentajes (probabilidades), siempre hay que
analizar respecto a que grupo se est calculando dicho valor (es decir, si se trata de una
probabilidad marginal, conjunta o condicional)

19

TEMA 6: INTRODUCCION A LAS DISTRIBUCIONES DE


PROBABILIDAD
Objetivo del tema a estudiar:
Conocer los diferentes tipos de comportamiento de ciertos fenmenos probabilsticos.
Temas a tratar:
- Que son las distribuciones de probabilidad: ventajas de analizar el comportamiento global
- Distribucin discretas: Binomial
- Distribuciones continuas: Caractersticas bsicas

1. INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDAD


Para entender mejor las distribuciones, es necesario definir algunos conceptos bsicos:
Variable Aleatoria:
Es una variable X cuyos valores se deben al azar. Pueden ser discretas o continuas. Ejm:
Nmero de estudiantes por aula, Notas de cada alumno, horas de estudio diario, etc.
Distribucin de probabilidad: Es una lista de todos los posibles resultados x i de un
experimento y de la probabilidad P(X = x i) asociada a cada resultado xi. Se puede presentar
como tabla, grfico o frmula. (Lase Tabla de Distribucin de frecuencias)
Propiedades:

0 P(X = xi) 1;

P(X = xi) = 1

Media Aritmtica de variables aleatorias:


La media aritmtica ( o promedio) de una v.a. X, se llama Valor Esperado de X.
( =E[X]). Su clculo depende del tipo de distribucin, aunque bsicamente se trata de un
promedio ponderado de todos los resultados posibles (x i), tomando como pesos las
probabilidades asociadas a cada resultado (p(xi)):
Varianza de variables aletorias:
El concepto de varianza es el mismo que el de las medidas de dispersin.
Nota: Cada distribucin tiene su propia media y varianza.
Ventajas de las distribuciones de probabilidad:
Si nosotros identificamos el tipo de distribucin que tiene una determinada poblacin, podemos
establecer su comportamiento probabilstico, y el proceso de estimacin de los parmetros
sern estadsticamente ms confiables.
IDEA: Para identificar el tipo de distribucin, debemos primero analizar el tipo de dato que
estamos analizando y posteriormente el tipo de fenmeno que ocurre en la muestra

2. DISTRIBUCIONES DISCRETAS
Las distribuciones discretas se presentan en variables discretas. Existen varias distribuciones
de probabilidad, las que vamos a analizar son: Binomial, Hipergeomtrica y de Poisson.
2.1. DISTRIBUCION BINOMIAL
La distribucin binomial, surge de analizar el siguiente suceso: De una poblacin, donde el
porcentaje de xito es conocido, se toma una muestra de n datos, cul es la probabilidad de
que en dicha muestra encuentre x de xitos?

20

DISTRIBUCIN BINOMIAL

P(x) =

n!
x! ( n x )!

(1-

n-x

Donde:
n es el nmero de ensayos.
x es el nmero de xitos
Es la probabilidad del xito en cada ensayo.
Observe que utilizamos la letra griega para denotar un parmetro de una poblacin. No debe
confundirse con la constante matemtica igual a 3.1416.
La distribucin binomial, tiene como media a = n , y su varianza es = n (1 - )
IDEA: Para facilitar el clculo de estas distribuciones se utilizan las Combinaciones: nCr
Ejemplo en clase: Se supone que la tasa de reaccin a una nueva vacuna es del 30% Cul
es la probabilidad de que al aplicar la vacuna en 20 pacientes, 13 de ellos presente alguna
reaccin? Si el porcentaje del 30% se cumpliera, a cuantos se esperara que presenten
alguna reaccin?

3. DISTRIBUCIONES CONTINUAS
Cuando la variable en estudio proviene de un proceso de medicin, es decir, en variables
continuas. Puede tomar infinitos valores y depende del instrumento de medicin. Ejm:
Distribucin Uniforme, Exponencial, Normal.
Por sus aplicaciones estadsticas, estudiaremos la Distribucin Normal, que representa la base
de toda la Inferencia Estadstica.

21

TEMA 7: LA DISTRIBUCIN NORMAL


Objetivo del tema a estudiar:
Determinar las caractersticas y aplicaciones estadsticas fundamentales derivadas de la
distribucin normal.
Temas a tratar:
- Vdeo: La distribucin normal
- La distribucin Normal: aplicaciones y forma de calcular

1. INTRODUCCION A LA DISTRIBUCION NORMAL


Para entender las nociones bsicas de la distribucin normal, veamos un video donde se
explican sus principales caractersticas y aplicaciones.
Despus de ver el vdeo Puede identificar la forma, los parmetros y las principales
caractersticas de esta distribucin?

2. LA DISTRIBUCIN NORMAL: CALCULO Y APLICACIONES


La distribucin normal es una curva con forma de campana, con eje de simetra en el punto
correspondiente al promedio de la poblacin. La distancia entre el eje de simetra de la
campana y el punto de inflexin de la curva es igual a la desviacin standard de la poblacin:

Densidad de Probabilidad

Grfico de la Distribucin Normal


0,25
0,20

0,15
0,10

0,05
0,00
1

10 11 12 13 14 15 16

Variable Aleatoria X

El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida entre -
y + es aproximadamente igual a 0,68 del rea total; entre -2 y +2 es aproximadamente
igual a 0,95 del rea total:
Grfico de la Distribucin Normal

Densidad de Probabilidad

0,25
0,20
0,15

68 % rea

0,10
0,05

295 % rea

0,00
1

10

11

12

13

14

15

16

Variable Aleatoria X

22

Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la
distribucin normal son la Media y desviacin standard de la poblacin. Con estos dos
parmetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la
media) y cual es su ancho (Determinado por la desviacin standard).
La Distribucin normal estndar.

x
,

Sea Z =

Esta es la frmula de la Distribucin Normal Standard o Tipificada. Como podemos


observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin standard de
la poblacin. Esta funcin est tabulada, y para ingresar en la tabla es necesario calcular Z,
para lo cual necesitamos la media y la desviacin standard de la poblacin. Al calcular Z, lo que
estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de
Gauss centrndola en el 0 del eje X, y modificamos el ancho para que la desviacin standard
sea 1:

Grfico de la Distribucin Normal

Densidad de Probabilidad

0,45
0,40
0,35

=0
= 1

0,30
0,25
0,20

= 15
= 2,5

Cambio de
variable

0,15
0,10
0,05

0,00

-5 -4 -3 -2 -1 0

1 2

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Variables Aleatorias X y Z

El cambio de variable hace que se conserve la forma de la funcin y que sirva para cualquier
poblacin, siempre y cuando esa poblacin tenga una distribucin normal. Cuando queremos
calcular las probabilidades para una poblacin real, calculamos Z y entramos en la tabla de la
funcin normal standard: (ver tabla Z)
Grfico de la Distribucin Normal Standard
Densidad de Probabilidad

0,50
0,45
0,40

Probabilidad de que Z
sea mayor o igual a 1,2

0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-4

-3

-2

-1

Variable Aleatoria Z

Puede calcular, usando la tabla Z, el rea sombreada?


VER HOJA DE TAREA DOS

23

TEMA 8: LAS DISTRIBUCIONES MUESTRALES


Objetivo del tema a estudiar:
Determinar las caractersticas y aplicaciones estadsticas fundamentales derivadas de la
distribucin normal.
Temas a tratar:
- El comportamiento de los estadsticos muestrales
- El teorema del lmite central
- Aplicaciones para la media y la proporcin poblacional

1. EL COMPORTAMIENTO DE LOS ESTADISTICOS MUESTRALES


Recordemos lo que vimos al inicio del mdulo, respecto al proceso estadstico:
PROCESO ESTADSTICO:
Poblacin: Es el conjunto total de datos sobre el cual se
establecen las mediciones o la informacin a conocer. Debe
estar perfectamente delimitado (tiempo, lugar, caractersticas
especficas)
Parmetro: Es la informacin de la poblacin que se desea
conocer
Muestra: Es un subconjunto representativo de la Poblacin
Estimador o estadstico: Es la informacin relativa al
parmetro, obtenida a partir de la muestra
Error muestral: Es la diferencia entre el Parmetro y el
Estadstico ( )

Poblacin (Parmetro)
Muestra
Estadstico
Estimador
muestral

IDEA: A partir de este momento, no trabajamos con valores individuales de la poblacin, sino
con MUESTRAS. Es decir, con los estadsticos muestrales
Los estadsticos muestrales sirven para estimar o acercarnos al valor del parmetro, pero
siempre hay que recordar que el estadstico representa a una muestra de n datos.
PARAMETRO
Media
Poblacional
Varianza
Poblacional
Desviacin
Poblacional
Proporcin
Poblacional

SIMBOLO

FORMULA

X
i

ESTADISTICO
Promedio
Muestral

X
N

SIMBOLO
X

Varianza
Muestral

Desviacin
estndar
muestral
Proporcin
muestral

FORMULA

X
i

X X

n 1

s2

x
n

Si nosotros conocemos los parmetros poblacionales, entonces podemos conocer el


comportamiento probabilstico de UN individuo, utilizando las distribuciones de probabilidades
revisadas anteriormente. La pregunta que surge es: El comportamiento de los datos
individuales es el mismo de los estadsticos muestrales?
La respuesta es NO. La inferencia estadstica ha demostrado que los estadsticos muestrales
se comportan de manera distinta a los individuos de la poblacin, y que su comportamiento
depende de las caractersticas de la muestra de la cual provienen. Estos resultados se derivan
de lo que se conoce como EL TEOREMA DEL LIMITE CENTRAL

24

2. EL TEOREMA DEL LIMITE CENTRAL T.L.C.


Dada una v.a. cualquiera, si extraemos muestras de tamao n, y calculamos los promedios
muestrales, entonces:

Dichos promedios tienen distribucin aproximadamente normal;


La media de los promedios muestrales es la misma que la de la variable original.
La desviacin tpica de los promedios disminuye en un factor raz de n (error
estndar).
Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.
Este teorema justifica la importancia de la distribucin normal.
Sea lo que sea lo que midamos, cuando se promedie sobre una muestra
grande (n>30) nos va a aparecer de manera natural la distribucin normal.

3. APLICACIONES
POBLACIONALES

DEL T.L.C.

PARA MEDIAS

Y PROPORCIONES

Recordemos que si una poblacin es normal, entonces podemos calcular


probabilidad de un individuo X, utilizando Z =

x
,

cualquier

Si tomamos una muestra de dicha poblacin, donde n>30, y calculamos su promedio muestral

X-
X , entonces, para calcular las probabilidades respecto a este estadstico sera: Z =

IDEA: Ntese que la frmula anterior cumple todas las caractersticas del TLC, pero tiene
condiciones para ser utilizadas. Ms abajo se tiene un resumen de las condiciones del TLC
La frmula anterior sirve en el caso de medias poblacionales, cuando se tienen muestras
grandes (n >30). La otra pregunta es, qu pasa si n < 30? Simplemente, en lugar de utilizar
la distribucin Z, debemos utilizar otra distribucin llamada t o de Student, la cual la veremos
ms adelante (en el estudio de muestras pequeas). El uso de T implica adems algunas
suposiciones de ndole estadsticas adicionales que deben ser verificadas
En el caso de proporciones poblacionales, tambin se puede aplicar el TLC con sus respectivas
condiciones sobre la frmula de Z
PARAMETRO
Media
Poblacional
(Muestra
Grande)
Media
Poblacional
(Muestra
pequea)
Proporcin
Poblacional

SIMBOLO

T.L.C.

X-
Z =

X-
T = s

p
Z = (1 )

CONDICIONES DE USO
n mayor o igual a 30.

Si no se conoce , se
puede reemplazar por el
estadstico s
n menor a 30
Siempre se debe suponer que
la poblacin es normal ???
Solo se utiliza s
Al menos 5 xitos y 5 fracasos
en la muestra

25

TEMA 9: LAS ESTIMACIONES POR INTERVALO


Objetivo del tema a estudiar:
Construir un rango de valores altamente confiable, dentro del cual se confa que se encuentre
el parmetro poblacional, a partir de la informacin de una muestra
Temas a tratar:
- Construccin de un intervalo de confianza
- Intervalos de confianza en muestras grandes
- Intervalos de confianza en muestras pequeas
- Intervalos de confianza para proporciones poblacionales

1. CONSTRUCCION DE UN INTERVALO DE CONFIANZA


Supongamos que deseamos inferir algo sobre el valor del parmetro de la media poblacional
basados en el valor de la media muestral. Una de las aplicaciones ms importantes de la
estadstica inferencial es la construccin de intervalos de confianza (IC)
Un intervalo de confianza es un rango de valores dentro del cual se espera que est el valor
real del parmetro poblacional buscado, con una probabilidad de error conocida como error de
confianza denotado por el valor (alfa). El valor 1 - , se conocer como el nivel de confianza.

LIC

LSC

Observ que el ancho del intervalo de confianza, nos da una medida del error muestral del
estadstico respecto al parmetro.

2. INTERVALOS DE CONFIANZA PARA LOS DIFERENTES PARMETROS


PARAMETRO
Media
Poblacional
(Muestra
Grande)
Media
Poblacional
(Muestra
pequea)
Proporcin
Poblacional

T.L.C.

Clculo de las
distribuciones
El valor 1 ( / 2) se
busca en la tabla Z

X T

p Z

p (1 p )

El valor , y los grados


de libertad = n-1, se
buscan en la tabla T
El valor 1 ( / 2) se
busca en la tabla Z

CONDICIONES DE USO
n mayor o igual a 30.

Si no se conoce , se
puede reemplazar por el
estadstico s
n menor a 30
Siempre se debe suponer
que la poblacin es normal
Solo se utiliza s
Al menos 5 xitos y 5
fracasos en la muestra

26

TEMA 10: TECNICAS DE MUESTREO


Objetivo del tema a estudiar:
Conocer las tcnicas que permitan tomar muestras con error muestral controlado
Temas a tratar:
- Introduccin al muestreo
- Muestreos probabilsticos
- Muestreos no probabilisticos

1. INTRODUCCION AL MUESTREO
Si en una investigacin se pudiera abarcar a todos los miembros de una poblacin, la toma de
muestras sera innecesaria, as como los clculos estadsticos de probabilidades para estimar
el grado de representatividad de dicha muestra no tendran sentido, puesto que los atributos
cuantitativos encontrados (si se ha medido bien) al grupo observado sera la poblacin misma.
Tambin habra que considerar si vale la pena tomarse la molestia de extraer una muestra
significativa con procedimientos tcnicamente correctos y rigurosos, cuando la investigacin es
slo un estudio preliminar o exploratorio, cuya metodologa es incierta o bien los instrumentos
de observacin se encuentran en etapas de ensayo y validacin. Todas las etapas del estudio
deberan tener un grado o nivel de rigurosidad similar.
Una buena cantidad de experiencias e investigaciones han eludido el problema de la toma de
muestras con mucho ingenio. Por ejemplo, al comparar dos grupos cursos con caractersticas
similares, a los cuales se les va a aplicar dos metodologas pedaggicas diferentes para
demostrar la efectividad de una de ellas. Los estudiantes podran ser distribuidos en ambos
cursos por una tcnica de pareo .Tambin, es posible realizar un sorteo con una tabla de
nmeros aleatorios (o generando muestras a travs de Excel)
Jean Piaget y su escuela de Ginebra realizaron numerosas investigaciones sobre el desarrollo
psicolgico de los nios, utilizando muestras escogidas o muestras arbitrarias de pocos nios.
Ellos partan de ciertos postulados (principios aceptados que no requieren demostracin) sobre
la uniformidad del desarrollo y de la maduracin biolgica y psicolgica de los seres humanos.
Otro caso, sera el de un inspector sanitario que toma pequeas muestras del agua de una
piscina, para analizar su composicin qumica y la contaminacin bacteriolgica que pudiera
tener el contenido de la alberca; aqu se postula que la solucin del agua es homognea en
toda la piscina.

1.1. TIPOS DE MUESTREOS

El muestreo utilizado, as como las forma de delimitar la poblacin objetivo, determinan el valor
de las generalizaciones que se pueden extraer de la muestra escogida.

27

1.2. TERMINOS TCNICOS PARA REALIZAR MUESTREOS

Elementos: Es un objeto en el cual se toman las mediciones


Poblacin: Es una coleccin de elementos acerca de los cuales deseamos hacer
alguna inferencia
Unidades de muestreo: Son colecciones de elementos no traslapadas de elementos
de la poblacin que cubren la poblacin completa
Marco muestral: Es una lista de las unidades de muestreo
Muestra: Es una coleccin de unidades muestrales seleccionadas de un marco o de
varios marcos muestrales
Mortalidad experimental. Se refiere a los sujetos escogidos para someterse a
observacin en una muestra en estudio y no se les ubica, o bien no es posible lograr
que proporcionen la informacin que se necesita. Si la mortalidad experimental es alta,
la investigacin pierde su credibilidad. El plan de muestreo debe considerar este factor.
EJEMPLO:
Para investigar sobre la calidad de las mediciones de los laboratorios clnicos de Quito,
se podra definir lo siguiente

Elementos: Es un laboratorio clnico


Poblacin: Todos los laboratorios clnicos, en el sector urbano del DMQ, que se
encuentren en operaciones durante el ao 2010
Unidades de muestreo: Separamos la ciudad por regiones o zonas: norte, centro, sur,
etc. Y ubicamos en cada zona los laboratorios que se encuentren en operaciones
Marco muestral: Es el listado de laboratorios clnicos por zona (donde se podra
obtener?)
Muestra: Dependiendo de la tcnica a utilizar, la muestra se puede tomar por zonas
Mortalidad experimental: Posiblemente algun laboratorio cerr el ultimo ao, o
cambio su direccin.

La respuesta definitiva ser cuando se utilice en especfico una tcnica de muestreo

2. MUESTREOS PROBABILISTICOS
A) MUESTRAS ALEATORIAS SIMPLES.
Constituyen la base para los diferentes procedimientos de muestreo aleatorio.
Sus Principales ventajas son:
* Ms econmica que otros procedimientos aleatorios;
* Asegura la equiprobabilidad de la eleccin.
Desventajas:
* No provee suficientes casos de grupos minoritarios.

28

Los pasos a seguir:


1. Obtener un listado de todos los integrantes de la poblacin. (el marco)
2. Numerar a todos los sujetos de la poblacin (o unidades de muestreo).
3. Utilizar una Tabla de Nmeros Aleatorios o un procedimiento similar (Excel) para
seleccionar a los sujetos de la muestra.
4. Ubicar a los sujetos seleccionados y administrar los instrumentos de recopilacin
de datos.
5. Aquellos sujetos seleccionados que por alguna razn no sean sometidos a
observacin integrarn la categora de mortalidad experimental.

NOTA: Una mortalidad experimental mayor al 5% de la muestra aleatoria simple se


estima que afecta seriamente a la confiabilidad de los resultados obtenidos.
Toda tcnica de muestreo debe considerar dos cosas: el nivel de error (o nivel de confianza al
cual va a trabajar) y el error muestral que quiere asignarle a dicha muestra (recuerde los
intervalos de confianza). Tambin depende si se trata de medias poblacionales o proporciones
poblacionales. Considerando a un nivel de confianza del 95%, se tiene que:
PARAMETRO

TAMAO MUESTRAL

Media Poblacional

N 2
E2
n=
2
( N 1)
4

Proporcin Poblacional

N pq
2
n = ( N 1) E ( p q )
4

CONDICIONES
N = Tamao poblacional
2 = Varianza poblacional (se
estima de una muestra piloto)
E = mximo error muestral
asignado
p = estimacin de la
proporcin poblacional de
una muestra piloto, o 50%
q = 1 p (probabilidad de
fracaso)

B) MUESTRAS ESTRATIFICADAS
Pueden ser convenientes cuando en la poblacin blanco se presentan categoras o
subconjuntos de individuos que representen un inters particular de observar y
compararlas con otras categoras.
En este caso, su ventaja es: Lograr una muestra ms homognea.
Los criterios para establecer estratos pueden ser las variables: sexo, edad, profesin,
nivel educacional, nivel socioeconmico, nacionalidad, religin, etc.
La investigacin que requiera este tipo de muestra, deber definir los estratos
correspondientes y justificar en el proyecto sus bases de comparacin.
C) MUESTRAS POR CONGLOMERADO.
Se utilizan cuando los individuos constituyen agrupaciones naturales, por ejemplo los
alumnos del mismo curso, las familias nucleares, etc. En este caso, la unidad de
muestreo no es el individuo, sino el conglomerado. Los pasos a seguir ahora, son los
mismos que el grupo anterior; obteniendo un listado de los conglomerados, etc.
Entre sus ventajas se destacan:
* Son ms econmicas y rpidas que el procedimiento anterior, facilitando el trabajo de
los investigadores de campo;
Como desventaja:
* Pueden tener cierta prdida del carcter aleatorio del procedimiento y
* Disminucin de la precisin de sus resultados.

29

Esta ltima crtica pierde fuerza si el nmero de conglomerados es mayor que 30.

3. MUESTREOS NO PROBABILISTICOS
A) MUESTRAS ERRTICAS O CASUALES
Por ejemplo, las personas que van saliendo de la biblioteca o del casino a la hora que
aparece el encuestador. Esta es una tcnica tpica de reporteros de prensa y TV, como
ejemplo las encuestas a boca de urna. Tambin es utilizada por algunas agencias de
publicidad y de estudios de mercado. Tcnicamente es incorrecto hacer
generalizaciones a un grupo mayor que el de los mismos entrevistados (problema de
validez externa).
Ventajas (si las tiene):
* De bajo costo y no requieren de personal entrenado;
* Se sacan conclusiones rpidamente.
Desventajas:
* Carencia de validez externa y confiabilidad;
* Presenta sesgos de muestreo por criterios arbitrarios de seleccin de los sujetos
(aunque el entrevistador no los advierta).
B) MUESTRAS INTENCIONADAS O RACIONALES
En este caso se selecciona a los sujetos de acuerdo a un criterio establecido por un
experto. Por ejemplo, los estudiantes que tienen problemas de aprendizaje, o aquellos
que demuestran ausentismo escolar elevado.
Ventajas:
* Rpida y de bajo costo,
* Tiene una validez relativa para estudios de caso;
* Es muy til para estudios exploratorios,
* Para la optimizacin de instrumentos de observacin,
* Para ampliar el marco terico y la formulacin de hiptesis.
Desventajas:
* Hay problemas en los criterios de seleccin de los sujetos,
* carece de validez externa y confiabilidad al intentar generalizar hacia grupos mayores.
C) MUESTRAS POR CUOTAS
Es equivalente a las muestras aleatorias estratificadas. A los entrevistadores se les fijan
cuotas de individuos, especificndoles sus caractersticas, por ejemplo: solteras, con
hijos o embarazadas o estudiantes varones de pelo largo y con aros. Cada
entrevistador selecciona por su cuenta y entrevista con ayuda de una lista (entrevista
dirigida).
Ventajas:
* Rpida y eficiente;
* Es un sustituto de muestras estratificadas til para estudiantes;
* puede servir para un ensayo preliminar de dicha tcnica.
Desventajas:
* El sesgo del entrevistador para elegir a los sujetos es su defecto ms evidente.
D) MUESTRAS BOLA DE NIEVE
Recomendada para el estudio de casos de inters especial, que son difciles de
identificar, por ejemplo: drogadictos, homosexuales, miembros de una secta, etc. La
tcnica consiste en localizar algunos individuos tpicos, los cuales conducen a otros y
as sucesivamente va creciendo la bola de nieve. Es una tcnica apropiada para la
investigacin cualitativa y estudios de casos.
Ventajas:
* Acumula informacin enriquecedora para construir marcos tericos.
* Recomendada para estudios sociolgicos y problemas sicopedaggicos.
Desventajas:
* Requiere entrevistadores profesionales bien entrenados;
* La interpretacin de los resultados tiene problemas de confiabilidad;
* Puede haber sesgo en la seleccin de los sujetos.

30

TEMA 11: COMPROBACION DE SUPUESTOS: LOS


CONTRASTES DE HIPOTESIS
Objetivo del tema a estudiar:
Determinar si una suposicin sobre el parmetro poblacional es falsa o no, a partir de la
informacin de una muestra
Temas a tratar:
- La identificacin del proceso estadstico y las pruebas de hiptesis
- El proceso de las pruebas de hiptesis
- Aplicaciones en la investigacin cientfica

1. EL PROCESO ESTADSTICO Y LAS PRUEBAS DE HIPTESIS


Las pruebas de hiptesis constituyen una herramienta fundamental en los procesos de
investigacin. Tiene una relacin directa sobre la comprobacin de un parmetro poblacional,
utilizando la informacin de un estadstico muestral
Una hiptesis estadstica no es ms que una afirmacin que se hace sobre una o ms
caractersticas de una poblacin. Para contrastar la hiptesis que se formula acerca de la
poblacin, podramos tomar todas y cada uno de los elementos de la poblacin y ver que la
afirmacin que se hace es cierta o falsa, no siempre es factible realizar este proceso ya que la
forma de llevar a cabo la investigacin es destructiva o muy costosa, entonces es necesario
tomar una muestra para inferir sobre la poblacin.
IDEA: Las pruebas de hiptesis se centran en el concepto de distancia o diferencia entre lo
supuesto (como hiptesis) y lo observado (en una muestra)

Lo que se debe considerar, es que no podemos comparar directamente entre el valor del
parmetro y el estadstico, pues siempre existe el error muestral inherente en la muestra. Por
tanto, para poder comparar las hiptesis debemos considerar los siguientes aspectos:
-

Qu parmetro estamos probando: (media o proporcin poblacional)


El comportamiento de la poblacin (es decir, a que distribucin pertenece: Z o T)
De donde proviene la evidencia de la prueba (es decir si es muestra grande o
pequea)
31

2. EL PROCESO DE LAS PRUEBAS DE HIPTESIS


Para la realizacin del contraste se utiliza un estadstico cuya distribucin en el muestreo se
conoce si la hiptesis que se ha planteado es verdadera. El estadstico tomar valores que
pueden llevarnos a sospechar que la hiptesis no es razonable y debe ser rechazada, o por el
contrario, puede considerarse como justificacin de la hiptesis, en ambos casos podemos
equivocarnos, es decir rechazar una hiptesis siendo verdadera (error tipo 1) o bien aceptarla
error (tipo 2)
Para trabajar con contrastes de Hiptesis es necesario tener claro los siguientes conceptos:
-

Hiptesis nula H0: Es la hiptesis que se quiere contrastar y es por lo tanto la que se
acepta o rechaza como conclusin del contraste. Trabaja con los signos =; ;

Hiptesis alternativa H1: Es la hiptesis que nos sita como alternativa ante Ho de tal
forma que si se acepta H1 se rechaza Ho y viceversa. Trabaja con los signos , <, >

Estadstico de contraste: Es una funcin de la muestra aleatoria simple cuya


distribucin se utiliza para el contraste. (puede ser Z o T, dependiendo las condiciones
y del parmetro)

Error de Tipo 1: Error que se comente en la decisin del contraste cuando se rechaza
la hiptesis nula, siendo correcta.

Nivel de significacin: Probabilidad de cometer el error de tipo 1, se denota por (alfa).


Debe ser determinado ANTES de realizar el experimento

32

Error de Tipo II: Error que se comente en la decisin del contraste cuando se acepta la
hiptesis nula, siendo falsa. Se le llama (beta)
Realidad
Inocente
veredicto Inocente

OK

Culpable Error Tipo I


Muy grave

Culpable
Error Tipo II
Menos grave
OK

Contraste Bilateral: Es aquel cuya regin crtica est formada por dos conjunto de
puntos de la recta real. Se utiliza en pruebas con signos =;

Contraste Unilateral: Es aquel cuya regin crtica est formada por un solo conjunto
puntos de la recta real. Trabaja con los signos ; ; >; <

El proceso bsicamente es determinar una regin de no rechazo (en base a un intervalo de


confianza) en el cual si el estadstico se encuentra dentro de este intervalo, la hiptesis no es
rechazada (se toma H0), caso contrario, la hiptesis es rechazada (se toma H1)
La otra forma, (la que vamos a utilizar) es comparar el valor del nivel de significancia , con el
p-valor de la prueba, tal que:
-

P-valor: es el nivel de probabilidad asignado al haber obtenido el valor de la muestra,


suponiendo que la hiptesis sea verdadera.
Es la probabilidad que tendra una regin crtica que comenzase exactamente en el
valor del estadstico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe an ms que la nuestra de H 0.
Es la probabilidad de que por puro azar obtengamos una muestra ms extraa que la
obtenida.
P-valor es conocido despus de realizar el experimento aleatorio
El contraste es no significativo cuando p>a

33

IDEA: Si > P-valor , entonces Ho es rechazada, caso contrario no se rechaza

Las pruebas de hiptesis son quizs unas de las herramientas ms poderosas que tiene la
estadstica, cuyas aplicaciones van desde la medicina y la agricultura, hasta el diseo de
experimentos, finanzas y las investigaciones de mercado.
La forma de calcular estas Pruebas de Hiptesis depende del tipo de prueba que se est
utilizando.

2. EL PROCESO DE LAS PRUEBAS DE HIPTESIS Y SU APLICACIN EN


LA INVESTIGACION CIENTFICA
Una prueba de hiptesis responde a la metodologa de la investigacin cientfica, lo que implica
que debe responder a un orden metodolgico y de anlisis que consta de los siguientes pasos
PASO 1: Determinar el sistema de hiptesis:
Es decir, plantear la hiptesis nula Ho y la alternativa H1 (con sus signos respectivos)
PASO 2: Determinar el nivel de significacin de la prueba
Implica establecer un valor para la prueba (por lo general entre el 1% y el 10%)
PASO 3: Tomar una muestra e Identificar el estadstico de prueba
Implica utilizar Z o T, dependiendo el parmetro y el tamao muestral y otras
condiciones inherentes.
PASO 4: Establecer la regla de decisin y Calcular los valores crticos
Implica saber, en funcin de ,cuando se rechaza la Ho o no.
PASO 5: Tomar e interpretar la decisin:
Tomar Ho o H1 en funcin de la relacin entre y el P-valor
Las aplicaciones de este proceso en la investigacin cientfica permitirn comprobar las
hiptesis establecidas en dichos procesos, con un alto grado de confiabilidad estadstica.

34

TEMA 12: PRUEBAS PARA UNA POBLACION


Objetivo del tema a estudiar:
Realizar pruebas de hiptesis sobre una poblacin, analizando los diferentes casos que pueden
presentarse
Temas a tratar:
- Prueba Z: condiciones y anlisis
- Prueba t: condiciones y anlisis
- Pruebas para Proporciones poblacionales
- Pruebas de una y de dos colas: Bilaterales y Unilaterales

1. CUADRO DE ESTADISTICOS DE PRUEBA PARA CADA PARAMETRO


PARAMETRO
Media
Poblacional
(Muestra Grande)
Media
Poblacional
(Muestra
pequea)
Proporcin
Poblacional

TIPO PRUEBA

Prueba Z para

Prueba T para

Prueba Z para

ESTADISTICOS DE PRUEBA

X-

Ztest =

n
X-

Ttest = s

p
Ztest = (1 )

Como se puede observar, el estadstico de prueba es exactamente igual al TLC para cada
parmetro, la nica diferencia es que se utilizan los valores hipotticos de los parmetros para
el clculo respectivo. Cabe recalcar, que las condiciones que se tenan anteriormente para el
uso de TLC se aplican igualmente en este caso.
Tambin es importante recordar que existen varios signos con los que podemos trabajar, y en
funcin de esos signos, hay que determinar:
-

Si estamos trabajando sobre la Ho la H1


Si la prueba es Bilateral o Unilateral (revise el tema anterior)

EJEMPLOS DE APLICACIONES:
En los siguientes recortes, identifique la hiptesis nula, la alternativa y si la prueba es bilateral o
unilateral:

Nota:
En las pruebas de hiptesis, es importante que la tomar una decisin, siempre tendremos una
interpretacin asociada a la misma, adems que nunca estaremos 100% de esta decisin,
puesto que la evidencia que tenemos la hemos obtenido a partir de una muestra, que siempre
tendr asociado un error muestral.

35

TEMA 13: PRUEBAS DE COMPARACIN DE DOS


POBLACIONES
Objetivo del tema a estudiar:
Realizar pruebas de hiptesis para comparar dos parmetros poblacionales, analizando los
diferentes casos que pueden presentarse
Temas a tratar:
- Pruebas para muestreos pareados
- Pruebas para muestreos independientes: Caso 1, 2 y 3
- Pruebas de comparacin de proporciones

1. INTRODUCCION A LAS PRUEBAS DE COMPARACION:


En el caso de las pruebas para una poblacin, se trataba de comparar un parmetro respecto a
un valor fijo, pero qu sucede si queremos comparar dos parmetros de dos poblaciones
distintas entre s?
-

El Porcentaje de desnutricin ser el mismo en Quito que en Guayaquil?


Las mediciones promedio de un laboratorio sern las mismas que las obtenidas por
otro laboratorio, utilizando la misma muestra patrn?
El promedio de reduccin de la presin arterial en pacientes hipertensos, ser mejor
con la nueva medicina, que con la medicina genrica?

En estos casos, no nos interesa saber cul es el valor de cada parmetro, sino saber cul es
ms alto respecto al otro, o si efectivamente son iguales. Para estos casos, debemos trabajar
en base a diferencias positivas o negativas:
-

Si 1 > 2 , entonces 1 - 2 > 0 (diferencia positiva)


Asimismo, si 1 2 , entonces 1 - 2 0 (diferencia negativa)

IDEA: Para identificar las pruebas que debemos hacer, primero debemos establecer que tipos
de muestras se tienen en cada poblacin: Pareadas o Independientes
-

Muestras pareadas: Trabajamos sobre la misma poblacin, pero medida ANTES y


DESPUES de realizar un tratamiento sobre ella. Siempre consideramos a los mismos
elementos o individuos muestrales

Muestras independientes: Tomamos muestras e individuos distintos en cada muestra.


Puede ser la mismas o distintas poblaciones. Existen tres casos:
o
o
o

Prueba Z: cuando se conocen las desviaciones poblacionales de cada


poblacin
Prueba T: cuando no se conocen las desviaciones poblacionales, pero se
suponen iguales (misma poblacin)
Prueba T: cuando no se conocen las desviaciones poblacionales, pero se
suponen distintas (diferentes poblaciones)

IDEA: Las frmulas de clculo suelen ser muy engorrosas. Las aplicaciones se pueden realizar
en Microsoft Excel o en cualquier programa estadstico
La forma de realizar las pruebas es exactamente parecida, es decir, se mantienen los mismos 5
pasos que vimos en los temas anteriores.

36

2. PRUEBA F: COMO COMPARAR LAS VARIANZAS


La prueba F sirve, entre otras cosas para comparar las varianzas de dos poblaciones. El
proceso estadstico es el siguiente:
Poblacin 1 (12)

Poblacin 2 (22)

Muestra 1

Muestra 2

n1 = 9
S1 = 97

n2 = 7
S2 = 83

El estadstico F es: F = (S12)/ (S22) , donde siempre se tiene que: (S12) > (S22)
En el ejemplo analizado, F = 1.37
Para verificar la hiptesis de varianzas iguales, es decir Ho: 12 = 22, frente a su hiptesis
alternativa Ha: 12 22, la idea principal es que el valor de F debe ser cercana a 1
superiormente (pues se tom S12 > S22 ), pero esto no se consigue puesto que se trabaja con
muestras, entonces se debe buscar un valor crtico para F de manera que si este F no supera a
este valor crtico, entonces no se puede rechazar Ho, y se pueden suponer varianzas iguales.
El valor crtico para F (Fc), depender del valor de confianza y de los grados de libertad:
numerador (n1 1) y denominador (n2 1). Para este fin, se utiliza la tabla F. Aunque este
valor es mejor que se calcule por medio de algn programa informtico.

NOTA: En todos estos casos, se est asumiendo que las variables analizadas (es decir, las
diferencias) siguen una distribucin normal. Caso contrario, debemos utilizar pruebas no
paramtricas.

37

TEMA 14: PRUEBAS JI CUADRADA Y ANALISIS DE VARIANZA


Objetivo del tema a estudiar:
Realizar pruebas para comprobar comportamiento y para probar suposiciones simultneamente
en varias poblaciones
Temas a tratar:
- Prueba Ji cuadrada
- Anlisis de varianza de uno y dos factores

1. PRUEBA JI CUADRADA
Esta prueba est diseada para verificar si un conjunto de datos tiene un comportamiento
determinado. Por lo general, los datos se encuentran distribuidos por clases (una tabla de
distribucin de frecuencias, o no tabla de contingencia). Se determina con la frmula:

2
Donde:
-

(Oi Ei ) 2
, con grados de libertad = K m 1,
Ei

Oi es la frecuencia observada en la muestra


Ei es la frecuencia esperada que debera aparecer en la muestra
K es el nmero de categoras o clases
m es el nmero de parmetros estimados en base a la muestra

2. ANALISIS DE VARIANZA UNIDIRECCIONAL (ANOVA)


Sirve para probar la igualdad de varias medias poblacionales (no solamente de 2 en 2, como
las pruebas de comparacin). Se basa en el estadstico F.
El proceso estadstico se basa en la comparacin de los efectos de diferentes tratamientos al
ser aplicados estos en diferentes muestras (que contienen varias unidades experimentales) en
varias (c) poblaciones
Ho: 1 =2 =3 =...= c
Ha: No todas las medias son iguales (al menos una es diferente)
Poblacin 1 (1)

Poblacin 2 (2)

Poblacin 3 (3)

Poblacin C (c)

Muestra 1

Muestra 2

Muestra 3

Muestra 1

n1

n2

n3

nc
..........

3.1. SUPUESTOS BASICOS DEL ANOVA


Diseo completamente aleatorizado: Significa que las unidades experimentales fueron
asignados a un tratamiento de forma indistinta.
Modelo de efectos fijos: Los tratamientos son fijos o conocidos desde el inicio del estudio.
Adems:
- Todas las poblaciones son normales.
- Todas las poblaciones tienen varianzas iguales
- Las muestras se eligen de manera independiente. (no es muestreo pareado)
- A cada muestra se le aplic un determinado tratamiento.
Aunque el ANOVA trata de comparar las medias poblacionales de varias poblaciones sometidas
a diferentes tratamientos, el anlisis se basa en el estudio de las variaciones inherentes a
dichos tratamientos. Hay tres variaciones en el anlisis ANOVA:

38

Variacin Intramuestral: Es la variacin de cada muestra independiente


Variacin Intermuestral: Es la variacin entre los diferentes muestras, es decir, entre
los diferentes tratamientos.
Variacin Total: Es la variacin de todos los datos, considerando a la suma de todas
las muestras tomadas como si fuera una sola muestra grande. Asimismo, la variacin
total es la suma de las dos variaciones anteriores.

La variacin intramuestral no se debe a los tratamientos, puesto que cada unidad experimental
es diferente en s misma, pero estn sometidas al mismo tratamiento. Como se supone que las
varianzas poblacionales son iguales, entonces esta variacin debe ser igual dentro de cada
muestra.
El efecto de cada tratamiento sobre cada muestra (si este existe) slo est reflejada sobre la
variacin Intermuestral, y esta variacin debe ser mayor a la intramuestral, porque aumenta
mayores fluctuaciones a los datos. En este caso, los tratamientos no son iguales y Ho es
rechazada. Para comparar entonces los tratamientos, se debe comparar sus variaciones
utilizando el estadstico F = Variacin Intermuestral / Variacin Intramuestral.
3.2. CONSTRUCCION DE LA TABLA ANOVA
Los clculos necesarios para construir una tabla ANOVA de un factor implican clculos muy
engorrosos, pero para entender el proceso de anlisis de los resultados, veamos el siguiente
ejemplo:
Usted ha aplicado tres tipos diferentes de programas de capacitacin a sus empleados del
hospital para aumentar sus calificaciones en las evaluaciones internas respectivas. Luego de
dicha capacitacin, usted les ha tomado un examen evaluativo para conocer los resultados de
cada programa:
Nro de
empleados
1
2
3
4
5
Promedio ( X
)

Tipo de capacitacin
Programa 1
Programa 2 Programa
3
85
80
82
72
84
80
83
81
85
80
78
90
*
82
88
80
81
85

Esta informacin nos dice que


cada muestra tiene un diferente
tratamiento y tambin diferente
informacin. Es posible concluir
que todos los programas de
capacitacin son iguales?
Ntese que cada muestra tiene
un tamao ni. Es decir:
n1= 4; n2= 5; n3= 5;
el tamao total es
n = n1 + n2 + n3= 14;

Como hay 3 programas diferentes, c = 3


Luego, se calcula el promedio de cada muestra, y luego la media general X :
c

X=

ni X i

i 1

4(80) 5(81) 5(85)


14
=
= 82,14

n
SUMAS DE CUADRADOS
r

Suma Cuadrada Total = SST =

(X
j1 i 1

ij

X) 2

= 251,7

(es decir, a cada valor se le resta la media general y se eleva al cuadrado y se suma)
(Variacin Total)

39

Suma Cuadrada del Tratamiento = SSTR =

i (X i

X) 2

i 1

= 65,7

(a cada promedio muestral se le resta la media general, se eleva al cuadrado, se multiplica por
el tamao de la muestra y se suma) (Variacin intermuestral)
r

Suma Cuadrada del Error = SSE =

(X

ij

Xi )2

j1 i 1

= 186,0

(a cada valor, se le resta el promedio de su muestra, se eleva al cuadrado y se suma)


(Variacin Intramuestral)
Se puede comprobar que: SST = SSTR + SSE , es decir: 251,7 = 65,7 + 186,0
En la prctica, se calcular SSE de esta ltima expresin, es decir:
SSE = SST SSTR = 251,7 65,7 = 186,0
MEDIAS CUADRADAS
Luego de calcular las sumas cuadradas, se calculan las medias cuadradas, de la siguiente
manera:

SST
Media Cuadrada Total = MST = n 1 = 19,4
SSTR
Media Cuadrada del Tratamiento = MSTR = c 1 = 32,9
SST
Media Cuadrada del Error = MSE = n c = 16,9
CALCULO DE F: Como se explic anteriormente, F es la razn entre la variacin intermuestral
y la intramuestral:
MSTR
F = MSE = 1,94
VALOR CRITICO DE F (Fc): Depende del error de confianza , y de los grados de libertad del
numerador (c 1) y del denominador (n c). En nuestro ejemplo, y con un nivel de confianza
de 95%, entonces Fc = F0,05;2;11= 3,98
REGLA DE DECISIN: Ho es rechazada si F > Fc, de lo contrario no se rechaza. En nuestro
caso, como F = 1,94 y Fc = 3,98, entonces Ho no es rechazada. Se puede suponer que los tres
programas de formacin son iguales.
TABLA ANOVA
Fuente de variacin
Intermuestral
(tratamiento)
Intramuestral (error)
Variacin total

Suma
Cuadradas
SSTR
SSE
SST

Grados de Libertad

Medias Cuad.

c1

SSTR / (c -1)

nc
n1

SSE / (n c )

Valor F

Fc

MSTR/MSE

IDEA: El ANOVA de un factor es cuando comparamos efectos solo por columnas, tambin se
puede utilizar para comparar las filas. Esto se conoce que ANOVA de dos factores

40

F;c1;n-c

TEMA 15: ANALISIS DE CORRELACIONES Y REGRESIONES


Objetivo del tema a estudiar:
Determinar la relacin existente entre dos variables, si sta existe.
Temas a tratar:
- Correlacin lineal
- Regresin lineal
- Proyecciones

1. TIPOS DE RELACIONES ENTRE VARIABLES

41

Cmo medimos el tipo de relacin? Calculando la covarianza:

IDEA: Una cosa es establecer una relacin directa o inversa, y otra muy distinta es establecer
causalidad: es decir, que una variacin en X produce una variacin en Y.
Si queremos establecer una relacin de causalidad, debemos establecer primero que tipo de
relacin puede existir entre las variables. Para nuestro anlisis, asumiremos que esta relacin
es lineal.

2. CORRELACION LINEAL

El coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los


puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas
horizontales y verticales).

Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible
relacin sea directa o inversa.

r es til para determinar si hay relacin lineal entre dos variables, pero no servir para
otro tipo de relaciones (cuadrtica, logartmica,...)

S xy
SxS y

ANALISIS DE LA CORRELACION LINEAL


Es adimensional

Slo toma valores en [-1,1]

Las variables son incorreladas r=0

Relacin lineal perfecta entre dos variables r=+1 o r=-1


Excluimos los casos de puntos alineados horiz. o verticalmente.

Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal.(R >0,7)


Siempre que no existan observaciones anmalas.

42

3. REGRESION LINEAL
El anlisis de regresin sirve para predecir una medida en funcin de otra medida (o varias).
Y = Variable dependiente
predicha
explicada
X = Variable independiente
predictora
explicativa
Es posible descubrir una relacin?
Y = f(X) + error
f es una funcin de un tipo determinado

43

el error es aleatorio, pequeo, y no depende de X


En nuestro caso, estudiaremos las regresiones de tipo lineal, es decir, que f(x) es una recta.
MODELO DE REGRESION LINEAL SIMPLE
En el modelo de regresin lineal simple, dado dos variables
Y (dependiente)
X (independiente, explicativa, predictora)
buscamos encontrar una funcin de X muy simple (lineal) que nos permita
aproximar Y mediante
MODELO DE REGRESION LINEAL: = b0 + b1X
Donde:

b0 (ordenada en el origen, constante)


b1 (pendiente de la recta)
Y e rara vez coincidirn por muy bueno que sea el modelo de
regresin. A la cantidad

e=Y- se le denomina residuo o error residual.

El clculo de los coeficientes se realiza por la siguientes frmulas:

b1 r

SY
SX

b0 y b1 x

IDEA: No siempre se tiene una regresin lineal. Tambin puede ser polinomial, exponencial,
logartmica, etc. Asimismo, se puede hacer una regresin con varias variables causales
(mltiple)
Las regresiones son un excelente mtodo de prediccin, siempre y cuando se comprueben
ciertas hiptesis estadsticas (implicara otro curso ms especializado, para aplicaciones de
investigacin predictiva)

44

HOJA DE TAREA UNO:


TAREA INDIVIDUAL:
-

Consultar acerca de las medidas de tendencia central y de dispersin poblacionales.


Haga hincapi en las diferencias que hubieren entre stas y las medidas muestrales
estudiadas en este documento, en especial en lo referente al concepto de Grados de
Libertad
La consulta debe realizarse a mano, en mximo una pgina tamao A4, y entregarse
en la primera sesin presencial de la prxima semana.

TAREA GRUPAL:
Grupos de mximo 3 integrantes. Cada grupo deber realizar un bosquejo de investigacin
exploratoria, para lo cual deber realizar las siguientes actividades:
-

Identificar, dentro del contexto educativo, un proceso estadstico sobre el cual quisiera
investigar, para lo cual debe definir claramente:
o
o
o

La poblacin sobre la cual va a trabajar


El parmetro sobre el cual quiere realizar el estudio: Puede ser una media
poblacional (promedio) o una proporcin poblacional (%)
Determinar la forma en la cual va a conseguir la muestra. La muestra debe
tener al menos 30 observaciones

Una vez identificado las fases del proceso estadstico, debe disear un instrumento de
recoleccin de datos (encuestas) para obtener informacin muestral acerca del
parmetro definido anteriormente, bajo las siguientes condiciones:
o
o

La encuesta debe tener al menos 4 preguntas: 2 de tipo cuantitativo, 2 de tipo


categrico
Recuerde que cada pregunta debe ser exhaustiva y excluyente

Cada grupo deber entregar en la primera sesin de la prxima semana, un documento


impreso, realizado en computadora, que contenga lo siguiente
o
o
o
o
o

Cartula, con el nombre de los integrantes del Grupo


Objetivo de la Investigacin (En base al parmetro)
Poblacin objeto del estudio
Muestra y metodologa de muestreo
Encuesta a aplicar

NOTAS: Trate de enfocar la investigacin en una poblacin donde le sea factible conseguir
datos fcil y rpidamente. Todava no debe realizar la recoleccin de datos (aplicar la
encuesta), solo disearla.

45

HOJA DE TAREA DOS:


TAREA INDIVIDUAL: Resuelva los siguientes ejercicios de probabilidades:
1. Tabla de probabilidades:
Un investigador desea determinar el efecto de la edad de un cirujano respecto a la disposicin
de los pacientes para dejarse intervenir por el mismo. Para esto, en una muestra de 130
potenciales pacientes, se les indic que un experto cirujano iba a realizar la operacin. El
experto fue descrito con las mismas caractersticas para todos, excepto que a la mitad de los
pacientes se les dijo que el experto tiene 65 aos, y a la otra mitad se le dijo que tena 30 aos.
Posteriormente, se le pregunt a cada paciente si estaran dispuestos a ser operados por dicho
experto. De cada grupo, 22 y 38 alumnos respectivamente, manifestaron que si permitiran ser
intervenidos. El resto indic que lo contrario. En base a estos resultados:
a. Construya la tabla de probabilidades marginales
b. Construya la tabla de probabilidades condicionales respecto a los
subgrupos de inters
c. Analice los resultados encontrados. Existen indicios acerca del efecto
edad en la disposicin de los pacientes a ser operados?
2. Distribuciones de probabilidad:
a. Daando los cromosomas del vulo o del espermatozoide, pueden causarse mutaciones que
conducen a abortos, defectos de nacimiento, u otras deficiencias genticas. La probabilidad de
que tal mutacin se produzca por radiacin es del 10 %. De las siguientes 150 mutaciones
causadas por cromosomas daados, cuntas se esperara que se debiesen a radiaciones?
Cul es la probabilidad de que solamente 10 se debiesen a radiaciones?

b. Una prueba de laboratorio para detectar herona en sangre tiene un 92% de precisin. Si se
analizan 72 muestras en un mes, cul es la probabilidad de que:
- 60 o menos estn correctamente evaluadas?
- menos de 60 estn correctamente evaluadas?
- exactamente 60 estn correctamente evaluadas?

c. Entre los diabticos, el nivel de glucosa en sangre X, en ayunas, puede suponerse de


distribucin aproximadamente normal, con media 106 mg/100 ml y desviacin tpica 8 mg/100
ml.
- Qu porcentaje de diabticos tienen niveles comprendidos entre 90 y 120?.
- Hallar P[106 < X < 110].
- Hallar P[X < 121].
- Hallar el punto x caracterizado por la propiedad de que el 25% de todos los diabticos tiene
un nivel de glucosa en ayunas inferior o igual a x.

46

TABLA DE VALORES DE Z (Probabilidad acumulada)


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0, 0,50 0,50 0,50 0,51 0,51 0,51 0,52 0,52 0,53 0,53
0
00
40
80
20
60
99
39
79
19
59
0, 0,53 0,54 0,54 0,55 0,55 0,55 0,56 0,56 0,57 0,57
1
98
38
78
17
57
96
36
75
14
53
0, 0,57 0,58 0,58 0,59 0,59 0,59 0,60 0,60 0,61 0,61
2
93
32
71
10
48
87
26
64
03
41
0, 0,61 0,62 0,62 0,62 0,63 0,63 0,64 0,64 0,64 0,65
3
79
17
55
93
31
68
06
43
80
17
0, 0,65 0,65 0,66 0,66 0,67 0,67 0,67 0,68 0,68 0,68
4
54
91
28
64
00
36
72
08
44
79
0, 0,69 0,69 0,69 0,70 0,70 0,70 0,71 0,71 0,71 0,72
5
15
50
85
19
54
88
23
57
90
24
0, 0,72 0,72 0,73 0,73 0,73 0,74 0,74 0,74 0,75 0,75
6
57
91
24
57
89
22
54
86
17
49
0, 0,75 0,76 0,76 0,76 0,77 0,77 0,77 0,77 0,78 0,78
7
80
11
42
73
04
34
64
94
23
52
0, 0,78 0,79 0,79 0,79 0,79 0,80 0,80 0,80 0,81 0,81
8
81
10
39
67
95
23
51
78
06
33
0, 0,81 0,81 0,82 0,82 0,82 0,82 0,83 0,83 0,83 0,83
9
59
86
12
38
64
89
15
40
65
89
1, 0,84 0,84 0,84 0,84 0,85 0,85 0,85 0,85 0,85 0,86
0
13
38
61
85
08
31
54
77
99
21
1, 0,86 0,86 0,86 0,87 0,87 0,87 0,87 0,87 0,88 0,88
1
43
65
86
08
29
49
70
90
10
30
1, 0,88 0,88 0,88 0,89 0,89 0,89 0,89 0,89 0,89 0,90
2
49
69
88
07
25
44
62
80
97
15
1, 0,90 0,90 0,90 0,90 0,90 0,91 0,91 0,91 0,91 0,91
3
32
49
66
82
99
15
31
47
62
77
1, 0,91 0,92 0,92 0,92 0,92 0,92 0,92 0,92 0,93 0,93
4
92
07
22
36
51
65
79
92
06
19
1, 0,93 0,93 0,93 0,93 0,93 0,93 0,94 0,94 0,94 0,94
5
32
45
57
70
82
94
06
18
29
41
1, 0,94 0,94 0,94 0,94 0,94 0,95 0,95 0,95 0,95 0,95
6
52
63
74
84
95
05
15
25
35
45
1, 0,95 0,95 0,95 0,95 0,95 0,95 0,96 0,96 0,96 0,96
7
54
64
73
82
91
99
08
16
25
33
1, 0,96 0,96 0,96 0,96 0,96 0,96 0,96 0,96 0,96 0,97
8
41
49
56
64
71
78
86
93
99
06
1, 0,97 0,97 0,97 0,97 0,97 0,97 0,97 0,97 0,97 0,97
9
13
19
26
32
38
44
50
56
61
67
2, 0,97 0,97 0,97 0,97 0,97 0,97 0,98 0,98 0,98 0,98
0
72
78
83
88
93
98
03
08
12
17
2, 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98
1
21
26
30
34
38
42
46
50
54
57
2, 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,98
2
61
64
68
71
75
78
81
84
87
90
2, 0,98 0,98 0,98 0,99 0,99 0,99 0,99 0,99 0,99 0,99
3
93
96
98
01
04
06
09
11
13
16
2, 0,99 0,99 0,99 0,99 0,99 0,99 0,99 0,99 0,99 0,99
4
18
20
22
25
27
29
31
32
34
36
47

2,
5
2,
6
2,
7
2,
8
2,
9
3,
0
3,
1
3,
2
3,
3
3,
4
3,
5
3,
6
3,
7
3,
8
3,
9

0,99
38
0,99
53
0,99
65
0,99
74
0,99
81
0,99
87
0,99
90
0,99
93
0,99
95
0,99
97
0,99
98
0,99
98
0,99
99
0,99
99
1,00
00

0,99
40
0,99
55
0,99
66
0,99
75
0,99
82
0,99
87
0,99
91
0,99
93
0,99
95
0,99
97
0,99
98
0,99
98
0,99
99
0,99
99
1,00
00

0,99
41
0,99
56
0,99
67
0,99
76
0,99
82
0,99
87
0,99
91
0,99
94
0,99
95
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
43
0,99
57
0,99
68
0,99
77
0,99
83
0,99
88
0,99
91
0,99
94
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
45
0,99
59
0,99
69
0,99
77
0,99
84
0,99
88
0,99
92
0,99
94
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
46
0,99
60
0,99
70
0,99
78
0,99
84
0,99
89
0,99
92
0,99
94
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
48
0,99
61
0,99
71
0,99
79
0,99
85
0,99
89
0,99
92
0,99
94
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
49
0,99
62
0,99
72
0,99
79
0,99
85
0,99
89
0,99
92
0,99
95
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
51
0,99
63
0,99
73
0,99
80
0,99
86
0,99
90
0,99
93
0,99
95
0,99
96
0,99
97
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

0,99
52
0,99
64
0,99
74
0,99
81
0,99
86
0,99
90
0,99
93
0,99
95
0,99
97
0,99
98
0,99
98
0,99
99
0,99
99
0,99
99
1,00
00

TABLA DE VALORES DE T
ALF 0,2
A
0
G.L 0,1
.
00
3,07
1
8
1,88
2
6
1,63
3
8
1,53
4
3
1,47
5
6
1,44
6
0
1,41
7
5
8 1,39

0,1
5
0,0
75
4,16
5
2,28
2
1,92
4
1,77
8
1,69
9
1,65
0
1,61
7
1,59

0,1
0
0,0
50
6,31
4
2,92
0
2,35
3
2,13
2
2,01
5
1,94
3
1,89
5
1,86

BILATER
0,05 0,04 0,03 0,02 0,01
AL
0,02 0,02 0,01 0,01 0,00 UNILATE
5
0
5
0
5
RAL
12,7 15,8 21,2 31,8 63,6
06
95
05
21
57
4,30 4,84 5,64 6,96 9,92
3
9
3
5
5
3,18 3,48 3,89 4,54 5,84
2
2
6
1
1
2,77 2,99 3,29 3,74 4,60
6
9
8
7
4
2,57 2,75 3,00 3,36 4,03
1
7
3
5
2
2,44 2,61 2,82 3,14 3,70
7
2
9
3
7
2,36 2,51 2,71 2,99 3,49
5
7
5
8
9
2,30 2,44 2,63 2,89 3,35

48

9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

7
1,38
3
1,37
2
1,36
3
1,35
6
1,35
0
1,34
5
1,34
1
1,33
7
1,33
3
1,33
0
1,32
8
1,32
5
1,32
3
1,32
1
1,31
9
1,31
8
1,31
6
1,31
5
1,31
4
1,31
3
1,31
1
1,31
0

2
1,57
4
1,55
9
1,54
8
1,53
8
1,53
0
1,52
3
1,51
7
1,51
2
1,50
8
1,50
4
1,50
0
1,49
7
1,49
4
1,49
2
1,48
9
1,48
7
1,48
5
1,48
3
1,48
2
1,48
0
1,47
9
1,47
7

0
1,83
3
1,81
2
1,79
6
1,78
2
1,77
1
1,76
1
1,75
3
1,74
6
1,74
0
1,73
4
1,72
9
1,72
5
1,72
1
1,71
7
1,71
4
1,71
1
1,70
8
1,70
6
1,70
3
1,70
1
1,69
9
1,69
7

6
2,26
2
2,22
8
2,20
1
2,17
9
2,16
0
2,14
5
2,13
1
2,12
0
2,11
0
2,10
1
2,09
3
2,08
6
2,08
0
2,07
4
2,06
9
2,06
4
2,06
0
2,05
6
2,05
2
2,04
8
2,04
5
2,04
2

9
2,39
8
2,35
9
2,32
8
2,30
3
2,28
2
2,26
4
2,24
9
2,23
5
2,22
4
2,21
4
2,20
5
2,19
7
2,18
9
2,18
3
2,17
7
2,17
2
2,16
7
2,16
2
2,15
8
2,15
4
2,15
0
2,14
7

4
2,57
4
2,52
7
2,49
1
2,46
1
2,43
6
2,41
5
2,39
7
2,38
2
2,36
8
2,35
6
2,34
6
2,33
6
2,32
8
2,32
0
2,31
3
2,30
7
2,30
1
2,29
6
2,29
1
2,28
6
2,28
2
2,27
8

6
2,82
1
2,76
4
2,71
8
2,68
1
2,65
0
2,62
4
2,60
2
2,58
3
2,56
7
2,55
2
2,53
9
2,52
8
2,51
8
2,50
8
2,50
0
2,49
2
2,48
5
2,47
9
2,47
3
2,46
7
2,46
2
2,45
7

5
3,25
0
3,16
9
3,10
6
3,05
5
3,01
2
2,97
7
2,94
7
2,92
1
2,89
8
2,87
8
2,86
1
2,84
5
2,83
1
2,81
9
2,80
7
2,79
7
2,78
7
2,77
9
2,77
1
2,76
3
2,75
6
2,75
0

49

TABLA DE VALORES DE JI CUADRADA


X2
(Alfa)
G.L
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,995

0,990

0,900

0,100

0,050

0,025

0,020

0,010

0,005

0,000
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787

0,000
0,020
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,953

0,016
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599

2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256

3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773

5,024
7,378
9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,195
44,461
45,722
46,979

5,412
7,824
9,837
11,668
13,388
15,033
16,622
18,168
19,679
21,161
22,618
24,054
25,472
26,873
28,259
29,633
30,995
32,346
33,687
35,020
36,343
37,659
38,968
40,270
41,566
42,856
44,140
45,419
46,693
47,962

6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892

7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,559
46,928
48,290
49,645
50,993
52,336
53,672

50

51

Vous aimerez peut-être aussi