Académique Documents
Professionnel Documents
Culture Documents
=
i
i
x x
n
S
2 2
) (
1
2
S S =
DESVIACIN ESTNDAR
Denominada tambin como desviacin tpica: Es la raz cuadrada de la
varianza
El significado de la desviacin estndar
Cuando una distribucin la representamos grficamente mediante un polgono de
frecuencia
La desviacin estndar representa la VARIABILIDAD PROMEDIO que nos permite medir la
distancia entre los valores de la variable y la media aritmtica en unidades de
desviaciones estndares denominadas unidades sigma
-2s -s + s +s
Curva simtrica que muestra las relaciones entre las desviaciones estndar y la media
2
S S =
EJEMPLO
En un experimento con ratas en el cual se quera saber si la planta estudiada
tenia efecto hipoglucemiante Se obtuvieron los siguiente valores al
determinar la glucosa en un experimento (en mmol/L). Calcule la media, la
desviacin estndar y la desviacin tpica.
Valores
de
Glucosa
Media Diferencia Diferencia
al
cuadrado
20
25
30
36
total
Solucin del EJEMPLO
Valores
de
Glucosa
Media Diferencia Diferencia
al
cuadrado
20 27,50 -7,75 60,0625
25 27,75 -2,75 7.5625
30 27,75 2,25 5,0625
36 27,75 8,25 68,0625
total 140,75
Aplicando las formulaciones tendremos:
Media: 27,50
La varianza es 35,18
La desviacin estndar es: 5,93
Respuesta : los valores medios de la glucosa en ratas son 27,50, mientras que la
la varianza es 35,18 y La desviacin estndar es: 5,93
=
i
i
x x
n
S
2 2
) (
1
2
S S =
EJEMPLO 2
En tres empresas se pagan diferentes salarios, como puede observarse en la
tabla , diga cuales son las correspondientes medias y calcule la desviacin
estndar y la varianza. Si tuviese alguna oportunidad de trabajo cual de ellos
escogeria
Empresas
Salario en USD MEDIA
ARITMETICA
DESVIACION
ESTANDAR
varianz
a
A 400-400-400
B 200-400-600
C 300-400-500
Empresas
Salario en USD MEDIA
ARITMETICA
DESVIACIO
N
ESTANDAR
varianza
A 400-400-400 400 0 0
B 200-400-600 400 163,3 26666,89
C 300-400-500 400 81,65 6666,7225
Solucin del EJEMPLO
Respuesta:
Medidas de dispersin / desviacin
respecto a la media
Coeficiente de variacin:
Es la razn entre la desviacin tpica y la media. Mide la desviacin tpica en
forma de qu tamao tiene con respecto a la media. Tambin se la denomina
variabilidad relativa. se calcula dividiendo la desviacin estndar por la media
x
S
CV =
Si se multiplica por 100 se obtiene el grado de variabilidad respecto de
la media
Es de particular utilidad comparar la variabilidad de 2 o mas
conjuntos de datos con medias diferentes.
El coeficiente de variabilidad es una medida relativa que se
expresa en porcentaje en vez de en trminos de las unidades de
los datos.
Es una forma de estandarizar el desvo
Indica la relacin entre el desvo y la media
EJEMPLO CUANDO LAS VARIABLES DE
LAS DISTRIBUCIONES A COMPARAR SEAN
DE IGUAL NATURALEZA.
ESTADGRAFO SUELDOS
Empresa pequea Empresa grande
Media aritmtica 100000 2000000
Desviacin estndar 10 200000
Diga en que empresa ha habido mayor variacin
Resolucin del ejemplo
ESTADGRAFO SUELDOS
Empresa pequea Empresa grande
Media aritmtica 100000 2000000
Desviacin estndar 10.000 200000
x
S
CV =
Cv = 10000 .100
100,000
CV = 10% CV = 10%
Cv = 200000 .100
2,000.000
A simple vista podamos haber estimado que la Empresa Grande habran
existido mayor variacin dad su media y su desviacin estndar, sin embargo
mediante el coeficiente de variacin podemos comprobar que tiene la misma
variacin
EJEMPLO CUANDO LAS VARIABLES DE LAS
DISTRIBUCIONES A COMPARAR SEAN DE DISTINTA
NATURALEZA.
ESTADGRAFO VARIABLES
MINUTOS DE
ATRASOS
PRODUCTOS
VENDIDOS
Media aritmtica 49,27 30,80
Desviacin estndar 8,97 9,83
Diga EN QUE VARIABLE OCURRE MAYOR VARIACION
SOLUCION DEL EJEMPLO ANTERIOR
ESTADGRAFO VARIABLES
MINUTOS DE
ATRASOS
PRODUCTOS
VENDIDOS
Media aritmtica 49,27 30,80
Desviacin estndar 8,97 9,83
CV = 8,97 (100) CV = 9,83 (100)
49,27 30,80
V = 18% V= 32%
RESPUESTA: Con los resultados del coeficiente de variacin
determinamos que la distribucin de productos vendidos
(32%), tiene mayor variacin que la serie de minutos de
atrasos (18%).
AMPLITUD O RANGO:
La diferencia entre las observaciones extremas.
2, 1, 4, 3, 8, 4.
EL RANGO ES : 8-1=7
LA FORMA DE LA
DISTRIBUCIN
Una caracterstica de un conjunto de datos es la forma, es decir, la manera en que estn
distribuidas las observaciones.
La distribucin de los datos puede ser o no SIMTRICA. Si la distribucin de los datos no
es simtrica, se llama ASIMTRICA O SESGADA.
Para describir la forma se puede comparar LA MEDIA Y LA MEDIANA.
Tambin puede observarse a travs del coeficiente de asimetra Mide el grado de Simetra /
Asimetra de la distribucin
EJEMPLO DE UNA DISTRIBUCION SIMETRICA
ASIMETRA O SESGO
Una distribucin es simtrica si la mitad izquierda de
su distribucin es la imagen especular de su mitad
derecha.
En las distribuciones simtricas, media y mediana
coinciden. Si slo hay una moda tambin coincide
La asimetra es positiva o negativa en funcin de a
qu lado se encuentra la cola de la distribucin.
La media tiende a desplazarse hacia las valores
extremos (colas).
Mdn = Media
EN LA DISTRIBUCIN NORMAL ES SIMTRICA SI
MEDIA = MEDIANA: SIMTRICOS O CON SESGAMIENTO
CERO.
Mdn
Media
Si es + indicar muchos casos en los valores ms bajos y
pocos en los ms altos positivamente asimtrica .
Media > Mediana: Positivos o con sesgamiento a la derecha
Mdn
Media
Si es - indicar muchos casos en los valores ms altos y
pocos en los ms bajos negativamente asimtrica.
Media < Mediana: Negativos o con sesgaminto a la
izquierda.
LA CURTOSIS NOS INDICA EL
GRADO DE APUNTAMIENTO
(APLASTAMIENTO) DE UNA
DISTRIBUCIN CON RESPECTO A
LA DISTRIBUCIN NORMAL O
GAUSSIANA. ES ADIMENSIONAL
LA CURTOSIS
Otra manera de apreciar la forma de una distribucin es
observar el nivel de apilamiento o llanura de la curva
LA FORMA DE LA DISTRIBUCIN
leptocrtica
(menor dispersin)
LEPTO= ESBELTO
Platicrtica
(mayor dispersin)
PLATO= ANCHO O PLANO
Mesocrtica
MESO= MITAD
Leptocrtica: curtosis > 0
Mesocrtica: curtosis = 0
Platicrtica: curtosis < 0
4 K>0 (LEPTOCURTICA
f(X media) K < 0 (PLATICURTICA).
K = n - 3 K = 0 (MESOCURTICA)
4
S
Calcule el coeficiente de curtosis y diga como es la curva atendiendo
al mismo
L i
Ls
Xi
fi
Xi.fi
X-Xm=x
4
X
4
fi . x
2
fi. X .
0 2 1 20 20 1-10= -9 6561 131220 20
3 5 4 30 120 4-10=-6 1296 38880 480
6 8 7 80 560 7-10=-3 81 6480 3920
9 11 10 129 1290
10-10=0 0 0 12900
12 14 13 80 1040 13-10=3 81 6480 13520
15 17 16 30 480 16-10=6 1296 38880 7680
18 20 19 20 380 19-10=9 6561 131220 7220
Total 389 3980 353160 45740
353,16
K = 389_ - 3 K = 907,87 - 3
(4,19)
4
308,22
K = 2,95- 3= -0,05
Por su cercana al cero se le puede considerar simtrica
MESOCURTICA
GRFICOS PARA VARIABLES
CONTINUAS
Histogramas para variables
continuas
El rea que hay bajo el histograma entre
dos puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en el
intervalo.
20 40 60 80
Edad del encuestado
50
100
150
200
250
R
e
c
u
e
n
t
o
Qu hemos visto?
Introduccion
HISTORIA DE LA ESTADISTICA.
Utilidad de la estadstica.
Pasos en un estudio estadstico.
Definiciones bsicas en estadstica
Poblacin y Muestra
Variables
Cualitativas
Numricas
Presentacin ordenada de datos.
Estructura de las tablas estadisticas
Tablas de frecuencias y Representaciones grficas
Medidas descriptivas
Medidas de centralizacin: Media, mediana y moda
Medidas de dispersin (varianza, desviacin estandar, CV, rango
Asimetra y Medidas de apuntamiento (curtosis)
Regresin y correlacin
Asociacin entre variables
Hemos visto las distribuciones Unidimensionales , esto es analizamos una sola variable
(peso, contenido de glucosa, sueldos, edad, etc.) y se describi su comportamiento a travs
de tablas y grficos y medidas tanto de tendencia central como de dispersin, (media y
desviacin estndar).
Correlacin significa relacin mutua y expresa el grado de asociacin
existente entre las variables,
Cuando estudiamos dos variables en su posible relacin, influencia o dependencia se busca
como objetivos Establecer la naturaleza de la relacin digamos tambin
PREDECIR
El comportamiento de dichas variables . As por ejemplo un medicamento determinado
conlleva a una mejora durante un tiempo dado, , pero podemos preguntarnos si se
continua con el mismo podramos tener iguales resultados ?
Su parmetro es el coeficiente de correlacin. Su smbolo es r, que puede acompaarse, si la
claridad lo exige, de un subndice con la notacin de las variables (p.e. rxy)
La precisin de nuestra prediccin depende de l a :
FUERZA DE LA RELACION QUE TIENE LAS VARIABLES MEDICAMENTO Y MEJORA.
Este anlisis de relacin entre dos variables nos lleva al estudio de la
REGRESION Y CORRELACION
Regresin
Estimamos la relacin de una variable con otra en trminos de una
funcin lineal (o ms compleja ) de la otra. Nos permite adems hacer
predicciones . Hoy en da el sentido de regresin es el de prediccin de
una medida basndonos en el conocimiento de otra. (Variables
cuantitativas continuas ).
La regresin es la forma, el COMO de esa asociacin. Expresa la
relacin entre las dos variables, X e Y, mediante la ecuacin de
regresin y su representacin grfica la lnea de regresin.
Mediante ella conocida una variable es posible predecir la otra. Por
consenso X es la variable Independiente e Y la dependiente. De esta
forma Y = f(X).
Coeficiente de
Correlacin
Estimamos el grado en que 2 o ms variables cambian
simultneamente. (Variables cuantitativas continuas ).
Se plantea que
LA CORRELACIN MIDE LA FUERZA DE UNA RELACIN ENTRE
VARIABLES
LA REGRESIN DA LUGAR A UNA ECUACIN QUE DESCRIBE
DICHA RELACIN EN TRMINOS MATEMTICOS
En nuestro trabajo podemos sealar los siguientes ejemplos de
Relaciones bidimensionales :
Edad y peso
Contenido de glucosa y diabetes
Enfermedad y tipo de medicamento o clase.
DIAGRAMA DE DISPERSIN
Regresin
El anlisis de regresin sirve para predecir una medida en funcin de
otra medida (o varias).
Una funcin es una relacin matemtica que nos permite predecir que valores
de una variable Y corresponden a determinados valores de una variable X. tal
relacin generalmente se escribe como:
Y = F(X)
Y - variable dependiente
(predicha o explicada)
X - variable independiente
(predictiva o explicativa)
El diagrama de dispersin es una grfica de puntos en la que cada punto
del plano representa un par de valores correspondientes de la
variable X e Y
y = a + b x
Ecuacin de regresin b es la pendiente y el coeficiente de regresin
y a el intercepto
Ejemplos de varios tipos de relaciones
y = a + b x LINEAL
y = a + b x + c x
2
Cuadrtica
y =ab
n
Exponencial
y = log a + x log b Logaritmica
El objetivo de la Regresin lineal
es encontrar la lnea que mejor predice la Y a partir de la X.
Es + cuando al aumentar el valor de X tambin aumenta el de Y o
viceversa. Cuando disminuye la X tambin disminuyen los valores de Y.
Es - cuando al aumentar el valor de X disminuyen los valores de Y o
Cuando disminuye la X aumentan los valores de Y
Relacin directa
Ventas (millones Dls)
10
9
8
7
6
aos
1 2 3 4 5 6 7 8
ANALISIS DE REGRESION
COMO VIMOS EL OBJETIVO FUNDAMENTAL DE UN ANLISIS DE REGRESIN ES PREDECIR EL
VALOR DE LA VARIABLE DEPENDIENTE (Y) CONOCIENDO EL VALOR DE LA OTRA.
EN UN SENTIDO AMPLIO LA REGRESIN BUSCA COMO OBJETIVO UNA LNEA O UNA FUNCIN
MATEMTICA QUE EXPRESE SIN IRREGULARIDADES LA RELACIN ENTRE DOS VARIABLES.
Ejemplo de confeccin de curva dosis /efecto
En un experimento con ratones se suministraron varias dosis de una planta
medicinal determinada y se encontr que los pesos corporal aumentaban
como se observa en la tabla. Confeccione la curva correspondiente como
es la pendiente de la curva con relacin al signo.
X y
1 21
2 22
3 23
4 24
5 25
6 26
y = a + b x
De no darse esta relacin perfecta y de hecho en la prctica no es as
o sea no se disponen los pares ordenados en una lnea ideal.
La regresin tiene como objetivo determinar la Relacin Funcional de
las dos variables a travs de una ecuacin y una lnea que describa la
forma de relacin existente , es decir determinar un modelo
matemtico que exprese la supuesta relacin funcional entre X e Y.
AJUSTE DE UNA RECTA.
Entonces lo que buscamos es la llamada lnea de Regresin a travs de
una ecuacin matemtica denominada
ECUACION DE LA RECTA.
Ejemplos:
EN UN ENSAYO DE PESO DE ORGANOS EN RATAS MACHOS SE ENCONTRARON
LOS SIGUIENTES RESULTADOS . Ver tabla en la pagina siguiente
PREGUNTAS:
Diga cuales son los pares ordenados.
Porque se dicen que forman u par
Plotee los resultados obtenidos de los pares ordenados
Que conclusiones puede obtener
Cual es la ecuacin que representan estos resultados
DATOS DEL PROBLEMA ANTERIOR
X Y
100 40
200 45
300 50
400 65
500 70
600 70
700 80
DATOS DEL PROBLEMA ANTERIOR
80
60
40
20
10
0
0 100 200 300 400 500 600 700
EL MEJOR METODO MATEMATICO UTILIZADO EN ESTADISTICA PARA
OBTENER UNA ECUACION DE REGRESION Y AJUSTAR LA RECTA ES EL
DENOMINADO
METODO DE LOS MINIMOS CUADRADOS
CUANDO UNA LINEA RECTA NO PUEDE AJUSTARSE PERFECTAMENTE A LOS PUNTOS DEL
PLANO , LAS DESVIACIONES ENTRE LOS VALORES INDIVIDUALES REALES (Y) Y LA RECTA
IDEAL (YC) SE LE MINIMIZA A TRAVS DEL METODO DE LOS MINIMOS CUADRADOS QUE
PROPORCIONA LA RECTA DE MEJOR AJUSTE PUES MINIMIZA LA SUMA DE LOS CUADRADOS
DE LAS DESVIACIONES CON RESPECTO A LA RECTA.
METODO DE LOS MINIMOS CUADRADOS
ES EL METODO MATEMATICO UTILIZADO PARA DETERMINAR LA ECUACION DE REGRESION
QUE MINIMIZA LA SUMA DE LOS CUADRADOS DE LAS DISTANCIAS ENTRE LOS VALORES
REALES Y LOS PRONOSTICADO O ESTIMADOS (YC).
PARA COMPRENDER ESTE TERMINO PONDREMOS UN EJEMPLO MATEMATICO
LA ECUACIN LINEAL ES
Y = a + b X
EN NUESTRO CASO QUEREMOS HALLAR LA LNEA IDEAL Y LA ECUACION DE REGRESION
QUE VIENE DADA POR LA ECUACION
Y c = a + b X
Ahora como se calculan los valores de a y b
METODO DE LOS MINIMOS CUADRADOS
_ _
b= XY - n X Y
2 _2
X - n X
mientras que _ _
a = Y - b X
Con estas formulaciones podremos hallar la lnea ideal y la
ecuacin de regresin.
Veamos un ejemplo
EN UN EXPERIMENTO QUE RELACIONABA LOS AOS DE EXPERIENCIA DE UN
FARMACUTICO Y LAS UNIDADES DE MEDICAMENTOS VENDIDOS EN LA FARMACIA,
DURANTE UN DETERMINADO TIEMPO SE OBTUVIERON LOS DATOS SIGUIENTES.
OBTENGA LA ECUACION LINEAL DE REGRESION
FARMACEUTI
CO
AOS DE
EXPERIENCI
A (X)
UNIDADES
VENDIDAS
(Y)
XY 2
X
2
Y
A 6 90 540 36 8100
B 5 60 300 25 8600
C 3 40 120 9 1600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2500
G 6 80 480 36 6400
H 2 20 40 4 400
FARMACEUTI
CO
AOS DE
EXPERIENCIA (X)
UNIDADES
VENDIDAS
(Y)
XY 2
X
2
Y
A 6 90 540 36 8100
B 5 60 300 25 8600
C 3 40 120 9 1600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2500
G 6 80 480 36 6400
H 2 20 40 4 400
Totales
N= 8
30 400 1780 136 24400
Empleando las frmulas que conocemos calculamos las medias de
X e Y
_ _
X =3,75 Y= 50
PARA CALCULAR
b y a
_ _
b= XY - n X Y = 11.91
2 _2
X - n X
_ _
a = Y - b X = 5.34
Como Yc = a + b (X)
Por tanto la ecuacin lineal de la recta de regresin ser:
Yc= 5.34 + 11.91
De aqu podremos obtener la recta de mejor ajuste
De forma que si damos los valores siguientes a
X= 1 sustituyendo en la ecuacin obtenida
esto implica que Y = 17,25
X= 1 SUSTITUYENDO EN LA ECUACIN OBTENIDA
ESTO IMPLICA QUE
Y = 17,25
POR OTRA PARTE
PARA EL PUNTO X= 6 SUSTITUYENDO EN LA ECUACIN HALLADA
Y= 76,80
FINALMENTE PLOTEANDO EN EL GRFICO LOS PARES DE VALORES OBTENIDOS:
(1, 17.25) Y (6, 76.80) CON UNA PENDIENTE DE 11.91
Aos de experiencia
Unidades vendidas
0 1 2 3 4 5 6
(6,76.80)
(3,75; 50)
5,34 a
(1,17.25)
Media
50
17.25
76.80
PARA REALIZAR PREDICCIONES SOBRE LA BASE
DE LA ECUACION DE REGRESION DETERMINADA
DEBE CONSIDERARSE LO SIGUIENTE:
1. LA ECUACIN ES VLIDA PARA PRONOSTICAR VALORES YC SOBRE LA
POBLACIN DE DONDE SE ENVO LA MUESTRA. NO SERIA CORRECTO PARA
PRONOSTICAR DE OTRAS FARMACIAS QUE NO FUERA LAS QUE HEMOS
ANALIZADO.
2. DEBE PRONOSTICARSE SOBRE LA BASE DE LOS VALORES DE X QUE ESTN
DENTRO DEL DOMINIO O INTERVALO DE LOS VALORES DE X. SE PUEDE HACER
PREDICCIONES CON LAS DEBIDAS PRECAUCIONES Y CON VALORES PRXIMOS
AL INTERVALO DE DOMINIO DE LA VARIABLE X.
3. LA TEMPORALIDAD O TIEMPO ES UN FACTOR QUE DEBE CONSIDERARSE EN
EL ANLISIS DE REGRESION . PUES SI LA PRIMERA MUESTRA SE TOMO EN EL
2005 , SUS RESULTDFOS NO PDRIAN SER VALIDOS PARA 1990 O 2010.
Cuidado con la Extrapolacin
COEFICIENTE DE CORRELACION DE PEARSON
El diagrama de dispersin da una visin aproximada de la fuerza con que se relaciona las
variables y cuantitativamente esa fuerza de relacin se le mide a travs del denominado
coeficiente de correlacin
El coeficiente de correlacin mide que tan cerca estn los puntos reales de la lnea de
regresin o lnea ideal Yc
Mide la intensidad de la asociacin entre las variables
Es un nmero abstracto, independiente de la unidad de medida de las variables. Puede
adoptar cualquier valor entre 1 y 1.
DICHO DE OTRA Manera
r = (-11). Suele expresarse con 3 decimales, a no ser que valga 1, 0 1.
Aparte de su valor descriptivo sirve para ver la significacin estadstica de la relacin.
La correlacin entre dos variables. Su coeficiente de correlacin se llama de PEARSON,
aunque se dice simplemente COEFICIENTE DE CORRELACIN
Si r = 1 hay una correlacin total (perfecta) positiva.
Si r = -1 hay una correlacin total (perfecta) negativa.
Si r = 0 no hay correlacin.
Si est entre 1 y 0 , la correlacin es parcial y negativa.
Si est entre 0 y 1, la correlacin es parcial y positiva.
Una r de 0, -1 1 apenas se encuentra en la prctica
GRFICAMENTE ESTO SE PUEDE REPRESENTAR AS:
CLCULO DE COEFICIENTE DE CORRELACIN
Veremos nicamente el clculo a partir de los datos originales, aislados.
r = n XY - ( X ) ( Y )
2 2 2 2
[ n( X ) ] - ( X ) ] [ n( Y ) ] - ( Y ) ]
_ _
_
_
_ _
_
Para hacer los clculos se tendr en cuenta la tabla que
presentamos a continuacin
Sean los valores de X = (2 , 1 , 3 , 2 , 5)
Y = (3 , 5 , 4 , 2 , 6),
Los cuales representan las dosis de diferentes ( X ) de un medicamentos
que ofrecen respuesta positiva ante una patologa determinada.
Analice la intensidad de asociacin entre las variables
EJEMPLO DE CALCULO
X
Y
2
X
2
Y
XY
2 3 4 9 6
1 5 1 25 5
3 4 4 16 12
2 2 9 4 4
5 6 25 36 30
13 20 43 90 57
r = 5 x 57 - 13 x 20
2 2
[ 5 x 43 ) - ( 13 ) ] [ 5 x 90) ] - ( 20) ]
r = 25
46 x 50
R= 0.521
Como veremos a continuacin la correlacin es mnima es decir, es
decir que no existe relacion entre la dosis empleada y la mejora
del paciente
FUERZA DE LA RELACION
FUERZA DE LA RELACIN
POSITIVA ESTADO DE LA
CORRELACION
NEGATIVA
r=1 Correlacin perfecta r = -1
0.9 a 0.99 Correlacin excelente - 0.9 a - 0.99
0.80 a 0.89 Correlacin aceptable - 0.80 a - 0.89
0.60 a 0.79 Correlacin regular - 0.60 a -0.79
0.30 a 0.59 Correlacin mnima - 0 .30 a - 0.59
0. a 0.29 No hay correlacin - 0.a - 0.29
EJERCICIO DE TAREA DE TENDENCIA LINEAL (236)
EN UN LABORATORIO SE TIENEN DIFERENTES EQUIPOS PARA DETERMINAR EL
EFECTO DIURTICOS DE LOS MEDICAMENTOS CON DIFERENTES AOS DE USO Y
CUYO PRECIO VARIA COMO SE PUEDE APRECIAR DE LA TABLA SOBRE LA BASE
DE ESTO
1. ELABORAR EL DIAGRAMA DE PUNTOS Y DETERMINAR EL TIPO DE RELACIN
2. ELABORAR LA TABLA DE RELACION CORRELACION
3. CALCULAR LA ECUACION DE REGRESION
4. CALCULAR EL COEFICIENTE DE CORRELACION E INDICAR LA FUERZA DE LA
RELACION
5. ESTIME CUAL SERIA EL PRECIO DEL EQUIPO SI TUVIERA 3 Y 8 AOS DE USO.
6. GRAFICAR LOS PUNTOS REALES Y LA LINEA IDEAL EN UN SOLO GRAFICO
Aos de uso Precio (cientos de
dolares)
2 8
5 7
6 5
7 3
10 1
COEFICIENTE DE CORRELACION DE DATOS ORDINALES DE
SPERMAN
Introduccin:
El coeficiente de correlacin de Pearson es el mas apropiado
cuando los datos son de escala de intervalos o razn pero
cuando se trata de datos cualitativos cuyas modalidades se
han organizado sobre la base a un orden de rango , es decir
los datos han SIDO JERARQUIZADOS DE MENOR A MAYOR O
VICEVERSA, EL COEFICIENTE QUE NOS PERMITE MEDIR LA
RELACION ENTRE ESTE TIPO DE DATOS ES EL Coeficiente de
Sperman
En ocasiones tenemos caractersticas como
Belleza
Conducta
Actividad preferencial
Capacidad de liderazgo
Sabores entre otros
Como sabemos sus datos pueden ser jerarquizados u
organizados ordinalmente
EJEMPLO QUE NOS PERMITE CONOCER EL PROCESO DE LA
DETERMINACIN DE LOS RANGOS
Medidas Rangos
47 1
39 2
38 3
35 4
31 5
29 6
27 7
Obsrvese que el 27 tiene el rango 7 que es el mas bajo del conjunto de
datos mientras que el valor 47 recibe el rango numero 1 por ser el dato con
el valor mas alto
EJEMPLO
Cuando existen datos con valores similares se les asigna el rango promedio a los mismos.
Medidas Rangos
40 1
39 2.5
39 2.5
37 4
20 5
19 6
18 8
18 8
18 8
12 10
10 11
FORMULA DEL COEFICIENTE DE SPEARMAN
UNA VEZ EXPUESTO LA MECANICA DE ASIGNACIN DE RANGOS LA FORMULA DEL
COEFICIENTE DE SPERMAN ES:
R = 1 - 6 D
2
n (n
2
-1)
Al igual que el coeficiente de Pearson el de Spearman puede tomar valores
entre -1 y 1.
PARA APLICAR LA FORMULA SE DEBE SEGUIR EL SIGUIENTE
PROCEDIMIENTO
Primero: Determinar el rango de las medidas
Segundo Obtener la diferencia de los rangos
Tercero Verificar que las sumas de las diferencias de los rangos sea cero (= 0)
Cuarto Elevar al cuadrado las diferencias (D
2)
EJEMPLO DE APLICACIN DEL COEFICIENTE DE
SPEARMAN (DATOS CUANTITATIVOS)
Se receptan dos pruebas una terica y otra practica a dos estudiantes
de farmacologa en un curso de perfeccionamiento. Los resultados de las
calificaciones obtenidas son las siguientes:
Cul es la correlacin entre las pruebas y las calificaciones fueron
aceptable o no?
Estudiantes Prueba
terica
Prueba
practica
rangos Difer0.5en
cia de
1rangos
D
2
X Y X-2 Y = D
1 65 68 9 6.5 2.5 6.25
2 63 66 11 10.5 0.5 0.25
3 67 68 7.5 6.5 1 1
4 64 65 10 12 -2 4
5 68 69 5.5 4 1.5 2.25
6 62 66 12 10.5 1.5 2.25
7 70 68 3 6.5 -3.5 12.25
8 76 75 1 1 0 0
9 68 71 5.5 2 3.5 12.25
10 67 67 7.5 9 -1.5 2.25
11 69 68 4 6.5 -2.5 6.25
12 71 70 2 3 -1 1
N = 12 D = 50
Empleando la frmula )
r = 1 - 6 D
2
n (n
2
-1)
R= 1 6 x 50
12 (12
2
-1)
R = 1 0.17
R = 0.83
CORRELACIN
ACEPTABLE
Ejemplos para datos ordinales
Con el fin de medir la relacin que existe entre las preferencias por el
sabor de ciertas gaseosas y el diseo de sus envases . De las encuestas
realizadas se obtuvieron los siguientes resultados
MARCA DE
GASEOSA
RANGO DE
PREFERENCI
A
X
RANGO DE
DISEO
Y
DIFERENCIA
X - Y = D
D
2
=
COCA COLA 1 2 1- 2 = -1 1
PEPSI 2 5 2 -5 =-3 9
TROPICAL 3 1 3- 1 =2 4
SEVEN 4 3 4- 3 =1 1
FIORA 5 4 5- 4 =1 1
0 16
r = 1 - 6 D
2
n (n
2
-1)
R = 0.20 No hay correlacin
Los ejecutivos de venta de 10 distribuidoras de una empresa de productos
medicamentosos fueron entrenados para elevar su potencial de ventas.
Al cabo del ao sus calificaciones por rango en el programa de entrenamiento
se ordenaron para medir su correlacin con las ventas anualesn, en el cuadro
se presentan los resultados diga como fue la correlacin que se obtuvo.
Ejecutivos Ventas Rango
entrenamiento
X Y
A 319 3
B 150 9
C 175 6
D 460 1
E 398 4
F 300 10
G 280 5
H 200 2
I 190 7
j 300 8
N = 10
DESARROLLO
RANGOS DIFERENCIAS D
2
X Y X - Y = D
3 3 3 - 3 = 0 0
10 9 10 - 9 = 1 1
9 6 9 - 6 = 3 9
1 1 1 - 1 = 0 0
2 4 2 - 4 = -2 4
4.5 10 4.5 - 10 = -5.5 30.25
6 5 6 - 5 = 1 1
7 2 7 - 2 = 5 25
8 7 8 - 7 = 1 1
4.50 8 4.50 - 8 = -3.5 12.25
TOTAL 0 83.50
EMPLEANDO LA FRMULA PROPUESTA
TENDREMOS:
R = 1 - 6 D
2
N (N
2
-1)
R = 0.49
CORRELACION MNIMA
TAREA
Una empresa publicitaria desea determinar si el numero de anuncios comerciales que
se realizan mensualmente por televisin (X) se relacionan con el nmero de ventas de
los artculos que se proporcionan
Numero de anuncios publicitarios Numero de artculos vendidos
X Y
10 30
12 60
15 50
5 12
7 10
5 25
5 10
15 60
8 25
1 10
13 75
15 95
TEMA 9: ELEMENTOS DE PROBABILIDADES
INTRODUCCION
Mediante la Estadstica descriptiva y a travs de las
Tablas
Grficos
Medidas
Damos el informe del comportamiento de un fenmeno o sea una descripcin
de un fenmeno pasado
La probabilidad es una funcin Analitica Inferencial que nos permite a travs de
una muestra tomada de una poblacin
Estimar
Inferir
Hacer deducciones sobre el comportamiento de la poblacin de donde
fue tomada la muestra.
En este caso solo trataremos los elementos de probabilidad pues ella
solo abarcara el curso completo.
El papel de la probabilidad en la estadstica consiste en que el Probabilista
parte de la poblacin deducida de un sinnmero de ensayos o experimentos
para a partir de esta poblacin deducida analizar el compartimiento de la
muestra.
En cambio el estadista estima infiere la poblacin a partir de una muestra ,
realizando el proceso inverso de probabilista parte de la poblacin
EL PAPEL DE LA PROBABILIDAD EN LA ESTADSTICA
Consiste en que el Probabilista parte de la poblacin deducida de un
sinnmero de ensayos o experimentos para a partir de esta poblacin
deducida analizar el compartimiento de la muestra.
En cambio el estadista estima infiere la poblacin a partir de una muestra
realizando el proceso inverso de probabilista
MODELOS MATEMATICOS
Deterministas
Cuando es posible determinar de antemano los cambios de una variable
los modelos se denominan deterministas son modelos que emplean las
ciencias qumica,, fsicas, etc..
No todas las conductas humanas pueden estar ceidas a un modelo
matemtico determinista, donde inexorablemente deben cumplir se ciertas
leyes, muy por el contrario hay conductas que se desarrollan en la
incertidumbre y para ello se crearon los modelos matemticos denominado
Modelos probabilsticos.
Estos modelos no describen exactamente lo que ocurrir DADA UNA
SITUACIN SINO
QUE ESTIMA LO QUE ES POSIBLE QUE SUCEDA
Mecnica de la probabilidad y conceptos bsicos
La mecnica de la Probabilidad es estimar o inferir de que algo ocurrir:
Cual es la probabilidad de al lanzar una moneda caiga cara o escudo
Cual es la probabilidad de que caiga 3 al lanzar un dado
Conceptos bsicos de probabilidad
Que es probabilidad
La posibilidad de que algo ocurra
Como se mide la probabilidad?
La probabilidad es un numero que se mide entre uno y cero
0 P 1
Cuando existe la CERTEZA DE QUE UN EVENTO OCURRA
LA Probabilidad es :
Ej: sol
Cuando existe la certeza de que un evento no puede ocurrir es:
Ej : dado nmero 7
Que mide la probabilidad?
Mide la posibilidad de que llegue a ocurrir un evento como resultado de
un experimento
En el ejemplo de la moneda
Cara = 1/2
Cara + escudo
Valor fraccionado Valor decimal Valor porcentual
1/2 0.5 50 %
Espacio muestral
El conjunto de todos los resultados posibles de un experimentos se
denomina espacio muestral (S)
S = cara, escudo
S = 1,2,3,4,5,6
TIPOS DE PROBABILIDAD
LA PROBABILIDAD SE CLASIFICA EN:
CLASICA
DE FRECUENCIA RELATIVA
SUBJETIVA
Probabilidad clsica:
Podemos describirla de esta manera:
Probabilidad de un evento= nmero de resultados favorables
nmero de resultados posibles
Tambin puede expresarse de la forma siguiente:
Experimento en el lanzamiento de una moneda que salga cara
Levantar una carta de un juego de cuatro cartas correspondientes a los
cuatro ases de un juego de cartas Sea el as de brillo
P = as de brillo = 1/6
ases : brillo, trbol, corazn rojo, negro
P = f
n
Lanzamiento de un dado
Que caiga el nmero 3
PROBABILIDAD DE FRECUENCIA RELATIVA
Se determina por la va experimental.
La idea de frecuencia relativa es que la probabilidad se calcula despus
de una serie de ensayos y experimentos es decir se basa en la
experiencia pasada
Nmero de veces que
Probabilidad de que suceda un evento= el evento ocurri en el pasado
Nmero total de
observaciones
Veamos un Ejemplo :
EN UN LABORATORIO DE PRODUCCION DE MEDICAMENTOS SE TIENE REGISTRADOS
LOS SIGUIENTES DATOS SOBRE EL CONTENIDO DE UN DETERMINADO MEDICAMENTO
Evento Contenido Product
o
Probabilidad de
ocurrencia del evento
A Peso inferior 50 50/1000= 0.05
B Peso correcto 850 850/1000=0.85
C Peso superior 100 100/1000= 0.10
1000 1.00
Como puede observarse necesariamente la suma de todos los resultados es
igual a la unidad
Nos podemos plantear las siguiente probabilidades
Al tomar al azar un medicamento este tenga el peso inferior , peso correcto
o peso superior a lo que establece la norma.
Sea peso inferior
P (A) = 50/1000 = 0.05
Respuesta existe un 5 % de probabilidad de que el medicamento tomado sea
de peso infeiro al que establece la norma
Calcular correcto y el superior
CARACTERISTICAS DE LAS PROBABILIDADES DE FRECUENCIA
RELATIVA
1. La probabilidad obtenida no es el valor real sino una aproximada
estimacin del mismo
2. Cuanto mas ensayos o experimentos hagamos previamente los
resultados estimados sern mas exactos. Esto equivale a decir
que mientras mayor sea el tamao de la muestra mejor ser la
estimacion de la probabilidad.
3. Para la validez de la estimacin de la probabilidad deben darse
idnticas condiciones en las que se recopilaron los datos
Regla del complemento
Como ya sabemos la
0 P 1
De aqu podemos ratificar:
1. Ninguna probabilidad es mayor que 1
2. Ninguna probabilidad es menos a 0, no pueden existir
probabilidades negativas.
Si se designa con P(A) la probabilidad de que un evento
_
ocurra y con P(A) de que no ocurra, se obtiene las siguientes
relaciones conocidas como
Regla del complemento
1. La probabilidad de que un evento ocurra mas la que no
ocurra es igual a 1
_
P(A) + P(A)= 1
2. La probabilidad de que un evento A ocurra es igual a la
unidad menos la probabilidad de que no ocurra.
3. La probabilidad de que el evento no ocurra es igual a la
unidad menos la probabilidad de que ocurra
Ejercicio
Si designa a la ocurrencia de un evento como P y la probabilidad de que
no ocurra como Q y si lanzamos la moneda y designamos con P el
evento de que caiga cara y Q de que sea sello, como se representaran
estos eventos
EJEMPLOS DEL PROGRAMA RESOLVER
a) p de que al tirar un dado dos veces salgan en ambas un 6.
b) p de que al tirar dos dados salga en ambos un 6 seis en el primer dado y
seis en el segundo
c) La p de ser rubio es de 0,3 y la de llevar gafas es de 0,2 . Calcular la p de
que una persona cualquiera sea rubia y lleve gafas (se asume que son
independientes).
d) en una caja hay 3 bolas blancas y 2 negras. Calcular la p de que sacando
dos bolas, las dos sean negras.
e) p de que al sacar una carta de una baraja espaola de 40 cartas sea oros o
copas.
f) p de que al sacar una carta de esa baraja sea as o espadas.
hay 4 ases , 10 espadas y 1 as de espadas (que cuenta como as y como
espada, entre 40, que debe ser compensada)
g) p de acertar 6 en la Primitiva
Hay 49 bolas. Como no hay reemplazo, cada vez que sale una bola, queda una
menos en el bombo.
h) p de que tirando un dado 4 veces, la primera vez que salga un 5 sea
en la 4 tirada.
Respuestas
a. seis en la 1 tirada y 6 en la 2
p(2 veces 6) = 1/6 * 1/6 = 1/36 (mejor que 0,0278).
b. es el mismo caso que a).
c. p(rubio y gafas) = 0,3 * 0,2 = 0,06 ( 6%).
d. Nos piden la p de que sea negra la primera y negra la segunda.
la p de ser negra de la 1 bola es 2/5 ; una vez sacada quedan 4 bolas (una,
negra). la p de ser negra de la 2 bola es de
p( 2 bolas negras) = 2/5 * = 2/20 = 1/10 ( 0,1 10%).
e. p(oros o copas) = 10/40 + 10/40 = 20/40 = ( 0,5 50%).
f. hay 4 ases , 10 espadas y 1 as de espadas (que cuenta como as y como
espada, 1 entre 40, que debe ser compensada)
p(As o Espada) = 4/40 + 10/40 1/40 = 13/40 = 0,325
gHay 49 bolas. Como no hay reemplazo, cada vez que sale una bola, queda
una menos en el bombo. Para acertar los 6 resultados hay que acertar el
primer nmero y el segundo y el tercero...y el sexto.
p(6 aciertos) = 6/49 * 5/48 * 4/47 * 3/46 * 2/45 *1/44 = 1 /13.983.816
h. p de que tirando un dado 4 veces, la primera vez que salga un 5 sea
en la 4 tirada.
p(5 slo en la 4) = p(no 5 en la 1)*p(no 5 en la 2)*p(no 5 en la
3)*p(5 en la4) = 5/6 * 5/6 * 5/6 * 1/6 = 125/1296 = 0,096
EVENTOS Y TIPOS
1. MUTUAMENTE EXCLUYENTES
2. EVENTOS QUE NO SON MUTUAMENTE EXCLUYENTES
3. EVENTOS COLECTIVAMENTE EXHAUTIVOS
EVENTOS MUTUAMENTE EXCLUYENTES
Se dice que dos eventos son mutuamente excluyentes si Uno solo y solo
uno de los eventos de un experimento puede ocurrir a la vez,. En el
nacimiento de un beb se tiene varn o hembra siempre que sea un
parto de solo nio.
EVENTOS QUE NO SON MUTUAMENTE EXCLUYENTES
Se dice que dos eventos no son mutuamente excluyentes cuando es
posible que dos eventos ocurran simultneamente.
Por ejemplo:
Escoger a un mujer que sea enfermera para un puesto de trabajo.
EVENTOS QUE COLECTIVAMENTE EXHAUTIVOS
Cuando una lista de los eventos que puedan resultar de un experimento
incluye todos los resultados posibles, se dice que es colectivament3e
exhaustivos
Tema 9 . Distribuciones fundamentales de probabilidad
Ya hemos visto que los fenmenos naturales siguen el modelo indeterminista, es
decir las leyes del azar, entendido como la combinacin de mltiples factores, en
gran parte desconocidos e incontrolables, que conducen a resultados no
previsibles de antemano, aunque s conocidos, que se caracterizan por su
variabilidad en los diferentes individuos. A cada uno de los posibles resul- tados
se asocia una probabilidad, que en sucesos sencillos o poco complejos es fcil
de calcular por las leyes bsicas o fundamentales de la probabilidad, pero al
aumentar la complejidad el cl- culo se hace muy difcil o imposible. Entonces
hay que recurrir a una serie de modelos tericos, las llamadas distribuciones o
leyes fundamentales de la probabilidad, que nos permiten hacer el clculo con
relativa facilidad. Al aumentar el n de individuos todas las distribuciones se van
aproximando y acaban confluyendo y hacindose una en el infinito.
Clasificacin
a) para variables discretas
--Distribucin. binomial
--Distribucin de Poisson
--Distribucin hipergeomtrica
b) para variables continuas
--Distribucion Normal
--Distribucion de la t de Student
--Distribucion de la 2 de Pearson
--Distribucion de la F de Snedecor-Fisher
Para todas valen los principios que ya conocemos:
0 p 1 p + q = 1
p(x) = 1
DISTRIBUCION BINOMIAL
Concepto
Es el modelo bsico de distribucin de las variables discretas (o discretizadas),
que como ya sabemos pueden ser reducidas en ltima instancia a
dicotmicas.
Experimentos binomiales
Pueden ser elementales y complejos
Los elementales tienen dos resultados posibles:
xito (cuando aparece el resultado que se pre-tende) y
Fracaso , que puede ser nico o mltiple. Sus probabilidades respectivas son p
y q
En los complejos
el experimento elemental se repite n veces
--obteniendo r xitos ( de 0 a n) : 0 r n
--cada modalidad de la variable va asociada a una r .
Como r empieza en 0 siempre hay n+1 modalidades: la de r=0 y las de r
entre uno y n.
-- un experimento binomial complejo puede repetirse N veces. Cada moda-
lidad aparecer Nr veces.
Notacin
La distribucin suele designarse como DB, pero cuando se dan los
parmetros tpicos, la n y la p del suceso elemental, se utiliza slo B .
As: B(n , p)
Experimento xito p n r notacin
elemental: lanzar 1 moneda
complejo: lanzar 4 monedas
salir cara
salir cara
0,5
0,5
1
4
0 , 1
0 , 1 , 2 , 3 , 4
B(1 , 0,5)
B(4 , 0,5)
elemental: lanzar un dado
complejo: lanzar 5 dados
salir 1
salir 1
1/6
1/6
1
5
0 , 1
0 , 1 , 2 , 3 ,
4, 5
B(1 , 1/6)
B(5 , 1/6)
elemental: familia con 1 hijo
complejo: familia con 4 hijos
ser chica
ser chica
0,5
0,5
1
1
0 , 1
0 , 1 , 2 , 3 , 4
B(1 , 0,5)
B(4 , 0,5)
Algunos ejemplos:
El lanzamiento de las 4 monedas se puede repetir N veces. O
podemos estudiar N familias de 5 hijos.
Clculo de las p de r
p (r)= n! p
r
q
n r
r !* (n r )!
Grfico
Diagrama de barras
Otros parmetros _
Media o esperanza matemtica: X = np
la media representa el n esperado de xitos en el experimento
Varianza: s2 = npq
y por tanto, desviacin estndar: s =npq
n , p , N y Nr
Conviene insistir en estos smbolos que son bsicos en la DB.
n : veces que se repite el suceso elemental en un experimento binomial.
Si n=1 es un experi-mento simple;
si >1, es complejo
p : probabilidad del suceso elemental
N : veces que se repite el experimento complejo.
Si no se dice nada, N=1
Nr : frecuencia de cada modalidad tras N repeticiones. Nr = N
----Si tiramos una moneda 1 vez, es una B(1 , 0,5) . Podemos obtener
0 1 cara (r). N=1
Si este experimento lo repetimos 3000 veces (N) seguir siendo una
B(1, 0,5) pero con N=3000. r sigue valiendo 0 y 1. Nos pueden salir
p.e. 1450 caras. Entonces No = 1550 y N1 = 1450
Si tiramos de una vez 3000 monedas pueden salir entre 0 y 3000 caras
(r). Es una B(3000 , 0,5) ; n=3000 ; N=1
Si obtenemos 1450 caras (c), habr habido 1550 cruces (k). Como slo
se hace una vez, se suele asimilar al caso anterior y se dice que
No = 1550 ; N1 = 1450, aunque realmente no es correcto. Mejor sera
Nc y Nk.
Si tiramos tres monedas 1000 veces y obtenemos 0 caras en 115
ocasiones, una cara en 380, dos caras en 370 y tres caras en 130: es
una B(3 ; 0,5) , n=3 , N=1000 , N0=115 , N1=380 , N2=370 y
N3=130
Problemas asociados a la Distribucin Binomial
1) calcular p(r) : nos pueden pedir el clculo de una r en concreto o de todas
ellas. Como ejemplo vemos la p de 2 caras lanzando 3 monedas. Es B(3 , 0,5)
1- Aplicando la frmula
p (r)= n! p
r
q
n r
r !* (n r )!
p(r = 2) = 3!........0,5
2!*1!
0, 520, 51 = 0, 3750
2 - Mtodo Intuitivo (cuenta de la vieja). Vlido para una p elemental de 0,5.
Veremos no slo la p(r=3) sino todas las p(r). Hay que considerar todas las
combinaciones posibles de cara (c) y cruz (k).
Si el lanzamiento de las 3 monedas se repite 200 veces, tericamente
se obtendrn lo siguiente:
0 caras : N0 = 200 * 1/8 = 25
1 cara : N1 = 200 * 3/8 = 75
2 caras : N2 = 200 * 3/8 = 75
3 caras : N3 = 200 * 3/8 = 25
calcular la media, varianza, desviacin estndar
x = np ; S
2
= npq ; s= npq
En el ejemplo de las monedas:
x = 3 * 0,5 = 1,5
S
2
= 3 * 0,5 * 0,5 = 0,75
s = 3 * 0 ,5 * 0 ,5 = 0 ,866
r Nr r*Nr
0 4096 0
1 4096 4096
2 1536 3072
3 256 768
4 16 64
10000 8000
Ejemplo:
Lanzadas 4 monedas 10000 veces se han obtenido los resultados que se muestran en la
tabla:
0 caras en 4096 ocasiones, 1 cara en 4096, 2 caras en 1536, 3 caras en 256 y 4 caras en 16.
x = 8000 = 0 ' 8
10000
0'8=4p p=0'2
por tanto es una B (4 , 0'2)
DISTRIBUCION NORMAL
Es la distribucin tpica de variables aleatorias cuantitativas continuas
cuando el tamao es grande (por consenso, cuando N30) . Sus
parmetros bsicos son la media y la desviacin estndar.
La curva normal o de Gauss es un modelo matemtico que representa la
distribucin ms frecuente de los errores en las mediciones experimentales.
Es una distribucin de frecuencia para variables continuas
Su desarrollo se debe fundamentalmente a Laplace y Gauss. Quetelet le dio
el nombre de NORMAL O NATURAL porque observ que la gran mayora de
variables fisiolgicas seguan este modelo.
Es un nombre consagrado por el uso y no quiere decir que las otras
distribuciones sean anormales.
Los norteamericanos usan y han exportado la denominacin de distribucin
gaussiana.
Siguen la DN todo tipo de variables biolgicas ( como frecuencia cardaca,
tensin arterial, componentes qumicos de la sangre y orina, medidas
corporales...), duracin o vida de objetos y seres vivos, etc.
_
Notacin : N( x , s)
Frmula
La frmula para calcular las p asociadas a intervalos de valores ( no se
pueden calcular p de valores puntuales, ya que en el contexto de la DN
son infinitsimos) es muy compleja y necesita integracin.
Pero afortunadamente no hay que utilizarla, pues se dispone de una
tabla de fcil manejo, que nos da el clculo ya hecho.
Est caracterizada por la media, , y la desviacin tpica, .
A ttulo informativo la frmula es:
Su funcin de densidad es:
a p b
Representacin grfica
es la curva o campana de Gauss, en chapeau de gendarme (gorro de
gendarme) de los tiempos
napolenicos. Es el lmite de un histograma cuando la amplitud de las
clase se hace infinitesimal y el n de datos tiende a infinito.
2
2
1
2
1
) (
|
.
|
\
|
=
o
t o
x
e x f
Es simtrica alrededor de un eje vertical que pasa por x y
asinttica al eje de abscisas (lo corta en el infinito por ambos lados,
aunque a partir de x 3s ya casi lo toca).
La campana engloba todos los valores y por tanto la p de que un valor
cualquiera est en ella es 1 100%.
La superficie de campana delimitada por dos valores del eje de abscisas
equivale a la probabilidad de que un valor cualquiera se encuentre en ese
rea.
Cada distribucin tiene su propia campana, hay infinitas curvas de DN. En
estas condiciones su manejo sera muy difcil y complicado, ya que habra
que aplicar cada vez la frmula. Afortunadamente se ha encontrado un
modelo nico de distribucin y por tanto de campana al que pueden ser
adaptadas todas las DN.
Es la llamada DN tipificada.
Tipificacin _
Consiste en transformar cualquier N( x , s) en otra N(0 , 1), es decir, en una
DN de media 0 y desviacin estndar 1. Para ello hay que transformar los
valores originales x en puntuaciones estndar o valores tipificados, que aqu
llamaremos c. (Otros nombres: z o SDS).
c = x x s
S
Entre dos valores de c quedan delimitadas reas (=probabilidad) que
se pueden obtener a partir de la tabla de la DN tipificada.
Ya se ha dicho al principio que no se pueden calcular p de valores
aislados, slo de intervalos ms o menos grandes.
En esta campana estn representadas las reas o probabilidades entre valores de
c +1 y 1 , +2 y 2 , +3 y 3 . Pero es preferible expresar la p con nmeros
ms redondos :
---Al intervalo entre c = -1,96 y c = 1,96 corresponde un 95% de la superficie de
la campana. p(1,96 c 1,96) = 0,95 95%
---Al intervalo entre c = -2,58 y c = 2,58 corresponde un 99% de la superficie de
la campana. p(2,58 c 2,58) = 0,99 99%
---
Dada una variable de media y desviacin tpica , se denomina
valor tipificado, z, de una observacin x, a la distancia (con signo)
con respecto a la media, medido en desviaciones tpicas.
o
=
x
z
-1 o 1
-
La interpretacin es clara: Asigna a todo valor de N(, ), un valor de
N(0,1) que deja exactamente la misma probabilidad por debajo.
Como ejemplo podemos ver:
Al intervalo entre c = -3,30 y c = 3,30 corresponde un 99,9% de la superficie
de la campana. p(3,30 c 3,30) = 0,999 99,9%
que son los que utilizaremos aqu.
Es imprescindible dibujar una campana y marcar en ella la media y el valor o
valores de x.
Una vez tipificada se anotan el los valores de c.
A la media le corresponde siempre por definicin el valor de 0
Problemas asociados a la DN
1---tipificar
p.e. x=5 y x=3 de una B(4 , 2)
c = (5-4)/2 = 0,5 c = (3-4)/2 = -0,5
2---calcular la probabilidad de un intervalo,
p.e. entre c = 0 y c = 0,46 p(0 c 0,46) = 0,1772
Ejemplo:
La duracin media de un MEDICAL DEVICES ,es de 12 meses, con
una varianza de 4. El fabricante garantiza que pudiera durar 8 meses
ms. Calcular
1) la probabilidad de que se inactive en el periodo de garanta
2) la probabilidad de que dure al menos 16 meses
3) la probabilidad de que dure entre 15 y 18 meses
La variable Vida de la bombilla es una N(12, 2)
1) p(x 8) ?
se dibuja la campana
se tipifica: c = (8-12)/2 = -2
p(c -2) = 0,5 p(-2 c 0) =
0,5 0,4772 = 0,0228 2,28%
8 12
-2 0
2) p(x 16) ?
c = (16-12)/2 = 2
p(c 2) = 0,5 p(0 c 2) =
0,5 0,4772 = 0,0228 2,28%
12 16
0 2
DISTRIBUCIN DE LA T DE STUDENT
Es la distribucin terica de las muestras pequeas de una
poblacin que sigue la ley normal con datos cuantitativos
continuos.
Gosset (que utilizaba el seudnimo de Student) comprob que
cuando disminua el tamao de las muestras, no valan del todo los
normas de la DN, tanto ms cuanto ms pequea sea la muestra.
Hasta N=30 las diferencias son bastante acusadas.
Por eso la mayora de autores ponen a ese nivel la frontera de uso
prctico entre DN y t de Student.
Otros lo ponen en 60 y algunos hasta en 120.
Los programas estadsticos utilizan casi exclusivamente la t de
Student para todas las variables continuas, ya que hasta el infinito
no se produce una identidad plena entre ambas distribuciones.
La DN est en vas de extincin, al menos en la prctica.
Nosotros seguiremos el criterio de utilizar la t de Student para
muestras pequeas (N<30) y la DN para las grandes.
El valor obtenido de los clculos anteriores es comparado con los valores en
una tabla de distribucin de t de student (esta puede encontrarse en
cualquier test de estadstica
Distribucin de frecuencias para variables continuas y muestras
pequeas (n<30)
Tiene un slo parmetro denominado grados de libertad (n-1).
Cuando aumentan los grados de libertad, ms se acerca a N(0,1).
Iguales propiedades que la distribucin normal.
La notacin es t (gl , ). es el nivel de significacin elegido y gl es el
grado de libertad.
Con este nombre se designa al nmero de observaciones independientes, que
en general son N-1.
En esta prueba de t de students se comparan pares de datos continuos ,
distribuidos al azar y se coparan de la forma siguiente:
_ _
t = X1 - X_2____
N1. N2 . (N1 + N2 -2)
D1
2
+ D 2 N1 + N2
2 2 2
De donde el valor de D : N X - (X_)____
N
UN EJEMPLO AYUDAR A ENTENDER ESTE CONCEPTO.
Si nos piden 5 valores que sumen 35, slo podremos elegir libremente 4,
pues el 5 es obligado: supongamos que elegimos 8 , 10 , 23 , -15 .
El 5 nmero tiene que ser por fuerza 9 ; hay 4 grados de libertad.
Aqu no hay modelo tipificado y para cada valor de N hay una campana
distinta (que no es preciso dibujar..).
La TABLA sigue el modelo de las tablas de doble entrada. En la primera
columna est el grado de libertad y en la primera fila hay tres niveles de
significacin.
t(5 , 0,05) = 2,571 ; t(26, 0,001) = 3,707 ; t (15, 0,01) = 2,947.
UTILIDADES
Comparar medias. Prueba de hiptesis entre medias.
Clculo de intervalo de confianza
Determinacin del tamao de muestra
EJEMPLO 2
Suponga que desea comparar dos grupos ( un grupo de ensayo y otro
control ) de pesos corporales de perros que han seguido un estudio de
inhalacin de vapores Se conduce el test como sigue
Perro Peso corporal test Peso corporal control
X1 en kg X1
2
X2 en kg X2
2
1 8,3 68,89 8,4 70,56
2 8,8 77,44 10,2 104,04
3 9,3 86,49 9,6 92,16
4 9,3 86,49 9,4 88,36
Suma 35,7 319,31 37,6 355,12
Medias 8,92 9,4
Aplicando la formula vista anteriormente
_ _
t = X1 - X_2____
N1. N2 . (N1 + N2 -2)
D1
2
+ D 2 N1 + N2
2 2 2
De donde el valor de D= N X - (X_)____
N
Por tanto el valor de t ser :
Diferencia de las medias : N2 N1 = 9.40 8.92
2 2
D 1 = 4 (319.31) (35.7) __= 2,75/4 = 0,6875
4
2 2
D 2= 4 (355,12) (36.6) = 6,72/4 = 1,68
4
De donde: t= 0,48 = 4 (4) . ( 4 +4 -2) = 1,08
0,6875 + 1,68 4 + 4
El valor tabular para t con un nivel de significacin de 0.05 y 6 grados de
libertad es 1.9432 esto implica que 1.08< 1,9432
RESPUESTA: LOS PESOS CORPORALES DE LOS PERROS NO
DIFIEREN SIGNIFICATIVAMENTE A UN NIVEL DE 0.05
Como buscar la El valor tabular para t con un nivel de significacin de 0.05
y 6 grados de libertad
g.ll.
0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
0.975
0.99
0.995
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
0.15838
0.14213
0.1366
0.13383
0.13218
0.13108
0.13029
0.12971
0.12925
0.12889
0.12859
0.12835
0.12814
0.12796
0.12781
0.12767
0.12755
0.12745
0.12735
0.12727
0.12719
0.12712
0.12706
0.127
0.12694
0.12689
0.12685
0.32492
0.28868
0.27667
0.27072
0.26718
0.26483
0.26317
0.26192
0.26096
0.26018
0.25956
0.25903
0.25859
0.25821
0.25789
0.2576
0.25735
0.25712
0.25692
0.25674
0.25658
0.25643
0.2563
0.25617
0.25606
0.25595
0.25586
0.50953
0.44475
0.4242
0.41416
0.40823
0.40431
0.40154
0.39947
0.39787
0.39659
0.39555
0.39469
0.39396
0.39333
0.39279
0.39232
0.3919
0.39153
0.3912
0.39091
0.39064
0.39039
0.39017
0.38997
0.38978
0.38961
0.38945
0.72654
0.61721
0.58439
0.56865
0.55943
0.55338
0.54911
0.54593
0.54348
0.54153
0.53994
0.53862
0.5375
0.53655
0.53573
0.53501
0.53438
0.53382
0.53331
0.53286
0.53246
0.53208
0.53175
0.53144
0.53115
0.53089
0.53065
1.
0.8165
0.76489
0.7407
0.72669
0.71756
0.71114
0.70639
0.70272
0.69981
0.69745
0.69548
0.69383
0.69242
0.6912
0.69013
0.6892
0.68836
0.68762
0.68695
0.68635
0.68581
0.68531
0.68485
0.68443
0.68404
0.68368
1.3764
1.0607
0.97847
0.94096
0.91954
0.9057
0.89603
0.88889
0.8834
0.87906
0.87553
0.87261
0.87015
0.86805
0.86624
0.86467
0.86328
0.86205
0.86095
0.85996
0.85907
0.85827
0.85753
0.85686
0.85624
0.85567
0.85514
1.9626
1.3862
1.2498
1.1896
1.1558
1.1342
1.1192
1.1081
1.0997
1.0931
1.0877
1.0832
1.0795
1.0763
1.0735
1.0711
1.069
1.0672
1.0655
1.064
1.0627
1.0614
1.0603
1.0593
1.0584
1.0575
1.0567
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.383
1.3722
1.3634
1.3562
1.3502
1.345
1.3406
1.3368
1.3334
1.3304
1.3277
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.315
1.3137
6.3138
2.92
2.3534
2.1318
2.015
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
12.706
4.3027
3.1824
2.7764
2.5706
2.4469
2.3646
2.306
2.2622
2.2281
2.201
2.1788
2.1604
2.1448
2.1314
2.1199
2.1098
2.1009
2.093
2.086
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
31.821
6.9646
4.5407
3.7469
3.3649
3.1427
2.998
2.8965
2.8214
2.7638
2.7181
2.681
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.528
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
63.657
9.9248
5.8409
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
Buscar el valor tabular para t (26, 0,01)
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0.12727
0.12719
0.12712
0.12706
0.127
0.12694
0.12689
0.12685
0.12681
0.12677
0.12673
0.1267
0.12666
0.12663
0.1266
0.12658
0.12655
0.12653
0.1265
0.12648
0.12646
0.12644
0.12642
0.12641
0.12639
0.12637
0.12636
0.12634
0.12633
0.12631
0.1263
0.25674
0.25658
0.25643
0.2563
0.25617
0.25606
0.25595
0.25586
0.25577
0.25568
0.25561
0.25553
0.25546
0.2554
0.25534
0.25528
0.25523
0.25518
0.25513
0.25508
0.25504
0.255
0.25496
0.25492
0.25488
0.25485
0.25482
0.25479
0.25476
0.25473
0.2547
0.39091
0.39064
0.39039
0.39017
0.38997
0.38978
0.38961
0.38945
0.3893
0.38916
0.38903
0.38891
0.3888
0.38869
0.38859
0.3885
0.38841
0.38833
0.38825
0.38817
0.3881
0.38803
0.38797
0.38791
0.38785
0.38779
0.38774
0.38768
0.38763
0.38759
0.38754
0.53286
0.53246
0.53208
0.53175
0.53144
0.53115
0.53089
0.53065
0.53042
0.53021
0.53002
0.52984
0.52967
0.5295
0.52935
0.52921
0.52908
0.52895
0.52883
0.52871
0.52861
0.5285
0.5284
0.52831
0.52822
0.52814
0.52805
0.52798
0.5279
0.52783
0.52776
0.68695
0.68635
0.68581
0.68531
0.68485
0.68443
0.68404
0.68368
0.68335
0.68304
0.68276
0.68249
0.68223
0.682
0.68177
0.68156
0.68137
0.68118
0.681
0.68083
0.68067
0.68052
0.68038
0.68024
0.68011
0.67998
0.67986
0.67975
0.67964
0.67953
0.67943
0.85996
0.85907
0.85827
0.85753
0.85686
0.85624
0.85567
0.85514
0.85465
0.85419
0.85377
0.85337
0.853
0.85265
0.85232
0.85201
0.85172
0.85144
0.85118
0.85094
0.8507
0.85048
0.85026
0.85006
0.84987
0.84968
0.84951
0.84934
0.84917
0.84902
0.84887
1.064
1.0627
1.0614
1.0603
1.0593
1.0584
1.0575
1.0567
1.056
1.0553
1.0547
1.0541
1.0535
1.053
1.0525
1.052
1.0516
1.0512
1.0508
1.0504
1.05
1.0497
1.0494
1.0491
1.0488
1.0485
1.0483
1.048
1.0478
1.0475
1.0473
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.315
1.3137
1.3125
1.3114
1.3104
1.3095
1.3086
1.3077
1.307
1.3062
1.3055
1.3049
1.3042
1.3036
1.3031
1.3025
1.302
1.3016
1.3011
1.3006
1.3002
1.2998
1.2994
1.2991
1.2987
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991
1.6973
1.6955
1.6939
1.6924
1.6909
1.6896
1.6883
1.6871
1.686
1.6849
1.6839
1.6829
1.682
1.6811
1.6802
1.6794
1.6787
1.6779
1.6772
1.6766
1.6759
2.086
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452
2.0423
2.0395
2.0369
2.0345
2.0322
2.0301
2.0281
2.0262
2.0244
2.0227
2.0211
2.0195
2.0181
2.0167
2.0154
2.0141
2.0129
2.0117
2.0106
2.0096
2.0086
2.528
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.462
2.4573
2.4528
2.4487
2.4448
2.4411
2.4377
2.4345
2.4314
2.4286
2.4258
2.4233
2.4208
2.4185
2.4163
2.4141
2.4121
2.4102
2.4083
2.4066
2.4049
2.4033
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
2.7633
2.7564
2.75
2.744
2.7385
2.7333
2.7284
2.7238
2.7195
2.7154
2.7116
2.7079
2.7045
2.7012
2.6981
2.6951
2.6923
2.6896
2.687
2.6846
2.6822
2.68
2.6778
ANALISIS DE VARIANZA (ANOVA)
Cuando estamos frente a la t de student tratamos de comparar dos medias para ver
si las hiptesis que se realizan son ciertas o no sin embargo existen casos en que
tenemos que trabajar con mas de dos grupos en los cuales tendremos por tanto
mas de dos medias ac no es posible aplicar la prueba de student por lo que el
ANOVA surge como una generalizacin del contrate para dos medias de Student
cuando el nmero de dos muestras a contrastar es mayor que dos.
Es utilizado para comparar 3 mas grupos de datos continuos cuando las varianzas
son homogeneas y los datos son independientes y normalmente distribuidos.
Por ello nos planteamos dos hiptesis
Ho: 1 = 2 = 3
H1: 1 2 1 3 2 3
caso en que una de ella fuera igual pero otra
diferente , tambin se rechaza la hiptesis nula
Una serie de clculos son requeridos para realizar el ANOVA, comenzando con los
valores dentro del cada grupo que debe ser adicionado.( X) y entonces estas
sumas deben ser adicionadas ( X) . Cada dato dentro del grupo es elevado al
2
cuadrado y entonces los cuadrados son sumados (X ).
Luego el factor de correccin CF puede ser calculado a partir de la formula
siguiente:
K N 2
( X)
1 1_____________________
CF = N1 + N2 + N3+Nk
Donde N es el numero de valores en el grupo y K es el numero de grupos.
La suma total de los cuadrados (SS) es entonces determinada como
sigue:
K N 2
SS total = X - CF
1 1
A su vez la suma de los cuadrados entre grupos (bg) se encuentra de la
forma siguiente:
2 2 2
SS bg = ( X 1) + ( X 2) + ( X k) - CF
N1 N2 Nk
SS wg = SS total - SS bg
AHORA EXISTEN TRES TIPOS DE GRADOS DE LIBERTAD PARA DETERMINAR
El primero, total df, es el total de nmeros de datos dentro de todos los grupos bajo anlisis
menos 1 o sea:
(N1 + N2 + N3+Nk) - 1
El segundo es , df entre los grupos es el numero de grupos menos uno (K-1)
El ultimo dato sera (dentro de los grupos o error de grados de libertad) es la diferencia
entre el primero y el segundo.
F = df total df bg
El prximo conjunto de clculos sera la determinacin de los cuadrados medios , es decir:
(MS wg y M S bg) ellas se calculan de la siguiente manera.
MS = (SS/df)
El clculo final es la relacin F o sea
F = M S bg
MS wg
Ejemplo para el empleo de las formulaciones para determinacin
del ANOVA
Suponga que quiere compara 4 grupos de peso de los riones de perros ,
expresados como porciento de peso corporal, seguida de una prueba de
inhalacin , Suponiendo la homogeneidad de la varianza (a partir del test
de Barlett) nosotros podemos completar los siguientes clculos.
400 ppm 200ppm 100 ppm 0 ppm
0,1849 0,2401 0,1156 0,1156
0,2704 0,2304 0,1600 0,1024
0,1849 0,1600 0,1764 0,1089
0,3025 0,1156 0,1600 0,1521
2
X = 0,9427
0,7461
0,6120
0,4790
2
X= 0,9427 + 0,7461 + 0,6120 + 0,4720 = 2,7798
2
CF = (6,58 ) ___= 2,7060
4+4+4+4
SS total = 2,7798 2,7060 = 0,0738
SS bg = (1,93 ) + (1,71) + (1,56 ) + (1,38) - 2,7060 = 0,04075
4 4 4 4
SS wg = 0,07380 -0,04075 = 0,03305
df total = 4 + 4+4 +4 - 1 = 15
df bg= 4 -1 = 3
df wg = 15 - 3 = 12
MS bg= 0,04075 = 0,01358
2 de donde F = 0,01358 = 4,94
MS wg = 0,03305 = 0,00275 0,00275
12
Buscando en la tabla de F encontramos que para 3 d fbg (mayor cuadrado
medio) y 12 d fwg (menor cuadrado medio), para el valor de 0.05 se halla que
F = 3,49
F calculado > F encontrado en la tabla.
04,94 > 3,49
Como el valor que nosotros calculamos es mayor que el encontrado.
Entonces existen diferencias significativas entre grupos.
Por lo que tenemos que determinar cuales son las diferencias, o cuales son los
grupos que difieren, para ellos aplicamos un ensayo de post hoc o una prueba
para diferenciar las medias.
DATOS A
BUSCAR
Df SS MS F
Bg 3 0,04075 0,01358 4,94
Wg 12 0,03305 0,00275
Total 15 0,07380
Los grados de libertad del numerador se encuentran en la primera fila,
en tanto que los grados de libertad del denominador se encuentran en la
primera columna, cada tabla corresponde a un valor diferente de alfa o
"p0.05
Distribucin de F para 0,95 %
1 2 3
1 161.45 199.5 215.71
2 18.513 19 19.164
3 10.128 9.5521 9.2766
4 7.7086 6.9443 6.5914
5 6.6079 5.7861 5.4094
6 5.9874 5.1432 4.7571
7 5.5915 4.7374 4.3468
8 5.3176 4.459 4.0662
9 5.1174 4.2565 3.8625
10 4.9646 4.1028 3.7083
11 4.8443 3.9823 3.5874
12 4.7472 3.8853 3.4903
Al realizar la determinacin de un metabolito en tres
fermentaciones se obtuvieron los siguientes resultados.
Determine mediante ANOVA si existen diferencias entre
las fermentaciones. Calcule las medias y varianza.
A 125 124 123 125 124 121 126 123 124 122
B 120 129 131 129 126 127 130 131 129 130
C 135 136 136 137 136 135 137 136 136 135
PRUEBAS PARA DETERMINAR LAS DIFERENCIAS ENTRE LAS
MEDIAS, O SEA PRUEBAS POST HOC.
Existe una variedad de pruebas post hoc disponibles para analizar los datos
despus del ANOVA.
Cada uno de ellos tienen sus ventajas y sus desventajas, cuatro de ellos son
muy utilizados en bioestadstica.
1. Prueba de los rangos mltiples de Duncan
2. La prueba de Scheffe
3. El test de Dunnett
LA PRUEBA DE LOS RANGOS MLTIPLES DE DUNCAN.
Es utilizada para comprar a grupos que se distribuyen continuos y al azar
(tales como el peso corporal y peso de los rganos), este test normalmente
involucra 3 mas grupos. La comparacin se hace entre pares de grupos
tomados a la misma vez.
Hay que buscar la prueba de F y cuando se obtienen valores mayores que el
tabular entonces podemos emplear este ensayo
GRUPOS CON IGUAL NUMERO DE DATOS
Los dos conjuntos de clculos deben ser llevado aqu:
1. 1ero La determinacin de las diferencias entre las medias de pares de
grupos.
2. La preparacin de la tabla de probabilidad contra la cual cada diferencia
es medias son comparadas .
Las medias son determinadas y ranqueadas en orden decreciente o
creciente.
Los grupos son tomados en pares y las diferencias entre las medias
_ _
(X 1 X2) , expresadas como un nmero positivo, son calculadas.
Usualmente cada par consisten en el grupo control y el grupo tratado,
entonces multiple grupos de ensayos pueden ser inter comparados si se
desea.
Para establecer la tabla de probabilidad , la SEM puede ser calculada coo se
muestra a continuacin.
SEM= ERROR DE LA MEDIA CUADRADA
N
= MEDIA CUADRADA DENTRO DEL GRUPO
N
Donde N es el numero de animales o replicas por cada nivel de dosis.
La media cuadrada dentro del grupo ( MSwg) puede ser calculada a partir de la
informacin dada por el procedimiento de ANOVA
La SEM es entonces multiplicada por una serie de valores tabulare, para establecer la
tabla de probabilidad.
La tabla de valores usado para el calculo son seleccionados de acuerdo a los niveles
de( probabilidad ( puede ser 0,05; 0,01 y 0,001)
Y el nmero de medias aparte para el grupo son comparadas y el numero error df .
El error df es el numero de df dentro del grupo Este ultimo dato es determinado de
los clculos del ANOVA
Ejemplo:
Empleando el peso del rin como % de peso corporal (4 grupos de perros con 4
perros en cada grupo)
rangos
Concentracin media del
peso de los riones
1 2 3 4
Grupos comparados _ _
X 1 - X2
Numero de medias
2 vs 1 ( 100 vs 0 ppm) 0,045 2
3 vs 1 (200 vs 0 ppm) 0,08/3 3
4 vs 1 ( (400 vs 0 ppm) 0,138 4
4 vs 2 (400 vs 100 ppm) 0,093 3
El cuadrado medio dentro del grupo del ejemplo del ANOVA fue 0,00275 o sea
MS wg = 0,03305 = 0,00275
12
Por tanto el SEM = = 0,00275 = 0,02622.
4
El error df (df wg) fue 12 de manera que la siguiente tabla de valores
son empleados.
No de media apartadas Nivel de probabilidad
0,05 0,01 0,001
2 3,082 4,320 6,106
3 3,225 4,504 6,34
4 3,313 4,622 6,494
Cuando estos son multiplicados por la SEM se obtienen los siguientes valores
de probabilidad en la tabla
No de media apartadas Nivel de probabilidad
0,05 0,01 0,001
2 0,0808 0,1133 0,1601
3 0,0846 0,01181 0,1661
4 0,869 0,1212 0,1703
Grupos con nmeros desiguales de datos ( N1 N2)
Este procedimiento es muy similar al que se discuti anteriormente.
Como antes las medias son ranqueadas y se determinan las diferencias
_ _
entre las medias ( X 1- X2 )
Posteriormente se determinan los valores pesantes a ij son calculados a
partir de los pares de grupos a ser comparados de acuerdo con las
siguientes formulaciones:
_____________
a ij = 2 Ni Nj = 2 N1 N2
Ni + Nj N1 + N2
_ _
Los valores obtenidos para cada par de grupos se multiplica por (X 1 X2)
Para cada valor para obtener un valor de t , este es el valor que ser
comparado posteriormente con la tabla de probabilidad.
La tabla de probabilidad es establecida como anteriormente excepto que en
lugar de multiplicar los valores de la tabla por SEM, SEM
2
Se utiliza
MSwg