Vous êtes sur la page 1sur 213

Estadstica

LIC. GASTN GARCA SIMN,


MSC. TOXICOLOGIA EXPERIMENTAL
2013
PROGRAMA DEL CURSO
Diagramas barras para variables discretas
Diagramas integrales.
Grficos para variables cualitativas ejs.

4. ESTADGRAFOS DE POSICIN
Medidas descriptivas.
Medidas de tendencia central
La Media .Ej de clculos
La mediana. Ej de clculos
La moda. Ej de clculos
Comparacin entre la media la mediana y la moda

5. Estadgrafos de dispersin
Mximo y Mnimo
Rango
Amplitud Intercuartlica
Varianza
Desvo tpico
Coeficiente de variabilidad





6. LA FORMA DE DISTRIBUCIN
Distribucin simtrica
Distribucin asimtrica
La Curtosis. Forma de expresarla

7. Regresin y correlacin
Introduccin
Diagrama de dispersin
Anlisis de Regresin
Ajuste de una recta
Aplicacin del mtodo de los mnimos cuadrados
Coeficiente de correlacin de Pearson
Coeficiente de correlacin de Spearman.

8. Elementos de probabilidades.
Introduccin
Tipos de probabilidades
Probabilidad de frecuencias relativas
Regla del complemento
Tipos de eventos



9. DISTRIBUCIN FUNDAMENTAL DE PROBABILIDAD
CLASIFICACIN
1. Variables discretas:
Distribucin Binomial
Distribucin de Poisson
Distribucin Normal
2, Variables continuas
--Distribucion Normal
--Distribucion de la t de Student
--Distribucion de la 2 de Pearson

10. ANALISIS DE VARIANZA (ANOVA)
Desarrollo del ANOVA
Pruebas para determinar las diferencias entre las medias, o sea pruebas
post hoc.
1. Prueba de los rangos mltiples de Duncan
2. La prueba de Scheffe
3. El test de Dunnett







11. LA PRUEBAS NO PARAMETRICaS.
1. Introduccin
2. Prueba de Wilcoxon para comparar dos grupos
3. Desarrollo del ANOVA no paramtrico
La prueba de Kruskal Walis
Pruebas para determinar las diferencias entre las grupos , o sea
pruebas post hoc.
1. Comparacin mltiple de distribucin libre


Se cree que los orgenes de la estadstica estn ligados al
antiguo Egipto y a los censos chinos hace unos 4000 aos,
aproximadamente.



Desde esa poca, diversos estados realizaron estudios sobre
algunas caractersticas de sus poblaciones, sus riquezas,
posesiones, etc.


En 1662, John Graunt, un mercader Ingls, public un libro sobre
los nacimientos y defunciones ocurridos en Londres; el libro tenia
conclusiones acerca de ciertos aspectos relacionados con estos
acontecimientos. ESTA OBRA ES CONSIDERADA
COMO EL PUNTO DE PARTIDA DE LA ESTADSTICA
MODERNA.
LA PALABRA ESTADSTICA comenz a usarse en el siglo XVIII, en
Alemania, en relacin a estudios donde los grandes nmeros, que
representaban datos, eran de importancia para el estado. Sin embargo, la
estadstica moderna se desarroll

EN EL SIGLO XX A PARTIR DE LOS ESTUDIOS DE KARL PEARSON.





Hoy LA ESTADSTICA tiene gran importancia, no slo por que presenta
informacin, sino que adems permite inferir y predecir lo que va a ocurrir,
y por lo tanto, es una herramienta fundamental a la hora de tomar
decisiones de importancia.
PARA QU SIRVE LA ESTADSTICA?

La Estadstica se utiliza como tecnologa al servicio
de las ciencias donde la variabilidad y la incertidumbre
forman parte de su naturaleza



La Bioestadstica ensea y ayuda a investigar en
todas las reas de las Ciencias de la Vida donde la
variabilidad no es la excepcin sino la regla Carrasco
de la Pea (1982)

La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y
presentacin de los datos referentes a un
fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico, con
objeto de

deducir las leyes que rigen esos fenmenos,


y poder de esa forma hacer previsiones sobre
los mismos, tomar:

DECISIONES Y OBTENER CONCLUSIONES.
Descriptiva
Inferencia
ESTADSTICA DESCRIPTIVA: Describe,
analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y
presentan la informacin contenida en ellos.



ESTADSTICA INFERENCIAL: Apoyndose en
el calculo de probabilidades y a partir de datos
muestrales, efecta estimaciones, decisiones,
predicciones u otras generalizaciones sobre un
conjunto mayor de datos.
MTODO CIENTFICO Y ESTADSTICA
Plantear
hiptesis
Obtener
conclusiones
Recoger datos
y analizarlos
Disear
experimento
Pasos en un estudio estadstico
Plantear hiptesis sobre una poblacin:

Los fumadores tienen ms bajas laborales que los no
fumadores debido a sus posibles patologias pulmonares y otras
asociadas
En qu sentido? Mayor nmero? Tiempo medio?.

Tambin puede adecuarse a las plantas medicinales, o sea
algunas tiene mayor efecto diurtico, que otras a pesar de ser de
la misma especie, a que puede deberse esto
Tipo de cultivo? terreno en que se cultivan?, procedimiento de
extraccin del principio activo

Decidir qu datos recoger (diseo de experimentos).

Qu individuos pertenecern al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Plantas obtenidas de un determinado herbario en determinada
poca del ao.
Criterios de exclusin Cmo se eligen? Descartamos los que
padecen enfermedades crnicas? Cules plantas se descartan?

Qu datos recoger de los mismos (variables)
Nmero de bajas, Tiempo de duracin de cada baja
Sexo? Sector laboral? Otros factores?
Numero de plantas , forma de seleccin y quin la selecciona

Recoger los datos (muestreo)
Estratificado? Sistemticamente?
PASOS EN UN ESTUDIO ESTADSTICO
CONTINUACION.

Describir (resumir) los datos obtenidos
tiempo medio de baja en fumadores y no (estadsticos).
Tipo de plantas cuyo extracto ejerce el efecto deseado
% de bajas por fumadores y sexo (frecuencias),
grficos.
% de plantas con actividad y sin ella.
Realizar una inferencia sobre la poblacin
Los fumadores estn de baja al menos 10 das/ao ms
de media que los no fumadores.
Las plantas cuyo efecto se pueda producir en los
animales experimentales medible y que
estadsticamente tengan diferencias significativas.

Cuantificar la confianza en la inferencia
Nivel de confianza del 95%
PREGUNTAS PARA RECAPITULAR LA CLASE # 1

1. Para que nos sirve la estadstica

1. Ponga un ejemplo que nos demuestre qu se conoce como
Bioestadstica.

2. Ponga un ejemplo que nos indique que es la estadstica
descriptiva?

3. Que se entiende por estadstica inferencial).

4. Disee un experimento
PARTIENDO DE LA DEFINICIN DE
ESTADSTICA DESCRIPTIVA: que es la que describe, analiza
y representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la
informacin contenida en ellos.

Describe, analiza y representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la informacin
contenida en ellos.

Ejemplo:
En la tabla podemos ver los datos de un anlisis realizado en un
hospital sobre un determinado tipo de patologa en pacientes por
sexo .
Sexo Cantidad de pacientes con el mal
de Parkinson
Macho 125
hembra 106
Total 231
Partiendo de la definicin de
ESTADSTICA INFERENCIAL: que es la que apoyndose en el
clculo de probabilidades y a partir de datos muestrales, efecta
estimaciones, decisiones, predicciones u otras generalizaciones sobre
un conjunto mayor de datos

Cantones
Cantidad total de pacientes que presentan
como promedio el mal de Parkinson en el
_
cantn (X )
Machala 125
Guayaquil 87
Santa Rosa 150
Total 362
OBTENER LAS CONCLUSIONES DE LOS RESULTADOS
DISEE UN EXPERIMENTO

Plantear hiptesis sobre una poblacin:

Decidir qu datos recoger (diseo de experimentos).

Recoger los datos (muestreo).

Describir (resumir) los datos obtenidos

Cuantificar la confianza en la inferencia





CLASE NUMERO 2
CONCEPTOS BSICOS
En muchas ocasiones, para llevar a cabo una investigacin se
hacen encuestas, las cuales son dirigidas a una

MUESTRA REPRESENTATIVA DE LA POBLACIN.
Para comprender mejor este tipo de estudios es importante que
conocer los siguientes trminos bsicos:




POBLACIN:

Es un conjunto de personas, eventos o cosas de las cuales se desea hacer
un estudio, y tienen una caracterstica en comn. (hacer inferencia).

Por su tamao las poblaciones pueden ser finitas o infinitas

Normalmente es demasiado grande para poder abarcarlo.

En la prctica, y para facilitar los clculos, una poblacin se
considera infinita a partir de un tamao de 10.000 individuos.

La obtencin de datos de una poblacin se llama censo.

Tericamente un individuo puede tener infinitas caractersticas y por
tanto puede formar parte de infinitas poblaciones.



MUESTRA:

Es un subconjunto cualquiera de la poblacin; al que tenemos
acceso y sobre el que realmente hacemos las observaciones
(mediciones).



Debera ser representativo.

Esta formado por miembros seleccionados de la poblacin
(individuos, unidades experimentales).

Un conjunto de individuos, segn las circunstancias, puede ser poblacin
o muestra.

Como es esto ejemplifquelo ?


Por ejemplo:
Los alumnos de la Escuela sern POBLACIN cuando tomemos a
unos cuantos de ellos para estimar la talla de todo el alumnado de
la misma.

Y sern MUESTRA si toda la Escuela ha sido seleccionada para participar
en un estudio a nivel nacional.
DE LA EXPERIENCIA DE SU PROPIA ESPECIALIDAD,
DESCRIBA UN EJEMPLO DE POBLACIN y MUESTRA
ALGUNOS EJEMPLOS
Para determinar si un medicamento hipoglicemiante producido en
una Empresa de Medicamentos tiene la calidad adecuada, o sea cumple
los parmetros de calidad, se toman 5 frascos de 100 tabletas al azar
de la produccin de ese lote.
Cual es la poblacin y cul la muestra?

Cmo Ud planificara el experimento?

Un grupo de investigadores desea estudiar el efecto afrodisaco de
las ratas ante un determinado medicamento, como paso de un estudio
preclnico. Como se disea el experimento para realizar los estudios
pertinentes.
DESARRROLLO

1. Como se planifica el diseo del efecto hipoglucemiante, en un
ensayo preclnico?
Plantear hiptesis
Disear experimento
Recoger datos y analizarlos
Obtener conclusiones

1. Como se planifica el diseo del efecto afrodisiaco?


VARIABLES

Una VARIABLE es una caracterstica observable que vara entre los
diferentes individuos de una poblacin.
En los individuos de una poblacin de uno a otro
ES VARIABLE:

El grupo sanguneo {A, B, AB, O}

Su nivel de felicidad declarado {Deprimido, Regular , Muy Feliz}

El nmero de hijos {0,1,2,3,...}

La altura {162 ; 174; ...}
PARA ESTUDIAR ALGUNA CARACTERSTICA ESPECIFICA DE LA
POBLACIN SE PUEDEN DEFINIR LOS SIGUIENTES TIPOS DE
VARIABLES:
VARIABLES CUALITATIVAS Y VARIABLES
CUANTITATIVAS:
Variables cualitativas
No se expresan numricamente es decir sus valores no se pueden asociar
naturalmente a un nmero (no se pueden hacer operaciones algebraicas con
ellos). , esto significa lo relativo a la cualidad; siendo la cualidad cada una de las
circunstancias o caracteres, naturales o adquiridos, que distinguen a las personas
o cosas.
Ejemplo: relacionadas con caractersticas no numricas de un
individuo.
por ejemplo: Atributos de una persona
Estado civil de una persona
colores de la crnea.

La Variables Cualitativas pueden enmarcarse
como:
Nominales: Si sus valores no se pueden ordenar por Ej:
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No).


Ordinales: Si sus valores se pueden ordenar. Es decir
Sern datos cualitativos ordinales cuando ellos pueden ser
jerarquizados en una relacin de orden, por ejemplo la
cualidad de educacin se puede jerarquizar en educacin
bsica, media, tcnica, universitaria
Mejora a un tratamiento, Grado de satisfaccin, la educacin
(poca educacin, mucha educacin);Intensidad del dolor



VARIABLES CUANTITATIVAS:
Se expresan numricamente es decir relacionadas con las caractersticas
numricas del individuo. Es decir significa lo relativo a la cantidad;
siendo la cantidad todo lo que es capaz de aumento y disminucin y
puede, por consiguiente, medirse o numerarse.


De modo que estas mediciones numricas llevan asociadas unidades
fsicas (no son nmeros abstractos sin dimensin!).
Estas mediciones se definen mediante una variable, puesto que lo que
se va a medir son cantidades que son capaces de aumentar o disminuir,
y esta variacin lo define de buena manera una variable, ya que una
variable es una magnitud que puede tener un valor cualquiera de los
comprendidos en un conjunto

LAS VARIABLES CUANTITATIVAS SE
DIVIDEN EN
DISCRETAS
(aquellas que no admiten otro valor entre 2 valores distintos y
consecutivos) , es decir toman valores enteros.
De modo que una variable ser discreta si los valores que se
asumir pertenecen al conjunto de los nmeros enteros, o en
general a cualquier conjunto discreto (finito o infinito)
Ejemplos
Cantidad de caballos en una granja.
Cantidad de ojos pardos
Nmero de paciente con HPB y con HIV

CONTINUAS
Aquellas que pueden tomar una infinidad de valores entre dos de
ellos.
O sea ser continua cuando la cantidad que se quiere medir ser
cualquier nmero que se encuentra en un intervalo de la recta real




Ej: Estatura de las personas, determinacin de glucosa en sangre,
etc
EJEMPLOS
Llene con una x los casilleros correspondientes
CARACTERSTI
CA
CUANTITATIVA CUALITATIVA
discreta continua nominal ordinal
Estatura en m
Religin que
profesa
Intensidad del
dolor de muelas
Color del cabello
Ratas apareadas
Valores de GOT Y
GPT en sangre
Respuesta
Llene con una x los casilleros correspondientes. Respuestas
CARACTERSTI
CA
CUANTITATIVA CUALITATIVA
discreta continua nominal ordinal
Estatura en m x
Religin que
profesa
x
Intensidad del
dolor de muelas
x
Color del cabello x
Ratas apareadas x
Valores de GOT Y
GPT en sangre
x
EJERCICIO PARA ENTREGAR

En la siguiente tabla diga cuales son variables cualitativas y cuales
las cuantitativas y clasifquelas :

CARACTERSTICA CUANTITATIVA CUALITATIVA
discreta continua nominal ordinal
Cantidad de hormigas
en un hormiguero
El amigo es soltero
Frecuencia cardaca
Medidas que vienen
en una regla
Signos clnicos en un
experimento .
(Sealarlos)
Conjunto de personas
felices
CARACTERSTIC
A
CUANTITATIVA CUALITATIVA
discreta continua nominal ordinal
Cantidad de
hormigas en un
hormiguero
x
Medidas que viene
en una regla
x
Frecuencia
cardaca
x
Es amigo es soltero x
Signos clnicos en
un experimento.
Sealarlos
x
Conjunto de
personas felices
x
RESPUESTAS
EL TRABAJO CON PROGRAMAS ESTADISTICOS:

Cuando se trabaja con programas estadsticos es BUENO codificar las
variables como nmeros


Sexo (Cualitativo: Cdigos arbitrarios)
1 = Hombre
2 = Mujer.

Raza (Cualitativo : Cdigos arbitrarios)
1 = Blanca
2 = Negra.

Felicidad Ordinal: Respetar un orden al codificar.
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz

Se pueden asignar cdigos a respuestas especiales como
0 = No sabe
99 = No contesta.

VEAMOS LOS SIGUIENTE EJEMPLO
VARIABLES CUALITATIVAS CODIFICADAS SON
ANALIZADAS COMO VARIABLES DISCRETAS.
VARIABLES
Discretas
VARIABLES
INDEPENDIENTES O PREDICTORAS: se
establecen al inicio del experimento y se controlan
por el investigador.
Ej: La dosis del medicamento frente a un ensayo
de hipoglucemiantes, antitusgeno, cardiotnico,
Hipotensor, diurtico, laxante, antidiarreico.

DEPENDIENTE O VARIABLE CRITERIO:
depende de los niveles de la variable
independiente
Ej: Respuesta frente a la dosis, ej: a mayor dosis mayor efecto
hipoglucemico en los animales de experimentacin despus de haberse
hecho hiperglucmica a la rata
Ejercicio de clases: Ponga ejemplos donde se
presenten las variables dependiente e
independientes
IDENTIFIQUE LAS VARIABLES
ESTADO NUTRICIONAL
SOBREVIVENCI
A
POBRE (N1) BUENO (N2)
SOBREVIVE (S1) 72 79
MUERE (S2) 87 32

RESPUESTA

VARIABLE INDEPENDIENTE: Estado nutricional
(cualitativa ordinal)



VARIABLE DEPENDIENTE: Supervivencia (cualitativa
ordinal)
EVALUATIVO:

SEALA UN EJEMPLO DE VARIABLES DEPENDIENTES E
INDEPENDIENTES

(Empleando variables cuantitativas cualitativas)







EJEMPLO 2

SE PRODUCE UN MEDICAMENTO PARA DISMINUIR EL ESTADO
FEBRIL DE LOS PACIENTES, EL MISMO SE ENSAYO EN LA FASE
PRECLNICA EN ANIMALES DE EXPERIMENTACIN, PARA ELLO SE
LE ADMINISTRA A LOS CONEJOS DETERMINADAS DOSIS DEL
ANTIPIRTICO Y SE REGISTRA LA TEMPERATURA CORPORAL DE
LOS ANIMALES .

CUALES SON LAS VARIABLES: INDEPENDIENTE Y DEPENDIENTE

POR QU?

VARIABLE INDEPENDIENTE:
VARIABLE DEPENDIENTE:




EJEMPLO 2


SE ESTUDIA UNA POBLACIN PARA VER EL DAO CAUSADO POR UNA PLAGA EN
PLANTAS QUE VAN A SER UTILIZADAS COMO DESINTOXICANTES.
COMO DESCRIBIRA EL EXPERIMENTO Y COMO HARIA LA TOMA DE MUESTRAS
CUAL UD CONSIDERA QUE SERIA LA VARIABLE INDEPENDIENTE Y CUAL LA DEPENDIENTE






Respuesta

Planteo de la hiptesis
Diseo del experimento:


Variable independiente: las plantas
Variable dependiente: el efecto que producen luego de haber sido
infectada por una plaga .

Obtencin de las datos.

Procesamiento de los resultados.

Conclusiones.
PRESENTACIN ORDENADA DE DATOS
PRESENTACIN TABULAR: Su utilizacin resulta imprescindible para
describir datos de fenmenos cientficos, comerciales, educativos,
sociales, polticos, etc, que en forma clara y adecuada se presentan en
tablas estadsticas de ah el termino tabular.






PRESENTACIN DE GRFICAS: Es la presentacin de datos
mediante grficas constituyendo el medio ms eficaz para que
los mismos sean interpretados con claridad y objetividad. Por
ello con justicia se dice:
Una buena grfica vale por mil palabras


Sexo del encuestado
636 41,9 41,9
881 58,1 58,1
1517 100,0 100,0
Hombre
Muj er
Total
Vli dos
Frecuenci a Porcentaj e
Porcentaj e
vl i do




ESTRUCTURA DE LA TABLA ESTADSTICA

TITULO: EXPRESA EL CONTENIDO DE LA TABLA EN FORMA RESUMIDA Y
CLARA. SE UBICA EN LA PARTE SUPERIOR DE LA MISMA

ENCABEZADO: CONSTITUYE LOS CONCEPTOS O TTULOS DEL
CONTENIDO DE LAS COLUMNAS CORRESPONDIENTES A LA COLUMNA
MATRIZ Y CUERPO DE LA TABLA

COLUMNA MATRIZ: ES LA PRIMERA COLUMNA DE LA TABLA QUE
DETALLA LA CLASIFICACION DE LOS DATOS ES DECIR EL TIPO DE SERIE
ESTADISTICA.

CUERPO CONSTITUYE LA EXPRESION CUANTITATIVA DEL FENOMENO
INVESTIGADO Y QUE SE EXPRESA MEDIAN TE LAS CANTIDADES A PARTIR
DE LA SEGUNDA COLUMNA DE LA TABLA

PRESENTACIN GRAFICATIVA ES LA PRESENTACION DE LOS
DATOS MEDIANTE GRAFICAS CONSTITUYENDO EL MEDIO MAS EFICAZ PARA
QUE LOS MISMOS SEAN INTERPRETADOS CON CLARIDAD Y OBJETIVIDAD


ESTRUCTURA DE LA TABLA ESTADISTICA
(TITULO).
VENTAS ANUALES DE UN MEDICAMENTO, SINTETICO O DE ORIGEN VEGETAL
EN UNA FARMACIA
ENCABEZADO:
AOS,. PRODUCTOS MEDICAMENTOSOS DE ORIGEN SINTETICO O VEGETAL OTROS
ARTICULOS QUE PUEDEN EXPENDERSE EN LA MISMA, SUBTOTAL, CREMA DENTAL,
LOCIONES,, TOTAL
COLUMNA MATRIZ:
ES LA PRIMERA COLUMNA DE LA TABLA QUE DETALLA LA CLASIFICACION DE LOS DATOS ,
EN ESTE CASO LA SERIE ES CRONOLOGICA
CUERPO
CONSTITUYE LA EXPRESION CUANTITATIVA DEL FENOMENO INVESTIGADO (VENTAS).
PRESENTACION GRAFICATIVA
SE UTILIZAN LAS GRAFICAS PARA QUE SEAN MAS COMPRENSIBLES LOS RESULTADOS



AO
S
PRODUCTO
S
MEDICAMENT
OS
SUBTOTAL CREMA
DENTAL,
LOCIONES
TOTA
L
2010 80 25 105 15 120
2011 105 35 140 40 180
2012 250 48 300 12 312
TOTA
L
435 108 545 65 612
Ordenando la informacin

Al ordenar datos muy numerosos, es usual agruparlos en :
CLASES O CATEGORAS.
Al determinar cuantos pertenecen a cada clase, establecemos
LA FRECUENCIA.
Construimos as una tabla de datos llamada:

TABLA DE FRECUENCIA.

LAS TABLAS DE FRECUENCIAS Y LAS REPRESENTACIONES
GRFICAS son

DOS MANERAS EQUIVALENTES de presentar la informacin.

LAS DOS EXPONEN ORDENADAMENTE LA INFORMACIN
RECOGIDA EN UNA MUESTRA

POR EJEMPLO PODEMOS VER:
Gnero Frec.
Hombre 4
Mujer 6
0
1
2
3
4
5
6
7
Hombre Mujer
TABLAS DE FRECUENCIAS Y
REPRESENTACIONES GRFICAS




Ejemplo:
Los siguientes datos corresponden a las notas obtenidas
por un curso de 24 alumnos en un trabajo de
matemtica:




4.2 5.0 5.6 5.0
3.2 4.2 5.6 6.0 2.8
3.9 4.2 4.2 50 5.0
3.9 3.9 3.2 3.2 4.2
5.6 6.0 6.0 3.2 6.0
DEFINICIONES:
1. LA FRECUENCIA ABSOLUTA DE UNA CLASE
ES EL NUMERO DE DATOS QUE FORMA DICHA CLASE. O SEA QUE APARECE
CADA VALOR DE LA VARIABLE.

2. LA FRECUENCIA RELATIVA
CORRESPONDE A LA RAZN ENTRE LA FRECUENCIA ABSOLUTA Y EL TOTAL
DE DATOS, LA CUAL SE PUEDE EXPRESAR MEDIANTE EL USO DE
PORCENTAJES. REPRESENTAN LA RELACIN ENTRE LA
FRECUENCIA ABSOLUTA Y EL TAMAO DE LA MUESTRA.
(PORCENTAJES Y PROPORCIONES)

3. FRECUENCIA RELATIVA ACUMULADA:
RELACIN ENTRE LA FRECUENCIA ABSOLUTA ACUMULADA
DIVIDIDO POR EL TAMAO DE LA MUESTRA (N).
Ordenando la informacin
Nota Frecuencia
Absoluta (f i)
Frecuencia
Relativa (h i)
Frecuencia
relativa
porcentual (%)
2.8 1 1/24 4.2
3.2 4 4/24 16.7
3.9 3 3/24 12.5
4.2 5 5/24 20.8
5.0 4 4/24 16.7
5.6 3 3/24 12.5
6.0 4 4/24 16.7
TOTAL 24 - 100
ORDENEMOS ESTOS DATOS EN LA SIGUIENTE TABLA:








Indicaremos que es lo que representa cada columna:

TABLA DE FRECUENCIA DE DATOS AGRUPADOS
En ocasiones, el agrupar los datos en intervalos, nos puede ayudar
para realizar un mejor anlisis de ellos.
Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de 80 estudiantes de cuarto ao de
educacin media.














1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75
1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75
1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93
1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79
1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76
1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76
1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
Notamos que la estatura mayor es :1,93 m
La estatura menor es :1,66m;
El rango es : 0,27m = 27 cm.
Formaremos 6 intervalos.
Para calcular el tamao de cada uno dividimos 27 : 6 = 4,5 lo aproximamos
a 5.
Nos queda la siguiente tabla:
Cual seria la frecuencia absoluta?










Intervalos Frecuencia Absoluta
1,65 1,69
1,70 1,74
1,75 1,79
1,80 1,84
1,85 1,89
1,90 1,94
Total :
LA FRECUENCIA ABSOLUTA SERIA
Intervalos Frecuencia Absoluta
1,65 1,69 6
1,70 1,74 12
1,75 1,79 30
1,80 1,84 22
1,85 1,89 8
1,90 1,94 2
Total : 80
PARA CONSTRUIR UNA TABLA DE FRECUENCIAS PARA DATOS
AGRUPADOS,
1. Determinamos el tamao de cada intervalo.
2 Dividiendo el valor del rango
3 Por la cantidad de intervalos que se desea obtener.

IMPORTANTE RECORDAR:
1. El rango, est dado por la diferencia entre el mximo y el
mnimo valor de la variable.
2. El tamao del intervalo se aproxima al impar ms cercano.
3. La Marca de clase es el representante de un intervalo, y
corresponde al promedio entre los extremos

EN RESUMEN:
Exponen la informacin recogida en la muestra, de forma
que no se pierda nada de informacin (o poca).

FRECUENCIAS ABSOLUTAS: Contabilizan el nmero de
individuos de cada modalidad

FRECUENCIAS RELATIVAS (PORCENTAJES): Contabilizan
el nmero de individuos de cada modalidad, pero dividido por
el total
fi = ni
n
Frecuencias (absolutas o relativas) acumuladas: Slo
tienen sentido para variables ordinales y numricas



Sexo del encuestado
636 41,9 41,9
881 58,1 58,1
1517 100,0 100,0
Hombre
Muj er
Total
Vli dos
Frecuenci a Porcentaj e
Porcentaj e
vl i do
Nivel de felicidad
467 30,8 31,1 31,1
872 57,5 58,0 89,0
165 10,9 11,0 100,0
1504 99,1 100,0
13 ,9
1517 100,0
Muy fel i z
Bastante fel iz
No demasi ado fel i z
Total
Vli dos
No contesta Perdi dos
Total
Frecuenci a Porcentaj e
Porcentaj e
vl i do
Porcentaj e
acumul ado
Ejemplos:
Nmero de hij os
419 27,6 27,8 27,8
255 16,8 16,9 44,7
375 24,7 24,9 69,5
215 14,2 14,2 83,8
127 8,4 8,4 92,2
54 3,6 3,6 95,8
24 1,6 1,6 97,3
23 1,5 1,5 98,9
17 1,1 1,1 100,0
1509 99,5 100,0
8 ,5
1517 100,0
0
1
2
3
4
5
6
7
Ocho o ms
Total
Vli dos
No contesta Perdi dos
Total
Frecuenci a Porcentaj e
Porcentaj e
vl i do
Porcentaj e
acumul ado
GRFICOS PARA VARIABLES CUALITATIVAS
Pictogramas:
Son grficas elaboradas con smbolos, figuras o signos
y totalmente libres cuya presentacin es eminentemente
esttica y representa la imagen del fenmeno que se
grafica

Fciles de entender.
El rea de cada modalidad debe ser proporcional a la
frecuencia.
Ejemplo
Botellas de cerveza recogidas el fin de semana.









SBADO DOMINGO
GRAFICAS LINEAL SIMPLE
Para elaborar esta grfica se emplea como base un eje de coordenadas positivas y se utiliza
preferentemente para graficar el comportamiento de tendencia de series cronolgicas.

Nos permite observar el desarrollo o tendencia que tiene el fenmeno en su
comportamiento durante un lapso de tiempo determinado.

Ventas (millones Dls)

10
9
8

7
6
aos
1 2 3 4 5 6 7 8


Ventas (millones Dls)











GRFICOS DIFERENCIALES PARA
VARIABLES NUMRICAS
DIAGRAMAS BARRAS PARA VARIABLES DISCRETAS
Se deja un hueco entre barras para indicar los valores que no son
posibles
0 1 2 3 4 5 6 7 Ocho o ms
Nmero de hijos
100
200
300
400
R
e
c
u
e
n
t
o
419
255
375
215
127
54
24 23
17
DIAGRAMAS INTEGRALES
REPRESENTACIN ESTADSTICA
GRFICOS PARA VARIABLES CUALITATIVAS
Diagramas de barras (mltiples)
Alturas proporcionales a las
frecuencias (absoluta o
relativa.)
Se pueden aplicar tambin a
variables discretas


Diagramas de sectores (tortas,
polares)
No usarlo con variables
ordinales.
El rea de cada sector es
proporcional a su frecuencia
(absoluta o relativa.)

EJEMPLO

CON LOS DATOS QUE SE MUESTRAN CONFECCIONE UN GRAFICO DE
BARRA EXPLIQUE QUE HA SUCEDIDO CON LA PRODUCCION DE BANANO
DURANTE ESTOS AOS.

AO PRODUCCION DE
BANANO (TON)
2009 15000
2010 12000
2011 18000
2012 11000
Diagramas integrales
PARMETROS Y ESTADSTICO
Parmetro: Es una cantidad numrica calculada sobre una poblacin

La altura media de los individuos de un pas

La idea es resumir toda la informacin que hay en la
poblacin en unos pocos nmeros (parmetros).

Estadstico: Es una cantidad numrica calculada sobre una muestra

la altura media de los que estn en un teatro en un
momento dado.
Son una muestra (representativa?) de la poblacin.

Si un estadstico se usa para aproximar un parmetro
tambin se le suele llamar ESTIMADOR.
MEDIDAS DESCRIPTIVAS
POSICIN
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
CENTRALIZACIN
Indican valores con respecto a los que los datos parecen agruparse.
Media, mediana y moda
DISPERSIN
Indican la mayor o menor concentracin de los datos con respecto a las
medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
FORMA
Asimetra
Apuntamiento o curtosis
MEDIDAS DESCRIPTIVAS
Medidas de tendencia central
Refiere a los valores de las variables que suelen estar
en el centro de la distribucin.

Posicin donde se centra una distribucin en una
escala de valores

MEDIA

MEDIANA

MODA

La MEDIA ARITMTICA O PROMEDIO es una medida estadstica de
tendencia central. De una cantidad finita de nmeros, es igual a la
suma de todos ellos dividida entre el nmero de sumandos.

Tambin la media aritmtica puede ser denominada como centro de
gravedad de una distribucin.
Medidas de tendencia central


Inconvenientes de la media:
EJEMPLOS DE CALCULOS DE LA MEDIA ARITMETICA

SE HA INVESTIGADO EL PRECIO DE UN ARTICULO EN CUATRO ESTABLECIMIENTOS
COMERCIALES DIFERENTES. CUAL ES EL PRECIO PROMEDIO DEL ARTICULO INVESTIGADO?
PRECIO (Xi)
20
25
30
36
RESPUESTA:


PRECIO (Xi)
20
25
30
36
LA MEDIA SERIA 27.75 ARTICULOS
EJEMPLOS DE CALCULOS DE LA
MEDIA ARITMETICA

Se ha hecho una encuesta sobre el nmero de veces que
semanalmente concurren los clientes a un comisariato a realizar
compras . Cuntas veces a la semana concurren como promedio
los clientes al comisariato?
Concurrencia semanal Clientes
Xi Fi Xi.fi
1 32
2 11
3 15
4 7
6 5
RESPUESTA:
Concurrencia semanal Clientes
Xi Fi Xi.fi
1 32 32
2 11 22
3 15 45
4 7 28
6 5 30
LOS CLIENTES CONCURREN COMO PROMEDIO 31,4
VECES





VALOR DEL PRODUCTO
10

8

6

5

3
0 32 37 42 47 52 57 62 67 aos
Media = 49,5

APROXIMACION GRAFICA DE LA MEDIA
ARITMETICA
Con el fin de ratificar que la media aritmtica es un promedio de tendencia
central podemos mediante un polgono de frecuencia podemos sealar el valor
aproximado de la media en el eje horizontal, y con ello comprobar el promedio
aritmtico se ubica por el centro de la distribucin.



OTRAS MEDIAS:
MEDIA GEOMETRICA:
Es de gran utilidad para calcular tasas, porcentajes y nmeros ndices y permite medir el
comportamiento de las series cronolgicas a travs del promedio del crecimiento y
decrecimiento de una variable en el tiempo
Se define a la media geomtrica como la raz ensima de los valores que adopta la variable
es decir que la frmula seria n..
G = X1 . X2..Xn,
Esta frmula tiene un inconveniente que si un valor fuera cero entonces no podra
calcularse la media geomtrica.
Para salvar este inconveniente entonces se utiliza la frmula basada en los
logaritmos

MEDIA GEOMETRICA
EJEMPLO DE CALCULO :
CALCULE LA MEDIA GEOMTRICA DE LOS SIGUIENTES DATOS QUE SE REFIEREN AL PRECIO
DEL BANANO.

PRECIO (X i) Log Xi
20
25
30
36
TOTAL
G = ANTILOG DE
n
G = n1.n2.n3.n4
RESPUESTA:
PRECIO (X i) Log Xi
20 1,3010
25 1,3979
30 1,4771
36 1,5563
TOTAL 5,7323
G = ANTILOG DE 5,7323 G= 27,11
4
4 4
G = 20.25.30.36 G = 540,000 4 G =27,11
UNA PROPIEDAD IMPORTANTE DE LA MEDIA ES QUE
LA SUMA DE LAS DESVIACIONES (X) DE CADA
VALOR INDIVIDUAL DE LA VARIABLE CON RELACION
A LA MEDIA ARITMETICA ES IGUAL A 0
Estadsticos de Centralizacin

Mediana Es un valor que divide a las observaciones en dos grupos
con el mismo nmero de individuos .Es decir es aquel valor de la
variable que supera y es superado por no ms de la mitad de los
datos.
La mediana se calcula en primer lugar ordenando los datos y luego:

Si el nmero de datos es par, se elige la media de los dos datos
centrales


Mediana de 1,2,4,5,6,6,8
es 5

Mediana de 1,2,4,5,6,6,8,9
es (5+6)/2=5,5

Es conveniente cuando los datos son asimtricos.

Mediana de 1,2,4,5,6,6,800
es 5.
La media es 117,7!

Propiedades de la mediana
20 150 250 300 400 500 600 700 800 1000
40 150 250 300 400 500 600 700 850 1000
72 150 280 300 400 500 600 750 900 1000
90 160 280 320 450 510 600 760 900 1100
100 160 300 330 450 540 600 800 900 1150
120 200 300 350 480 550 640 800 960 1200
120 200 300 360 480 550 650 800 960 1200
120 200 300 380 500 550 650 800 980 1500
150 220 300 400 500 570 680 800 1000 1800
150 250 300 400 500 580 700 800 1000 2440



EJEMPLOS DE CALCULOS
EN EL EJEMPLO QUE SE EXPONE A CONTINUACION BUSCAR LA MEDIANA
DE LOS DATOS QUE SE PRESENTAN

MEDIANA
RESPUESTA:
MEDIANA
20 150 250 300 400 500 600 700 800 1000
40 150 250 300 400 500 600 700 850 1000
72 150 280 300 400 500 600 750 900 1000
90 160 280 320 450 510 600 760 900 1100
100 160 300 330 450 540 600 800 900 1150
120 200 300 350 480 550 640 800 960 1200
120 200 300 360 480 550 650 800 960 1200
120 200 300 380 500 550 650 800 980 1500
150 220 300 400 500 570 680 800 1000 1800
150 250 300 400 500 580 700 800 1000 2440

MEDIANA
edad

Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
15
439878 7,1 7,1 7,1
16
427380 6,9 6,9 14,0
17
412200 6,7 6,7 20,6
18
419529 6,8 6,8 27,4
19
415349 6,7 6,7 34,1
20
399023 6,4 6,4 40,6
21
428206 6,9 6,9 47,5
22
378808 6,1 6,1 53,6
23
461983 7,5 7,5 61,0
24
408871 6,6 6,6 67,6
25
415516 6,7 6,7 74,3
26
430316 6,9 6,9 81,3
27
407540 6,6 6,6 87,9
28
385408 6,2 6,2 94,1
29
367549 5,9 5,9 100,0
Vlidos
Total
6197556 100,0 100,0


Estadsticos

edad
Vlidos
6197556
N
Perdidos
0
Media
21,89
Mediana
22,00
Moda
23

Estadsticos

edad
Vlidos
6197556
N
Perdidos
0
Media
21,89
Mediana
22,00
Moda
23

EJEMPLOS DE CALCULOS
Se aprecian la media , la mediana y la moda del ejemplo
anterior
Moda
Es un promedio posicional que puede definirse como:
Aquel valor de la variable o aquella categora o modalidad del
atributo que mayormente se repite en la distribucin.
Dicho de otra manera la Moda es aqul valor o modalidad de mayor
frecuencia en la distribucin












Cuando en la serie se presenta un Si hubiesen dos valores o
mismo valor o una misma modalidad modalidades con la misma
o categora con mayor frecuencia mayor frecuencia
Unimodal Bimodal
EJEMPLOS DE CALCULOS PARA LA MODA
EN LA TABLA SE PRESENTA EL SALARIO DE DIVERSAS PERSONAS QUE EJERCEN
COMO OFICINISTA DIGA CUAL ES LA MODA EN ESTE EJEMPLO








MO=
Sueldos Oficinistas
350 2
380 3
400 25
450 1
500 1
EJEMPLOS DE CALCULOS PARA LA MODA
En la tabla se presenta el salario de diversas personas que ejercen como oficinista
diga cual es la moda en este ejemplo.

La s unidades de vehculos vendidas tienen diferentes colores diga cual es el color
Modal que se presenta en este ejemplo




Color del vehculo Unidades vendidas
Azul 3
Blanco 15
Rosado 2
Negro 5
Carmelita 2
N = 27
COMPARACIN ENTRE LA MODA, LA
MEDIANA Y LA MEDIA.

En el caso que los datos sean cualitativos ( ejemplo: el tipo de reaccin), no
hay otra manera que usar la
MODA, ya que estos eventos pueden ser solo contados.

Si los datos pueden ser ordenados de alguna forma, entonces puede usarse
LA MODA Y LA MEDIANA

Por ultimo si los datos son medibles de forma cuantitativas, es posible usar
tambin
LA MEDIA.

Como se ha sealado la media es la medida de tendencia central mas
utilizada debido a sus propiedades , sin embargo es necesario sealar que
la misma puede alterarse como hemos visto considerablemente en algunos
casos, en presencia de valores extremos considerables (muy grandes o
muy pequeos


ESTADIGRAFOS DE DISPERSION




INTRODUCCIN

LOS MEDIDAS DE TENDENCIA CENTRAL COMO LA MEDIA, NOS SEALAN HACIA
DONDE TIENDE A CONCENTRARSE LOS VALORES DE LA DISTRIBUCIN, PERO
NINGUNO DE LOS PROMEDIOS SEAN MATEMTICOS O POSICIONALES NO NOS
INDICAN


COMO O CUANTO SE DISPERSAN LOS VALORES DE LA
VARIABLE EN TORNO A UN PROMEDIO.



DE TAL MANERA QUE ADEMS DE UNA MEDIDA DE TENDENCIA CENTRAL
NECESITAMOS UNA MEDIDA DE DISPERSIN QUE NOS PERMITA CERTIFICAR LA
REPRESENTATIVIDAD QUE SOBRE EL COLECTIVO TIENE UN VALOR PROMEDIAL..
VEAMOS UN EJEMPLO DE LO DICHO HASTA AHORA.

EL SUELDO PROMEDIO DE A ES MAS REPRESENTATIVO , A PESAR DE SER EL PROMEDIO DE
LOS TRES IGUALES, ESTO SE EXPRESA EN LA DISPERSION MEDIDA A TRAVS DE LA
DESVIACIN ESTNDAR PUES ES IGUAL A CERO EN LA EMPRESA A

DE FORMA QUE LAS MEDIDAS DE DISPERSION O VARIABILIDAD NOS PERMITEN
CUANTIFICAR COMO ESTN CONCENTRADOS O DISPERSOS LOS VALORES DE LA VARIABLE
EN TORNO A UN PROMEDIO QUE GENERALMENTE ES LA MEDIA ARITMTICA O MEDIANA.
Empresas Salario en USD MEDIA
ARITMETICA
DESVIOACION
ESTANDAR
A 400-400-400 400 0
B 200-400-600 400 163,3
C 300-400-500 400 81,65
MEDIDAS DE DISPERSIN
DE MANERA QUE :
Los datos tambin se deben caracterizar en trminos de su dispersin o
variabilidad.
Las medidas de variabilidad cuantifican la extensin de la dispersin
La variabilidad tiene que ver con qu tan alejados estn los datos de la
media.
Miden el grado de cercana o lejana de las puntuaciones respecto a la media
Permiten describir el grado de homogeneidad / heterogeneidad de la distribucin
de una variable
LOS ESTADSTICOS DE DISPERSIN SE PUEDEN CLASIFICAR DE LA
FORMA
SIGUIENTE
Mximo y Mnimo
Rango
Amplitud Intercuartlica
Varianza
Desvo tpico
Coeficiente de variabilidad

Mnimo Mximo rango o recorrido y amplitud intercuartlica

20 150 250 300 400 500 600 700 800 1000
40 150 250 300 400 500 600 700 850 1000
72 150 280 300 400 500 600 750 900 1000
90 160 280 320 450 510 600 760 900 1100
100 160 300 330 450 540 600 800 900 1150
120 200 300 350 480 550 640 800 960 1200
120 200 300 360 480 550 650 800 960 1200
120 200 300 380 500 550 650 800 980 1500
150 220 300 400 500 570 680 800 1000 1800
150 250 300 400 500 580 700 800 1000 2440
Mnimo
Mximo
RANGO O RECORRIDO
Distancia entre el mximo valor y el mnimo valor que puede asumir la variable.
Es la medida de dispersin mas simple, mide el campo de variacin de la variable a travs
de la diferencia entre le mximo y el mnimo
R = XM - Xm
Mximo - Mnimo
2240- 20 = 2220


LA UTILIDAD DEL RANGO
RESIDE EN QUE NOS PERMITE DIVIDIR LA DISTRIBUCIN EN INTERVALOS
INFORMNDONOS DE LOS VALORES EXTREMOS. COMO MEDIDA DE DISPERSION ES
LIMITADA SU FUNCION PUES TOMA EN CONSIDERACIN SOLAMENTE LOS VALORES
EXTREMOS.
DESVIACIN ESTNDAR (O DESVIACIN TPICA) Y LA VARIANZA
La desviacin estndar (o desviacin tpica) y la varianza son medidas de dispersin
para variables de razn y de intervalo.
Son medidas que informan acerca del promedio de distancias que tienen los datos
respecto de su media aritmtica, expresada en las mismas unidades de medida que
la variable de origen. n


Varianza S
2
: Mide el promedio de las desviaciones (al cuadrado) de las observaciones
con respecto a la media.
n

Ambas medidas estn estrechamente relacionadas ya que se define una a partir de la
otra.


.



DESV TPICO

=
i
i
x x
n
S
2 2
) (
1
2
S S =
DESVIACIN ESTNDAR
Denominada tambin como desviacin tpica: Es la raz cuadrada de la
varianza



El significado de la desviacin estndar
Cuando una distribucin la representamos grficamente mediante un polgono de
frecuencia
La desviacin estndar representa la VARIABILIDAD PROMEDIO que nos permite medir la
distancia entre los valores de la variable y la media aritmtica en unidades de
desviaciones estndares denominadas unidades sigma










-2s -s + s +s

Curva simtrica que muestra las relaciones entre las desviaciones estndar y la media

2
S S =
EJEMPLO

En un experimento con ratas en el cual se quera saber si la planta estudiada
tenia efecto hipoglucemiante Se obtuvieron los siguiente valores al
determinar la glucosa en un experimento (en mmol/L). Calcule la media, la
desviacin estndar y la desviacin tpica.
Valores
de
Glucosa
Media Diferencia Diferencia
al
cuadrado
20
25
30
36
total
Solucin del EJEMPLO


Valores
de
Glucosa
Media Diferencia Diferencia
al
cuadrado
20 27,50 -7,75 60,0625
25 27,75 -2,75 7.5625
30 27,75 2,25 5,0625
36 27,75 8,25 68,0625
total 140,75
Aplicando las formulaciones tendremos:

Media: 27,50
La varianza es 35,18
La desviacin estndar es: 5,93

Respuesta : los valores medios de la glucosa en ratas son 27,50, mientras que la
la varianza es 35,18 y La desviacin estndar es: 5,93

=
i
i
x x
n
S
2 2
) (
1
2
S S =
EJEMPLO 2
En tres empresas se pagan diferentes salarios, como puede observarse en la
tabla , diga cuales son las correspondientes medias y calcule la desviacin
estndar y la varianza. Si tuviese alguna oportunidad de trabajo cual de ellos
escogeria
Empresas

Salario en USD MEDIA
ARITMETICA
DESVIACION
ESTANDAR
varianz
a
A 400-400-400
B 200-400-600
C 300-400-500
Empresas

Salario en USD MEDIA
ARITMETICA
DESVIACIO
N
ESTANDAR
varianza
A 400-400-400 400 0 0
B 200-400-600 400 163,3 26666,89
C 300-400-500 400 81,65 6666,7225
Solucin del EJEMPLO
Respuesta:
Medidas de dispersin / desviacin
respecto a la media
Coeficiente de variacin:
Es la razn entre la desviacin tpica y la media. Mide la desviacin tpica en
forma de qu tamao tiene con respecto a la media. Tambin se la denomina
variabilidad relativa. se calcula dividiendo la desviacin estndar por la media

x
S
CV =
Si se multiplica por 100 se obtiene el grado de variabilidad respecto de
la media
Es de particular utilidad comparar la variabilidad de 2 o mas
conjuntos de datos con medias diferentes.
El coeficiente de variabilidad es una medida relativa que se
expresa en porcentaje en vez de en trminos de las unidades de
los datos.
Es una forma de estandarizar el desvo
Indica la relacin entre el desvo y la media

EJEMPLO CUANDO LAS VARIABLES DE
LAS DISTRIBUCIONES A COMPARAR SEAN
DE IGUAL NATURALEZA.
ESTADGRAFO SUELDOS
Empresa pequea Empresa grande
Media aritmtica 100000 2000000
Desviacin estndar 10 200000
Diga en que empresa ha habido mayor variacin
Resolucin del ejemplo
ESTADGRAFO SUELDOS
Empresa pequea Empresa grande
Media aritmtica 100000 2000000
Desviacin estndar 10.000 200000
x
S
CV =
Cv = 10000 .100
100,000
CV = 10% CV = 10%

Cv = 200000 .100
2,000.000
A simple vista podamos haber estimado que la Empresa Grande habran
existido mayor variacin dad su media y su desviacin estndar, sin embargo
mediante el coeficiente de variacin podemos comprobar que tiene la misma
variacin
EJEMPLO CUANDO LAS VARIABLES DE LAS
DISTRIBUCIONES A COMPARAR SEAN DE DISTINTA
NATURALEZA.
ESTADGRAFO VARIABLES
MINUTOS DE
ATRASOS
PRODUCTOS
VENDIDOS
Media aritmtica 49,27 30,80
Desviacin estndar 8,97 9,83
Diga EN QUE VARIABLE OCURRE MAYOR VARIACION
SOLUCION DEL EJEMPLO ANTERIOR
ESTADGRAFO VARIABLES
MINUTOS DE
ATRASOS
PRODUCTOS
VENDIDOS
Media aritmtica 49,27 30,80
Desviacin estndar 8,97 9,83
CV = 8,97 (100) CV = 9,83 (100)
49,27 30,80
V = 18% V= 32%

RESPUESTA: Con los resultados del coeficiente de variacin
determinamos que la distribucin de productos vendidos
(32%), tiene mayor variacin que la serie de minutos de
atrasos (18%).


AMPLITUD O RANGO:
La diferencia entre las observaciones extremas.

2, 1, 4, 3, 8, 4.

EL RANGO ES : 8-1=7
LA FORMA DE LA
DISTRIBUCIN
Una caracterstica de un conjunto de datos es la forma, es decir, la manera en que estn
distribuidas las observaciones.
La distribucin de los datos puede ser o no SIMTRICA. Si la distribucin de los datos no
es simtrica, se llama ASIMTRICA O SESGADA.
Para describir la forma se puede comparar LA MEDIA Y LA MEDIANA.
Tambin puede observarse a travs del coeficiente de asimetra Mide el grado de Simetra /
Asimetra de la distribucin
EJEMPLO DE UNA DISTRIBUCION SIMETRICA
ASIMETRA O SESGO
Una distribucin es simtrica si la mitad izquierda de
su distribucin es la imagen especular de su mitad
derecha.

En las distribuciones simtricas, media y mediana
coinciden. Si slo hay una moda tambin coincide

La asimetra es positiva o negativa en funcin de a
qu lado se encuentra la cola de la distribucin.

La media tiende a desplazarse hacia las valores
extremos (colas).

Mdn = Media
EN LA DISTRIBUCIN NORMAL ES SIMTRICA SI
MEDIA = MEDIANA: SIMTRICOS O CON SESGAMIENTO
CERO.
Mdn
Media
Si es + indicar muchos casos en los valores ms bajos y
pocos en los ms altos positivamente asimtrica .
Media > Mediana: Positivos o con sesgamiento a la derecha
Mdn
Media
Si es - indicar muchos casos en los valores ms altos y
pocos en los ms bajos negativamente asimtrica.
Media < Mediana: Negativos o con sesgaminto a la
izquierda.

LA CURTOSIS NOS INDICA EL
GRADO DE APUNTAMIENTO
(APLASTAMIENTO) DE UNA
DISTRIBUCIN CON RESPECTO A
LA DISTRIBUCIN NORMAL O
GAUSSIANA. ES ADIMENSIONAL
LA CURTOSIS
Otra manera de apreciar la forma de una distribucin es
observar el nivel de apilamiento o llanura de la curva
LA FORMA DE LA DISTRIBUCIN
leptocrtica
(menor dispersin)
LEPTO= ESBELTO
Platicrtica
(mayor dispersin)
PLATO= ANCHO O PLANO
Mesocrtica
MESO= MITAD
Leptocrtica: curtosis > 0

Mesocrtica: curtosis = 0

Platicrtica: curtosis < 0





4 K>0 (LEPTOCURTICA
f(X media) K < 0 (PLATICURTICA).
K = n - 3 K = 0 (MESOCURTICA)
4
S
Calcule el coeficiente de curtosis y diga como es la curva atendiendo
al mismo

L i

Ls

Xi

fi

Xi.fi

X-Xm=x
4
X
4
fi . x
2
fi. X .
0 2 1 20 20 1-10= -9 6561 131220 20
3 5 4 30 120 4-10=-6 1296 38880 480
6 8 7 80 560 7-10=-3 81 6480 3920
9 11 10 129 1290

10-10=0 0 0 12900
12 14 13 80 1040 13-10=3 81 6480 13520
15 17 16 30 480 16-10=6 1296 38880 7680
18 20 19 20 380 19-10=9 6561 131220 7220
Total 389 3980 353160 45740
353,16
K = 389_ - 3 K = 907,87 - 3
(4,19)
4
308,22


K = 2,95- 3= -0,05
Por su cercana al cero se le puede considerar simtrica
MESOCURTICA






GRFICOS PARA VARIABLES
CONTINUAS

Histogramas para variables
continuas
El rea que hay bajo el histograma entre
dos puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en el
intervalo.

20 40 60 80
Edad del encuestado
50
100
150
200
250
R
e
c
u
e
n
t
o
Qu hemos visto?
Introduccion
HISTORIA DE LA ESTADISTICA.
Utilidad de la estadstica.
Pasos en un estudio estadstico.
Definiciones bsicas en estadstica
Poblacin y Muestra
Variables
Cualitativas
Numricas
Presentacin ordenada de datos.
Estructura de las tablas estadisticas
Tablas de frecuencias y Representaciones grficas
Medidas descriptivas
Medidas de centralizacin: Media, mediana y moda
Medidas de dispersin (varianza, desviacin estandar, CV, rango
Asimetra y Medidas de apuntamiento (curtosis)
Regresin y correlacin
Asociacin entre variables


Hemos visto las distribuciones Unidimensionales , esto es analizamos una sola variable
(peso, contenido de glucosa, sueldos, edad, etc.) y se describi su comportamiento a travs
de tablas y grficos y medidas tanto de tendencia central como de dispersin, (media y
desviacin estndar).
Correlacin significa relacin mutua y expresa el grado de asociacin
existente entre las variables,
Cuando estudiamos dos variables en su posible relacin, influencia o dependencia se busca
como objetivos Establecer la naturaleza de la relacin digamos tambin
PREDECIR
El comportamiento de dichas variables . As por ejemplo un medicamento determinado
conlleva a una mejora durante un tiempo dado, , pero podemos preguntarnos si se
continua con el mismo podramos tener iguales resultados ?
Su parmetro es el coeficiente de correlacin. Su smbolo es r, que puede acompaarse, si la
claridad lo exige, de un subndice con la notacin de las variables (p.e. rxy)

La precisin de nuestra prediccin depende de l a :

FUERZA DE LA RELACION QUE TIENE LAS VARIABLES MEDICAMENTO Y MEJORA.

Este anlisis de relacin entre dos variables nos lleva al estudio de la
REGRESION Y CORRELACION




Regresin
Estimamos la relacin de una variable con otra en trminos de una
funcin lineal (o ms compleja ) de la otra. Nos permite adems hacer
predicciones . Hoy en da el sentido de regresin es el de prediccin de
una medida basndonos en el conocimiento de otra. (Variables
cuantitativas continuas ).
La regresin es la forma, el COMO de esa asociacin. Expresa la
relacin entre las dos variables, X e Y, mediante la ecuacin de
regresin y su representacin grfica la lnea de regresin.
Mediante ella conocida una variable es posible predecir la otra. Por
consenso X es la variable Independiente e Y la dependiente. De esta
forma Y = f(X).
Coeficiente de







Correlacin
Estimamos el grado en que 2 o ms variables cambian
simultneamente. (Variables cuantitativas continuas ).
Se plantea que
LA CORRELACIN MIDE LA FUERZA DE UNA RELACIN ENTRE
VARIABLES
LA REGRESIN DA LUGAR A UNA ECUACIN QUE DESCRIBE
DICHA RELACIN EN TRMINOS MATEMTICOS





En nuestro trabajo podemos sealar los siguientes ejemplos de
Relaciones bidimensionales :
Edad y peso
Contenido de glucosa y diabetes
Enfermedad y tipo de medicamento o clase.

DIAGRAMA DE DISPERSIN
Regresin
El anlisis de regresin sirve para predecir una medida en funcin de
otra medida (o varias).

Una funcin es una relacin matemtica que nos permite predecir que valores
de una variable Y corresponden a determinados valores de una variable X. tal
relacin generalmente se escribe como:
Y = F(X)
Y - variable dependiente
(predicha o explicada)
X - variable independiente
(predictiva o explicativa)

El diagrama de dispersin es una grfica de puntos en la que cada punto
del plano representa un par de valores correspondientes de la
variable X e Y

y = a + b x
Ecuacin de regresin b es la pendiente y el coeficiente de regresin
y a el intercepto
Ejemplos de varios tipos de relaciones
y = a + b x LINEAL
y = a + b x + c x
2
Cuadrtica
y =ab
n
Exponencial
y = log a + x log b Logaritmica

El objetivo de la Regresin lineal
es encontrar la lnea que mejor predice la Y a partir de la X.
Es + cuando al aumentar el valor de X tambin aumenta el de Y o
viceversa. Cuando disminuye la X tambin disminuyen los valores de Y.
Es - cuando al aumentar el valor de X disminuyen los valores de Y o
Cuando disminuye la X aumentan los valores de Y




Relacin directa
Ventas (millones Dls)

10
9
8

7
6

aos
1 2 3 4 5 6 7 8

ANALISIS DE REGRESION
COMO VIMOS EL OBJETIVO FUNDAMENTAL DE UN ANLISIS DE REGRESIN ES PREDECIR EL
VALOR DE LA VARIABLE DEPENDIENTE (Y) CONOCIENDO EL VALOR DE LA OTRA.
EN UN SENTIDO AMPLIO LA REGRESIN BUSCA COMO OBJETIVO UNA LNEA O UNA FUNCIN
MATEMTICA QUE EXPRESE SIN IRREGULARIDADES LA RELACIN ENTRE DOS VARIABLES.

Ejemplo de confeccin de curva dosis /efecto
En un experimento con ratones se suministraron varias dosis de una planta
medicinal determinada y se encontr que los pesos corporal aumentaban
como se observa en la tabla. Confeccione la curva correspondiente como
es la pendiente de la curva con relacin al signo.
X y
1 21
2 22
3 23
4 24
5 25
6 26
y = a + b x
De no darse esta relacin perfecta y de hecho en la prctica no es as
o sea no se disponen los pares ordenados en una lnea ideal.

La regresin tiene como objetivo determinar la Relacin Funcional de
las dos variables a travs de una ecuacin y una lnea que describa la
forma de relacin existente , es decir determinar un modelo
matemtico que exprese la supuesta relacin funcional entre X e Y.

AJUSTE DE UNA RECTA.
Entonces lo que buscamos es la llamada lnea de Regresin a travs de
una ecuacin matemtica denominada

ECUACION DE LA RECTA.




Ejemplos:
EN UN ENSAYO DE PESO DE ORGANOS EN RATAS MACHOS SE ENCONTRARON
LOS SIGUIENTES RESULTADOS . Ver tabla en la pagina siguiente
PREGUNTAS:
Diga cuales son los pares ordenados.
Porque se dicen que forman u par
Plotee los resultados obtenidos de los pares ordenados
Que conclusiones puede obtener
Cual es la ecuacin que representan estos resultados
DATOS DEL PROBLEMA ANTERIOR
X Y
100 40
200 45
300 50
400 65
500 70
600 70
700 80
DATOS DEL PROBLEMA ANTERIOR







80


60


40

20
10

0







0 100 200 300 400 500 600 700
EL MEJOR METODO MATEMATICO UTILIZADO EN ESTADISTICA PARA
OBTENER UNA ECUACION DE REGRESION Y AJUSTAR LA RECTA ES EL
DENOMINADO
METODO DE LOS MINIMOS CUADRADOS

CUANDO UNA LINEA RECTA NO PUEDE AJUSTARSE PERFECTAMENTE A LOS PUNTOS DEL
PLANO , LAS DESVIACIONES ENTRE LOS VALORES INDIVIDUALES REALES (Y) Y LA RECTA
IDEAL (YC) SE LE MINIMIZA A TRAVS DEL METODO DE LOS MINIMOS CUADRADOS QUE
PROPORCIONA LA RECTA DE MEJOR AJUSTE PUES MINIMIZA LA SUMA DE LOS CUADRADOS
DE LAS DESVIACIONES CON RESPECTO A LA RECTA.

METODO DE LOS MINIMOS CUADRADOS
ES EL METODO MATEMATICO UTILIZADO PARA DETERMINAR LA ECUACION DE REGRESION
QUE MINIMIZA LA SUMA DE LOS CUADRADOS DE LAS DISTANCIAS ENTRE LOS VALORES
REALES Y LOS PRONOSTICADO O ESTIMADOS (YC).
PARA COMPRENDER ESTE TERMINO PONDREMOS UN EJEMPLO MATEMATICO
LA ECUACIN LINEAL ES
Y = a + b X

EN NUESTRO CASO QUEREMOS HALLAR LA LNEA IDEAL Y LA ECUACION DE REGRESION
QUE VIENE DADA POR LA ECUACION
Y c = a + b X

Ahora como se calculan los valores de a y b


METODO DE LOS MINIMOS CUADRADOS
_ _
b= XY - n X Y
2 _2
X - n X

mientras que _ _
a = Y - b X

Con estas formulaciones podremos hallar la lnea ideal y la
ecuacin de regresin.

Veamos un ejemplo


EN UN EXPERIMENTO QUE RELACIONABA LOS AOS DE EXPERIENCIA DE UN
FARMACUTICO Y LAS UNIDADES DE MEDICAMENTOS VENDIDOS EN LA FARMACIA,
DURANTE UN DETERMINADO TIEMPO SE OBTUVIERON LOS DATOS SIGUIENTES.
OBTENGA LA ECUACION LINEAL DE REGRESION

FARMACEUTI
CO
AOS DE
EXPERIENCI
A (X)

UNIDADES
VENDIDAS
(Y)
XY 2
X
2
Y
A 6 90 540 36 8100
B 5 60 300 25 8600
C 3 40 120 9 1600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2500
G 6 80 480 36 6400
H 2 20 40 4 400
FARMACEUTI
CO
AOS DE
EXPERIENCIA (X)

UNIDADES
VENDIDAS
(Y)
XY 2
X
2
Y
A 6 90 540 36 8100
B 5 60 300 25 8600
C 3 40 120 9 1600
D 1 30 30 1 900
E 4 30 120 16 900
F 3 50 150 9 2500
G 6 80 480 36 6400
H 2 20 40 4 400
Totales
N= 8
30 400 1780 136 24400
Empleando las frmulas que conocemos calculamos las medias de
X e Y
_ _
X =3,75 Y= 50
PARA CALCULAR
b y a
_ _
b= XY - n X Y = 11.91
2 _2
X - n X

_ _
a = Y - b X = 5.34

Como Yc = a + b (X)

Por tanto la ecuacin lineal de la recta de regresin ser:

Yc= 5.34 + 11.91

De aqu podremos obtener la recta de mejor ajuste
De forma que si damos los valores siguientes a
X= 1 sustituyendo en la ecuacin obtenida
esto implica que Y = 17,25









X= 1 SUSTITUYENDO EN LA ECUACIN OBTENIDA
ESTO IMPLICA QUE

Y = 17,25

POR OTRA PARTE
PARA EL PUNTO X= 6 SUSTITUYENDO EN LA ECUACIN HALLADA
Y= 76,80
FINALMENTE PLOTEANDO EN EL GRFICO LOS PARES DE VALORES OBTENIDOS:
(1, 17.25) Y (6, 76.80) CON UNA PENDIENTE DE 11.91



Aos de experiencia
Unidades vendidas
0 1 2 3 4 5 6
(6,76.80)
(3,75; 50)
5,34 a
(1,17.25)
Media
50
17.25

76.80






PARA REALIZAR PREDICCIONES SOBRE LA BASE
DE LA ECUACION DE REGRESION DETERMINADA
DEBE CONSIDERARSE LO SIGUIENTE:

1. LA ECUACIN ES VLIDA PARA PRONOSTICAR VALORES YC SOBRE LA
POBLACIN DE DONDE SE ENVO LA MUESTRA. NO SERIA CORRECTO PARA
PRONOSTICAR DE OTRAS FARMACIAS QUE NO FUERA LAS QUE HEMOS
ANALIZADO.
2. DEBE PRONOSTICARSE SOBRE LA BASE DE LOS VALORES DE X QUE ESTN
DENTRO DEL DOMINIO O INTERVALO DE LOS VALORES DE X. SE PUEDE HACER
PREDICCIONES CON LAS DEBIDAS PRECAUCIONES Y CON VALORES PRXIMOS
AL INTERVALO DE DOMINIO DE LA VARIABLE X.

3. LA TEMPORALIDAD O TIEMPO ES UN FACTOR QUE DEBE CONSIDERARSE EN
EL ANLISIS DE REGRESION . PUES SI LA PRIMERA MUESTRA SE TOMO EN EL
2005 , SUS RESULTDFOS NO PDRIAN SER VALIDOS PARA 1990 O 2010.




Cuidado con la Extrapolacin
COEFICIENTE DE CORRELACION DE PEARSON
El diagrama de dispersin da una visin aproximada de la fuerza con que se relaciona las
variables y cuantitativamente esa fuerza de relacin se le mide a travs del denominado
coeficiente de correlacin

El coeficiente de correlacin mide que tan cerca estn los puntos reales de la lnea de
regresin o lnea ideal Yc
Mide la intensidad de la asociacin entre las variables
Es un nmero abstracto, independiente de la unidad de medida de las variables. Puede
adoptar cualquier valor entre 1 y 1.

DICHO DE OTRA Manera
r = (-11). Suele expresarse con 3 decimales, a no ser que valga 1, 0 1.
Aparte de su valor descriptivo sirve para ver la significacin estadstica de la relacin.
La correlacin entre dos variables. Su coeficiente de correlacin se llama de PEARSON,
aunque se dice simplemente COEFICIENTE DE CORRELACIN
Si r = 1 hay una correlacin total (perfecta) positiva.
Si r = -1 hay una correlacin total (perfecta) negativa.
Si r = 0 no hay correlacin.
Si est entre 1 y 0 , la correlacin es parcial y negativa.
Si est entre 0 y 1, la correlacin es parcial y positiva.
Una r de 0, -1 1 apenas se encuentra en la prctica

GRFICAMENTE ESTO SE PUEDE REPRESENTAR AS:
CLCULO DE COEFICIENTE DE CORRELACIN
Veremos nicamente el clculo a partir de los datos originales, aislados.

r = n XY - ( X ) ( Y )
2 2 2 2
[ n( X ) ] - ( X ) ] [ n( Y ) ] - ( Y ) ]


_ _
_

_
_ _
_
Para hacer los clculos se tendr en cuenta la tabla que
presentamos a continuacin
Sean los valores de X = (2 , 1 , 3 , 2 , 5)
Y = (3 , 5 , 4 , 2 , 6),
Los cuales representan las dosis de diferentes ( X ) de un medicamentos
que ofrecen respuesta positiva ante una patologa determinada.
Analice la intensidad de asociacin entre las variables
EJEMPLO DE CALCULO

X

Y
2
X
2
Y


XY
2 3 4 9 6
1 5 1 25 5
3 4 4 16 12
2 2 9 4 4
5 6 25 36 30
13 20 43 90 57
r = 5 x 57 - 13 x 20
2 2
[ 5 x 43 ) - ( 13 ) ] [ 5 x 90) ] - ( 20) ]

r = 25

46 x 50

R= 0.521


Como veremos a continuacin la correlacin es mnima es decir, es
decir que no existe relacion entre la dosis empleada y la mejora
del paciente
FUERZA DE LA RELACION
FUERZA DE LA RELACIN
POSITIVA ESTADO DE LA
CORRELACION
NEGATIVA
r=1 Correlacin perfecta r = -1
0.9 a 0.99 Correlacin excelente - 0.9 a - 0.99
0.80 a 0.89 Correlacin aceptable - 0.80 a - 0.89
0.60 a 0.79 Correlacin regular - 0.60 a -0.79
0.30 a 0.59 Correlacin mnima - 0 .30 a - 0.59
0. a 0.29 No hay correlacin - 0.a - 0.29
EJERCICIO DE TAREA DE TENDENCIA LINEAL (236)
EN UN LABORATORIO SE TIENEN DIFERENTES EQUIPOS PARA DETERMINAR EL
EFECTO DIURTICOS DE LOS MEDICAMENTOS CON DIFERENTES AOS DE USO Y
CUYO PRECIO VARIA COMO SE PUEDE APRECIAR DE LA TABLA SOBRE LA BASE
DE ESTO
1. ELABORAR EL DIAGRAMA DE PUNTOS Y DETERMINAR EL TIPO DE RELACIN
2. ELABORAR LA TABLA DE RELACION CORRELACION
3. CALCULAR LA ECUACION DE REGRESION
4. CALCULAR EL COEFICIENTE DE CORRELACION E INDICAR LA FUERZA DE LA
RELACION
5. ESTIME CUAL SERIA EL PRECIO DEL EQUIPO SI TUVIERA 3 Y 8 AOS DE USO.
6. GRAFICAR LOS PUNTOS REALES Y LA LINEA IDEAL EN UN SOLO GRAFICO



Aos de uso Precio (cientos de
dolares)
2 8
5 7
6 5
7 3
10 1
COEFICIENTE DE CORRELACION DE DATOS ORDINALES DE
SPERMAN

Introduccin:
El coeficiente de correlacin de Pearson es el mas apropiado
cuando los datos son de escala de intervalos o razn pero
cuando se trata de datos cualitativos cuyas modalidades se
han organizado sobre la base a un orden de rango , es decir
los datos han SIDO JERARQUIZADOS DE MENOR A MAYOR O
VICEVERSA, EL COEFICIENTE QUE NOS PERMITE MEDIR LA
RELACION ENTRE ESTE TIPO DE DATOS ES EL Coeficiente de
Sperman
En ocasiones tenemos caractersticas como
Belleza
Conducta
Actividad preferencial
Capacidad de liderazgo
Sabores entre otros
Como sabemos sus datos pueden ser jerarquizados u
organizados ordinalmente


EJEMPLO QUE NOS PERMITE CONOCER EL PROCESO DE LA
DETERMINACIN DE LOS RANGOS

Medidas Rangos
47 1
39 2
38 3
35 4
31 5
29 6
27 7
Obsrvese que el 27 tiene el rango 7 que es el mas bajo del conjunto de
datos mientras que el valor 47 recibe el rango numero 1 por ser el dato con
el valor mas alto

EJEMPLO
Cuando existen datos con valores similares se les asigna el rango promedio a los mismos.

Medidas Rangos
40 1
39 2.5
39 2.5
37 4
20 5
19 6
18 8
18 8
18 8
12 10
10 11
FORMULA DEL COEFICIENTE DE SPEARMAN
UNA VEZ EXPUESTO LA MECANICA DE ASIGNACIN DE RANGOS LA FORMULA DEL
COEFICIENTE DE SPERMAN ES:

R = 1 - 6 D
2

n (n
2
-1)

Al igual que el coeficiente de Pearson el de Spearman puede tomar valores
entre -1 y 1.

PARA APLICAR LA FORMULA SE DEBE SEGUIR EL SIGUIENTE
PROCEDIMIENTO

Primero: Determinar el rango de las medidas
Segundo Obtener la diferencia de los rangos
Tercero Verificar que las sumas de las diferencias de los rangos sea cero (= 0)
Cuarto Elevar al cuadrado las diferencias (D
2)


EJEMPLO DE APLICACIN DEL COEFICIENTE DE
SPEARMAN (DATOS CUANTITATIVOS)


Se receptan dos pruebas una terica y otra practica a dos estudiantes
de farmacologa en un curso de perfeccionamiento. Los resultados de las
calificaciones obtenidas son las siguientes:

Cul es la correlacin entre las pruebas y las calificaciones fueron
aceptable o no?

Estudiantes Prueba
terica
Prueba
practica
rangos Difer0.5en
cia de
1rangos


D
2

X Y X-2 Y = D
1 65 68 9 6.5 2.5 6.25
2 63 66 11 10.5 0.5 0.25
3 67 68 7.5 6.5 1 1
4 64 65 10 12 -2 4
5 68 69 5.5 4 1.5 2.25
6 62 66 12 10.5 1.5 2.25
7 70 68 3 6.5 -3.5 12.25
8 76 75 1 1 0 0
9 68 71 5.5 2 3.5 12.25
10 67 67 7.5 9 -1.5 2.25
11 69 68 4 6.5 -2.5 6.25
12 71 70 2 3 -1 1
N = 12 D = 50
Empleando la frmula )
r = 1 - 6 D
2

n (n
2
-1)


R= 1 6 x 50
12 (12
2
-1)
R = 1 0.17

R = 0.83

CORRELACIN
ACEPTABLE


Ejemplos para datos ordinales

Con el fin de medir la relacin que existe entre las preferencias por el
sabor de ciertas gaseosas y el diseo de sus envases . De las encuestas
realizadas se obtuvieron los siguientes resultados
MARCA DE
GASEOSA

RANGO DE
PREFERENCI
A
X
RANGO DE
DISEO
Y
DIFERENCIA
X - Y = D
D
2
=

COCA COLA 1 2 1- 2 = -1 1
PEPSI 2 5 2 -5 =-3 9
TROPICAL 3 1 3- 1 =2 4
SEVEN 4 3 4- 3 =1 1
FIORA 5 4 5- 4 =1 1
0 16
r = 1 - 6 D
2

n (n
2
-1)

R = 0.20 No hay correlacin
Los ejecutivos de venta de 10 distribuidoras de una empresa de productos
medicamentosos fueron entrenados para elevar su potencial de ventas.
Al cabo del ao sus calificaciones por rango en el programa de entrenamiento
se ordenaron para medir su correlacin con las ventas anualesn, en el cuadro
se presentan los resultados diga como fue la correlacin que se obtuvo.

Ejecutivos Ventas Rango
entrenamiento
X Y
A 319 3
B 150 9
C 175 6
D 460 1
E 398 4
F 300 10
G 280 5
H 200 2
I 190 7
j 300 8
N = 10
DESARROLLO
RANGOS DIFERENCIAS D
2


X Y X - Y = D
3 3 3 - 3 = 0 0
10 9 10 - 9 = 1 1
9 6 9 - 6 = 3 9
1 1 1 - 1 = 0 0
2 4 2 - 4 = -2 4
4.5 10 4.5 - 10 = -5.5 30.25
6 5 6 - 5 = 1 1
7 2 7 - 2 = 5 25
8 7 8 - 7 = 1 1
4.50 8 4.50 - 8 = -3.5 12.25
TOTAL 0 83.50






EMPLEANDO LA FRMULA PROPUESTA
TENDREMOS:

R = 1 - 6 D
2

N (N
2
-1)

R = 0.49
CORRELACION MNIMA

TAREA
Una empresa publicitaria desea determinar si el numero de anuncios comerciales que
se realizan mensualmente por televisin (X) se relacionan con el nmero de ventas de
los artculos que se proporcionan
Numero de anuncios publicitarios Numero de artculos vendidos
X Y
10 30
12 60
15 50
5 12
7 10
5 25
5 10
15 60
8 25
1 10
13 75
15 95
TEMA 9: ELEMENTOS DE PROBABILIDADES
INTRODUCCION
Mediante la Estadstica descriptiva y a travs de las
Tablas
Grficos
Medidas
Damos el informe del comportamiento de un fenmeno o sea una descripcin
de un fenmeno pasado
La probabilidad es una funcin Analitica Inferencial que nos permite a travs de
una muestra tomada de una poblacin
Estimar
Inferir
Hacer deducciones sobre el comportamiento de la poblacin de donde
fue tomada la muestra.
En este caso solo trataremos los elementos de probabilidad pues ella
solo abarcara el curso completo.

El papel de la probabilidad en la estadstica consiste en que el Probabilista
parte de la poblacin deducida de un sinnmero de ensayos o experimentos
para a partir de esta poblacin deducida analizar el compartimiento de la
muestra.
En cambio el estadista estima infiere la poblacin a partir de una muestra ,
realizando el proceso inverso de probabilista parte de la poblacin

EL PAPEL DE LA PROBABILIDAD EN LA ESTADSTICA
Consiste en que el Probabilista parte de la poblacin deducida de un
sinnmero de ensayos o experimentos para a partir de esta poblacin
deducida analizar el compartimiento de la muestra.

En cambio el estadista estima infiere la poblacin a partir de una muestra
realizando el proceso inverso de probabilista

MODELOS MATEMATICOS
Deterministas
Cuando es posible determinar de antemano los cambios de una variable
los modelos se denominan deterministas son modelos que emplean las
ciencias qumica,, fsicas, etc..
No todas las conductas humanas pueden estar ceidas a un modelo
matemtico determinista, donde inexorablemente deben cumplir se ciertas
leyes, muy por el contrario hay conductas que se desarrollan en la
incertidumbre y para ello se crearon los modelos matemticos denominado
Modelos probabilsticos.
Estos modelos no describen exactamente lo que ocurrir DADA UNA
SITUACIN SINO
QUE ESTIMA LO QUE ES POSIBLE QUE SUCEDA
Mecnica de la probabilidad y conceptos bsicos

La mecnica de la Probabilidad es estimar o inferir de que algo ocurrir:

Cual es la probabilidad de al lanzar una moneda caiga cara o escudo

Cual es la probabilidad de que caiga 3 al lanzar un dado


Conceptos bsicos de probabilidad
Que es probabilidad
La posibilidad de que algo ocurra

Como se mide la probabilidad?

La probabilidad es un numero que se mide entre uno y cero
0 P 1
Cuando existe la CERTEZA DE QUE UN EVENTO OCURRA
LA Probabilidad es :
Ej: sol
Cuando existe la certeza de que un evento no puede ocurrir es:
Ej : dado nmero 7
Que mide la probabilidad?
Mide la posibilidad de que llegue a ocurrir un evento como resultado de
un experimento
En el ejemplo de la moneda
Cara = 1/2
Cara + escudo

Valor fraccionado Valor decimal Valor porcentual
1/2 0.5 50 %

Espacio muestral
El conjunto de todos los resultados posibles de un experimentos se
denomina espacio muestral (S)

S = cara, escudo

S = 1,2,3,4,5,6
TIPOS DE PROBABILIDAD
LA PROBABILIDAD SE CLASIFICA EN:
CLASICA
DE FRECUENCIA RELATIVA
SUBJETIVA
Probabilidad clsica:
Podemos describirla de esta manera:

Probabilidad de un evento= nmero de resultados favorables
nmero de resultados posibles

Tambin puede expresarse de la forma siguiente:


Experimento en el lanzamiento de una moneda que salga cara

Levantar una carta de un juego de cuatro cartas correspondientes a los
cuatro ases de un juego de cartas Sea el as de brillo

P = as de brillo = 1/6
ases : brillo, trbol, corazn rojo, negro
P = f
n
Lanzamiento de un dado
Que caiga el nmero 3

PROBABILIDAD DE FRECUENCIA RELATIVA
Se determina por la va experimental.
La idea de frecuencia relativa es que la probabilidad se calcula despus
de una serie de ensayos y experimentos es decir se basa en la
experiencia pasada
Nmero de veces que
Probabilidad de que suceda un evento= el evento ocurri en el pasado
Nmero total de
observaciones

Veamos un Ejemplo :

EN UN LABORATORIO DE PRODUCCION DE MEDICAMENTOS SE TIENE REGISTRADOS
LOS SIGUIENTES DATOS SOBRE EL CONTENIDO DE UN DETERMINADO MEDICAMENTO

Evento Contenido Product
o
Probabilidad de
ocurrencia del evento
A Peso inferior 50 50/1000= 0.05
B Peso correcto 850 850/1000=0.85
C Peso superior 100 100/1000= 0.10
1000 1.00
Como puede observarse necesariamente la suma de todos los resultados es
igual a la unidad

Nos podemos plantear las siguiente probabilidades

Al tomar al azar un medicamento este tenga el peso inferior , peso correcto
o peso superior a lo que establece la norma.
Sea peso inferior

P (A) = 50/1000 = 0.05
Respuesta existe un 5 % de probabilidad de que el medicamento tomado sea
de peso infeiro al que establece la norma
Calcular correcto y el superior

CARACTERISTICAS DE LAS PROBABILIDADES DE FRECUENCIA
RELATIVA

1. La probabilidad obtenida no es el valor real sino una aproximada
estimacin del mismo
2. Cuanto mas ensayos o experimentos hagamos previamente los
resultados estimados sern mas exactos. Esto equivale a decir
que mientras mayor sea el tamao de la muestra mejor ser la
estimacion de la probabilidad.
3. Para la validez de la estimacin de la probabilidad deben darse
idnticas condiciones en las que se recopilaron los datos
Regla del complemento

Como ya sabemos la
0 P 1
De aqu podemos ratificar:
1. Ninguna probabilidad es mayor que 1
2. Ninguna probabilidad es menos a 0, no pueden existir
probabilidades negativas.
Si se designa con P(A) la probabilidad de que un evento
_
ocurra y con P(A) de que no ocurra, se obtiene las siguientes
relaciones conocidas como
Regla del complemento
1. La probabilidad de que un evento ocurra mas la que no
ocurra es igual a 1
_
P(A) + P(A)= 1
2. La probabilidad de que un evento A ocurra es igual a la
unidad menos la probabilidad de que no ocurra.
3. La probabilidad de que el evento no ocurra es igual a la
unidad menos la probabilidad de que ocurra


Ejercicio
Si designa a la ocurrencia de un evento como P y la probabilidad de que
no ocurra como Q y si lanzamos la moneda y designamos con P el
evento de que caiga cara y Q de que sea sello, como se representaran
estos eventos
EJEMPLOS DEL PROGRAMA RESOLVER

a) p de que al tirar un dado dos veces salgan en ambas un 6.

b) p de que al tirar dos dados salga en ambos un 6 seis en el primer dado y
seis en el segundo

c) La p de ser rubio es de 0,3 y la de llevar gafas es de 0,2 . Calcular la p de
que una persona cualquiera sea rubia y lleve gafas (se asume que son
independientes).

d) en una caja hay 3 bolas blancas y 2 negras. Calcular la p de que sacando
dos bolas, las dos sean negras.

e) p de que al sacar una carta de una baraja espaola de 40 cartas sea oros o
copas.

f) p de que al sacar una carta de esa baraja sea as o espadas.
hay 4 ases , 10 espadas y 1 as de espadas (que cuenta como as y como
espada, entre 40, que debe ser compensada)

g) p de acertar 6 en la Primitiva
Hay 49 bolas. Como no hay reemplazo, cada vez que sale una bola, queda una
menos en el bombo.
h) p de que tirando un dado 4 veces, la primera vez que salga un 5 sea
en la 4 tirada.
Respuestas
a. seis en la 1 tirada y 6 en la 2
p(2 veces 6) = 1/6 * 1/6 = 1/36 (mejor que 0,0278).

b. es el mismo caso que a).

c. p(rubio y gafas) = 0,3 * 0,2 = 0,06 ( 6%).

d. Nos piden la p de que sea negra la primera y negra la segunda.
la p de ser negra de la 1 bola es 2/5 ; una vez sacada quedan 4 bolas (una,
negra). la p de ser negra de la 2 bola es de
p( 2 bolas negras) = 2/5 * = 2/20 = 1/10 ( 0,1 10%).

e. p(oros o copas) = 10/40 + 10/40 = 20/40 = ( 0,5 50%).

f. hay 4 ases , 10 espadas y 1 as de espadas (que cuenta como as y como
espada, 1 entre 40, que debe ser compensada)
p(As o Espada) = 4/40 + 10/40 1/40 = 13/40 = 0,325

gHay 49 bolas. Como no hay reemplazo, cada vez que sale una bola, queda
una menos en el bombo. Para acertar los 6 resultados hay que acertar el
primer nmero y el segundo y el tercero...y el sexto.
p(6 aciertos) = 6/49 * 5/48 * 4/47 * 3/46 * 2/45 *1/44 = 1 /13.983.816











h. p de que tirando un dado 4 veces, la primera vez que salga un 5 sea
en la 4 tirada.
p(5 slo en la 4) = p(no 5 en la 1)*p(no 5 en la 2)*p(no 5 en la
3)*p(5 en la4) = 5/6 * 5/6 * 5/6 * 1/6 = 125/1296 = 0,096

EVENTOS Y TIPOS
1. MUTUAMENTE EXCLUYENTES
2. EVENTOS QUE NO SON MUTUAMENTE EXCLUYENTES
3. EVENTOS COLECTIVAMENTE EXHAUTIVOS

EVENTOS MUTUAMENTE EXCLUYENTES
Se dice que dos eventos son mutuamente excluyentes si Uno solo y solo
uno de los eventos de un experimento puede ocurrir a la vez,. En el
nacimiento de un beb se tiene varn o hembra siempre que sea un
parto de solo nio.

EVENTOS QUE NO SON MUTUAMENTE EXCLUYENTES
Se dice que dos eventos no son mutuamente excluyentes cuando es
posible que dos eventos ocurran simultneamente.
Por ejemplo:
Escoger a un mujer que sea enfermera para un puesto de trabajo.

EVENTOS QUE COLECTIVAMENTE EXHAUTIVOS
Cuando una lista de los eventos que puedan resultar de un experimento
incluye todos los resultados posibles, se dice que es colectivament3e
exhaustivos


Tema 9 . Distribuciones fundamentales de probabilidad

Ya hemos visto que los fenmenos naturales siguen el modelo indeterminista, es
decir las leyes del azar, entendido como la combinacin de mltiples factores, en
gran parte desconocidos e incontrolables, que conducen a resultados no
previsibles de antemano, aunque s conocidos, que se caracterizan por su
variabilidad en los diferentes individuos. A cada uno de los posibles resul- tados
se asocia una probabilidad, que en sucesos sencillos o poco complejos es fcil
de calcular por las leyes bsicas o fundamentales de la probabilidad, pero al
aumentar la complejidad el cl- culo se hace muy difcil o imposible. Entonces
hay que recurrir a una serie de modelos tericos, las llamadas distribuciones o
leyes fundamentales de la probabilidad, que nos permiten hacer el clculo con
relativa facilidad. Al aumentar el n de individuos todas las distribuciones se van
aproximando y acaban confluyendo y hacindose una en el infinito.

Clasificacin
a) para variables discretas
--Distribucin. binomial
--Distribucin de Poisson
--Distribucin hipergeomtrica

b) para variables continuas
--Distribucion Normal
--Distribucion de la t de Student
--Distribucion de la 2 de Pearson
--Distribucion de la F de Snedecor-Fisher
Para todas valen los principios que ya conocemos:
0 p 1 p + q = 1

p(x) = 1

DISTRIBUCION BINOMIAL
Concepto
Es el modelo bsico de distribucin de las variables discretas (o discretizadas),
que como ya sabemos pueden ser reducidas en ltima instancia a
dicotmicas.

Experimentos binomiales
Pueden ser elementales y complejos
Los elementales tienen dos resultados posibles:
xito (cuando aparece el resultado que se pre-tende) y
Fracaso , que puede ser nico o mltiple. Sus probabilidades respectivas son p
y q

En los complejos
el experimento elemental se repite n veces
--obteniendo r xitos ( de 0 a n) : 0 r n
--cada modalidad de la variable va asociada a una r .
Como r empieza en 0 siempre hay n+1 modalidades: la de r=0 y las de r
entre uno y n.
-- un experimento binomial complejo puede repetirse N veces. Cada moda-
lidad aparecer Nr veces.
Notacin
La distribucin suele designarse como DB, pero cuando se dan los
parmetros tpicos, la n y la p del suceso elemental, se utiliza slo B .

As: B(n , p)
Experimento xito p n r notacin
elemental: lanzar 1 moneda
complejo: lanzar 4 monedas
salir cara
salir cara
0,5
0,5
1
4
0 , 1
0 , 1 , 2 , 3 , 4
B(1 , 0,5)
B(4 , 0,5)
elemental: lanzar un dado
complejo: lanzar 5 dados
salir 1
salir 1
1/6
1/6
1
5
0 , 1
0 , 1 , 2 , 3 ,
4, 5
B(1 , 1/6)
B(5 , 1/6)
elemental: familia con 1 hijo
complejo: familia con 4 hijos
ser chica
ser chica
0,5
0,5
1
1
0 , 1
0 , 1 , 2 , 3 , 4
B(1 , 0,5)
B(4 , 0,5)


Algunos ejemplos:
El lanzamiento de las 4 monedas se puede repetir N veces. O
podemos estudiar N familias de 5 hijos.

Clculo de las p de r
p (r)= n! p
r
q
n r

r !* (n r )!

Grfico
Diagrama de barras
Otros parmetros _
Media o esperanza matemtica: X = np
la media representa el n esperado de xitos en el experimento
Varianza: s2 = npq
y por tanto, desviacin estndar: s =npq

n , p , N y Nr
Conviene insistir en estos smbolos que son bsicos en la DB.
n : veces que se repite el suceso elemental en un experimento binomial.
Si n=1 es un experi-mento simple;
si >1, es complejo
p : probabilidad del suceso elemental
N : veces que se repite el experimento complejo.
Si no se dice nada, N=1

Nr : frecuencia de cada modalidad tras N repeticiones. Nr = N
----Si tiramos una moneda 1 vez, es una B(1 , 0,5) . Podemos obtener
0 1 cara (r). N=1

Si este experimento lo repetimos 3000 veces (N) seguir siendo una
B(1, 0,5) pero con N=3000. r sigue valiendo 0 y 1. Nos pueden salir
p.e. 1450 caras. Entonces No = 1550 y N1 = 1450

Si tiramos de una vez 3000 monedas pueden salir entre 0 y 3000 caras
(r). Es una B(3000 , 0,5) ; n=3000 ; N=1

Si obtenemos 1450 caras (c), habr habido 1550 cruces (k). Como slo
se hace una vez, se suele asimilar al caso anterior y se dice que
No = 1550 ; N1 = 1450, aunque realmente no es correcto. Mejor sera
Nc y Nk.

Si tiramos tres monedas 1000 veces y obtenemos 0 caras en 115
ocasiones, una cara en 380, dos caras en 370 y tres caras en 130: es
una B(3 ; 0,5) , n=3 , N=1000 , N0=115 , N1=380 , N2=370 y
N3=130

Problemas asociados a la Distribucin Binomial
1) calcular p(r) : nos pueden pedir el clculo de una r en concreto o de todas
ellas. Como ejemplo vemos la p de 2 caras lanzando 3 monedas. Es B(3 , 0,5)

1- Aplicando la frmula
p (r)= n! p
r
q
n r

r !* (n r )!

p(r = 2) = 3!........0,5
2!*1!

0, 520, 51 = 0, 3750

2 - Mtodo Intuitivo (cuenta de la vieja). Vlido para una p elemental de 0,5.
Veremos no slo la p(r=3) sino todas las p(r). Hay que considerar todas las
combinaciones posibles de cara (c) y cruz (k).

Si el lanzamiento de las 3 monedas se repite 200 veces, tericamente
se obtendrn lo siguiente:
0 caras : N0 = 200 * 1/8 = 25
1 cara : N1 = 200 * 3/8 = 75
2 caras : N2 = 200 * 3/8 = 75
3 caras : N3 = 200 * 3/8 = 25

calcular la media, varianza, desviacin estndar
x = np ; S
2
= npq ; s= npq

En el ejemplo de las monedas:

x = 3 * 0,5 = 1,5

S
2
= 3 * 0,5 * 0,5 = 0,75

s = 3 * 0 ,5 * 0 ,5 = 0 ,866




r Nr r*Nr
0 4096 0
1 4096 4096
2 1536 3072
3 256 768
4 16 64

10000 8000
Ejemplo:
Lanzadas 4 monedas 10000 veces se han obtenido los resultados que se muestran en la
tabla:
0 caras en 4096 ocasiones, 1 cara en 4096, 2 caras en 1536, 3 caras en 256 y 4 caras en 16.

x = 8000 = 0 ' 8
10000
0'8=4p p=0'2

por tanto es una B (4 , 0'2)


DISTRIBUCION NORMAL

Es la distribucin tpica de variables aleatorias cuantitativas continuas
cuando el tamao es grande (por consenso, cuando N30) . Sus
parmetros bsicos son la media y la desviacin estndar.

La curva normal o de Gauss es un modelo matemtico que representa la
distribucin ms frecuente de los errores en las mediciones experimentales.
Es una distribucin de frecuencia para variables continuas

Su desarrollo se debe fundamentalmente a Laplace y Gauss. Quetelet le dio
el nombre de NORMAL O NATURAL porque observ que la gran mayora de
variables fisiolgicas seguan este modelo.

Es un nombre consagrado por el uso y no quiere decir que las otras
distribuciones sean anormales.

Los norteamericanos usan y han exportado la denominacin de distribucin
gaussiana.

Siguen la DN todo tipo de variables biolgicas ( como frecuencia cardaca,
tensin arterial, componentes qumicos de la sangre y orina, medidas
corporales...), duracin o vida de objetos y seres vivos, etc.
_
Notacin : N( x , s)

Frmula
La frmula para calcular las p asociadas a intervalos de valores ( no se
pueden calcular p de valores puntuales, ya que en el contexto de la DN
son infinitsimos) es muy compleja y necesita integracin.
Pero afortunadamente no hay que utilizarla, pues se dispone de una
tabla de fcil manejo, que nos da el clculo ya hecho.
Est caracterizada por la media, , y la desviacin tpica, .

A ttulo informativo la frmula es:
Su funcin de densidad es:
a p b


Representacin grfica
es la curva o campana de Gauss, en chapeau de gendarme (gorro de
gendarme) de los tiempos
napolenicos. Es el lmite de un histograma cuando la amplitud de las
clase se hace infinitesimal y el n de datos tiende a infinito.


2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
x
e x f


Es simtrica alrededor de un eje vertical que pasa por x y
asinttica al eje de abscisas (lo corta en el infinito por ambos lados,
aunque a partir de x 3s ya casi lo toca).
La campana engloba todos los valores y por tanto la p de que un valor
cualquiera est en ella es 1 100%.
La superficie de campana delimitada por dos valores del eje de abscisas
equivale a la probabilidad de que un valor cualquiera se encuentre en ese
rea.
Cada distribucin tiene su propia campana, hay infinitas curvas de DN. En
estas condiciones su manejo sera muy difcil y complicado, ya que habra
que aplicar cada vez la frmula. Afortunadamente se ha encontrado un
modelo nico de distribucin y por tanto de campana al que pueden ser
adaptadas todas las DN.

Es la llamada DN tipificada.

Tipificacin _
Consiste en transformar cualquier N( x , s) en otra N(0 , 1), es decir, en una
DN de media 0 y desviacin estndar 1. Para ello hay que transformar los
valores originales x en puntuaciones estndar o valores tipificados, que aqu
llamaremos c. (Otros nombres: z o SDS).

c = x x s
S
Entre dos valores de c quedan delimitadas reas (=probabilidad) que
se pueden obtener a partir de la tabla de la DN tipificada.

Ya se ha dicho al principio que no se pueden calcular p de valores
aislados, slo de intervalos ms o menos grandes.


En esta campana estn representadas las reas o probabilidades entre valores de
c +1 y 1 , +2 y 2 , +3 y 3 . Pero es preferible expresar la p con nmeros
ms redondos :
---Al intervalo entre c = -1,96 y c = 1,96 corresponde un 95% de la superficie de
la campana. p(1,96 c 1,96) = 0,95 95%
---Al intervalo entre c = -2,58 y c = 2,58 corresponde un 99% de la superficie de
la campana. p(2,58 c 2,58) = 0,99 99%
---
Dada una variable de media y desviacin tpica , se denomina
valor tipificado, z, de una observacin x, a la distancia (con signo)
con respecto a la media, medido en desviaciones tpicas.

o

=
x
z
-1 o 1
-
La interpretacin es clara: Asigna a todo valor de N(, ), un valor de
N(0,1) que deja exactamente la misma probabilidad por debajo.

Como ejemplo podemos ver:
Al intervalo entre c = -3,30 y c = 3,30 corresponde un 99,9% de la superficie
de la campana. p(3,30 c 3,30) = 0,999 99,9%

que son los que utilizaremos aqu.









Es imprescindible dibujar una campana y marcar en ella la media y el valor o
valores de x.
Una vez tipificada se anotan el los valores de c.
A la media le corresponde siempre por definicin el valor de 0
Problemas asociados a la DN
1---tipificar
p.e. x=5 y x=3 de una B(4 , 2)
c = (5-4)/2 = 0,5 c = (3-4)/2 = -0,5


2---calcular la probabilidad de un intervalo,
p.e. entre c = 0 y c = 0,46 p(0 c 0,46) = 0,1772

Ejemplo:
La duracin media de un MEDICAL DEVICES ,es de 12 meses, con
una varianza de 4. El fabricante garantiza que pudiera durar 8 meses
ms. Calcular
1) la probabilidad de que se inactive en el periodo de garanta
2) la probabilidad de que dure al menos 16 meses
3) la probabilidad de que dure entre 15 y 18 meses

La variable Vida de la bombilla es una N(12, 2)
1) p(x 8) ?
se dibuja la campana
se tipifica: c = (8-12)/2 = -2
p(c -2) = 0,5 p(-2 c 0) =
0,5 0,4772 = 0,0228 2,28%
8 12
-2 0
2) p(x 16) ?
c = (16-12)/2 = 2
p(c 2) = 0,5 p(0 c 2) =
0,5 0,4772 = 0,0228 2,28%


12 16
0 2
DISTRIBUCIN DE LA T DE STUDENT

Es la distribucin terica de las muestras pequeas de una
poblacin que sigue la ley normal con datos cuantitativos
continuos.

Gosset (que utilizaba el seudnimo de Student) comprob que
cuando disminua el tamao de las muestras, no valan del todo los
normas de la DN, tanto ms cuanto ms pequea sea la muestra.
Hasta N=30 las diferencias son bastante acusadas.

Por eso la mayora de autores ponen a ese nivel la frontera de uso
prctico entre DN y t de Student.

Otros lo ponen en 60 y algunos hasta en 120.

Los programas estadsticos utilizan casi exclusivamente la t de
Student para todas las variables continuas, ya que hasta el infinito
no se produce una identidad plena entre ambas distribuciones.

La DN est en vas de extincin, al menos en la prctica.

Nosotros seguiremos el criterio de utilizar la t de Student para
muestras pequeas (N<30) y la DN para las grandes.

El valor obtenido de los clculos anteriores es comparado con los valores en
una tabla de distribucin de t de student (esta puede encontrarse en
cualquier test de estadstica

Distribucin de frecuencias para variables continuas y muestras
pequeas (n<30)

Tiene un slo parmetro denominado grados de libertad (n-1).

Cuando aumentan los grados de libertad, ms se acerca a N(0,1).

Iguales propiedades que la distribucin normal.
La notacin es t (gl , ). es el nivel de significacin elegido y gl es el
grado de libertad.
Con este nombre se designa al nmero de observaciones independientes, que
en general son N-1.
En esta prueba de t de students se comparan pares de datos continuos ,
distribuidos al azar y se coparan de la forma siguiente:
_ _
t = X1 - X_2____

N1. N2 . (N1 + N2 -2)
D1
2
+ D 2 N1 + N2

2 2 2
De donde el valor de D : N X - (X_)____
N





UN EJEMPLO AYUDAR A ENTENDER ESTE CONCEPTO.

Si nos piden 5 valores que sumen 35, slo podremos elegir libremente 4,
pues el 5 es obligado: supongamos que elegimos 8 , 10 , 23 , -15 .

El 5 nmero tiene que ser por fuerza 9 ; hay 4 grados de libertad.

Aqu no hay modelo tipificado y para cada valor de N hay una campana
distinta (que no es preciso dibujar..).

La TABLA sigue el modelo de las tablas de doble entrada. En la primera
columna est el grado de libertad y en la primera fila hay tres niveles de
significacin.

t(5 , 0,05) = 2,571 ; t(26, 0,001) = 3,707 ; t (15, 0,01) = 2,947.

UTILIDADES
Comparar medias. Prueba de hiptesis entre medias.
Clculo de intervalo de confianza
Determinacin del tamao de muestra



EJEMPLO 2

Suponga que desea comparar dos grupos ( un grupo de ensayo y otro
control ) de pesos corporales de perros que han seguido un estudio de
inhalacin de vapores Se conduce el test como sigue



Perro Peso corporal test Peso corporal control
X1 en kg X1
2
X2 en kg X2
2


1 8,3 68,89 8,4 70,56
2 8,8 77,44 10,2 104,04
3 9,3 86,49 9,6 92,16
4 9,3 86,49 9,4 88,36
Suma 35,7 319,31 37,6 355,12
Medias 8,92 9,4
Aplicando la formula vista anteriormente
_ _
t = X1 - X_2____

N1. N2 . (N1 + N2 -2)
D1
2
+ D 2 N1 + N2

2 2 2
De donde el valor de D= N X - (X_)____
N
Por tanto el valor de t ser :
Diferencia de las medias : N2 N1 = 9.40 8.92
2 2
D 1 = 4 (319.31) (35.7) __= 2,75/4 = 0,6875
4
2 2
D 2= 4 (355,12) (36.6) = 6,72/4 = 1,68
4

De donde: t= 0,48 = 4 (4) . ( 4 +4 -2) = 1,08
0,6875 + 1,68 4 + 4

El valor tabular para t con un nivel de significacin de 0.05 y 6 grados de
libertad es 1.9432 esto implica que 1.08< 1,9432
RESPUESTA: LOS PESOS CORPORALES DE LOS PERROS NO
DIFIEREN SIGNIFICATIVAMENTE A UN NIVEL DE 0.05




Como buscar la El valor tabular para t con un nivel de significacin de 0.05
y 6 grados de libertad
g.ll.

0.55

0.60

0.65

0.70

0.75

0.80

0.85

0.90

0.95

0.975

0.99

0.995
1
2
3
4
5
6
7
8
9

10
11
12
13
14
15
16
17
18
19

20
21
22
23
24
25
26
27
0.15838
0.14213
0.1366
0.13383
0.13218
0.13108
0.13029
0.12971
0.12925

0.12889
0.12859
0.12835
0.12814
0.12796
0.12781
0.12767
0.12755
0.12745
0.12735

0.12727
0.12719
0.12712
0.12706
0.127
0.12694
0.12689
0.12685
0.32492
0.28868
0.27667
0.27072
0.26718
0.26483
0.26317
0.26192
0.26096

0.26018
0.25956
0.25903
0.25859
0.25821
0.25789
0.2576
0.25735
0.25712
0.25692

0.25674
0.25658
0.25643
0.2563
0.25617
0.25606
0.25595
0.25586
0.50953
0.44475
0.4242
0.41416
0.40823
0.40431
0.40154
0.39947
0.39787

0.39659
0.39555
0.39469
0.39396
0.39333
0.39279
0.39232
0.3919
0.39153
0.3912

0.39091
0.39064
0.39039
0.39017
0.38997
0.38978
0.38961
0.38945
0.72654
0.61721
0.58439
0.56865
0.55943
0.55338
0.54911
0.54593
0.54348

0.54153
0.53994
0.53862
0.5375
0.53655
0.53573
0.53501
0.53438
0.53382
0.53331

0.53286
0.53246
0.53208
0.53175
0.53144
0.53115
0.53089
0.53065
1.
0.8165
0.76489
0.7407
0.72669
0.71756
0.71114
0.70639
0.70272

0.69981
0.69745
0.69548
0.69383
0.69242
0.6912
0.69013
0.6892
0.68836
0.68762

0.68695
0.68635
0.68581
0.68531
0.68485
0.68443
0.68404
0.68368
1.3764
1.0607
0.97847
0.94096
0.91954
0.9057
0.89603
0.88889
0.8834

0.87906
0.87553
0.87261
0.87015
0.86805
0.86624
0.86467
0.86328
0.86205
0.86095

0.85996
0.85907
0.85827
0.85753
0.85686
0.85624
0.85567
0.85514
1.9626
1.3862
1.2498
1.1896
1.1558
1.1342
1.1192
1.1081
1.0997

1.0931
1.0877
1.0832
1.0795
1.0763
1.0735
1.0711
1.069
1.0672
1.0655

1.064
1.0627
1.0614
1.0603
1.0593
1.0584
1.0575
1.0567
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.383

1.3722
1.3634
1.3562
1.3502
1.345
1.3406
1.3368
1.3334
1.3304
1.3277

1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.315
1.3137
6.3138
2.92
2.3534
2.1318
2.015
1.9432
1.8946
1.8595
1.8331

1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291

1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
12.706
4.3027
3.1824
2.7764
2.5706
2.4469
2.3646
2.306
2.2622

2.2281
2.201
2.1788
2.1604
2.1448
2.1314
2.1199
2.1098
2.1009
2.093

2.086
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
31.821
6.9646
4.5407
3.7469
3.3649
3.1427
2.998
2.8965
2.8214

2.7638
2.7181
2.681
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395

2.528
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
63.657
9.9248
5.8409
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498

3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609

2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707

Buscar el valor tabular para t (26, 0,01)
20
21
22
23
24
25
26
27
28
29

30
31
32
33
34
35
36
37
38
39

40
41
42
43
44
45
46
47
48
49
50
0.12727
0.12719
0.12712
0.12706
0.127
0.12694
0.12689
0.12685
0.12681
0.12677

0.12673
0.1267
0.12666
0.12663
0.1266
0.12658
0.12655
0.12653
0.1265
0.12648

0.12646
0.12644
0.12642
0.12641
0.12639
0.12637
0.12636
0.12634
0.12633
0.12631
0.1263
0.25674
0.25658
0.25643
0.2563
0.25617
0.25606
0.25595
0.25586
0.25577
0.25568

0.25561
0.25553
0.25546
0.2554
0.25534
0.25528
0.25523
0.25518
0.25513
0.25508

0.25504
0.255
0.25496
0.25492
0.25488
0.25485
0.25482
0.25479
0.25476
0.25473
0.2547
0.39091
0.39064
0.39039
0.39017
0.38997
0.38978
0.38961
0.38945
0.3893
0.38916

0.38903
0.38891
0.3888
0.38869
0.38859
0.3885
0.38841
0.38833
0.38825
0.38817

0.3881
0.38803
0.38797
0.38791
0.38785
0.38779
0.38774
0.38768
0.38763
0.38759
0.38754
0.53286
0.53246
0.53208
0.53175
0.53144
0.53115
0.53089
0.53065
0.53042
0.53021

0.53002
0.52984
0.52967
0.5295
0.52935
0.52921
0.52908
0.52895
0.52883
0.52871

0.52861
0.5285
0.5284
0.52831
0.52822
0.52814
0.52805
0.52798
0.5279
0.52783
0.52776
0.68695
0.68635
0.68581
0.68531
0.68485
0.68443
0.68404
0.68368
0.68335
0.68304

0.68276
0.68249
0.68223
0.682
0.68177
0.68156
0.68137
0.68118
0.681
0.68083

0.68067
0.68052
0.68038
0.68024
0.68011
0.67998
0.67986
0.67975
0.67964
0.67953
0.67943
0.85996
0.85907
0.85827
0.85753
0.85686
0.85624
0.85567
0.85514
0.85465
0.85419

0.85377
0.85337
0.853
0.85265
0.85232
0.85201
0.85172
0.85144
0.85118
0.85094

0.8507
0.85048
0.85026
0.85006
0.84987
0.84968
0.84951
0.84934
0.84917
0.84902
0.84887
1.064
1.0627
1.0614
1.0603
1.0593
1.0584
1.0575
1.0567
1.056
1.0553

1.0547
1.0541
1.0535
1.053
1.0525
1.052
1.0516
1.0512
1.0508
1.0504

1.05
1.0497
1.0494
1.0491
1.0488
1.0485
1.0483
1.048
1.0478
1.0475
1.0473
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.315
1.3137
1.3125
1.3114

1.3104
1.3095
1.3086
1.3077
1.307
1.3062
1.3055
1.3049
1.3042
1.3036

1.3031
1.3025
1.302
1.3016
1.3011
1.3006
1.3002
1.2998
1.2994
1.2991
1.2987
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991

1.6973
1.6955
1.6939
1.6924
1.6909
1.6896
1.6883
1.6871
1.686
1.6849

1.6839
1.6829
1.682
1.6811
1.6802
1.6794
1.6787
1.6779
1.6772
1.6766
1.6759
2.086
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452

2.0423
2.0395
2.0369
2.0345
2.0322
2.0301
2.0281
2.0262
2.0244
2.0227

2.0211
2.0195
2.0181
2.0167
2.0154
2.0141
2.0129
2.0117
2.0106
2.0096
2.0086
2.528
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.462

2.4573
2.4528
2.4487
2.4448
2.4411
2.4377
2.4345
2.4314
2.4286
2.4258

2.4233
2.4208
2.4185
2.4163
2.4141
2.4121
2.4102
2.4083
2.4066
2.4049
2.4033
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
2.7633
2.7564

2.75
2.744
2.7385
2.7333
2.7284
2.7238
2.7195
2.7154
2.7116
2.7079

2.7045
2.7012
2.6981
2.6951
2.6923
2.6896
2.687
2.6846
2.6822
2.68
2.6778
ANALISIS DE VARIANZA (ANOVA)
Cuando estamos frente a la t de student tratamos de comparar dos medias para ver
si las hiptesis que se realizan son ciertas o no sin embargo existen casos en que
tenemos que trabajar con mas de dos grupos en los cuales tendremos por tanto
mas de dos medias ac no es posible aplicar la prueba de student por lo que el
ANOVA surge como una generalizacin del contrate para dos medias de Student
cuando el nmero de dos muestras a contrastar es mayor que dos.
Es utilizado para comparar 3 mas grupos de datos continuos cuando las varianzas
son homogeneas y los datos son independientes y normalmente distribuidos.


Por ello nos planteamos dos hiptesis
Ho: 1 = 2 = 3
H1: 1 2 1 3 2 3
caso en que una de ella fuera igual pero otra
diferente , tambin se rechaza la hiptesis nula


Una serie de clculos son requeridos para realizar el ANOVA, comenzando con los
valores dentro del cada grupo que debe ser adicionado.( X) y entonces estas
sumas deben ser adicionadas ( X) . Cada dato dentro del grupo es elevado al
2
cuadrado y entonces los cuadrados son sumados (X ).
Luego el factor de correccin CF puede ser calculado a partir de la formula
siguiente:
K N 2
( X)
1 1_____________________
CF = N1 + N2 + N3+Nk

Donde N es el numero de valores en el grupo y K es el numero de grupos.
La suma total de los cuadrados (SS) es entonces determinada como
sigue:

K N 2
SS total = X - CF
1 1

A su vez la suma de los cuadrados entre grupos (bg) se encuentra de la
forma siguiente:
2 2 2
SS bg = ( X 1) + ( X 2) + ( X k) - CF
N1 N2 Nk





SS wg = SS total - SS bg

AHORA EXISTEN TRES TIPOS DE GRADOS DE LIBERTAD PARA DETERMINAR
El primero, total df, es el total de nmeros de datos dentro de todos los grupos bajo anlisis
menos 1 o sea:
(N1 + N2 + N3+Nk) - 1

El segundo es , df entre los grupos es el numero de grupos menos uno (K-1)

El ultimo dato sera (dentro de los grupos o error de grados de libertad) es la diferencia
entre el primero y el segundo.

F = df total df bg

El prximo conjunto de clculos sera la determinacin de los cuadrados medios , es decir:
(MS wg y M S bg) ellas se calculan de la siguiente manera.

MS = (SS/df)

El clculo final es la relacin F o sea

F = M S bg
MS wg













Ejemplo para el empleo de las formulaciones para determinacin
del ANOVA

Suponga que quiere compara 4 grupos de peso de los riones de perros ,
expresados como porciento de peso corporal, seguida de una prueba de
inhalacin , Suponiendo la homogeneidad de la varianza (a partir del test
de Barlett) nosotros podemos completar los siguientes clculos.







400 ppm 200ppm 100 ppm 0 ppm
0,1849 0,2401 0,1156 0,1156
0,2704 0,2304 0,1600 0,1024
0,1849 0,1600 0,1764 0,1089
0,3025 0,1156 0,1600 0,1521
2
X = 0,9427


0,7461

0,6120

0,4790
2
X= 0,9427 + 0,7461 + 0,6120 + 0,4720 = 2,7798
2
CF = (6,58 ) ___= 2,7060
4+4+4+4

SS total = 2,7798 2,7060 = 0,0738


SS bg = (1,93 ) + (1,71) + (1,56 ) + (1,38) - 2,7060 = 0,04075
4 4 4 4

SS wg = 0,07380 -0,04075 = 0,03305

df total = 4 + 4+4 +4 - 1 = 15

df bg= 4 -1 = 3
df wg = 15 - 3 = 12

MS bg= 0,04075 = 0,01358
2 de donde F = 0,01358 = 4,94
MS wg = 0,03305 = 0,00275 0,00275
12



Buscando en la tabla de F encontramos que para 3 d fbg (mayor cuadrado
medio) y 12 d fwg (menor cuadrado medio), para el valor de 0.05 se halla que

F = 3,49

F calculado > F encontrado en la tabla.
04,94 > 3,49







Como el valor que nosotros calculamos es mayor que el encontrado.

Entonces existen diferencias significativas entre grupos.

Por lo que tenemos que determinar cuales son las diferencias, o cuales son los
grupos que difieren, para ellos aplicamos un ensayo de post hoc o una prueba
para diferenciar las medias.

DATOS A
BUSCAR

Df SS MS F
Bg 3 0,04075 0,01358 4,94
Wg 12 0,03305 0,00275
Total 15 0,07380
Los grados de libertad del numerador se encuentran en la primera fila,
en tanto que los grados de libertad del denominador se encuentran en la
primera columna, cada tabla corresponde a un valor diferente de alfa o
"p0.05

Distribucin de F para 0,95 %
1 2 3
1 161.45 199.5 215.71
2 18.513 19 19.164
3 10.128 9.5521 9.2766
4 7.7086 6.9443 6.5914
5 6.6079 5.7861 5.4094
6 5.9874 5.1432 4.7571
7 5.5915 4.7374 4.3468
8 5.3176 4.459 4.0662
9 5.1174 4.2565 3.8625
10 4.9646 4.1028 3.7083
11 4.8443 3.9823 3.5874
12 4.7472 3.8853 3.4903
Al realizar la determinacin de un metabolito en tres
fermentaciones se obtuvieron los siguientes resultados.
Determine mediante ANOVA si existen diferencias entre
las fermentaciones. Calcule las medias y varianza.
A 125 124 123 125 124 121 126 123 124 122
B 120 129 131 129 126 127 130 131 129 130
C 135 136 136 137 136 135 137 136 136 135
PRUEBAS PARA DETERMINAR LAS DIFERENCIAS ENTRE LAS
MEDIAS, O SEA PRUEBAS POST HOC.

Existe una variedad de pruebas post hoc disponibles para analizar los datos
despus del ANOVA.
Cada uno de ellos tienen sus ventajas y sus desventajas, cuatro de ellos son
muy utilizados en bioestadstica.
1. Prueba de los rangos mltiples de Duncan
2. La prueba de Scheffe
3. El test de Dunnett

LA PRUEBA DE LOS RANGOS MLTIPLES DE DUNCAN.
Es utilizada para comprar a grupos que se distribuyen continuos y al azar
(tales como el peso corporal y peso de los rganos), este test normalmente
involucra 3 mas grupos. La comparacin se hace entre pares de grupos
tomados a la misma vez.
Hay que buscar la prueba de F y cuando se obtienen valores mayores que el
tabular entonces podemos emplear este ensayo




GRUPOS CON IGUAL NUMERO DE DATOS

Los dos conjuntos de clculos deben ser llevado aqu:

1. 1ero La determinacin de las diferencias entre las medias de pares de
grupos.
2. La preparacin de la tabla de probabilidad contra la cual cada diferencia
es medias son comparadas .
Las medias son determinadas y ranqueadas en orden decreciente o
creciente.
Los grupos son tomados en pares y las diferencias entre las medias
_ _
(X 1 X2) , expresadas como un nmero positivo, son calculadas.
Usualmente cada par consisten en el grupo control y el grupo tratado,
entonces multiple grupos de ensayos pueden ser inter comparados si se
desea.
Para establecer la tabla de probabilidad , la SEM puede ser calculada coo se
muestra a continuacin.

SEM= ERROR DE LA MEDIA CUADRADA
N

= MEDIA CUADRADA DENTRO DEL GRUPO
N


Donde N es el numero de animales o replicas por cada nivel de dosis.
La media cuadrada dentro del grupo ( MSwg) puede ser calculada a partir de la
informacin dada por el procedimiento de ANOVA
La SEM es entonces multiplicada por una serie de valores tabulare, para establecer la
tabla de probabilidad.
La tabla de valores usado para el calculo son seleccionados de acuerdo a los niveles
de( probabilidad ( puede ser 0,05; 0,01 y 0,001)
Y el nmero de medias aparte para el grupo son comparadas y el numero error df .
El error df es el numero de df dentro del grupo Este ultimo dato es determinado de
los clculos del ANOVA

Ejemplo:
Empleando el peso del rin como % de peso corporal (4 grupos de perros con 4
perros en cada grupo)



rangos
Concentracin media del
peso de los riones
1 2 3 4
Grupos comparados _ _
X 1 - X2
Numero de medias
2 vs 1 ( 100 vs 0 ppm) 0,045 2
3 vs 1 (200 vs 0 ppm) 0,08/3 3
4 vs 1 ( (400 vs 0 ppm) 0,138 4
4 vs 2 (400 vs 100 ppm) 0,093 3
El cuadrado medio dentro del grupo del ejemplo del ANOVA fue 0,00275 o sea

MS wg = 0,03305 = 0,00275
12
Por tanto el SEM = = 0,00275 = 0,02622.
4
El error df (df wg) fue 12 de manera que la siguiente tabla de valores
son empleados.


No de media apartadas Nivel de probabilidad
0,05 0,01 0,001
2 3,082 4,320 6,106
3 3,225 4,504 6,34
4 3,313 4,622 6,494
Cuando estos son multiplicados por la SEM se obtienen los siguientes valores
de probabilidad en la tabla

No de media apartadas Nivel de probabilidad
0,05 0,01 0,001
2 0,0808 0,1133 0,1601
3 0,0846 0,01181 0,1661
4 0,869 0,1212 0,1703
Grupos con nmeros desiguales de datos ( N1 N2)

Este procedimiento es muy similar al que se discuti anteriormente.
Como antes las medias son ranqueadas y se determinan las diferencias
_ _
entre las medias ( X 1- X2 )
Posteriormente se determinan los valores pesantes a ij son calculados a
partir de los pares de grupos a ser comparados de acuerdo con las
siguientes formulaciones:
_____________
a ij = 2 Ni Nj = 2 N1 N2
Ni + Nj N1 + N2
_ _
Los valores obtenidos para cada par de grupos se multiplica por (X 1 X2)
Para cada valor para obtener un valor de t , este es el valor que ser
comparado posteriormente con la tabla de probabilidad.
La tabla de probabilidad es establecida como anteriormente excepto que en
lugar de multiplicar los valores de la tabla por SEM, SEM
2
Se utiliza
MSwg

Vous aimerez peut-être aussi