Vous êtes sur la page 1sur 26

Estadstica Descriptiva e Inferencial

Atahualpa SOSA LOPEZ


Centro de Ecologa Pesqueras y
Oceanografa del Golfo de Mxico
EPOMEX
Facultad de Ciencia Qumico Biolgicas
Universidad Autnoma de Campeche
atahsosa@uacam.mx
Conceptos Bsicos
Clasificacin de la estadstica:
1. De acuerdo al nivel de anlisis
a) Descriptiva
b) Inferencial
2. De acuerdo al nmero de variables
a) Univariada
b) Multivariada
3. De acuerdo al tipo de variables
a) Paramtrica
b) No-paramtrica
4. De acuerdo al tipo de anlisis
a) De dependencia (Causa-efecto)
b) De interdependencia (Ordenacin)
Conceptos Bsicos
Conceptos Bsicos
Anlisis exploratorio de datos
Anlisis exploratorio de datos
Anlisis exploratorio de datos
Anlisis exploratorio de datos
Anlisis exploratorio de datos
Anlisis exploratorio de datos
Agrupamiento de datos
Cuando los datos estadsticos de los cuales se dispone
son numerosos, el trabajar con ellos directamente
es complicado y poco se puede hacer con ellos si
nos se les organiza y clasifica, es decir se les arregla
de acuerdo a algn mtodo. Este mtodo estadstico es
conocido como distribucin de frecuencias.
Para comprender la tcnica de distribucin de frecuencias
y dominar sus aplicaciones, es preciso saber que es un
intervalo de clase. Los intervalos de clase estn limitados
por valores extremos que se denominan
lmite inferior y lmite superior, por ejemplo:
Intervalo de clase 22 - 25 (Clase de valores de 22 a 25)
Intervalo de clase 26 - 29 (Clase de valores de 26 a 29)
Agrupamiento de datos
El nmero de intervalos de clase depende de la distribucin que quiera hacerse, si son muy pocos,
se pierden detalles y si son muchos, se manifiestan irregularidades que no permiten apreciar
un patrn de comportamiento.
En todo caso la mayora de analistas recomienda no menos no menos de 5 ni ms de 15 intervalos de clase,
sin embargo una forma ms precisa para estimar el nmero de intervalos de clase (K) sera a travs de la siguiente expresin:
K = 1 +3.32(Log
10
n) (1)
Las pasos generales para formar distribuciones de frecuencia son las siguientes:
1. Se obtiene la diferencia entre los valores extremos (Amplitud, A). Dato mayor dato menor.
2. Se calcula el nmero de intervalos de clase (Ecuacin 1).
3. Se estima el tamao de cada intervalo (M) mediante:
(2)
Si el resultado de la divisin no es un nmero entero, se recomienda redondear al entero superior.
As si la divisin dio 3.5 el nmero de intervalos se toma como 4.
Nueva amplitud (NA) = (M)(K)
Si la amplitud fue de 21 y el nmero de clases que se calcul de 6:
M= 21 6 = 3.5
M = 4; por lo cual
La nueva amplitud ser 6(4) = 24
El exceso de 3 que se tiene con relacin al rango original, se distribuye entre el lmite superior y el limite inferior;
al agregar 2 al limite superior y restar 1 al inferior o viceversa. De ambas formas la diferencia entre los valores
extremos es de 24.
4. Se forman los intervalos de clase agregando (M) al lmite inferior de cada clase,
principiando por el nmero inferior de la diferencia entre los valores extremos.
5. Se fijan los lmites de cada clase.
6. Se determinan las frecuencias de cada clase.
K
A
M =
Agrupamiento de datos
65 53 64 60 68 63 57 63 61 62
63 58 72 62 66 65 59 69 55 60
68 64 56 63 61 67 63 61 66 65
59 70 62 66 69 64 55 64 61 67
64 58 67 65 57 71 62 66 64 60
Ejemplo 1: Un investigador desea determinar como varan las tallas
De cierta especie de parasito tomando una muestra de 50 organismos
y anota sus tallas en mm, encontrando:
Agrupamiento de datos
Intervalos
de clase
(mm)
Marcas
de clase
(x)
Frecuenci
a
F(x)
Frecuencia
relativa
FR(x)
Frecuencia
acumulada
FC(x)
Frecuencia
acumulada
relativa FRC(x)
50.5 53.5 52 1 0.02 1 0.02
53.5 56.5 55 2 0.04 3 0.06
56.5 59.5 58 6 0.12 9 0.18
59.5 62.5 61 11 0.22 20 0.40
62.5 65.5 64 16 0.32 36 0.72
65.5 68.5 67 9 0.18 45 0.90
68.5 71.5 70 4 0.08 49 0.98
71.5 74.5 73 1 0.02 50 1.00
Elabora un cuadro de distribucin de frecuencias de la siguiente manera:
1. Obtencin de las diferencias entre los valores extremos = 72 53 = 19
2. Se obtiene k = 7 clases. Para de terminar la anchura del intervalo tenemos:
M = 19 7 = 2.71
M = 3
La nueva diferencia = 3 (8) = 24; el exceso de cinco se distribuye de la siguiente manera:
53 3 = 50 y 72 + 2 = 74
3. Formamos los intervalos agregando (M) al lmite inferior o sea 50 + 3 = 53 que ser el
lmite superior de la primera clase.
4. Encontramos los lmites reales agregando 0.5 a los lmites de cada clase, es decir:
50.5 a 53.5
5. Se cuentan las frecuencias que caen en cada intervalo.
Tabla de recuento y frecuencia de las tallas para las 50 organismos
Agrupamiento de datos

0
4
8
12
16
20
52 55 58 61 64 67 70 73
Marcas de clase
F
R
(
x
)
0
0.1
0.2
0.3
0.4
R
F
(
x
)
Pruebas de Hiptesis
Dentro de las pruebas de hiptesis podemos distinguir dos grupos
principales, aquellas que trabajan con datos dados en escala cardinal,
donde las muestras siguen una distribucin normal, y las varianzas
son homogneas; denominadas pruebas estadsticas paramtricas,
ya que utilizan los parmetros para hacer las inferencias estadsticas.
Por otro lado tenemos las pruebas estadsticas no paramtricas
que comnmente se basan suma de rangos para establecer diferencias
entre dos o mas muestras.
As mismo las pruebas de hiptesis no paramtricas son utilizadas
mas como pruebas alternativas debido a su bajo poder estadstico.
En general para plantear una prueba de hiptesis, esta deber ser
con base en algn parmetro de la poblacin (varianza, media,
proporcin, etc) y de acuerdo a la muestra o nmero de muestras
que se pretendan comparar.
Pruebas de Hiptesis
Condiciones para aplicar una Prueba de
Hiptesis Paramtrica:
1. Datos en escala cardinal
2. Aleatoriedad
3. Normalidad
4. Homocedasticidad
Estad. descriptiva vs Estad. inferencial
Histograma Distribucin de datos
F
r
e
c
u
e
n
c
i
a
Intervalos de clase
(Datos originales)

( )
2
2
2
2
1
o

t o

=
x
e Y
100 %
Distribucin normal
Ecuacin de la
distribucin normal
Valores normalizados (Z)
-3 -1 0 1 3
Normalizacin o
Estandarizacin

s
X x
Z
i

=
Pruebas de Hiptesis
Decisin
Estado real de la poblacin
H
0
es verdadera H
0
es falsa
Rechazar H
0
Error tipo o No hay error
No rechazar H
0
No hay error Error tipo |
Valor crtico (a) Valor crtico (b)
Regin de no-rechazo
de H
0
Regin de no-rechazo
de H
0
Regin de rechazo de
H
0
Regin de rechazo de
H
0
H
0
es
verdadera
H
0
es
falsa
H
0
es
falsa
H
0
es
verdadera
o o | |
Las hiptesis nula y alternativa en un anlisis de
varianza es la siguiente:
La hiptesis nula (H
0
) indica que todos los grupos de
medias son iguales, lo cual significa que provienen de la
misma poblacion.
k
, es igual a la media del grupo k.
Para saber como elegimos la hiptesis correcta nos
apoyamos de la distribucin F de Fisher; contrastando
un valor calculado de F (F
calc
) contra un valor de F
crtico (F
crit
)
Planteamiento de hiptesis en un ANOVA una va
H
A
: Al menos uno de los grupos de vectores de madias es distinto
H
0
:
1
=
2
=
3
=
k
El anlisis de varianza ANOVA
Por ejemplo: Un caso en el rea de salud pudiera ser la
comparacin del peso de recin nacidos a travs de
diferentes localidades
Los investigadores en ciencias exactas frecuentemente colectan mediciones de una
variable a partir de tres o mas muestras y de tres o mas poblaciones, una situacin que
conlleva al anlisis mltiple de muestras
Campeche Champotn Escrcega
2.5 kg 1.7 kg 3.8 kg
1.9 kg 2.1 kg 2.4 kg
2.3 kg 2.2 kg 3.1 kg
En este caso la pregunta sera, si el peso promedio entre
localidades muestra diferencias significativas.
ANOVA de un factor o una va
vs
ANOVA de mas factores o vas
El mismo caso del rea de salud pero con mas de un factor
pudiera ser la comparacin del peso de recin nacidos a
travs de diferentes localidades (Factor 1) y sexos (Factor 2)
Los ANOVAs pueden ser de un factor a una va dependiendo del nmero de variables
independientes (factores) que estn envueltas en el problema.
En este caso la pregunta sera, si el peso promedio entre
localidades muestra diferencias significativas no solo entre
localidades sino tambin entre sexos.
El ejemplo anterior sera un caso de un ANOVA de una va o un factor, ya que solo
tenemos una variables independiente (factor) que es la LOCALIDAD.
Campeche Champotn Escrcega
Nio
Nia
Diagrama de flujo de un ANOVA de una va

Hiptesis
Datos
Clculos
preliminares
Sumario
del ANOVA
CONCLUSION
Ejemplo de un ANOVA de una va
Anlisis de regresin mltiple
El anlisis de regresin mltiple es una de las tcnicas
estadsticas mas ampliamente usadas. Contiene
variables independientes adicionales tiles para dar
predicciones mas precisas de la variable de respuesta.
El modelo lineal de regresin mltiple se expresa de la
siguiente forma:
La representacin en un plano y con dos variables
dependientes (ver ejemplo):
c | | | | + + + + =
j i i
X X X Y ...
2 2 1 1 . 0
2 2 1 1 0
X X Y
i
| | | + + =
Anlisis de regresin mltiple
Representacin grfica del caso
con dos variables independientes
Y
X1
X2
|
0
Superficie de respuesta, Plano
X1 X2

Vous aimerez peut-être aussi