Académique Documents
Professionnel Documents
Culture Documents
PARA LA INVESTIGACIN
ESTADSTICA
DESCRIPTIVA
Sesiones 1_2: Arreglo de Datos y
Distribucin de Frecuencias
Mtodos Estadsticos en la Investigacin
Dr. Carlos A. Risco Dvila
1-2
Definicin de Estadstica
Estadstica es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propsito de ayudar a una
toma de decisiones ms efectiva.
Estadstica Descriptiva
Estadstica Descriptiva
Recolectar Datos
Ej. Encuestas
Presentar Datos
Ej. Tablas y Grficos
Resumir Datos
Ej. Media muestral =
X
n
Estadstica Descriptiva
A mediados de diciembre el proveedor de
servicios de Internet American On Line (AOL)
realiz una encuesta entre sus usuarios. La
siguiente pregunta se refera a los rboles de
navidad:
Cul prefiere?
Un rbol natural
Un rbol artificial
De entre 7073 respuestas recibidas de los
usuarios de Internet, 4650 respuestas prefirieron
un rbol natural y 2423 un rbol artificial
Estadstica Descriptiva
La revista Good Housekeeping
invit a mujeres para que visitaran
su pgina de Internet para
contestar una encuesta, y se
registraron
1500
respuestas.
Cuando se les pregunt si
preferan tener ms dinero o
dormir mas, el 88% eligi mas
dinero y solo el 11%, dormir ms.
Estadstica Descriptiva
Trate de identificar cada una de las fallas
principales en lo siguiente: Un diario
realizo una encuesta pidiendo a los lectores
que llamaran y respondieran esta pregunta:
Apoya usted el desarrollo de armas
atmicas que podran matar a millones de
personas inocentes? Se reporto que 20
lectores respondieron y 87% contesto no,
mientras que el 13% dijo si
Estadstica Descriptiva
U editorial del Comercio critic
un grfico que describa un
enjuague bucal que reduce la
placa bacteriana en mas de
300%. Qu es incorrecto en esta
declaracin?
La inversin extranjera cayo en
500% durante la dcada del 1990.
Que esta equivocado en esta
declaracin?
Estadstica Inferencial
Estimacin
Ej. Estimar el peso promedio de
la poblacin usando el peso
promedio de la muestra.
Prueba de Hiptesis
Ej. Probar que el peso promedio
de la poblacin es 65 kg.
Poblacin y Muestra
Poblacin
TODOS los posibles
Individuos, objetos,
mediciones y conteos
Un PARMETRO describe
a una Poblacin.
Muestra
PARTE representativa
de la Poblacin.
Un ESTADSTICO describe
a una Muestra.
1-7
Tipos de Variables
Variable cualitativa o de atributos: la
caracterstica o variable que se estudia
no es numrica.
EJEMPLOS: Genero, afiliacin
religiosa, tipo de automvil que se
posee, lugar de nacimiento, color de
los ojos.
1-8
Tipos de Variables
Variable cuantitativa: la variable se
puede registrar numricamente.
EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, nmero de nios en una
familia.
1-9
Variables Discretas
Las variables cuantitativas se pueden clasificar
como discretas o continuas.
Variables discretas: slo pueden adquirir
ciertos valores y casi siempre hay brechas
entre esos valores.
EJEMPLO: el nmero de habitaciones en una
casa (1,2,3,..., etc.). El nmero de hijos que
tiene un matrimonio (0, 1, 2, 3., etc).
Las variables discretas se cuentan.
1-10
Variables Continuas
Variables continuas: Son variables cuantitativas
que pueden tomar cualquier valor dentro de un
intervalo especfico.
EJEMPLO: El tiempo que toma viajar de
Lima a Ica. El peso de un artculo.
Las variable continuas se miden
1-11
Resumen de
Tipos de Variables
DATOS
Cualitativos o de atributos
Cuantitativos o numricos
Discretos
(Conteo)
Continuos
(Medicin)
Ordenamiento de Datos
Datos Numricos
Arreglo
de Datos
Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas
Ojiva
Polgono
Arreglo de Datos
Ordenamiento de Datos
Datos Numricos
Arreglo
de Datos
Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas
Ojiva
Polgono
Distribucin de Frecuencias
Clase
Grupo de valores que describe una
caracterstica de los datos.
Tipos de Clases
Cualitativas
Cuantitativas
Discretas
Continuas
Intervalos de Clase
Lmite
Inferior
Lmite
Superior
Ancho del
Intervalo
10
10
19
10
20
29
10
30
39
10
40
49
10
50
59
10
Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:
49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0
Distribucin
de
Frecuencias
Clase
Conteo
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
//
////
//// //// /
//// /
///
///
Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:
49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0
Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:
49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0
Distribucin
de
Frecuencias
Clase
Conteo
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
//
////
//// //// /
//// /
///
///
Frecuencia
2
5
11
6
3
3
Tabla de
Distribucin de Frecuencias
Marca de Clase
(48.8 + 49.2)/2 = 49.0
Distribucin
de
Frecuencias
Lmite Inferior
Clase
Frecuencia
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
2
5
11
6
3
3
Lmite Superior
Distribucin de
Frecuencias Relativas
Distribucin
de
Frecuencias
Relativas
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
Frec. Relativa
2
5
11
6
3
3
0.07
0.16
0.37
0.20
0.10
0.10
30
1.00
Distribucin de Frecuencias
Relativas Acumuladas
Distribucin
de
Frecuencias
Relativas
Acumuladas
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
Frec. Relativa
2
5
11
6
3
3
0.07
0.16
0.37
0.20
0.10
0.10
30
1.00
Frec. Relativa
Acumulada
0.07
0.23
0.60
0.80
0.90
1.00
Ordenamiento de Datos
Datos Numricos
Arreglo
de Datos
Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas
Ojiva
Polgono
Histograma
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
12
10
8
6
4
2
0
48.8
49.2
49.3
49.7
49.8
50.2
50.3
50.7
50.8
51.2
51.3
51.7
Frecuencia
2
5
11
6
3
3
Ordenamiento de Datos
Datos Numricos
Arreglo
de Datos
Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas
Ojiva
Polgono
Polgono de Frecuencias
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
12
10
8
6
4
2
0
48.8
49.2
49.3
49.7
49.8
50.2
50.3
50.7
50.8
51.2
51.3
51.7
Frecuencia
2
5
11
6
3
3
Polgono de Frecuencias
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
Frecuencia
12
10
8
6
4
2
0
48.5 49.0
49.5
50.0
50.5
51.0
51.5 52.0
Marca
Frecuencia
49.0
49.5
50.0
50.5
51.0
51.5
2
5
11
6
3
3
Polgono de Frecuencias
12
Frecuencia
10
8
6
4
2
0
48.5 49.0
49.5
50.0
50.5
51.0
51.5 52.0
Marca
Frecuencia
48.5
49.0
49.5
50.0
50.5
51.0
51.5
52.0
0
2
5
11
6
3
3
0
Ordenamiento de Datos
Datos Numricos
Arreglo
de Datos
Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas
Ojiva
Polgono
Ojiva
30
27
Frecuencia
Acumulada Relativa
24
Clase
18
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7
7
2
48.8
49.3
49.8
50.3
50.8
51.3
51.8
Frec.
Abs.
Menor
que
Frec.
Acum.
2
5
11
6
3
3
48.8
49.3
49.8
50.3
50.8
51.3
51.8
0
2
7
18
24
27
30
4.9
2.1
6.2
3.6
5.7
2.8
3.5
2.5
5.1
3.7
3.6
4.0
2.9
4.8
4.6
2.5
3.7
2.8
1.6
4.0
4.5
2.7
5.1
3.6
5.6
3.5
4.0
1.8
6.1
4.9
3.7
4.4
5.6
4.7
4.2
4.1
3.7
2.2
3.9
3.1
4.9
4.2
3.4
3.9
3.9
1
2
3
4
5
6
68
9518595872
1865767657791499
390860509472192
71166
21
1
2
3
4
5
6
68
1255578899
1145566677778999
000122345678999
11667
12
ESTADSTICA
DESCRIPTIVA
Caractersticas de los Datos
Caractersticas
de los Datos
Tendencia Central
(Posicin)
Dispersin
(Variacin)
Sesgo
Tendencia
Central
Media
Aritmtica
Media
Ponderada
Media
Geomtrica
Mediana
Moda
3-2
Media de la Poblacin
Para datos no agrupados, la media aritmtica de
la poblacin es la suma de todos los valores en
ella dividida entre el total de valores en la
poblacin:
x / N
3-4
x x / n
x
3-6
Propiedades de la
Media Aritmtica
Todo conjunto de datos tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de valores slo tiene una media.
Desventaja
Es afectada por los valores extremos.
Media Aritmtica
Es la medida ms comn de tendencia central.
Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10
Media = 5
0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 6
3-8
Media Ponderada
La media ponderada de un conjunto de nmeros x1,
x2, ..., xn, con las ponderaciones correspondientes
w1, w2, ...,wn, se calcula con la frmula:
xw ( w1 x1 w2 x2 ... wn xn ) /( w1 w2 ...wn )
xw ( w * x ) / w
3-14
Media Geomtrica
La media geomtrica (MG) de un conjunto de n
nmeros positivos se define como la raz nsima del producto de los n valores. Su frmula
es:
3-10
Mediana
Mediana: es el punto medio de los valores
despus de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
Nota: para un conjunto con un nmero par
de nmeros, la mediana ser el promedio
aritmtico de los dos nmeros medios.
Mediana
No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5
n 1
Mediana
2
Mediana = 5
3-12
Propiedades de la mediana
La mediana es nica para cada conjunto de
datos.
No se ve afectada por valores muy grandes o
muy pequeos.
Moda
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
Datos NO Agrupados
Registro cantidad de artculos vendidos
durante 22 das
Datos Agrupados
Distribucin de Frecuencias de artculos vendidos
durante 22 das
3-18
( f * x )
( f * x )
x
f
n
f = frecuencia de cada clase
x = punto medio o marca de la clase
n = nmero de observaciones
Ejemplo
Media de Datos Agrupados
224
Media
10.18
22
3-21
( n 1) / 2 ( F 1)
* w Lm
m
fm
Ejemplo
Mediana de Datos Agrupados
22 1
Ubicacin de la mediana
11.5
2
( 22 1) / 2 (9 1)
m
* 3 10 10.64
7
3-25
Mo LMo
*w
d1 d 2
LMo= Lmite inferior de la clase modal
d1= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por debajo de ella (en valor).
d2= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por encima de ella (en valor).
w= Ancho del intervalo de la clase modal.
Ejemplo
Moda de Datos Agrupados
(7 5)
* 3 11.2
Mo 10
(7 5) (7 4)
Medidas de
Dispersin
Dispersin
Varianza
Alcance
Varianza de
la Poblacin
Varianza de la
Muestra
Alcance Intercuartil
Desviacin Estndar
Desviacin
Estndar de
la Poblacin
Desviacin
Estndar de
la Muestra
Coeficiente de
Variacin
Alcance o Rango
Alcance
Diferencia entre la mayor y la menor de las
observaciones
Alcance = xmayor xmenor
Alcance: 12 - 7 = 5
7
10
11
12
10
11
12
Cuartiles
Los datos se ordenan de menor a mayor.
25%
25%
Q1
Observacin
Menor
25%
Q2
25%
Q3
Observacin
Mayor
Desviacin de la
Media
Promedio de
desviacin de cada dato
2
-2
1
-1
( x ) 0
Varianza de la Poblacin
Desviacin cuadrtica promedio con relacin a
la media de la Poblacin
( x )
x
2
N
2
Desviacin Estndar
de la Poblacin
Raz Cuadrada de la Varianza de la Poblacin
( x )
N
x
2
N
2
Varianza de la Muestra
Desviacin cuadrtica promedio (n-1) con
relacin a la media de la Muestra
( x x )
s
n 1
2
x
nx
s
n 1 n 1
2
Desviacin Estndar
de la Muestra
Raz Cuadrada de la Varianza de la Muestra
s
s
s
s
( x x )
n 1
x
nx
n 1 n 1
2
Varianza de la Poblacin
Datos Agrupados
f ( x )
N
2
fx
2
N
2
x marca de clase
Desviacin Estndar
de la Poblacin
Datos Agrupados
f ( x ) 2
N
fx
2
x marca de clase
Varianza de la Muestra
Datos agrupados
f ( x x )
s
n 1
2
fx
nx
s
n 1 n 1
2
x marca de clase
Desviacin Estndar
de la Muestra
Datos Agrupados
s
s
s
s
f ( x x )
n 1
fx
nx
n 1 n 1
2
x marca de clase
Comparacin de Desviaciones
Estndar
Datos A
11 12
13
14
15
16
17
18
19
20 21
Datos B
11 12
13
14
15
16
17
18
19
Media = 15.5
s = 3.338
20 21
Media = 15.5
s = .9258
20 21
Media = 15.5
s = 4.57
Datos C
11 12
13
14
15
16
17
18
19
4-14
Interpretacin y usos de la
Desviacin Estndar
Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporcin mnima de valores que est
dentro de k desviaciones estndar
desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que 1.
4-15
Interpretacin y usos de la
Desviacin Estndar
Regla emprica: para una distribucin de
frecuencias simtrica de campana:
Cerca de 68% de las observaciones estar dentro
de 1 de la media ();
Cerca de 95% de las observaciones estar dentro
de 2 de la media ();
Casi todas (alrededor de 99.7%) las observaciones
estarn dentro de 3 de la media ().
-3
-2
-1
+1
+2
+3
34.13%
34.13%
13.60%
13.60%
2.135%
2.135%
0.135%
0.135%
-3
-2
-1
+1
68.26%
95.46%
99.73%
+2
+3
Resultado Estndar
-3
-2
-1
Re
+1
+2
+3
100
20
x 80
Re?
-3
-2
80 100
Re
1
20
100
20
x 160
Re?
-1
80
100
+1
+2
+3
160
160 100
Re
3
20
4-17
Dispersin Relativa
El coeficiente de variacin es la razn de la
desviacin estndar a la media aritmtica,
expresada como porcentaje:
s
CV (100%)
x
Distribucin B
x 10
s2
x 100
s5
Distribucin B
5
CV
100 5%
100
Negativamente
Sesgada
Simtrica
Positivamente
Sesgada