Académique Documents
Professionnel Documents
Culture Documents
PARA LA INVESTIGACIÓN
Definición de Estadística
n
Estadística Descriptiva
A mediados de diciembre el proveedor de
servicios de Internet American On Line (AOL)
realizó una encuesta entre sus usuarios. La
siguiente pregunta se refería a los árboles de
navidad:
Cuál prefiere?
Un árbol natural
Un árbol artificial
De entre 7073 respuestas recibidas de los
usuarios de Internet, 4650 respuestas prefirieron
un árbol natural y 2423 un árbol artificial
Estadística Descriptiva
La revista Good Housekeeping
invitó a mujeres para que visitaran
su página de Internet para
contestar una encuesta, y se
registraron 1500 respuestas.
Cuando se les preguntó si
preferían tener más dinero o
dormir mas, el 88% eligió mas
dinero y solo el 11%, dormir más.
Estadística Descriptiva
Trate de identificar cada una de las fallas
principales en lo siguiente: Un diario
realizo una encuesta pidiendo a los lectores
que llamaran y respondieran esta pregunta:
Apoya usted el desarrollo de armas
atómicas que podrían matar a millones de
personas inocentes? Se reporto que 20
lectores respondieron y 87% contesto “no”,
mientras que el 13% dijo “si”
Estadística Descriptiva
U editorial del Comercio criticó
un gráfico que describía un
enjuague bucal que “reduce la
placa bacteriana en mas de
300%”. Qué es incorrecto en esta
declaración?
La inversión extranjera cayo en
500% durante la década del 1990.
Que esta equivocado en esta
declaración?
Estadística Inferencial
Estimación
Ej. Estimar el peso promedio de
la población usando el peso
promedio de la muestra.
Prueba de Hipótesis
Ej. Probar que el peso promedio
de la población es 65 kg.
Población Muestra
• TODOS los posibles • PARTE “representativa”
•Individuos, objetos, de la Población.
mediciones y conteos • Un ESTADÍSTICO describe
• Un PARÁMETRO describe a una Muestra.
a una Población.
1-7
Tipos de Variables
Variable cualitativa o de atributos: la
característica o variable que se estudia
no es numérica.
EJEMPLOS: Genero, afiliación
religiosa, tipo de automóvil que se
posee, lugar de nacimiento, color de
los ojos.
1-8
Tipos de Variables
Variable cuantitativa: la variable se
puede registrar numéricamente.
EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, número de niños en una
familia.
1-9
Variables Discretas
Las variables cuantitativas se pueden clasificar
como discretas o continuas.
Variables discretas: sólo pueden adquirir
ciertos valores y casi siempre hay “brechas”
entre esos valores.
EJEMPLO: el número de habitaciones en una
casa (1,2,3,..., etc.). El número de hijos que
tiene un matrimonio (0, 1, 2, 3…., etc).
Las variables discretas se “cuentan”.
1-10
Variables Continuas
Variables continuas: Son variables cuantitativas
que pueden tomar cualquier valor dentro de un
intervalo específico.
EJEMPLO: El tiempo que toma viajar de
Lima a Ica. El peso de un artículo.
Las variable continuas se “miden”
1-11
Resumen de
Tipos de Variables
DATOS
Discretos Continuos
(Conteo) (Medición)
Ordenamiento de Datos
Datos Numéricos
Histograma Ojiva
Tablas Polígono
Arreglo de Datos
Organiza los datos para enfocar las
características importantes.
Los datos son ordenados de mayor a menor o
viceversa.
Datos sin procesar, según son recolectados.
24, 26, 24, 21, 27, 27, 30, 41, 32, 38
Datos en un arreglo ordenado.
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Ordenamiento de Datos
Datos Numéricos
Histograma Ojiva
Tablas Polígono
Distribución de Frecuencias
Ordenamiento de los datos en clases.
Indica el número de observaciones (datos)
que caen en cada clase.
Clase
Grupo de valores que describe una
característica de los datos.
Tipos de Clases
Cualitativas
Cuantitativas
Discretas
Continuas
Pasos para construir una
Distribución de Frecuencias
1. Calcule el alcance o rango
(Dato mayor - Dato menor).
2. Determine el número de clases.
Usualmente entre 6 y 15.
3. Calcule el intervalo de clase.
Divida el alcance entre el número de clases
4. Determine los límites de cada clase.
Límite Superior y Límite Inferior
6. Asigne las observaciones a cada clase y
efectúe el conteo.
Intervalos de Clase
Límite Límite Ancho del
Inferior Superior Intervalo
0 9 10
10 19 10
20 29 10
30 39 10
40 49 10
50 59 10
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0
Límite Superior
Límite Inferior
Distribución de
Frecuencias Relativas
Distribución
de Clase Frecuencia Frec. Relativa
Frecuencias
Relativas 48.8-49.2 2 0.07
49.3-49.7 5 0.16
49.8-50.2 11 0.37
50.3-50.7 6 0.20
50.8-51.2 3 0.10
51.3-51.7 3 0.10
30 1.00
Distribución de Frecuencias
Relativas Acumuladas
30 1.00
Ordenamiento de Datos
Datos Numéricos
Histograma Ojiva
Tablas Polígono
Histograma
Clase Frecuencia
48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia
8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
Ordenamiento de Datos
Datos Numéricos
Histograma Ojiva
Tablas Polígono
Polígono de Frecuencias
Clase Frecuencia
48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia
8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
Polígono de Frecuencias
Clase Marca Frecuencia
48.8-49.2 49.0 2
12 49.3-49.7 49.5 5
49.8-50.2 50.0 11
10 50.3-50.7 50.5 6
Frecuencia
8 50.8-51.2 51.0 3
51.3-51.7 51.5 3
6
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Polígono de Frecuencias
Marca Frecuencia
48.5 0
12 49.0 2
49.5 5
10 50.0 11
Frecuencia
50.5 6
8 51.0 3
6 51.5 3
52.0 0
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Ordenamiento de Datos
Datos Numéricos
Histograma Ojiva
Tablas Polígono
Ojiva
30
27
24
Acumulada Relativa
49.8-50.2 11 49.8 7
50.3-50.7 6 50.3 18
50.8-51.2 3 50.8 24
7 51.3-51.7 3 51.3 27
51.8 30
2
0 48.8 49.3 49.8 50.3 50.8 51.3 51.8
Diagrama de Tallo y Hoja
3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9
2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2
3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4
2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9
4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9
1 68
2 9518595872
3 1865767657791499
4 390860509472192
5 71166
6 21
1 68
2 1255578899
3 1145566677778999
4 000122345678999
5 11667
6 12
ESTADÍSTICA
DESCRIPTIVA
Dispersión
(Variación)
Sesgo
Tendencia
Central
Media de la Población
Para datos no agrupados, la media aritmética de
la población es la suma de todos los valores en
ella dividida entre el total de valores en la
población:
x / N
donde µ representa la media de la población.
N es el número total de elementos en la población.
x representa cualquier valor en particular.
Σ indica la operación de sumar.
3-4
Propiedades de la
Media Aritmética
Todo conjunto de datos tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de valores sólo tiene una media.
Desventaja
Es afectada por los valores extremos.
Media Aritmética
Es la medida más común de tendencia central.
Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
3-8
Media Ponderada
La media ponderada de un conjunto de números x1,
x2, ..., xn, con las ponderaciones correspondientes
w1, w2, ...,wn, se calcula con la fórmula:
xw ( w1 x1 w2 x2 ... wn xn ) /( w1 w2 ... wn )
xw ( w * x ) / w
3-14
Media Geométrica
La media geométrica (MG) de un conjunto
de n números positivos se define como la
raíz n-ésima del producto de los n valores.
Su fórmula es:
Mediana
Mediana: es el punto medio de los valores
después de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
Nota: para un conjunto con un número par
de números, la mediana será el promedio
aritmético de los dos números medios.
Mediana
No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
n 1
Mediana
2
3-12
Propiedades de la mediana
La mediana es única para cada conjunto de
datos.
No se ve afectada por valores muy grandes o
muy pequeños.
Moda
Valor que ocurre más a menudo.
No es afectada por valores extremos.
Puede no existir una moda.
Pueden haber varias modas.
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
3-18
( f * x ) ( f * x )
x
f n
f = frecuencia de cada clase
x = punto medio o marca de la clase
n = número de observaciones
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.
1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224
224
Media 10.18
22
3-21
( n 1) / 2 ( F 1)
m
* w Lm
fm
n= número de elementos de la distribución
F= suma de todas las frecuencias de clase hasta pero sin incluir la
clase mediana.
fm= Frecuencia de la clase mediana
W = ancho del intervalo de clase
Lm= Límite inferior del intervalo de clase mediano
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22
22 1
Ubicación de la mediana 11.5
2
( 22 1) / 2 (9 1)
m * 3 10 10.64
7
3-25
(7 5)
Mo 10
(7 5) (7 4)
* 3 11.2
Medidas de
Dispersión
7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles
Los datos se ordenan de menor a mayor.
25% 25% 25% 25%
Q1 Q2 Q3
Observación Observación
Menor Mayor
-2
1
-1
0 1 2 3 4 5
( x ) 0
Varianza de la Población
Desviación cuadrática promedio con relación a
la media de la Población
( x ) 2
2
N
x 2
2
2
N
Desviación Estándar
de la Población
Raíz Cuadrada de la Varianza de la Población
( x ) 2
2
N
x 2
2
2
N
Varianza de la Muestra
Desviación cuadrática promedio (n-1) con
relación a la media de la Muestra
( x x ) 2
s 2
n 1
x 2 2
nx
s
2
n 1 n 1
Desviación Estándar
de la Muestra
Raíz Cuadrada de la Varianza de la Muestra
( x x ) 2
s s 2
n 1
x2 2
nx
s s 2
n 1 n 1
Varianza de la Población
Datos Agrupados
f ( x ) 2
2
N
fx 2
2
2
x marca de clase
Desviación Estándar
de la Población
Datos Agrupados
f ( x ) 2
2
N
fx 2
2
2
N
x marca de clase
Varianza de la Muestra
Datos agrupados
f ( x x) 2
s
2
n 1
fx 2 2
nx
s
2
n 1 n 1
x marca de clase
Desviación Estándar
de la Muestra
Datos Agrupados
f ( x x) 2
s s 2
n 1
fx 2 2
nx
s s 2
n 1 n 1
x marca de clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
4-14
Interpretación y usos de la
Desviación Estándar
Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporción mínima de valores que está
dentro de k desviaciones estándar
desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que 1.
4-15
Interpretación y usos de la
Desviación Estándar
Regla empírica: para una distribución de
frecuencias simétrica de campana:
Cerca de 68% de las observaciones estará dentro
de ±1σ de la media (μ);
Cerca de 95% de las observaciones estará dentro
de ±2σ de la media (μ);
Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).
Curva de Distribución Normal
13.60% 13.60%
2.135% 2.135%
0.135% 0.135%
x
Re
100 100
20 20
x 80 x 160
¿ Re? ¿ Re?
Dispersión Relativa
El coeficiente de variación es la razón de la
desviación estándar a la media aritmética,
expresada como porcentaje:
s
CV (100%)
x
Ejemplo de Dispersión Relativa
Distribuci ón A Distribuci ón B
x 10 x 100
s2 s5
Distribuci ón A Distribuci ón B
2 5
CV 100 20% CV 100 5%
10 100
Negativamente Positivamente
Simétrica Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media