Vous êtes sur la page 1sur 87

MÉTODOS ESTADÍSTICOS

PARA LA INVESTIGACIÓN

Métodos Estadísticos para la Investigación


Dr. Carlos A. Risco Dávila
ESTADÍSTICA
DESCRIPTIVA

Sesiones 1_2: Arreglo de Datos y


Distribución de Frecuencias

Métodos Estadísticos en la Investigación


Dr. Carlos A. Risco Dávila
1-2

Definición de Estadística

 Estadística es la ciencia de recolectar,


organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una
toma de decisiones más efectiva.
Estadística Descriptiva
 Estadística Descriptiva: Conjunto de
métodos y procedimientos gráficos y
numéricos que organizan, resumen y
presentan datos
 Es usada para transformar datos en
información.
Estadística Descriptiva
 Recolectar Datos
 Ej. Encuestas
 Presentar Datos
 Ej. Tablas y Gráficos
 Resumir Datos
 Ej. Media muestral = X i

n
Estadística Descriptiva
 A mediados de diciembre el proveedor de
servicios de Internet American On Line (AOL)
realizó una encuesta entre sus usuarios. La
siguiente pregunta se refería a los árboles de
navidad:
 Cuál prefiere?
 Un árbol natural
 Un árbol artificial
 De entre 7073 respuestas recibidas de los
usuarios de Internet, 4650 respuestas prefirieron
un árbol natural y 2423 un árbol artificial
Estadística Descriptiva
 La revista Good Housekeeping
invitó a mujeres para que visitaran
su página de Internet para
contestar una encuesta, y se
registraron 1500 respuestas.
Cuando se les preguntó si
preferían tener más dinero o
dormir mas, el 88% eligió mas
dinero y solo el 11%, dormir más.
Estadística Descriptiva
 Trate de identificar cada una de las fallas
principales en lo siguiente: Un diario
realizo una encuesta pidiendo a los lectores
que llamaran y respondieran esta pregunta:
Apoya usted el desarrollo de armas
atómicas que podrían matar a millones de
personas inocentes? Se reporto que 20
lectores respondieron y 87% contesto “no”,
mientras que el 13% dijo “si”
Estadística Descriptiva
 U editorial del Comercio criticó
un gráfico que describía un
enjuague bucal que “reduce la
placa bacteriana en mas de
300%”. Qué es incorrecto en esta
declaración?
 La inversión extranjera cayo en
500% durante la década del 1990.
Que esta equivocado en esta
declaración?
Estadística Inferencial
 Estimación
 Ej. Estimar el peso promedio de
la población usando el peso
promedio de la muestra.
 Prueba de Hipótesis
 Ej. Probar que el peso promedio
de la población es 65 kg.

Extraer conclusiones y/o tomar decisiones


concernientes a una población basándose en
los resultados de una muestra.
Población y Muestra

Población Muestra
• TODOS los posibles • PARTE “representativa”
•Individuos, objetos, de la Población.
mediciones y conteos • Un ESTADÍSTICO describe
• Un PARÁMETRO describe a una Muestra.
a una Población.
1-7

Tipos de Variables
 Variable cualitativa o de atributos: la
característica o variable que se estudia
no es numérica.
 EJEMPLOS: Genero, afiliación
religiosa, tipo de automóvil que se
posee, lugar de nacimiento, color de
los ojos.
1-8

Tipos de Variables
 Variable cuantitativa: la variable se
puede registrar numéricamente.
 EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, número de niños en una
familia.
1-9

Variables Discretas
 Las variables cuantitativas se pueden clasificar
como discretas o continuas.
 Variables discretas: sólo pueden adquirir
ciertos valores y casi siempre hay “brechas”
entre esos valores.
 EJEMPLO: el número de habitaciones en una
casa (1,2,3,..., etc.). El número de hijos que
tiene un matrimonio (0, 1, 2, 3…., etc).
 Las variables discretas se “cuentan”.
1-10

Variables Continuas
Variables continuas: Son variables cuantitativas
que pueden tomar cualquier valor dentro de un
intervalo específico.
 EJEMPLO: El tiempo que toma viajar de
Lima a Ica. El peso de un artículo.
 Las variable continuas se “miden”
1-11

Resumen de
Tipos de Variables

DATOS

Cualitativos o de atributos Cuantitativos o numéricos

Discretos Continuos
(Conteo) (Medición)
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
Arreglo de Datos
 Organiza los datos para enfocar las
características importantes.
 Los datos son ordenados de mayor a menor o
viceversa.
 Datos sin procesar, según son recolectados.
 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
 Datos en un arreglo ordenado.
 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
Distribución de Frecuencias
 Ordenamiento de los datos en clases.
 Indica el número de observaciones (datos)
que caen en cada clase.

 Clase
 Grupo de valores que describe una
característica de los datos.

 Tipos de Clases
 Cualitativas
 Cuantitativas
 Discretas
 Continuas
Pasos para construir una
Distribución de Frecuencias
 1. Calcule el alcance o rango
 (Dato mayor - Dato menor).
 2. Determine el número de clases.
 Usualmente entre 6 y 15.
 3. Calcule el intervalo de clase.
 Divida el alcance entre el número de clases
 4. Determine los límites de cada clase.
 Límite Superior y Límite Inferior
 6. Asigne las observaciones a cada clase y
efectúe el conteo.
Intervalos de Clase
Límite Límite Ancho del
Inferior Superior Intervalo
0 9 10
10 19 10
20 29 10
30 39 10
40 49 10
50 59 10
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo


de
Frecuencias 48.8-49.2 //
49.3-49.7 ////
49.8-50.2 //// //// /
50.3-50.7 //// /
50.8-51.2 ///
51.3-51.7 ///
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

 Alcance: 51.7 – 48.8 = 2.9


 Núm. Clases: 6
 Intervalo de Clase: 51.8 – 48.8 = 0.5
6
Tabla de
Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo Frecuencia


de
Frecuencias 48.8-49.2 // 2
49.3-49.7 //// 5
49.8-50.2 //// //// / 11
50.3-50.7 //// / 6
50.8-51.2 /// 3
51.3-51.7 /// 3
Tabla de
Distribución de Frecuencias
Marca de Clase
(48.8 + 49.2)/2 = 49.0

Distribución Clase Frecuencia


de
Frecuencias 48.8-49.2 2
49.3-49.7 5
49.8-50.2 11
50.3-50.7 6
50.8-51.2 3
51.3-51.7 3

Límite Superior
Límite Inferior
Distribución de
Frecuencias Relativas

Distribución
de Clase Frecuencia Frec. Relativa
Frecuencias
Relativas 48.8-49.2 2 0.07
49.3-49.7 5 0.16
49.8-50.2 11 0.37
50.3-50.7 6 0.20
50.8-51.2 3 0.10
51.3-51.7 3 0.10

30 1.00
Distribución de Frecuencias
Relativas Acumuladas

Distribución Frec. Relativa


de Clase Frecuencia Frec. Relativa Acumulada
Frecuencias
Relativas 48.8-49.2 2 0.07 0.07
Acumuladas 49.3-49.7 5 0.16 0.23
49.8-50.2 11 0.37 0.60
50.3-50.7 6 0.20 0.80
50.8-51.2 3 0.10 0.90
51.3-51.7 3 0.10 1.00

30 1.00
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
Histograma
Clase Frecuencia

48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia

8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
Polígono de Frecuencias
Clase Frecuencia

48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10 50.3-50.7 6
Frecuencia

8 50.8-51.2 3
51.3-51.7 3
6
4
2
0 48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
Polígono de Frecuencias
Clase Marca Frecuencia

48.8-49.2 49.0 2
12 49.3-49.7 49.5 5
49.8-50.2 50.0 11
10 50.3-50.7 50.5 6
Frecuencia

8 50.8-51.2 51.0 3
51.3-51.7 51.5 3
6
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Polígono de Frecuencias
Marca Frecuencia

48.5 0
12 49.0 2
49.5 5
10 50.0 11
Frecuencia

50.5 6
8 51.0 3
6 51.5 3
52.0 0
4
2
0 48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
Ojiva
30
27

24
Acumulada Relativa

Clase Frec. Menor Frec.


Abs. que Acum.
18
48.8-49.2 2 48.8 0
49.3-49.7 5 49.3 2
Frecuencia

49.8-50.2 11 49.8 7
50.3-50.7 6 50.3 18
50.8-51.2 3 50.8 24
7 51.3-51.7 3 51.3 27
51.8 30
2
0 48.8 49.3 49.8 50.3 50.8 51.3 51.8
Diagrama de Tallo y Hoja

3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9
2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2
3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4
2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9
4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9
1 68
2 9518595872
3 1865767657791499
4 390860509472192
5 71166
6 21
1 68
2 1255578899
3 1145566677778999
4 000122345678999
5 11667
6 12
ESTADÍSTICA
DESCRIPTIVA

Características de los Datos

Métodos Estadísticos en la Investigación


Dr. Carlos A. Risco Dávila
Características
de los Datos
Tendencia Central
(Posición)

Dispersión
(Variación)

Sesgo
Tendencia
Central

Media Media Media Mediana Moda


Aritmética Ponderada Geométrica
3-2

Media de la Población
 Para datos no agrupados, la media aritmética de
la población es la suma de todos los valores en
ella dividida entre el total de valores en la
población:
  x / N
 donde µ representa la media de la población.
 N es el número total de elementos en la población.
 x representa cualquier valor en particular.
 Σ indica la operación de sumar.
3-4

Media de una Muestra


 Para datos no agrupados, la media de una
muestra es la suma de todos los valores
divididos entre el número total de los
mismos:
x  x / n
x
 donde denota la media muestral
 n es el número total de valores en la muestra.
3-6

Propiedades de la
Media Aritmética
 Todo conjunto de datos tiene un valor medio.
 Al evaluar la media se incluyen todos los valores.
 Un conjunto de valores sólo tiene una media.

 Desventaja
 Es afectada por los valores extremos.
Media Aritmética
 Es la medida más común de tendencia central.
 Es afectada por valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 5 Media = 6
3-8

Media Ponderada
 La media ponderada de un conjunto de números x1,
x2, ..., xn, con las ponderaciones correspondientes
w1, w2, ...,wn, se calcula con la fórmula:

xw  ( w1 x1  w2 x2  ...  wn xn ) /( w1  w2  ... wn )
xw  ( w * x ) / w
3-14

Media Geométrica
 La media geométrica (MG) de un conjunto
de n números positivos se define como la
raíz n-ésima del producto de los n valores.
Su fórmula es:

MG  n ( x1)( x2)( x3)...( xn)


 La media geométrica se usa para encontrar el
promedio de porcentajes, razones, índices o
tasas de crecimiento.
3-10

Mediana
 Mediana: es el punto medio de los valores
después de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
 Nota: para un conjunto con un número par
de números, la mediana será el promedio
aritmético de los dos números medios.
Mediana
 No es afectada por los valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5

n 1
Mediana 
2
3-12

Propiedades de la mediana
 La mediana es única para cada conjunto de
datos.
 No se ve afectada por valores muy grandes o
muy pequeños.
Moda
 Valor que ocurre más a menudo.
 No es afectada por valores extremos.
 Puede no existir una moda.
 Pueden haber varias modas.

0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9 Sin Moda


Datos NO Agrupados
Registro cantidad de artículos vendidos
durante 22 días
Día Artículos Día Artículos
1 10 12 10
2 14 13 14
3 9 14 6
4 12 15 13
5 8 16 8
6 15 17 12
7 12 18 7
8 3 19 16
9 11 20 9
10 17 21 11
11 5 22 6
Datos Agrupados
Distribución de Frecuencias de artículos vendidos
durante 22 días

CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
3-18

Media de Datos Agrupados


 La media de una muestra de datos agrupados
se puede “estimar” con la formula:

( f * x ) ( f * x )
x 
f n
 f = frecuencia de cada clase
 x = punto medio o marca de la clase
 n = número de observaciones
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.
1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224

224
Media   10.18
22
3-21

Mediana de datos agrupados


 La mediana de una muestra de datos agrupados se calcula
mediante la siguiente fórmula:

 ( n  1) / 2  ( F  1) 
m
 
 * w  Lm
 fm 
 n= número de elementos de la distribución
 F= suma de todas las frecuencias de clase hasta pero sin incluir la
clase mediana.
 fm= Frecuencia de la clase mediana
 W = ancho del intervalo de clase
 Lm= Límite inferior del intervalo de clase mediano
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22
22  1
Ubicación de la mediana   11.5
2
 ( 22  1) / 2  (9  1) 
m  * 3  10  10.64
 7 
3-25

Moda de datos agrupados


 La moda de los datos agrupados se encuentra de la clase
que contiene la frecuencia de clase mayor.
 d1 
Mo  LMo   *w
 d1  d 2 
 LMo= Límite inferior de la clase modal
 d1= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por debajo de ella (en valor).
 d2= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por encima de ella (en valor).
 w= Ancho del intervalo de la clase modal.
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22

 (7  5) 
Mo  10  
 (7  5)  (7  4) 
 * 3  11.2
 
Medidas de
Dispersión

Métodos Estadísticos en la Investigación


Dr. Carlos A. Risco Dávila
Dispersión

Varianza Desviación Estándar Coeficiente de


Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de la
Muestra Desviación
Estándar de
Alcance Intercuartil la Muestra
Alcance o Rango

Métodos Estadísticos en la Investigación


Dr. Carlos A. Risco Dávila
Alcance
 Diferencia entre la mayor y la menor de las
observaciones
 Alcance = xmayor – xmenor

 No toma en cuenta la forma en que están


distribuidos los datos.
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles
 Los datos se ordenan de menor a mayor.
25% 25% 25% 25%

 Q1   Q2  Q3 
Observación Observación
Menor Mayor

 El alcance intercuartil es la distancia entre el tercer


cuartil Q3 y el primer cuartil Q1.
Desviación de la
Media

Métodos Estadísticos en la Investigación


Dr. Carlos A. Risco Dávila
Promedio de
desviación de cada dato

-2
1
-1

0 1 2 3 4 5

( x   )  0
Varianza de la Población
 Desviación cuadrática promedio con relación a
la media de la Población

( x   ) 2
 2

N
x 2
 2
  2

N
Desviación Estándar
de la Población
 Raíz Cuadrada de la Varianza de la Población

( x   ) 2
   2

N
x 2
   2
  2

N
Varianza de la Muestra
 Desviación cuadrática promedio (n-1) con
relación a la media de la Muestra

( x  x ) 2
s  2

n 1
x 2 2
nx
s 
2

n 1 n 1
Desviación Estándar
de la Muestra
 Raíz Cuadrada de la Varianza de la Muestra

( x  x ) 2
s s 2

n 1

x2 2
nx
s s 2
 
n 1 n 1
Varianza de la Población
Datos Agrupados

f ( x   ) 2
 2

N
fx 2
 2
  2

x  marca de clase
Desviación Estándar
de la Población
Datos Agrupados

f ( x   ) 2
   2

N
fx 2
   2
  2

N
x  marca de clase
Varianza de la Muestra
Datos agrupados

f ( x  x) 2
s 
2

n 1
fx 2 2
nx
s 
2

n 1 n 1
x  marca de clase
Desviación Estándar
de la Muestra
Datos Agrupados

f ( x  x) 2
s s 2

n 1

fx 2 2
nx
s s 2
 
n 1 n 1
x  marca de clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27

MEDIA 10.18 VARIANZA 15.584

DESV. ESTAND. 3.948


Comparación de Desviaciones
Estándar
Datos A Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = .9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
4-14

Interpretación y usos de la
Desviación Estándar
 Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporción mínima de valores que está
dentro de k desviaciones estándar
desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que 1.
4-15

Interpretación y usos de la
Desviación Estándar
 Regla empírica: para una distribución de
frecuencias simétrica de campana:
 Cerca de 68% de las observaciones estará dentro
de ±1σ de la media (μ);
 Cerca de 95% de las observaciones estará dentro
de ±2σ de la media (μ);
 Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).
Curva de Distribución Normal

-3σ -2σ -1σ μ +1σ +2σ +3σ


34.13% 34.13%

13.60% 13.60%

2.135% 2.135%

0.135% 0.135%

-3σ -2 σ -1σ μ +1σ +2σ +3σ


68.26%
95.46%
99.73%
Resultado Estándar

-3σ -2σ -1σ μ +1σ +2σ +3σ

x
Re 

  100   100
  20   20
x  80 x  160
¿ Re? ¿ Re?

-3σ -2σ -1σ μ +1σ +2σ +3σ


80 100 160

80  100 160  100


Re   1 Re  3
20 20
4-17

Dispersión Relativa
 El coeficiente de variación es la razón de la
desviación estándar a la media aritmética,
expresada como porcentaje:

s
CV  (100%)
x
Ejemplo de Dispersión Relativa

Distribuci ón A Distribuci ón B
x  10 x  100
s2 s5

¿Cuál de las dos tiene menor dispersión?


Ejemplo de Dispersión Relativa

Distribuci ón A Distribuci ón B
2 5
CV  100  20% CV  100  5%
10 100

La distribución B tiene menor dispersión


Sesgo de una distribución

Negativamente Positivamente
Simétrica Sesgada
Sesgada

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media

Vous aimerez peut-être aussi