Vous êtes sur la page 1sur 87

MTODOS ESTADSTICOS

PARA LA INVESTIGACIN

Mtodos Estadsticos para la Investigacin


Dr. Carlos A. Risco Dvila

ESTADSTICA
DESCRIPTIVA
Sesiones 1_2: Arreglo de Datos y
Distribucin de Frecuencias
Mtodos Estadsticos en la Investigacin
Dr. Carlos A. Risco Dvila

1-2

Definicin de Estadstica
Estadstica es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propsito de ayudar a una
toma de decisiones ms efectiva.

Estadstica Descriptiva

Estadstica Descriptiva: Conjunto de


mtodos y procedimientos grficos y
numricos que organizan, resumen y
presentan datos
Es usada para transformar datos en
informacin.

Estadstica Descriptiva
Recolectar Datos
Ej. Encuestas

Presentar Datos
Ej. Tablas y Grficos

Resumir Datos
Ej. Media muestral =

X
n

Estadstica Descriptiva
A mediados de diciembre el proveedor de
servicios de Internet American On Line (AOL)
realiz una encuesta entre sus usuarios. La
siguiente pregunta se refera a los rboles de
navidad:
Cul prefiere?
Un rbol natural
Un rbol artificial
De entre 7073 respuestas recibidas de los
usuarios de Internet, 4650 respuestas prefirieron
un rbol natural y 2423 un rbol artificial

Estadstica Descriptiva
La revista Good Housekeeping
invit a mujeres para que visitaran
su pgina de Internet para
contestar una encuesta, y se
registraron
1500
respuestas.
Cuando se les pregunt si
preferan tener ms dinero o
dormir mas, el 88% eligi mas
dinero y solo el 11%, dormir ms.

Estadstica Descriptiva
Trate de identificar cada una de las fallas
principales en lo siguiente: Un diario
realizo una encuesta pidiendo a los lectores
que llamaran y respondieran esta pregunta:
Apoya usted el desarrollo de armas
atmicas que podran matar a millones de
personas inocentes? Se reporto que 20
lectores respondieron y 87% contesto no,
mientras que el 13% dijo si

Estadstica Descriptiva
U editorial del Comercio critic
un grfico que describa un
enjuague bucal que reduce la
placa bacteriana en mas de
300%. Qu es incorrecto en esta
declaracin?
La inversin extranjera cayo en
500% durante la dcada del 1990.
Que esta equivocado en esta
declaracin?

Estadstica Inferencial
Estimacin
Ej. Estimar el peso promedio de
la poblacin usando el peso
promedio de la muestra.

Prueba de Hiptesis
Ej. Probar que el peso promedio
de la poblacin es 65 kg.

Extraer conclusiones y/o tomar decisiones


concernientes a una poblacin basndose en
los resultados de una muestra.

Poblacin y Muestra

Poblacin
TODOS los posibles
Individuos, objetos,
mediciones y conteos
Un PARMETRO describe
a una Poblacin.

Muestra
PARTE representativa
de la Poblacin.
Un ESTADSTICO describe
a una Muestra.

1-7

Tipos de Variables
Variable cualitativa o de atributos: la
caracterstica o variable que se estudia
no es numrica.
EJEMPLOS: Genero, afiliacin
religiosa, tipo de automvil que se
posee, lugar de nacimiento, color de
los ojos.

1-8

Tipos de Variables
Variable cuantitativa: la variable se
puede registrar numricamente.
EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, nmero de nios en una
familia.

1-9

Variables Discretas
Las variables cuantitativas se pueden clasificar
como discretas o continuas.
Variables discretas: slo pueden adquirir
ciertos valores y casi siempre hay brechas
entre esos valores.
EJEMPLO: el nmero de habitaciones en una
casa (1,2,3,..., etc.). El nmero de hijos que
tiene un matrimonio (0, 1, 2, 3., etc).
Las variables discretas se cuentan.

1-10

Variables Continuas
Variables continuas: Son variables cuantitativas
que pueden tomar cualquier valor dentro de un
intervalo especfico.
EJEMPLO: El tiempo que toma viajar de
Lima a Ica. El peso de un artculo.
Las variable continuas se miden

1-11

Resumen de
Tipos de Variables
DATOS
Cualitativos o de atributos

Cuantitativos o numricos

Discretos
(Conteo)

Continuos
(Medicin)

Ordenamiento de Datos
Datos Numricos

Arreglo
de Datos

Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas

Ojiva
Polgono

Arreglo de Datos

Organiza los datos para enfocar las


caractersticas importantes.
Los datos son ordenados de mayor a menor o
viceversa.
Datos sin procesar, segn son recolectados.
24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Datos en un arreglo ordenado.


21, 24, 24, 26, 27, 27, 30, 32, 38, 41

Ordenamiento de Datos
Datos Numricos

Arreglo
de Datos

Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas

Ojiva
Polgono

Distribucin de Frecuencias

Ordenamiento de los datos en clases.


Indica el nmero de observaciones (datos)
que caen en cada clase.

Clase
Grupo de valores que describe una
caracterstica de los datos.

Tipos de Clases
Cualitativas
Cuantitativas
Discretas
Continuas

Pasos para construir una


Distribucin de Frecuencias

1. Calcule el alcance o rango


(Dato mayor - Dato menor).

2. Determine el nmero de clases.


Usualmente entre 6 y 15.

3. Calcule el intervalo de clase.


Divida el alcance entre el nmero de clases

4. Determine los lmites de cada clase.


Lmite Superior y Lmite Inferior

6. Asigne las observaciones a cada clase y


efecte el conteo.

Intervalos de Clase
Lmite
Inferior

Lmite
Superior

Ancho del
Intervalo

10

10

19

10

20

29

10

30

39

10

40

49

10

50

59

10

Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:

49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribucin
de
Frecuencias

Clase

Conteo

48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

//
////
//// //// /
//// /
///
///

Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:

49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Alcance: 51.7 48.8 = 2.9


Nm. Clases:
6
Intervalo de Clase: 51.8 48.8 = 0.5
6

Tabla de
Distribucin de Frecuencias
Datos sin
Procesar:

49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribucin
de
Frecuencias

Clase

Conteo

48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

//
////
//// //// /
//// /
///
///

Frecuencia
2
5
11
6
3
3

Tabla de
Distribucin de Frecuencias
Marca de Clase
(48.8 + 49.2)/2 = 49.0
Distribucin
de
Frecuencias

Lmite Inferior

Clase

Frecuencia

48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

2
5
11
6
3
3

Lmite Superior

Distribucin de
Frecuencias Relativas
Distribucin
de
Frecuencias
Relativas

Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

Frecuencia

Frec. Relativa

2
5
11
6
3
3

0.07
0.16
0.37
0.20
0.10
0.10

30

1.00

Distribucin de Frecuencias
Relativas Acumuladas
Distribucin
de
Frecuencias
Relativas
Acumuladas

Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

Frecuencia

Frec. Relativa

2
5
11
6
3
3

0.07
0.16
0.37
0.20
0.10
0.10

30

1.00

Frec. Relativa
Acumulada
0.07
0.23
0.60
0.80
0.90
1.00

Ordenamiento de Datos
Datos Numricos

Arreglo
de Datos

Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas

Ojiva
Polgono

Histograma
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

Frecuencia

12
10
8
6
4
2
0

48.8
49.2

49.3
49.7

49.8
50.2

50.3
50.7

50.8
51.2

51.3
51.7

Frecuencia
2
5
11
6
3
3

Ordenamiento de Datos
Datos Numricos

Arreglo
de Datos

Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas

Ojiva
Polgono

Polgono de Frecuencias
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

Frecuencia

12
10
8
6
4
2
0

48.8
49.2

49.3
49.7

49.8
50.2

50.3
50.7

50.8
51.2

51.3
51.7

Frecuencia
2
5
11
6
3
3

Polgono de Frecuencias
Clase
48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

Frecuencia

12
10
8
6
4
2
0

48.5 49.0

49.5

50.0

50.5

51.0

51.5 52.0

Marca

Frecuencia

49.0
49.5
50.0
50.5
51.0
51.5

2
5
11
6
3
3

Polgono de Frecuencias
12
Frecuencia

10
8
6
4
2
0

48.5 49.0

49.5

50.0

50.5

51.0

51.5 52.0

Marca

Frecuencia

48.5
49.0
49.5
50.0
50.5
51.0
51.5
52.0

0
2
5
11
6
3
3
0

Ordenamiento de Datos
Datos Numricos

Arreglo
de Datos

Distribucin de Frecuencias
Distribucin Acumulada
Histograma
Tablas

Ojiva
Polgono

Ojiva
30
27

Frecuencia
Acumulada Relativa

24

Clase
18

48.8-49.2
49.3-49.7
49.8-50.2
50.3-50.7
50.8-51.2
51.3-51.7

7
2

48.8

49.3

49.8

50.3

50.8

51.3

51.8

Frec.
Abs.

Menor
que

Frec.
Acum.

2
5
11
6
3
3

48.8
49.3
49.8
50.3
50.8
51.3
51.8

0
2
7
18
24
27
30

Diagrama de Tallo y Hoja


3.1
2.9
3.8
2.5
4.3

4.9
2.1
6.2
3.6
5.7

2.8
3.5
2.5
5.1
3.7

3.6
4.0
2.9
4.8
4.6

2.5
3.7
2.8
1.6
4.0

4.5
2.7
5.1
3.6
5.6

3.5
4.0
1.8
6.1
4.9

3.7
4.4
5.6
4.7
4.2

4.1
3.7
2.2
3.9
3.1

4.9
4.2
3.4
3.9
3.9

1
2
3
4
5
6

68
9518595872
1865767657791499
390860509472192
71166
21

1
2
3
4
5
6

68
1255578899
1145566677778999
000122345678999
11667
12

ESTADSTICA
DESCRIPTIVA
Caractersticas de los Datos

Mtodos Estadsticos en la Investigacin


Dr. Carlos A. Risco Dvila

Caractersticas
de los Datos
Tendencia Central
(Posicin)
Dispersin
(Variacin)

Sesgo

Tendencia
Central

Media
Aritmtica

Media
Ponderada

Media
Geomtrica

Mediana

Moda

3-2

Media de la Poblacin
Para datos no agrupados, la media aritmtica de
la poblacin es la suma de todos los valores en
ella dividida entre el total de valores en la
poblacin:

x / N

donde representa la media de la poblacin.


N es el nmero total de elementos en la poblacin.
x representa cualquier valor en particular.
indica la operacin de sumar.

3-4

Media de una Muestra


Para datos no agrupados, la media de una
muestra es la suma de todos los valores
divididos entre el nmero total de los
mismos:

x x / n
x

donde denota la media muestral


n es el nmero total de valores en la muestra.

3-6

Propiedades de la
Media Aritmtica
Todo conjunto de datos tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de valores slo tiene una media.
Desventaja
Es afectada por los valores extremos.

Media Aritmtica
Es la medida ms comn de tendencia central.
Es afectada por valores extremos.

0 1 2 3 4 5 6 7 8 9 10

Media = 5

0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 6

3-8

Media Ponderada
La media ponderada de un conjunto de nmeros x1,
x2, ..., xn, con las ponderaciones correspondientes
w1, w2, ...,wn, se calcula con la frmula:
xw ( w1 x1 w2 x2 ... wn xn ) /( w1 w2 ...wn )
xw ( w * x ) / w

3-14

Media Geomtrica
La media geomtrica (MG) de un conjunto de n
nmeros positivos se define como la raz nsima del producto de los n valores. Su frmula
es:

MG n ( x1)( x 2)( x 3)...( xn)


La media geomtrica se usa para encontrar el
promedio de porcentajes, razones, ndices o tasas de
crecimiento.

3-10

Mediana
Mediana: es el punto medio de los valores
despus de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
Nota: para un conjunto con un nmero par
de nmeros, la mediana ser el promedio
aritmtico de los dos nmeros medios.

Mediana
No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5

n 1
Mediana
2

Mediana = 5

3-12

Propiedades de la mediana
La mediana es nica para cada conjunto de
datos.
No se ve afectada por valores muy grandes o
muy pequeos.

Moda

Valor que ocurre ms a menudo.


No es afectada por valores extremos.
Puede no existir una moda.
Pueden haber varias modas.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

Sin Moda

Datos NO Agrupados
Registro cantidad de artculos vendidos
durante 22 das

Datos Agrupados
Distribucin de Frecuencias de artculos vendidos
durante 22 das

3-18

Media de Datos Agrupados


La media de una muestra de datos agrupados
se puede estimar con la formula:

( f * x )
( f * x )
x

f
n
f = frecuencia de cada clase
x = punto medio o marca de la clase
n = nmero de observaciones

Ejemplo
Media de Datos Agrupados

224
Media
10.18
22

3-21

Mediana de datos agrupados


La mediana de una muestra de datos agrupados se calcula
mediante la siguiente frmula:

( n 1) / 2 ( F 1)
* w Lm
m
fm

n= nmero de elementos de la distribucin


F= suma de todas las frecuencias de clase hasta pero sin incluir la
clase mediana.
fm= Frecuencia de la clase mediana
W = ancho del intervalo de clase
Lm= Lmite inferior del intervalo de clase mediano

Ejemplo
Mediana de Datos Agrupados

22 1
Ubicacin de la mediana
11.5
2
( 22 1) / 2 (9 1)
m
* 3 10 10.64
7

3-25

Moda de datos agrupados


La moda de los datos agrupados se encuentra de la clase
que contiene la frecuencia de clase mayor.
d1

Mo LMo
*w
d1 d 2
LMo= Lmite inferior de la clase modal
d1= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por debajo de ella (en valor).
d2= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por encima de ella (en valor).
w= Ancho del intervalo de la clase modal.

Ejemplo
Moda de Datos Agrupados

(7 5)
* 3 11.2
Mo 10
(7 5) (7 4)

Medidas de
Dispersin

Mtodos Estadsticos en la Investigacin


Dr. Carlos A. Risco Dvila

Dispersin

Varianza
Alcance

Varianza de
la Poblacin
Varianza de la
Muestra

Alcance Intercuartil

Desviacin Estndar
Desviacin
Estndar de
la Poblacin
Desviacin
Estndar de
la Muestra

Coeficiente de
Variacin

Alcance o Rango

Mtodos Estadsticos en la Investigacin


Dr. Carlos A. Risco Dvila

Alcance
Diferencia entre la mayor y la menor de las
observaciones
Alcance = xmayor xmenor

No toma en cuenta la forma en que estn


distribuidos los datos.
Alcance: 12 - 7 = 5

Alcance: 12 - 7 = 5
7

10

11

12

10

11

12

Cuartiles
Los datos se ordenan de menor a mayor.

25%

25%

Q1
Observacin
Menor

25%

Q2

25%

Q3
Observacin
Mayor

El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el


primer cuartil Q1.

Desviacin de la
Media

Mtodos Estadsticos en la Investigacin


Dr. Carlos A. Risco Dvila

Promedio de
desviacin de cada dato
2
-2
1
-1

( x ) 0

Varianza de la Poblacin
Desviacin cuadrtica promedio con relacin a
la media de la Poblacin

( x )

x
2

N
2

Desviacin Estndar
de la Poblacin
Raz Cuadrada de la Varianza de la Poblacin

( x )
N

x
2

N
2

Varianza de la Muestra
Desviacin cuadrtica promedio (n-1) con
relacin a la media de la Muestra

( x x )
s
n 1
2

x
nx
s

n 1 n 1
2

Desviacin Estndar
de la Muestra
Raz Cuadrada de la Varianza de la Muestra

s
s

s
s

( x x )
n 1

x
nx

n 1 n 1
2

Varianza de la Poblacin
Datos Agrupados

f ( x )

N
2

fx
2

N
2

x marca de clase

Desviacin Estndar
de la Poblacin
Datos Agrupados

f ( x ) 2
N
fx
2

x marca de clase

Varianza de la Muestra
Datos agrupados
f ( x x )
s
n 1
2

fx
nx
s

n 1 n 1
2

x marca de clase

Desviacin Estndar
de la Muestra
Datos Agrupados
s
s

s
s

f ( x x )
n 1

fx
nx

n 1 n 1
2

x marca de clase

Ejemplo Desviacin Estndar


de Datos Agrupados

Comparacin de Desviaciones
Estndar
Datos A
11 12

13

14

15

16

17

18

19

20 21

Datos B
11 12

13

14

15

16

17

18

19

Media = 15.5
s = 3.338

20 21

Media = 15.5
s = .9258

20 21

Media = 15.5
s = 4.57

Datos C
11 12

13

14

15

16

17

18

19

4-14

Interpretacin y usos de la
Desviacin Estndar
Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporcin mnima de valores que est
dentro de k desviaciones estndar
desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que 1.

4-15

Interpretacin y usos de la
Desviacin Estndar
Regla emprica: para una distribucin de
frecuencias simtrica de campana:
Cerca de 68% de las observaciones estar dentro
de 1 de la media ();
Cerca de 95% de las observaciones estar dentro
de 2 de la media ();
Casi todas (alrededor de 99.7%) las observaciones
estarn dentro de 3 de la media ().

Curva de Distribucin Normal

-3

-2

-1

+1

+2

+3

34.13%

34.13%

13.60%

13.60%
2.135%

2.135%
0.135%

0.135%

-3

-2

-1

+1

68.26%
95.46%
99.73%

+2

+3

Resultado Estndar

-3

-2

-1

Re

+1

+2

+3

100
20
x 80
Re?

-3

-2

80 100
Re
1
20

100
20
x 160
Re?

-1

80

100

+1

+2

+3
160

160 100
Re
3
20

4-17

Dispersin Relativa
El coeficiente de variacin es la razn de la
desviacin estndar a la media aritmtica,
expresada como porcentaje:

s
CV (100%)
x

Ejemplo de Dispersin Relativa


Distribucin A

Distribucin B

x 10
s2

x 100
s5

Cul de las dos tiene menor dispersin?

Ejemplo de Dispersin Relativa


Distribucin A
2
CV 100 20%
10

Distribucin B
5
CV
100 5%
100

La distribucin B tiene menor dispersin

Sesgo de una distribucin

Negativamente
Sesgada

Simtrica

Media < Mediana < Moda

Media = Mediana = Moda

Positivamente
Sesgada

Moda < Mediana < Media

Vous aimerez peut-être aussi