Vous êtes sur la page 1sur 48

Estadstica

Prof. Juan Narro Lavi


Diplomatura de Estudio
en
Gestin de Operaciones

Sesiones 3 y 4:
Resumen numrico
de los datos
Medidas de Correlacin

La estadstica es una ciencia que


demuestra que si mi vecino tiene dos
autos y yo ninguno, en promedio los dos
tenemos uno.

Estadstica Sumaria
Descripcin Numrica de
Datos
Tendencia Central

Dispersin

Media Aritmetica

Rango

Mediana

Rango Intercuartil

Moda

Varianza
Desviacin
Estndar
Coeficiente de Variacin

Estadstica Sumaria
Tendencia Central

Media

Mediana

Moda

x
i 1

Promedio
Aritmtico

Punto medio
de los Datos
Ordenados

Valor
observado
frecuentemente

Medidas de tendencia central


Aquellas que nos indican cual podra ser el punto
medio o tpico de un conjunto de datos
analizados.
Llamados Promedios.
Promedios principales:
Media aritmtica simple
Media ponderada
Media geomtrica
Media Armnica
Mediana
Moda

Media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas:
Se ve afectada por los datos extremos.

0 1 2 3 4 5 6 7 8 9 10

Media = 3

0 1 2 3 4 5 6 7 8 9 10

Media = 4

Media ponderada
k

w X
i

i 1

i 1

w x
i 1
k

w
i 1

Media aritmtica en la
cual se considera a
cada uno de los
valores
de
las
variables de acuerdo
con su importancia
relativa en el grupo.

Media geomtrica
De n nmeros positivos
es la raz n-sima del
producto
de
los
n
nmeros.
Para
promediar
porcentajes, ndices y
cifras relativas.
Determinar el incremento
porcentual promedio en
ventas, produccin, etc.

G N X 1 X 2 X 3 .. X n
G

N 1

Valoralfinal
1

Valoralinicio

Mediana
Punto medio de
valores despus
ordenarlos.
Es un promedio
posicin.
No es afectada
valores extremos.

los
de

Med

X N2 0.5

DatosNoAgrupados

de
por

Med

Li

2 faA
i
f i

DatosAgrupados

Mediana
Reglas
1 Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15, 17, 20, 21, 24
2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18 23
mediana
20.5
2

Mediana
Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.

Moda
Valor que ms se repite
en un conjunto de datos.
No es afectada por
valores extremos.
Para datos discretos es
fcil de calcular.
No puede ser calculada
exactamente en una dist.
de frecuencias.

Mo

Li

d 1
d 1 d 2

DatosAgrupados

Moda
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38

14

Moda
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores externos
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin amodal).
En otros casos la distribucin tiene varias modas, lo
que dificulta su interpretacin.

O
B
S
E
R
V
A
C
I

N
D
A
T
O
S
2
,
2
4
,
2
5
,
2
6
,
2
7
,
2
8
,
E
D
A
D
8
9
3
0
3
1
3
3
4
,
.
2
,
9
,
1
,
,
1
2
,
IM
N
G
R
E
S
O
E
N
1
2
3
1
2
.
5
3
1
3
.
5
8
6
,
9
7
IT
L
E
S
D
E
$
3
9
,
4
0
,
4
1
,
4
,
4
1
,
4
1
A
L
A
ZPT
O
S422335
Seleccin del promedio apropiado

Seleccin del promedio ms adecuado


La mediana siempre es la posicin central.
La moda se puede emplear cuando se requiere
una idea rpida de la tendencia central.
La ms usada es la media aritmtica.
La ms representativa para datos de una
distribucin asimtrica es la mediana.
Media valor de equilibrio de Magnitud .
Mediana valor de equilibrio de Cantidad.
Moda valor con mayor frecuencia.

Cuartiles, deciles y percentiles


(Fractiles o cuantiles)
Medidas de posicin.
Dividen en :
Cuatro (Qj)
Diez (Dj)
Cien (Pj)

Formulacin
semejante a la
mediana.

F j X jn F 0.5
DatosNoAgrupados
jn faA

i
F

F j Lij

f
ij

DatosAgrupados

Medidas de dispersin
Dispersin

Rango

Desviacin
Media

Varianza

Desviacin
Estandard

Coeficiente
de Variacin

Informacin sobre la
variabilidad de los
datos.
Mismo centro,
Diferente variacin

Rango o recorrido
R V . max V . min.
DatosNoAgrupados
R

Ls ( A) Li ( B)

DatosAgrupados

Diferencia entre el
valor mayor y el
valor menor de un
conjunto de datos.
No est afectado
por los valores
comprendidos
entre los extremos.

Rango o recorrido
Ventajas
fcil de calcular
fcil de entender e interpretar
Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni el valor
de estos

0 1 2 3 4 5 6 7 8 9 10 11 12

Rango = 14 - 1 = 13

13 14

Desviacin media
N

Media de los valores


absolutos de las
diferencias entre las
variables y la media.
Da una mejor
descripcin de la
dispersin que el rango.

Xi

DM i 1

N
DatosNoAgrupados
N

f i Xi

DM i 1

N
DatosAgrupados

Varianza
N

Media aritmtica de las


desviaciones cuadrticas
respecto a la media.
Expresada en unidades
al cuadrado.
n-1, factor de correccin.

i 1

Poblacion
n

xi x

S 2 i 1

Muestra

n1

Desviacin estndar
N

X i

i 1

Poblacion
n

xi x

i 1

Muestra

n1

Es la raz cuadrada
positiva de la varianza.
Unidades originales.
Permite medir el % de
elementos dentro de
intervalos de una curva
simtrica.
Puntaje estndar (Z).

Comparacin de Desviaciones Estndar


Datos A

11

12

Media = 15.5
s = 3.338

13

14

15

16

17

18

19

20 21

Datos B
Media = 15.5

11

12

13

14

15

16

17

18

19

20 21

s = .9258

Datos C
Media = 15.5

11

12

13

14

15

16

17

18

19

20 21

s = 4.57

Puntaje o Resultado Estndar (Z)

-3

-3

-2

-2

-1

-1

+1

+1

+2

+2

+3

+3

Interpretacin y usos de la Desviacin


Estndar
Regla Emprica, si la distribucin de
datos tiene forma acampanada,
entonces el intervalo:
1
contiene cerca 68% de los
valores en la poblacin o muestra.
68%

Interpretacin y usos de la Desviacin


Estndar
2contiene cerca 95% de los valores
en la
poblacin o muestra.
3contiene a casi todos (cerca
99.7%)
los valores de la
poblacin o
muestra.

95%

99.7%

Interpretacin y usos de la Desviacin


Estndar
34.13%
34.13%
13.60%

13.60%
2.135%

2.135%

0.135%

0.135%

-3

-2

-1

68.26%
95.46%
99.73%

+1

+2

+3

Coeficiente de variacin
Indica
la
magnitud
relativa de la desviacin
estndar con respecto a
la media aritmtica.
Comparacin
de
distribuciones.

CV *100

Poblacion
S
CV *100
x
Muestra

Coeficiente de variacin
CV

Grado de Variablidad
0 < CV < 10 Datos muy homogneos
Datos regularmente
10 CV < 15 homogneos
Datos regularmente
15 CV < 20 variables
20 CV < 25 Datos variables
Datos muy variables
CV 25

Medidas de Simetra y Curtosis


Evala como estn concentradas las observaciones.
Adems de la tendencia para agruparse alrededor de
ciertos valores y grados de dispersin.
Representatividad de los valores de tendencia y su
confiabilidad.
Coeficientes:
de Asimetra de Pearson
de Curtiosis

Coeficiente de Simetria y Curtosis de Fisher


Tercer momento
Simtrica
=0
Simetra
Asimetrica Positiva >
0
Asimetrica Negativa <
0

CuartoCurtosis
Momento
Mesocurtica = 0
Leptocurtica > 0
Platicurtica < 0

Sesgo de una distribucin

Coeficiente de Curtosis

K>0

K=0

K<0

Anlisis de Regresin Simple


Finalidad es establecer una relacin cuantitativa
(ecuacin de regresin) entre dos variables, y
estimar el valor de Y (dependiente) con base en un
valor de X (independiente).
Ecuacin de estimacin o de pronstico (Y) .
Regresin lineal simple
Una recta.

Y ' a bX

Y' 0 1 X

Anlisis de regresin simple


Mtodos : grfico y matemtico (mnimos
cuadrados).
Grfico
Diagrama de dispersin.
Trazar una recta que trate de unir los puntos.
Ventaja: simple y directo.
Desventaja: procedimiento subjetivo.

X31254
Y9571410

Anlisis de regresin simple


Mnimos cuadrados
Tcnica para encontrar la ecuacin de regresin
minimizando la suma de los cuadrados de las
distancias verticales entre los valores observados
y los estimados (recta) de Y.
Hallar los coeficientes de regresin a y b.
Ecuaciones Normales.

Y na b X ;
2
XY

a
X

b
X

a Y bX
XY nXY

b
2
2

n
X
X

Recta de regresin

Y
Valor
Efectivo

Y
Y=2.7+2.1X

Valor
Estimado

Anlisis de regresin simple


Error estndar de estimacin

Mide la disparidad (dispersin) promedio


entre los valores observados y los valores
estimados de Y.

S y .x

Y Y '

S y .x

n2
2

a ( Y ) b ( XY )
n2

Indicador del grado de precisin de la ecuacin.


No es la ms adecuada para medir relacin.

Coeficiente de correlacin (r)


Karl Pearson, 1900.
Mide el grado de asociacin o relacin lineal entre
las variables X e Y.
Sus valores van de -1 a +1.(correlacin negativa y
positiva perfecta).
Es el mismo signo de b.

XY nXY
2
2
2
2
( X nX )( Y nY )

Coeficiente de correlacin (r)


Medida de intensidad de la relacin entre dos conjuntos de variables.

Correlacin
Negativa
Perfecta

Ninguna
Correlacin
Correlacin
Negativa
Moderada

-1

Correlacin
Positiva
Perfecta

0.5
Correlacin negativa

Correlacin
Positiva
Moderada
0

0.5
Correlacin positiva

Coeficiente de correlacin (r)


Y

r = -1

r = -.6

r=0
Y

X
r = +1

X
r = +.3

X
r=0

Variaciones

Variacin
Total

Variacin no
Explicada

Variacin
Explicada

Coeficiente de determinacin (r2)


Proporcin de la variacin total en la variable
dependiente (Y) que se explica por o se debe a la
variacin de la variable independiente.
Puede adoptar valores entre 0 y 1.
Var. Explicada
2
r

Var. Total
r2

2
(
Y
'

Y
)

2
(
Y

Y
)

a Y b XY nY 2
2
2
Y

nY

Coeficiente de determinacin (r2)


Si r2 = 1 : Correlacin perfecta, es decir, toda
variacin de Y puede explicarse por X
Si r2 = 0 : No existe correlacin entre X e Y. La
variacin explicada es 0.
La variable X no explica nada de los cambios
en Y

0 r

Cuanto ms cerca a uno, las variables tendrn


mayor correlacin.

Anlisis de regresin simple


Una empresa dedicada a la produccin de cierto artculo
perecible ZZ desea evaluar la relacin existente entre la
distancia recorrida para transportar su producto a los
diferentes puntos de comercializacin y las mermas producidas
por dicho transporte. Con este fin, se lleva a cabo un estudio en
el que se observan, entre otras variables:
Y= porcentaje de carga til final (luego del transporte)
X= Distancia recorrida (decenas de kilmetros)
Y se encuentra en una muestra aleatoria de 12 viajes o
recorridos los siguientes resultados:
Carga til (y)

9
1

9
5

9
3

9
8

9
7

9
7

8
8

9
4

8
9

9
0

9
2

9
5

Distancia
Recorrida (x)

3
3

1
2

1
8

6
6

3
7

2
9

1
5

1
0

Con la finalidad de establecer medidas preventivas, Cul ser


el porcentaje de carga til para un futuro transporte de 250
km.?

Estadstica
Prof. Juan Narro Lavi
Diplomatura de Estudio
en
Gestin de Operaciones

Vous aimerez peut-être aussi