Vous êtes sur la page 1sur 30

Dnde estamos?

DESCRIPTIVA
DESCRIPTIVA
UNA VARIABLE CUALITATIVA
UNA VARIABLE CUANTITATIVA
DOS VARIABLES CUALITATIVAS
UNA V. CUALI. Y UNA V. CUANTI.
DOS VARIABLES CUANTITATIVAS

CLCULO
DE
PROBAB.

INFERENCIA

1981

Emilio Letn
Dpto. Estadstica, UC3M
Estadstica: E. Letn

YT: SBTC

Estadstica: E. Letn

YT: SBTC

Standing in the dark


Oh I was waiting for man to come
I am beautiful and clean

To cut a long story short


I lost my mind

To cut a long story short

Questions, questions
Give me no answers

Estadstica: E. Letn

Estadstica: E. Letn

Frentes abiertos

UNA VARIABLE CUALITATIVA


Frecuencias, moda
Grficos de barras, de tartas

Empezar
Llegar a las poblaciones

UNA VARIABLE CUANTITATIVA


DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
Estadstica: E. Letn

UNA VARIABLE CUALITATIVA

Frecuencias
1 (a)
2 (b)
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)

Estadsticos
vs. Parmetros
Grficos vs.
Grficos poblacionales
Florence
Nightingale
(1820-1910)
PORTRAITS HISTORY STATISTICS
Estadstica: E. Letn

Estadstica: E. Letn

Estadstica: E. Letn

fa

fr

faa

fra

0,7

0,7

0,1

0,8

0,2

10

1,0

Resumen: frecuencias

Moda
1 (a)
2 (b)
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)

Estadstica: E. Letn

Resumen: moda

fr

faa

fra

0,7

0,7

0,1

0,8

0,2

10

1,0

Estadstica: E. Letn

10

Grfico de barras
1 (a)
2 (b)
1 (a)
1 (a)
1 (a)
3 (c)
3 (c)
1 (a)
1 (a)
1 (a)

Estadstica: E. Letn

fa

11

Estadstica: E. Letn

fa

fr

faa

fra

0,7

0,7

0,1

0,8

0,2

10

1,0

12

Sin acumular

Acumulado
Barchart for Col_1

frequency

8
6
4
2
0
1

Estadstica: E. Letn

13

Simetra

Estadstica: E. Letn

Estadstica: E. Letn

14

Resumen: grfico de barras

15

Estadstica: E. Letn

16

Grfico de tartas

Resumen: grfico de tartas

Piechart for Col_1


20,00%

Col_1
1
2
3

10,00%

70,00%

Estadstica: E. Letn

17

UNA VARIABLE CUALITATIVA

Estadstica: E. Letn

18

UNA VARIABLE CUANTITATIVA

UNA VARIABLE CUANTITATIVA

Estadsticos
vs. Parmetros

Media, mn, mx, dt, cuartiles, CAS


Histograma, box-plot

Grficos vs.
Grficos poblacionales

DOS VARIABLES CUALITATIVAS


UNA V. CUANTI. Y UNA V. CUALI.

John Tukey
(1915-2000)

DOS VARIABLES CUANTITATIVAS


Estadstica: E. Letn

19

Estadstica: E. Letn

20

Media
1
4
5
5
5
6
6
6
7
10

Propiedades (1/3)

x =

xi

n i =1

1
4
5
5
5
6
6
6
7
10

x j fr (x j )
k

j =1

Estadstica: E. Letn

21

Propiedades (2/3)
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

Medida de centralizacin

Estadstica: E. Letn

22

Propiedades (3/3)
1
4
5
5
5
6
6
6
7
10

Unidades?

23

Estadstica: E. Letn

1
4
5
5
5
6
6
6
7
100

Sensible a atpicos?

24

Resumen: media

Mediana
1
4
5
5
5
6
6
6
7

Estadstica: E. Letn

25

Propiedades (1/3)
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

1
4
5
5
5
6
6
6
7
10

Estadstica: E. Letn

26

Propiedades (2/3)
1
4
5
5
5
6
6
6
7
10

Medida de centralizacin

27

Estadstica: E. Letn

Unidades?

28

Propiedades (3/3)
1
4
5
5
5
6
6
6
7
10

1
4
5
5
5
6
6
6
7
100

Resumen: mediana

Sensible a atpicos?

Estadstica: E. Letn

29

Mnimo, mximo y amplitud

30

Propiedades

1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

Estadstica: E. Letn

1
4
5
5
5
6
6
6
7
10
31

Estadstica: E. Letn

Medida de dispersin
Unidades?
Sensible a atpicos?

32

Resumen: min, mx, amplitud

Varianza
1
4
5
5
5
6
6
6
7
10

Estadstica: E. Letn

33

Origen (1/2)

1
1
1
1
1
10
10
10
10
10

Estadstica: E. Letn

34

Origen (2/2)

s2
s2n-1

Estadstica: E. Letn

1
2
3
4
5
6
7
8
9
10

35

D1 D2
D3
4,65 8,25 20,25
5,17 9,17 22,50

Estadstica: E. Letn

36

Propiedades (1/3)
1
4
5
5
5
6
6
6
7
10

Propiedades (2/3)
1
4
5
5
5
6
6
6
7
10

Medida de dispersin

Estadstica: E. Letn

37

Propiedades (3/3)
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

1
4
5
5
5
6
6
6
7
100

Unidades?

Estadstica: E. Letn

38

Resumen: varianza

Sensible a atpicos?

39

Estadstica: E. Letn

40

Desviacin tpica
1
4
5
5
5
6
6
6
7
10

1
2
3
4
5
6
7
8
9
10

Origen
1
1
1
1
1
10
10
10
10
10

Estadstica: E. Letn

s
sn-1

41

Propiedades
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

D1 D2 D3
2,16 2,87 4,50
2,27 3,03 4,74

Estadstica: E. Letn

42

Resumen: desviacin tpica


Medida de dispersin
Unidades?
Sensible a atpicos?

43

Estadstica: E. Letn

44

Desigualdad de Chebyshev (1/2)

Desigualdad de Chebyshev (2/2)

Alrededor de la media
muestral +/- k veces la dt
muestral hay al menos

Pafnuty
Chebyshev
(1821-1894)

k
1
1,5
2
3
4
10

1 2 %
k

Estadstica: E. Letn

45

Resumen: des. de Chebyshev

Estadstica: E. Letn

%min.obs.
0
55,6%
75,0%
88,9%
93,8%
96,0%

46

Cuartiles
1
4
5
5
5
6
6
6
7
10

Estadstica: E. Letn

47

Estadstica: E. Letn

48

Propiedades
1
4
5
5
5
6
6
6
7
10

Resumen: cuartiles
Medida de posicin
Unidades?
Sensible a atpicos?

Estadstica: E. Letn

49

Rango intercuartlico
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

1
2
3
4
5
6
7
8
9
10

Estadstica: E. Letn

50

Propiedades

1
1
1
1
1
10
10
10
10
10

1
4
5
5
5
6
6
6
7
10
51

Estadstica: E. Letn

Medida de dispersin
Unidades?
Sensible a atpicos?

52

Resumen: rango intercuartlico

Deciles y percentiles

1
(x + x (i +1) ) , f = 0
PP = 2 (i )
x (i +1) , f > 0

i = [np ]

Estadstica: E. Letn

53

Propiedades
1
4
5
5
5
6
6
6
7
10
Estadstica: E. Letn

f = np [np ]

Estadstica: E. Letn

54

Resumen: deciles y percentiles


Medida de localizacin
Unidades?
Sensible a atpicos?

55

Estadstica: E. Letn

56

Coeficiente de asimetra
4
5
9

Origen (1/3)

(
xi x )

n i =1
=
1

Puede haber dos conjuntos de


datos, de igual tamao, con todos
los valores distintos entre s, con
igual media y con igual dt?

(
xi x )

n i =1
1

3
7

s
Estadstica: E. Letn

57

Origen (2/3)

Estadstica: E. Letn

s3

Estadstica: E. Letn

=
58

Origen (3/3)

(
xi x )

n i =1
1

CAS =

= CAS

59

Estadstica: E. Letn

(x i x )
n

n
i =1
(n 1)(n 2)
s3

60

Propiedades (1/3)
1
4
5
5
5
6
6
6
7
10

Propiedades (2/3)

Medida de simetra

Simetra implica
CAS=0

Unidades?

Simetra implica que media=mediana

Sensible a atpicos?

media=mediana no implica simetra

Estadstica: E. Letn

61

Propiedades (3/3)
CAS>0

Estadstica: E. Letn

CAS=0 no implica
simetra

Estadstica: E. Letn

62

Resumen: coeficiente de asimetra


CAS<0

63

Estadstica: E. Letn

64

Des. Cheb. (sim. y unimodal) (1/2)

Des. Cheb. (sim. y unimodal) (2/2)

Alrededor de la media muestral +/- k


veces la dt muestral hay al menos

%min.obs. %min.obs.
(sim+unim)
0
1
55,6%
55,6%
1,5
80,2%
75,0%
2
88,9%
88,9%
3
95,1%
93,8%
4
97,2%
96,0%
10
99,6%
k

4 /9

1 2 %
k

Estadstica: E. Letn

65

Resumen: des. Che. (sim. y unim.)

Estadstica: E. Letn

66

Coeficiente de apuntamiento
Puede haber dos conjuntos
de datos, de igual tamao, con
todos los valores distintos
entre s, con igual media, con
igual dt y con igual CAS?

Estadstica: E. Letn

67

Estadstica: E. Letn

68

Origen

Propiedades (1/2)

(
xi x )

n i =1
1

1
4
5
5
5
6
6
6
7
10

s4

3 = CAP

Estadstica: E. Letn

69

Propiedades (2/2)
CAP<0
platicrtica

Estadstica: E. Letn

CAP=0
mesocrtica

Medida de apuntamiento
Unidades?
Sensible a atpicos?

Estadstica: E. Letn

70

Resumen: coeficiente de apuntam.


CAP>0
leptocrtica

71

Estadstica: E. Letn

72

Otros estadsticos

Resumen: otros estadsticos

MEDA = Mediana x i x med


CV =

s
x

x
CSR =
s
Estadstica: E. Letn

73

Histograma

Estadstica: E. Letn

Estadstica: E. Letn

74

Sin acumular

75

Estadstica: E. Letn

76

Acumulado

Estadstica: E. Letn

Simetra

77

Resumen: histograma

Estadstica: E. Letn

Estadstica: E. Letn

78

Polgono de frecuencias

79

Estadstica: E. Letn

80

Sin acumular

Estadstica: E. Letn

Acumulado

81

Resumen: polgono de frecuencias

Estadstica: E. Letn

82

Box-Plot
John Tukey
(1977)
BOX-PLOT WIKIPEDIA

Estadstica: E. Letn

83

Estadstica: E. Letn

84

Sin datos atpicos

Con datos atpicos

Box-and-Whisker Plot

150

160

170

180

190

Box-and-Whisker Plot

120

200

160

180

200

MB_descargados

MB

Estadstica: E. Letn

140

85

Estadstica: E. Letn

86

UNA VARIABLE CUALITATIVA

Resumen: box-plot

UNA VARIABLE CUANTITATIVA


DOS VARIABLES CUALITATIVAS
Tabla de contingencia
Grfico de bloques
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
Estadstica: E. Letn

87

Estadstica: E. Letn

88

DOS VARIABLES CUALITATIVAS


x1
1
1
1
1
2
2
2
2
2
2

x2
1
2
3
2
2
3
3
1
1
1

Estadstica: E. Letn

Tabla de contingencia
x1
1
1
1
1
2
2
2
2
2
2

Estadsticos
vs. Parmetros
Grficos vs.
Grficos poblacionales

89

Elementos

x2
1
2
3
2
2
3
3
1
1
1

Estadstica: E. Letn

90

Notacin
Var 1=x

Var
2=y

Niv1
Niv2

Niv r

Estadstica: E. Letn

91

Estadstica: E. Letn

Cat1
n11
n21

Cat 2
n12
n22

Cat c
n1c
n2c

r1
r2

nr1
c1

nr2
c2


nrc
cc

rr
n

92

Independencia (1/2)

Independencia (2/2)

fr (y j x i ) = fr (y j )fr (x i )

fr (y j | x i ) = fr (y j )
ind .

n ji fr (y j x i )
fr (y j | x i ) =
=
ci
fr (x i )

n ji r j c i
rjci
=

n ji =
n
n n
n

= fr (y j )

ind .

Estadstica: E. Letn

93

Resumen: tabla de contingencia

Estadstica: E. Letn

Estadstica: E. Letn

94

Grfico de bloques

95

Estadstica: E. Letn

96

UNA VARIABLE CUALITATIVA

Resumen: grfico de bloques

UNA VARIABLE CUANTITATIVA


DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
Estadsticos por grupo
Grficos por grupo
DOS VARIABLES CUANTITATIVAS
Estadstica: E. Letn

97

UNA V. CUALI. Y UNA V. CUANTI.


x1
1
1
1
1
2
2
2
2
2
2
Estadstica: E. Letn

x2
12
21
33
21
21
31
32
15
17
18

Estadstica: E. Letn

98

Estadsticos por grupo

Estadsticos por grupos


Grficos por grupos

99

Estadstica: E. Letn

100

Resumen: estadsticos por grupo

Grficos por grupo


Box-and-Whisker Plot
80

fim_ini

70
60
50
40
30
1

sociales

Estadstica: E. Letn

101

Estadstica: E. Letn

102

UNA VARIABLE CUALITATIVA

Resumen: grficos por grupo

UNA VARIABLE CUANTITATIVA


DOS VARIABLES CUALITATIVAS
UNA V. CUANTI. Y UNA V. CUALI.
DOS VARIABLES CUANTITATIVAS
Covarianza, correlacin
Diagrama de dispersin
Estadstica: E. Letn

103

Estadstica: E. Letn

104

DOS VARIABLES CUANTITATIVAS


x
2
6
1
5
7
7
1
3
4
5

y
1
10
1
5
14
13
3
1
7
6

Covarianza
x
2
6
1
5
7
7
1
3
4
5

Estadsticos
Grficos

Pearson
(1857-1936)

Estadstica: E. Letn

105

Origen (1/2)

s xy =

Estadstica: E. Letn

Estadstica: E. Letn

106

Origen (2/2)

(
x i x )(y i y )

n i =1
1

y
1
10
1
5
14
13
3
1
7
6

sxy

107

Estadstica: E. Letn

)(

1 n
=
xi x yi y

n 1 i =1

108

Propiedades

Resumen: covarianza

Medida de variabilidad conjunta


Unidades?

Estadstica: E. Letn

109

Correlacin
x
2
6
1
5
7
7
1
3
4
5
Estadstica: E. Letn

y
1
10
1
5
14
13
3
1
7
6

Estadstica: E. Letn

110

Propiedades

s xy
sxy
=
= 0,9
r =
s x s y sx sy

Medida de variabilidad conjunta


Unidades?
Rango de valores?

r = 81%

=0?

111

Estadstica: E. Letn

112

Resumen: correlacin

Grfico de dispersin
x
2
6
1
5
7
7
1
3
4
5

Estadstica: E. Letn

113

Tipos (1/2)

Estadstica: E. Letn

114

Tipos (2/2)
x
-4
-3
-2
-1
0
1
2
3
4

Estadstica: E. Letn

y
1
10
1
5
14
13
3
1
7
6

115

Estadstica: E. Letn

y
16
9
4
1
0
1
4
9
16

116

Resumen: grfico de dispersin

Causalidad
x
2
6
8
7
0
1
2
2
3

Estadstica: E. Letn

117

Resumen: causalidad

y
4
20
60
30
7
6
14
20
18

r = 0,846

Estadstica: E. Letn

118

Webgrafa: web de la asignatura

Software; Prcticas; ABP; Autoevaluacin;


Ejercicios; Mini-Vdeos; CPC; Tutoras; Webgrafa
Estadstica: E. Letn

119

Estadstica: E. Letn

120

Vous aimerez peut-être aussi