Vous êtes sur la page 1sur 64

ndice

Clase #1 ESTADSTICA.......................................................................................... 5
1.1-

Concepto de estadstica................................................................................. 5

1.2-

Tipos de Estadstica: estadstica descriptiva y estadstica inductiva............................5

1.3-

Poblacin y muestra..................................................................................... 5

1.4-

Ejemplo de poblacin y muestra......................................................................5

1.5

Variables estadsticas: Variables cuantitativas y variables cualitativas.........................5

Clase #2 CARACTERIZACIN DE VARIABLE CUANTITATIVA...................................6


2.1- Introduccin................................................................................................... 6
2.2- Diagramas de tallo y hojas................................................................................. 6
2.3- Ejemplos de uso de diagramas de tallo y hojas.........................................................6
2.1- Introduccin a las variables cuantitativas...............................................................6
Clase #3 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin)...................8
3.1-

Ejercicios de Diagramas de Tallo y Hojas...........................................................8

3.2-

Grficos de series de tiempo........................................................................... 8

3.3-

Ejemplos de Grficos de series de tiempo...........................................................8

Clase #4 REPASO PARA EXAMEN.........................................................................10


Clase #5 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin)...............11
5.1-

Qu es una distribucin de frecuencia?...........................................................11

5.2-

Construccin de una distribucin de frecuencias.................................................11

5.3-

Construccin de tabla de Frecuencia...............................................................11

5.4-

Ejemplos de Construccin de tabla de Frecuencia...............................................11

Clase #6 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin)..............13


6.1- Concepto de frecuencias.................................................................................. 13
6.2- Tipos de frecuencia........................................................................................ 13
6.3- Distribucin de frecuencias aplicado al ejemplo de los automviles............................13
6.4- Interpretacin de los tipos de frecuencias.............................................................13
Clase #7 EJERCICIOS DE CARACTERIZACIN DE VARIABLE CUANTITATIVA..........15
Clase #8 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin)..............17
8.1- Histogramas de Frecuencias............................................................................. 17
8.2- Ejemplo de Histogramas de Frecuencias..............................................................17
8.3- Polgonos de Frecuencias................................................................................. 17
8.4- Ejemplo de Histogramas de Frecuencias..............................................................17
1

8.5- Construccin de Histogramas de frecuencia y Polgonos de frecuencia en word..............17


8.6- TAREA EVALUATIVA #3............................................................................... 17
Clase #9 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin)..............20
9.1- Medidas de localizacin.................................................................................. 20
9.2- Medidas de la tendencia central.........................................................................20
9.3- Media Aritmtica........................................................................................... 20
9.4- Mediana. Caso1............................................................................................ 20
9.5- TAREA EVALUATIVA #4............................................................................... 20
Clase #10 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............22
10.1- Mediana. Caso2........................................................................................... 22
10.2- Moda........................................................................................................ 22
10.3- TAREA EVALUATIVA #5............................................................................. 22
Clase #11 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............24
11.1- Medidas de Posicin..................................................................................... 24
11.2- Cuartiles.................................................................................................... 24
11.3- Cmo calcular los cuartiles?............................................................................24
11.4- Ejemplo de clculo de cuartiles........................................................................24
Clase #12 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............26
12.1- Medidas de Dispersin.................................................................................. 26
12.2- El Rango................................................................................................... 26
12.3- La Varianza................................................................................................ 26
12.4- Ejemplo de clculo de varianza........................................................................26
12.5- Desviacin estndar...................................................................................... 26
12.6- TAREA EVALUATIVA #7............................................................................. 26
Clase #13 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............29
13.1- Anlisis de datos usando la herramienta Excel.....................................................29
13.3- TAREA EVALUATIVA #8............................................................................. 29
Clase #14 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............34
14.1- Diagramas de Cajas...................................................................................... 34
14.2- Construccin de un diagrama de cajas...............................................................34
Clase #15 CARACTERIZACIN DE VARIABLE CUANTITATIVA (continuacin).............36
15.1- Ejemplo de Construccin de un diagrama de cajas................................................36
15.2- TAREA EVALUATIVA #10............................................................................36
2

Clase #16 CARACTERIZACIN DE VARIABLE CUALITATIVA..................................39


16.1- Caracterizacin de una variable cualitativa..........................................................39
16.2- Tablas....................................................................................................... 39
16.3- Ejemplo de Elaboracin de Tablas....................................................................39
Clase #17 CARACTERIZACIN DE VARIABLE CUALITATIVA (continuacin)...............41
17.1- La moda.................................................................................................... 41
17.2- Ejemplo de obtencin de la moda.....................................................................41
17.3- Grficos.................................................................................................... 41
17.4- Cmo crear un histograma en Excel?.................................................................41
17.5- Cmo crear un diagrama circular en Excel?.........................................................41
17.6- Ejemplo de Diagrama Circular........................................................................41
CLASE #18 CARACTERIZACIN DE VARIABLES CUALITATIVAS USANDO LA
HERRAMIENTA EXCEL........................................................................................ 45
18.1-

Creacin de Histogramas..........................................................................45

18.2-

Creacin de Diagramas Circulares en Excel...................................................45

18.1-

Creacin de Histogramas..........................................................................45

El histograma ser creado a partir del ejemplo tratado en la clase anterior...........................45


CLASE #19

CARACTERIZACIN DE VARIABLES CUALITATIVAS............................49

19.1- Tablas de Contingencia.................................................................................. 49


19.2- Ejemplo1 de Tablas de Contingencia................................................................49
19.3- Ejemplo2 de Tablas de Contingencia.................................................................49
19.4- Separacin de la Tablas de Contingencia en dos Tablas de frecuencias relativas totales.. .49
19.5- TAREA EVALUATIVA # 10...........................................................................49

Clase #1

ESTADSTICA

1.1- Concepto de estadstica


1.2- Tipos de Estadstica: estadstica descriptiva y estadstica inductiva
1.3- Poblacin y muestra
1.4- Ejemplo de poblacin y muestra
1.5 Variables estadsticas: Variables cuantitativas y variables cualitativas
1.1- Concepto de Estadstica
La estadstica es la ciencia de recolectar, describir e interpretar datos.
1.2- Estadstica se divide en 2 grandes rasgos y reas:
1.2.1- Estadstica Descriptiva: Organizacin, sntesis y descripcin de datos.
1.2.2- Estadstica Inductiva: Objetivo de estudio es una muestra, es una conclusin que puede
inferirse para una poblacin, a la cual pertenece esa muestra.
1.3- Poblacin y muestra
Poblacin: Conjunto formado por un grupo de individuos o elementos, bien definidos sobre
los cuales, se pretende estudiar alguna caracterstica.
Muestra: Es una parte o subconjunto de la poblacin que se selecciona para ser encuestada,
en los casos en que la poblacin es muy numerosa (debe ser representativa (un nmero
razonable) y aleatoria (debe ser escogida al azar)).
1.4- Ejemplo de poblacin y muestra
1- Se desea establecer la efectividad de un medicamento en un paciente con tensin alta.
Poblacin: Personas que tienen problema de tensin alta.
Muestra: Historias clnicas de los pacientes, ordenadas por fecha de
nacimiento.
1.5- Variables estadsticas
Variable: Es una caracterstica que va a ser estudiada en una poblacin.
Estadstica: Puede responder a una pregunta, cuyas respuestas puedan ser tabuladas o
clasificadas dentro de determinados rangos.
Variable cuantitativa: Cuando el contenido de la variable es medible numricamente
- Si toma valores enteros, es una variable discreta.
- Si toma valores reales, es una variable continua
Variable cualitativa: En el estudio para que ella se utiliza se busca definir, gustos,
preferencias u opiniones.
Ejemplo: Se desea conocer el apoyo ciudadano a una medida del congreso:
Variable se puede dividir en:
.Totalmente de acuerdo

.Parcialmente de acuerdo

.En desacuerdo

.No sabe o no responde

Clase #2

CARACTERIZACIN DE VARIABLE CUANTITATIVA

2.1- Introduccin
2.2- Diagramas de tallo y hojas
2.3- Ejemplos de uso de diagramas de tallo y hojas
2.1- Introduccin a las variables cuantitativas
En la clase anterior se defini el concepto de variable cuantitativa como variable donde el
contenido de la variable es medible numricamente:
-

Si toma valores enteros, es una variable discreta.


Si toma valores reales, es una variable continua

En las siguientes clases se van a estudiar formas de organizar las variables cuantitativas, para un
estudio ms favorable, estos mtodos son:

Diagrama de Tallo y Hojas


Grficos de serie de tiempo
Distribucin de frecuencias

2.2- Este diagrama se usa como anlisis de informacin.


Diagrama de tallo y hojas
La tcnica del diagrama de tallo y hoja, consiste en dividir los valores numricos
correspondiente a una determinada variable estadstica, en una parte llamada tallo que ser el
primer o primeros dgitos y otra parte llamada hojas que estar formada por los dgitos restantes
(dependiendo del nmero que dgitos que tengan la muestra: si tiene 2 las decenas es el tallo y
las unidades las hojas; si tiene 3, centenas y decenas representan el tallo y unidades las hojas).
Caracterizacin de variables cuantitativas
2.3- Ejemplo: Elabore un diagrama de tallo y hojas para los datos presentados.
Los siguientes, son los datos recogidos al preguntar por el tiempo que tardaron 30 estudiantes
en desplazarse de la casa al colegio en el primer da de clases.
30 11 27 23 28 36 37 39 37 27 19 37 40 13 22 21 19 37 31 21 34 21 20 24
Solucin:
Se observa que todos los tiempos estn en decenas: 10, 20, 30, 40
Tallo primer dgito
Hoja segundo dgito
30 tallo 3 y hoja 0
Se coloca primero el tallo y luego la hoja.
Al realizar ese procedimiento quedara:
1
2
3

1
7
0

9
3
6

3
8
7

9
7
9

2
7

1
7

1
7

1
1

0
4

4
9
6

Conclusin que los tiempos empleados por la mayora de los estudiantes estn entre 20 y 30
minutos

Clase #3 CARACTERIZACIN DE VARIABLE CUANTITATIVA


(continuacin)
3.1- Ejercicios de Diagramas de Tallo y Hojas
3.2- Grficos de series de tiempo
3.3- Ejemplos de Grficos de series de tiempo
3.1- Ejercicios de Diagramas de Tallo y Hojas.
Elaborar un diagrama de tallo y hojas para la siguiente situacin.
Hank Aaron y Babe Ruth fueron dos grandes jugadores de beisbol. Su habilidad para conectar home
runs los ha hecho famosos en la historia de este deporte. A continuacin los jonrones que conect
cada jugador en las temporadas de ligas mayores que particip.
a) Quin hizo ms jonrones por temporada?
Aaron
13, 44, 27, 39, 36, 29, 44, 44, 30, 38, 39, 37, 45,
20, 44, 12, 24, 10, 32, 34, 30, 34, 40

Ruth
11, 54, 29, 49, 54, 49, 59, 46, 35, 41, 41, 34, 46,
22, 25, 47, 60

3.2- Grficos de series de tiempo


Los grficos que permiten visualizar el comportamiento de una variable que se mide con respecto a
un perodo de tiempo, se denominan series de tiempo.
3.3- Ejemplo de Grficos de serie de tiempo
Elaborar una serie de tiempo para la siguiente situacin.
Los datos corresponden a las ventas, en miles de pesos de una estacin de gasolina, ubicada en el
centro de la ciudad, durante el mes de diciembre del ao 2002. Ubicar en el eje horizontal el da del
mes y en el eje vertical su correspondiente venta.
a) En qu momento del mes caen las ventas?
b) En qu momento del mes las ventas presentan un comportamiento similar?
8

Domingo
1
49.83
8
51.482
15
39.275
22
48.114
29
89.431

Lunes
2
31.544
9
81.111
16
26.111
23
84.170
30
41.657

Martes
3
63.771
10
34.008
17
43.528
24
55.291
31
86.86

Mircoles
4
83.442
11
40.927
18
25
52.7

Jueves
5
82.5
12
27.956
19
60.986
26
44.754

Vienes
6
87.3
13
27.105
20
48.229
27
88.421

Sbado
7
25.942
14
35.668
21
49.169
28
77.433

Clase #4

REPASO PARA EXAMEN

10

Clase #5 CARACTERIZACIN DE VARIABLE CUANTITATIVA


(continuacin)
5.1- Qu es una distribucin de frecuencia?
5.2- Construccin de una distribucin de frecuencias
5.3- Construccin de tabla de Frecuencia
5.4- Ejemplos de Construccin de tabla de Frecuencia
5.1- Qu es una distribucin de frecuencia?
Una distribucin de frecuencias es un resumen de una lista de datos y puede considerarse como un
criterio de agrupacin de los datos. Este criterio de agrupacin permite visualizar los datos de una
manera reducida y clara.
5.2- Construccin de una distribucin de frecuencias se realizan los siguientes pasos:

Encontrar el rango de la distribucin: El rango de una distribucin, es la medida que


determina su longitud. Se obtiene restando el dato mayor D M del dato meno Dm
Rango = DM Dm
Determinar el nmero de intervalos. El nmero de intervalos puede ser definido por la
persona que realiza el estudio de acuerdo con la naturaleza de los datos, sin embargo, una
buena aproximacin a este nmero se hace calculando la raz cuadrada del nmero de datos
en la muestra.
No. de intervalos = (n)1/2
1/2
Si el valor de (n) no es un nmero entero, este nmero se aproxima al entero ms
cercano.
Definir el tamao del intervalo. Para definir el tamao de cada intervalo, basta con dividir
el rango obtenido entre el nmero aproximado de intervalos.
Tamao del intervalo = Rango / No. de intervalos

5.3- Construccin de Tabla de Frecuencia


Despus de definir los valores anteriores, se construye la tabla de frecuencias. Donde se ubican los
intervalos y el nmero de datos contenidos en cada uno de ellos. Hay que garantizar que cada dato
se incluya en solo un intervalo.
5.4- Ejemplos de Construccin de Tabla de Frecuencia
Ejemplo: Las velocidades en Kilmetros por hora, de 55 automviles fueron medidas con radar en
una calle de cierta ciudad. Los datos recogidos fueron los siguientes:
27 23 22 38 43 24 35 26 28 18 20 25 23 22 52 31 30 45 45 29 27 43 29 28 27 25 29 24 24 37 28 29
18 26 33 25 27 25 34 32 36 22 32 33 21 23 24 18 48 23 16 38 26 21 23
1ro. Determinar el rango
Se resta del dato mayor el dato menor:
Rango = DM Dm = 52 16 = 36
11

2do. Determinar el nmero de intervalos


No. de intervalos = (55)1/2 = 7.41 = 7
3ro. Determinar el tamao del intervalo
Tamao del intervalo = 36 /7 = 5.14 = 5
4to. Construccin de intervalos

Primer intervalo se usa el dato menor = Lmite Inferior


Se suma el tamao del intervalo + Lmite Inferior = Lmite Superior
Se suma 1 + Lmite Superior = Lmite inferior
Lmite inferior
16
21 + 1 = 22
27 + 1 = 28
33 + 1 = 34
39 + 1 = 40
45 + 1 = 46
51 + 1 = 52

Lmite Superior
16 + 5 = 21
22 + 5 = 27
28 + 5 = 33
34 + 5 = 39
40 + 5 = 45
46 + 5 = 51
52 + 5 = 57

Intervalo
16 21
22 27
28 33
34 39
40 45
46 51
52 57

12

Clase #6

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
6.1- Concepto de frecuencias
6.2- Tipos de frecuencia
6.3- Distribucin de frecuencias aplicado al ejemplo de los automviles
6.4- Interpretacin de los tipos de frecuencias
6.5- TAREA EVALUATIVA #1
6.1- Conceptos de frecuencias
La frecuencia f, de un intervalo, es la cantidad de datos que estn contenidos en ese intervalo.
6.2- Tipos de frecuencias

Frecuencia relativa (fr): Es el cociente entre la frecuencia y el tamao de la muestra f r = f/n


Frecuencia acumulada (F) de un intervalo: Es la sumatoria de la frecuencia de los intervalos
anteriores y la frecuencia del intervalo.
Frecuencia relativa acumulada (Fr): Cociente entre la frecuencia acumulada y el tamao de
la muestra Fr = F/n

6.3- La distribucin de frecuencias para ejemplo de las velocidades de los automviles


Intervalo
16 - 21
22-27
28 - 33
34 39
40 - 45
46 51
52 - 57
Totales

F
7
23
13
6
4
1
1
55

fr
7/55 = 0,127
0,418
0,236
0,109
0,072
0,018
0,018

F
7
30
43
49
53
54
55

Fr
7/55 = 0,127
0,545
0,781
0,89
0,963
0,981
1

6.4- Interpretacin de los tipos de frecuencias


La frecuencia relativa y relativa acumulada se puede considerar como la proporcin de datos que se
encuentran en cada intervalo.

Si la frecuencia relativa se multiplica por 100 se obtiene el porcentaje de datos ubicados en


ese intervalo.
Intervalo 16 -21 fr = 0,127
fr*100 = 12,7 % Que representa que en el Intervalo 16 -21 se encuentran acumulados el
12,7% de los autos que pasaron por el lugar.

13

Si la frecuencia acumulada se multiplica por 100 se obtiene el porcentaje de datos totales


ubicados hasta ese intervalo.
Intervalo 22 27 F = 30
Fr = 0,545
Fr*100 = 54,5 % Que representa que en el Intervalo 16 -21 y el Intervalo 22 27 se
encuentran acumulados el 54,5% de los autos que pasaron por el lugar.

6.5- TAREA EVALUATIVA #1


La siguiente informacin, corresponde al nmero de pacientes atendidos en una sala de urgencias el
pasado mes de febrero
Domingo

Lunes

Martes

Mircoles

Jueves

Viernes

Sbado
1
15

21

10

17

16

10

11

12

13

14

15

21

25

32

16

28

17

16

17

18

19

20

21

22

20

12

15

12

32

15

23

24

25

26

27

28

12

14

18

29

22

10

a) Construir un grfico de serie de tiempo.


b) Cules son las conclusiones que se pueden obtener de esos datos?

14

Clase #7 EJERCICIOS DE CARACTERIZACIN DE VARIABLE


CUANTITATIVA
7.1- TAREA EVALUATIVA #2

1- Las siguientes cantidades son tarifas, en miles de pesos, que una empresa de mensajera
cobr por entregar paquetes pequeos la tarde del jueves pasado.
4,03
4,07
3,59

3,87
6,04
7,86

4,02
3,62
2,93

4,57
3,89
3,70

4,63
5,02
4,15

3,82
5,46
3,10

4,30
5,24
4,91

a) Elaborar un diagrama de tallo y hojas.


b) Construir una distribucin de frecuencias.
2- A continuacin se proporcionan las edades de 50 bailarines que asistieron a una audicin
para participar en una comedia musical.
21
21
18
20
20

22
21
19
22
21

18
19
22
20
22

23
20
24
20
19

19
19
24
20
19

19
20
19
19
21

21
19
19
21
18

21
21
20
19
21

22
19
19
19
20

21
21
20
19
17

a) Elaborar una distribucin de frecuencia donde los intervalos sean:


17 aos 18 aos
19 aos
20 aos
21 aos
Ms de 21 aos
b) Explicar por qu, en este caso, no es conveniente aplicar los mtodos de construccin de
distribuciones expuestos.
c) Es posible realizar un diagrama de tallo y hojas para este ejemplo?Por qu?
d) Determinar el porcentaje de bailarines menores de 21 aos y el porcentaje de bailarines
entre 19 y 21 aos.
7.1- TAREA EVALUATIVA #2
Para una investigacin se midi la estatura en centmetros de 35 mujeres y 35 hombres. Los
datos son los siguientes:

Hombres
15

172
174
166
171
156
167
169
152
160
154
169
171

159
157
167
179
152
153
159
174
159
168
159
155

171
155
174
158
157
Mujeres
178
146 136 148
170
138 140 144
154
153 142 164
153
162 136 159
163
162 144 165
180
164 145 143
135 152 164
147 146 137
161 146 159
142 162 164
139 146 159
136 149

a) Elaborar un
diagrama de tallo y hojas para cada muestra.
b) Comparar
los diagramas anteriores y elaborar una conclusin con
respecto a
los datos.
c) Construir
una distribucin de frecuencias para la estatura de los
hombres y una distribucin de frecuencias para las estaturas de las mujeres.

16

Clase #8

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
8.1- Histogramas de Frecuencias
8.2- Ejemplo de Histogramas de Frecuencias
8.3- Polgonos de Frecuencias
8.4- Ejemplo de Histogramas de Frecuencias
8.5- Construccin de Histogramas de frecuencia y Polgonos de frecuencia en word
8.6- TAREA EVALUATIVA #3

8.1- Histogramas de Frecuencias


Un histograma de frecuencias, es un grfico de barras ubicado en el plano cartesiano, en el cual, el
eje horizontal corresponde a los intervalos y el eje vertical a las frecuencias.
8.2- Ejemplo de Histogramas de Frecuencias
Ejemplo:
La Tabla de Frecuencias corresponde a los puntajes totales obtenidos por 50 estudiantes, en el
examen de Estado del ao 2002, en un colegio de Bogot. Se tiene el siguiente histograma de
frecuencias relativas:
Intervalo
40 50
50 60
60 70
70 80
80 90
90 100

0.45

fr
0,127
0,418
0,236
0,109
0,072
0,018

0.42

0.4
0.35
40-50

0.3

50-60

0.24

0.25

60-70

0.2
0.15

70-80
0.13

0.1

90-100

0.07

0.05
0

80-90

0.11
0.02
Clase

17

8.3- Polgonos de Frecuencias


El polgono de frecuencias, es una representacin lineal del histograma, en la cual se describe el
comportamiento de la variable entre los intervalos.
Para construir un polgono de frecuencias, se ubica en el eje horizontal el punto medio de cada
intervalo. Luego, en el eje vertical, se ubican las frecuencias obtenidas en la tabla.
Para que la grfica que se construye corresponda a un polgono, es necesario construir una clase, o
intervalo anterior al primer intervalo y un intervalo posterior al ltimo. A estos intervalos se les
asigna frecuencia cero.

8.4- Ejemplo de Histogramas de Frecuencias

Para el ejemplo del histograma anterior, se genera el siguiente polgono de frecuencias

Intervalo
30 40
40 50
50 60
60 70
70 80
80 90
90 100
100 110

Punto medio
35
45
55
65
75
85
95
105

fr
0
0,127
0,418
0,236
0,109
0,072
0,018
0

18

Porcentajes obtenidos por 50 estudiantes en el Examen de Estado, 2002


0.45
0.4
0.35
0.3
0.25

Serie 1

0.2
0.15
0.1
0.05
0
35

45

55

65

75

85

95

105

8.5- Construccin de Histogramas de frecuencia y Polgonos de frecuencia en word

Paso
1

Polgon

19

8.6- TAREA EVALUATIVA #3


1- Desarrollar los siguientes incisos a partir de los siguientes datos, apoyndose en el ejercicio 1 de
la clase anterior
1- Las siguientes cantidades son tarifas, en miles de pesos, que una empresa de mensajera
cobr por entregar paquetes pequeos la tarde del jueves pasado.
4,03
4,07
3,59

3,87
6,04
7,86

4,02
3,62
2,93

4,57
3,89
3,70

4,63
5,02
4,15

3,82
5,46
3,10

4,30
5,24
4,91

a) Construir un histograma de frecuencias relativas para las tarifa de la empresa de mensajera


(Construya el diagrama en word).

20

Clase #9

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
9.1- Medidas de localizacin
9.2- Medidas de la tendencia central
9.3- Media Aritmtica
9.4- Mediana. Caso1
9.5- TAREA EVALUATIVA #4
9.1- Medidas de localizacin
Una vez se han determinado los mtodos grficos y tabulares para resumir la informacin de un
conjunto de datos, es importante construir algunas medidas numricas que proporcionen un
resumen y suministren conclusiones acerca de las caractersticas de la variable que se est
considerando.
Dichas medidas dependen de la localizacin de los datos y se considerarn de dos tipos: medidas de
tendencia central y medidas de posicin.
9.2- Medidas de la tendencia central
Las medidas de tendencia central, pretenden encontrar un punto centro o punto de acumulacin de
datos. Las principales medidas de tendencia central son: el promedio aritmtico o media, la mediana
y la moda. Es importante destacar que para el caso de las variables cuantitativas, solo se estudian la
media y la mediana.
9.3- Media Aritmtica
La media de un conjunto de datos es el promedio aritmtico de ellos. Generalmente se nota por

X
Si

x 1 , x 2 , , x n es un conjunto de datos, entonces:


n

xi

X = i=1 =
n

x 1 + x 2+ + x n
n

La media se interpreta como el individuo o dato tpico de un grupo, y se puede considerar como el
dato que mejor representa al conjunto.
La media se considera una medida sensible a las observaciones puesto que si uno de los datos es
muy alto o muy bajo con respecto a los otros el promedio se ve afectado de una forma importante.
Ejemplo:
El siguiente dato corresponde a las edades de 7 estudiantes:
21

x1 = 14, x2 = 14, x3 = 15, x4 = 15, x5 = 15, x6 = 16, x7 = 17


a) Calcule la media aritmtica
n

xi x + x + x + x + x + x + x
X = i=1 = 1 2 3 4 5 6 7 = 14+ 14+15+15+16 +17
n
7
7
X =15,2857

9.4- Mediana
La mediana es el dato que divide un conjunto de datos en dos partes porcentuales iguales. Es notada

~
X .

como

Para calcular la mediana es necesario ordenar el conjunto de datos de menor a mayor,

x 1 x2 x 3 x n

y ubicar el punto o valor que est en el centro de ellos. Se tienen dos casos:

Caso 1.
Si el nmero de datos n es impar.

~
X=x

n +1
)
2

Representa luego de ordenar los datos de mayor a menor, el valor situado en la mitad de los datos.
Ejemplo: (En este ejemplo ya los datos se encuentran ordenados de mayor a menor)
El siguiente dato corresponde a las edades de 7 estudiantes:
x1 = 14, x2 = 14, x3 = 15, x4 = 15, x5 = 15, x6 = 16, x7 = 17
b) Calcule la mediana
El nmero de estudiantes es 7, que representa un nmero impar

~
X=x

=x

=x 4 =15

( n+12 ) (7 +12 )

Conclusiones del ejemplo:

22

El 50% de los estudiantes tiene edades iguales o superiores a 15 aos y el otro 50% tiene edades
iguales o inferiores a 15 aos.
9.5- TAREA EVALUATIVA #4

1- Las siguientes son las edades de 31 trabajadores de una empresa floricultora de la sabana de
Bogot.
22 20 20 19 21 20 18 27 23 19 21 19 30 20 21 55 29 27 20 21 22 20 22 24 17 18 20 21 22
22 23
a) Encontrar la media y la mediana de las edades de los trabajadores.
b) Calcular la media y la mediana, para las edades, sin tener en cuenta el trabajador cuya edad
es de 55 aos.

23

Clase #10

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
10.1- Mediana. Caso2
10.2- Moda
10.3- TAREA EVALUATIVA #5
10.1- Mediana
Caso2.
Si el nmero de datos n es par, ~
X=

x n +x

( 2 ) (n2 +1) , es decir, la mediana es el punto medio entre las


2

dos observaciones que se ubican en el centro.


Ejemplo: (En este ejemplo ya los datos se encuentran ordenados de mayor a menor)
El siguiente dato corresponde a las edades de 6 estudiantes:
x1 = 14, x2 = 14, x3 = 15, x4 = 17, x5 = 18, x6 = 19
a) Calcule la mediana
El nmero de estudiantes es, que representa un nmero par

~
X=

x n +x

x +x

( 2 ) (n2 +1) = ( 62 ) ( 62 +1 ) = x (3 )+ x ( 4) = 15+17 = 32 =16


2

10.2- Moda

La Moda es el valor con una mayor frecuencia en una distribucin de datos, es el valor que
ms se repite en una serie de datos.
Ejemplo:
El siguiente dato corresponde a las edades de 6 estudiantes:
x1 = 14, x2 = 14, x3 = 15, x4 = 17, x5 = 18, x6 = 19
a) Determine la moda
x1 = 14, x2 = 14, ambos datos son 14, siendo el nico que se repite dos veces, por eso la moda es
14.

24

10.3- TAREA EVALUATIVA #5

1- Las siguientes son las edades de 30 trabajadores de una empresa floricultora de la sabana de
Bogot.
22 20 20 19 21 20 18 27 23 19 21 19 30 20 21 55 29 27 20 21 22 20 22 24 17 18 20 21 22
22
a) Encontrar la mediana y la moda de las edades de los trabajadores.

25

26

Clase #11 CARACTERIZACIN DE VARIABLE CUANTITATIVA


(continuacin)
11.1- Medidas de Posicin
11.2- Cuartiles
11.3- Cmo calcular los cuartiles?
11.4- Ejemplo de clculo de cuartiles
11.5- TAREA EVALUATIVA #6
11.1- Medidas de Posicin
Las medidas de posicin son medidas que permiten dividir el conjunto de datos en partes
porcentuales. Estas medidas se usan para describir la posicin que tiene un subconjunto de datos
ordenados, en relacin con el resto de datos.
Las medidas de posicin ms importantes son: los cuartiles y los percentiles
11.2- Cuartiles
Es un valor que toma la variable que representa una cota o medida.
Los cuartiles son valores de la variable, que dividen un conjunto ordenado de datos en cuatro partes
iguales. Cada de una de estas partes contiene el 25% del total de datos. Los cuartiles son 3 y se
representa por Q1, Q2 y Q3.
El primer cuartil, Q1, es un nmero tal que, a lo sumo, el 25% del total de los datos es menor que l
y a los sumo el 75 % de los datos es mayor que l.
El segundo cuartil, Q2, es la mediana.
El tercer cuartil, Q3, es un nmero tal que a lo sumo el 75% de los datos es menor que l, y a los
sumo, el 25% de los datos es mayor que l.
Q1

Q2

Q3

25%

50%

75%

Cuartil 1
Q1 >= que el 25 % de los nmeros
Q1 <= que el 75 % de los nmeros
Cuartil 3
Q3 >= que el 75 % de los nmeros
Q3 <= que el 25 % de los nmeros
27

11.3- Cmo calcular los cuartiles?


1. Se ordenan los datos de menor a mayor
2. Se encuentra la mediana, es decir Q2
3. Se calcula una nueva mediana para Q1 tomando como extremo inferior el dato menor y
como dato superior Q2.
4. Se calcula una nueva mediana para Q3 tomando como extremo superior el dato mayor y
como dato inferior Q2.
11.4- Ejemplo de clculo de cuartiles.
Calcular los cuartiles en la siguiente situacin.
Los puntajes corresponden a los resultados obtenidos por 25 estudiantes en las pruebas de Estado en
el rea de matemticas
32, 32, 32, 33, 35, 36, 37, 40, 41, 42, 44, 45, 45, 46, 46, 47, 48, 49, 53, 54, 65, 65, 66, 67, 68
Para calcular la mediana (Q2) se tienen los 25 datos ordenados, por lo tanto:
Q2 = X13 = 45, por ser nmero impar es el valor que representa la posicin media de la secuencia
numrica.
Para calcular Q1 se consideran solamente los 13 primeros datos 32, 32, 32, 33, 35, 36, 37, 40, 41,
42, 44, 45, 45 y se calcula una nueva mediana Q1, Q1 = X7 = 37
Para calcular Q3 se consideran solamente los 13 ltimos datos 45, 46, 46, 47, 48, 49, 53, 54, 65, 65,
66, 67, 68 y se calcula una nueva mediana Q1, Q1 = X7 = 53.
A partir de los valores obtenidos se concluye que, el 25% de los estudiantes tiene puntajes iguales o
inferiores a 37 puntos, y el 25% tiene puntajes iguales o superiores a 53 puntos.
11.5- TAREA EVALUATIVA #6

1- Un estudio de agilidad y destreza en el manejo de las operaciones bsicas: suma, resta,


multiplicacin y divisin, llev a los investigadores a disear una prueba que se aplic a 25
estudiantes de grado quinto grado de primaria. A continuacin se relacionan los tiempos en
minutos, utilizados por cada uno de ellos en resolver la prueba:

33,6 20,9 15,2 28,5 24,1 44,7 15,3 41,6 26,1 38,6 39,1 32,4 16,6 19,3 34,8 31,3
15,6 29,3 41,2 28,2 15,3 20,1 18,3 21,1 20,0
28

a) Encontrar el tiempo promedio utilizado por un estudiante para resolver la prueba.


b) Calcular la mediana del conjunto de datos.
c) Encontrar los cuartiles y obtener una conclusin asociada a cada porcentaje.

29

Clase #12 CARACTERIZACIN DE VARIABLE CUANTITATIVA


(continuacin)
12.1- Medidas de Dispersin
12.2- El Rango
12.3- La Varianza
12.4- Ejemplo de clculo de varianza
12.5- Desviacin estndar
12.6- TAREA EVALUATIVA #7
12.1- Medidas de Dispersin
Las medidas de dispersin, son valores numricos que miden la dispersin o variabilidad entre los
datos. Estas medidas se consideran como un criterio para determinar la cercana de las
observaciones.
Si los datos estn relativamente cerca uno del otro, con respecto a la escala en la cual se midieron,
las medidas de dispersin toman valores numricos pequeos.
Si los datos estn relativamente lejanos uno del otro, con respecto a la escala en la cual se midieron,
las medidas de dispersin toman valores numricos grandes.
Las principales medidas de dispersin son: el rango, la varianza y la desviacin estndar.
12.2- El Rango
El rango de un conjunto de datos, es la diferencia numrica entre el dato mayor del conjunto y el
dato menor.
Rango = DM - Dm
El rango se puede considerar como el intervalo cerrado en el que se encuentra la totalidad de los
datos; entre ms pequeo sea su valor, ms cercanos estarn los datos.
12.3- La varianza
La varianza es una medida que pretende establecer la cercana de cada uno de los datos con
respecto a la media.
Para calcular la varianza es necesario determinar la desviacin, es decir, la distancia que hay entre
cada uno de los datos y la media.
Se llama desviacin de un dato con respecto a la media, a la diferencia numrica que hay entre el
dato y el valor de la media.
Ejemplo de clculo de la desviacin
Por ejemplo los siguientes datos corresponden a la estatura, en centmetros, de seis personas de un
grupo musical: 160, 155, 168, 175, 170, 177.
El promedio de estatura es

X =167,5 entonces las desviaciones para cada uno de los datos son:
30

x 1 X =160167,5=7,5

x 2 X =155167,5=12,5

x 3 X =168167,5=0,5

x 4 X=175167,5=7,5

x 5 X =170167,5=2,5

x 6 X =177167,5=9,5

Si el valor de la desviacin es negativo, entonces el dato correspondiente es menor que el


promedio.
Si el valor de la desviacin es positiva, entonces el dato correspondiente es mayor que el
promedio.

Ya que la media es el centro de masa de un conjunto de datos, entonces al sumar las desviaciones el
resultado debe ser cero.
Suma de las desviaciones:

7,5 + 12,5 + 0,5 + 7,5 + 2,5 + 9,5 = 0

Una vez definida la desviacin de cada uno de los datos con respecto a la media, se puede definir la
varianza de un conjunto de datos.
La varianza de un conjunto de datos

x1 ,

x 2 , ,

xn

notada como S2, es el promedio

aritmtico de los cuadrados de las desviaciones y se calcula de la siguiente manera:


n

( x i X )

S 2= i=1

n1

12.4- Ejemplo de clculo de varianza


Calcular el rango y la varianza para la siguiente situacin.
Los siguiente valores corresponden al nmero de horas diarias que duermen 15 estudiantes del
curso dcimo: 5, 5, 6, 8, 7, 7, 9, 5, 6, 8, 4, 11, 6, 10, 8
Solucin:
Para calcular el rango se consideran los valores entre 5 y 11, entonces:
Rango = DM - Dm = 11 5 = 6 horas
En el caso de la varianza, es necesario calcular la media,

X =(5+5+ 6+8+7+7 +9+5+6 +8+ 4+11+ 6+10+8)/15=7


Se calcula el cuadrado de las desviaciones de cada dato con respecto a la media

31

S=

( 5 7 ) + ( 57 ) + ( 67 ) + ( 8 7 ) + ( 7 7 ) + ( 77 ) + ( 97 )

151
2
2
2
2
2
2
2
2

( 57 ) + ( 67 ) + ( 87 ) + ( 47 ) + ( 117 ) + ( 67 ) + ( 107 ) + ( 87 )
151

S 2=

56
=4 horas 2
14

12.5- Desviacin Estndar


La desviacin estndar representa un dato que, al sumarlo y restarlo dos veces a la media, genera un
intervalo en el cual se concentra el 95% de los datos.

Si el intervalo es grande, los datos estn muy alejados entre si y el promedio no representa
bien al grupo.
Si el intervalo es pequeo, se tendr la mayora de los datos cercanos y la media ser un
buen representante del grupo.

La desviacin estndar, notada como S, es la raz cuadrada positiva de la varianza

S= S2=

( x i X )
i=1

n1

12.6- TAREA EVALUATIVA # 7


1. Una empresa de servicios, est interesada en hallar el tiempo promedio que sus clientes
utilizan para hacer una transaccin completa. Para tal fin, se tomaron los tiempos que
tardaron 17 clientes en realizar una transaccin. Los tiempos, en minutos, son los
siguientes:
15, 22, 31, 3, 31, 11, 4, 10, 12, 6, 32, 34, 16, 7, 4, 8, 4
a) Determinar el rango de los datos.
b) Calcular la desviacin estndar de los tiempos utilizados.
c) Hacer una interpretacin de los datos a partir del clculo de la desviacin estndar.
2. Investigar como obtener en Excel la media, la mediana, el rango, la varianza, la desviacin
estndar de un conjunto de datos.

32

33

Clase #13 CARACTERIZACIN DE VARIABLE CUANTITATIVA


(continuacin)
13.1- Anlisis de datos usando la herramienta Excel
13.2- Ejemplo de uso de la herramienta Excel
13.3- TAREA EVALUATIVA #8

13.1- En este curso debemos comenzar a introducirnos en la herramienta Excel aplicada a realizar
clculos estadsticos. Se hace necesario en primer lugar tener el fundamento terico necesario para
poder llevar a cabo las operaciones necesarias.
13.2- Ejemplo de uso de la herramienta excel
Para esto ser ilustrado mediante un ejemplo:
Se tienen las marcas en metros realizadas por saltadores largo en una competencia de atletismo. En
la siguiente tabla de frecuencias ya se encuentran organizadas las mismas tomando como intervalo
las marcas correspondientes.

1ro Se debe calcular la sumatoria de las frecuencias para cada uno de los intervalos.

34

Se coloca en la celda marcada la frmula colocada en la barra de frmulas del libro


2do Calcular el producto del intervalo por la frecuencia para ese intervalo, que va a permitir
facilitar el clculo de la mediana.

Para calcular el producto, se coloca en la barra de frmula la multiplicacin de ambas celdas y


luego se arrastra desde la esquina inferior derecha de la celda para calcular el resto de productos.

35

3ro Calcular el producto del intervalo al cuadrado por la frecuencia para ese intervalo, que va a
permitir facilitar el clculo de la varianza.

Para calcular el producto, se coloca en la barra de frmula la multiplicacin de ambas celdas y


luego se arrastra desde la esquina inferior derecha de la celda para calcular el resto de productos.

36

4to Calcular la frecuencia relativa para cada intervalo dividiendo la frecuencia entre el total de
muestras 93 para cada una de las frecuencias.

5to Calcular la frecuencia acumulada

37

La frecuencia acumulada del primer intervalo, se obtiene de la frecuencia relativa para ese mismo
intervalo, debido a que la frecuencia acumulada depende de la frecuencia del intervalo anterior, el
cual no existe para la primera frecuencia.

La frecuencia acumulada del intervalo nmero 2 se obtiene a partir de la frecuencia acumulada


anterior ms la nueva frecuencia relativa y luego se arrastra desde la esquina inferior derecha de la
celda para calcular el resto de las frecuencias acumuladas.

6to Calcular la media

38

Se calcula la mediana dividiendo el producto de la frecuencia por el intervalo de la frecuencia entre


el total de muestras tomadas.

7mo Calcular la varianza


Se calcula a travs del cociente de del producto del intervalo de la frecuencia al cuadrado por la
frecuencia del intervalo entre el total de muestras tomadas menos la media al cuadrado

8vo Calcular la moda

39

La moda es el valor que ms se repite de las muestras tomadas.

40

41

Clase #14

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
14.1- Diagramas de Cajas
14.2- Construccin de un diagrama de cajas
14.3- TAREA EVALUATIVA #9
14.1- Diagramas de Cajas
El diagrama de cajas, es un resumen grfico en el que se describen varias de las caractersticas ms
destacadas de un conjunto de datos.
Algunas de las caractersticas que se muestran en un diagrama de cajas son:

Los datos inusuales del estudio.

La dispersin de los datos con respecto a los cuartiles.

14.2- Construccin de diagrama de cajas


El primer paso en la elaboracin de un diagrama de cajas es calcular el valor de los cuartiles.
Una vez determinados estos valores, se ubican en una recta numrica y se construyen rectngulos
cuyas bases estn definidas por la diferencia entre cuartiles, tal y como se muestra en la siguiente
figura,

Q1

Q2

Q3

Luego, se define una medida de dispersin, llamada rango intercuartlico, relacionando los cuartiles
uno y tres.

42

El rango intercuartlico o cuarta dispersin es la diferencia entre el cuartil tres y el cuartil uno. As,
rango intercuartlico = Q3 Q1

La cuarta dispersin se multiplica por 1,5. Este valor se toma como criterio estndar para la
construccin del diagrama de cajas.
Una vez determinada esta medida de dispersin, se construye una lnea desde el valor del
primer cuartil hasta el valor Q1 1,5(Q3 Q1) y de la misma forma, desde el tercer cuartil hasta
Q3 1,5(Q3 Q1), tal y como se muestra en la figura,

Q1 + 1,5(Q3
Q1)

Q1

Q2

Q3

Q3 + 1,5(Q3
Q1)

Los datos que estn incluidos en esta longitud, son datos que se consideran dentro de un rango
permitido, ya estn cubiertos dentro del rango calculado.

Para la parte izquierda del diagrama, se marca una nueva lnea desde Q1 1,5(Q3 Q1)
hasta Q1 2(1,5(Q3 Q1)).
Para la parte derecha, se marca otra lnea desde Q3 1,5(Q3 Q1) hasta Q3 2(1,5(Q3
Q1)).

Finalmente el diagrama construido encierra el 95% de los datos:

Los datos que quedan incluidos en esta nueva longitud se llaman datos inusuales suaves, ya que
afectan de manera poco significativa el clculo de la media y de la desviacin estndar. Los datos
que estn fuera del diagrama de cajas se llaman datos inusuales o atpicos, y son valores que
influyen de manera significativa en el clculo de las medidas que caracterizan la variable. Estos
datos atpicos corresponden a valores mal tomados en el momento de la obtencin de la
informacin.
43

44

Clase #15

CARACTERIZACIN DE VARIABLE CUANTITATIVA

(continuacin)
15.1- Ejemplo de Construccin de un diagrama de cajas
15.2- TAREA EVALUATIVA #10
15.1-Ejemplo de Construccin de un diagrama de cajas
Construir un diagrama de cajas para la siguiente situacin
Para mejorar el proceso de transporte de jugos en una ciudad, estos se someten a un proceso de
congelacin. Cmo consecuencia de este proceso, en la descongelacin, se pierde un porcentaje del
jugo inicialmente empacado.
Se ha sometido al proceso anterior el jugo de 19 tipos de fresa. Estos tipos de fresa pierden los
siguientes porcentajes de jugo respectivamente:
46, 51, 44, 50, 12, 46, 78, 41, 55, 46, 53, 53, 42, 44, 50, 54, 46, 41, 48
Solucin:
1- Se ordenan los datos de menor a mayor
12, 41, 41, 42, 44, 44, 46, 46, 46, 46, 48, 50, 50, 51, 53, 53, 54, 55, 78
2- Calculando los cuartiles se tiene:

Q2 =

Q1 = ?

~
X = 46 (Mediana)

Lmite inferior: 12 y Lmite superior: 46


Nueva Mediana (como el nuevo nmero de datos es par, 10)

~
X=

x n +x

+x

( 2 ) (n2 +1) = ( 102 ) ( 102 +1) = 44+ 44 =44


2

Q1 = 44

Q3 = ?
Lmite inferior: 46 y Lmite superior: 78
Nueva Mediana (como el nuevo nmero de datos es par, 10)

~
X=

x n +x

+x

( 2 ) (n2 +1) = ( 102 ) ( 102 +1) = 53+ 53 =53


2

Q3 = 53
45

3- Calcular el rango intercuartlico = Q3 Q1= 53 44 = 9


4- Calcular el primer segmento
desde Q1 1,5(Q3 Q1) = 44 1,5(53 44) = 30,5
hasta Q3 1,5(Q3 Q1) = 53 1,5(53 44) = 66,5
5- Construir la segunda dispersin, el diagrama de cajas se amplia
desde Q1 2(1,5(Q3 Q1)) = 44 2(1,5(53 44)) = 17
hasta Q3 2(1,5(Q3 Q1)) = 53 2(1,5(53 44)) = 80
6- El diagrama de cajas ser
Datos
inusual
es

12

17

30,
5

Q1

Q2

Dato
atpico

Q3

66,
5

78 8
0

Dato
inusual

Se puede decir que 78 es un dato inusual suave, y 12 es un dato tpico. El dato atpico es el
que influye significativamente en el clculo de la media y de las medidas de dispersin
descritas anteriormente.
A partir del diagrama de cajas se puede decir:

El jugo de al ser descongelado presenta un 12% de prdida debe ser una medida
sujeta a una nueva observacin.
Al encontrarse el dato atpico 12, se puede evaluar las caractersticas de dicho
jugo, ya que su valor es lejano con respecto a los dems.

Es importante calcular la media recortada, sin tener en cuenta el dato 12, para observar la
influencia del dato en el clculo de la media.
Adems se puede concluir que el 95% de las medidas de jugo perdido al ser descongelado
est entre 30% y 66,5%.

15.2- TAREA EVALUATIVA #10

46

Los siguientes datos corresponden a la cantidad de veces al mes, que un estudiante de grado
undcimo asiste a una sala de cine.
5, 2, 2, 1, 4, 2, 7, 2, 2, 6, 5, 0, 3, 3, 4, 2, 1, 0, 0, 12, 0, 10
a) Construir un diagrama de cajas.
b) Incluir en el diagrama, la media de los datos y compararla con respecto a la mediana.

47

Clase #16

CARACTERIZACIN DE VARIABLE CUALITATIVA

16.1- Caracterizacin de una variable cualitativa


16.2- Tablas
16.3- Ejemplo de Elaboracin de Tablas
16.1- Caracterizacin de una variable cualitativa
Para la caracterizacin de una variable cualitativa se utilizan criterios como la construccin de
tablas, la moda y la elaboracin de grficos.
16.2- Tablas
Las Tablas ms utilizadas en la caracterizacin de una variable cualitativa, corresponden a una
distribucin de frecuencias en las que los rangos son gustos, preferencias, cualidades o
caractersticas.
Las frecuencias y frecuencias relativas, definidas para la construccin en la distribucin en
variables cuantitativas, tienen la misma interpretacin y aplicacin en las variables cualitativas. Las
frecuencias acumuladas y acumuladas relativas, no tienen interpretacin ni sentido en este tipo de
tablas.
16.3- Ejemplo de Elaboracin de Tablas
Elaborar una tabla de frecuencias para la siguiente variable cualitativa.
Un estudio mdico report los datos, correspondientes a los tipos de problemas de salud, que
presentan los 60 empleados de una hacienda cafetera. Los problemas de salud se clasificaron en:
J: Articulacin Inflamada
F: Fatiga
B: Dolor de Espalda
M: Debilidad Muscular
T: Tos
N: Nariz con flujo e irritacin
O: Cansancio
48

Los resultados son los siguientes:


O, O, N, J, T, F, B, B, F, O, B, O, J, O, O, M, O, F, F, O, O, N, O, N, J, F, J, B, O, T, F, F, J, O, J, J,
F, N, O, B, M, O, J, M, O, B, O, F, J, O, J, N, O, B, N, T, O, O, O, M.
Los cuales quedan organizados de la siguiente forma:

Intervalo
J
F
B
M
T
N
O
Total

f
10
9
7
4
3
6
21
60

fr
0.166
0.150
0.116
0.066
0.050
0.100
0.350
1

Solucin:
Si se supone que cada intervalo corresponde a un tipo de problema de salud, y se encuentran las
frecuencias de la misma forma que para variables cuantitativas.
A partir de la tabla de frecuencias se puede concluir que: el principal problema de salud, entre los
60 hombres, es el cansancio. Lo padece el 35% de la poblacin. Se presentan algunos problemas de
tos y debilidad muscular, pero se consideran pocos en la poblacin. El porcentaje de trabajadores
con debilidad muscular es 6,6% y el porcentaje de trabajadores con problemas de tos es 5%.

49

50

Clase #17

CARACTERIZACIN DE VARIABLE CUALITATIVA

(continuacin)
17.1- La moda
17.2- Ejemplo de obtencin de la moda
17.3- Grficos
17.4- Cmo crear un histograma en Excel?
17.5- Cmo crear un diagrama circular en Excel?
17.6- Ejemplo de Diagrama Circular
17.1- La moda
La moda es una medida de la tendencia central, que se utiliza frecuentemente en variables
cuantitativas y corresponde al rango de la tabla con mayor frecuencia.
La moda no es una medida nica, por esta razn un conjunto de datos puede tener ms de una
moda. Su interpretacin es semejante a la de la media en variables cuantitativas.
17.2- Ejemplo de obtencin de la moda
A partir de la tabla de frecuencia elaborada en la clase anterior, encontrar la moda para la misma.
Un estudio mdico report los datos, correspondientes a los tipos de problemas de salud, que
presentan los 60 empleados de una hacienda cafetera. Los problemas de salud se clasificaron en:
J: Articulacin Inflamada
F: Fatiga
B: Dolor de Espalda
M: Debilidad Muscular
T: Tos
N: Nariz con flujo e irritacin
O: Cansancio
Los resultados son los siguientes:
O, O, N, J, T, F, B, B, F, O, B, O, J, O, O, M, O, F, F, O, O, N, O, N, J, F, J, B, O, T, F, F, J, O, J, J,
F, N, O, B, M, O, J, M, O, B, O, F, J, O, J, N, O, B, N, T, O, O, O, M.
51

Los cuales quedan organizados de la siguiente forma:


Intervalo
J
F
B
M
T
N
O
Total

f
10
9
7
4
3
6
21
60

fr
0.166
0.150
0.116
0.066
0.050
0.100
0.350
1

Solucin:
Como se especific anteriormente la moda es representada por el rango de la tabla de mayor
frecuencia o con mayor nmero de datos acumulados.
Para nuestro ejemplo es representado por los pacientes que padecen cansancio (O), 21.
17.3- Grficos
La representacin grfica de un conjunto de datos cualitativos debe obtenerse de la elaboracin de
una tabla. Los grficos usados son el histograma y el diagrama circular.

El histograma se construye de manera semejante al histograma elaborado en variables


cuantitativas. Para las variables cualitativas, en el eje horizontal se ubican las clases o
rangos de la variable y en el eje vertical las frecuencias relativas.

17.4- Cmo crear un histograma en Excel?

52

Se realizar el histograma del ejemplo analizado anteriormente, usando como base la tabla
planteada.
25
21
20

J
F

15
10

B
10

6
4

N
O

0
Tipo de Enfermedad

Eje X: Rangos de la Variable (J, F, B, M, T, N, O)


Eje Y: Frecuencias Relativas

El diagrama circular es una representacin, en un crculo, frecuentemente de porcentajes,


de los rangos que toma la variable.

17.5- Cmo crear un diagrama circular en Excel?

53

17.6 Ejemplo de Diagrama Circular


Se pregunt a 2,482 ciudadanos, respecto de la medida de prohibicin de porte de armas, tomada
por el alcalde mayor en los ltimos das.
Los Rasgos para la respuesta de cada encuestado fueron:
-

De Acuerdo (DA)
En Desacuerdo (NA)
No Sabe o No Responde (NS/NR)

Solucin:
Rango
De acuerdo (DA)
En Desacuerdo (NA)
No Sabe, no Responde (NS/ NR)

F
1520
875
87

54

Nivel de aceptacin respecto a la medida de prohibicin de porte de armas


4%
DA

35%

NA
61%

NS/NR

55

CLASE #18 CARACTERIZACIN DE VARIABLES CUALITATIVAS


USANDO LA HERRAMIENTA EXCEL
18.1- Creacin de Histogramas
18.2- Creacin de Diagramas Circulares en Excel
18.1- Creacin de Histogramas
El histograma ser creado a partir del ejemplo tratado en la clase anterior
1. Un estudio mdico report los datos, correspondientes a los tipos de problemas de salud, que
presentan los 60 empleados de una hacienda cafetera. Los problemas de salud se clasificaron
en:
J: Articulacin Inflamada
F: Fatiga
B: Dolor de Espalda
M: Debilidad Muscular
T: Tos
N: Nariz con flujo e irritacin
O: Cansancio

Los resultados son los siguientes:


O, O, N, J, T, F, B, B, F, O, B, O, J, O, O, M, O, F, F, O, O, N, O, N, J, F, J, B, O, T, F, F, J, O, J, J,
F, N, O, B, M, O, J, M, O, B, O, F, J, O, J, N, O, B, N, T, O, O, O, M.
Los cuales quedan organizados de la siguiente forma:
Intervalo
J
F
B
M
T

f
10
9
7
4
3

fr
0.166
0.150
0.116
0.066
0.050
56

N
O
Total

6
21
60

0.100
0.350
1

a) Realizar el histograma correspondiente para cada una de las siguientes frecuencias relativas.

1ro

Localizar el histograma

Al seleccionar el Histograma, se abre otra ventana de una hoja de clculo donde se teclean los
datos, categora es el eje de las abscisas y la serie son las datos que toma la categora.
2do

57

Se edita la hoja de clculo agregando ms series dependiendo de la cantidad de intervalos que


tenga el ejercicio, antes eliminando las categoras innecesarias.
3ro

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

J
F
B
M
T
N
O
fr

4to

Se pudiera agregar la etiqueta a cada uno de los rectngulos para conocer el valor del dato
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

J
F
0.170.15
0.12
0.070.05
fr

0.10.35

B
M
T
N
O

Clic derecho encima del rectngulo, agregar etiqueta.


18.2- Creacin de Diagramas Circulares en Excel
1ro

Localizar el Diagrama Circular

58

Al seleccionar el Diagrama Circular, se abre otra ventana de una hoja de clculo donde se
teclean los datos, columna es el eje de las ordenadas con sus correspondientes datos.
2do

Se edita la hoja de clculo agregando ms series dependiendo de la cantidad de intervalos que


tenga el ejercicio.
3ro

Columna1

J
F
B
M
T
N
O

Se pudiera agregar la etiqueta a cada uno de los arcos de circunferencia para conocer el valor del
dato.
4to

59

Columna1
J
F

0.17

0.35
0.15

M
T

0.1

0.05 0.07

0.12

N
O

Clic derecho encima del rectngulo, agregar etiqueta.

60

CLASE #19

CARACTERIZACIN DE VARIABLES CUALITATIVAS

19.1- Tablas de Contingencia


19.2- Ejemplo1 de Tablas de Contingencia
19.3- Ejemplo2 de Tablas de Contingencia
19.4- Separacin de la Tablas de Contingencia en dos Tablas de frecuencias relativas totales
19.5- TAREA EVALUATIVA # 10
19.1- Tabla de Contingencia
Una tabla de contingencia o tabla cruzada, es una tabla en la cual las filas corresponden a los rangos
de una variable cualitativa y las columnas corresponden a los rangos de otra variable cualitativa.
19.2- Ejemplo1 de Tablas de Tablas de Contingencia
La tabla que se mostrar a continuacin corresponde al cruce de la variable gnero: hombre o mujer,
junto con la variable color de cabello: castao, rubio, negro, utilizando los siguientes datos:
Hombre con cabello castao: 21
Hombre con cabello rubio: 10
Hombre con cabello negro: 27
Mujer con cabello castao: 17
Mujer con cabello rubio: 25
Mujer con cabello negro: 10
Cada una de las casillas de la tabla suministra la informacin correspondiente al cruce de los rangos
de las dos variables.
Gnero
Hombre
Mujer
Total

Castao
21
17
38

Color de Cabello
Rubio
Negro
10
27
25
10
35
37

Totales
58
52
110

Anlisis:
61

1.

Las columnas contienen los tipos de cabellos.


Al sumar las columnas se obtiene la cantidad de personas que tienen un determinado color de
cabello, sin importar el gnero.
38 personas de cabello castao
35 personas de cabello rubio
37 personas de cabello Negro

2.

Las filas contienen los tipos de gnero.


La suma de los nmeros de la fila corresponde a la cantidad de hombres y mujeres de la
muestra, sin importar el color de cabello.
58 hombres
52 mujeres

3.

La suma del total de personas debe ser igual, tanto en la variable color de cabello como en la
variable gnero.
El Total es 110 personas

19.3- Ejemplo2 de Tablas de Tablas de Contingencia


Con los mismos datos anteriores construir la tabla de frecuencias relativas, para el total de
individuos que es 110.
Gnero
Hombre
Mujer
Total

Castao
0,190
0,154
0,345

Color de Cabello
Rubio
Negro
0,090
0,245
0,227
0,090
0,318
37

Totales
0,527
0,472
1

Cada una de las casillas contiene las proporciones de personas que tienen las dos caractersticas. Al
multiplicar ese valor por 100, se obtiene el porcentaje correspondiente.
Anlisis:
o
o

El 19% de la poblacin son hombres de cabello castao.


El 22,7% de la poblacin son mujeres de cabello rubio

Los totales representan el porcentaje por rangos de cada una de las variables:
o
o
o

34,5% de la poblacin tiene cabello de color castao.


31,8% de la poblacin tiene cabello de color rubio.
33,6% de la poblacin tiene cabello de color negro.

52,7% de la poblacin son hombres


47,2% de la poblacin son mujeres.

19.4- Separacin de la Tabla de Contingencia en dos Tablas de frecuencias relativas totales

62

Es posible separar la Tabla principal en dos Tablas de frecuencias independientes usando para
comparar cada una de las dos variables.
Utilizando como base el ejemplo 2, es posible construir una tabla de frecuencias relativas para el
total de la variable gnero y para el total de la variable color de cabello.
Para el caso de la variable gnero la tabla se construye dividiendo cada frecuencia entre el total
correspondiente a cada fila. As,

21
10
27
=0,362 =0,172 =0,465
58
58
58
17
25
10
=0,326 =0,480 =0,192
52
58
52

Gnero
Hombre
Mujer

Color de Cabello
Rubio
Negro
0,172
0,465
0,480
0,192

Castao
0362
0,326

Totales
1
1

La tabla de frecuencias relativas con respecto a la variable color del cabello, se obtiene al dividir
cada frecuencia entre el total de cada columna.

21
10
27
=0,553 =0,286 =0,730
38
35
37
17
25
10
=0,447 =0,714 =0,270
38
35
37

Gnero
Hombre
Mujer
Totales

Castao
0,553
0,447
1

Color de Cabello
Rubio
0,286
0,714
1

Negro
0,730
0,270
1

19.5- TAREA EVALUATIVA #10 (En Excel)


La siguiente tabla muestra las preferencias de un grupo de personas por los noticieros de televisin
con respecto a su filiacin poltica. Los noticieros incluidos son CNN, ATT y BBC y los partidos
polticos tenidos en cuenta son Demcratas, Socialistas e Independientes.
Partido
Demcrata

CNN
45

Noticiero
ATT
71

BBC
25
63

Socialista
Independiente

82
21

50
25

30
95

a) Construir la tabla de frecuencias relativas totales.


b) Cul es el porcentaje de personas demcratas que ven cada noticiero?
c) Cul es el porcentaje de personas que prefieren ver el noticiero ATT en cada uno de los
partidos?
d) Construir las tablas de frecuencias de las dos variables y elaborar un histograma de
frecuencias relativas y un diagrama circular de porcentajes para cada uno.

64

Vous aimerez peut-être aussi