Académique Documents
Professionnel Documents
Culture Documents
com
Mdulo 1
INTRODUCCIN A LA
ESTADSTICA
INTRODUCCIN A LA ESTADSTICA
INTRODUCCION
En el lenguaje comn se emplea la palabra ESTADSTICA casi como sinnimos de
nmeros o cifras.
Suele utilizarse bajo dos significados distintos, a saber:
1 Como coleccin de datos numricos: Se sobrentiende que dichos datos numricos
han de estar presentados de manera ordenada y sistemtica. Una informacin
numrica cualquiera puede no constituir una estadstica, para merecer este apelativo,
los datos han de constituir un conjunto coherente, establecido de forma sistemtica y
siguiendo un criterio de ordenacin.
2 Como ciencia: En este contexto, la Estadstica estudia el comportamiento de los
fenmenos de masas. Como todas las ciencias, busca las caractersticas generales
de un colectivo y prescinde de las particulares de cada elemento. As por ejemplo al
investigar el gnero en los nacimientos, iniciaremos el trabajo tomando un grupo
numeroso de nacimientos y obtendremos despus la proporcin de varones. Es muy
frecuente enfrentarnos con fenmenos en los que es muy difcil predecir el resultado;
as, no podemos dar una lista, con las personas que van a morir con una cierta edad,
o el gnero
embarazo,
Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran
en los fenmenos de masa.
Ejemplo 1:
* El comentarista deportivo dice: estas son las estadsticas de los partidos.
* Segn las estadsticas el 99% de la poblacin fue censada.
* Segn las estadsticas el ao anterior fue menor en nmero de accidentes durante
la celebracin de las fiestas de fin de ao.
Ejemplo 2:
Uno va y abre la llave del bao para sentir la temperatura del agua y decidir si
aade ms agua caliente o agua fra, o que la temperatura sea la correcta y se pone
bajo la ducha.
frente a la gndola de pizzas, una de las marcas de pizzas, est sobre el mostrador y
ofrecen pequeos pedazos para prueba. Despus de probarla, uno decide si la
compra o no.
En los dos ejemplos anteriores, se toma una decisin y se elige un curso de accin
basndose en una muestra.
El trmino ESTADSTICA, que se deriva del latn status, significa estado en el sentido
poltico, se emple entonces para referirse a la recoleccin y descripcin de tales
datos del estado. La necesidad de acopiar y analizar datos numricos impuls a
desarrollar mtodos para facilitar la labor, que era lo que constitua lo ms
considerable de la estadstica hasta la era moderna.
Es importante y fascinante el tema de la probabilidad, que comenz en el siglo XVII
con los esfuerzos matemticos
Las tcnicas estadsticas se utilizan para tomar decisiones que afecten nuestra vida
diaria, eso quiere decir que afecta nuestro bienestar personal.
Adems el conocimiento de la estadstica ayudar a entender por qu se toman
ciertas decisiones y le aportarn una mejor comprensin sobre la manera que la
afectan.
DEFINICION
ESTADISTICA: es la ciencia de recolectar, organizar, presentar, analizar e interpretar
datos para ayudar en una toma de decisiones ms efectiva.
TIPOS DE ESTADSTICA
ESTADISTICA DESCRIPTIVA: se refiere a la recoleccin, presentacin, descripcin,
anlisis e interpretacin de una coleccin de datos, esencialmente consiste en
resumir stos con uno o dos elementos de informacin (medidas descriptivas) que
caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de
obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el
conocimiento proporcionado por stos. Puede utilizarse para resumir o describir
cualquier conjunto ya sea que se trate de una poblacin o de una muestra.
Lic. Olga Cardozo
Recogida de datos.
Representacin grfica.
CONCEPTOS BASICOS
TIPOS DE VARIABLES
VARIABLE: es el conjunto de caractersticas de las entidades que interesan en una
investigacin cientfica.
no
Ejemplos de este tipo de variable son: el saldo en la cuenta de cheques, las edades
de los trabajadores de una empresa, la duracin en horas del acumulador.
Por ejemplo: la estatura de las personas, el tiempo necesario para realizar una
transaccin bancaria de parte del cliente, el peso de los recin nacidos en la fecha.
NIVELES DE MEDICION
NIVEL NOMINAL: los datos son clasificados en categoras sin algn orden especfico
de las mismas. Sirve para nombrar las unidades de anlisis en una investigacin, se
asignan nmeros a eventos con el propsito de identificarlos, aunque no existe
ningn referente cuantitativo. Son mutuamente excluyentes entre s.
Por ejemplo, si la unidad de anlisis es un grupo de personas, para clasificarlas se
puede establecer la categora gnero con dos niveles, masculino (M) y femenino (F),
los respondientes solo tienen que sealar su gnero, no se requiere de un orden real.
As, si se asignan nmeros a estos niveles solo sirven para identificacin y puede ser
indistinto: 1 = M, 2 = F o bien, se pueden invertir los nmeros sin que afecte la
medicin: y es utilizada en crceles, escuelas, deportes, etc.
NIVEL ORDINAL: Se establecen categoras con dos o ms niveles que implican un
orden inherente entre s. Estas escalas admiten la asignacin de nmeros en funcin
de un orden prescrito. La escala de medicin ordinal es cuantitativa porque permite
ordenar a los eventos en funcin de la mayor o menor posesin de un atributo o
caracterstica.
Las formas ms comunes de variables ordinales son tems (reactivos) actitudinales
estableciendo una serie de niveles que expresan una actitud de acuerdo o
desacuerdo con respecto a algn referente.
Por ejemplo, ante el tem: La economa nacional debe dolarizarse, el respondiente
puede marcar su respuesta de acuerdo a las siguientes alternativas, respuesta que
pueden codificarse con nmeros que sugieren un orden preestablecido pero no
implican una distancia entre un nmero y otro.
1. Totalmente de acuerdo
2. De acuerdo
3. Indiferente
4. En desacuerdo
5. Totalmente en desacuerdo
Una persona que en un examen de matemticas que obtiene una puntuacin de cero
no significa que carezca de conocimientos, el punto cero es arbitrario porque sigue
existiendo la caracterstica medida.
NIVEL DE RAZN: Una escala de medicin de razn incluye las caractersticas de los
tres anteriores niveles de medicin anteriores (nominal, ordinal e intervalo). Determina
la distancia exacta entre los intervalos de una categora. Adicionalmente tiene un
punto cero absoluto, es decir, en el punto cero no existe la caracterstica o
atributo que se mide. Las variables de ingreso, edad, nmero de hijos, altura, peso,
distancia o el salario, son ejemplos de este tipo de escala. El nivel de medicin de
razn se aplica tanto a variables continuas como discretas.
EJERCICIOS
10
11
Ejemplo prctico:
Sprite (S)
Srite Zero (SZ)
12
Gnero
Bebida preferida
Gnero
Bebida preferida
CC
SZ
CC
PC
PC
CZ
CZ
SZ
SZ
PC
PC
CC
PL
CC
PL
CC
CZ
PC
PL
CZ
CC
SZ
CC
PC
CZ
SZ
SZ
Gnero
Cantidad
Femenino
17
56,67
Masculino
13
43,43
Total
30
100
Bebida preferida
Cantidad
Coca cola
23,33
Coca Zero
17,44
Pepsi Cola
20
Pepsi Ligth
10
Sprite
10
Sprite Zero
20
Total
30
100
13
Porcentaje
de
encuestados
por gnero
43%
57%
Femenino
Masculino
20%
Porcentaje por
eleccin de la
bebida gasificada
23%
10%
17%
10%
20%
Coca cola
Coca Zero
Pepsi Cola
Pepsi Ligth
Sprite
Sprite Zero
14
Cantidad
Cantidad
Gnero
Bebida preferida
Femenino
Masculino
Coca cola
5
16,67
2
6,67
Coca Zero
4
13,33
1
3,33
Pepsi Cola
3
10
3
10
Pepsi Ligth
0
0
3
10
Sprite
1
3,33
2
6,67
Sprite Zero
4
13,33
2
6,67
Total
17
13
%
56,67
43,33
Grfico de barras compuesto relacionando las variables analizadas
%
23,33
17,44
20
10
10
20
100
5
4
3
% Femenino
% Masculino
2
1
0
Coca cola Coca Zero Pepsi Cola
Pepsi
Ligth
Sprite
Sprite
Zero
15
Ejemplo:
18
11
10
32
12
10
26
37
11
15
18
10
21
La clasificacin ordenada.
10
10
10
11
11
12
15
18
18
21
26
32
37
PRESENTACIONES TABULARES DE
VARIABLES CUANTITATIVAS
PASOS A SEGUIR PARA CONSTRUIR UNA TABLA DE DISTRIBUCIN DE
FRECUENCIAS.
Observacin: el trabajo debe realizarse con los datos ordenados.
Este proceso conocido como La regla de Sturges, propuesta por Herbert Sturges en
1926, es una regla prctica acerca del nmero de clases que deben considerar al
elaborarse un arreglo tabular.
16
Indica el menor nmero de intervalos de clase o renglones que tendra una ordenacin
tabular
Rango
k
Otros mtodos utilizados para la eleccin del nmero de intervalos sugeridos para
valores elegidos de la cantidad n de datos entre 10 y 300.
k n
DISTRIBUCIONES DE FRECUENCIA
Al construir una presentacin tabular deben considerarse los
siguientes componentes:
N es el tamao de la poblacin de donde se obtiene la muestra de tamao n
INTERVALO DE CLASE (CLASE): se denomina as a cada uno de los grupos en que
se divide el conjunto de datos.
17
LIMITES REALES DE CLASE: son los valores reales que se pueden tomar para
asegurarnos que estn incluidos los extremos. Siempre es menos o ms media unidad
que la ltima cifra significativa de los lmites de clase.
MARCA DE CLASE: ( xi ) es el representante de un intervalo. Se calcula por la
semisuma de los extremos del intervalo.
xi
LI L S
2
xi
L RI L RS
2
Fr
datos.
F
n
82
70
74
87
69
22
49
73
52
86
45
19
15
51
23
42
50
69
58
89
71
59
70
47
41
51
71
67
69
60
38
74
56
67
56
46
70
18
Solucin:
15
19
22
23
38
41
42
45
46
47
49
50
51
51
52
56
56
58
59
60
67
67
69
69
69
70
70
70
71
71
73
73
74
74
82
86
87
89
Rango = 89 2 = 87
Nmero de intervalos: k = 1 + 3,32 . log 40 K 6 deberamos tener 6 clases como
mnimo.
Amplitud: h =
89 2
h = 15 cada clase debe contener 15 distintos valores.
6
Li
xi
Ls
Lrs
Li
xi
Ls
Lrs
Li
xi
Ls
Lrs
Lrs
16
Li
xi
Ls
16
17
31
32
46
47
61
62
76
77
91
19
2 16
17 31
77 91
9;
24.....
84
2
2
2
Lri
Li
xi
Ls
16
17
24
31
32
39
46
47
54
61
62
69
76
77
84
91
Lrs
Lri
Li
xi
Ls
Lrs
1,5
16
16,5
17
24
31
32
39
46
47
54
61
62
69
76
77
84
91
Lri
Li
xi
Ls
Lrs
1,5
16
16,5
16,5
17
24
31
31,5
31,5
32
39
46
46,5
46,5
47
54
61
61,5
11
61,5
62
69
76
76,5
14
76,5
77
84
91
91,5
20
Lri
Li
xi
Ls
Lrs
1,5
16
16,5
16,5
17
24
31
31,5
31,5
32
39
46
46,5
46,5
47
54
61
61,5
11
61,5
62
69
76
76,5
14
76,5
77
84
91
91,5
n=
40
Fr
F
Fp Fr * 100
n
Lri
Li
xi
Ls
Lrs
Fr
Fp
1,5
16
16,5
0,075
7,5
16,5
17
24
31
31,5
0,075
7,5
31,5
32
39
46
46,5
0,125
12,5
46,5
47
54
61
61,5
11
0,275
27,5
61,5
62
69
76
76,5
14
0,35
35
76,5
77
84
91
91,5
0,1
10
40
100
n=
REPRESENTACIONES GRAFICAS
Son las distintas formas de presentar la informacin, con la intensin de impactar
visualmente al observador. Son fciles de interpretar.
21
Figura 1
Figura 21
22
16
14
12
10
8
6
4
2
0
9
24
39
54
69
84
.
Figura 3
Figura 42
Fuente: http://graficos-en-c.blogspot.com/
http://www.desarrolloweb.com/articulos/1582.php
23
Para graficar unas barras verticales, se indican los lmites sobre el eje horizontal
y la frecuencia sobre el eje vertical. Se forman rectngulos con estas
dimensiones levemente separados.
16
14
12
10
8
6
4
2
0
www.rebiun.org
24
14
11
5
4
3
1,5
16,5
31,5
46,5
61,5
76,5
91,5
25
Figura 63
Figura 5
Del ejemplo prctico:
Li
xi
Ls
Fp
16
7,5
27
17
24
31
7,5
27
32
39
46
12,5
45
47
54
61
11
27,5
99
62
69
76
14
35
126
77
84
91
10
36
n=
40
100
360
Fuente: http://www.grupoargon.com/cofm/temas/Excel_Tema12.html
http://www.saberespractico.com/ordenador/como-hacer-una-grafica-circular-en-excel/
26
10%
8%
8%
PROM 2a16
13%
PROM17a31
PROM32a46
PROM47a61
34%
PROM62a76
27%
PROM77A91
Figura 7
Figura 84
27
3
9
3
2
1
7
0
6
5
1
7
0
7
6
2
9
1
9
7
6
9
1
9
6
Fuente: http://www.icarito.cl/enciclopedia/articulo/primer-ciclo-basico/matematica/datos-y-azar/2009/12/568551-9-3-datos.shtml
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/pictograma.html
5
http://www.disfrutalasmatematicas.com/definiciones/diagrama-de-tallo-y-hojas.html
http://matematicas-maravillosas.blogspot.com/2008/07/diagramas-de-tallo-y-hoja.html
28
Otros componentes
FRECUENCIA ACUMULADA: (Fa) Sumando la frecuencia de una clase determinada
con las frecuencias de las clases posteriores (acumulacin ascendente o creciente) la
cual recibe el nombre de frecuencia absoluta o relativa menos que. Indica cuantos
elementos de la distribucin tienen un valor menor que el lmite inferior de cada clase.
Simblicamente
Sumando la frecuencia de una clase determinada con las de las clases anteriores
(acumulacin descendente o decreciente), recibe el nombre de frecuencia absoluta o
relativa ms de. Indica cuantos elementos de la distribucin tienen un valor mayor el
lmite inferior de cada clase. Simblicamente Fa(-). Su representacin grfica se
llama Ojiva o frecuencia acumulada ms que.
Frecuencias acumuladas absolutas y relativas del ejemplo prctico:
Li
xi
Ls
Fa(+)
Fa(-)
1,5
16,5
40
16,5
24
31,5
3+3=6
40-3=37
31,5
39
46,5
6+5=11
37-3=34
46,5
54
61,5
11
11+11=22
34-5=29
61,5
69
76,5
14
22+14=36
29-11=18
76,5
84
91,5
36+4=40
18-14=4
n=
40
Fa(+)
Fa(-)
Menos de 2
Ms de 2
40
Menos de 17
Ms de 17
37
Menos de 32
Ms de 32
34
Menos de 47
11
Ms de 47
29
Menos de 62
22
Ms de 62
18
Menos de 77
36
Ms de 77
Menos de 92
40
Ms de 92
29
45
40
Frecuencia
35
30
25
Fa(+)
20
Fa(-)
15
10
5
0
9
24
39
54
69
84
Puntajes promedios
corporaciones en la industria del carbn, del gas y la minera. Las ventas del cuarto
trimestre en 2.007 (en millones de dlares) para estas corporaciones son:
Corporacin
Ventas
American Hess
1.645
Atlantic Richfield
4.757
Chevron
8.913
Diamond Shamrock
627
Exxon
24. 612
Quaker State
191
30
HOMBRE
MUJER
ADMINISTRACIN
400
100
EDUCACIN
650
100
HUMANIDADES
150
200
BIOLOGA
250
100
CIENCIAS SOCIALES
200
250
Cantidad
Pagars
550
Bono
3.800
Papel Comercial
4.000
Cantidad
Petrolera
560
Agropecuarias
143
Extractivas
49
Manufactureras
951
31
Feb
Mar
Ab
May
Jun
Jul
Ago
Set
Oct
Nov
Dic
27,2
27,4
27
22.3
18.1
17.2
16.3
19.1
23,
24,4
26
27,1
EDAD
MUJER
<20
>20
<20
>20
ADMINISTRACIN
200
100
80
100
EDUCACIN
450
150
120
100
HUMANIDADES
100
120
150
200
BIOLOGA
180
200
60
100
CIENCIAS SOCIALES
100
190
125
250
20
14
25
24
48
15
10
17
50
25
22
60
30
10
12
20
50
45
99
105
prstamos
32
1000
7206
2227
550
3000
727
973
300
2112
1200
720
1525
784
1670
935
1000
1388
1500
700
1190
954
870
630
554
660
1610
440
1219
1900
254
850
1890
850
586
660
720
2200
452
300
3. Supuestamente un cereal para desayuno incluye 200 pasas en cada caja. Una
muestra de 60 cajas, mostr el siguiente nmero de pasas en cada caja.
a) Lmites reales de la cuarta clase.
b) Frecuencia relativa porcentual.
c ) Marca de clase.
d) Construya el histograma y el polgono de frecuencia.
e) Construya la ojiva ms de.
f) Construya la ojiva menos de
191
193
193
193
195
195
196
196
196
197
197
197
198
198
198
198
198
199
199
199
199
200
200
200
200
200
200
200
200
200
200
200
201
201
201
201
202
202
202
202
202
202
202
202
203
203
203
204
204
204
205
205
205
205
206
206
206
206
206
207
4.La siguiente tabla muestra el saldo en las cajas de ahorro de un determinado banco
de la capital(en dlares)
27
74
149
302
521
37
87
185
303
703
43
100
203
321
758
55
110
215
350
863
57
125
234
404
968
68
127
234
440
980
72
141
252
489
1000
33
a)
b)
c)
d)
e)
El banco considera como cliente preferencial aquel cliente que tenga como
12
14
16
21
28
13
14
16
21
28
13
15
16
21
28
13
15
17
22
28
10
13
15
17
23
28
10
13
15
17
24
29
10
13
16
18
24
29
11
13
16
19
24
29
11
13
16
20
26
30
11
14
16
20
26
30
a)
b)
c)
d)
Menor frecuencia.
e)
Construya el histograma
f)
g)
34
BIBLIOGRAFA
El material presentado es un compendio de referencias bibliogrficas de libros de textos de Estadstica
Aplicada, de diferentes autores:
Mason L.M. (2002) Estadstica bsica para Administracin y Economa. Mxico : Pearson.
Lincon Ch. (2002) Introduccin a la Estadstica. Continental.
Berenson L. (2000) Estadstica Bsica en Administracin. Mxico: McGraw Hill.
Canavos, G. (1987). Probabilidad y Estadstica. Mxico: McGraw Hill.
http://www.aulafacil.com/CursoEstadistica/Lecc-1-est.htm
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%20descriptiva.pdf
http://www.fca.unam.mx/docs/apuntes_matematicas/34.%20Estadistica%20Descriptiva.pdf
http://www.ditutor.com/estadistica/estadistica_descriptiva.html
35