Vous êtes sur la page 1sur 41

INTRODUCCIN A LA

ESTADSTICA
Ing. Ral Acurio del Pino

1-2

Qu significa estadstica?
Estadstica es la ciencia que se
encarga
de
recolectar,
organizar, presentar, analizar
e interpretar datos con el
propsito de ayudar a una
toma de decisiones ms
efectiva.

1-3

Quin usa estadstica?


Las tcnicas estadsticas se usan
ampliamente por personas en
reas
de
ingeniera
comercializacin,
contabilidad,
control de calidad, consumidores,
deportes, administracin de
hospitales, educacin, poltica,
medicina, etctera...

1-4

Tipos de estadsticas
Estadstica descriptiva: mtodos para organizar,
resumir y presentar datos de manera informativa.
EJEMPLO 1: un sondeo de opinin encontr que
49% de las personas en una encuesta saban el
nombre del primer libro en la Biblia. La estadstica
49 describe el nmero de cada 100 personas
que saben la respuesta.
EXAMPLE 2: segn el Consumer Reports, los
dueos de lavadoras de ropa Whirlpool
reportaron 9 problemas por cada 100 mquinas
durante 1995. La estadstica 9 describe el
nmero de problemas por cada 100 mquinas.

1-5

Tipos de estadsticas
Estadstica inferencial: una decisin,
estimacin, prediccin o generalizacin
sobre una poblacin, con base en una
muestra.
Una poblacin es un conjunto de todos
los posibles individuos, objetos o
medidas de inters.
Una muestra es una porcin, o parte, de
la poblacin de inters.

1-6

Tipos de estadsticas
(Ejemplos de inferencia estadstica)

EJEMPLO 1: las cadenas de TV monitorean la


popularidad de sus programas contratando a
Nielsen y otras organizaciones para muestrear
las preferencias de televidentes.
EJEMPLO 2: el departamento de contabilidad
de una empresa elegir una muestra de
facturas para verificar la exactitud de todas las
facturas de la compaa.
EJEMPLO 3: los catadores de vino prueban unas
cuantas gotas para tomar la decisin de liberar
todo el vino para la venta.

1-7

Tipos de variables
Variable cualitativa o de
atributos: la caracterstica o
variable que se estudia no es
numrica.
EJEMPLOS: sexo, afiliacin
religiosa, tipo de automvil que
se posee, lugar de nacimiento,
color de los ojos.

1-8

Tipos de variables
Variable
cuantitativa:
la
variable se puede registrar
numricamente.
EJEMPLO: saldo en una cuenta
de cheques, minutos que
faltan para que termine la
clase, nmero de nios en una
familia.

1-9

Tipos de variables
Las variables cuantitativas se pueden
clasificar como discretas o continuas.
Variables discretas: slo pueden
adquirir ciertos valores y casi
siempre hay brechas entre esos
valores.
EJEMPLO:
el
nmero
de
habitaciones en una casa (1,2,3,...,
etc.).

1-10

Tipos de variables
Las variables cuantitativas se
pueden clasificar como discretas o
continuas.
Variables continuas: pueden tomar
cualquier valor dentro de un
intervalo especfico.
EJEMPLO: el tiempo que toma volar
de Quito a Nueva York.

1-11

Resumen de tipos de variables


DATOS
Cualitativos o de atributos
(tipo de auto que posee)

Cuantitativos o numricos

discretos
(nmero de hijos)

continuos
(tiempo para resolver el examen)

1-12

Fuentes de datos estadsticos

Los problemas de investigacin suelen


requerir datos publicados. Se pueden
encontrar estadsticas relacionadas en
artculos
publicados,
revistas
y
peridicos.
No todos los temas disponen de datos
publicados.
En
esos
casos,
la
informacin deber recolectarse y
analizarse.
Una manera de recolectar datos es
mediante encuestas.

1-13

Niveles de medicin
Nivel nominal: los datos slo
se
puede
clasificar
en
categoras, no se pueden
ordenar.
ELEMPLOS: color de los ojos,
sexo, afiliacin religiosa.

1-14

Niveles de medicin
Mutuamente
excluyente:
un
individuo, objeto o artculo, al ser
incluido en una categora, debe
excluirse de las dems.
EJEMPLO: color de los ojos.
Exhaustivo: cada persona, objeto o
artculo debe clasificarse en al menos
una categora.
ELEMPLO: afiliacin religiosa.

1-15

Niveles de medicin
Nivel ordinal: involucra datos que se
pueden ordenar, pero no es posible
determinar las diferencias entre los
valores de los datos o no tienen
significado.
EJEMPLO: en una prueba de sabor de 4
refrescos de cola, el C se clasific como
nmero 1, el B como nmero 2, el A
como 3 y el D como nmero 4.

1-16

Niveles de medicin
Nivel de intervalo: similar al nivel
ordinal, con la propiedad adicional
de que se pueden determinar
cantidades significativas de las
diferencias entre los valores. No
existe un punto cero natural.
EJEMPLO: temperatura en la escala
de grados Fahrenheit.

1-17

Niveles de medicin
Nivel de razn: el nivel de
intervalo con un punto cero
inicial inherente. Las diferencias
y razones son significativas para
este nivel de medicin.
EJEMPLOS: dinero, altura de los
jugadores de basquetbol de la
NBA.

1-17

Niveles de medicin Reglas:


a) Puede decirse que un valor es igual o
diferente del de otro valor de la variable.
b) Puede decirse que un valor es igual,
mayor o menor que otro.
c) Puede decirse que la diferencia entre
dos valores de la variable es igual, mayor
o menos que la diferencia entre los
valores de otros dos pares de valores de
la variable. O sea pueden efectuarse
vlidamente divisiones entre intervalos.

1-17

Niveles de medicin Reglas:


d) Puede decirse que un valor es
tantas veces mayor o menor que
otro. O sea pueden dividirse con
vlidamente valores de la variable.

1-17

Ejercicios

2-2

Distribucin de frecuencias

Agrupamiento de datos en
categoras que muestran
el
nmero
de
observaciones en cada
categora
mutuamente
excluyente.

2-3

Elaboracin de una distribucin de


frecuencias
pregunta que recoleccin
se desea
de datos
responder (datos originales)

organizacin
de datos

distribucin
de frecuencias

presentacin
de datos
(grfica)

obtencin
de
conclusiones

2-4

Distribucin de frecuencias
Marca de clase (punto medio): punto que
divide a la clase en dos partes iguales. Es el
promedio entre los lmites superior e
inferior de la clase.
Intervalo de clase: para una distribucin
de frecuencias que tiene clases del mismo
tamao, el intervalo de clase se obtiene
restando el lmite inferior de una clase del
lmite inferior de la siguiente.

2-5

EJEMPLO 1
Dr. Acosta es el director de la escuela de
ingeniera y desea determinar cunto estudian los
alumnos en ella. Selecciona una muestra aleatoria
de 30 estudiantes y determina el nmero de horas
por semana que estudia cada uno: 15.0, 23.7, 19.7,
15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9,
20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7,
14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
Organice los datos en una distribucin de
frecuencias.

2-6

EJEMPLO 1

continuacin

Considere las clases 8-12 y 13-17. Las marcas de clase son 10


y 15. El intervalo de clase es 5 (13 - 8).

Horas de estudio
8-12
13-17
18-22
23-27
28-32
33-37

Frecuencia, f
1
12
10
5
1
1

2-7

Sugerencias para elaborar


una distribucin de frecuencias
Los intervalos de clase usados en
la distribucin de frecuencias
deben ser iguales.
Determine un intervalo de clase
sugerido con la frmula: i = (valor
ms alto - valor ms bajo)/nmero
de clases.

2-8

Sugerencias para elaborar


una distribucin de frecuencias
Use el intervalo de clase calculado
sugerido para construir la distribucin
de
frecuencias.
Nota: este es un intervalo de clase
sugerido; si el intervalo de clase
calculado es 97, puede ser mejor usar
100.
Cuente el nmero de valores en cada
clase.

2-9

Distribucin de frecuencia relativa


La frecuencia relativa de una clase se obtiene dividiendo
la frecuencia de clase entre la frecuencia total.
Horas
8 -1 2

F re c u e n c ia ,
f
1

F re c u e n c ia
re la tiv a
1 /3 0 = .0 3 3 3

1 3 -1 7

1 2

1 2 /3 0 = .4 0 0

1 8 -2 2

1 0

1 0 /3 0 = .3 3 3

2 3 -2 7

5 /3 0 = .1 6 6 7

2 8 -3 2

1 /3 0 = .0 3 3 3

3 3 -3 7

1 /3 0 = .0 3 3 3

T O T A L

3 0

3 0 /3 0 = 1

2-10

Representaciones de tallo y hoja


Representaciones de tallo y hoja:
tcnica estadstica para representar un
conjunto de datos. Cada valor numrico
se divide en dos partes: los dgitos
principales son el tallo y el dgito
siguiente es la hoja.
Nota: una ventaja de la representacin
de tallo y hoja comparado con la
distribucin de frecuencias es que no se
pierde la identidad de cada observacin.

2-11

EJEMPLO 2
Pedro logr las siguientes calificaciones en el
doceavo examen de contabilidad del semestre: 86,
79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya
una representacin de tallo y hoja para los datos.

tallo

hoja

89

234568

126

2-12

Presentacin grfica de una


distribucin de frecuencias
Las tres formas de grficas ms usadas son
histogramas, polgonos de frecuencia y
distribuciones de frecuencias acumuladas
(ogiva).
Histograma: grfica donde las clases se
marcan en el eje horizontal y las frecuencias
de clase en el eje vertical. Las frecuencias de
clase se representan por las alturas de las
barras y stas se trazan adyacentes entre s.

2-13

Presentation grfica de una


distribucin de frecuencias
Un polgono de frecuencias consiste en
segmentos de lnea que conectan los
puntos formados por el punto medio de
la clase y la frecuencia de clase.
Una
distribucin
de
frecuencias
acumulada (ogiva) se usa para
determinar cuntos o qu proporcin de
los valores de los datos es menor o
mayor que cierto valor.

2-14

Histograma para las horas de estudio

Frecuencia

14
12
10
8
6
4
2
0
10

15

20

25

Horas de estudio

30

35

2-15

Polgono de frecuencias para las


horas de estudio
14
Frecuencia

12
10
8
6
4
2
0
10

15

20

25

Horas de estudio

30

35

2-16

Distribucin de frecuencias
acumuladas menor que para las
horas de estudio
35

Frecuencia

30
25
20
15
10
5
0
10

15

20

25

Horas de estudio

30

35

2-17

Grfica de barras
Una grfica de barras se puede usar
para describir cualquier nivel de
medicin (nominal, ordinal, de
intervalo o de razn).
EJEMPLO 3: construya una grfica
de barras para el nmero de
personas desempleadas por cada
100.000 habitantes de ciertas
ciudades en 2005.

2-18

EJEMPLO 3

continuacin

Ciudad

Nmero de desempleados
por 100 000 habitantes

Quito
Guayaquil
Cuenca
Machala
Tulcn
Ambato

7300
5400
6700
8900
8200
8900

2-19

# desempleados/100 000

Grfica de barras para los datos de


desempleados
10000
8000

8900
7300

8200

8900

6700
Quito
Guayaquil
Machala
Machala
Tulcn
Ambato

5400

6000
4000
2000
0
1

Ciudades

2-20

Grfica circular
Una grfica circular es en especial til
para desplegar una distribucin de
frecuencias relativas. Se divide un crculo
de manera proporcional a la frecuencia
relativa y las rebanadas representan los
diferentes grupos.
EJEMPLO 4: se pidi a una muestra de
200 corredores que indicaran su tipo
favorito de zapatos para correr.

2-21

EJEMPLO 4

continuacin

Dibuje una grfica circular basada en la siguiente


informacin.

Tipo de zapato

# de corredores

Nike

92

Adidas

49

Reebok

37

Asics

13

Otros

2-22

Grfica cicular para tipos de zapatos


Reebok

Asics
Otros
Nike
Adidas
Reebok
Asics
Otros

Adidas
Nike