Vous êtes sur la page 1sur 34

ESTADISTICA GENERAL

ESTADSTICA
Elaborado por: Lic. Ing. Hugo L. Chunga Gutirrez

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

INTRODUCCIN
La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes
arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, viajes, visitantes,
ingresos, ventas y as sucesivamente.
Algunas personas podran pensar que la enseanza de la estadstica slo interesa a los profesores,
o bien a los investigadores que trabajan en los diferentes departamentos de una universidad. Esta
es una creencia errnea y podemos encontrar Estadsticos en psicologa, economa, medicina,
ingeniera y otras reas.

Qu es la estadstica?
Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de poder
hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
La Estadstica es un mtodo de razonamiento para describir e interpretar informacin, cuya
caracterstica principal es la variabilidad de los datos.

DIVISIN DE LA ESTADSTICA
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica
Descriptiva y la Inferencial.

Estadstica Descriptiva: Se denomina estadstica descriptiva, al conjunto de mtodos estadsticos


que se relacionan con el resumen y descripcin de los datos, como tablas, grficas, y el anlisis
mediante algunos clculos.

Estadstica Inferencial Se denomina inferencia estadstica al conjunto de mtodos con los que se
hacen la generalizacin o la inferencia sobre una poblacin utilizando una muestra. La inferencia
puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario
que stas sean dadas con una medida de confiabilidad que es la probabilidad.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada.
Estas dos partes de la estadstica no son mutuamente excluyentes, ya que para utilizar los mtodos
de la inferencia estadstica, se requiere conocer los mtodos de la estadstica descriptiva.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

TRMINOS DE ESTADSTICA
Los trminos estadsticos que se usan en estadstica es necesario conocerlos para poder entender el
lenguaje estadstico que se utiliza en el desarrollo de la asignatura:
Poblacin: En forma general, en estadstica; se denomina poblacin, a un conjunto de elementos
(que consiste de personas, objetos, etc.), que contienen una o ms caractersticas observables de
naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
La poblacin debe estar perfectamente definida en el tiempo y en el espacio.

Muestra: Es un subconjunto de una poblacin. Una muestra es representativa cuando los


elementos son seleccionados de tal forma que pongan de manifiesto las caractersticas de una
poblacin. Su caracterstica ms importante es la representatividad.
.
Unidad estadstica o Unidad de anlisis o unidad elemental: Es elemento de la poblacin que
reporta la informacin y sobre el cual se realiza un determinado analisis.
La unidad de estudio es la entidad que va a ser objeto de medicin y se refiere al qu o quin es
sujeto de inters en una investigacin.

Parmetro: son aquellos valores que caracterizan numricamente a la poblacin como tal. El
parmetro poblacional de inters es nico (media, varianza, etc.), pero una poblacin puede tener
muchas caractersticas de inters.

Indicador estadstico: Es el dato numrico, resultado de un proceso que cuantifica


cientficamente una caracterstica de una muestra. Es el elemento caracterstico que describe una
situacin permitiendo su anlisis

Diferencia entre dato e informacin


El dato es un elemento aislado, recabado para un cierto fin, pero que no ha pasado por un proceso
que lo interrelacione con otros; mientras que la informacin trata de datos procesados y
relacionados de manera que nos pueden dar pauta a la correcta toma de decisiones
Por lo tanto la diferencia radica en que la informacin se compone de datos que ya han sido
procesados de algn modo para que tengan un sentido y un objetivo al momento de tomar
decisiones.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

La medicin: Los datos se obtienen a travs un proceso llamado medicin. Desde este punto de
vista, puede definirse medicin como el proceso por el cual asignamos una categora (o un valor) a
una variable, para determinada unidad de anlisis.

Variable: Es una caracterstica que puede tomar diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en varias
categoras.
Podemos iniciar el tema indicando que definir las variables me permitir dar respuesta a lo
que quiero estudiar.
Datos: Comnmente se le conoce como observaciones. Son los valores que toma la variable
en cada unidad estadstica.
Son todas aquellas caractersticas o valores susceptibles de ser observados, clasificados y
contados.
La forma de medir las variables va a determinar el anlisis matemtico, estadstico, de las mismas.

Elementos de una variable:


La identificacin y definicin de variables es la tarea ms delicada de toda investigacin y del
trabajo estadstico. Tngase presente que las variables se deducen a partir de los objetivos de
un estudio o investigacin. En consecuencia, para tener xito en la seleccin de variables, es
recomendable distinguir los siguientes elementos:
a) Nombre o denominacin de la variable.
b) Definicin o conceptualizacion de la variable.
c) Un conjunto de categoras o niveles, que es definida por el investigador. Las categoras
no son nicas, lo mnimo es dos categoras y dependen de los objetivos de la
investigacin.
Ejemplo:
Veamos la variable Cualitativa Estado Civil:
a) Nombre: Estado Civil o conyugal
b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes y
costumbres del pas.
c) Categoras:

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

1) Soltero

2) Casado

3) Conviviente

4) Divorciado

5) Viudo

Veamos la variable cuantitativa, Ingreso:


a) Nombre: Ingresos
b) Definicin: Son los recursos monetarios netos, incluyendo todas las bonificaciones que
percibe una persona por su ocupacin principal y secundaria durante el periodo de
referencia de la encuesta.
c) Categoras: Puede proponerse en forma de niveles o simplemente intervalos.
Primera forma:
(01) Alto
(02) Medio
(03) Bajo

Segunda forma:
(01) Menos de 300
(02) De 301 a 500
(03) De 501 a 700
(04) De 701 a mas

CLASIFICACIN DE LAS VARIABLES


Segn su naturaleza:
VARIABLES CUALITATIVAS:
Miden una caracterstica, en trmino de cualidad, nunca de forma numrica.
Cada uno de los valores que puede tomar la variable se llama categoras. Deben incluir todas
las opciones posibles que puede adoptar la variable.

Nominal: Son aquellos variables que establecen la distincin de los elementos en diversas
categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o mas
categoras. Ejemplo: Sexo, Estado Civil, profesiones, etc.

Ordinal: Son aquellas variables que implican orden entre sus categoras, pero no grados de
distancias iguales entre ellas; estn referidas a un orden o jerarqua, donde las categoras
expresan una posicin de orden.
Ejemplo: Grado de instruccin, clases sociales, orden de merito, ciclo de estudios, escala de
dolor: Sin dolor, con poco dolor, con mucho dolor.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

Si las variables cualitativas tienen solo dos categoras se llama variable cualitativa
dicotmica (Ejemplo: Sexo: Hombre. Mujer), y si tiene ms de dos, variable cualitativa
politmica (color de cabello: negro, rubio, castao, pelirrojo)
VARIABLES CUANTITATIVAS:
Miden una caracterstica de forma numrica. Pueden ser:

Variables Discretas: Cuando el valor de la variable resulta de la operacin de contar, su valor


representado solo por nmeros naturales (enteros positivos) o entre dos valores consecutivos
no existe otro valor.
Ejemplo; Nmero de hijos de las pacientes con cncer de mama, Nmero de pacientes
atendidos hospitales.

Variables Continuas: Cuando la variable es susceptible de medirse, es toda variable cuyo


valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Las
variables pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por
cualquier nmero real. Entre dos valores consecutivos se pueden encontrar infinitos valores.
Ejemplo: Peso de los pacientes con tuberculosis, El grado de glucosa en la personas con
diabetes, la talla de los recin nacidos, etc.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

Segn escala de medicin:


De escala nominal: Idem
De escala ordinal: Idem

De escala Intervalo: Mediante esta escala, adems de existir una relacin de orden como la
anterior, implica una relacin de igualdad de diferencias entre pares de objetos respecto a una
caracterstica determinada. Adems las diferencias entre los nmeros se corresponden
puntualmente con las diferencias entre los objetos en la propiedad del objeto de medicin. Pero
el valor cero es arbitrario y convencional. Ejemplos: Temperatura, inteligencia, rendimiento
acadmico y personalidad.

De escala Razn o Proporcin: Mediante esta escala adems de existir una relacin de
igualdad de diferencias como la anterior, considera un punto de origen fijo o natural, el cero
absoluto. El valor cero significa la nulidad o ausencia de la caracterstica o variable que se
estudia; y la

proporcin tiene sentido, ejemplos: Peso, estatura y edad de los alumnos.

Nmero de alumnos, de computadoras, y de fotocopiadoras que posee un colegio.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

EJERCICIOS 01

De los enunciados siguientes Identificar la poblacin, muestra, unidad de anlisis y la


variable (tipo de variable y sus elementos)
1) Se desea saber el estado civil, grado de hemoglobina y el tiempo de gestacin de las mujeres
que se atendieron en ESALUD de la ciudad de Piura en los seis primeros ltimos del ao
anterior.

2) En la a UNP se quiere saber cul es el deporte ms practicado, el tiempo de dedicacin a este


y que das lo practica, de los alumnos la cual se tomo informacin de 200 alumnos elegidos al
azar de las diferentes escuelas de esta universidad en el presente ciclo de estudios.

3) Se desea saber cul es la estatura, el peso y la edad de los nios menores de 5 aos con
enfermedades respiratorias atendidos en los hospitales de la ciudad de Piura, la cual para
obtener esta informacin para la estimacin se eligi solo a tres hospitales de esa ciudad y a
50 nios por cada hospital del presente mes.

4) Una Institucin publica recin creada empleara a 345 personas de las cuales ya estn
seleccionadas, y a travs de los registros de vida obtenemos de que universidad proceden, que
profesin tienen, que cargo ocuparan, estado civil, y el numero de hijos, esta institucin recin
creada en la cuidad de tumbes.

Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA GENERAL

ESTADISTICA DESCRIPTIVA
REPRESENTACIN DE TALLO Y HOJA
Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos
estadsticos tradicionales, y que adems proporciona informacin rpida, visual y es relativamente
nueva, es la representacin grfica de tronco y hoja.
Esta representacin se basa en la ordenacin de los datos a manera de grfico, pero sin llegar a
ello, utilizando las decenas y las unidades.

Ejemplo:
Supongamos la siguiente distribucin de frecuencias que representan la edad de un colectivo de n
= 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas.
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2,
4, que reordenadas son 2, 3 y 4.
A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo
Tallos

Hojas

Por ltimo reordenamos las hojas y hemos terminado el diagrama

Tallos

Lic. Estadstico Hugo Luis Chunga Gutierrez

Hojas

10

ESTADISTICA GENERAL

Ahora supongamos que tenemos las siguiente series edades de otro grupo de personas
35 38 32 28 30 29 27 19 48 40
39

24 24 34 26 41 29 48 28 22

Luego de haber construido el tallo y

hoja de estos datos nos que comparar

1.- El siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemticas:
78 93 61 100 70 83 88 74 97 72 66 73 76

81

83 64 91 70 77 86

2.- representar mediante un diagrama de tallo y hojas los siguientes datos, expresadas en cm:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

3.- Construir una representacin tallo-hoja para el siguiente conjunto de 20 calificaciones.


82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78
4.- Un estudio en una muestra de clientes de una empresa del nmero de llamadas recibidas revel
la siguiente informacin. Desarrolle un diagrama de tallo y hojas. Cuntas llamadas recibe un
cliente tpico? Cules fueron el mayor y el menor nmero de llamadas recibidas?
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55
5.- El BCP se est estudiando el nmero de veces por da que es utilizado su cajero automtico
localizado en esta cuidad. A continuacin se muestra el nmero de veces que fue usado durante los
ltimos 30 das. Desarrolla un diagrama de tallo y hojas. cuntas veces al da fue usado el cajero?
Cules son el menor y el mayor nmero de veces que fue usado? Alrededor de qu nmeros se
agrupa la cantidad de veces que fue usado el cajero?
83, 63, 95, 64, 80, 36, 84, 84, 78, 76, 73, 61, 84, 68, 59, 54, 52, 84, 75, 65, 95, 59, 90, 47, 70,
52, 87, 61, 77, 60

Lic. Estadstico Hugo Luis Chunga Gutierrez

11

ESTADISTICA GENERAL

DISTRIBUCION DE FRECUENCIAS
Qu es una distribucin de frecuencias?
Distribucin de frecuencias es una forma de organizar y resumir los datos con la finalidad de
describir del comportamiento de las variables de inters. Esta organizacin, en su forma tabular,
consiste en presentar la lista de valores de una variable, clases o categoras de datos junto con el
nmero de veces que se repite cada valor de la variable o el nmero de valores que caen dentro de
cada clase o categora respectivamente.
El nmero de veces que se repite cada valor de la variable o el nmero de valores que caen dentro
de cada clase o categora se denominan frecuencias.

CUADROS O TABLAS ESTADSTICAS

Un cuadro estadstico es el arreglo ordenado, columnas y filas, de datos estadsticos o


caractersticas relacionadas, con el objeto de ofrecer informacin estadstica de fcil lectura,
comparacin e interpretacin. Un cuadro estadsticos es le resultado de trabajos previos
(planeamiento, recopilacin, tabulacin, clculos, etc.)

Partes principales:

1) Nmero del Cuadro


2) Titulo, es la descripcin resumida del contenido del cuadro.
Responder a las clsicas preguntas: Que, Donde, Como y Cuando
3) Encabezamiento o conceptos
4) Cuerpo
5) Columna Matriz
6) Fuente
7) Elaboracin

Lic. Estadstico Hugo Luis Chunga Gutierrez

12

ESTADISTICA GENERAL

GRFICOS ESTADSTICOS

En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De


sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema de referencia
(coordenadas), permiten presentar informacin cualitativa y cuantitativa.
La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino
que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los datos,
siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino
tambin para analizarla.

Grficos estadsticos
IMPORTANCIA:

Son esenciales en el estudio y presentacin de trabajos estadsticos.

Permite observar en forma instantnea el comportamiento de la variable.

Permite formar una idea sobre la tendencia de las variables en el futuro.

PRINCIPALES PARTES DE UN GRAFICO

1) Numero del Grafico

2) Titulo:
3) Los Diagramas:
4) Escalas:
5) Leyenda:
6) Fuente:

Lic. Estadstico Hugo Luis Chunga Gutierrez

13

ESTADISTICA GENERAL

CUADROS ESTADSTICOS PARA VARIABLES CUALITATIVAS


En una muestra se recolecto datos sobre el estado civil de 30 personas que laboran en la empresa
EXPORT S.A de la cuidad de Talara.
co

ca

se

co

ca

ca

co

ca

ca

se

se

co

se

co

co

co

se

co

ca

co

so

co

ca

ca

co

co

co

co

co

ca

Donde:
ca: casada
co: conviviente
se: separada
so: soltera

Ejercicios
1. Se escogi un saln de clases de cuarto grado, con un total de 25 estudiantes, y se les pidi que
calificaran del 1 al 5 un programa televisivo.
(5 = Excelente 4 = Bueno 3 = Regular 2= No muy bueno 1 = Malo)
Estos fueron los resultados:
1 3 3 4 1 2 2 2 5 1 2 1 2 4 5 1 5 3 5 1 4 1 2 3 5
2. En el ltimo del mes del ao pasado se realizo en Chile la Reunin del Grupo Andino donde se
tomo datos de los participantes acerca de su nacionalidad.

Donde: P = Per

B = Bolivianos

C = Colombianos E = Ecuatoriano

V = Venezolano

3. En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Negro(N), Blanco(B), Rojo(R), 20 consumidores dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.
4. Al investigar el nivel socioeconmico en los valores: Bajo(B), medio (M), alto(A), 20 familias
dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.

Lic. Estadstico Hugo Luis Chunga Gutierrez

14

ESTADISTICA GENERAL

5. Una empresa encuestadora de mercados pregunta a un conjunto de personas acerca de la


preferencia de un cierto candidato para las prximas elecciones. Los candidatos son A, B, C, D,
E, la pregunta fue: Si las elecciones fueran maana por quien votaria usted?. Los resultados
fueron:
E D A E A B A B A D A B A C A C A B A C A C A B A B A
B A B A B A B A C A C

A D A B E B A A B D A E

6. Se identifico una muestra de autos robados en la ciudad de Piura y se registro la marca de cada
auto. A continuacin se presenta los datos que se obtuvo: (T = Toyota; D = Daewoo; N =
Nissan; W = Volkswagen; H = Hyundai)
T
D
T
N
D

D
W
D
T
N

T
H
T
T
T

H
N
D
D
T

T
H
T
H
N

W
H
H
T
T

D
T
N
W
T

T
H
W
N
D

W
N
H
T
T

T
N
T
D
D

7. Los siguientes datos corresponden a una muestra de 19 reclusos de un Centro penitenciario,


segn el tipo de delito.
V R D D
Donde:
V : violacin,

D R V

D D R

R : robo agravado,

D V

D = Trfico ilcito de drogas

8. Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de
gaseosa que ms consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2
Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1
Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

Lic. Estadstico Hugo Luis Chunga Gutierrez

15

ESTADISTICA GENERAL

GRFICOS PARA VARIABLES CUALITATIVAS


Los grficos ms usuales para representar variables cualitativas son los siguientes:
DIAGRAMA DE BARRAS VERTICAL: Es una forma grafica de representar datos
cualitativos que se han resumido en una distribucin de frecuencias de frecuencias relativas o
porcentuales.

CANTIDAD

75
60
45
30

Superior

Secundaria

Analfabeto

Primaria

15

GRADO DE INSTRUCCIN

GRFICOS SECTORIALES, CIRCULAR O DE PASTEL: Se usa para representar y


comparar la dimensin de las partes de un fenmeno con el fenmeno total. Para su
elaboracin se utiliza la circunferencia, siendo necesario que los valores absolutos y/o
Xi= (360 Fiabs) / N

porcentuales, sean traducidos en GRADOS.

Xi= (360 %) / 100

Otros tipos de grficos estadsticos para datos cualitativos:


GRFICO DE BARRAS COMPUESTAS: Para su elaboracin se debe contar con una tabla
o cuadro de entrada doble.
MASCULINO
FEMENINO

30
20

Superior

Secundaria

Primaria

10

Analfabeto

CANTIDAD

40

GRADO DE INSTRUCCIN

Lic. Estadstico Hugo Luis Chunga Gutierrez

16

ESTADISTICA GENERAL

PACIENTES ATENDIDOS POR TUBERCULOSIS PULMONAR POR GRADO DE INSTRUCCIN


SEGN SEXO

LIMA: ABRIL DEL 2005


GRADO DE
INSTRUCCIN

SEXO

TOTAL

MASCULINO FEMENINO

Analfabeto
13
15
Primaria
35
28
Secundaria
09
07
Superior
02
01
59
51
TOTAL
FUENTE: Hospital Loayza, Oficina de Estadstica

28
63
16
03
110

Investigador piensa que existen variaciones en los abortos en funcin de la condicin


socioeconmica de las familias. Para ello selecciona a seis mujeres de 50 aos pertenecientes a tres
niveles de condicin socioeconmica. El nmero total de hijos nacidos por mujer se refleja en la
siguiente tabla.

Nivel Socioeconmico
Alto Medio Bajo
2
3
1
1
1
1
3
3
2
2
4
4
1
3
1
1
1
1

Lic. Estadstico Hugo Luis Chunga Gutierrez

17

ESTADISTICA GENERAL

Sexo

Edad

Iglesia

Masculino

De 31 a 40

Evanglica

Femenino

De 21 a 30

Masculino

Grado de estudios

Deporte

Fuma

Maestra

Si

No

Muy Insatisfecho

Bueno

Otras

Titulado universitario

Si

No

Ni satisfecho ni insatisfecho

Regular

De 21 a 30

Catolica

Titulado universitario

Si

No

Insatisfecho

Regular

Femenino

De 31 a 40

Otras

Titulado universitario

Si

No

Insatisfecho

Bueno

Masculino

De 31 a 40

Otras

Titulado universitario

Si

Si

Insatisfecho

Regular

Femenino

De 31 a 40

Catolica

Tecnica

No

No

Satisfecho

Bueno

Masculino

De 21 a 30

Otras

Tecnica

Si

Si

Satisfecho

Regular

Masculino

De 31 a 40

Catolica

Tecnica

Si

No

Insatisfecho

Regular

Masculino

De 11 a 20

Evangelica

Titulado universitario

No

No

Insatisfecho

Regular

Masculino

De 21 a 30

Otras

Tecnica

No

No

Satisfecho

Bueno

Masculino

De 11 a 20

Otras

Titulado universitario

No

No

Satisfecho

Regular

Femenino

De 21 a 30

Catolica

Titulado universitario

No

No

Insatisfecho

Bueno

Masculino

De 11 a 20

Catolica

Titulado universitario

Si

Si

Satisfecho

Excelente

Femenino

De 11 a 20

Otras

Titulado universitario

Si

Si

Insatisfecho

Regular

Masculino

De 21 a 30

Evangelica

Doctorado/PhD

No

No

Ni satisfecho ni insatisfecho

Bueno

Masculino

De 21 a 30

Evangelica

Tecnica

Si

Si

Satisfecho

Bueno

Femenino

De 11 a 20

Otras

Maestria

Si

Si

Insatisfecho

Regular

Femenino

De 21 a 30

Evangelica

Titulado universitario

No

No

Satisfecho

Regular

Masculino

De 21 a 30

Otras

Tecnica

Si

Si

Satisfecho

Regular

Masculino

De 31 a 40

Catolica

Tecnica

Si

Si

Satisfecho

Bueno

Masculino

De 11 a 20

Catolica

Titulado universitario

No

No

Satisfecho

Regular

Masculino

De 21 a 30

Evangelica

Maestria

No

No

Satisfecho

Bueno

Masculino

De 31 a 40

Otras

Tecnica

Si

No

Satisfecho

Regular

Femenino

De 21 a 30

Evangelica

Maestria

No

No

Ni satisfecho ni insatisfecho

Bueno

Masculino

De 11 a 20

Evangelica

Maestria

No

No

Satisfecho

Regular

Masculino

De 21 a 30

Otras

Titulado universitario

Si

No

Satisfecho

Regular

Femenino

De 31 a 40

Evangelica

Tecnica

No

No

Satisfecho

Regular

Femenino

De 21 a 30

Catolica

Tecnica

No

No

Satisfecho

Bueno

Masculino

De 21 a 30

Catolica

Tecnica

Si

No

Satisfecho

Regular

Masculino

De 31 a 40

Catolica

Doctorado/PhD

Si

No

Satisfecho

Regular

Lic. Estadstico Hugo Luis Chunga Gutierrez

Grado satisfaccin

Calificacin

18

ESTADISTICA GENERAL

CUADROS ESTADSTICOS PARA VARIABLES CUANTITATIVAS


PARA DATOS AGRUPADOS SIN INTERVALOS.

1.- Se tomo a 20 empresas de transportes de la Ciudad del norte del pas la cual se tiene datos de
la cantidad de quejas por parte de los turistas que visitaron los diferentes puntos tursticos del
norte del pas:
6
5

5
6

4
2

4
4

3
3

3
4

4
6

4
5

5 5
3 2

2.- Ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20 hogares,
marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2,
3, 2, 1, 3, 2, 3, 3, 1, 2,

0,
4.

3.- En una clase de 25 alumnos hemos preguntado la edad de cada uno, obteniendo estos
resultados:
14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14,
13, 14, 14, 14, 15, 14, 16, 14, 15, 15, 13, 14, 15
4.- El siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemticas:
78 93 61 100 70 83 88 74 97 72 66 73 76

81

83 64 91 70 77 86

5.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestacin de la
posta medica San Juan:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

6.- Tenemos un conjunto de 20 calificaciones del curso de estadstica:


82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78
7.- Un estudio en una muestra de clientes de una empresa del nmero de llamadas recibidas revel
la siguiente informacin:
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55

Lic. Estadstico Hugo Luis Chunga Gutierrez

19

ESTADISTICA GENERAL

PARA DATOS AGRUPADOS CON INTERVALOS.


Recorrido

R: Valor mximo Valor mnimo

Numero de intervalos m: 1 + 3,322*log(n)


Amplitud

C: R/m

Exceso

E: R R

donde

tambin

m: 2.5 4 n

R: C x m

Ejemplo:
a. Estos datos corresponden a las puntuaciones de 60 ingresantes a la Escuela de Hoteleria y
Turismo en el ltimo examen de admisin para el ingreso a la UCV Piura.
65
36
49
84
79
56

43
78
37
40
68
72

88
50
60
56
57
46

59
48
76
74
70
51

35
62
52
63
32
80

76
60
48
55
51
54

21
35
61
45
33
61

45
53
34
67
42
69

62
65
55
61
73
50

41
74
82
58
26
35

b. Los ingresos quincenales en dlares (variable X) de 45 personas son:


63
43
64
59
53

89
53
72
60
64

36
70
52
67
76

49
57
51
57
44

56
62
62
67
73

64
43
60
61
56

59
68
71
67
62

35
62
61
51
63

78
26
55
81
60

c. Suponga que usted es el estadstico oficial de un hospital y que el director de esta institucin
le ha pedido que recoja y organice datos relativos a las cirugas que se realizaron los mdicos
en los ultimos 50 meses. Ha obtenido estos datos de mensuales de cirugas en los ltimos 50
meses y ha reflejado esta informacin:
68 72 50 70 65 83 77 78
84 72 84 73 81 84 92 77
78 79 91 102 83 67 66 75
80 79
69 76 94 71 97 95

80 93 71 74 60
57 70 59 85 74
79 82 93 90 101
83 86 69

d. Los datos que se muestran a continuacin, son los cargos (en nuevos soles) por los servicios de
electricidad, agua y gas durante el mes de julio del 2013 en el ministerio de educacin para
una muestra de 50 instituciones educativas:
96
171
157 185
141 149
95 163
108 119

202
90
206
150
183

178 147 102


116 172
111
175 123 128
154 130 143
151 114 135

Lic. Estadstico Hugo Luis Chunga Gutierrez

153
148
144
187
191

197 127
213 130
168 109
166 139
137 129

82
165
167
149
158

20

ESTADISTICA GENERAL

GRFICOS PARA VARIABLES CUANTITATIVAS


HISTOGRAMA:
Es una grafica que se utiliza para representar la distribucin de frecuencias absolutas o
relativas simples.
Consiste en un grupo de rectngulos adyacentes que tienen sus bases en el eje de las abscisas
(donde se representa los intervalos de clase de la variable) y altura igual a las frecuencias de
cada clase.
POLGONO DE FRECUENCIA:
Tambin es un grafico que se utiliza para representar la distribucin de frecuencias absolutas
o relativas simples.
Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante el par de
valores de marca y frecuencia correspondientes. Para fines de grfico, se hace necesario
incrementar un intervalo de clase en cada extremo, con frecuencias cero.

35
30

CANTIDAD

25
20
15
10
5
0
7

12

17
22
27
EDAD (aos)

Lic. Estadstico Hugo Luis Chunga Gutierrez

32

37

21

ESTADISTICA GENERAL

MEDIDAS DE RESUMEN Y MEDIDAS DE DISPERSION

MEDIDAS DE RESUMEN:
En las tres semanas anteriores estn referidos, con cierto detalle, a la clasificacin de variables,
recoleccin de datos, construccin de tablas de frecuencia y a la representacin grafica, como fase
preliminar en la descripcin y anlisis estadstico. El objetivo principal de estas primeros temas,
ha sido determinar la naturaleza y formas de la distribucin de frecuencias, como base para la
reduccin de datos a travs de ciertas caractersticas descriptivas y medidas de resumen.

En el problema de comparar dos o mas distribuciones de frecuencias, puede resultar fcil hacer
una comparacin grafica de las frecuencias, sin embargo, existen dificultades para hacer
comparaciones cuantitativas. Estadsticamente para facilitar este anlisis comparativo es necesario
disponer de algunos indicadores o medidas de resumen.

Para ello estudiaremos las medidas de posiciones centrales y no centrales.

MEDIDAS DE DISPERSIN:

Las medidas de dispersin o variabilidad son nmeros que miden el grado de separacin de los
datos con respecto a un valor central, que generalmente es la media aritmtica. Las principales
medidas de dispersin son:
El rango, el rango intercuartil, la varianza, la desviacin estndar, y el coeficiente de variacin.

Lic. Estadstico Hugo Luis Chunga Gutierrez

22

ESTADISTICA GENERAL

MEDIDAS DE POSICIONES CENTRALES PARA DATOS NO


AGRUPADOS

Son valores que reflejan el centramiento o punto central de la variable estudiada. Son tres: la
media, la mediana y la moda.
MEDIA ARITMTICA ( x )
La media aritmtica de un conjunto de valores de una variable es el promedio de todas las
observaciones. Esto es, se suman todos los valores de la variable y se divide por el nmero de
valores. Esta medida se obtiene mediante la siguiente expresin:
n

xi

i 1

x1 x 2 x3 ........... x n
n

LA MEDIANA ( Me )
La mediana de un conjunto de valores ordenados de una variable, es el valor central.
Si el conjunto de datos tiene un nmero impar de valores entonces la mediana es el valor de la
variable que esta localizado en la parte central y si es par el nmero de valores, entonces la
mediana es el promedio simple de los dos valores de la variable que estn localizados en la parte
si n es impar
central.
si n es impar Me x n 1

Me x n

Cuando se tiene un numero impar

si n es par

si n es par

Cuando se tiene un numero par

1
2

xn xn

Me x n 2 x n

Me

22

LA MODA O EL VALOR MODAL (MO):


Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es
mayor. No tiene porque ser nica.
Ejemplo:

El conjunto: 2 2 5 7 9 9 9 10 10 11 13 tiene la moda Mo = 9

El conjunto: 3 5 8 10 12 16 18 no tiene moda.

El conjunto: 2 3 4 4 4 5 5 7 7 7 9 tiene dos modas 4 y 7; es una distribucin


bimodal.

Lic. Estadstico Hugo Luis Chunga Gutierrez

23

ESTADISTICA GENERAL

EJERCICIOS

1.- Consideremos el peso en kilogramos de una muestra de 13 alumnos deportista de esta


universidad:
65

76

48

48

68

78

90

87

67

72

78 77 84

2.- Supongamos que tenemos datos sobre las edades de 10 alumnos de esta universidad:
18

22

20

19

18

17

21

20

18

23

3.- Tenemos los calificativos de 11 alumnos en el curso de estadstica:


09

10

08

17

14

08

11

14

12

14

14

4.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestacin de la
posta medica San Juan:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

5.- Un estudio en una muestra de clientes de una empresa del nmero de llamadas recibidas revel
la siguiente informacin:
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55

Lic. Estadstico Hugo Luis Chunga Gutierrez

24

ESTADISTICA GENERAL

MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS NO


AGRUPADOS

LOS CUARTILES (Qk):


Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

LOS DECILES (Dk):


Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

LOS PERCENTILES (Pk):


Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

L= valor del centil (medida de la posicin)


K= porcentaje equivalente a la medida de posicin
n= tamao de muestra
Si L resulta un nmero decimal se aproxima a entero y ese es el valor de la posicin del
porcentaje equivalente que estamos calculando.
Ahora si resulta un nmero entero se toma esta posicin junto con la siguiente para que se suman
y se dividan entre dos.

Lic. Estadstico Hugo Luis Chunga Gutierrez

25

ESTADISTICA GENERAL

MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS


Varianza: es el promedio del cuadrado de las distancias entre cada observacin y la media
aritmtica del conjunto de observaciones.
Desviacin tpica o Desviacin estndar: La varianza viene dada por las mismas unidades que la
variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la
desviacin tpica que se define como la raz cuadrada positiva de la varianza.
Es la medida que mide cunto se separan los datos.
Es una medida de dispersin, que nos indica cunto pueden alejarse los valores respecto al
promedio (media), La desviacin slo significa qu tan lejos de lo normal

Coeficiente de variacin de Pearson: Cuando se quiere comparar el grado de dispersin de dos


distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se
utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin
tpica y el valor absoluto de la media aritmtica.
Es una medida que se emplea fundamentalmente para:

Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de
medida. Por ejemplo, kilogramos y centmetros.

Comparar la variabilidad entre dos grupos de datos obtenidos por dos o ms personas distintas.

Comparar dos grupos de datos que tienen distinta media.

Determinar si cierta media es consistente con cierta varianza.

Medida de dispersin
Varianza
Desviacin estndar
Coeficiente de
variacin

Para una poblacin


xi 2

2

n
=

Para una muestra

s2

n 1

s=

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo
tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.
Si CV < =33% el grupo de estudio es mas Homogneo;
Si CV > 33% el grupo de estudio es mas Heterogneo;

Lic. Estadstico Hugo Luis Chunga Gutierrez

26

ESTADISTICA GENERAL

Ejemplos
En la evaluacin a 120 alumnos en 02 asignaturas, se obtienen los siguientes resultados:
1. Examen de Estadstica: x 1 2; s 3 . 5
2. Examen de Investigacin: x 4 5; s 7 . 4
En cual de las pruebas el grupo tiene mayor variabilidad?
Analizar comparativamente la distribucin de los sueldos de los 45 trabajadores de cierta empresa
Directivos
Empleados
Obreros

Desv. Estndar
70
60
90

Media
700
300
250

Con un micrmetro, se realizan mediciones del dimetro de un balero, que tienen una media de
4.03 mm y una desviacin estndar de 0.012 mm; con otro micrmetro se toman mediciones de la
longitud de un tornillo que tiene una media de 1.76 pulgadas y una desviacin estndar de 0.0075
pulgadas. Cul de los dos micrmetros presenta una variabilidad relativamente menor?

Entendiendo la varianza y la desviacin estndar:


Ejemplo: T y tus amigos han medido las alturas de sus perros (en milmetros):
Nombre Perro
Fido
Pulgas
Ringo
Boby
Lindo

Milmetros
600. 00
470. 00
170. 00
430. 00
300. 00

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviacin estndar.

Lic. Estadstico Hugo Luis Chunga Gutierrez

27

ESTADISTICA GENERAL

As

que

la

altura

media

es

394

mm.

Vamos

dibujar

esto

en

el

grfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:
2

Varianza: =

2062 + 762 + (-224)2 + 362 + (-94)2


5

108,520
5

= 21,704

As que la varianza es 21,704.


Y la desviacin estndar es la raz de la varianza, as que:
Desviacin estndar: = 21,704 = 147
y lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a distancia
menos de la desviacin estndar (147mm) de la media:

Lic. Estadstico Hugo Luis Chunga Gutierrez

28

ESTADISTICA GENERAL

Todas las estaturas entre 394 hasta 541. 32 (394 + 147. 32) son normales y estan dentro de los
limites establecidos, en este caso Fido es "Anormal" por estar muy alto.
Todas las estaturas entre 246. 68 hasta 394 (394 - 147. 32) son normales y estan dentro de los
limites establecidos, en este caso Chihua es "Anormal" por estar muy bajito.
As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es normal, o
extra grande o extra pequeo.
Pudieramos decir que la desviacion estandar es la media de la media.

MEDIDAS DE POSICIONES CENTRALES PARA DATOS AGRUPADOS

LA MEDIA ARITMTICA

Los datos se pueden presentar en tablas sin intervalos y en tablas con intervalos, en ambos casos
se usa la Media aritmtica Ponderada
y

Y i f i

M(Y) =

i 1

LA MEDIANA
1. La mediana en tablas sin intervalos
a) Que

n
no coincide con algn Nj se tiene que:
2

b) Que

n
coincide con algn Nj, se tiene que:
2
Entonces: M e :

Lic. Estadstico Hugo Luis Chunga Gutierrez

1
Y j i Y j
2

29

ESTADISTICA GENERAL

2. La mediana en tablas con intervalos


a. Hallamos

n
2
[

LA MODA

La moda en tablas sin intervalos


Una vez agrupados los datos en una tabla de frecuencia, el valor modal ser el valor de la
variable que mas se repite o que tiene la mayor frecuencia. La mayor frecuencia se denotara con

nj .
La moda Mo = n j
2. La moda en tablas con intervalos

MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS


AGRUPADOS
LOS CUARTILAS (QK)
[

DECILES:

PERCENTILES:
[

Lic. Estadstico Hugo Luis Chunga Gutierrez

30

ESTADISTICA GENERAL

MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS


Medida de dispersin
Varianza
Desviacin estndar

Para una poblacin

fi
2

Coeficiente de

fi

n 1

s=

variacin

Para una muestra

EJERCICIOS
CUADRO N 01
NIOS CON ENFERMEDADES RESPIRATORIAS DEL AAHH SAN MARTIN
SEGN EDAD, PIURA JUNIO 2012
Nio con enfermedad
diarreica (fi)
1
4
7
5
3
20

Edad
2
3
4
5
6
Total

CUADRO N 02
ALUMNOS DE EPE DE LA UCV PIURA SEGN PUNTAJES OBTENIDOS
EN ESTADSTICA EN EL 2012
Puntaje
9
10
11
12
13
14
Total

Alumnos (fi)
2
6
10
7
6
5
36

Lic. Estadstico Hugo Luis Chunga Gutierrez

31

ESTADISTICA GENERAL

CUADRO N 03
NMEROS DE HOSPITALES SEGN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN
NUESTRO PAS EN DICIEMBRE DE 2012

[L i , L s >
[90 120>
[120 150>
[150 180>
[180 210>
[210 - 240>
[240 - 270>
[270 300>
Total

xi

fi

Fj

*****

11
13
20
17
15
3
1
80

11
24
44
61
76
79
80
*****

CUADRO N 04
NMEROS DE HOSPITALES SEGN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN
NUESTRO REGION EN DICIEMBRE DE 2012
[L i , L s >
[60 120>
[120 180>
[180 240>
[240 300>
[300 - 360>
[360 - 420>
Total

xi

fi

Fj

*****

14
16
12
10
6
2
60

14
30
42
52
58
60
*****

Lic. Estadstico Hugo Luis Chunga Gutierrez

32

ESTADISTICA GENERAL

MEDIDAS DE DEFORMACIN
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de
barras de la distribucin, con la distribucin normal.

MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el
Coeficiente de Asimetra de Pearson:

Cs

x Mo
S

Cs
o

3( x Me)
S

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha
y negativo cuando existe asimetra a la izquierda.
La interpretacin del coeficiente (1.10) es como sigue:

Cs 0 , la distribucin es con asimetra positiva o con cola a la derecha.


C 0 , la distribucin es con asimetra negativa o con cola a la izquierda.
S, s
C 0 , la distribucin es simtrica.
S, s
S,

Asimetra
Negativa

Lic. Estadstico Hugo Luis Chunga Gutierrez

Asimetra
Positiva

33

ESTADISTICA GENERAL

MEDIDA DE APUNTAMIENTO O KURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos
de distribuciones segn su grado de Kurtosis:
Distribucin mesocrtica (K = 0.5): presenta un grado de concentracin medio alrededor de los
valores centrales de la variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica (K = 1): presenta un elevado grado de concentracin alrededor de los
valores centrales de la variable.
Distribucin platicrtica (K = 0): presenta un reducido grado de concentracin alrededor de los
valores centrales de la variable.

El Estadgrafo de Kurtosis es:

P7 5 P2 5
C o e f i c i e n t e Pe r c e n t i l d e K u r t o s i s
P9 0 P1 0

Lic. Estadstico Hugo Luis Chunga Gutierrez

34