Vous êtes sur la page 1sur 78

1 11 1

S SE EM ME ES ST TR RE E I I/ /9 98 8
D Do oc ce en nt te e: : I In ng g. . R Ro ob be er rt to o M Ma an nc ch he eg go o C C. .
C Co oc ch ha ab ba am mb ba a, , J Ju ul li io o d de e 1 19 99 98 8
Contenido y lmites de la Estadstica
I-1
CONTENIDO Y LMITES DE LA ESTADSTICA
1.1 Antecedentes histricos de la Estadstica.- Toda persona, tanto en el
ejercicio de su profesin como en su actividad cotidiana est en contacto con el
peridico, televisin, Internet, revistas y otros medios, los cuales le ofrecen
informacin en forma de datos.
Todo aquello que se relaciona con la recoleccin, procesamiento, anlisis
e interpretacin de datos cualitativos y cuantitativos pertenece al campo de la
Estadstica.
Consecuentemente, algn conocimiento de Estadstica le ser de utilidad
a la poblacin en general, pero en particular, el conocimiento estadstico ser
vital para quienes estn inmersos en el estudio de la ciencia y la ingeniera, en
cualquiera de sus campos.
La Estadstica surge porque en la mayora de los procesos existe
variabilidad. La variabilidad es el resultado de los cambios que ocurren en las
condiciones en medio de las cuales se realizan dichos procesos.
La Estadstica como tal es el resultado de la unin de dos disciplinas que
evolucionaron independientemente hasta confluir en el siglo XIX: la primera es
el "clculo de probabilidades, que se origina aproximadamente en el siglo XVII
como teora matemtica de los juegos de azar y, la segunda es como "ciencia
del Estado, resultado de la necesidad de efectuar una descripcin numrica de
entidades polticas tales como ciudades, provincias, pases, etc..
Sin embargo, mucho antes del siglo XVII, la gente registraba y utilizaba
datos. El Antiguo Testamento contiene informes sobre levantamiento de
censos. En la Edad Media, los gobernantes empezaron a registrar la propiedad
de la tierra. En el ao 762, Carlomagno solicit la descripcin detallada de la
Contenido y lmites de la Estadstica
I-2
cantidad de siervos que existan en cada feudo. Cerca al ao 1086, Guillermo el
Conquistador orden que se escribiera el Domesday Book, un registro de la
propiedad, extensin y valor de las tierras de Inglaterra. Posteriormente, cerca
al ao 1500, tanto en Inglaterra como en Francia, se efectuaron censos de
bautismos, defunciones y matrimonio, etc..
1.2 Significado de la Estadstica.- Es posible comprender el sentido de la
Estadstica como:
"La Estadstica es una ciencia que utiliza instrumentos de la Matemtica,
particularmente el clculo de probabilidades, para estudiar fenmenos que
dependen del azar (fenmenos aleatorios) a partir de una muestra, tal que las
reglas de comportamiento obtenidas de la muestra se refieran a la poblacin
1.3 Divisin de la Estadstica.- Para un mejor estudio, la Estadstica se
divide en dos partes:
a) Estadstica Descriptiva, cuya funcin es organizar, presentar y resumir los
datos de una poblacin o una muestra, a fin de describir y analizar sus
caractersticas mediante valores numricos y atributos.
Muchas de las tcnicas de la Estadstica Descriptiva se han empleado
desde hace ms de 200 aos y se han originado en estudios y actividades de
censos. La moderna tecnologa de las computadoras, en particular las grficas
por computadora y los paquetes estadsticos, han ampliado en forma
considerable el campo de la Estadstica Descriptiva en los ltimos aos.
b) Estadstica Inferencial, cuya funcin es de induccin o inferencia, es decir,
su propsito es formular leyes generales sobre el comportamiento de los
elementos de una poblacin a partir el examen de una muestra extrada de
ella.
Contenido y lmites de la Estadstica
I-3
La mayor parte de las tcnicas de la Estadstica Inferencial se han
desarrollado en los ltimos 80 aos, en consecuencia, es una rama de las
Estadstica mucho ms reciente que la Estadstica Descriptiva.
1.4 Poblacin y muestra.-
1.4.1 Poblacin.- Es el total de un conjunto de elementos (animales,
personas u objetos) que poseen determinadas propiedades o caractersticas
comunes que los hace distinguibles respecto a elementos de otra poblacin.
Los elementos que caracterizan a una poblacin se denominan parmetros y se
representan mediante las letras del alfabeto griego.
Segn la cantidad de elementos, existen dos tipos de poblacin:
a)Poblacin finita. Es aquella poblacin que est conformada por un
conjunto numerable de elementos. Generalmente se asume a aquella
poblacin con menos de 500.000 unidades.
b)Poblacin infinita. Es aquella que est conformada por un conjunto no
numerable de elementos o cuando la cantidad sobrepasa las 500.000
unidades.
1.4.2. Muestra.- Es un subconjunto de la poblacin y se utiliza con el
propsito de representar la poblacin o universo y permitir los trabajos
empricos. La muestra es aplicable en los universos o poblaciones que no son
manejables puesto que se reducen costos y tiempo y, las conclusiones no
distan mucho de la realidad.
La muestra cumple la funcin de caracterizar los elementos de una
poblacin a partir de un nmero limitado de los elementos de la poblacin. Los
elementos que caracterizan a una muestra se denominan estadgrafos y se
representan por las letras del alfabeto latino.
Contenido y lmites de la Estadstica
I-4
BIBLIOGRAFA:
(1) HINES Walter y MONTGOMERY David (1996): "Probabilidad y Estadstica
para Ingeniera y Administracin. McGraw-Hill, Mxico.
(2) KINNEAR Thomas y TAYLOR James (1994). "Investigacin de mercados.
McGraw-Hill, Mxico.
(3) MILLER Irwin, FREUND John y JOHNSON Richard (1994): "Probabilidad y
estadstica para ingenieros, Mxico.
(4) MOYA Rufino (1988): "Estadstica Descriptiva. Per.
========================
NDICE
Pg.
1.1. Antecedentes histricos de la Estadstica....................................... 1
Contenido y lmites de la Estadstica
I-5
1.2. Significado de la Estadstica......................................................... 2
1.3. Divisin de la Estadstica............................................................. 2
1.4. Poblacin y muestra.................................................................... 3
1.4.1. Poblacin........................................................................... 3
1.4.2. Muestra............................................................................. 3
I I- -1 1
MTODOS DE RECOLECCIN DE DATOS
2.1 Introduccin.- La recoleccin de datos es un proceso que permite reunir
informacin de tal modo que de lugar a describir una poblacin o muestra.
2.2 Fuente de datos.- La recoleccin de datos puede efectuarse a partir de
dos tipos de fuentes:
a)Fuentes primarias. En este caso, la informacin proviene de elementos,
personas o situaciones que se observan en una poblacin o muestra de
modo tal que responda a las necesidades de la investigacin; para ello se
aplica diversos instrumentos tales como: la observacin, entrevista,
cuestionario, experimentacin, lluvia de ideas, grupos focales, etc..
b)Fuentes secundarias. En este caso, la informacin requerida se encuentra en
informes, anuarios, folletos, Internet, etc., y son datos que se recolectan
con propsitos diferentes de las necesidades especficas de la investigacin.
2.3 La observacin.- Es una forma de recoleccin de datos mediante la cual
se utiliza cualquiera de los sentidos, en especial el de la vista, para efectuar un
reconocimiento y registro del comportamiento de las personas, objetos o
sucesos.
2.3.1 Clases de observacin.- En este proceso de conocer y descubrir, la
observacin utiliza distintos procedimientos y adopta modalidades diferentes.
Las distintas formas de observacin que pueden presentarse son las
siguientes:
a) Estructurada o no estructurada. La observacin no estructurada se
denomina tambin simple, ordinaria o libre y consiste en recoger la informacin
sin un guin preestablecido y sin la ayuda de medios o instrumentos
I I- -2 2
especiales. Se utiliza para tener el primer contacto con la realidad, percibir sus
problemas, ordenarlos y formular hiptesis.
La observacin estructurada es conocida tambin como observacin
sistemtica por que sigue un plan determinado para alcanzar propsitos
definidos y utiliza diversos instrumentos para captar los hechos con mayor
objetividad tales como cuadros, anotaciones, escalas, etc..
b) Participante o no participante, segn si el observador obtiene los datos
participando de modo activo o n en la vida de la poblacin o muestra sujeto
de estudio.
c) Individual o en equipo, segn si la observacin se realiza por un individuo o
un equipo, que se hace responsable de la validez, confiabilidad y precisin de
los datos.
Las modalidades anteriores no son excluyentes y en el proceso de
observacin puede utilizarse una modalidad o modalidades combinadas, segn
el plan de observacin y los propsitos de la investigacin.
2.3.2 Ventajas.- Las principales ventajas de la observacin son:
Favorece la recoleccin de la informacin permitiendo que sta sea
independiente del deseo, capacidad y veracidad de los elementos que son
motivos de observacin.
Permite recolectar informacin y efectuar el anlisis de sta sin la necesidad
de intermediarios.
2.3.3 Desventajas.- Las principales desventajas de la observacin son:
La informacin obtenida puede ser distorsionada por los observadores o por
el uso inadecuado de los instrumentos de la observacin.
Constituye un procedimiento muy costoso.
No es conveniente cuando se estudian poblaciones muy numerosas.
I I- -3 3
2.4 La entrevista.- La entrevista es una tcnica de recoleccin de informacin
que consiste en que una persona llamada entrevistador, mediante la
interaccin verbal solicita informacin a otra persona llamada entrevistada.
Los instrumentos que ayudan para lograr una mayor eficacia con el uso
de esta tcnica son: la grabadora, esquemas, filmadoras, etc..
Para efectuar la entrevista puede utilizarse la conversacin libre o el
interrogatorio estructurado. En todos los casos el entrevistador debe conducir
la entrevista empleando un guin o bosquejo de asuntos que oriente sus
tareas.
2.4.1. Tipos de entrevista.- La entrevista puede ser clasificada en dos
grandes grupos:
2.4.1.1 Entrevista no estructurada.- Consiste en dar libre iniciativa al
entrevistado. En este caso se utilizan preguntas abiertas, que son respondidas
por el entrevistado en su vocabulario y segn su capacidad de comprensin.
2.4.1.2 Entrevista estructurada.- El entrevistador utiliza un formulario y
somete a los entrevistados a un mismo orden de preguntas, planteadas con el
mismo nfasis y en los mismos trminos.
2.4.2 Ventajas.- Las ventajas ms importantes de la entrevista son:
Permite obtener informacin que es susceptible de manejo y tratamiento
estadstico.
Es posible obtener informacin sobre situaciones pasadas y actitudes
futuras.
2.4.3 Desventajas.- Las desventajas ms importantes de la entrevista son:
I I- -4 4
La informacin ha obtener depende de la memoria y la buena f del
entrevistado, por lo que existe riesgo de distorsin en la informacin
proporcionada.
Con frecuencia se requiere personal capacitado y bastante tiempo para
llevar a cabo las entrevistas, lo cual significa erogar grandes cantidades de
recursos econmicos.
2.5 El cuestionario.- Es un procedimiento que permite la recoleccin de
informacin aplicando un formulario a una persona denominada encuestada, a
objeto de proporcionar respuestas por escrito y sin la presencia del
encuestador.
2.5.1 Ventajas.- Las ventajas del cuestionario son las siguientes:
Puede aplicarse a una gran cantidad de personas, distribuidas en un rea
geogrfica grande.
El estudio se realiza con menores gastos de adiestramiento de personal y
trabajo de campo, respecto a otras tcnicas
Las respuestas por escrito dan mayor libertad a la expresin y permite
mantener el anonimato de las personas encuestadas.
Se disminuye el riesgo de distorsin de la informacin que proviene de la
presencia e influencia del encuestador.
2.5.2 Desventajas.- Las limitaciones del cuestionario son:
Existe la posibilidad de altos ndices de formularios sin respuestas o de
cuestionarios incompletos.
Existe imposibilidad de cooperar en la comprensin de preguntas y en la
aplicacin de las normas e instrucciones para el llenado del cuestionario.
Existe exclusin de las personas que no saben leer o escribir.
Existe recepcin tarda de cuestionarios y prdidas de cuestionarios por
envos equivocados.
I I- -5 5
2.6 La experimentacin.- En la recoleccin de informacin requerida para
propsitos de estudio se utilizan tambin mtodos experimentales.
Un experimento se dice que es un modelo que est determinado por un
conjunto de condiciones establecidas y por los resultados que se obtienen al
efectuar el experimento en las condiciones establecidas.
Un experimento puede ser de dos clases: deterministico y aleatorio.
2.6.1. Experimento deterministico.- El experimento es deterministico si las
condiciones que se establecen determinan el nico modo en que aparecen los
sucesos o resultados.
2.6.2. Experimento aleatorio.- El experimento es aleatorio si determinadas
las condiciones de modo artificial o independientemente de la voluntad del
experimentador, no es posible determinar los sucesos a obtener.
BIBLIOGRAFA:
(1) HANKE Jhon y REITSCH Arthur (1996). "Pronsticos en los negocios.
Prentice Hall. Mxico.
(2) KINNEAR Thomas y TAYLOR James (1994). "Investigacin de mercados.
McGraw-Hill, Mxico.
(3) MOYA Rufino (1988): "Estadstica Descriptiva. Per.
=========================
NDICE
I I- -6 6
Pg.
2.1. Introduccin............................................................................... 1
2.2. Fuentes de datos........................................................................ 1
2.3. La observacin............................................................................ 1
2.3.1. Clases de observacin......................................................... 1
2.3.2. Ventajas............................................................................ 2
2.3.3. Desventajas....................................................................... 2
2.4. La entrevista............................................................................... 3
2.4.1. Tipos de entrevista............................................................. 3
2.4.1.1. Entrevista no estructurada...................................... 3
2.4.1.2.Entrevista estructurada............................................ 3
2.4.2. Ventajas............................................................................ 3
2.4.3. Desventajas....................................................................... 3
2.5. El cuestionario............................................................................ 4
2.5.1. Ventajas............................................................................ 4
2.5.2. Desventajas....................................................................... 4
2.6. La experimentacin..................................................................... 4
2.6.1. Experimento deterministico................................................. 5
2.6.2. Experimento aleatorio......................................................... 5
Organizacin y presentacin de datos
III-1
ORGANIZACIN Y PRESENTACIN DE DATOS
3.1 Introduccin.- Una vez efectuada la recoleccin de los datos y con el
objeto de proporcionar utilidad a la informacin obtenida, es necesario efectuar
la organizacin de dichos datos para posteriormente presentarlos en forma
tabular y en forma grfica.
3.2 Caracteres de una poblacin o muestra.- Se refieren a los rasgos
distintivos que tiene los elementos que forman la poblacin y la muestra. Estos
rasgos caractersticos pueden ser de dos tipos: cualitativo y cuantitativo, por
lo que esta distincin da lugar a la comprensin del atributo y de la variable.
3.2.1 Atributo.- Son los rangos caractersticos o propiedades cualitativas de
un conjunto de elementos. Los atributos se designan con las primeras letras
del alfabeto (A, B, C).
Los elementos distintos de un atributo se denominan modalidades y se
diferencia con un subndice en las letras utilizadas (a
i
, b
j
, c
k
).
Existen dos clases de atributos:
3.2.1.1 Atributo nominal.- Se refiere al atributo cuyas modalidades son
susceptibles de ordenamiento.
3.2.1.2 Atributo ordinal.- Se refiere a aquel atributo cuyas modalidades
presentan jerarqua o capacidad de ordenamiento.
3.2.2 Variable.- Son los rasgos caractersticos o propiedades cuantificables de
los elementos de una poblacin o una muestra. Una variable se designa con las
ltimas letras del alfabeto (X, Y, Z).
Organizacin y presentacin de datos
III-2
Las magnitudes concretas de una variable se denominan valores y se
diferencia con un subndice en las letras utilizadas (x
i
, y
j
, z
k
).
Existen dos clases de variables:
3.2.2.1 Variable discreta.- Es aquella variable que no permite que entre dos
valores consecutivos pueda incluirse algn valor intermedio.
3.2.2.2 Variable continua.- Es aquella variable que permite que entre dos
valores consecutivos pueda incluirse un valor intermedio.
3.3 Distribucin de frecuencias.- Los datos obtenidos mediante cualquiera
de las tcnicas anteriormente descritas deben ser sometidos a un tratamiento
estadstico, construyendo un cuadro en el cual se presentan las frecuencias de
repeticin de cada modalidad del atributo o valor de la variable.
Las partes esenciales de un cuadro de Distribucin de frecuencias son:
a) Nmero. Es el cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra "Cuadro.
b) Ttulo. Es la identificacin que preside al cuadro y es colocado en la parte
superior del mismo. Debe reunir dos condiciones:
- Debe ser completo, es decir, debe especificar a qu se refieren los
datos presentados en el cuadro, a qu periodo de tiempo y el lugar al
cual se refiere la informacin.
- Debe ser conciso, es decir, el ttulo debe ser breve sin perder la
claridad necesaria.
c) Matriz de datos. Es una matriz que contiene la informacin y consta de un
conjunto de casillas o celdas, dispuestas en columnas y filas.
d) Notas explicativas. Estas notas contienen habitualmente la fuente de los
datos y cualquier aclaracin sobre el contenido del cuadro.
Organizacin y presentacin de datos
III-3
3.4 Distribucin de frecuencias de un atributo.- Para el caso de atributos
nominales u ordinales, una distribucin de frecuencias se construye de la
siguiente manera:
3.4.1 Construccin de un cuadro de Distribucin de Frecuencias.- Para
construir la distribucin de frecuencias de un atributo se deben seguir las
siguientes reglas:
- En la primera columna se nombran las distintas modalidades del atributo.
- En la segunda columna se calcula la frecuencia absoluta (n
i
), es decir, el
nmero de veces que se repite la modalidad del atributo.
- En la tercera columna se calcula la frecuencia relativa (h
i
) que puede ser
expresada en forma de proporcin o porcentaje, mediante la ecuacin
(3.1).
n
n
h
i
i
= (3.1)
En el cuadro (3.1) se muestra el modelo de una Distribucin de
Frecuencias de un Atributo.
CUADRO (3.1)
DISTRIBUCION DE FRECUENCIAS DEL ATRIBUTO A
MODALIDADES
DEL ATRIBUTO A
FRECUENCIA
ABSOLUTA (n
i
)
FRECUENCIA
RELATIVA (h
i
)
a
1
n
1
h
1
a
2
n
2
h
2
a
3
n
3
h
3
... ... ...
a
n
n
n
h
n
TOTAL
Fuente:
Organizacin y presentacin de datos
III-4
3.4.2 Representacin grfica de una distribucin de frecuencias de un
atributo.- La representacin grfica de una distribucin de frecuencias de un
atributo, ya sea nominal ordinal, se efecta mediante un grfico de barras,
una grfica de pastel o un grfico rectangular, de tal manera que pueda
apreciarse la informacin contenida en un golpe de vista.
3.4.2.1 Grfico de Barras.- Consiste en presentar las frecuencias que
corresponden a las diferentes modalidades de un atributo mediante barras,
rectngulos o paraleleppedos, los cuales pueden dibujarse horizontal o
verticalmente, siendo la longitud de las barras igual a la frecuencia absoluta o a
la frecuencia relativa.
El grfico de barras se representa en un sistema de ejes coordenados,
en el cual las modalidades del atributo se representan en el eje de las abscisas
y las frecuencias absolutas o relativas se representan en el eje de las
ordenadas, tal como se muestra en el Grfico (3.1).
Frecuencia
a1 a2 a3 a4
Modalidad del atributo
GRAFICO (3.1)
DISTRIBUCION DE FRECUENCIAS DEL
ATRIBUTO A
3.4.2.2 Grfica de pastel.- Esta grfica es especialmente apropiada para
ilustrar divisiones de una cantidad total, de tal forma que puedan efectuarse
comparaciones de una serie de modalidades del atributo, comparada con el
total.
Organizacin y presentacin de datos
III-5
En este caso, las modalidades del atributo corresponden a cada
segmento del pastel y se representan mediante la ecuacin (3.2).
i i
h p - =
0
360 (3.2)
En la que:
p
i
= porcin del pastel.
h
i
= frecuencia relativa en proporcin.
En el grfico (3.2) se ilustra una grfica de pastel tpico.
GRAFICO (3.2)
DISTRIBUCION DE FRECUENCIAS
DEL ATRIBUTO B
b1
b2
b3
b4
3.4.2.3. Grfica rectangular.- Consiste en representar las modalidades del
atributo mediante segmentos rectangulares. Para tal efecto se construye un
rectngulo de cualquier base y con altura que sea igual al total de elementos
de la poblacin o muestra. El segmento rectangular correspondiente a cada
modalidad se determina tomando los valores de la frecuencia absoluta o
relativa dimensionada en la altura del rectngulo, tal como se muestra en el
Grfico (3.3).
GRAFICO (3.3)
a a
1 1
a a
2 2
a a
3 3
a a
4 4
Organizacin y presentacin de datos
III-6
3.5 Distribucin de frecuencias de una variable.- La informacin
recolectada mediante la observacin, la entrevista, el cuestionario o cualquier
otra tcnica, es sometida a un tratamiento estadstico teniendo en cuenta la
cantidad de observaciones y la cantidad de valores diferentes de la variable,
dando lugar a las llamadas distribuciones de frecuencias de variables
funciones de frecuencia.
Existen dos tipos de distribuciones de frecuencia:
3.5.1 Distribucin Tipo I.- En general, esta distribucin se utiliza para
presentar variables discretas. Es aquella distribucin que se aplica cuando se
han obtenido pocos valores diferentes de la variable. En este caso la
informacin se dispone tomando en cuenta las siguientes normas:
- En la primera columna se escriben los valores de la variable.
- En la segunda columna se anota el nmero de veces que aparece cada valor
de la variable. Este nmero se denomina frecuencia absoluta (n
i
).
- En la tercera columna se registran las proporciones o porcentajes de
aparicin de cada valor diferente de la variable o lo que es lo mismo la
frecuencia relativa (h
i
).
- En la cuarta columna se registran los valores acumulados, en orden
ascendente o descendente, de la frecuencia absoluta. El conjunto conforma
la frecuencia acumulada absoluta (N
i
).
- En la quinta columna se registran los valores acumulados de modo
ascendente o descendente de frecuencia relativa, es decir, la frecuencia
acumulada relativa (H
i
).
El modelo de presentacin para este tipo de distribuciones se muestra en
el cuadro (3.2).
Organizacin y presentacin de datos
III-7
CUADRO (3.2)
DISTRIBUCION DE FRECUENCIAS DE LA VARIABLE X
VALORES DE
LA VARIABLE
X
FRECUENCIA
ABSOLUTA
(n
i
)
FRECUENCIA
RELATIVA
(h
i
)
FRECUENCIA
ACUMULADA
ABSOLUTA
(N
i
)
FRECUENCIA
ACUMULADA
RELATIVA
(H
i
)
x
1
n
1
h
1
N
1
H
1
x
2
n
2
h
2
N
2
H
2
x
3
n
3
h
3
N
3
H
3
... ... ... ... ...
x
n
n
n
h
n
N
n
H
n
TOTAL
Fuente:
Existen dos formas tradicionales de presentar grficamente los datos de
una Distribucin Tipo I. En ambos casos se utiliza un sistema de ejes
coordenados, en el cual se utilizan las abscisas para presentar los valores de la
variable y en las ordenadas las frecuencias observadas.
- Grfico de barras.- El grfico de barras sirve para representar frecuencias
absolutas y relativas mediante barras cuyas alturas corresponden a las
frecuencias de cada valor de variable observada.
- Grfico acumulativo de frecuencias.- En este caso para cada valor de la
variable se levantan ordenadas del tamao de la frecuencia acumulada
absoluta o relativa respectiva. Los brazos continuos en forma de gradas
conforman el grfico acumulativo de frecuencias. Esa lnea discontinua es
una funcin emprica que se simboliza con la ecuacin (3.3).
( )

> =
s s =
< =
=
n
1 i
1
x x
x H
x 0
n
x x N
x
x F
n i
(3.3)
Organizacin y presentacin de datos
III-8
3.5.2 Distribucin de frecuencias de Tipo II.- Este tipo de tratamiento
estadstico se utiliza preferentemente para variables continuas o tambin
cuando se han efectuado muchas observaciones y se han obtenido muchos
valores diferentes de la variable.
Para construir una distribucin de frecuencias de Tipo II se siguen los
siguientes pasos:
- Se determina el nmero de estratos o clases, el cual puede ser fijado
arbitrariamente (segn necesidades de estudio o investigacin) o mediante
la ecuacin (3.4).
n e = (3.4)
En la que:
e = nmero de estratos
n = cantidad total de observaciones
- Se calcula el recorrido o rango de la variable, siendo sta la diferencia del
mayor valor observado y el menor valor observado, es decir:
min max
x x r = (3.5)
- Se determina la longitud del intervalo de clase. Esta distancia puede ser
constante o no. En el caso de tener intervalos de clase de longitud
constante, sta se calcula dividiendo el recorrido de la variable entre el
nmero de estratos.
e
r
c
i
= (3.6)
Segn la ecuacin (3.6), los intervalos de clase se encuentran en funcin
de los estratos, de tal modo que permitan la ordenacin de los datos en forma
exhaustiva y tal que sean mutuamente excluyentes.
Organizacin y presentacin de datos
III-9
- En la primera columna, se colocan los intervalos de clase ( L
i-1
- L
i
).
A este efecto es imprescindible que en cada estrato o clase se diferencie:
- El lmite inferior (L
i-1
).
- El lmite superior (L
i
), valor hasta el cual se puedan incluir los valores
a clasificar.
- En la segunda columna se calcula la marca de clase que es el valor central
de cada intervalo de clase y se designa mediante x
i
, calculndose con la
ecuacin (3.7).
( )
2
1 i i
i
L L
x
+
=

(3.7)
En este caso la marca de clase sirve para transformar una Distribucin
Tipo II en una Distribucin de Tipo I y de esta manera efectuar operaciones
para la determinacin de indicadores estadsticos.
- En la tercera columna se calcula la frecuencia absoluta (n
i
).
- En la cuarta columna se registran los valores de la frecuencia relativa (h
i
).
- En la quinta columna se obtiene la frecuencia acumulada absoluta (N
i
).
- En la sexta columna se registran los valores de la frecuencia acumulada
relativa (H
i
).
En el cuadro (3.3), se muestra el formato de una Distribucin de
Frecuencias de Tipo II.
Organizacin y presentacin de datos
III-10
CUADRO (3.3)
DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE X
INTERVA-
LOS DE
CLASE
(L
i-1
- L
i
)
MARCA
DE CLASE
(X
i
)
FRECUENCIA
ABSOLUTA
(n
i
)
FRECUENCIA
RELATIVA
(h
i
)
FRECUENCIA
ACUMULADA
ABSOLUTA
(N
i
)
FRECUENCIA
ACUMULADA
RELATIVA
(H
i
)
L
o
- L
1
x
1
n
1
h
1
N
1
H
1
L
1
- L
2
x
2
n
2
h
2
N
2
H
2
L
2
- L
3
x
3
n
3
h
3
N
3
H
3
.... ... ... ... ... ...
L
n-1
- L
n
x
n
n
n
h
n
N
n
H
n
TOTAL
Fuente:
La Distribucin de Tipo II implica prdida de informacin, debido a que
los valores observados se tabulan en intervalos de clase, a diferencia, de la
Distribucin Tipo I donde la informacin se tabula tal como es, sin ninguna
prdida.
La Distribucin Tipo II puede representarse grficamente mediante:
- Histograma.- En un sistema de ejes coordenados, empleando rectngulos
cuyas alturas representan los valores de las frecuencias, se utiliza el eje de
las abscisas para representar los intervalos de clase (L
i-1
- L
i
) y en el eje de
ordenadas se representan los valores de las frecuencias absolutas o
relativas.
En el histograma de frecuencias, si los puntos medios de los rectngulos
(marcas de clase) se unen mediante una lnea se forma el polgono de
frecuencias.
Organizacin y presentacin de datos
III-11
- Polgono acumulativo de frecuencias u ojiva.- En un sistema de ejes
coordenados se utilizan las abscisas para representar los valores de los
intervalos de clase y en el eje de ordenadas se representan las frecuencias
acumuladas absolutas o relativas. Para obtener el polgono, se une los
puntos lmites de los intervalos de clase correspondientes a las ordenadas
cuyo valor es de la frecuencia acumulada.
BIBLIOGRAFA:
(1) MOYA Rufino (1988): "Estadstica Descriptiva. Per.
========================
NDICE
Pg.
3.1. Introduccin...................................................................................... 1
3.2. Caracteres de una poblacin o muestra................................................ 1
3.2.1. Atributo................................................................................ 1
3.2.1.1. Atributo nominal............................................................ 1
3.2.1.2. Atributo ordinal............................................................. 1
3.2.2. Variable.................................................................................. 1
3.2.2.1. Variable discreta.......................................................... 2
3.2.2.2. Variable continua......................................................... 2
3.3. Distribucin de Frecuencias................................................................ 2
3.4. Distribucin de frecuencias de un atributo............................................ 3
3.4.1. Construccin de un cuadro de Distribucin de Frecuencias............ 3
3.4.2. Representacin grfica de una distribucin de frecuencias de un
atributo............................................................................................. 4
3.4.2.1.Grfica de barras............................................................ 4
3.4.2.2.Grfica de pastel............................................................. 4
3.4.2.3.Grfica rectangular......................................................... 5
3.5. Distribucin de frecuencias de una variable........................................... 6
3.5.1. Distribucin Tipo I...................................................................... 6
3.5.2. Distribucin Tipo II..................................................................... 6
Medidas de posicin
IV-1
MEDIDAS DE POSICIN
4.1 Medidas descriptivas.- Una vez efectuada la organizacin y presentacin de
los datos mediante la Distribucin de frecuencias y su representacin grfica, es
necesario calcular ciertos valores que permitan resumir y transmitir los principales
rasgos o caractersticas de la informacin recolectada.
Estos valores se cuantifican a travs de ciertas medidas, entre las cuales se
tiene: las medidas de posicin, las medidas de dispersin, las medidas de
asimetra, las medidas de curtosis, etc..
4.2 Medidas de posicin.- En este caso, las medidas de posicin son aquellas
que describen la posicin que ocupa la distribucin de frecuencias respecto a un
valor de la variable o modalidad del atributo.
Las medidas de posicin ms conocidas son: moda, mediana, media
aritmtica, media cuadrtica, media armnica, media geomtrica, cuartiles, deciles
y percentiles.
4.3 La moda.- La moda es una medida de posicin que corresponde al valor de la
variable o modalidad del atributo determinada por la frecuencia (absoluta o
relativa) con mayor valor. La moda se denota frecuentemente por Mo, Mo(x), etc..
En el caso de que una distribucin de frecuencia tuviera una sola moda se
denomina unimodal, si tiene 2 modas se llama bimodal y si tiene ms de tres
modas se denomina multimodal.
4.3.1 Clculo de la moda.- Para la obtencin de la moda se consideran dos
procedimientos:
Medidas de posicin
IV-2
4.3.1.1 Primer procedimiento.- Se aplica en el caso de estar presentes frente a
una Distribucin de Tipo I o una Distribucin de frecuencias de un atributo, siendo
la moda el valor de la variable o la modalidad del atributo correspondiente a la
frecuencia con mayor valor.
4.3.1.2 Segundo procedimiento.- Se aplica cuando los datos se han agrupado
en una Distribucin Tipo II y se utiliza la ecuacin (4.1).
2
d
1
d
i
c
1
d
1 i
L Mo
+
+

= (4.1)
En la que:
L
i-1
= Lmite inferior correspondiente al intervalo con
la frecuencia absoluta con mayor valor.
c
i
= Longitud del intervalo de la clase modal.
d
1
= n
i
-n
i-1
d
2
= n
i
-n
i+1
n
i
= frecuencia absoluta correspondiente a la clase modal.
4.3.2 Ventajas de la moda.- Las principales ventajas de la moda son:
- La moda se puede utilizar como una medida de posicin para datos cualitativos
como cuantitativos.
- La moda no est afectada por los valores extremos.
4.3.3 Desventajas de la moda.- Las principales desventajas de la moda son:
- En muchos casos, no existe un valor modal, puesto que el conjunto de datos no
contiene valores que se repiten ms de una vez.
- Cuando el conjunto de observaciones contiene dos, tres o ms modas, stas
son difciles de interpretar y comparar.
Medidas de posicin
IV-3
4.4 La mediana.- La mediana se define como el valor de la variable tal que si se
ordenan los valores en forma creciente o decreciente, divide en dos partes iguales
la distribucin. La mediana frecuentemente se denota por: Me, Me(x), , etc..
4.4.1 Clculo de la mediana.- En el clculo de la mediana es posible distinguir
tres procedimientos.
4.4.1.1 Primer procedimiento.- Se utiliza en caso de que los valores de la
variable no se encuentren agrupados. En este caso se aplica el concepto de la
mediana para determinar su valor, considerando los siguientes pasos:
- Se ordenan los valores no agrupados en forma ascendente o descendente.
- Si el nmero de datos es impar el valor de la mediana corresponde al valor de
la variable que ocupa la posicin central.
- Si el nmero de datos es par el valor de la mediana es el promedio aritmtico
de los valores centrales de la variable.
4.4.1.2 Segundo procedimiento.- Se aplica para datos agrupados en
distribuciones Tipo I y para su clculo se siguen los siguientes pasos:
- Se determina la cantidad media del universo, es decir: n/2.
- Se ubica el valor n/2 entre dos valores consecutivos de la frecuencia acumulada
absoluta, tal que el lmite superior sea mayor o igual a n/2.
i i
N
n
N s <

2
1
En tal caso se presentan dos situaciones:
- Si N
i
> n/2, entonces el valor de la mediana es igual al valor de la
correspondiente x
i
, es decir:
i
x Me =
(4.2)
- Si N
i
= n/2, entonces el valor de la mediana es el promedio de los valores
centrales de la variable, es decir:
Medidas de posicin
IV-4
2
1 +
+
=
i i
x x
Me (4.3)
4.4.1.3 Tercer procedimiento.- Se utiliza cuando se manejan distribuciones Tipo
II y se siguen los pasos que a continuacin se detallan:
- Se determina la cantidad media del universo, es decir: n/2.
- Se ubica el valor n/2 entre dos valores consecutivos de la frecuencia acumulada
absoluta, tal que el lmite superior sea mayor o igual a n/2.
i i
N
n
N s <

2
1
En tal caso se pueden presentar dos casos:
- Si N
i
> n/2 entonces el valor de la mediana se calcula con la ecuacin
(4.4).
1
1
1
2

|
.
|

\
|

+ =
i i
i i
i
N N
N
n
c
L Me (4.4)
- Si N
i
= n/2 entonces el valor de la mediana corresponde al lmite inferior
del intervalo al cual pertenece el valor de N
i
, es decir:
1
=
i
L Me (4.5)
4.4.2 Ventajas de la mediana.- Las ventajas de utilizar la mediana son:
- La mediana es fcil de entender y puede ser calculada en cualquier clase de
datos.
- La mediana es afectada por el nmero de observaciones y no por la presencia
de valores extremos.
4.3.3 Desventajas de la mediana.- Las desventajas de emplear la mediana son:
- Se deben organizar los datos antes de realizar cualquier tipo de clculo. Esto
consume mucho tiempo para un conjunto de datos con muchos elementos.
Medidas de posicin
IV-5
- La mediana no es adecuada para efectuar manipulaciones algebraicas
posteriores.
4.5 La media aritmtica.- Es una de las medidas de posicin ms conocidas y
utilizadas en el campo de la Estadstica y se define como el valor del centro de
gravedad de la distribucin. La media aritmtica acta como punto de equilibrio o
balanceo del conjunto de valores, de modo que las observaciones que son
menores se equilibran con las mayores. En forma simblica se expresa como: ,

x
, M(x), etc..
4.5.1 Clculo de la media aritmtica.- Dependiendo del tipo de Distribucin en el
que se presentan los datos, se tiene:
4.5.1.1 Primer procedimiento.- Se aplica en datos no agrupados y se determina
como la suma de los valores de la variable dividida entre el nmero de ellos, en
otras palabras, empleando la ecuacin (4.6).

=
n
x
i
(4.6)
4.5.1.2 Segundo procedimiento.- Se utiliza cuando se tiene una distribucin Tipo
I y se obtiene aplicando cualquiera de las siguientes ecuaciones:

=
n
n x
i i
(4.7)

=
i i
h x (4.8)
4.5.1.3 Tercer procedimiento.- Se aplica en Distribuciones Tipo II y se obtiene
aplicando la expresin utilizada para Distribuciones Tipo I, pero obteniendo
previamente, las marcas de clase que vendran a conforman los valores de x
i
en la
ecuacin.
Medidas de posicin
IV-6
Cabe resaltar que la media aritmtica que se obtiene utilizando las
ecuaciones (4.7) y (4.8) es un valor aproximado al valor de la media aritmtica
que se obtendra si se utilizara la ecuacin (4.6), puesto que al ser la marca de
clase un valor representativo del intervalo analizado, no toma en cuenta los
valores que se encuentran en dicho intervalo.
4.5.2 Propiedades de la media aritmtica.- La media aritmtica como medida de
posicin goza de las siguientes propiedades:
- La media aritmtica de una constante es la constante misma.
( ) k k M = (4.9)
- La media aritmtica de una variable multiplicada por una constante es igual a la
constante por la media de la variable.
( ) ( ) x kM k M = (4.10)
- La media aritmtica de una variable ms/menos una constante es igual a la
media aritmtica del variable ms/menos la constante.
( ) ( ) x M k x k M = (4.11)
- Si una variable x es particionable mediante r variables, es decir:
r
x .. .......... x x x x =
3 2 1
ntes independie x var.
entonces se cumple:
( ) ( )
r
x ... .......... x x x M x M =
3 2 1
( ) ( ) ( ) ( ) ( )
r
x M . .......... x M x M x M x M =
3 2 1
(4.12)
4.5.3 Ventajas de la media aritmtica.- La media aritmtica tiene las siguientes
ventajas:
- Es un concepto conocido e intuitivo a la mayora de las personas.
- Es una medida que es nica, puesto que cada conjunto de datos tiene una y
slo una media aritmtica.
- Para su clculo se toma en cuenta todas las observaciones del conjunto de
datos.
Medidas de posicin
IV-7
4.5.4. Desventajas de la media aritmtica.- El uso de la media aritmtica
presenta las siguientes desventajas:
- Puede estar afectada por valores extremos que no son representativos del resto
de las observaciones.
- El clculo de la media aritmtica es tedioso por que se utilizan todas las
observaciones para efectuar los clculos.
- No es posible calcular la media aritmtica para un conjunto de datos que tiene
intervalos de clase abiertos en los extremos.
4.6 Otras medidas de posicin.-
4.6.1 La media armnica.- La media armnica es una medida que se utiliza
preferentemente cuando los datos tienen unidades que se encuentran divididas en
unidades de tiempo, es decir, sustituye a la media aritmtica como indicador de
posicin cuando los datos se refieren a determinadas tasas de utilizacin.
La media armnica se calcula con la ecuacin (4.13).
. .=

(4.13)
4.6.2 La media geomtrica.- La media geomtrica es una medida que se emplea
en casos en los que la variable se presenta en porcentaje, especialmente en tasas
de crecimiento de tipo poblacional (crecimientos geomtricos).
La media geomtrica se calcula con la ecuacin (4.14).
. .= (4.14)
4.6.3 Cuantiles.- Los cuantiles permiten dividir a los datos en otras proporciones,
siendo un concepto extendido de la mediana. Los cuantiles ms usados en el
anlisis estadstico son: cuartiles, deciles y percentiles.
Medidas de posicin
IV-8
4.6.3.1 Cuartiles.- Los cuartiles son valores que dividen a un conjunto de datos
ordenados en forma ascendente o descendente en cuatro partes iguales.
4.6.3.2 Deciles.- Los deciles son valores que dividen a un conjunto de datos
ordenados en forma ascendente o descendente en diez partes iguales.
4.6.3.3 Percentiles.- Los percentiles son valores que dividen a un conjunto de
datos ordenados en forma ascendente o descendente en cien partes iguales.
BIBLIOGRAFA:
(1) MOYA Rufino (1988): Estadstica Descriptiva. Per.
====================
Medidas de posicin
IV-9
NDICE
Pg.
4.1. Medidas descriptivas............................................................................................ 1
4.2. Medidas de posicin.. 1
4.3. La moda........................................................................................... .................... 1
4.3.1. Clculo de la moda.................................................................................... 1
4.3.1.1.Primer procedimiento.................................................................... 1
4.3.1.2.Segundo procedimiento................................................................. 2
4.3.2. Ventajas de la moda.................................................................................. 2
4.3.3. Desventajas de la moda............................................................................ 2
4.4. La mediana....................................................................................... .................... 3
4.4.1. Clculo de la mediana............................................................................... 3
4.4.1.1.Primer procedimiento.................................................................... 3
4.4.1.2.Segundo procedimiento................................................................. 3
4.4.1.3.Tercer procedimiento..................................................................... 4
4.4.2. Ventajas de la mediana............................................................................. 4
4.4.3. Desventajas de la mediana....................................................................... 4
4.5. La media aritmtica.............................................................................................. 5
4.5.1. Clculo de la media aritmtica................................................................. 5
4.5.1.1.Primer procedimiento 5
4.5.1.2.Segundo procedimiento.. 5
4.4.1.3 Tercer procedimiento 5
4.5.2. Propiedades de la media aritmtica.......................................................... 6
4.5.3. Ventajas de la media aritmtica................................................................ 6
4.5.4. Desventajas de la media aritmtica........................................................... 7
4.6. Otras medidas de posicin................................................................................... 7
4.6.1. La media armnica.................................................................................... 7
4.6.2. La media geomtrica................................................................................. 7
4.6.3. Cuantiles..................................................... 7
4.6.3.1. Cuartiles....................................................................................... 8
4.6.3.2. Deciles.......................................................................................... 8
4.6.3.3. Percentiles 8
Medidas de dispersin, comparacin y asimetra
V-1
MEDIDAS DE DISPERSIN, COMPARACIN Y ASIMETRA
5.1 Medidas de dispersin.- Las medidas de dispersin son aquellas que
permiten determinar el grado en que los datos tienden a esparcirse en
referencia a una medida de posicin (generalmente la media aritmtica).
Las principales medidas de dispersin son:
- El recorrido de la variable.
- La desviacin media absoluta.
- La varianza.
- La desviacin standard.
En trminos generales, si cualquiera de las medidas anteriores adopta
valores grandes, se dice que existe una dispersin elevada y, por el contrario,
si el valor es pequeo, la dispersin tambin es pequea.
5.1.1 El recorrido de la variable.- Es la medida ms sencilla y de clculo
ms fcil puesto que proporciona una indicacin global de la dispersin.
El clculo del recorrido de la variable se efecta mediante la diferencia
del valor mximo y el valor mnimo de los valores observados para la variable,
es decir:
min max
x x r = (5.1)
En ciertas ocasiones el recorrido ofrece una medida errnea de la
dispersin, debido a que para su clculo slo se emplean los valores extremos
y se ignora la naturaleza de la variacin entre todas las dems observaciones,
adems est altamente influenciado por los valores extremos.
5.1.2. Desviacin media absoluta.- Es la media aritmtica en valor absoluto
de las desviaciones de los valores observados de la variable respecto de la
media aritmtica. Se calcula mediante las ecuaciones (5.2) y (5.3).
Medidas de dispersin, comparacin y asimetra
V-2
- Para datos no agrupados:


=
n
x
DMA
i
(5.2)
- Para datos agrupados.


=
n
n x
DMA
i i
(5.3)
La desviacin media absoluta est expresada en las mismas unidades de
la variable y se puede utilizar como medida de dispersin en todas aquellas
distribuciones en las que la medida de tendencia central ms significativa es la
media aritmtica.
La desviacin media absoluta presenta las siguientes ventajas:
- En su clculo se utiliza todas las observaciones.
- Es menos sensible a la presencia de valores extremos respecto al recorrido
de la variable.
La desviacin media absoluta presenta las siguientes desventajas:
- Su manejo algebraico es complicado.
- Su interpretacin terica es relativamente difcil.
5.1.3. Varianza.- La varianza se define como la media aritmtica del cuadrado
de las desviaciones de los valores de la variable respecto de la media
aritmtica.
La varianza se representa mediante: o
2
, V(x), VAR(x), o
2
x
, etc..
5.1.3.1 Clculo de la varianza.- Dependiendo de si los datos se encuentran
agrupados o n, la varianza se calcula mediante dos procedimientos:
5.1.3.1.1 Para datos no agrupados.- Cuando la cantidad de datos es
pequea, para su clculo se aplica su misma definicin.
Medidas de dispersin, comparacin y asimetra
V-3
( )


= o
n
x
i
2
2
(5.4)
Si la cantidad de datos es relativamente numerosa es mejor aplicar la
ecuacin (5.5).
2
2
2
= o

n
x
i
(5.5)
5.1.3.1.2 Para datos agrupados.- Este caso se presenta cuando los datos se
agrupan en una Distribucin Tipo I o cuando los datos de una Distribucin Tipo
II se reducen a una Distribucin Tipo I. La varianza se calcula aplicando la
definicin de la siguiente manera:
( )


= o
n
n x
i i
2
2
(5.6)
( )

= o
i i
h x
2
2
(5.7)
El desarrollo de la ecuacin (5.6) permite el clculo de la varianza de un
modo operativo ms simple, dando origen a la ecuacin (5.8).
2
2
2
= o

n
n x
i i
(5.8)
5.1.3.2 Propiedades de la varianza.- La varianza goza de las siguientes
propiedades:
- La varianza de un conjunto de datos siempre es un nmero no negativo.
( ) 0 > x V (5.9)
- La varianza de una constante es 0.
( ) 0 = k V (5.10)
- La varianza de una variable ms/menos una constante es igual a la varianza
de la variable.
( ) ( ) x V k x V = (5.11)
- La varianza de la variable multiplicada por una constante es igual al
cuadrado de la constante por la varianza de la variable.
( ) ( ) x V k kx V
2
= (5.12)
Medidas de dispersin, comparacin y asimetra
V-4
5.1.4 Desviacin standard.- En vista de que las unidades de la varianza
estn elevadas al cuadrado, esto representa un inconveniente en cuanto a la
interpretacin de esta cantidad. En la prctica se utiliza otra medida basada en
el valor de la varianza que sirve para dar una medida de la dispersin en la
misma unidad en la que estn los datos. Este indicador es la desviacin
standard o desviacin tpica.
La desviacin standard es la raz cuadrada positiva de la varianza y est
expresada en las mismas unidades de la variable. Se representa por o y se
calcula mediante cualquiera de las siguientes ecuaciones:
- Para datos no agrupados:
( )


= o
n
x
i
2
(5.13)

= o
2
2
n
x
i
(5.14)
- Para datos agrupados:
( )


= o
n
n x
i i
2
(5.15)

= o
2
2
n
n x
i i
(5.16)
5.2 Medidas de comparacin.- Para efectuar comparaciones entre dos
distribuciones de frecuencias se buscan indicadores que no estn expresados
en la escala de la medida de la variable y que manejen nmeros abstractos.
Estas medidas son llamadas tambin medidas de dispersin relativa y las
ms utilizadas son:
- Coeficiente de variacin.
- Variable standarizada.
Medidas de dispersin, comparacin y asimetra
V-5
5.2.1 Coeficiente de variacin.- Es la relacin que se establece entre la
desviacin standard y la media aritmtica, es decir, expresa la desviacin
standard existente en la distribucin por unidad de media aritmtica.
El coeficiente de variacin se calcula con la ecuacin (5.17).

o
= . V . C (5.17)
El coeficiente de variacin es til cuando se comparan la variabilidad de
dos ms conjuntos de datos que difieren de modo considerable en las
magnitudes de las observaciones.
5.2.2 Variable standarizada.- Permite conocer el nmero de desviaciones
standard que una observacin en particular ocupa por encima o por debajo de
la media aritmtica. Se calcula con la ecuacin (5.18).
( )
o

=
i
i
x
z (5.18)
Si el signo de "z es positivo significa que la variable analizada (x
i
) es
mayor que la media aritmtica y si es negativo es menor que la media
aritmtica.
5.3 Medidas de asimetra.- En forma general, el grfico de una distribucin
de frecuencias se relaciona con un eje vertical o eje de simetra, el cual
atraviesa el punto ms alto de la distribucin. En trminos de este eje de
simetra, la representacin grfica de una distribucin se califica como
simtrica o asimtrica.
El concepto de asimetra de una distribucin indica la deformacin
horizontal de las distribuciones de frecuencia.
Medidas de dispersin, comparacin y asimetra
V-6
Una grfica de distribucin de frecuencias se dice que es simtrica
cuando los valores de posicin: media, mediana y moda, tienen el mismo valor,
es decir, las dos partes divididas mediante el eje de simetra son iguales.
Cuando la grfica de una distribucin de frecuencias tiene "cola, "falda
o "rama estirada a la derecha o izquierda, se dice que es sesgada o
asimtrica a la derecha o a la izquierda, respectivamente. En este caso la
mediana, la moda y la media tienen valores no coincidentes, es decir:
- Asimetra positiva o derecha: Mo s Me s
- Asimetra negativa o izquierda: s Me s Mo
Una medida que cuantifica la asimetra es el momento de tercer orden
respecto a la media aritmtica, que se obtiene mediante las ecuaciones (5.19)
y (5.20).
- Para datos no agrupados:
( )


=
n
x
m
i
3
3
(5.19)
- Para datos agrupados.
( )


=
n
n x
m
i i
3
3
(5.20)
Si:
- m
3
= 0, la distribucin es simtrica.
- m
3
< 0, la distribucin es asimtrica a la izquierda.
- m
3
> 0, la distribucin es asimtrica a la derecha.
BIBLIOGRAFA:
(1) MOYA Rufino (1988): "Estadstica Descriptiva. Per.
Medidas de dispersin, comparacin y asimetra
V-7
==========================
Medidas de dispersin, comparacin y asimetra
V-8
NDICE
Pg.
5.1. Medidas de dispersin.......................................................................... 1
5.1.1. El recorrido de la variable............................................................ 1
5.1.2. Desviacin media absoluta......................................................... 1
5.1.3. Varianza................................................................................... 2
5.1.3.1.Clculo de la varianza...................................................... 2
5.1.3.1.1.Para datos no agrupados...................................... 2
5.1.3.1.2.Para datos agrupados........................................... 3
5.1.3.2.Propiedades de la varianza............................................... 3
5.1.4. Desviacin standard................................................................... 4
5.2. Medidas de comparacin...................................................................... 4
5.2.1. Coeficiente de variacin.............................................................. 5
5.2.2. Variable standarizada................................................................. 5
5.3. Medidas de asimetra........................................................................... 5
Medidas de dispersin, comparacin y asimetra
V-9
UNIVERSIDAD MAYOR DE SAN SIMN
FACULTAD DE CIENCIAS Y TECNOLOGA
DEPARTAMENTO DE MATEMTICAS
ESTADSTICA I
CAPTULO V
"MEDIDAS DE DISPERSIN, COMPARACIN
Y ASIMETRA"
SEMESTRE: I/2004
Docente: Ing. Roberto Manchego C.
Cochabamba, Febrero de 2004
Clculo de probabilidades
V VI I- -1 1
CLCULO DE PROBABILIDADES
6.1 Antecedentes.- La probabilidad es un concepto utilizado con bastante
frecuencia en el cotidiano desenvolvimiento de nuestras actividades puesto que cada
uno debe tomar decisiones y en la mayor parte de los casos existe incertidumbre
respecto a los resultados posibles.
Con ms razn, en el desarrollo de las actividades profesionales, al momento
de tomar alguna decisin administrativa, tcnica, econmica, etc., el valor de la
probabilidad proporciona una herramienta que sirve de apoyo a la decisin ms
adecuada.
6.2 Espacio muestral.- Es el conjunto de resultados o sucesos posibles e
imaginables del experimento aleatorio.
Un espacio muestral puede expresarse mediante las modalidades que
permiten expresar un conjunto, es decir, por extensin y comprensin.
- Por extensin, implica describir y enumerar los distintos sucesos.
- Por comprensin, implica incluir los sucesos en un concepto.
6.2.1 Sucesos de un espacio muestral.- El elemento que compone el espacio
muestral se denominan suceso y puede clasificarse en simple y compuesto.
- Un suceso es simple cuando no es posible su descomposicin en otros sucesos.
Por ejemplo, en el lanzamiento de un dado, la aparicin de cualquiera de los
nmeros en la cara superior, es un suceso simple.
- Un suceso es compuesto cuando es posible descomponer el suceso en uno o
ms sucesos simples. Por ejemplo, al lanzar dos dados, un suceso compuesto
ocurre al estar interesados en la suma de los nmeros que salen en las caras
superiores.
Clculo de probabilidades
V VI I- -2 2
6.2.2 Evento.- El evento constituye un subconjunto del espacio muestral. Est
conformado por los resultados o sucesos que son de inters para el clculo de
probabilidades.
Ya que el espacio muestral y el evento son conjuntos, es posible aplicar las
operaciones de conjuntos, las leyes y propiedades relacionadas con estos. Los
eventos y espacios muestrales y, en particular las relaciones entre eventos son a
menudo representados por medio de Diagramas de Venn.
6.3 Definicin de probabilidad.- En general, la probabilidad es la medida de la
incertidumbre. La probabilidad es la posibilidad de que suceda un evento particular.
Esta medida se expresa mediante un nmero que se asocia al evento o conjunto de
sucesos aleatorios que expresan una situacin de incertidumbre.
6.3.1 Notacin y terminologa.- Las principales formas de anotar y sus
correspondientes trminos son:
- p(E)= probabilidad de que ocurra el evento E.
- p(E
1
o E
2
)= p(E
1
E
2
)= probabilidad de que ocurra el evento E
1
o el evento E
2
- p(E
1
/E
2
) = probabilidad de que ocurra el evento E
1
dado que ocurri el evento E
2
- p(E
1
E
2
)= p(E
1
E
2
)= probabilidad de que ocurra el evento E
1
y el evento E
2
Se hace notar que la notacin y terminologa anterior se hace extensible a ms
de 2 eventos.
6.3.2 Axiomas de probabilidad.- Sea un experimento cualquiera, para el que se
define: S el espacio muestral correspondiente, E un evento cualesquiera y p(E) la
probabilidad de que ocurra E, entonces p(E) debe cumplir los siguientes axiomas:
1 La probabilidad es un nmero no negativo y menor que la unidad, es decir:
0 p(E) 1
2La probabilidad de un evento cierto es igual a la unidad, es decir:
p(E) = 1 si E es cierto
Clculo de probabilidades
V VI I- -3 3
3Si E es un evento cualquiera y E es un evento contrario, la probabilidad del
evento contrario es igual a la unidad menos la probabilidad del evento E, es decir:
( ) |
.
|

\
|
= E p E p 1 (6.1)
6.3.3. Tipos de clculo de probabilidades.- El concepto de probabilidad ha sido
desarrollado de distintas maneras, lo que ha dado lugar a dos formas o definiciones,
los cuales son: la definicin subjetiva y la definicin objetiva.
6.3.3.1 Definicin subjetiva.- Esta definicin se basa en el grado de creencia que
tiene la persona que calcula la probabilidad, respecto a la ocurrencia de un
determinado evento.
El grado de creencia es un nmero que difiere segn la evidencia que posee la
persona que efecta la asignacin.
6.3.3.2 Definicin objetiva.- En este caso, la situacin difiere de la anterior en
vista si dos ms personas deciden calcular la probabilidad de un evento particular,
partiendo de los mismos datos y utilizando las mismas normas de clculo deben
llegar a los mismos resultados.
En lo que resta del tema se detalla el clculo objetivo de probabilidad con
todas sus reglas y teoremas.
6.4 Tcnicas de conteo.- En ocasiones puede ser difcil o al menos tedioso,
determinar el nmero de elementos de un espacio muestral por medio de la
enumeracin directa. Para manejar sistemticamente este problema existen las
siguientes tcnicas de conteo:
a) Enumeracin explcita.- Es la tcnica ms bsica de conteo, que consiste en
enumerar uno por uno, todos los elementos del espacio muestral.
Clculo de probabilidades
V VI I- -4 4
b) Cuadro o matriz de doble entrada.- Se utiliza cuando se desea conocer la
cantidad y los elementos de un suceso compuesto de 2 sucesos simples.
c) Diagrama del rbol.- Se emplea cuando se tiene un experimento aleatorio con
sucesos compuestos de 2 ms sucesos simples.
d) Permutacin.- Una permutacin es un arreglo de objetos distintos, en la que
una permutacin difiere de otra si el orden del arreglo o el contenido difieren. Si
se desea seleccionar permutaciones de r objetos a partir de n objetos distintos,
el nmero de resultados est dado por la ecuacin (6.2).
( )!
!
r n
n
n
r
P

= (6.2)
e) Combinacin.- Una combinacin es un arreglo de objetos distintos, en la que
una combinacin difiere de otra, slo si difiere el contenido del arreglo. Si se
desea determinar el nmero de combinaciones cuando en n objetos distintos
deben seleccionarse r a la vez, se utiliza la ecuacin (6.3).
( )! !
!
r n r
n
n
r
C

= (6.3)
6.5 Definicin clsica.- Esta definicin se aplica para el caso de eventos con
sucesos simples o cuando se tiene un evento con sucesos compuestos, cada uno de
ellos conformado de sucesos simples que tienen la misma posibilidad de ocurrir.
Se define de la siguiente manera: "La probabilidad de un evento cualquiera es
el nmero que se obtiene al dividir el nmero de casos favorables al evento entre el
nmero de casos posibles, es decir:
( )
posibles casos de nmero
(E) evento al favorables casos de nmero
= E p (6.4)
Clculo de probabilidades
V VI I- -5 5
Ahora bien, asociada a esta situacin existe el caso de utilizar las frecuencias
de una distribucin de frecuencias, por lo que la probabilidad de un evento es igual
a la frecuencia relativa observada de la aparicin de dicho evento, siempre y cuando
el nmero de experimentos sea un valor muy grande, es decir:
( )
( )
n
E n
E h = (6.5)
( ) ( ) E h E p ~ n (6.6)
La definicin frecuencial de probabilidad supone:
- Gran cantidad de ensayos.
- Acepta el principio de regularidad estadstica que consiste en que al repetir un
fenmeno aleatorio de manera indefinida se puede observar que existe creciente
estabilidad en la aparicin de un suceso.
6.6 Regla de la adicin.- La regla de la adicin se utiliza cuando se desea
determinar la probabilidad de que ocurra un evento u otro. La probabilidad de que
ocurra el evento E
1
el evento E
2
, puede representarse en el lenguaje de la teora
de conjuntos como la unin del conjunto E
1
con el conjunto E
2
, y designarse
mediante p(E
1
E
2
).
En forma general, la probabilidad de que ocurra E
1
o E
2
es la suma de la
probabilidad de que ocurra E
1
ms la probabilidad de que ocurra E
2
menos la
probabilidad conjunta de que ocurra E
1
y E
2
, es decir:
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
+ = =
2 1 2 1 2 1 2 1
E E p E p E p E E p oE E p (6.7)
La probabilidad p(E
1
E
2
), como se dijo, se denomina probabilidad conjunta de
la ocurrencia de dos eventos y es la interseccin de E
1
y E
2
designndose tambin
como p(E
1
E
2
).
Clculo de probabilidades
V VI I- -6 6
En el caso de que E
1
y E
2
sean eventos mutuamente excluyentes:
0 ) E p(E
2 1
= (6.8)
por tanto, la ecuacin (6.7) se convierte en:
( ) ( ) ( ) ( )
2 1 2 1 2 1
E p E p E E p oE E p + = = (6.9)
6.7 Probabilidad condicional.- Frecuentemente, existe inters en obtener la
probabilidad de un evento, el cual est condicionado a la ocurrencia de otro evento
del espacio muestral. Es evidente, tambin que ello ocurre cuando ambos eventos
son dependientes entre s, es decir, cuando la ocurrencia o n ocurrencia de uno
afecta la probabilidad de ocurrencia del otro evento.
En estas situaciones se utiliza el concepto de probabilidad condicional para
designar la probabilidad de ocurrencia de un evento relacionado. Por tanto, si E
1
y E
2
son eventos cualesquiera que se encuentran en un espacio muestral S, la
probabilidad condicional de E
2
, con respecto a E
1
es:
( )
( )
1
2 1
1
2
E
E
E p
E E p
p

=
|
|
.
|

\
|
( ) 0
1
> E p (6.10)
es decir, es el cociente de la probabilidad conjunta de E
1
y E
2
con respecto a la
probabilidad de E
1
.
6.8 Regla del producto.- La regla del producto se refiere a la determinacin de la
probabilidad de la ocurrencia de los eventos de E
1
y E
2
, es decir, p(E
1
E
2
), siempre
y cuando existan diferentes espacios muestrales y ocurra simultaneidad de sucesos
y, los sucesos sean compuesto de sucesos simples con diferentes probabilidades.
6.8.1 Independencia estadstica.- En el caso de que la ocurrencia de E
1
no tenga
ningn efecto sobre la ocurrencia del evento de E
2
, en el sentido de que la
probabilidad condicional p(E
2
/ E
1
) es igual a la probabilidad p(E
2
) an a pesar de
que haya ocurrido el evento E
1
, se origina un concepto muy importante que se
conoce como independencia estadstica, la cual se define de la siguiente manera:
Clculo de probabilidades
V VI I- -7 7
Sean E
1
y E
2
dos eventos cualesquiera de un espacio muestral S, de tal forma
que es posible calcular:
( )
( )
1
2 1
1
2
E p
E E p
E
E
p

=
|
|
.
|

\
|
(6.11)
se dice que el evento E
1
es estadsticamente independiente del evento E
2
si:
( )
2
1
2
E p
E
E
p =
|
|
.
|

\
|
(6.12)
lo cual implica que:
( ) ( ) ( )
2 1 2 1
(E E p E p E p - = (6.13)
Con cierta frecuencia se confunde la aparicin de sucesos mutuamente
excluyentes y no excluyentes, por un lado, y los conceptos de independencia y
dependencia por el otro. La mutua exclusividad indica que dos sucesos no pueden
ocurrir al mismo tiempo, en tanto que la independencia seala que la probabilidad
de ocurrencia de un evento no es afectada por la ocurrencia del otro.
6.8.2 Dependencia estadstica.- Al considerar la probabilidad condicional de
algn evento E
2
, dada la ocurrencia de otro evento E
1
, siempre se ha implicado que
las probabilidades de E
1
y E
2
, son dependientes entre s. En otras palabras, la
informacin con respecto a la ocurrencia de E
2
afectar la probabilidad de E
1
.
Para este caso la regla del producto se deduce de la definicin de probabilidad
condicional:
( )
( )
1
2 1
1
2
E p
E E p
E
E
p

=
|
|
.
|

\
|
(6.14)
Despejando de la ecuacin (6.14) se obtiene:
Clculo de probabilidades
V VI I- -8 8
( ) ( )
|
|
.
|

\
|
- =
1
2
1 2 1
E
E
E
p E p E p (6.15)
ecuacin que representa la llamada regla del producto, es decir, la probabilidad de
que ocurran los eventos E
1
y E
2
es igual a la probabilidad de la ocurrencia de uno de
ellos multiplicado por la probabilidad condicional de que ocurra el segundo, dado que
ocurri el primero.
6.9 Probabilidad total.- En caso de tener eventos secuenciales, es posible
calcular la probabilidad de que ocurra un evento, combinando la regla de la suma y
la regla del producto, es decir:
Sean B
1
, B
2
, B
3
,....., B
n
, n eventos mutuamente excluyentes del espacio
muestral S y A un evento arbitrario en S, entonces para r = 1,2,.....,n:
( )

=
- =
|
|
.
|

\
|
|
.
|

\
|
r
i i
B
A
p
i
B p A p
1
(6.16)
y se lee "probabilidad total de que ocurra A.
6.10 Teorema de Bayes.- En su forma algebraica ms simple, el Teorema de
Bayes se refiere al clculo de la probabilidad de un evento especfico B
i
, dado que
ocurri el evento A, es decir:
( ) A p
i
B
A
p
i
B p
A
i
B
p
|
|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
-
= r ,......, , , i 3 2 1 = (6.17)
A primera vista, no es ms que una aplicacin de la probabilidad condicional.
Sin embargo, la importancia especial del Teorema de Bayes consiste en que se
aplica en el contexto de eventos secuenciales y adems, proporciona la base para
determinar la probabilidad condicional de un evento que ha ocurrido en la primera
Clculo de probabilidades
V VI I- -9 9
posicin secuencial, dado que se ha observado un evento especfico en la segunda
posicin secuencial.
El Teorema de Bayes ofrece tambin el fundamento para obtener la llamada
probabilidad "condicional hacia atrs o "a priori, puesto que puede determinarse la
probabilidad de que se haya observado un evento determinado en una primera
etapa, dada la observacin de otro evento en una segunda etapa.
BIBLIOGRAFA:
(1) LEVIN Richard (1996): "Estadstica para Administracin y Economa. Mxico
(2) MOYA Rufino (1988): "Probabilidad e Inferencia Estadstica. Per.
=====================
Clculo de probabilidades
V VI I- -1 10 0
NDICE
Pg.
6.1. Antecedentes..................................................................................... 1
6.2. Espacio muestral................................................................................ 1
6.2.1. Sucesos de un espacio muestral.................................................. 1
6.2.2. Evento............................................................................. 2
6.3. Definicin de probabilidad..................................................................... 2
6.3.1. Notacin y terminologa............................. 2
6.3.2. Axiomas de probabilidad........................... 2
6.3.3. Tipos de clculo de probabilidad.................................................... 3
6.3.3.1.Definicin subjetiva.......................................................... 3
6.3.3.2.Definicin objetiva............................................................ 3
6.4. Tcnicas de conteo..................................................................... 3
6.5. Definicin clsica..................................... 4
6.6. Regla de la adicin............................................................................... 5
6.7. Probabilidad condicional........................................................................ 6
6.8. Regla del producto...................................................................... 6
6.8.1. Independencia estadstica............................................................ 6
6.8.2. Dependencia estadstica................................................................ 7
6.9. Probabilidad total..................................... 8
6.10. Teorema de Bayes................................................................................ 8
Distribuciones de probabilidad
VII-1
DISTRIBUCIONES DE PROBABILIDAD
7.1 Variable aleatoria.- Una variable aleatoria x es aquella funcin de valor que
permite asignar puntos y elementos del espacio muestral en la serie
correspondiente a los nmeros reales.
Se dice que x es aleatoria por que involucra la probabilidad de los
resultados del espacio muestral.
7.1.1 Variable aleatoria discreta.- Una variable aleatoria x se denomina
discreta si existe correspondencia con la serie de los nmeros naturales.
Una variable aleatoria discreta se identifica cuando entre dos valores
consecutivos de la variable no puede existir un valor intermedio.
7.1.2 Variable aleatoria continua.- Se dice que x es una variable aleatoria
continua cuando sta toma un continuo de valores o cuando entre dos valores
consecutivos de la variable es posible la aparicin de un valor intermedio.
7.2 Distribucin de probabilidad de una variable aleatoria.- Una distribucin de
probabilidad de variable aleatoria es el resultado de asignar valores de
probabilidad a todos los valores numricos posibles de dicha variable aleatoria, ya
sea, mediante un listado o a travs de una funcin matemtica, segn sea el
caso.
7.2.1 Distribucin de probabilidad de una variable aleatoria discreta.- Es
aquel conjunto formado por todos los valores numricos posibles de una variable
aleatoria con sus probabilidades correspondientes, tal como se muestra en el
Cuadro (7.1).
Distribuciones de probabilidad
VII-2
Cuadro (7.1)
DISTRIBUCIN DE PROBABILIDAD DE LA VARIABLE X
x
i
p(x
i
)
x
1
p(x
1
)
x
2
p(x
2)
x
3
p(x
3
)
... ...
x
n
p(x
n
)
Fuente:
La distribucin de probabilidad de una variable aleatoria discreta se
denomina tambin funcin de cuanta y puede expresarse mediante una ecuacin
matemtica o un listado.
Si X es una variable aleatoria discreta y p(x
i
) la probabilidad de que x
i
tome un valor en particular, todos los valores de p(x
i
) deben satisfacer las
siguientes condiciones:
a) Cualquier valor de p(x
i
), debe ser un nmero real positivo, es decir:
( ) 0 >
i
x p
x i
N x e
b) La suma de todos los valores p(x
i
) es 1, es decir:
( ) 1 =

i
x p
x i
N x e
Cuando la distribucin de probabilidad de variable aleatoria discreta implica
la acumulacin de probabilidades hasta un valor determinado de la variable, esa
acumulacin se denomina Funcin de Distribucin Acumulada de X, es decir,
representa la probabilidad de que x sea menor o igual a un valor especfico de X y
se designa mediante la ecuacin (7.1).
Distribuciones de probabilidad
VII-3
( ) ( )

=
= s =
0
1
0 0
x
i
i
) x ( p x x p x F
x i
N x e (7.1)
La funcin de cuanta y la funcin de Distribucin Acumulada pueden
representarse grficamente mediante:
a) Un diagrama de barras, para lo cual en el eje de abscisas se colocan los
valores de la variable y en las ordenadas se representan el valor de las
probabilidades.
b) Un diagrama acumulativo de probabilidades, para lo cual en el eje de las
abscisas se colocan los valores de la variable y en las ordenadas se colocan
los valores correspondientes a la Funcin de Distribucin Acumulada.
7.2.2 Distribucin de probabilidad de una variable aleatoria continua.- Es
aquella en la que los valores numricos posibles de una variable aleatoria se
determinan a travs de una funcin matemtica y se ilustra en forma grfica por
medio de una curva de probabilidad. La distribucin de probabilidad de una
variable aleatoria continua se denomina funcin de densidad y se representan
generalmente como f(x).
X
f ( X )
l s l i
Distribuciones de probabilidad
VII-4
Si f(x) existe, debe cumplir dos condiciones:
a) La funcin f(x) debe proporcionar valores mayores o iguales que 0, es decir:
( ) 0 > x f l.s x l.i < <
b) La integral de la funcin debe ser igual a 1.
( ) 1 =
}
s . l
i . l
dx x f
En la que:
- l.i = lmite inferior
- l.s = lmite superior
Es importante indicar que f(x) no representa ninguna probabilidad como tal
y que solamente cuando la funcin se integra entre dos puntos proporciona un
valor de probabilidad, es decir:
( ) ( ) ( )
}
= s s = < <
b
a
dx x f b x a p b x a p
x
R x e (7.2)
Grficamente, la probabilidad queda expresada por el rea bajo la curva
entre los puntos a y b.
La funcin de distribucin acumulada de X para el caso de una variable
aleatoria continua se designa por F(x
o
) y permite determinar la probabilidad
acumulada correspondiente a un nivel determinado de variable y se define como:
( ) ( )
}
= s =
o
x
i . l
o o
dx ) x ( f x X p x F
x
R x e (7.3)
La funcin de distribucin acumulada, para que sea tal, debe cumplir dos
condiciones:
a) F(x
o
=l.i) = 0
b) F(x
o
=l.s) = 1
Distribuciones de probabilidad
VII-5
Cuando la funcin de distribucin acumulada es derivable en el recorrido de
la variable, su derivada da origen a la funcin de densidad, es decir:
( )
) x ( f
dx
x dF
o
= (7.4)
7.3 Medidas de posicin y dispersin de una distribucin de probabilidad de
variable aleatoria.-
7.3.1 Moda.- En caso de que la variable aleatoria fuese discreta, la moda se
define como aquel valor de la variable que tiene mayor probabilidad de ocurrencia.
Para el caso continuo, la moda de la distribucin se calcula aplicando las
condiciones que corresponden a la determinacin del valor mximo
correspondiente, es decir, aplicando la ecuacin (7.5).
( )
( )
dx
x df
x f = ' (7.5)
Se verifica si existe moda calculando la segunda derivada, para lo cual
debe cumplirse:
f(x) < 0
Ahora bien en caso de no poder aplicarse el clculo diferencial, es posible
utilizar el anlisis de puntos extremos o anlisis de contorno.
7.3.2 Mediana.- La mediana para una funcin de densidad f(x) se calcula
aplicando la definicin, es decir, es el valor de la variable que divide la
distribucin en dos partes iguales. La expresin que permite el clculo de la
mediana se muestra en la ecuacin (7.6).
( ) ( ) 5 0. dx x f dx x f
ls
Me
Me
li
= =
} }
(7.6)
Distribuciones de probabilidad
VII-6
7.3.3 Valor esperado.- El valor esperado de una variable aleatoria X es el valor
promedio despus de un nmero grande de experimentos, llamado tambin valor
a la larga o esperanza matemtica; se define segn las ecuaciones (7.7) y (7.8).
( ) ( )

=
i i
x p x x E discreta .a. x v (7.7)
( ) ( )
}
=
ls
li
dx x xf x E continua .a. x v (7.8)
7.3.4 Varianza.- La varianza de una variable aleatoria X se define segn la
ecuacin (7.9).
( ) ( )
2
2
= o = x E x V (7.9)
Para el caso de tener una variable discreta y otra continua, se tiene las
ecuaciones (7.10) y (7.11).
( ) ( )

= o
i i
x p x
2
2
discreta .a. x v (7.10)
( ) ( )
}
= o
ls
li
dx x f x
2
2
continua a. x v. (7.11)
Otras formas alternativas de clculo son las que se muestran en las
ecuaciones (7.12) y (7.13).
( )

= o
2 2 2
i i
x p x discreta .a. x v (7.12)
( )
}
= o
ls
li
dx x f x
2 2 2
continua a. x v. (7.13)
BIBLIOGRAFA:
(1) MOYA Rufino y SARAVIA Gregorio (1988): Probabilidad e Inferencia
Estadstica. Per.
====================
Distribuciones de probabilidad
VII-7
INDICE
Pg.
7.1 Variable aleatoria.................................................................... ..................... 1
7.1.1 Variable aleatoria discreta................................................................. 1
7.1.2 Variable aleatoria continua................................................................ 1
7.2 Distribucin de probabilidad de una variable aleatoria................................ 1
7.2.1 Distribucin de probabilidad de una variable aleatoria discreta... 1
7.2.2 Distribucin de probabilidad de una variable aleatoria continua.. 3
7.3 Medidas de posicin y dispersin de una distribucin de probabilidad de
variable aleatoria......................................................................................... 5
7.3.1 Moda............................................................................... .................. 5
7.3.2 Mediana............................................................................................ 5
7.3.3 Valor esperado.................................................................. ............... 6
7.3.4 Varianza........................................................................... ................ 6
Distribuciones tericas de probabilidad
VIII-1
DISTRIBUCIONES TERICAS DE PROBABILIDAD
8.1. Distribuciones de probabilidad de variable aleatoria discreta.- Son
aquellas en las que la variable aleatoria adopta valoes enteros. Las princiaples
son:
8.1.1. Distribucin Bernoulli.- Se dice que un experimento sigue una distribucin
Bernoulli, si cumple las siguientes condiciones:
a) Se realiza una nica prueba.
b) Slo existen dos posibles resultados en cada ensayo, llamados comunmente:
xito y fracaso.
La distribucin de probabilidad que describe el comportamiento de la variable
aleatoria x es:
( ) 0,1 x
1
= =
x x
q p x p (8.1)
( ) caso otro en 0 = x p
En la que:
p = probabilidad de xito (x = 1, xito)
q = probabilidad de fracaso (x = 0, fracaso)
El valor esperado y la varianza de la distribucin son:
( ) p x E = (8.2)
( ) pq x V = (8.3)
Esta funcin no es muy utilizada, siendo que en realidad se emplea para
desarrollar el modelo de la Distribucin Binomial.
8.1.2. Distribucin Binomial.- Cuando un experimento que sigue una distribucin
Bernoulli se repite n veces, se dice que se comporta como una distribucin
Binomial.
La distribucin Binomial debe cumplir las siguientes condiciones:
a) El nmero de pruebas es fijo e igual a n.
b) Slo existen dos posibles resultados en cada ensayo (generalmente
denominados xito y fracaso).
Distribuciones tericas de probabilidad
VIII-2
c) Las pruebas son independientes unas de otras, lo cual implica que las
probabilidades de xito y fracaso son constantes o que el experimento es con
devolucin.
De forma general, para deducir la ecuacin Binomial, se determina la
probabilidad en n ensayos, que ocurran x xitos consecutivos seguidos de (n-x)
fracasos consecutivos. Puesto que los n ensayos son independientes, se tiene:
( )
( ) x n x
q p q ......... q q q ........ p p p p

= - - - - - - - -

trminos x - n x trminos
(8.4)
La probabilidad de obtener exactamente x xitos y (n-x) fracasos en cualquier
orden es el producto de p
x
q
(n-x)
por el nmero de ordenaciones distintas, es decir,
el nmero de combinaciones de n objetos tomados de x a la vez, o lo que es lo
mismo:
( )

=
=
|
|
.
|

\
|
=
=

casos otros en 0
n ., 0,1,2,.... x
x n x
q p
x
n
x p (8.5)
En la que:
x = nmero de xitos
n = nmero de pruebas
p = probabilidad de xito.
q = probabilidad de fracaso.
El valor esperado y la varianza son, respectivamente:
( ) np x E = (8.6)
( ) npq x V = (8.7)
Sus reas de aplicacin incluyen inspecciones de calidad, ventas,
mercadotecnia, medicina, investigaciones de opinin y otras.
8.1.3. Distribucin Poisson.- La distribucin Poisson se presenta
frecuentemente en dos situaciones:
Distribuciones tericas de probabilidad
VIII-3
a) Cuando un evento o el cambio del estado de un sistema ocurre aleatoriamente
sobre el tiempo o espacio (distancias, reas, volmenes, pesos, etc..),
procesos que se denominan Procesos Poisson, por ejemplo:
- Nmero de automviles por hora que llegan a un autobanco.
- Nmero de repuestos producidos por minuto.
- Nmero de bacterias por cm
2
en un cultivo.
b) Esta distribucin constituye una aproximacin a la Distribucin Binomial
cuando n y p0, generalmente se asume cuando: p 0.10 y n 50, es
decir, cuando se cumplen las anteriores condiciones en una distribucin
Binomial, es conveniente utilizar una Distribucin Poisson.
Se dice que una variable aleatoria x sigue una distribucin Poisson si tiene
una distribucin de probabilidad con la ecuacin (8.9).
( )

=
=

=
=

casos otros en 0
.......n 0,1,2,3,.. x
! x
e
x p
x
(8.8)
En la que:
np = (8.9)
En este caso, el valor esperado y varianza de la variable aleatoria son
iguales:
( ) np x E = (8.10)
( ) np x V = (8.11)
La distribucin Poisson es el principal modelo de probabilidad empleado
para analizar lneas de espera.
8.1.4. Distribucin Hipergeomtrica.- Se dice que una variable aleatoria x sigue
una distribucin Hipergeomtrica, si cumple las siguientes condiciones:
a) El nmero de pruebas es fijo e igual a n.
b) Los resultados de cada prueba se clasifican en xito o fracaso.
Distribuciones tericas de probabilidad
VIII-4
c) Las probabilidades de xito varan en cada prueba puesto que el muestreo es
sin reemplazo, lo cual implica que los sucesos son dependientes unos de otros.
De forma general, si en una poblacin de N elementos se extrae sin
reeemplazo una muestra de tamao n y se sabe que existen k elementos con
cierta caracteristica en la poblacin N. Considerando x el nmero de elementos de
dicha clase en la muestra n y (n-x) el nmero de elementos que no son de esa
clase. El nmero total de formas de obtener x elementos de k es
|
.
|

\
|
x
k
y las
formas de obtener (n-x) elementos de un total (N-k) es igual a
|
.
|

\
|

x n
k N
. Luego, el
nmero total de formas en que pueden presentarse ambos casos es
|
.
|

\
|
|
.
|

\
|

x
k
x n
k N
.
Por otra parte, el nmero de maneras distintas en que pueden
seleccionarse una muestra de n elementos de un total de N es
|
.
|

\
|
n
N
y cada
muestra con una probabilidad de seleccin igual a
(

n
N
1
. De esta forma la
probabilidad de seleccionar x elementos que poseen cierta caracteristica es:
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
N
x n
k N
x
k
) x ( p (8.12)
Por tanto, la distribucin de probabilidad Hipergeomtrica es:
( )

=
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
=
casos otros en 0
n ......, 0,1,2,3... x
n
N
x n
k N
x
k
x p (8.13)
Distribuciones tericas de probabilidad
VIII-5
En la que:
x = variable aleatoria asociada a una de las dos categoras de
estudio
N = nmero total de objetos de la poblacin.
k = nmero de objetos en la poblacin, de la categoria asociada a la
variable aleatoria.
n = tamao de la muestra.
La esperanza y la varianza de la distribucin son:
N
nk
) x ( E = (8.14)
( )
( )( )
( ) 1
2


=
N N
n N k N nk
x V (8.15)
La Distribucin Hipergeomtrica se utiliza con mucha frecuencia en el
control de calidad estadstico.
8.2. Distribuciones de probabilidad de variable aleatoria continua.-
8.2.1. Distribucin Normal.- La distribucin Normal o distribucin de Gauss es
una de las ms importantes y de mayor uso de todas las distribuciones continuas
de probabilidad. Es fundamental en la aplicacin de la inferencia estadstica, ya
que las distribuciones de muchas estadsticas muestrales tienden a la distribucin
Normal conforme crece el tamao de la muestra.
Se dice que una variable aleatoria x est normalmente distribuida si su
funcin de densidad est dada por:
( ) + < <
to
=
|
.
|

\
|
o

x -
2
2
2
2
1 x
e
x f (8.16)
En la que:
= media aritmtica - < < +
o= varianza > 0
Distribuciones tericas de probabilidad
VIII-6
La grfica de la distribucin Normal es una curva simtrica con forma de
campana, que se extiende sin lmites tanto en la direccin positiva como en la
negativa.
La distribucin Normal queda completamente definida una vez que se
especifica la media y la varianza, es decir, estos dos parmetros determinan la
posicin y la forma de la distribucin Normal.
La probabilidad de que una variable aleatoria normalmente distribuida sea
menor o igual a un valor especfico, est dada por la funcin de distribucin
acumulada:
( )




}

|
.
|

\
|

= s
2
2
1
2
2


(8.16)
La funcin f(x) no es una funcin simple y su integracin no puede
realizarse en forma sencilla. Si se tabulara la funcin de densidad de la
distribucin Normal, la tabla que se elaborara sera para un par de valores de y

2
, es decir, se tendra que elaborar tablas para cada par de valores de y
2
,
tarea virtualmente imposible.
Por otra parte, esta distribucin tiene la propiedad de que cualquier
transformacin lineal de una variable aleatoria normalmente distribuida sigue
teniendo la misma distribucin, por ejemplo, si x tiene una distribucin Normal con
media y varianza
2
y z = ax + b, entonces z tendr una distribucin Normal con
media a + b y varianza a
2

2
.
Por tanto, para reducir el problema anterior y utilizando dicha propiedad, es
necesario hacer una transformacin que permita presentar los resultados en una
sola tabla, dicha transformacin es:
o

=
x
z (8.17)
Luego, se origina la llamada Distribucin Normal standard:
( )
2
2
2
2
to
=

z
e
z f (8.18)
con:
Distribuciones tericas de probabilidad
VIII-7
( ) 0 = z E
( ) 1 = z V
De manera que:
( ) dz
e a
z p a x p
a z
}
o

t
=
|
.
|

\
|
o

s = s
2
2
2
(8.19)
Con mtodos de clculo integral, todava sigue siendo difcil integrar la
funcin de densidad acumulada de la distribucin Normal standarizada, sin
embargo, por medio del anlisis numrico se han obtenido tablas para dicha
funcin.
BIBLIOGRAFA:
(1) LEVIN Richard (1996): Estadstica para Administracin y Economa. Mxico
(2) MOYA Rufino (1988): Probabilidad e Inferencia Estadstica. Per.
===================
Distribuciones tericas de probabilidad
VIII-8
NDICE
Pag.
8.1Distribuciones de probabilidad de variable aleatoria discreta........................... 1
8.1.1 Distribucin Bernoulli........................................................................ 1
8.1.2 Distribucin Binomial........................................................................ 1
8.1.3 Distribucin Poisson......................................................................... 2
8.1.4 Distribucin Hipergeomtrica........................................................... 4
8.2 Distribuciones de probabilidad de variable aleatoria continua......................... 5
8.2.1Distribucin Normal............................................................................. 5
1 1
I IX X D DI IS ST TR RI IB BU UC CI IO ON NE ES S B BI ID DI IM ME EN NS SI IO ON NA AL LE ES S
9 9. .1 1 I In nt tr ro od du uc cc ci i n n. .- - T To od do o u un ni iv ve er rs so o p po ob bl la ac ci i n n e es s p po os si ib bl le e
c ca ar ra ac ct te er ri iz za ar rl lo o r re ec cu ur rr ri ie en nd do o a a d do os s m ma as s c cr ri it te er ri io os s d de e
c cl la as si if fi ic ca ac ci i n n, , e es s d de ec ci ir r, , u un na a p po ob bl la ac ci i n n p pu ue ed de e s se er r e es st tu ud di ia ad da a, ,
c co on ns si id de er ra an nd do o d do os s m ma as s c ca ar ra ac ct te er re es s c cu ua al li it ta at ti iv vo os s o o c cu ua an nt ti it ta at ti iv vo os s. .
C Cu ua an nd do o u un na a p po ob bl la ac ci i n n e es s e es st tu ud di ia ad da a p po or r 2 2 a at tr ri ib bu ut to os s, , 2 2
v va ar ri ia ab bl le es s u un n a at tr ri ib bu ut to o y y u un na a v va ar ri ia ab bl le e, , s se e d di ic ce e q qu ue e l la a
d di is st tr ri ib bu uc ci i n n q qu ue e p pe er rm mi it te e m ma an ne ej ja ar r o ob bs se er rv va ac ci io on ne es s y y v va al lo or re es s e es s d de e
c ca ar ra ac ct te er r b bi id di im me en ns si io on na al l. .
9 9. .2 2 T Ti ip po os s d de e D Di is st tr ri ib bu uc ci i n n B Bi id di im me en ns si io on na al l. .- - S Se eg g n n e el l n n m me er ro o d de e
o ob bs se er rv va ac ci io on ne es s y y v va al lo or re es s o o m mo od da al li id da ad de es s d di if fe er re en nt te es s, , l la as s
d di is st tr ri ib bu uc ci io on ne es s d de e f fr re ec cu ue en nc ci ia a p pu ue ed de en n s se er r d de e l la as s s si ig gu ui ie en nt te es s c cl la as se es s: :
9 9. .2 2. .1 1 D Di is st tr ri ib bu uc ci i n n B Bi id di im me en ns si io on na al l T Ti ip po o I I. .- - S So on n l la as s d di is st tr ri ib bu uc ci io on ne es s
q qu ue e c co or rr re es sp po on nd de en n a a u un na a s si it tu ua ac ci i n n e en n q qu ue e s se e h ha an n t to om ma ad do o p po oc ca as s
o ob bs se er rv va ac ci io on ne es s o o m mo od da al li id da ad de es s d di if fe er re en nt te es s. . E En n e es st te e c ca as so o n no o s se e
r re eq qu ui ie er re e t tr ra at ta am mi ie en nt to o e es st ta ad di is st ti ic co o y y l la a i in nf fo or rm ma ac ci i n n o ob bt te en ni id da a s se e
r re eg gi is st tr ra a e en n 2 2 c co ol lu um mn na as s, , o or rg ga an ni iz za an nd do o s su us s v va al lo or re es s e en n f fo or rm ma a
a as sc ce en nd de en nt te e o o d de es sc ce en nd de en nt te e. .
L La a D Di is st tr ri ib bu uc ci i n n T Ti ip po o I I t ti ie en ne e l la a s si ig gu ui ie en nt te e c co on nf fo or rm ma ac ci i n n: :
D DI IS ST TR RI IB BU UC CI IO ON N T TI IP PO O I I
X X
i i
Y Y
j j
x x
1 1
y y
1 1
x x
2 2
y y
2 2
x x
3 3
y y
3 3
. .. . . .. .. .
x x
r r
y y
s s
2 2
9 9. .2 2. .2 2 D Di is st tr ri ib bu uc ci i n n B Bi id di im me en ns si io on na al l T Ti ip po o I II I. .- - S Se e u ut ti il li iz za a c cu ua an nd do o
e ex xi is st te en n m mu uc ch ha as s o ob bs se er rv va ac ci io on ne es s d de el l p pa ar r ( (x x
i i
, ,y y
j j
) ) y y s so on n p po oc co os s l lo os s
v va al lo or re es s d di is st ti in nt to os s d de e l la a v va ar ri ia ab bl le e. . L La a i in nf fo or rm ma ac ci i n n s se e p pr re es se en nt ta a e en n
u un n c cu ua ad dr ro o d de e d do ob bl le e e en nt tr ra ad da a, , t ta al l q qu ue e l lo os s v va al lo or re es s d de e x x
i i
s se e
p pr re es se en nt ta an n e en n l la as s f fi il la as s y y l lo os s v va al lo or re es s d de e y y
j j
e en n l la as s c co ol lu um mn na as s y y e en n
e el l c cu ue er rp po o s se e r re eg gi is st tr ra an n l la as s f fr re ec cu ue en nc ci ia as s a ab bs so ol lu ut ta as s o o r re el la at ti iv va as s. .
S Su u d di is sp po os si ic ci i n n t ta ab bu ul la ar r p pa ar ra a e el l c ca as so o d de e f fr re ec cu ue en nc ci ia as s a ab bs so ol lu ut ta as s
e es s d de e l la a s si ig gu ui ie en nt te e f fo or rm ma a: :
D DI IS ST TR RI IB BU UC CI IO ON N T TI IP PO O I II I
y y
1 1
y y
2 2
y y
3 3
. .. .. . y y
s s
x x
1 1
n n
1 11 1
n n
1 12 2
n n
1 13 3
. .. .. . n n
1 1s s
x x
2 2
n n
2 21 1
n n
2 22 2
n n
2 23 3
. .. .. . n n
2 2s s
x x
3 3
n n
3 31 1
n n
3 32 2
n n
3 33 3
. .. .. . n n
3 3s s
. .. .. . . .. .. . . .. .. . . .. .. . . .. .. . . .. .. .
x x
r r
n n
r r1 1
n n
r r2 2
n n
r r3 3
. .. .. . n n
r rs s
D Do on nd de e n n
i ij j
r re ep pr re es se en nt ta an n e el l n n m me er ro o d de e v ve ec ce es s q qu ue e s se e r re ep pi it te e e el l
p pa ar r ( (x x
i i
, ,y y
j j
) ). .
P Po or r o ot tr ra a p pa ar rt te e e es s p po os si ib bl le e d de ef fi in ni ir r l la as s d di is st tr ri ib bu uc ci io on ne es s
m ma ar rg gi in na al le es s e en n l la as s c cu ua al le es s s so ol lo o i in nt te er re es sa a l la a i in nf fo or rm ma ac ci i n n p pa ar ra a u un na a d de e
l la as s v va ar ri ia ab bl le es s, , p pr re es sc ci in nd di ie en nd do o d de e l la a o ot tr ra a. .
3 3
L La as s d di is st tr ri ib bu uc ci io on ne es s m ma ar rg gi in na al le es s s se e m mu ue es st tr ra an n e en n l lo os s s si ig gu ui ie en nt te es s
c cu ua ad dr ro os s: :
P Pa ar ra a l la a v va ar ri ia ab bl le e x x: :
D DI IS ST TR RI IB BU UC CI IO ON N M MA AR RG GI IN NA AL L D DE E X X
x x
i i
n n( (x x
i i
) )
x x
1 1
n n( (x x
1 1
) ) = =
x x
2 2
n n( (x x
2 2
) ) = =
x x
3 3
n n( (x x
3 3
) ) = =
. .. .. .. .
x x
r r
n n( (x x
r r
) ) = =
P Pa ar ra a l la a v va ar ri ia ab bl le e Y Y: :
D DI IS ST TR RI IB BU UC CI IO ON N M MA AR RG GI IN NA AL L D DE E Y Y
Y Y
i i
n n( (Y Y
i i
) )
Y Y
1 1
n n( (Y Y
1 1
) ) = =
Y Y
2 2
n n( (Y Y
2 2
) ) = =
Y Y
3 3
n n( (Y Y
3 3
) ) = =
. .. .. .. .
Y Y
S S
n n( (Y Y
S S
) ) = =
9 9. .2 2. .3 3 D Di is st tr ri ib bu uc ci i n n B Bi id di im me en ns si io on na al l T Ti ip po o I II II I. .- - S Se e r re ea al li iz za a c cu ua an nd do o s se e
h ha an n e ef fe ec ct tu ua ad do o m mu uc ch ha as s o ob bs se er rv va ac ci io on ne es s y y o ob bt te en ni id do o m mu uc ch ho os s v va al lo or re es s
d di is st ti in nt to os s d de e l la a v va ar ri ia ab bl le e o o c cu un na ad do o l la as s o ob bs se er rv va ac ci io on ne es s p pu ue ed de en n
c cl la as si if fi ic ca ar rs se e c co om mo o u un na a v va ar ri ia ab bl le e c co on nt ti in nu ua a. .
P Pa ar ra a e el la ab bo or ra ar r u un na a D Di is st tr ri ib bu uc ci i n n t ti ip po o I II I s se e p pr ro oc ce ed de e d de e l la a
s si ig gu ui ie en nt te e m ma an ne er ra a: :
4 4
S Se e d de ef fi in ne e e el l r re ec co or rr ri id do o d de e c ca ad da a u un na a d de e l la as s v va ar ri ia ab bl le es s d de el l p pa ar r
( (x x
i i
; ; y y
j j
) ) t ta al l q qu ue e e el l r re ec co or rr rr ri id do o d de e x x e e y y e es s: :
r r
x x
= = X X
m ma ax x
- - X X
m mi in n
( (9 9. .1 1) )
r r
y y
= = Y Y
m ma ax x
- - y y
m mi in n
( (9 9. .2 2) )
S Se e e es st ta ab bl le ec ce e e el l n n m me er ro o d de e c cl la as se es s, , e es st tr ra at to os s o o c ca at te eg go or r a as s, , s se eg g n n
l la as s n ne ec ce es si id da ad de es s d de e l la a i in nv ve es st ti ig ga ac ci i n n. .
S Se e d de et te er rm mi in na a l la a a am mp pl li it tu ud d d de el l i in nt te er rv va al lo o d de e c cl la as se e, , m me ed di ia an nt te e l la a
d di iv vi is si i n n d de el l r re ec co or rr ri id do o d de e l la a v va ar ri ia ab bl le e p po or r e el l c co or rr re es sp po on nd di ie en nt te e
n n m me er ro o d de e c cl la as se es s o o e es st tr ra at to os s. .
a a
x x
= = r r
x x
/ /N N
o o
d de e e es st tr ra at to os s d de e x x ( (9 9. .3 3) )
a a
y y
= = r r
y y
/ /N N
o o
d de e e es st tr ra at to os s d de e y y ( (9 9. .4 4) )
C Co on n l lo os s e el le em me en nt to os s a an nt te er ri io or re es s s se e c co on ns st tr ru uy ye e l la a D Di is st tr ri ib bu uc ci i n n
B Bi id di im me en ns si io on na al l d de e T Ti ip po o I II II I, , t ta al l c co om mo o s se e m mu ue es st tr ra a e en n e el l s si ig gu ui ie en nt te e
c cu ua ad dr ro o: :
D DI IS ST TR RI IB BU UC CI IO ON N T TI IP PO O I II II I
y y
0 0
- -y y
1 1
y y
1 1
- -y y
2 2
y y
2 2
- -y y
3 3
. .. .. . y y
s s- -1 1
- -
y y
s s
x x
0 0
- -x x
1 1
n n
1 11 1
n n
1 12 2
n n
1 13 3
. .. .. . n n
1 1s s
x x
1 1
- -x x
2 2
n n
2 21 1
n n
2 22 2
n n
2 23 3
. .. .. . n n
2 2s s
x x
2 2
- -x x
3 3
n n
3 31 1
n n
3 32 2
n n
3 33 3
. .. .. . n n
3 3s s
. .. .. . . .. .. . . .. .. . . .. .. . . .. .. . . .. .. .
x x
r r- -1 1
- -
x x
r r
n n
r r1 1
n n
r r2 2
n n
r r3 3
. .. .. . n n
r rs s
D Do on nd de e n n
i ij j
r re ep pr re es se en nt ta an n e el l n n m me er ro o d de e v ve ec ce es s q qu ue e s se e r re ep pi it te e e el l
p pa ar r ( (x x
i i- -1 1
- -x x
i i
, ,
y y
j j- -1 1
- -y y
j j
) ). .
5 5
T Ta am mb bi ie en n p pa ar ra a e es st te e c ca as so o e es s p po os si ib bl le e c co on ns st tr ru ui ir r l la as s
D Di is st tr ri ib bu uc ci io on ne es s M Ma ar rg gi in na al le es s d de e X X y y Y Y. .
P Pa ar ra a o ob bt te en ne er r l lo os s e es st ta ad d g gr ra af fo os s d de e p po os si ic ci i n n y y d di is sp pe er rs si i n n
n ne ec ce es sa ar ri io os s p pa ar ra a c ca ar ra ac ct te er ri iz za ar r l la a d di is st tr ri ib bu uc ci i n n e en n f fo or rm ma a d de e
i in nd di ic ca ad do or re es s s se e t tr ra an ns sf fo or rm ma a l la a D Di is st tr ri ib bu uc ci i n n T Ti ip po o I II II I e en n u un na a
D Di is st tr ri ib bu uc ci i n n T Ti ip po o I II I. . A Ad de em m s s, , c co on n l la as s d di is st tr ri ib bu uc ci io on ne es s m ma ar rg gi in na al le es s
o ob bt te en ni id da as s d de e l la a d di is st tr ri ib bu uc ci i n n b bi id di im me en ns si io on na al l, , a ap pl li ic ca an nd do o l la as s f fo or rm ma as s
d de e c c l lc cu ul lo o c co or rr re es sp po on nd di ie en nt te es s p pu ue ed de en n o ob bt te en ne er rs se e l lo os s i in nd di ic ca ad do or re es s
b bi id di im me en ns si io on na al le es s c co on no oc ci id do os s y y r re es so ol lv ve er r c cu ua al lq qu ui ie er r p pr ro ob bl le em ma a r re ef fe er ri id do o
a a l la as s v va ar ri ia ab bl le e c co on ns si id de er ra ad da a. .
9 9. .3 3 C Co ov va ar ri ia an nz za a. .- - E Es s u un n e es st ta ad d g gr ra af fo o q qu ue e p pe er rm mi it te e e es st tu ud di ia ar r l la a
d de ep pe en nd de en nc ci ia a e es st ta ad di is st ti ic ca a d de e l la as s v va ar ri ia ab bl le es s c co on nt te en ni id da as s e en n u un na a
d di is st tr ri ib bu uc ci i n n b bi id di im me en ns si io on na al l. .
L La a c co ov va ar ri ia an nz za a s se e d de ef fi in ne e c co om mo o l la a m me ed di ia a a ar ri it tm m t ti ic ca a d de el l
p pr ro od du uc ct to o d de e l la as s d de es sv vi ia ac ci io on ne es s d de e l lo os s v va al lo or re es s d de e c ca ad da a v va ar ri ia ab bl le e
r re es sp pe ec ct to o d de e s su u m me ed di ia a a ar ri it tm m t ti ic ca a y y s se e d de es si ig gn na a c co on n e el l s s m mb bo ol lo o
x xy y
. .
L La a c co ov va ar ri ia an nz za a s se e c ca al lc cu ul la a m me ed di ia an nt te e l la as s s si ig gu ui ie en nt te es s e ec cu ua ac ci io on ne es s: :
P Pa ar ra a d da at to os s n no o a ag gr ru up pa ad do os s: :

x xy y
= = ( (x x
i i
- -
x x
) )( (y y
i i
- -
y y
) )/ /n n ( (9 9. .5 5) )

x xy y
= = x x
i i
y y
i i
/ /n n - - ( ( x x
i i
/ /n n) )( ( y y
i i
/ /n n) ) ( (9 9. .6 6) )
P Pa ar ra a d da at to os s a ag gr ru up pa ad do os s: :

x xy y
= = ( (x x
i i
- -
x x
) )( (y y
i i
- -
y y
) )n n
i i
/ /n n ( (9 9. .7 7) )

x xy y
= = x x
i i
y y
i i
n n
i i
/ /n n - - ( ( x x
i i
n n
i i
/ /n n) )( ( y y
i i
n n
i i
/ /n n) ) ( (9 9. .8 8) )
9 9. .4 4 F Fu un nc ci io on ne es s d de e p pr ro ob ba ab bi il li id da ad d b bi id di im me en ns si io on na al l. .- - D Da ad do o u un n e ex xp pe er ri im me en nt to o
a al le ea at to or ri io o E E, , s si i e el l e es sp pa ac ci io o m mu ue es st tr ra al l r re es su ul lt ta an nt te e s se e c co on ns si id de er ra a X X y y
Y Y, , c co om mo o v va ar ri ia ab bl le es s a al le ea at to or ri ia as s y y l la as s f fu un nc ci io on ne es s d de e p pr ro ob ba ab bi il li id da ad d: :
6 6
P P( (x x, ,y y) ), , p pa ar ra a e el l c ca as so o d di is sc cr re et to o y y f f( (x x, ,y y) ) p pa ar ra a e el l c ca as so o c co on nt ti in nu uo o e es s
p po os si ib bl le e d de es sa ar rr ro ol ll la ar r t to od do o l lo o r re ef fe er re en nt te e a al l c c l lc cu ul lo o d de e
p pr ro ob ba ab bi il li id da ad de es s d de e l la a s si ig gu ui ie en nt te e m ma an ne er ra a: :
9 9. .4 4. .1 1 F Fu un nc ci io on ne es s d de e c cu ua an nt t a a b bi id di im me en ns si io on na al l. .- -
9 9. .4 4. .1 1. .1 1 C Co on nd di ic ci io on ne es s p pa ar ra a q qu ue e u un na a f fu un nc ci i n n s se ea a d de e c cu ua an nt t a a. .- - A Al l
i ig gu ua al l q qu ue e p pa ar ra a e el l c ca as so o u un ni id di im me en ns si io on na al l, , p pa ar ra a q qu ue e u un na a f fu un nc ci i n n s se ea a
d de e c cu ua an nt t a a d de eb be e c cu um mp pl li ir r d do os s c co on nd di ic ci io on ne es s: :
a a) ) L La as s p pr ro ob ba ab bi il li id da ad de es s d de eb be en n s se er r m ma ay yo or re es s o o i ig gu ua al le es s a a c ce er ro o, , e es s
d de ec ci ir r. .
p p( (x x, ,y y) ) = = 0 0
b b) ) L La a s su um ma a d de e t to od da as s l la as s p pr ro ob ba ab bi il li id da ad de es s d de eb be e s se er r i ig gu ua al l a a 1 1, , e es s
d de ec ci ir r: :
p p( (x x
i i
, ,y y
j j
) ) = = 1 1
9 9. .4 4. .1 1. .2 2 C C l lc cu ul lo o d de e p pr ro ob ba ab bi il li id da ad de es s. .- - P Pa ar ra a d de et te er rm mi in na ar r l la a
p pr ro ob ba ab bi il li id da ad d d de e q qu ue e x x s se e e en nc cu ue en nt tr re e e en n e el l p pa ar r ( (a a
1 1
, ,b b
1 1
) ) e e y y e en n e el l
p pa ar r( (a a
2 2
, ,b b
2 2
) ), ,s se e t ti ie en ne e: :
p p( (a a
1 1
x x b b
1 1
, , a a
2 2
y y b b
2 2
) ) = = p p( (x x, ,y y) ) ( (9 9. .9 9) )
9 9. .4 4. .1 1. .3 3 F Fu un nc ci io on ne es s d de e D Di is st tr ri ib bu uc ci i n n A Ac cu um mu ul la ad da a. .- - L La a F Fu un nc ci i n n d de e
D Di is st tr ri ib bu uc ci i n n A Ac cu um mu ul la ad da a s se e d de ef fi in ne e d de e l la a s si ig gu ui ie en nt te e m ma an ne er ra a: :
p p( (X X, ,Y Y) ) = = p p( (0 0 x x X X, , 0 0 Y Y b b
2 2
) ) = = p p( (x x
i i
, ,y y
j j
) ) ( (9 9. .1 10 0) )
9 9. .4 4. .2 2 F Fu un nc ci io on ne es s d de e d de en ns si id da ad d b bi id di im me en ns si io on na al l. .- -
9 9. .4 4. .2 2. .1 1 C Co on nd di ic ci io on ne es s p pa ar ra a q qu ue e u un na a f fu un nc ci i n n s se ea a d de e d de en ns si id da ad d. .- - A Al l
i ig gu ua al l q qu ue e p pa ar ra a e el l c ca as so o u un ni id di im me en ns si io on na al l, , p pa ar ra a q qu ue e u un na a f fu un nc ci i n n s se ea a
d de e d de en ns si id da ad d d de eb be e c cu um mp pl li ir r d do os s c co on nd di ic ci io on ne es s: :
a a) ) L La as s p pr ro ob ba ab bi il li id da ad de es s d de eb be en n s se er r m ma ay yo or re es s o o i ig gu ua al le es s a a c ce er ro o, , e es s
d de ec ci ir r. .
f f( (x x, ,y y) ) = = 0 0
7 7
b b) ) L La a s su um ma a d de e t to od da as s l la as s p pr ro ob ba ab bi il li id da ad de es s d de eb be e s se er r i ig gu ua al l a a 1 1, , e es s
d de ec ci ir r: :
f f( (x x
i i
, ,y y
j j
) ) = = 1 1
9 9. .4 4. .2 2. .2 2 C C l lc cu ul lo o d de e p pr ro ob ba ab bi il li id da ad de es s. .- - P Pa ar ra a d de et te er rm mi in na ar r l la a
p pr ro ob ba ab bi il li id da ad d d de e q qu ue e x x s se e e en nc cu ue en nt tr re e e en nt tr re e e el l p pa ar r ( (a a
1 1
, ,b b
1 1
) ) e e y y e en nt tr re e
e el l p pa ar r( (a a
2 2
, ,b b
2 2
) ), ,s se e t ti ie en ne e: :
p p( (a a
1 1
x x b b
1 1
, , a a
2 2
y y b b
2 2
) ) = = f f( (x x, ,y y) ) ( (9 9. .1 11 1) )
9 9. .4 4. .2 2. .3 3 F Fu un nc ci io on ne es s d de e D Di is st tr ri ib bu uc ci i n n A Ac cu um mu ul la ad da a. .- - L La a F Fu un nc ci i n n d de e
D Di is st tr ri ib bu uc ci i n n A Ac cu um mu ul la ad da a s se e d de ef fi in ne e d de e l la a s si ig gu ui ie en nt te e m ma an ne er ra a: :
F F( (X X, ,Y Y) ) = = p p( (0 0 x x X X, , 0 0 Y Y b b
2 2
) ) = = f f( (x x
i i
, ,y y
j j
) ) ( (9 9. .1 12 2) )
9 9. .4 4. .2 2. .4 4 F Fu un nc ci io on ne es s d de e d de en ns si id da ad d m ma ar rg gi in na al l. .- - D Da ad da a l la a f fu un nc ci i n n d de e
d de en ns si id da ad d p pa ar ra a u un na a v va ar ri ia ab bl le e c co on nj ju un nt ta a e es s p po os si ib bl le e d de ef fi in ni ir r l la as s
f fu un nc ci io on ne es s d de e d de en ns si id da ad d m ma ar rg gi in na al le es s, , e es st to o s si ig gn ni if fi ic ca a c co on ns si id de er ra ar r u un na a
v va ar ri ia ab bl le e p pr re es sc ci in nd di ie en nd do o d de e l la a o ot tr ra a. .
D Da ad do o f f( (x x, ,y y) ) e en n e el l r re ec co or rr ri id do o: : l l. .i i. .
x x
x x l l. .s s
x x
, , l l. .i i
y y
y y
l l. .s s
y y
, , s se e d de ef fi in ne e: :
L La a f fu un nc ci i n n d de e d de en ns si id da ad d m ma ar rg gi in na al l f f( (x x) ) a a: :
f f( (x x) ) = = f f( (x x, ,y y) ) d dy y ( (9 9. .1 13 3) )
L La a f fu un nc ci i n n d de e d de en ns si id da ad d m ma ar rg gi in na al l f f( (y y) ) a a: :
f f( (y y) ) = = f f( (x x, ,y y) ) d dx x ( (9 9. .1 14 4) )
P Pa ar ra a c ca al lc cu ul la ar r p pr ro ob ba ab bi il li id da ad de es s s se e p pr ro oc ce ed de e d de e l la a s si ig gu ui ie en nt te e
m ma an ne er ra a: :
8 8
p p( (a a
1 1
x x b b
1 1
) ) = = f f( (x x) )d dx x ( (9 9. .1 15 5) )
p p( ( a a
2 2
y y b b
2 2
) ) = = f f( (y y) )d dy y ( (9 9. .1 16 6) )
9 9. .5 5 A An n l li is si is s d de e r re eg gr re es si i n n y y c co or rr re el la ac ci i n n l li in ne ea al l. .- - E El l a an n l li is si is s d de e
r re eg gr re es si i n n y y d de e c co or rr re el la ac ci i n n p pe er rm mi it te e l la a p pr re ed di ic cc ci i n n o o e es st ti im ma ac ci i n n e el l
v va al lo or r d de es sc co on no oc ci id do o d de e u un na a v va ar ri ia ab bl le e y y d de en no om mi in na ad da a v va ar ri ia ab bl le e
d de ep pe en nd di ie en nt te e e en n e el l s su up pu ue es st to o c ca as so o d de e q qu ue e s se e c co on no oc ce e e el l v va al lo or r d de e o ot tr ra a
v va ar ri ia ab bl le e x x q qu ue e s se e c co on no oc ce e c co on n e el l n no om mb br re e d de e v va ar ri ia ab bl le e
i in nd de ep pe en nd di ie en nt te e, , c co on n l la a c cu ua al l s se e r re el la ac ci io on na a. .
P Pa ar ra a e el l a an n l li is si is s d de e r re eg gr re es si i n n, ,d de es sd de e e el l p pu un nt to o d de e v vi is st ta a
t te e r ri ic co o s si i s se e d di is sp po on ne e d de e u un na a s se er ri ie e d de e p pa ar re es s d de e v va al lo or re es s p pa ar ra a l la a
v va ar ri ia ab bl le e c co on nj ju un nt ta a ( (x x
i i
, ,y y
j j
) ) e es s p po os si ib bl le e e en nc co on nt tr ra ar r u un na a f fu un nc ci i n n
m ma at te em m t ti ic ca a o o f fu un nc ci i n n d de e a aj ju us st te e q qu ue e r re el la ac ci io on ne e a a a am mb ba as s v va ar ri ia ab bl le es s y y
q qu ue e d de et te er rm mi in ne e l la a l le ey y d de e c co om mp po or rt ta am mi ie en nt to o q qu ue e e ex xi is st te e e en nt tr re e t ta al le es s
v va ar ri ia ab bl le es s. .
E El l p pr ro oc ce es so o d de e a aj ju us st ta ar r u un n c co on nj ju un nt to o d de e d da at to os s p pe er rt te en ne ec ci ie en nt te es s a a
l la as s v va ar ri ia ab bl le es s ( (x x, ,y y) ) s se e r re es su um me e e en n d do os s e et ta ap pa as s: :
P Pr ri im me er ra a e et ta ap pa a: :E El la ab bo or ra ar r e el l d di ia ag gr ra am ma a d de e d di is sp pe er rs si i n n y y d de ef fi in ni ir r u un na a
f fu un nc ci i n n m ma at te em m t ti ic ca a q qu ue e m me ej jo or r s se e a aj ju us st te e a a l lo os s d da at to os s. .
S Se eg gu un nd da a e et ta ap pa a: : E Es st ta ab bl le ec ce er r u un n m m t to od do o q qu ue e p pe er rm mi it ta a d de et te er rm mi in na ar r l lo os s
v va al lo or re es s q qu ue e a as su um mi ir r n n l lo os s p pa ar r m me et tr ro os s d de e l la a f fu un nc ci i n n d de e a aj ju us st te e o o d de e
r re eg gr re es si i n n. . E En n e es st te e s se en nt ti id do o e el l m m s s a ap pr ro op pi ia ad do o e es s e el l d de e m m n ni im mo os s
c cu ua ad dr ra ad do os s. .
E En nt tr re e l la as s f fu un nc ci io on ne es s m ma at te em m t ti ic ca as s m m s s c co on no oc ci id da as s p pa ar ra a
r re el la ac ci io on na ar r d do os s v va ar ri ia ab bl le es s s se e t ti ie en ne e: :
L Li in ne ea al l s si im mp pl le e: : y y = = a a + + b bx x
L Li in ne ea al l i in nv ve er rs sa a: : y y = = a a + + b b/ /x x
L Li in ne ea al l l lo og ga ar ri it tm mi ic ca a: : y y = = a a + + b bL Ln nx x
E Ex xp po on ne en nc ci ia al l: : y y = = a ab b
x x
. .
P Po ot te en nc ci ia al l: : y y = = a ax x
b b
. .
9 9
E El l p pr ri in nc ci ip pa al l o ob bj je et ti iv vo o d de el l a an n l li is si is s d de e c co or rr re el la ac ci i n n e es s m me ed di ir r
e el l g gr ra ad do o d de e r re el la ac ci i n n e en nt tr re e l la a v va ar ri ia ab bl le e i in nd de ep pe en nd di ie en nt te e y y l la a
v va ar ri ia ab bl le e d de ep pe en nd di ie en nt te e. .
P Pa ar ra a e ef fe ec ct tu ua ar r e el l a an n l li is si is s d de e c co or rr re el la ac ci i n n s se e c ca al lc cu ul la an n d do os s
c co oe ef fi ic ci ie en nt te es s: :
a a) )C Co oe ef fi ic ci ie en nt te e d de e d de et te er rm mi in na ac ci i n n. .- - E El l c co oe ef fi ic ci ie en nt te e d de e d de et te er rm mi in na ac ci i n n
m mi id de e l la a p pr ro op po or rc ci i n n d de e v va ar ri ia ab bi il li id da ad d q qu ue e h ha a s si id do o e es st ta ad d s st ti ic ca am me en nt te e
e ex xp pl li ic ca ad da a, , r re es sp pe ec ct to o a a l la a v va ar ri ia ab bi il li id da ad d t to ot ta al l, , m me ed di ia an nt te e l la a e ec cu ua ac ci i n n
d de e r re eg gr re es si i n n. . E Es s d de ec ci ir r: :
R R = = V VE E/ /V VT T = = 1 1 - - V VN NE E/ /V VT T
( (9 9. .1 17 7) )
D Do on nd de e: :
V VE E = = V Va ar ri ia ab bi il li id da ad d e ex xp pl li ic ca ad da a = = ( (Y Y
c c
- - y y) )
V VN NE E = = V Va ar ri ia ab bi il li id da ad d n no o e ex xp pl li ic ca ad da a = = ( (Y Y
o o
- -Y Y
c c
) )
V VT T = = V Va ar ri ia ab bi il li id da ad d t to ot ta al l = = ( (Y Y
o o
- - y y ) )
A Ad de em m s s: :
V VT T = = V VE E + + V VN NE E ( (9 9. .1 18 8) )
L Lo os s v va al lo or re es s q qu ue e t to om ma a e es st t n n s si ie em mp pr re e c co om mp pr re en nd di id do os s e en n e el l
i in nt te er rv va al lo o: :
0 0 R R 1 1. . D De e m ma an ne er ra a i id de ea al l s se e d de es se ea a t te en ne er r u un n v va al lo or r d de e R R = = 1 1, ,
p pu ue es st to o q qu ue e e en nt to on nc ce es s l la a v va ar ri ia ab bi il li id da ad d n no o e ex xp pl li ic ca ad da a s se er r a a i ig gu ua al l a a
c ce er ro o, , y y q qu ue e t to od da a l la a v va ar ri ia ac ci i n n p pu ue ed de e e ex xp pl li ic ca ar rs se e p po or r l la a p pr re es se en nc ci ia a
d de e l la as s v va ar ri ia ab bl le es s i in nd de ep pe en nd di ie en nt te es s e en n l la a e ec cu ua ac ci i n n d de e r re eg gr re es si i n n. .
b b) ) C Co oe ef fi ic ci ie en nt te e d de e c co or rr re el la ac ci i n n. .- - E El l c co oe ef fi ic ci ie en nt te e d de e c co or rr re el la ac ci i n n
i in nd di ic ca a e el l g gr ra ad do o d de e r re el la ac ci i n n q qu ue e e ex xi is st te e e en nt tr re e l la as s v va ar ri ia ab bl le es s
i in nd de ep pe en nd di ie en nt te es s c co on n l la a v va ar ri ia ab bl le e d de ep pe en nd di ie en nt te e. . S Se e c ca al lc cu ul la a d de e l la a
s si ig gu ui ie en nt te e m ma an ne er ra a: :
1 10 0
r r = = R R ( (9 9. .1 19 9) )
E El l v va al lo or r d de e r r f fl lu uc ct t a a e en nt tr re e 0 0 r r 1 1, , c cu ua an nd do o r r e es s i ig gu ua al l a a 1 1
l la a r re el la ac ci i n n e es s p pe er rf fe ec ct ta a y y c cu ua an nd do o e el l v va al lo or r d de e r r e es s i ig gu ua al l a a c ce er ro o, ,
s se e d di ic ce e q qu ue e n no o e ex xi is st te e r re el la ac ci i n n e en nt tr re e l la as s v va ar ri ia ab bl le es s c co on ns si id de er ra ad da as s. .
P Pa ar ra a e el l c ca as so o d de e u un n m mo od de el lo o l li in ne ea al l s si im mp pl le e, , e el l v va al lo or r r r v va ar r a a
e en nt tr re e - -1 1 y y 1 1, , s si ie en nd do o e el l s si ig gn no o d de e r r e el l m mi is sm mo o q qu ue e e el l d de el l
c co oe ef fi ic ci ie en nt te e d de e l la a v va ar ri ia ab bl le e i in nd de ep pe en nd di ie en nt te e. .
= == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == =
U UN NI IV VE ER RS SI ID DA AD D M MA AY YO OR R D DE E S SA AN N S SI IM MO ON N
F FA AC CU UL LT TA AD D D DE E C CI IE EN NC CI IA AS S Y Y T TE EC CN NO OL LO OG GI IA A
L LI IC C. . E EN N I IN NF FO OR RM MA AT TI IC CA A
I IN NG G. . D DE E S SI IS ST TE EM MA AS S
I IN NG G. . I IN ND DU US ST TR RI IA AL L
C CA AP PI IT TU UL LO O I IX X
D DI IS ST TR RI IB BU UC CI IO ON NE ES S B BI ID DI IM ME EN NS SI IO ON NA AL LE ES S
( (M MA AT T- -2 23 33 3/ /M MA AT T- -2 28 80 0) )
1 11 1
S SE EM ME ES ST TR RE E I I/ /9 98 8
D Do oc ce en nt te e: : I In ng g. . R Ro ob be er rt to o M Ma an nc ch he eg go o C C. .
C Co oc ch ha ab ba am mb ba a, , J Ju ul li io o d de e 1 19 99 98 8

Vous aimerez peut-être aussi