Vous êtes sur la page 1sur 101

Apuntes de clase Estadstica General

INTRODUCCION

Hace ms de 100 aos H. G. Wells, escritor e historiador ingls, dijo que el conocimiento
estadstico ser algn da tan necesario para ser un buen y eficiente ciudadano,
como la aptitud de poder leer y escribir.

En la actualidad, probablemente dira: las nociones estadsticas son necesarias no


nicamente para ser un buen y eficiente ciudadano, sino tambin para una toma
acertada de decisiones en diversos aspectos de nuestra vida

Una de las herramientas utilizadas para tomar decisiones es la estadstica. La estadstica


no solo se sirve a la gente dedicada a los negocios; en nuestra vida cotidiana tambin
aplicamos conceptos estadsticos. Por ejemplo, para comenzar el da, usted al baarse
abre la regadera y deja correr el agua unos segundos. Enseguida moja su mano para
percatarse si la temperatura es adecuada o decidir si abre ms la llave de agua caliente o
la del agua fra. Ahora suponga que est en un supermercado y quiere comprar embutidos.
Dos marcas tienen un puesto de promocin y cada uno le ofrece una pequea proporcin.
Despus de probar, decide su compra.

HISTORIA DE LA ESTADSTICA

La recopilacin sistemtica de datos econmicos y de poblacin se inici en Venecia y


Florencia, las ciudades-Estado italianas, durante el Renacimiento. El trmino
ESTADISTICA, derivado de la palabra Estado, se utiliz entonces para referirse a la
obtencin de datos de inters estatal. Esta idea de recopilacin de datos se extendi desde
Italia a otros pases de Europa occidental. De hecho, durante la primera mitad del siglo
XVI, era habitual que los gobiernos europeos obligaran a las parroquias a que registraran
los nacimientos, los matrimonios y las defunciones. Debido a las muy escasas condiciones
de salud pblica, las estadsticas referidas a estos hechos tenan un especial inters.

El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia
descriptiva de los Estados, se identific cada vez ms, en el siglo XIX, con las cifras
cuantitativas. Hacia 1830, en Francia e Inglaterra, el trmino ya fue usado de forma general
como sinnimo de la ciencia numrica de la sociedad. Este cambio de significado se debi
a que, desde 1800, los gobiernos de Europa Occidental y de Estados Unidos comenzaron
a recopilar y publicar sistemticamente una gran cantidad de registros de censos y de otros
tipos de tablas.

Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por
matemticos tales como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su
aplicacin al estudio de hechos estadsticos fue casi inexistente, ya que la mayor parte de
los estadsticos sociales de la poca se contentaban con dejar que los datos hablaran por
s mismos. En particular, en esa poca los estadsticos no estaban interesados en sacar
inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener
censos de la poblacin al completo. Como resultado, la inferencia probabilstica sobre la
poblacin a partir de muestras era prcticamente desconocida en las estadsticas sociales
del siglo XIX

1
Apuntes de clase Estadstica General

No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por
inferir conclusiones a partir de los datos numricos. El movimiento comenz con los
trabajos de Francis Galton sobre el anlisis de la influencia de la herencia a travs de la
utilizacin de tcnicas que actualmente se conocen como anlisis de regresin y
correlacin, que alcanzaron su mayor auge con los trabajos de Karl Pearson. ste, que
desarroll los contrastes de bondad de ajuste, fue el primer director del laboratorio Galton,
fundado por Galton en 1904. All, Pearson lider un programa de investigacin con el
objetivo de desarrollar nuevos mtodos en los que la Estadstica se utiliza con fines
inferenciales. Su laboratorio potenci que investigadores provenientes de distintas reas
de la ciencia y la industria aprendieran los mtodos estadsticos que podan tener
aplicacin en sus campos. Uno de los primeros estudiantes que acudi a su laboratorio fue
W. S. Gosset qumico de formacin, que demostr su devocin por Pearson y public sus
propios trabajos bajo el seudnimo de Student. Existe una famosa leyenda que mantiene
que Gosset tema publicar sus trabajos, bajo su propio nombre por miedo a que, en la
fbrica de cerveza Guinnes, donde laboraba, sus jefes descubrieran que uno de sus
qumicos realizaba investigaciones estadsticas. Gosset es famoso por el desarrollo de los
contrastes de t.

Dos de las reas ms importantes de aplicacin de la Estadstica a principios del siglo XX


fueron la biologa y la agricultura; todo ello gracias al inters de Pearson y de otros
investigadores de su laboratorio, y tambin a los logros del cientfico ingls Ronald A.
Fisher. La teora de la inferencia desarrollada por estos investigadores pioneros y otros
entre los que se encuentran Egon Pearson, hijo de Karl Pearson, y el estadstico
matemtico polaco Jersy Neyman- fue lo suficiente general como para tratar una amplia
gama de problemas cuantitativos prcticos. Como resultado, tras los primeros aos del
siglo XX, aument muy rpidamente el nmero de personas, procedente de la ciencia, los
negocios y la administracin, que empezaron a considerar la Estadstica como una
herramienta capaz de suministrar soluciones cuantitativas a una gran variedad de
problemas cientficos y prcticos.

En la actualidad, podemos encontrar las ideas estadsticas en muchos mbitos. La


Estadstica Descriptiva puede verse en peridicos y revistas. La Inferencia Estadstica
se ha hecho indispensable en las investigaciones mdicas y de salud pblica, en la
investigacin de mercados y en el control de calidad, en la educacin, la contabilidad, la
economa, en la prediccin meteorolgica o de las votaciones, y en muestreos, deportes,
seguros, en juego de apuestas y en cualquier tipo de investigacin que pretenda ser
cientfica. Hoy en da, la Estadstica se ha convertido realmente en una pieza integrante de
nuestra herencia.

LA CAMBIANTE DEFINICION DE LA ESTADSTICA

La Estadstica tiene el objeto de realizar una representacin fiable de un Estado en una


poca determinada (Quetelet, 1849)

La Estadstica es la nica herramienta mediante la cual se puede conseguir una apertura


en la formidable espesura de dificultades que entorpece el camino de aquellos que
estudian la Ciencia del hombre (Galton, 1889)

2
Apuntes de clase Estadstica General

La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el
estudio de las variaciones y (iii) como el estudio de los mtodos de reduccin de datos
(Fisher, 1925).

La Estadstica es la disciplina cientfica relativa a la recopilacin, el anlisis y la


interpretacin de datos obtenidos mediante la observacin o la experimentacin. Tiene una
estructura coherente basada en la Teora de la Probabilidad e incluye muchos
procedimientos diferentes que contribuyen a la investigacin y el desarrollo en todas las
ramas de la Ciencia y la Tecnologa. (E. Pearson, 1936)

La Estadstica es el nombre de la ciencia que trata de llevar a cabo inferencias bajo


situaciones de incertidumbre; para ello, usa los nmeros para averiguar cuestiones
relativas a la naturaleza y la experiencia. (Weaver, 1952).

La Estadstica se caracteriza en el siglo XX como una herramienta matemtica para


analizar datos experimentales u observados. (Ross, 2005).

Estadstica es la ciencia que nos ayuda a recolectar, organizar, presentar, analizar e


interpretar datos para una toma de decisin ms efectiva. (Alvaro Pintado-Agurto Meja,
2009).

CUAL ES LA DEFINICION DE ESTADISTICA?

Nos topamos con ella en el lenguaje cotidiano. En realidad posee dos significados: En su
acepcin ms comn, la estadstica se refiere a informacin numrica. Algunos ejemplos
son: el sueldo inicial de los graduados de Universidad, el nmero de muertos provocados
por el alcoholismo el ao pasado, el nmero de goles en un partido de futbol etc. En estos
ejemplos las estadsticas se refieren a un valor o porcentaje.

Todos estos ejemplos se refiere constituyen ejemplos de estadsticas. Una coleccin de


informacin numrica recibe el nombre de estadsticas. A un dato numrico o valor
aislado se la denomina dato estadstico

ESTADISTICA.-

Ciencia que se ocupa de la creacin, el desarrollo y aplicacin de tcnicas que permitan


hacer un anlisis confiable de una poblacin. En trminos generales, se ocupa de la
coleccin, el resumen y la presentacin de la informacin, y del anlisis e interpretacin de
datos y resultados, de modo tal que se puedan derivar a partir de la informacin captada.

Usualmente, se toman decisiones bajo condiciones de incertidumbre. La ciencia de la


estadstica proporciona un conjunto de procedimientos que permiten tomar dichas
decisiones de manera ms confiable

Estadsticas (en plural).- Se refiere a un ordenamiento sistemtico de datos, presentados


en forma de tablas o cuadros y grficas. En otras palabras, las estadsticas son datos
agrupados en forma metdica y presentada en publicaciones, elaboradas por diversas
empresas o entidades privadas o del estado, buscando ser consultadas por los interesados

3
Apuntes de clase Estadstica General

DIVISION DE LA ESTADISTICA

El estudio de la estadstica se divide en dos categoras: la estadstica descriptiva y la


estadstica inferencial

ESTADSTICA DESCRIPTIVA

Es la rama de la estadstica que se ocupa del resumen y la descripcin de los datos


recolectados; es decir, se ocupa de la clasificacin de la informacin, de su resumen en
tabulaciones y de su presentacin mediante cuadros y grficos que describan en forma
apropiada el comportamiento de la informacin captada. Luego, se realizan los clculos de
las medidas estadsticas (paramentos o estadsticos), se interpretan los valores
correspondientes y se realiza un anlisis estadstico inicial. El anlisis estadstico final se
efecta en la siguiente etapa.

Por ejemplo, cuando se hace una encuesta para estudiar la opinin del pblico sobre la
calidad y el precio posible de un nuevo producto, con la aplicacin de la estadstica
descriptiva sera posible, entre otras cosas, clasificar las respuestas de modo tal que sea
posible tener una idea general de la opinin del pblico; con las respuestas sobre el precio
evaluar su promedio y la variabilidad de las respuestas; construir cuadros, tablas y grficos
que permitan evaluar visualmente el comportamiento de la informacin..

OBJETIVO DE LA ESTADISTICA DESCRIPTIVA


RECOPILAR

IDENTIFICAR, CONOCER
DESCUBRIR,RESUMIR
Datos recopilados
Proporcionando

INDICES, MEDIDAS Y GRFICOS


Obtenidos a partir de los datos recopilados

ESTADISTICA INFERENCIAL

Es la rama de la estadstica que se ocupa de los procesos de estimacin de parmetros y


pruebas de hiptesis. Su propsito es llegar a conclusiones que brinden un adecuado
sustento cientfico para la toma de decisiones sobre la base de la informacin muestral
captada

INFERIR

ANALIZAR
POBLACION MUESTRA
DATOS

4
Apuntes de clase Estadstica General

ETAPAS DE UN TRABAJO ESTADISTICO

La estadstica como ciencia tiene como objetivo desarrollar procedimientos que permitan
obtener conclusiones acerca de los parmetros de una poblacin a partir de los datos
mustrales captados.

Para la aplicacin objetiva y pragmtica de los procedimientos y tcnicas estadsticas es


recomendable tener presente las siguientes etapas:

a.- Definicin del problema.- En esta etapa se determina con claridad el estudio por
realizar los objetivos de la investigacin. Adems, se debe establecer cul es la
poblacin en estudio, se debe identificar las variables de inters, se deben formular
hiptesis y se debe establecer el plan de tabulacin de datos. Esto ltimo constituye un
conjunto de modelos de cuadros que se pretenden formar con la informacin captada.

b.- Formulacin del plan de recopilacin de datos.- En esta etapa se precisa si se


trabaja con la poblacin o si se trabaja con una muestra, es decir, si se realizar el
censo o muestreo, para lo cual ser necesario formular un plan de recopilacin de datos
que permitan alcanzar los objetivos de la investigacin. Si se realiza un censo, el plan
de recopilacin de datos se denominar plan censal. Si se lleva a cabo un muestreo, el
plan de recopilacin de datos se llamar plan de muestreo.

c.- Recopilacin de datos.- En esta etapa se recogen los datos de acuerdo con los planes
establecidos en la etapa anterior, teniendo cuidado en controlar la calidad de la
informacin que se recopila. El xito de una investigacin de pende de gran parte de la
calidad de los datos captados.

d.- Clasificacin, clculo de medidas estadsticas, anlisis e interpretacin.- En esta


etapa se clasifica la informacin segn sus caractersticas y se resume mediante la
aplicacin de medidas estadsticas (parmetros o estimadores) para su posterior
anlisis e interpretacin.

e.- Generalizacin e inferencia.-mediante la aplicacin de los mtodos de inferencia


estadstica, las conclusiones de la investigacin son generalizadas a la poblacin de
donde se obtuvo la informacin

CONCEPTOS BASICOS

En la aplicacin de los diversos procesos estadsticos es necesario tener presente cierta


terminologa asociada a esta ciencia para una mejor comprensin de los resultados que se
obtengan con su aplicacin. As por ejemplo, cuando los estadsticos mencionan trminos
como poblacin, individuo, observacin, etc se refieren a conceptos con un significado que
tiene una particular importancia, la cual es conveniente precisar.

POBLACION

Una poblacin es el conjunto de todas las unidades elementales que poseen


caractersticas o factores que son de inters para un estudio.

Por ejemplo, si se desea estudiar la realidad socioeconmica de las familias de un lugar,


las caractersticas de inters pueden ser el ingreso mensual, la cantidad de hijos la

5
Apuntes de clase Estadstica General

tenencia de agua y desage, etc. Es decir se tiene una realidad que es desconocida y
sobre la cual se desea conocer cmo se comportan los elementos que la conforman

Segn sea el nmero de elementos, la poblacin puede considerarse como finita o infinita.
Es una poblacin finita cuando el nmero de elementos que la compone es limitado; es
infinita cuando consta de ilimitado nmero de elementos

Por ejemplo

- Conjunto de familias de una ciudad


- Conjunto de empresas de una regin
- Conjunto de bombillas elctricas producidas en un periodo de produccin

MUESTRA

Es un sub conjunto de unidades elementales, elegidas de una poblacin.

Ejemplo

- 200 familias elegidas en una ciudad de un total de cien mil


- 30 empresas elegidas en una regin de un total de mil
- 80 bombillas elctricas elegidas de las producidas en un determinado momento del
periodo de produccin.

Marco.- Se denomina marco, marco muestral o marco de referencia, a la lista, mapa o


cualquier otro material aceptable, que contenga todas las unidades o elementos
perfectamente identificados y actualizados, donde se selecciona la muestra

CLASES DE MUESTRAS

Dependiendo de la forma como se eligen las unidades, las muestras pueden ser aleatorias
o no aleatorias

MUESTRAS ALEATORIAS

Son aquellas cuyos elementos son elegidos usando algn criterio probabilstico. En este
caso, todos los elementos tienen alguna posibilidad de salir elegidos. En algunos casos,
todos los elementos tienen la misma posibilidad de ser elegidos en otros casos no.

MUESTRAS NO ALEATORIAS

Son aquellas cuyos elementos son elegidos mediante criterios no probabilsticos. En este
caso, existen elementos de la poblacin que no tienen posibilidad alguna de ser elegidos.

La ventaja de las muestras aleatorias respecto de las muestras no aleatorias, es que


brindan una mayor confianza en que los datos recopilados no estn afectados por sesgos
o factores extraos a la investigacin.

Por otro lado, para que un anlisis estadstico basado en muestras sea objetivo y eficiente,
es necesario que la muestra sea representativa de la poblacin de donde se eligieron sus
elementos; es decir, es necesario que todas las caractersticas importantes existente en la

6
Apuntes de clase Estadstica General

poblacin se vean reflejadas de alguna manera en la muestra que ser utilizada para
realizar el anlisis

UNIDAD ELEMENTAL

Es todo elemento que est asociado a una caracterstica o factor que se desea estudiar en
la poblacin o muestra. Por ejemplo:

- Al realizar un estudio socio econmico en una ciudad, una caracterstica en estudio


ser el ingreso familiar, y cada familia de la ciudad ser una unidad elemental
- Al estudiar el grado de preparacin tcnica de los trabajadores de una empresa,
una caracterstica en estudio podra ser el grado de instruccin, y cada trabajador
de la empresa ser una unidad elemental.

VARIABLE

Se refieren a las caractersticas o propiedades que se desean estudiar o investigar y que


pertenece a una poblacin o muestra. Las variables se denotan con letras mayscula(X,
Y, Z)

TIPOS DE VARIABLE

A.- Segn la naturaleza hay dos tipos de variable

VARIABLE CUALITATIVA O ATRIBUTO

Es cuando la caracterstica que se estudia es de naturaleza no numrica (cualidad,


caracterstica o atributo) y sus datos se expresan usando palabras.

- Variable cualitativa nominal, es aquellas que estable la distincin de los


elementos en categoras sin implicar el orden entre ellas Ejemplo:

Gnero, filiacin religiosa, tipo de automvil que se posee, color de ojos.

- Variable cualitativa ordinal, es aquella que agrupa a los objetos, individuos, en


categoras ordenadas, para establecer relaciones comparativas Ejemplo:

Nivel de instruccin, nivel de pobreza, calidad de los artculos producidos por una
empresa

VARIABLE CUANTITATIVA

Es cuando la variable que se estudia aparece en forma numrica. Puede ser discreta y
contina.

- Variable cuantitativa discreta, es aquella que adopta solo ciertos valores y existe
vaco entre ellos, ejemplo:

Nmero de camas en una casa, nmero de estudiante en cada aula, cantidad de


accidentes en una empresa.

Las variables discretas son el resultado de un proceso de conteo.

7
Apuntes de clase Estadstica General

- Variable cuantitativa contina, es aquella que toma cualquier valor dentro de un


intervalo especfico. Ejemplo:

Presin de aire de una llanta, duracin de un vuelo entre Lima y Chiclayo.

Las variables continuas son el resultado de mediciones.

B.- Segn su relacin

Variables independientes (VI)

Son las variables explicativas o predictivas, cuya asociacin, relacin o influencia en la


variable dependiente se pretende descubrir en una investigacin. Las variables
independientes son las que traducen o explican las causas o razones de las variaciones de
la variable dependiente

Variables dependientes (VD)

Son aquellas que se explican por otra variable, son los efectos o resultados respecto a los
cuales hay que buscar un motivo, causa o razn de ser. Es la variable que traduce la
consecuencia del efecto de una o varias razones o causas, de otras variables

Variables intervinientes o interferentes

Son aquellas que coparticipan con la variable independiente condicionando el


comportamiento dela variable dependiente

Ejemplo:

La escasa difusin de la importancia la educacin alimentaria en la poblacin, es una de


las causa del incremento de la desnutricin infantil, en las familias con bajos nivel de
instruccin.

Educacin alimentaria (VI)


Desnutricin infantil (VD)
Nivel de instruccin (V interviniente)

OBSERVACION

Es el dato o registro que resulta de la apreciacin de una caracterstica en un individuo o


unidad elemental. Una observacin puede ser cualitativa o cuantitativa. Por ejemplo:
- Rojo, es la observacin del color preferido por una determinada persona
- 240 toneladas, es la observacin del volumen de produccin de harina de pescado
de una fabrica
- Bueno, es la observacin de la calidad de un producto despus de ser revisado por
u tcnico en control de calidad

8
Apuntes de clase Estadstica General

Tipos de variables

Cualitativas Cuantitativas

Discreta Continua
-Marca de PC
- Estado civil
-Color del cabello -Hijos por familia - Peso de un alumno
- Alumnos por - Estatura de un
aula alumno

NIVELES DE MEDICIN DE LOS DATOS

Los datos se clasifican por niveles de medicin. El nivel de medicin de los datos rige los
clculos que se llevan a cabo con el fin de resumir y presentar los datos. Tambin
determina las pruebas estadsticas que se deben realizar.

Por ejemplo, si se compra una caja de lentejas de dulce, encontramos que hay seis
colores. Suponga que se le asigna 1 al caf, 2 al amarillo, 3 al azul, 4 al naranja, 5 al verde
y 6 al rojo. Sume la cantidad de lentejas que hay en la caja, la divide entre el nmero de
lenteja e informa que el color promedio es 3.56. Significa que el color promedio es azul o
anaranjado? Desde luego que no.

Otro ejemplo, en la pista atltica hay ocho competidores para una carrera de 400 metros.
Para indicar el orden en que llegan a la meta se dice que la media es de 4.5 Qu revela
este promedio? Nada. En ambos casos, no se emple adecuadamente en nivel de
medicin.

Existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn

La medicin ms baja o primaria corresponde al nivel ordinal. La ms alta o el nivel que


proporciona la mayor informacin relacionada con la observacin es la medicin de razn.

DATOS DE NIVEL NOMINAL

En el caso del nivel nominal de medicin, las observaciones acerca de una variable
cualitativa solo se clasifican y se cuentan. No existe una forma particular para ordenar las
etiquetas (categoras). La clasificacin de las de lentejas de dulce, simplemente se
clasifican por color. No existe un orden natural. Es decir, no se presentan primero las
lunetas color caf, las anaranjadas o las de cualquier color. El gnero representa otro
ejemplo del nivel de medicin nominal. Si contamos en una aula de clase, cuantos hombre
y cuantas mujeres hay. Podramos presentar primero a los hombres o a las mujeres. Para
el nivel nominal, la medicin consiste en contar.

Los datos del nivel nominal poseen las siguientes caractersticas.

9
Apuntes de clase Estadstica General

1.- Las categoras de datos se encuentran representadas por etiquetas o nombres.


2.- Aun cuando las etiquetas se codifiquen con nmeros, las categoras de datos no tienen
ningn orden lgico.

DATOS DE NIVEL ORDINAL

El nivel inmediato superior de datos es el nivel ordinal. En la siguiente tabla se presentan


las calificaciones que los alumnos del profesor PERICO PEREZ le otorgaron despus de
un curso de introduccin aeroespacial. Cada estudiante de la clase respondi a la pregunta
En trminos generales. Cmo calificas al profesor del curso? Las calificacin variable
ilustra el uso dela escala ordinal de medicin. Una calificacin es la ms alta o mejor, que
la siguiente: Superior es mejor que bueno, bueno es mejor que promedio, etc. Sin embargo
no es posible distinguir la magnitud de las diferencias entre grupos. La diferencia entre
superior y bueno es la misma que entre malo e inferior? No es posible afirmarlo.

Las propiedades del nivel ordinal de los datos son:

1.- Las calificaciones de los datos se encuentran representadas por conjuntos de etiquetas
o nombres (alto, medio, bajo), las cuales tienen valores relativos.
2.- En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.

DATOS DE NIVEL DE INTERVALO

El nivel de intervalo de medicin es el nivel de inmediato superior. Incluye todas las


caractersticas del nivel ordinal, pero adems la diferencia entre valores constituye una
magnitud constante.

Un ejemplo de nivel de intervalo de medicin es la temperatura. Suponga las temperaturas


mximas durante tres das consecutivos de verano en la ciudad de Chiclayo son 29, 34 y
26 grados Fahrenheit. Estas temperaturas se clasifican fcilmente aunque, es posible
determinar la diferencia entre ellas gracias a que un grado Fahrenheit representa una
unidad de medicin constante. Diferencias iguales entre dos temperaturas son las mismas,
sin importar su posicin en la escala Es decir, la diferencia entre 20 y 25 grados Fahrenheit
es de 5: la diferencia entre 40 y 45 grados tambin es de 5. Es importante destacar que 0
es un punto ms en la escala. No representa la ausencia de algo. Cero grados Fahrenheit
no representa la ausencia de calor, sino sencillamente el hecho que hace frio. De hecho, 0
grados Fahrenheit equivale aproximadamente a 18 grados en la escala Celsius.

Las propiedades de los datos de nivel de intervalo son las siguientes:

1.- Las clasificaciones de datos se ordenan de acuerdo con el grado que posea la
caracterstica en cuestin
2.- Diferencias iguales en la caracterstica representan diferencias iguales en las
mediciones.

DATOS DE NIVEL DE RAZN

Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. El nivel
de razn es el ms alto. Posee todas las caractersticas del nivel de intervalo, aunque,
adems el punto 0 tiene sentido y la razn entre dos nmeros es significativa

10
Apuntes de clase Estadstica General

Ejemplos de la escala de razn de medicin incluye salarios, unidades de produccin,


peso, cambios en los precios de acciones, distancia entre dos ciudades, altura, etc.
El dinero ilustra bien el caso. Si se tiene cero nuevos soles, entonces no tiene dinero.
La razn entre nmeros tambin resulta significativa. Si Diana gana $18 000 anuales
vendiendo seguros y Ral gana $ 36 000 vendiendo automviles, entonces Ral gana el
doble de lo que gana Diana.
Las propiedades de los datos de nivel de razn son las siguientes:

1.- Las clasificaciones de datos se ordenan de acuerdo con la cantidad de caractersticas


que poseen.
2.- Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros
asignados las clasificaciones.
3.- El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es
significativa.

Escala Descripcin Ejemplo


Sus valores se clasifican en categoras o clases, entre Sexo
las cuales no se puede establecer ningn ordenamiento Estado civil
Nominal sugerido por la magnitud de sus valores. Relacin de Religin
igualdad
Sus valores se pueden clasificar en categoras y se Clase social
pueden ordenar. Relacin de orden (mayor o menor). Orden de
Ordinal
Relacin de igualdad mrito

Diferencia de los objetos en cantidad. Relacin de Temperatura


distancia. Relacin de orden. Relacin de igualdad. El Test de
Intervalo
cero es arbitrario y no denota ausencia de propiedad. inteligencia
Adicin y sustraccin
Existencia de un cero real (ausencia de propiedad). Peso
Relacin de distancia. Relacin de orden. Relacin de Sueldo
Razn
igualdad. Sus valores pueden obtenerse por conteo Longitud
(discretos) o por registro continuo (peso, volumen, etc.)

Esto mismo puede representarse de manera esquemtica:

Razn 0 absoluto
Intervalo Distancia. Cero convencional
Ordinal Relacin de orden, igualdad y no igualdad
Nominal Relacin de identidad

11
Apuntes de clase Estadstica General

Niveles de Medicin

Nominal Ordinal Intervalo Razn

Los datos solo se Los datos se Diferencia significativa Punto 0 significativo y


clasifican ordenan entre valores razn entre valores

Marca de automvil Su nmero en la


- Temperatura -Nmero de pacientes
lista de clase atendidos
- Talla

PARAMETRO:

Es una funcin de todas las observaciones de una poblacin. Un parmetro es un


indicador que resume la informacin contenida en las observaciones proporcionadas por
todas las unidades elementadlas comprendidas en una poblacin, por lo cual su valor es
nico y constituye usualmente un valor desconocido que todo investigador desea conocer.
Los parmetros se definen tambin como valores constantes que caracterizan a una
poblacin. Algunos parmetros son:

- Media poblacional, cuya notacin es


- Variancia o varianza poblacional, cuya notacin es
- Moda poblacional, cuya notacin es Mo

ESTADISTICO O ESTIMADOR

Es una funcin de las observaciones mustrales y que no depende de parmetro algn. Un


estadstico o estimador permite resumir la informacin contenida en las observaciones que
corresponde a una muestra. Se caracteriza porque pueden tomar valores diferentes de
muestra a muestra, debido a que las observaciones captadas en muestras diferentes no
son necesariamente iguales. Los estadsticos o estimadores son tiles porque permiten
obtener estimaciones (aproximaciones) del valor de los parmetros respectivos .Algunos
de los estimadores son.

- Media muestral, cuya notacin es


- Variancia o varianza muestral, cuya notacin es
- Moda muestral, cuya notacin es mo

Los valores que se obtienen al aplicar los estimadores o estadsticos a una muestra
particular son llamados estimados de los parmetros. Es decir, si para una muestra se
obtiene:

= 128,45. 2 =9,16, mo = 125,42

Estos valores son los estimados, de los parmetros definidos como media poblacional (),
variancia poblacional ( 2 ), y moda poblacional (Mo) respectivamente.

12
Apuntes de clase Estadstica General

La diferencia entre el estimador y el parmetro, se le denomina error de muestreo, y


lo fija el investigador para determinar el tamao de muestra, con base en la experiencia y
el conocimiento que tenga sobre el comportamiento y la variacin que tenga la
caracterstica o caractersticas principales relacionadas con el objetivo mismo de la
investigacin.

DESCRIPCIN DE DATOS

PARTES DE UNA TABLA O CUADRO ESTADSTICO.

Las partes de un cuadro estadstico son: 1 Nmero del cuadro; 2 Ttulo; 3 Cuadro
propiamente dicho; 4 Las notas explicativas o calce; 5 Fuente
1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se
escribe a continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto
cuadro del captulo dos.

2.- TTULO.- Es la identificacin que preside la tabla y es colocada en la parte superior de


la misma. El ttulo debe reunir las condiciones siguientes: a.- ser completo; b.- ser
conciso.
a.- SER COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido
del cuadro estadstico. Debe responder a las preguntas: Qu, Cmo, Dnde y
Cundo
QUE: A qu se refiere la tabla que se estudia. Cul es el universo que se investiga.
Ejemplo: Alumnos matriculados
COMO: Cmo se estudia, de acuerdo a cules caractersticas se clasifican los
individuos u objetos estudiados. Las variables ubicadas en las filas se identifican
con la proposicin segn y las de las columnas con la proposicin por
Ejemplo: Por sexo y segn especialidad
CUANDO: Momento o periodo de tiempo a que se refiere el estudio.
Ejemplo: Ciclo 2016- II
DONDE: Lugar a que se refiere la informacin.
Ejemplo Universidad Nacional Pedro Ruiz Gallo.
b.- SER CONCISO.- El ttulo debe ser breve, lo ms conciso posible, aunque no debe
sacrificarse la claridad a la concisin.

3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin
y consta de un conjunto de casillas o celdas, dispuestas en columnas y filas. Sus
elementos esenciales son: encabezamiento de las columnas, columna principal o
matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y
el objeto de cada una de las columnas, es decir indica la naturaleza de los datos
inscritos en cada una de las celdas que se hallan debajo. Deben ser breves y
explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las
diferentes clases de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y
columnas, donde estn anotados los datos numricos.

13
Apuntes de clase Estadstica General

4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para


aclarar algunos trminos o siglas tambin para indicar que elementos estn o no
incluidos en algunos de los conceptos del cuadro.

5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se
recurre a los propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadro

CONSTRUCCIN DE UNA TABLA DE FRECUENCIA

TABLA DE FRECUENCIAS

Llamada tambin distribucin de frecuencias es la agrupacin de datos en clases


mutuamente excluyentes que muestra el nmero de observaciones en cada clase

TABLA DE FRECUENCIA DE DATOS CUALITATIVOS

Antes de iniciar el trabajo de organizacin de datos cualitativos, es necesario determinar si


los datos por procesar corresponden a variables cualitativas jerrquicas o nominales. Si los
datos cualitativos nominales, se pueden formar categoras que pueden ser presentadas
indistintamente en cualquier orden; por ejemplo los colores de preferencia de las personas.
Si los datos cualitativos son de una variable cualitativa jerrquica, entonces dichos datos
deben estar asociados a algn orden en su presentacin, por ejemplo, las opiniones sobre
la calidad de un artculo.

En el caso de datos cualitativos, la tabla de distribucin de frecuencias adoptar la


siguiente forma

Frecuencia
Frecuencia Frecuencia
relativa
Absoluta Relativa
Variable porcentual

%
Caracterstica A 100 %
Caracterstica B 100 %

Caracterstica Z 100 %
Totales N 1 100%

Tabla de frecuencia de los vehculos vendidos por VEHICULOS SAC, el mes pasado.

Tipo de Nmero de
automvil automviles
Domstico 50
De importacin 30

14
Apuntes de clase Estadstica General

El nmero de observaciones en cada clase se denomina frecuencia de clase. Se


simboliza

Frecuencia relativa de clase.- Es posible convertir las frecuencias de clase en


frecuencias relativas de clases para mostrar la fraccin del nmero total de observaciones
en cada clase. As, una frecuencia relativa capta la relacin entre la totalidad de elementos
de una clase y el nmero total de las observaciones. Se simboliza

Tabla de frecuencia relativa de vehculos vendidos por VEHICULOS SAC el mes pasado

Tipo de Cantidad Frecuencia


vehculo Vendida relativa
Domstico 50 0.625 50
80
De 30 0.375 30
80
importacin
Total 80 1.000

REPRESENTACIN GRFICA DE DATOS CUALITATIVOS


GRFICA DE BARRAS
Aqu las clases se representan en el eje horizontal y la frecuencia de clase en el eje
vertical. Las frecuencias de clase son proporcionales a las alturas de las barras

Una caracterstica distintiva de la grfica de barras es que existe una distancia o espacio
entre las barras. Es decir que, como la variable de inters es de naturaleza cualitativa, las
barras no son adyacentes. Por consiguiente, una grfica de barras es una representacin
grfica de una tabla de frecuencias mediante una serie de rectngulos de anchura
uniforme, cuya altura corresponde a la frecuencia de clase

Grfica No 1 Vehculos vendidos por tipo el mes pasado por VEHICULO SAC.

70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
Domstico De importacin

GRAFICA DE PASTEL

Grfica que muestra la parte o porcentaje que representa cada clase del total de
nmeros de frecuencia

15
Apuntes de clase Estadstica General

37.50% Domstico
62.50%
De importacin

Grafico Caracterstica
. Los datos de cada categora se representan por una barra rectangular
(vertical u horizontal)
Barras . La altura del rectngulo es proporcional a la frecuencia de la categora
. Si la escala es ordinal deben aparecer en su orden natural
. Las barras aparecen separadas
. Son apropiadas para variables cualitativas que no tengan muchas
categoras
Circular . Los datos de cada categora se representan por un sector circular
. El ngulo central de cada sector es proporcional a la frecuencia relativa
expresada porcentualmente
. Si el grfico toma forma tridimensional se denomina de pastel o torta

Ejemplo:

La empresa STAT.S.A llev a cabo un estudio sobre el empleo de los habitantes de una
regin. Entre las inquietudes que motivaron el estudio se tena inters por conocer los
sectores que generan mayor empleo. Para realizar el estudio se eligieron al azar 200
personas a las cuales se les pregunt, entre otras cosas, sobre el sector econmico en el
cual se desenvuelve la institucin por la cual trabajan. Luego de clasificar las respuestas
observadas, se ha obtenido por un proceso de conteo los siguientes resultados.

Sectores Frecuencia Frecuencia Frecuencia


Absoluta Relativa Porcentual
%
Agricultura 73 0,365 36,5
Comercio 35 0,175 17,5
Educacin 54 0,270 27,0
Industria 26 0,130 13,0
Turismo 12 0,060 6,00
TOTAL 200 1,000 100

16
Apuntes de clase Estadstica General

DIAGRAMA DE BARRAS

GRAFICOS CIRCULARES O SECTORES

Tambin se puede usar efectos tridimensionales

17
Apuntes de clase Estadstica General

Ejemplo:

En relacin a la ejercicio anterior, suponga que la empresa STAT S. A. Tambin consider


estudiar la generacin de empleo segn el sexo de los trabajadores. Luego de clasificar las
respuestas observadas, se obtiene los resultados siguientes

Frecuencia Frecuencia
Porcentaje
Sectores Sexo Absoluta relativa
%

Agricultura Femenino 36 0,35294 35,294
Masculino 37 0,37755 37,755
Comercio Femenino 15 0,14706 14,706
Masculino 20 0,20408 20,408
Educacin Femenino 35 0,34314 34,314
Masculino 19 0,19388 19,388
Industria Femenino 6 0,05882 5,882
Masculino 20 0,20408 20,408
Turismo Femenino 10 0,09804 9,804
Masculino 2 0,02041 2,041
Total Femenino 102 1,00000 100,00
Masculino 98 1,00000 100,00

Las frecuencias de este cuadro se obtienen de manera similar a lo explicado


anteriormente, con la diferencia de que las frecuencias relativas y porcentuales referidas a
la categora femenino y masculino se obtienen considerando a 102 personas para el
primer caso y a 98 personas para el segundo.

18
Apuntes de clase Estadstica General

En este caso, como puede apreciarse, es conveniente adicionar una leyenda para indicar
el color que representa a cierta informacin. Por otro lado, tambin puede observarse que
existe una separacin entre cada grupo de barras verticales equivalente a la mitad del
ancho de cada grupo. Se debe tener en cuenta que si los nombres o etiquetas de las
categoras son grandes, es preferible utilizar el grafico de barras horizontales, cuya
construccin es similar a lo indicado anteriormente.

Del mismo modo, para mejorar la presentacin, se suele utilizar grficos en tres
dimensiones. Los grficos anteriores pueden ser presentados de la siguiente manera.

19
Apuntes de clase Estadstica General

ELABORACION DE TABLA DE FRECUENCIA DATOS CUANTITATIVOS

Ante todo es conveniente familiarizarnos con ciertos smbolos que se usan tanto en la
variable discreta como en la variable continua.

N n Tamao de la muestra
N N Tamao de la poblacin o universo
Identificacin para cada valor observado (minscula en
la muestra)
Frecuencias absolutas
Frecuencias relativas

Frecuencias absolutas acumulativas
Frecuencias relativas acumulativas
Identifica la variable discreta o las marca de clase en
la continua
Identifica a ala variable continua con sus intervalos
I C Amplitud del intervalo
M M Numero de valores de la variable o de intervalo

TABLAS DE DATOS DISCRETOS

Ejemplo.- Un experimento consisti en contar el nmero de flores por planta de una


muestra de 32 plantas. Los valores resultantes del conteo fueron los siguientes:

1 10 2 8 3 4 4 6 5 5 6 8 7 10 8 3
9 7 10 3 11 6 12 7 13 2 14 8 15 2 16 3
17 9 18 7 19 8 20 1 21 9 22 = 10 23 5 24 6
25 4 26 6 27 7 28 5 29 7 30 3 31 5 32 8

Clasificacin.- En este caso se identifican los distintos valores que tiene y ubicamos el
mayor y menor valor: = 1 = 10

20
Apuntes de clase Estadstica General

Los diferentes valores que toma la variable los vamos a denotar por

1 = 1 2 = 2 3 = 4 4 = 2 5 = 4 6 = 4 7 = 5 8 = 5 9 = 2 10 = 3
Tabla No 4. Distribucin del nmero de flores por planta. Marzo 2016.

No de Tarjas Frecuencia
Flores
1 / 1
2 // 2
3 //// 4
4 // 2
5 //// 4
6 //// 4
7 ///// 5
8 ///// 5
8 // 2
10 /// 3
Total 32

TABLA PARA DATOS CONTINUOS

Designemos tambin el conjunto original de datos u observaciones por 1 , 2,. , siendo


n el tamao del conjunto y donde estos datos son del tipo continuo, para construir una
tabla de frecuencia debemos calcular lo siguiente:

CLASES.- (m, K)
Se llaman clases a cada uno de los grupos en los que se divide el conjunto de datos. No
hay una regla fija para determinar el nmero de clases.
4
K= 2, 5
K = 1 + 3, 3 log n
5 20
RANGO. - (R)

Diferencia entre la observacin que tiene el valor mximo y la observacin que tiene el
valor minino, tambin se conoce como recorrido amplitud total.

R=

INTERVALO DE CLASE (C).-


Es el cociente que resulta de dividir la amplitud total o rango entre el nmero de clases.

C

MARCA DE CLASE ( ).-

Es el punto medio de un intervalo o clase

21
Apuntes de clase Estadstica General

FRECUENCIA ABSOLUTA ( )

Llamada tambin frecuencia absoluta simple, es el nmero de veces que se repite los
valores dentro de las diferentes clases (intervalo) en la que est dividida la informacin.

FRECUENCIA RELATIVA ( ).-

Se denomina frecuencia relativa del valor al cociente de la frecuencia absoluta de y el


nmero total de observaciones. Se denota por


= =

FRECUENCIA ABSOLUTA ACUMULADA ( ).-

Se llama frecuencia absoluta acumulada correspondiente al valor al nmero de


observaciones menores o iguales a se denota por "

= 1 + 2 + 3 + +
Entonces tenemos
1

1 = = 1
=1
2

2 = = 1 + 2
=1
3

3 = = 1 + 2 + 3
=1
4

4 = = 1 + 2 + 3 + 4
=1
5

5 = = 1 + 2 + 3 + 4 + 5
=1

Y as sucesivamente

FRECUENCIA RELATIVA ACUMULADA ( ) .-

se llama frecuencia relativa acumulada del valor a la frecuencia relativa total de las
observaciones menores o iguales a . Se denota como

f1 +f2 +f3 +.+f


= 1 + 2 + . + =

=
=1

Entonces tenemos:

22
Apuntes de clase Estadstica General

1 = = 1
=1
2

2 = = 1 + 2
=1
3

3 = = 1 + 2 + 3
=1
4

4 = = 1 + 2 + 3 + 4
=1
5

5 = = 1 + 2 + 3 + 4 + 5
=1

As sucesivamente


0 1 1 1 1 1
1 2 2 2 2 2
2 3 3 3 3 3

PROPIEDADES DE LAS FRECUENCIAS


1.- Las frecuencias absolutas y las frecuencias acumuladas absolutas son siempre enteros
no negativos

0 y 0 para i = 1, 2, 3,., m

2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de
observaciones.

= 1 + 2 + =
=1

3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero
fraccionados no negativos, no mayores de uno.

0 1 0 para i= 1, 2,., m

4.- La frecuencia absoluta acumulada correspondiente al valor coincide con el nmero


total conjunto de observaciones.

= =
=1

23
Apuntes de clase Estadstica General

5.- La frecuencia relativa acumulativa correspondiente al valor coincide con la unidad


= = 1
=1

6.- Las frecuencias absolutas acumuladas cumplen las siguientes desigualdades

1 = 1 2 . Para i = 1, 2,, m

7.- Las frecuencias relativas acumuladas cumplen las siguientes desigualdades

1 = 1 2 . Para i = 1, 2,, m

Ejemplo Los datos que a continuacin se dan, corresponde al rendimiento de 50


genotipos de papa del Banco de Germoplasma del Centro Internacional de la
Papa (CIP). Equivalente a toneladas por hectrea.

1 = 3,9 2 = 4,7 3 = 4,3 4 = 3,7 5 = 4,8 6 = 4,5 7 = 4,3


8 =5,3 9 = 5,3 10 = 5,0 11 = 6,0 12 = 4,3 13 = 4,5 14 = 4,8
15 = 5,3 16 = 5,6 17 = 3,3 18 = 5,1 19 = 4,4 20 = 4,1 21 = 5,1
22 = 4,7 23 = 4,1 24 = 4,9 25 = 4,0 26 = 4,7 27 = 3,3 28 = 3,9
29 = 4,4 30 = 4,2 31 = 4,5 32 = 5,3 33 = 5,6 34 = 3,9 35 = 6,1
36 = 4,9 37 = 4,5 38 = 4,5 39 = 4,7 40 = 4,2 41 = 5,0 42 = 4,3
43 = 4,2 44 = 4,7 45 =5,8 46 = 6,1 47 = 4,8 48 = 4,7 49 = 5,8
50 = 5,4

1.- Ordenamos los datos de menor a mayor

3,3 3,3 3,7 3,9 3,9 3,9 4,0 4,1 4,1 4,2
4,2 4,2 4,3 4,3 4,3 4,3 4,4 4,4 4,5 4,5
4,5 4,5 4,5 4,7 4,7 4,7 4,7 4,7 4,7 4,8
4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1 5,3 5,3
5,3 5,3 5,4 5,6 5,6 5,8 5,8 6,0 6,1 6,1

El rango ser:
R = 6,1 3,3= 2,8
El nmero de clases o intervalos ser:
4
K = m = 2,550 = 6,64 7
La amplitud del intervalo ser:
2,8
C= = 0,42 = 0,4
6,64
A continuacin calculamos:

24
Apuntes de clase Estadstica General

Lmites de clase:
El nmero menor se convierte en el lmite inferior de la primera clase. Se le suma el
intervalo de clase y se convierte en el lmite superior de la primera clase. As
sucesivamente

Marca de clase ( )

Es la semi suma de los lmites de clase. Es decir lmite inferior ms lmite superior entre
dos.

Frecuencia absoluta ( )

Es el nmero de observaciones o de datos comprendidos entre los lmites de clase

Frecuencia relativa ( )

se denomina frecuencia relativa del valor al cociente de la frecuencia absoluta de y el


nmero total de observaciones. Se denota por


= =

As sucesivamente
1 3 2 6
1 = = = 0,06 2 = = = 0,12 3 14 4 11
50 50 3 = = = 0,28 4 = = = 0,22
50 50
5 8 6 3 7 5
5 = = = 0,16 6 = = = 0,06 7 = = = 0,10
50 50 50

Interpretacin

: 0,06 se interpreta como la proporcin de genotipos cuyo rendimiento es igual a mayor


a 3, 3, pero igual o menor a 3,7 toneladas por hectrea
: 0,12 se interpreta como la proporcin de genotipos cuyo rendimiento es mayor a 3,7
pero igual o menor a 4,1 toneladas por hectrea.
Y as sucesivamente

Frecuencia absoluta acumulada ( )

Se llama frecuencia absoluta acumulada correspondiente al valor al nmero de


observaciones menores o iguales a se denota por "

= 1 + 2 + 3 + +

Para nuestro ejemplo ser:

1 = 1=1 = 1 = 3

25
Apuntes de clase Estadstica General

2 = = 1 + 2 = 3 + 6 = 9
=1
3

3 = = 1 + 2 + 3 = 3 + 6 + 14 = 23
=1
4

4 = = 1 + 2 + 3 + 4 = 3 + 6 + 14 + 11 = 34
=1
5

5 = = 1 + 2 + 3 + 4 + 5 = 3 + 6 + 14 + 11 + 8 = 42
=1
Y as sucesivamente.

Interpretacin.-

2 = 9 Significa que hay 9 genotipos de papa cuyo rendimiento es mayor a 3,7 pero igual o
menor a 4,1 toneladas por hectrea.

Frecuencia relativa acumulada ( )

Se llama frecuencia relativa acumulada del valor a la frecuencia relativa total de las
observaciones menores o iguales a . Se denota como

1 +2 +3 +.+
= 1 + 2 + . + =

=
=1

Para nuestro ejemplo


1

1 = = 1 = 0,06
=1
2

2 = = 1 + 2 = 0,06 + 0,12 = 0,18


=1
3

3 = = 1 + 2 + 3 = 0,06 + 0,12 + 0,28 = 0,46


=1
4

4 = = 1 + 2 + 3 + 4 = 0,06 + 0,12 + 0,28 + 0,22 = 0,68


=1
5

5 = = 1 + 2 + 3 + 4 + 5 = 0,06 + 0,12 + 0,28 + 0,22 + 0,16 = 0.84


=1
As sucesivamente

Interpretacin:

26
Apuntes de clase Estadstica General

= 0,18 es la proporcin de genotipos de papa cuyo rendimiento es igual o mayor a 3,3


pero igual o menor a 4,1 toneladas por hectrea.
= 0,46 es la proporcin de genotipos de papa cuyo rendimiento es igual o mayor a 3,3
pero igual o menor a 4,5 toneladas por hectrea.

As sucesivamente

La tabla de distribucin de frecuencias ser:


3,3 3,7 3,5 3 0,06 3 0,06
3,7 4,1 3,9 6 0,12 9 0,18
4,1 4,5 4,3 14 0,28 23 0,46
4,5 4,9 4,7 11 0,22 34 0,68
4,9 5,3 5,1 8 0,16 42 0,84
5,3 5,7 5,5 3 0,06 45 0,90
5,7 6,1 5,9 5 0,10 50 1

REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS

HISTOGRAMA DE FRECUENCIA

Grafica en la que las clases se sealan en el eje horizontal y las frecuencias de clase en el
eje vertical. Las frecuencias de clase se representan por medio de las alturas de barras,
estas se dibujan de manera adyacente.

Un histograma que utiliza las frecuencias relativas de cada una de las clases, en lugar de
usar la frecuencia absoluta se conoce como histograma de frecuencias relativas. Este
histograma tiene la misma forma que un histograma de frecuencias absolutas construido a
partir del mismo conjunto de datos

27
Apuntes de clase Estadstica General

POLIGONO DE FRECUENCIAS

Tambin muestra la forma que tiene una distribucin y es similar a un histograma. Consiste
en segmentos de recta que conectan los puntos formados por las intersecciones de los
puntos medio de clase y las frecuencias de clase

16
14
12
10
8
6
4
2
0
5.6 7 8.4 9.8 11.2 12.6 14 15.1 16.5

El polgono tambin se puede construir con las frecuencias relativas, a esta figura se le
conoce como polgono de frecuencias relativas.

Las ventajas de un histograma son:


a.- Los rectngulos muestran cada clase de la distribucin por separado
b.- El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero
total de observaciones que se encuentran en esa clase.
Las ventajas del polgono son:
a.- El polgono de frecuencias es ms sencillo que su correspondiente histograma
b.- Traza con ms claridad el perfil del patrn de los datos
c.- El polgono se vuelven cada vez ms liso y parecido a una curva conforme aumentamos
el nmero de clases y el nmero de observaciones

OJIVA O DISTRIBUCIN DE FRECUENCIA ACUMULATIVAS,

Grafica que resulta de la unin de las frecuencias acumulativas con las marcas de
clase. Nos permite ver cuntas observaciones estn por encima de ciertos valores

60
50
40
30
20
10
0
5.6 7 8.4 9.8 11.2 12.6 14 15.4

28
Apuntes de clase Estadstica General

REPRESENTACIN DE VARIABLES CUANTITATIVAS

Grfico Caracterstica
. Apropiadas para variable discretas
Barras
. Las barras aparecen separadas
. Son barras rectangulares contiguas
. Son apropiadas para variables cuantitativas continuas agrupadas en
intervalo
Histograma . La base de cada barra es proporcional a la amplitud del intervalo
. El punto medio de cada barra coincide con la marca de clase
. La altura de la barra es proporcional a su frecuencia
. Se obtiene uniendo con segmentos de recta los puntos medios de
Polgono de
las bases superiores de las barras de un histograma con su
frecuencias frecuencia.

REPRESENTACION TALLO HOJA

Es otra tcnica para construir cuadros de frecuencias para datos continuos. Consiste en
realizar primero una ordenacin de datos. La ordenacin consiste en formar el llamado
tallo con los primeros dgitos significativo de los datos. Luego, las hojas se forman con
los otros dgitos. Despus, se puede hacer una representacin grfica preliminar en la que
se pueden observar ciertos detalles que pudieron estar o no previstos.

Ejemplo

Se tiene datos sobre el precio de un artculo observado en 40 establecimientos


comerciales

5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1 5,3 6,2
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3 9,1 8,6
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6 7,0 7,7
8,3 7,5 9,8 7,5

Para elaborar una representacin tallo hoja es recomendable, primero, ordenar los datos
en forma ascendente, con lo cual se obtiene lo siguiente:

5,2 5,3 5,4 5,7 6,2 6,4 6,5 6,6 6,6 6,8
7,0 7,0 7,1 7,1 7,2 7,3 7,5 7,5 7,7 7,8
7,8 7,8 8,1 8,2 8,2 8,3 8,3 8,4 8,5 8,6
8,7 9,0 9,1 9,2 9,4 9,6 9,8 10,1 10,2 10,2

El siguiente paso consiste en formar tallos. Teniendo en cuenta que los precios varan
entre 5,2 y 10,2, los tallos se pueden formar con los dgitos de las unidades. Es decir, se
tendr:

29
Apuntes de clase Estadstica General

Tallos
5.
6.
7.
8.
9
10.

A continuacin, se forman las hojas de cada tallo colocando a su lado derecho los dgitos
menos significativos que forman cada uno de los datos.

Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2

Tambin se puede agregar segmentos lineales partiendo de la ltima hoja de cada tallo
para obtener una aproximacin al polgono de frecuencias, obtenindose lo siguiente.

Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2

OTRAS REPRESENTACIONES GRAFICAS

DIAGRAMA DE PARETO

En una representacin grfica que se utiliza usualmente para controles de calidad y que
permite tomar acciones correctivas necesarias.

Ejemplo

Con la finalidad de tomar acciones correctivas sobre la ocurrencia de defectos en la


produccin de pernos, se inspeccionaron 2 000 pernos de un lote de produccin.

En el cuadro siguiente se presenta la organizacin inicial de la informacin. Este cuadro se


form con las observaciones tomadas de los pernos de la muestra que presentaron al
menos un defecto. En total se presentaron 84 defectos para 60 pernos que presentaron al
menos un defecto.

30
Apuntes de clase Estadstica General

No. De veces
Defecto Porcentaje
Que aparecen
Cabeza rota 22 26,2
Tamao inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Longitud imperfecta 12 14,3
Dureza fuera de la especificacin 29 34,5
Otros 4 4,8
Total 84 100,0

En el siguiente cuadro, se forma considerando los defectos en orden descendiente, segn


el porcentaje de veces que se presentan

No. De veces
Defecto Porcentaje
Que aparecen
Dureza fuera de la especificacin 29 34,5
Cabeza rota 22 26,2
Longitud imperfecta 12 14,3
Tamao inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Otros 4 4,8
Total 84 100,0

Con la conformacin proporcionada en el cuadro anterior, se construye el grafico de Pareto


utilizando la cantidad de veces que se presentan los defectos y el porcentaje acumulado.

Este grafico permite determinar el orden que se debe seguir para la correccin de los
defectos. As tenemos que el primer defecto que se debe corregir es la dureza fuera de las
especificaciones; luego, las cabezas rotas; en seguida, la longitud imperfecta; y as
sucesivamente

GRAFICO PARA SERIE DEL TIEMPO

Cuando se recoge la informacin hay que distinguir datos para un corte transversal en el
tiempo y datos correspondientes a una serie del tiempo. El primero de ellos se refiere a
informacin coleccionada en un determinado momento; as por ejemplo se tiene la

31
Apuntes de clase Estadstica General

informacin recogida sobre las utilidades netas obtenidas en el ao 2000 por cincuenta
empresas. Los datos para serie del tiempo se refieren a informacin recogida para una o
ms variables a intervalos regulares de tiempo.

Estos intervalos regulares de tiempo pueden ser das, semanas, meses, bimestres,
semestres, ao, etc. As por ejemplo, se tiene la informacin sobre el producto nacional
bruto periodo 1991 2000.

Los datos en serie de tiempo para una variable determinada se pueden representar
grficamente en dos formas. La primera mediante barras, una barra para cada intervalo o
periodo de tiempo con una altura proporcional al valor que le corresponde a la variable de
inters. La segunda, mediante lneas que unen los puntos que tienen como componente el
periodo de tiempo y el valor de la variable

Ejemplo

La siguiente informacin corresponde a datos de la variable volumen de venta anual ( en


millones de soles), para el periodo 1991 2000, de una empresa

Ao 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Volumen
12 15 19 25 26 28 30 28 24 22
De ventas

DESCRIPCCION DE DATOS

MEDIDAS DE TENDENCIA CENTRAL.-

La tendencia central se refiere al punto medio de una distribucin. Se conocen como


medidas de posicin.

LA MEDIA ARITMTICA.-

Es la suma de todos los valores dividido entre el nmero de valores.

32
Apuntes de clase Estadstica General

MEDIA POBLACIONAL:

=1
=

En la cual.

representa la media poblacional, letra griega mu


N es el nmero de valores en la poblacin
representa cualquier valor en particular
es la letra griega mayscula sigma e indica la operacin suma
es la suma de X valores de la poblacin

MEDIA MUESTRAL
=1
=

En la cual:

= Media muestral
n = es el nmero de valores de la muestra.

PROPIEDADES DE LA MEDIA ARITMETICA

1.- Todo conjunto de datos de nivel de intervalo o de nivel de razn posee una media
2.- Todos los valores se encuentran incluidos en el clculo de la media
3.- La media es nica. Solo existe una media en un conjunto de datos.
4.- Si todos los valores observados X1, X2,. son iguales a b (donde b es una
constante) entonces la media de una constante es la misma constante
M(x) = M (b) = b

5.- Si a cada valor de las observaciones X1, X2,Xn se le suma (o se resta) una
constante, la media del nuevo conjunto transformado yi= xi b; es la media aritmtica
del conjunto original ms (o menos) la constante. Es decir

= M (Y)= ()

Donde Yi = Xi b, b= constante, i = 1,2,.,n

6.- Si cada valor de un conjunto X1, X2,.,Xn se multiplica por una constante
diferente de cero, la media aritmtica del conjunto transformado Yi = aXi, donde i= 1,
2,,n es la media aritmtica del conjunto original multiplicado por la constante. O sea:

= () = ()

7.- La suma algebraica de las desviaciones de cada valor observado X1, X2, X3,.Xn con
respecto a su media es cero. Esta propiedad significa que,
( ) = 0
Para datos agrupados esta propiedad se transforma en

33
Apuntes de clase Estadstica General

( ) = 0
=1

m = nmero de clases
= frecuencia absoluta de la clase i
Yi = punto medio del intervalo i (marca de clase)

8.- Si X1, X2,,Xn, y ,Y1,Y2,Yn son dos conjuntos de observaciones de n valores


cada uno, de dos variables X y Y, expresados en las mismas unidades, entonces la
media de ambas variables ser:

M(X Y) = M(X) M (Y)

9.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmtica se


puede utilizar para estimar la cantidad total de una poblacin. Esta propiedad indica
que:

Total = N X

MEDIA PONDERADA

La media ponderada de un conjunto de nmeros denotados por 1 , 2 , 3 , , con


ponderaciones 1 , 2 , 3 , . . , , se calcula como sigue:

( )
=

Ejemplo.- Un establecimiento vende gaseosas de tres tamaos: pequeo, mediano y
grande. El pequeo cuesta $0,50 (soles): el mediano $ 0,75; y el grande $ 1,00.
Ayer se vendieron 20 gaseosas pequeas, 50 gaseosas medianas y 30
gaseosas grandes. Cul es el precio medio ponderado por gaseosa?

MEDIANA

Valor en la posicin central de los valores despus de ordenarlos de menor a mayor o de


mayor a menor. Hay tantos valores por encima de la mediana como por debajo de ella en
la ordenacin de datos

+1
Ubicacin de la mediana
2

Si hay cinco datos, entonces la ubicacin de la mediana (n+1)/2 ser igual a (5+1)/2 igual
a 3. Al ordenar los datos de menor a mayor, se obtiene el valor del tercer elemento, que es
7, la mediana

Nmero de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15

Mediana

34
Apuntes de clase Estadstica General

En el siguiente ejemplo hay seis elementos de manera que (n+1)/2 ser igual a (6+1)/2
igual a 3,5 Despus de ordenar los datos de menor a mayor se encuentra la semi suma de
los valores 3 y 4. Luego la mediana ser 31

Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35

31
Mediana
VENTAJAS Y DESVENTAJAS DE LA MEDIANA
1.- La mediana es nica; esto es, a semejanza de la media solo existe una mediana para
un conjunto de datos.
2.- No es difcil determinar la mediana para datos no agrupados. Tan solo se necesita
ordenarlos de menor a mayor o viceversa, y encontrar el valor del elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeos y por tanto, es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
4.- Puede calcularse para datos de nivel de razn, de intervalo y ordinal

MODA
Valor de la observacin que aparece con mayor frecuencia

La moda puede determinarse para todos los niveles de datos: nominales, ordinales, de
intervalo y de razn. La moda tambin tiene la ventaja de no verse afectada por valores
muy altos o muy bajos

Hay muchos conjuntos de datos que no tienen moda, porque ningn valor figura ms de
una vez. Pero tambin existen conjunto de datos que tiene ms de una moda.

MEDIA GEOMETRICA (M.G.)

LA MEDIA GEOMTRICA de un conjunto de n nmeros positivos se define como: la raz


n-sima del producto de n nmeros.
Si uno de los nmeros es cero o negativo, no se puede calcular la media geomtrica

M.G. g (1 )(2 )(3 ) . . ( )

Hay dos usos principales de la media geomtrica

1.- Para promediar porcentajes, ndices y cifras relativas


2.- Para determinar el incremento porcentual promedio.
Ejemplo:

Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6% respectivamente Cul es la media geomtrica de las
ganancias?

M.G. (1 )(2 )(3 ) . . ( )
4
M.G. (3)(2)(4)(6) 3,46%

35
Apuntes de clase Estadstica General

Ejemplo
Supongamos que un capital de 50 000 sea colocado a una tasa anual del 24% el primero
de Enero del 2012. Si se capitaliza los das primero de Enero de cada ao, calcule el
promedio del dinero invertido entre el 31 de Diciembre del 2012 y 31 de Diciembre del
2015

AOS log
2012 50 000 4,698970
2013 62 000 4,792392
2014 76 880 4,885813
2015 93 331,2 4,979235
19,356410


M.G. (1 )(2 )(3 ) . . ( )


log M.G. =

19,356410
log M.G. = = 4,8391025
4
M.G. = antilog 4,8391025
M.G. = 69,040.27 (Promedio invertido durante el perodo)

La media geomtrica de trminos positivos es siempre menor o igual que la media


aritmtica. Es igual a la media aritmtica slo en el caso en que todos los trminos sean
iguales entre s

La media geomtrica para datos agrupados en clases, es la raz n-sima del producto
de las marcas de clase elevadas a sus respectivas frecuencias


. . = g = 1 1 2 2 .

Desventajas de la media geomtrica

1.- Su clculo es muy engorroso


2.- Est limitado para valores positivos para que pueda ser interpretado
3.- Si algn valor de la variable es cero, la media geomtrica ser igual a cero
4.- Si aparece algn valor negativo, el estadgrafo toma un valor imaginario

MEDIA ARMONICA (h )

LA MEDIA ARMNICA (h = ) de trminos no nulos 1 , 2 , es el reciproco


de la media aritmtica de los recprocos de esos trminos.

Es decir

36
Apuntes de clase Estadstica General


= =

= /
=

Ejemplo

La media armnica de los nmeros 3, 4, 6, y 8

4
= = 1 1 1 1 = 4,57143
+ + +
3 4 6 8

La media armnica para datos agrupados ser:


= =

=1

Siempre que se trate del mismo conjunto de datos

VENTAJAS Y DESVENTAJAS

1.- La media armnica se basa en todas las observaciones por lo que est afectado por los
valores extremos. Pero da a los valores grandes un peso menor que el que da la media
geomtrica; mientras que a los valores pequeos, le da un peso mayor que el que da la
media aritmtica y la media geomtrica.
2.- La media armnica no est defina, si alguno de los valores es cero
.
Aplicaciones de la media armnica
1.- Cuando se tiene trminos para cuyos recprocos se quiere calcular su media.
2.- Cuando se presenta una relacin inversa entre las variables implcitas, como por
ejemplo:

- Entre la productividad y el tiempo.

e=p x t
Donde: e = espacio p = productividad t = tiempo

- La velocidad y el tiempo
e=v x t
Donde: e= espacio v = velocidad t= tiempo

Ejemplos

1.- Suponga que ha gastado usted, un sol por 3 docenas de naranjas en una tienda, otro
sol por 4 docenas de naranjas en una segunda tienda y otro sol ms por 5 docenas en
una tercera tienda. Determinar el precio promedio por una docena de naranjas.

Solucin:

37
Apuntes de clase Estadstica General

Obtendremos primero el precio pagado por docena de naranja.


En la primera usted ha gastado 1 sol por 3 docenas de naranjas o sea 1/3 de sol por
docena.
En la segunda gast 1 sol por 4 docenas, es decir 1/4 de sol por docena.
En la tercera tienda gast un sol por 5 docenas, o sea 1/5 de sol por docena.
En otras palabras queremos calcular la media de los recprocos de los nmeros 3, 4, 5


= = 1

=1
3
= = 1 1 1 = 0,25
+ +
1/3 1/4 1/5

2.- Cinco secretarias tienen las siguientes velocidades 40, 36, 28, 40, y 35 palabras por
minuto. Si cada una de ellas escribe un mismo texto, calcule la velocidad media

5
= = 1 = 1 1 1 1 1 = 35,196 palabras/minuto

=1 + + + +
40 36 28 40 35

MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS

MEDIA ARITMERICA PARA DATOS AGRUPADOS (datos tabulados)

Para datos discretos

Considerando esta simbologa, las expresiones de clculo son las siguientes:

Media o promedio poblacional



=

Media o promedio muestral
=
=

Para datos continuos
Si los datos han sido clasificados en m clases en una tabla de frecuencia con marca de
clase Yi y frecuencia absoluta = 1,2,.., m, la media aritmtica de estos datos est
definida por:

Media o promedio poblacional:



=

Media o promedio muestral:



=

38
Apuntes de clase Estadstica General


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

MEDIANA PARA DATOS AGRUPADOS





Me = + [ ]

Donde:

cj = amplitud de la clase mediana


Fi = Frecuencia absoluta acumulada de la clase medina
n = nmero de observaciones

1 = Lmite inferior de la clase mediana


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1




Me = + [ ]

100
2
45
= 9,9 +1,29[ ] = 10,158
70 45
MODA PARA DATOS AGRUPADOS


Mo= + [( ]
)+ ( +)
Donde:

39
Apuntes de clase Estadstica General

= lmite inferior de la clase modal


fi-1 = frecuencia absoluta de la clase pre modal
fi = frecuencia absoluta de la clase modal
fi+1 = frecuencia absoluta de la clase pos modal
cj = amplitud de la clase modal


6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1

1

Mo = 1 + [( ]
1 )+ ( +1)

2513
Mo = 9,9 + 1,2 [ ] 10,5
(2513)+ (25 13)

RELACIN ENTRE MEDIA, MEDIANA Y MODA EN DISTRIBUCIONES


SIMTRICAS Y ASIMTRICAS

1.- En una distribucin de frecuencias simtrica cuya representacin grfica es


acampanada y adems unimodal; coinciden exactamente en el mismo valor, media,
mediana y moda.

= =
2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las
tres medidas toman valores diferentes, y la mediana queda comprendida generalmente
entre la moda y la media aritmtica.

En una distribucin asimtrica positiva (o con sesgo positivo) la media aritmtica es el


mayor de los tres promedios. Esto se debe a que en la media influye ms que en la
mediana y la moda, los valores sumamente altos.

En una distribucin asimtrica negativa, la media es el menor de los tres promedios. La


media se ve afectada por los valores extremadamente bajos

Si se conocen dos promedios de una distribucin de frecuencias con sesgo o asimetra


moderada, el tercer promedio puede aproximarse, de acuerdo con las siguientes frmulas

Moda Media 3(Media Mediana)

40
Apuntes de clase Estadstica General

3 ()
Media =
2

2 ()+
Mediana =
3

Toma Es
Qu tan en afectada
Medida comn Existencia cuenta por los Ventajas/
es? cada valores Desventajas
Valor? extremos?
Promedio Siempre Es el de mayor uso,
Media ms existe Si Si sensible a los valores
conocido extremos
Mediana Valor en el Siempre No No Apropiada cuando
medio existe hay valores extremos
Valor ms Podra no Apropiada para
Moda frecuente existir No No variables en escala
nominal

USOS DE LA MEDIA ARITMETICA, MEDIANA Y MODA

a.- La media aritmtica se utiliza

1. Cuando no existen valores extremos que afecten a la media


2. Cuando se tengan que calcular otros valores estadsticos como la varianza

b.- La mediana se utiliza

1. Cuando se desea conocer el valor de posicin central


2. Cuando se tienen valores extremos que afecten a la media

c.- La moda se utiliza

1. Cuando se desea conocer el valor de la observacin ms frecuente


2. Cuando se analizan variables cualitativas
3. Cuando se desea tener una estimacin rpida y aproximada de tendencia central

41
Apuntes de clase Estadstica General

MEDIDAS DE POSICIN NO CENTRALES O CUANTILES

Son medidas de posicin que no necesariamente reflejan la tendencia central de la


distribucin de frecuencias: A este tipo de medidas se les llama cuantiles, que son los
valores de la variable que dividen a la distribucin en intervalos que contienen el mismo
nmero de observaciones.

Los cuantiles ms usados son los cuartiles, , los deciles, Dj y los percentiles, .

PERCENTILES

El p simo percentil es un valor tal que, a lo sumo, p por ciento de las observaciones
son menores o iguales que este valor y, a lo sumo, (100 p) por ciento de las
observaciones son mayores o iguales que este valor.

CALCULO DEL I SIMO PERCENTIL PARA DATOS NO AGRUPADOS

Se siguen los siguientes pasos:

1.- Ordenar los datos de forma ascendente.


2.- Calcule un ndice k:

K=[ ]n

Dnde i es el percentil de inters y n es la cantidad de observaciones

3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la
posicin del i simo percentil.
Si k es entero, el i simo percentil es el promedio de los valores de los datos
ubicados en los lugares k y k + 1.

Ejemplo

Dada una muestra cuyos valores son:

53 55 70 58 64 57 72 53 69 57 68 53

Calcule los percentiles 30 y 75

Solucin

1.- Se ordenan los datos de menor a mayor, esto es:


53 53 53 55 57 57 58 64 68 69 70 72
2.- Clculo del ndice k

Para percentil 30
30
K= [ ]n = [ ] 12 = 3.6
100 100

3.- Como k no es entero, redondeamos. El lugar del percentil 30 es el siguiente entero


mayor de 3.6, es decir, el lugar 4. En este caso el percentil 30 es el valor del dato que

42
Apuntes de clase Estadstica General

ocupa la posicin cuarta, o sea 55. Esto significa que el 30% de los datos es menor que
55 y el 70% mayor o igual a 55.

Para percentil 75
75
k= [ ]n = [100] 12 = 9
100

Como k es entero se establece que el percentil 75 es el promedio de los valores de los


68 +69
datos noveno y dcimo; es por lo tanto. [ ] = 68.5 Esto significa que el 75% de los
2
datos, a lo sumo es menor que 68.5 y a lo sumo el 25% mayor o igual que 68.5.

Clculo del i simo percentil para datos agrupados

Se siguen los siguientes pasos:


1.- Se calcula , donde i = 1, 2,3,..,99
100

2.- Se identifica la clase que contiene el por la frecuencia acumulada


3.- Se emplea la frmula

100
1
= 1 + [ ]

Donde:

1 = Lmite inferior de la clase que contiene a
n = Tamao de la muestra o poblacin.
= Tamao del intervalo de clase
1 = Frecuencia acumulada de la clase anterior a la clase que contiene a
f = frecuencia simple de la clase que contiene a
Ejemplo

La tabla siguiente muestra la distribucin de las edades de 120 personas


30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36
70 80 43 79
80 90 32 111
90 - 100 9 120

Determine la edad mnima del 25% de las personas de ms edad

Solucin

43
Apuntes de clase Estadstica General

La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido
tenemos que encontrar las frecuencias acumuladas

75 120
1.- Se calcula = = 90
100 100
2.- La clase que contiene al 75 es 80 90
3.- Utilizando la frmula

1
100
= 1 + [ ]

9079
75 = 80 + 10 [ ] = 83.44
32

CUARTILES.-
Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, 1 deja el 25% de
los datos ordenados a su izquierda, y el otro 75% a su derecha. El segundo cuartil, 2 , deja
el 50% de los datos a su izquierda y el otro 50% a su derecha, este valor coincide con la
mediana, mientras que el tercer cuartil, 3 deja el 75% de los datos ordenados a su
izquierda y el otro 25% a su derecha.

CALCULO DE LOS CUARTILES PARA DATOS ORDENADOS.


Los cuartiles son solo percentiles especficos; por lo tanto, los pasos para calcular los
percentiles se pueden aplicar en forma directa para calcular los cuartiles. Esto es:
1 = Primer cuartil o percentil 25
2 = Segundo cuartil o percentil 50
3 = Tercer cuartil o percentil 75

Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12
Ingenieros Agrnomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880
Determine el 1 3

Solucin

Cuartil uno,

1.- Se ordenan los datos en forma ascendente

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2.- Calcular el 1 es igual que calcular el 25 , en ese sentido se calcula el ndice K

25
k= [ ]n = [ ] 12 = 3
100 100

44
Apuntes de clase Estadstica General

Como K es entero se establece que el percentil 25 es el promedio de los valores de los


2850 +2880
datos tercero y cuarto; es por lo tanto [ ] = 2865. Esto significa que el 25%
2
de los Ingenieros Agrnomos tienen un salario mensual superior a 2865.

Cuartil tres, :

Implica calcular el percentil 75, entonces:

1.- Calcular el ndice K

75
k= [ ]n = [ ] 12 = 9
100 100

Como K es entero se establece que el percentil 75 es el promedio de los valores de los


2950 +3050
datos noveno y dcimo; es por lo tanto, [ ] = 3000. Esto significa que el 75%
2
de los Ingenieros Agrnomos tienen un salario menor a 3000 y el otro 25% un salario
mensual superior a 30000

1 2 3

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2865 2905 3000

CLCULO DE CUARTILES PARA DATOS NO AGRUPADOS





= + [ ]




= + [ ]

3
1
4
= + [ ]

Donde:

=Limitre inferior de la clase que contiene al cuartil i


= Nmero de datos
1 = Frecuencia acumulada de la clase anterior de la clase que contiene al cuartil i
f = frecuencia de clase simple de la clase que contiene al cuartil
= tamao del intervalo de clase

Ejemplo

Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la
aplicacin de un test que arroja los siguientes puntajes

45
Apuntes de clase Estadstica General


0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8

Determine:

a.- La puntuacin que es excedida por el 75% de los trabajadores


b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores.
Solucin

a.- En este caso Se debe calcular el primer cuartil (1 )


1
= + [ 4 ]

Debemos encontrar las frecuencias acumuladas



1
0 - 20 94 94
20 - 40 140 234
40 - 60 160 394
60 - 80 98 492
80 - 100 8 500

Luego

500
El lugar del cuartil 1 es la posicin = = 125. Es decir, que el cuartil est ubicado
4 4
en la clase 20 40. Por lo tanto:

1
4
1 = 1
+ [ ]


1 = 20 + 20 [ ] = 24.43

Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43

b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores,
corresponde al valor del tercer cuartil.

3 3 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est
4 4
ubicado en la clase 40 - 60. Por lo tanto

46
Apuntes de clase Estadstica General

3
1
4
3 = 1
+ [ ]

375 234
3 = 40+ 20 [ ] = 57.625
160

Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625

MEDIDA DE DISPERSIN Y ASIMETRA

Son medidas que se emplean para determinar el grado de variabilidad o de dispersin de


los datos con respecto a un promedio.

Existen varias razones por la cual se debe estudiar la dispersin en un conjunto de datos

1.- Al aplicar una medida de dispersin es posible evaluar la confiabilidad del promedio que
se est utilizando. Una dispersin pequea indica que los datos se encuentran
acumulados cercanamente, por ejemplo, alrededor de la media aritmtica. Por tanto, la
media se considera bastante representativa de los datos. Esto es: la media es un
promedio confiable. Por el contrario, una dispersin grande indica que la media no es
muy confiable, es decir no es muy representativa de los datos.

2.- Una medida de dispersin permite apreciar cun dispersas estn dos o ms
distribuciones. Por ejemplo veamos la siguiente figura

MEDIDA DE DISPERSIN.DATOS NO AGRUPADOS

A continuacin se muestran dos series de datos, ambos tienen la misma media aritmtica
pero se observa que tienen diferente dispersin alrededor de ella.
Se tiene dos series de datos:
a.- 48, 49, 49, 50, 50, 50, 51, 51,52
b.- 40, 47,47, 50, 50, 50, 53, 53,60

47
Apuntes de clase Estadstica General

La media aritmtica de ambas series es la misma. Un anlisis de las cifras individuales


revela sin embargo un gran contraste. En la serie B hay una gran variacin entre los
valores, siendo 40 el valor menor y 60 el valor mayor. En la serie A el nmero menor es 48
y el mayor es 52.

En resumen podremos decir que en la serie B hay valores muy altos y muy bajos., mientras
que en la serie A los valores estn ms concentrados alrededor del promedio.

RANGO, AMPLITUD TOTAL.-

Se trata de la diferencia entre los valores mayor (o ms alto) y menor ms bajo) de un


conjunto de datos

AMPLITUD TOTAL Valor ms alto Valor ms bajo

PROPIEDADES DEL RANGO:

1.- Es fcil de calcular y sus unidades son las mismas que las de la variable
2.- No utiliza todas las observaciones (slo dos de ellas)
3.- Se puede ver muy afectada por alguna observacin extrema
4.- El rango aumenta con el nmero de observaciones o bien se queda igual. En cualquier
caso nunca disminuye.

DESVIACIN MEDIA:

Denominada tambin desviacin promedio de los valores absolutos de las desviaciones


con respecto a la media aritmtica

| |
D.M.

Donde:

= Es el valor de cada observacin


= Es la media aritmtica de los valores
n = Es el nmero de observaciones en la muestra

La desviacin media tiene dos ventajas. Utiliza en su clculo el valor de cada uno de los
elementos de un conjunto de datos, y es fcil de comprender; y es el promedio en que los
valores se desvan con respecto de la media.

Ejemplo

Los pesos de una muestra de cajas listas para embarcarse a Italia son (en kilogramos):
103, 97, 101, 106 y 103

1.- Cul es la desviacin media?


2.- Cmo se interpreta?


= 103+97+101+106+103
= = = 102 Kg
5

48
Apuntes de clase Estadstica General

|103102|+|97102|+|101102|+|106102|+|103102|
D.M. =
5

D.M. 2,4 Kg

Interpretacin.- En promedio, los pesos de las cajas se desvan 2,4 Kg respecto de la


media aritmtica que es 102

VARIANCIA Y DESVIACION ESTANDAR

VARIANCIA.-

Media aritmtica de las desviaciones cuadrticas con respecto a la media.

( )2
Variancia de poblacin: 2 =

2
2 ( ) 2
( ) 2 2
2
Variancia de la muestra: = = =
1 1 1

La varianza para datos agrupados ser calculada empleando la siguiente frmula:

2
( ) 2
2 2
2
= =
1 1

PROPIEDADES DE LA VARIANZA

1.- La varianza de un conjunto de observaciones X1, X2,..Xn siempre es un


nmero no negativo
V(x) 0

2.- La varianza de una constante es cero. Esto significa que si X1 = X2 =..= Xn= b
entonces:
V (b) = 0

3.- Si a cada observacin X1, X2,,Xn se le adiciona o se le resta una constante b 0,


la varianza del nuevo conjunto de valores Y1,Y2,,Yn, donde Yi= Xi b, i =
1,2,.,n, coincide con la varianza del conjunto original. Es decir
V (y) = V (x b) = V(x)

4.- Si a cada valor de un conjunto X1,X2,Xn, se multiplica por una constante a, la


varianza del nuevo conjunto de valores Y1,Y2,Yn, donde Yi = aXi, i= 1,2,,n es
igual a la varianza del conjunto original multiplicada por el cuadrado de la constante. Es
decir:
V (y) = a2 V(X)

49
Apuntes de clase Estadstica General

VARIANZA CALCULADA A PARTIR DE SUB MUESTRAS

Si y son las medias aritmticas de dos submuestras de tamao n1 y n2


respectivamente y sus varianzas correspondientes. Entonces la varianza de la
muestra de tamao n = n1 + n2 est dada por

DESVIACION ESTANDAR

Raz cuadrada de la variancia

Desviacin estndar poblacional = 2

Desviacin estndar muestral S = 2

COEFICIENTE DE VARIACIN (CV)

En algunas ocasiones se requiere un estadstico descriptivo que indique cun grande es la


desviacin estndar en relacin con la media. Es decir nos indica la cantidad de veces que
la desviacin estndar contiene a la media aritmtica.

Esta medida es el coeficiente de variacin (coeficiente de variabilidad) y se


representa como porcentaje.

DESVIACIN ESTANDAR
CV = 100
MEDIA ARITMETICA


POBLACION CV = [ 100]


MUESTRA CV = [ 100]

CARACTERSTICAS DEL COEFICIENTE DE VARIABILIDAD

1.- No tiene unidad de medida


2.- No aplicable cuando la distribucin tiene media cero
3.- Se afecta su valor cuando se suma una constante K a cada observacin de un conjunto
de datos.
4.-No cambia de valor cuando se multiplica por una constante K a cada una de las
observaciones.
Calificacin de una distribucin de datos, segn el grado de dispersin:

50
Apuntes de clase Estadstica General

Coeficiente de Grados de variabilidad


variabilidad (%)
0 Datos Completamente
0 < < 10 homogneos
Datos muy homogneos
10 < < 15 Datos regularmente homogneos
15 < < 20 Datos regularmente variables
20 < < 25 Datos variables
CV> 25 Datos muy variable

TEOREMA DE CHEBYSHEV.-

Una desviacin estndar pequea para un conjunto de valores indica que stos se
encuentran localizados cerca de la media. Por el contrario una desviacin estndar grande
revela que las observaciones estn muy dispersas con respecto a la media.

El matemtico ruso P.L. Chebyshev, desarroll un teorema que permite determinar la


proporcin mnima de los valores que se encuentra dentro de un nmero especfico de
desviaciones estndares con respecto a la media.

REGLA EMPIRICA.- Para una distribucin de frecuencias simtrica en forma de campana,


aproximadamente el 68% de las observaciones se encontrar a ms o menos una
desviacin estndar de la media; aproximadamente el 95% de las observaciones se
encontrarn a ms o menos dos desviaciones estndar desde la media; y prcticamente
todas las observaciones (99,7%) se encontrarn a ms o menos tres desviaciones desde
la media.

51
Apuntes de clase Estadstica General

MEDIDAS DE FORMA

COEFICIENTE DE ASIMETRIA.

Las medidas de asimetra tienen como facilidad elaborar un indicador que permita
establecer el grado de simetra o asimetra, que presenta una distribucin, sin necesidad
de llevar a cabo su representacin grfica.

El coeficiente de asimetra puede calcularse mediante el coeficiente de asimetra de


Pearson.


=

Tambin existen otras frmulas alternativas para el clculo del coeficiente de asimetra.

3( )
=

Asimismo, el coeficiente de asimetra nos describe la forma de un conjunto de datos, es
decir, la manera como se distribuyen, comparando la media y la mediana. Si ambas
medidas son iguales, por lo general, se considera que los datos son simtricos (o con
sesgo cero, es decir, el coeficiente de asimetra es cero). Por lo contrario, los datos o su
distribucin es asimtrica o sesgada, es decir, si la media excede a la mediana, los datos
se describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetra
es positivo). Si la mediana excede a la media, los datos suelen llamarse sesgados a la
izquierda, o con sesgo negativo (el coeficiente de asimetra es negativo)

El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales: el sesgo negativo ocurre cuando la media se reduce debido a algunos valores
muy pequeos. Los datos son simtricos cuando en realidad no hay valores extremos en
ninguna direccin, de tal manera que los valores grandes y pequeos se equilibran.

Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
Sesgo negativo o a la izquierda Media < Mediana < Moda

COEFICIENTE DE APUNTAMIENTO O CURTOSIS

Analiza el grado de concentracin que presentan los valores alrededor de la zona central
de la distribucin, es decir, estudia la distribucin de frecuencias en la zona central. La
mayor o menor concentracin de frecuencias alrededor de la media y en la zona central de
la distribucin, dar lugar a una distribucin ms o menos apuntada.

As es por lo que a la curtosis tambin se le llama apuntamiento.

Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin
leptocrtica (es ms apuntada o puntiaguda que la distribucin normal); en caso contrario,

52
Apuntes de clase Estadstica General

si la curtosis es negativa, se dice que los datos tienen una distribucin platicrtica (es
menos apuntada o puntiaguda que la distribucin normal). Si la curtosis es cero, entonces
los datos se distribuyen siguiendo una distribucin normal, y se dice que en este caso la
distribucin mesocrtica.

Para medir la curtosis se puede emplear las siguientes frmulas:

4
( ) 1 3 1
k= 3 k= [ ]
4 2 90 .10

Donde

3 = Cuartil tres 90 = Percentil noventa

1 = Cuartil uno 10 = Percentil diez

CARACTERISTICAS DEL COEFICIENTE DE CURTOSIS

1.- No tiene unidades de medida


2.- Se aplica a distribuciones unimodales que sean simtricas o ligeramente asimtricas.
3.- No le afecta las operaciones de suma y multiplicacin por una constante c aplicada a
cada observacin.

( )2 ( )4
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media = 4
Varianza 2 = 8

Reemplazamos y calculamos el coeficiente de curtosis

4
( ) 288
k= 3 = - 3 = -1.875
4 (4)(64)

Al tener el coeficiente de curtosis un valor negativo, la distribucin ser platicurtica.

53
Apuntes de clase Estadstica General

CARACTERISTICAS DEL COEFICIENTE DE ASIMETRIA DE PEARSON

1.- No tiene unidad de medida


2.- Se aplica a distribuciones unimodales
3.- Su valor debe encontrarse en el intervalo de -3 a 3

Ejemplo

Una muestra de digitadoras de texto revel que su rapidez media de tecleo es de 87


palabras por minuto, con una media de 73. La desviacin estndar es de 16.9 palabras por
minuto. Cul es el coeficiente de asimetra? Interprete su respuesta.

Solucin

3() 3(8773)
Reemplazando = = = 2.49
16.9

Existe considerable asimetra con sesgo positivo en la distribucin de la rapidez de tecleo.


Algunas operadoras muy rpidas hacen que la media sea mayor que la mediana o la
moda.

PROBABILIDAD

QUE ES UNA PROBABILIDAD?

Probabilidad es una medida de la posibilidad de que ocurra un evento (o suceso) en el


futuro, solo puede asumir valores entre 0 y 1, inclusive

EXPERIMENTO:

Observacin de alguna actividad o la accin de efectuar una medicin. Un Experimento


tiene dos o ms resultados posibles y es incierto cul habr de ocurrir.

EVENTO:

Conjunto de uno o ms resultados de un experimento

RESULTADO:

Un acontecimiento particular de un experimento

Ejemplos

1.- Experimento: Observar si su auto arranca o no al activar el interruptor principal (llave


de encendido)
Resultado posible: Si, arranca
No, arranca
Evento posible: Arranca

2.- Experimento: Tirar un dado


Resultado posible: Caer un 1

54
Apuntes de clase Estadstica General

Caer un 2
Caer un 3
Caer un 4
Caer un 5
Caer un 6

Evento posible: Caer un nmero par


Caer un nmero mayor de 4
Caer un nmero 3 o menor

Una probabilidad se expresa como un nmero decimal o como una fraccin.

Cuanto ms se acerca una probabilidad a 0, es ms improbable que suceda el evento al


que se asocia. Cuanto ms se acerca la probabilidad a 1, tanto ms seguros estamos que
suceder.

ENFOQUES DE LA PROBABILIDAD:

Se analizarn dos enfoques de la teora probabilstica que son dos puntos de vista: objetivo
y subjetivo.

La probabilidad Objetiva puede subdividirse en:

1) probabilidad clsico o a priori


2) y 2) el concepto de frecuencia relativa o probabilidad a posteriori

PROBABILIDAD CLASICA:

Se basa en la consideracin de que los resultados de un experimento son igualmente


posibles.


Probabilidad de un evento

Ejemplo:

Se lanza un dado Cul ser la probabilidad de que el resultado sea un dos?


()
P (A) =
()

1
Probabilidad de un dos: 6

MUTUAMENTE EXCLUYENTES

La ocurrencia de un evento significa que ningn otro puede ocurrir al mismo tiempo

COLECTIVAMENTE EXHAUSTIVO,

Por lo menos uno de los sucesos ocurre cuando se realiza un experimento

PROBABILIDAD EMPIRICA O FRECUENCIA RELATIVA.

55
Apuntes de clase Estadstica General


Probabilidad de que suceda un evento

PROBABILIDAD SUBJETIVA

Posibilidad (probabilidad) de que suceda un evento, asignado por una persona con base
en cualquier informacin de que disponga

Ejemplo.-

1.- Estimar la probabilidad de que el equipo del JUAN AURICH, salga campen en el
campeonato de futbol profesional.
2.- Estimar la posibilidad de que usted tenga una calificacin de 20 en este curso.

REGLAS BASICAS DE PROBABILIDAD

REGLA DE LA ADICION

REGLA ESPECIAL DE ADICIN

Si dos eventos A y B son mutuamente excluyentes, la regla indica que la probabilidad de


que ocurra uno u otro de los eventos es igual a la suma de probabilidades.

P (A o B) = P(A B) = P (A) + P (B)

Ejemplo

En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero
impar" son mutuamente excluyentes. Si se observ un nmero par, no podra caer un
nmero impar al mismo tiempo.

Para tres eventos mutuamente excluyentes denotados por A, B, C, la regla ser:

P(A o B o C) = P ( ) = P(A) + P (B) + P(C)

REGLA GENERAL DE ADICIN

Es la probabilidad que mide la posibilidad de que dos o ms eventos ocurran en forma


simultnea:

P (A o B) = P(A) +P (B) - P(A y B) o equivalentemente

P (A U B) = P(A) + P (B) - P(A B)

A este tipo de probabilidad tambin se le conoce como probabilidad conjunta

REGLA DEL COMPLEMENTO

Sea A un evento cualquiera, entonces se tiene que:

P (A) + P (A') = 1, de donde P (A') = 1- P (A)

Ejemplo

56
Apuntes de clase Estadstica General

Se ha de entrevistar a un grupo selecto de empleados de la empresa ORION S.A., con


respecto a un plan de pensiones. Se efectuarn entrevistas detalladas a cada uno de los
empleados seleccionados en la muestra. Estos se clasificarn como sigue:

de
Clasificacin empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000

Cul es la probabilidad de que la primera persona seleccionada:


a) Sea empleada de mantenimiento o secretaria?
b) No sea de gerencia?

Solucin
Sean los siguientes eventos:
B = El empleado seleccionado al azar es de mantenimiento.
E = El empleado seleccionado al azar es secretaria.
D = El empleado seleccionado al azar es de gerencia.

a) P (B o E) = P (B)+ P (E), por ser mutuamente excluyentes.


50 68
P (B o E) =P (B E) = + = 0,059
200 2000
302
b) P (D') = 1- P (D) = 1- = 0.849
2000

REGLA DE LA MULTIPLICACION

Dos eventos A y B son independientes, cuando la ocurrencia de un evento no tiene efecto


en la probabilidad de la ocurrencia de cualquier otro
Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de
ocurrencia del otro.
Sean A y B dos eventos independientes, entonces:

P (A y B) = P(A). P (B)

P (A B) = P(A). P (B)

En el caso de tres eventos independientes, A, B y C, la regla de la multiplicacin utilizada


para determinar la probabilidad de que los tres eventos ocurran es:

P(A y B y C) = P(A).P (B).P(C)

P(A B C) = P(A).P (B).P(C)


Tambin se cumple que si A y B son independientes, entonces:

57
Apuntes de clase Estadstica General

P (A\B) = P (A)

P (B \ A) = P (B)

Ejemplo

Una moneda es laEscriba aqu la ecuacin.nzada dos veces al aire, cul es la probabilidad
de que las dos veces se obtenga cara?

Solucin:

Sea A = Obtener cara en el primer lanzamiento.

B = Obtener cara en el segundo lanzamiento.

1 1
P (A) = P (B) =
2 2

El que resulte cara en el segundo lanzamiento no depende si sali cara o no en el primero,


es por eso que A y B son eventos independientes. Por la tanto:

1 1 1
P (A B) = P(A) P (B) = =
2 2 4

Ejemplo

Una mquina automtica introduce legumbres en una bolsa de plstico. La experiencia


indica que algunos paquetes tuvieron menos peso, y algunos otros pesos de ms, pero la
mayora fueron satisfactorias. Veamos el siguiente cuadro:

Peso del
Probabilidad
paquete
Insuficiente 0.025
Satisfactorio 0.900
Excedido 0.075

a) Cul es la probabilidad de seleccionar tres paquetes de la lnea de procesamiento de


alimentos y encontrar que a los tres les falta peso?
b) Qu significa esta probabilidad?
Solucin

a) Sea F = Paquete seleccionado que le falta peso.

P (F) = 0.025
P (F F F) = P (F) P (F) P (F) = (0.025) (0.025) (0.025)
P (F F F) = 0.000015625
b) Descubrir que a los tres paquetes les falte peso es poco probable.

Observacin

58
Apuntes de clase Estadstica General

Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo
ilustraremos esta idea:
Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn
defectuosos. Se selecciona uno:

3
P (D) = Probabilidad de que sea defectuoso.
10

7
P (D') = Probabilidad de que no sea defectuoso.
10

Despus se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de


que este sea defectuoso depender si el primero lo fue, de ser as es:

2
P (2 ) = Probabilidad de que el segundo rollo extrado sea
9
defectuoso dado que el primero lo fue.
7
P (2 ) = Probabilidad de que el segundo rollo extrado no sea
9
defectuoso dado que el primero fue bueno.
Este tipo de anlisis nos ayuda a definir la probabilidad condicional.

PROBABILIDAD CONDICIONAL

Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.

P (A B) = P (A). P (B\A)

( )
P (B \ A) =
( )

( )
P (B \ A) =
( )

P (B \ A) = Probabilidad de que ocurra B dado que ya ocurri A.

Del ejemplo anterior: cul es la probabilidad de escoger un defectuoso seguido de otro


defectuoso?

P (A B) = P (A) P (B\A)
3 2
P (A B) = 10 = O.067
9
Donde:

A = Primer rollo defectuoso.


B = Segundo rollo defectuoso.

Ejemplo

De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la


probabilidad de obtener dos espadas, dos corazones y un diamante?

59
Apuntes de clase Estadstica General

Solucin

P (1 2 1 2 ) = (1 ) (2 / 1 ) (1 / 1 2 ) P (2 / 1 2 1 )
P ( / 1 2 1 2 )
13 12 13 12 13
P (1 2 1 2 ) = = 0.001014
52 51 50 49 48

Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero
es una permutacin con repeticin ya que las espadas se repiten dos veces y los
corazones tambin dos veces, entonces:
13 12 13 12 13 5!
P (1 2 1 2 ) = ( 52 ) = 0.0304
51 50 49 48 2 ! 2 !

TABLAS DE CONTINGENCIA

Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los
individuos de una poblacin se clasifican en funcin de dos variables. Tambin se le
conoce con el nombre de tabla de doble entrada.

Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han
clasificado segn el sexo y por su adiccin al tabaco.

Fumadores No Total
Hombres 120 fumadores
60 180
Mujeres 50 70 120
Total 170 130 300

En los mrgenes de la tabla se indican las sumas de filas y columnas.

Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de
probabilidad puede crearse dividiendo cada valor de las casillas por el total, que en el
ejemplo anterior sera 300.

Los resultados se muestran en la siguiente tabla:

Fumadores No Total
Hombres 120/300 fumadores
60/300 180/300
Mujeres 50/300 70/300 120/300
Total 170/300 130/300 300/300

Por lo tanto, la tabla de probabilidades quedara de la siguiente manera:

Fumadores No Total
Hombres 0.4 fumadores
0.2 0.6
Mujeres 0.1667 0.2333 0.4
Total 0.5667 0.4333 1

60
Apuntes de clase Estadstica General

Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo,
elegida una persona al azar la probabilidad de que esta sea hombre es P (H) = 0.6 y la
probabilidad de seleccionar una mujer es P (M) = O.4

A las probabilidades en las celdas de la estructura principal de la tabla se les denomina


probabilidades conjuntas y muestran la probabilidad de la interseccin de dos eventos. Por
ejemplo, la probabilidad de seleccionar una mujer y que esta sea fumadora es P (M F) =
0.167.

Tambin se puede calcular probabilidades condicionales por ejemplo, si se ha elegido un


fumador qu probabilidad hay de que sea mujer?

Nos piden que calculemos P (M \ F), esto es:

( ) 0.1667
P (M \ F) = = = 0.2942
() 0.5667

Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la
persona elegida.

DIAGRAMAS DE RBOL O ARBORIGRAMA

Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada
segmento en el rbol es una etapa del problema.

Para la elaboracin de un arborigrama se empieza trazando un punto en la izquierda, que


representa el punto central de un tronco.

Ilustremos lo anterior mediante un ejemplo:

Ejemplo

Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.

Estado Civil
Edad Civil
Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140

a) Cul es la probabilidad de encontrar un cliente menor de 30 y soltero?


b) Si un cliente tiene menos de 30 aos, cul es la probabilidad de que sea soltero?

Solucin:

Sean los siguientes eventos:

A = Cliente menor de 30 aos.


B = Cliente mayor o igual a 30 aos.
S = Cliente soltero.
C = Cliente casado.

61
Apuntes de clase Estadstica General

Trabajamos un diagrama de rbol para ubicar los datos.

Probabilidad Probabilidad
condicionada conjunta
P(S/A)

77 91 77
S p(A S) = P(A)P(S/A)
= = 0.55
91
140 91
91 A C P(A C) = P(A)P(C/A) 91 14 = 0.10
140 14 =
140 91
91
14
91
28 S P (B S) = P(B)P(S/B) 49 28 = 0.20
49
B
49 =
140 49
140
21 C P (B C) = P(B)P(C/B) 40 21 = 0.15
=
49 140 49
77
a.-P (A S) = 140 = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero

77
b.- P (S \ A) = 91 = 0.85 Probabilidad de que un cliente sea soltero dado que es menor
de 30 aos.

Tambin se puede asociar a cada diagrama de rbol una tabla de contingencia Y


viceversa. Para el ejemplo se tiene:

Estado Civil
Edad CivilIVIL
Soltero Casado Totales
A P (A S) P (A C) P (A)
B P (B S) P (B C) P (B)
Totales P(S) P(C) 1

Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:

Estado civil
Edad Civil
Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1

TEOREMA DE BAYES

P (A \ B) y P (B \ A), pueden parecer similares, en concepto existe diferencia apreciable


entre las probabilidades que representan. Por ejemplo: si A es el evento de que las ventas
en poca navidea sean altas en un rea especfica y B es el evento de que el clima sea
bueno, entonces P (A \ B) es la probabilidad de que las ventas sean altas dado que el
clima es bueno, mientras que P (B \ A) es la probabilidad de que el clima sea bueno dado
que las ventas son altas.

62
Apuntes de clase Estadstica General

Existen muchas probabilidades en Estadstica en que intervienen estas parejas de


probabilidades condicionadas, el teorema de Bayes que se ver a continuacin, permite
expresar la relacin matemtica entre las probabilidades de la forma P (A \ B) y P (B \ A),
pero para ello se necesitan algunos conceptos previos.

PROBABILIDAD A PRIORI

Probabilidad inicial con base en el nivel actual de informacin.

PROBABILIDAD A POSTERIORI

Es una probabilidad con base en informacin adicional. El teorema de Bayes proporciona


un mtodo para calcular este tipo de probabilidades.

TEOREMA DE BAYES

Si se conoce la probabilidad de B en cada uno de los componentes de un sistema


excluyente de eventos, entonces si ocurre B, se puede calcular la probabilidad (a
posteriori) de ocurrencia de cada A

( )( )

P(A\B) =
( ) ( )+ ( )( )+ .+( )( )

Observacin: Si los sucesos 1 , 2 , 3 , , se consideran casos posibles del suceso


B, entonces Bayes permite determinar la probabilidad de que uno de los ocurra siempre
que B haya ocurrido.

Ejemplo

La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe
que el 80% de los estudiantes terminarn los problemas asignados. Determin, que de los
estudiantes que cumplen con su trabajo el 90% aprobar el curso. De aquellos estudiantes
que no lo hacen as, el 60% ser aprobado. Eduardo Lpez tom Estadstica durante el
ltimo semestre con la profesora Blanquita y recibi una calificacin aprobatoria. Cul es
la probabilidad de que s haya hecho sus tareas?

Solucin:

Sea:
A = Estudiante que cumple con su trabajo.
A' = Estudiante que no cumple con su trabajo.
B = Estudiante que aprueba.
B' = Estudiante que no aprueba.

P (A) = 0.8 => P (A') = 0.2


P (B\A) = 0.9; P (B\A') = 0.6
P (B'\A) = 0.1; P (B'\ A') = 0.4

63
Apuntes de clase Estadstica General

P(B) = 0.9 P(A B) = P(A)P()

P(A B) = (0.8)(0.9)= 0.72

P( ) = 0.1

P(A) =0.8 P(A ) = ()( )

P(A ) = (0.8)(0.1) = 0.08

P(B) =0.6
P( B ) = ( )( )

P( ) =0.2 P( B ) = (0.2)(0.6) = 0.12)

P( ) = 0.4

P( ) = ( )( )

P( ) = (0.2)(0.4) = 0.08

Por definicin de probabilidad condicional tenemos:

( )
P ( ) =
()

( ) ()
P ( ) =
( )
Tener en cuenta que P (B) no es discernible de inmediato. Aqu es donde participa el
teorema de Bayes. Existen dos razones por las que Eduardo Lpez haya aprobado el
curso. Puede haber hecho los trabajos asignados y aprobar el curso o puede no haber
hecho los trabajos asignados y tambin aprobar el curso, es decir:

P (B) = P (A y B) +P (A y B)

P (B) = P (A). P (B \ A) + P (A'). P (B \ A')

Cuando se hace la sustitucin en el denominador de la frmula 1 se tiene:

P(A)P()

P ( ) =
() ()+ ( )( )

0.72
P ( ) = =
0.72 +0.12
0.72
P ( ) = = 0.86 = 86%
0.84
Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas
dado que recibi una calificacin aprobatoria.

Ejemplo

64
Apuntes de clase Estadstica General

El departamento de crdito de la tienda departamental Saga Falabella en Piura, inform


que 30% de sus ventas son en efectivo, 30% son pagadas con cheques en el momento de
la adquisicin y 40% son a crdito. Se tiene que 20% de las compras en efectivo, 90% de
las pagadas con cheques y 60% de las adquisiciones al crdito, son por ms de US$50. La
Sra. Milagritos acaba de comprar un vestido que cuesta US$ 120. Cul es la probabilidad
de que haya pagado por l en efectivo?

DISTRIBUCIONES PROBABILISTICAS DISCRETAS

QUE ES UNA DISTRUCION DE PROBABILIDADES?

Distribucin probabilstica, es la enumeracin de todos los resultados de un experimento


junto con la probabilidad asociada a cada uno de ellos.

Ejemplo:

Supngase que se est interesado en el nmero de caras que caen al lanzar tres veces
una moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres
caras. Cul es la distribucin de probabilidades para el nmero de caras?

Solucin.

Hay ocho posibles resultados, los cual son:

Resultado Tirada de la moneda Nmero de


Posible Primera Segunda Tercera Caras
1 S S S 0
2 S S C 1
3 S C S 1
4 S C C 2
5 C S S 1
6 C S C 2
7 C C S 2
8 C C C 3

A continuacin se muestra los resultados junto con su respectiva probabilidad:

Nmero de Probabilidad del


caras X resultado P(X)
0 1 = 0,125
8
1 3 = 0,375
8
2 3 = 0,375
8
3 1 0,125
8
TOTAL 8 = 1,000
8

Existen dos caractersticas importantes:


1.- La probabilidad de un resultado especfico debe estar siempre entre 0 y 1.
2.- La suma de las probabilidades de todos los resultados mutuamente excluyentes es 1

65
Apuntes de clase Estadstica General

VARIABLE ALEATORIA

Cantidad que es resultado de un experimento aleatorio que, debido al azar, puede tomar
distintos valores

VARIABLE ALEATORIA DISCRETA.

Variable que slo puede tener ciertos valores claramente separados y que es el resultado
de contar algn elemento de inters.

Ejemplos:
- El nmero de caras que se presentan en tres lanzamientos de una moneda
- El nmero de estudiantes que sacaron 15 en un examen
- El nmero de empleados ausentes en una fbrica determinada

VARIABLE ALEATORIA CONTINUA

Es aquella que puede tomar uno de una cantidad infinitamente grande de valores, dentro
de ciertas limitaciones

Ejemplos:
- La duracin de cada cancin en el ltimo lbum de Corazn Serrano
- El peso de cada estudiante de esta clase
- La temperatura ambiente al momento que lee estos apuntes

MEDIA, VARIANCIA, DESVIACION ESTANDAR DE UNA DISTRIBUCION DE


PROBABILIDADES

MEDIA:

La media es un valor representativo que sirve para representar una distribucin


probabilstica. Tambin es el valor promedio a largo plazo de la variable aleatoria. La
media se denomina tambin valor esperado o expectativa. E(X), de la variable.

= () = [()]

VARIANCIA Y DESVIACION ESTANDAR.-

Sirven para comparar la variacin en dos distribuciones que tengan la misma media, pero
diferente dispersin.

= [( ) ()]

Ejemplo:

Un vendedor, Juan Prez vende automviles nuevos para una empresa. Generalmente
negocia el mayor nmero de autos los sbados. Ha establecido la siguiente distribucin de
probabilidad para el nmero de autos que espera vender en un sbado en particular.

66
Apuntes de clase Estadstica General

Nmero de
automviles Probabilidad
Vendidos P(x)
X
0 0,10
1 0,20
2 0,30
3 0,30
4 0,10
total 1,00

1.- Qu tipo de distribucin es sta?


2.- En un sbado comn, Cuntos autos espera vender?
3.- Cul es la variancia de la distribucin?

DISTRIBUCIN PROBABILSTICA BINOMIAL

La Distribucin probabilstica Binomial, es una distribucin de probabilidades discreta.

Una caracterstica de esta distribucin binomial es que se ocupa de experimentos donde


cada resultado puede tomar slo uno de dos formas. Una forma comn de denotar los dos
resultados es como xito y fracaso.

Ejemplo:

Experimento: Seleccionar un juguete mecnico de la lnea de produccin

Resultado: El juguete funciona de manera correcta (xito)


El juguete no funciona en forma correcta (fracaso).

Experimento: Preguntar a un nio de cinco aos si le gusta un cereal de reciente


produccin.

Resultado: Le gusta (xito)


No le gusta (fracaso)

Una segunda caracterstica de una distribucin binomial es que los datos recopilados son
resultado de conteos.

Una tercera caracterstica de esta distribucin es que la probabilidad de xito permanece


igual de un ensayo a otro.

Una cuarta caracterstica es que un ensayo es independiente de cualquier otro. Lo que


significa que el resultado de un ensayo no afecta al resultado de algn otro.

La distribucin probabilstica Binomial puede describirse utilizando la siguiente frmula:

!
P(X) =
!( )!

67
Apuntes de clase Estadstica General

Donde:

n: es el nmero de ensayos
X: es el nmero de xitos observados
p: es la probabilidad de xito en cada ensayo
q: es la probabilidad de fracaso que se obtiene de 1- p

MEDIA Y VARIANCIA DE UNA DISTRIBUCION DE PROBABILIDADES


BINOMIAL

np

=
Ejemplo:

Una institucin universitaria establece nuevos mtodos de aprendizaje y de evaluacin,


con el resultado donde el 85% de sus alumnos aprueban todas las asignaturas.
Supongamos que se seleccionan 8 estudiantes de dicho plantel Cul es la probabilidad:
(a) exactamente 3 aprueben todas las asignaturas, (b) exactamente 3 pierdan alguna
asignatura; (c) por lo menos dos pierdan alguna asignatura?

!
a.- P(X) =
!( )!

!
P(X= 3) = 0,853 0,15 = 0, 0026 = 0,26%
!( )!

!
b.- P(X) =
!( )!
!
P(X= 3) = 0,153 0,85 = 0,0839 =8, 39%
!( )!

c.- () = 1 [( =) + (=) ]

8! 8!
() = 1 [( =0) = 0,150 0,8580 + (=1) = 0,151 0,8581 ]
0!(8 0)! 1!(8 1)!

(2) = 1 [0,2725 + 0,3847]

() = 0, 3428 = 34, 28%

Ejemplo

Supongamos que se toman 10 semillas de Oryza sativa L. Y se registra el evento


germin o no germin despus de 5 das desde su implantacin. En este experimento
las semillas estn suficientemente aisladas como para asegurar respuestas
independientes. Si la probabilidad de germinacin es (para todas las semillas) igual a 0,25
calculemos:

68
Apuntes de clase Estadstica General

a.- Cul es la variable aleatoria en este problema?


b.- La variable es discreta o continua? Por qu?
c.- Cul es la probabilidad que germinen al menos 3 de las 10 semillas?
d.- Calcule la media y la variancia y la desviacin estndar de la distribucin

DISTRIBUCION PROBABILISTICA DE POISSON

La distribucin de Poisson da un modelo para variables de tipo de conteo, donde los


conteos se refieren al registro del nmero de un evento de inters en una unidad de tiempo
o espacio dados (horas, minutos, 2 , 3 , etc).
Lleva ese nombre en honor a SIMON POISSON, quien la estudi y dio a conocer en 1837.
Con frecuencia se denomina ley de eventos improbables, lo cual significa que la
probabilidad p que suceda un evento especfico es bastante pequea. Esta es una
distribucin de probabilidades discreta.

Es una distribucin de probabilidades usada cuando n es muy grande, por lo general


mayor de cincuenta, y p, la probabilidad de xito de un suceso, se acerca a cero, mientras
que q la probabilidad del fracaso se aproxima a 1, de tal manera que el producto de np,
simbolizado por lambda , sea menor o igual a 5

La distribucin de Poisson se utiliza para describir el nmero de veces que se presenta un


evento durante un intervalo especfico ejemplo:

- La distribucin de llamadas telefnicas que llegan a un conmutados por hora, minuto,


etc, etc
- La demanda (necesidades) de los pacientes que requieren servicio en una institucin de
salud
- Las llegadas de camiones y automviles a una caseta de peaje por hora, da, etc
- Nmero de accidentes registrados en una interseccin de calles por da, semana, mes,
etc
Estos ejemplos tienen en comn un elemento: pueden ser descritos mediante una variable
aleatoria discreta que toma valores enteros (0, 1, 2, 3, etc.).

Otros ejemplos:
- Nmero de huevos de un insecto en una ovoposicin
- Nmero de bacterias en una muestra de agua
- Nmero de semillas defectuosas, observadas en una cinta transportadora por minuto.
- Nmero de nematodos por unidad de volumen de suelo
- El nmero de palabras mal escritas por pgina en un peridico
- El nmero de llamadas telefnicas por hora que recibe la secretaria de la Facultad
- El nmero de vehculos vendidos por da por la marca Toyota en la ciudad de
Lambayeque
- El nmero de goles en un encuentro de ftbol escolar
- Nmero de pulgones por planta
Se calcula de la siguiente manera.


P(X) = O bien P(X) =
! !

69
Apuntes de clase Estadstica General


P(X) =
!

Donde:

= = es la media aritmtica del nmero de ocurrencias (xitos) en un intervalo de


tiempo dado
e = es la constante 2,71828 (base de los logaritmos neperianos)
X= es el nmero de ocurrencias (xitos)
P (X) = es la probabilidad que se va a calcular para un valor dado de X

Las caractersticas de una distribucin Poisson son:


- El experimento aleatorio consiste en contar el nmero de veces que ocurre el
evento en una unidad determinada de espacio o tiempo.
- Las ocurrencias de los eventos son mutuamente independientes
- La probabilidad de ocurrencia es igual para todos los eventos
- En una unidad de espacio o de tiempo muy reducida, la probabilidad de ocurrencia
de ms de un evento es tan pequea que es prcticamente despreciable.

MEDIA Y VARIANCIA DE UNA DISTRIBUCION DE POISSON

= np

Ejemplo
Si el 1% de las bombillas fabricadas por una compaa son defectuosas, hallar la
probabilidad de que, en una muestra de 100 bombillas, 3 sean defectuosas


P(X) =
!
=

= 100 (0,01) = 1

13 2,718281
P(X) = = 0, 06121 = 6,13%
3!
Ejemplo:

1.- Se sabe que el nmero medio de errores por factura se estim en 0,3. Cul es la
probabilidad de no encontrar errores en una factura seleccionada al azar? Cul es la
probabilidad de hallar exactamente un error?

2.- Si el nmero promedio de picaduras de gorgojos por semilla es 0,2 (de cada 100
semillas 20 se encuentran picadas) Cuntas de 100 semillas no tendra picaduras?,
Cuntas 1 picadura? Y Cuntas 2 ms?

70
Apuntes de clase Estadstica General

DISTRIBUCION DE POISSON COMO APROXIMACION DE LA DISTRIBUCION


BINOMIAL

En casos en los que se aplica la distribucin binomial y n es relativamente grande y p


relativamente pequea, se acostumbra argumentar que los clculos de la probabilidad
binomial eran un tanto complicados y, por ello, se sugera utilizar la distribucin de
Poisson para aproximar los resultados porque, tal como se ver, la frmula es ms sencilla
de resolver.

Ejemplo

Los registros de una empresa muestran que la probabilidad de que falle cierto tipo de foco
en las primeras 100 horas de uso es p = 0,0005. Determine la probabilidad de que, de un
lote de 1 000 focos, cuando mucho 2 fallen en las primeras 100 horas de uso a) usando la
distribucin Poisson b) usando la Binomial

Solucin:

a.- P (cuando mucho 2) = P(X= 0) +P(X =1)+P(X=2)

= np = 1 000(0,0005) =0,5

2,718280,5 0,5 0 0,6065(1)


p (0) = = =0,6065
0! 1

2,718280,5 0,5 1 0,6065(0,5)


p (1) = = =0,30325
1! 1

2,718280,5 0,5 2 0,6065(0,25)


p (2) = = =0,07581
2! 2

Luego la probabilidad de que fallen cuando mucho 2 focos, segn Poisson

P (x 2) = P(X= 0) +P(X =1)+P(X=2) = 0,6065 + 0,30325 + 0,07581 = 0,98556

b.- Segn distribucin Binomial


!
P(X) =
!( )!

1 000!
P(X =0) = (0,0005)0 (0,9995)1000 =0,6065
0!(1 000 0)!

1 000!
P(X =1) = (0,0005)1 (0,9995)999 = 0,3034
1!(1 000 1)!

1 000!
P(X =2) = (0,0005)2 (0,9995)998 =0,07581
2!(1000 2)!

Luego la probabilidad de que fallen cuando mucho 2 focos, segn distribucin Binomial

71
Apuntes de clase Estadstica General

P (x 2) = P(X= 0) +P(X =1)+P(X=2) = 0,6065 + 0,30325 + 0,07581 = 0,98556

Como se ver los resultados son iguales.

DISTRIBUCION PROBABILISTICA NORMAL

Es una distribucin de probabilidad continua.


La distribucin probabilstica normal y su curva normal tienen la siguiente caracterstica:
1.- La curva normal tiene la forma de una campana y presenta un solo valor mximo en el
centro. La media, mediana y moda son iguales.
Luego la mitad del rea bajo la curva se encuentra a un lado (o por encima del valor
central) y la otra mitad al otro lado (o por debajo)
2.- La distribucin probabilstica normal es simtrica con respecto a su media, si se corta la
curva normal verticalmente por este valor central, las dos mitades sern como imgenes
reflejadas en un espejo
3.- La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
Es asinttica, lo cual significa que la curva se acerca cada vez ms al eje X, pero nunca
llega a tocarlo. Esto es, los puntos extremos de la curva se extienden indefinidamente
en ambas direcciones.
La distribucin normal estndar tiene media igual a 0 y desviacin estndar igual a 1.

0,5 0,5
50% 50%
%

Valor z (o desvi normal z) es la diferencia (desviacin) entre un valor seleccionado,


denotado por X y la media poblacional , dividida entre la desviacin estndar de la
poblacin
Expresado como frmula

Z=

Donde:

Z = Nmero de desviaciones estndar que hay desde X a la media de la distribucin


X = es el valor de cualquier observacin especfica
= es la media de la distribucin
= es la desviacin estndar de la distribucin

AREAS BAJO LA CURVA NORMAL

1.- Aproximadamente el 68% del rea bajo la curva normal est dentro ms una y menos
una desviacin estndar respecto de la media. Esto se expresa as 1
2.-Aproximadamente el 95,5 % del rea bajo la curva normal est dentro ms dos y menos
dos desviaciones estndar respecto de la media. Esto se expresa as 2

72
Apuntes de clase Estadstica General

3.- Aproximadamente el 99,7 % del rea bajo la curva normal est dentro ms tres y
menos tres desviaciones estndar respecto de la media. Esto se expresa as 3
Mostramos esto en el siguiente diagrama

DETERMINACION DE AREAS BAJO LA CURVA NORMAL

Se usa la tabla de Z, donde se ve que al transformar las mediciones a desvos normales z


cambia la escala. Las conversiones se muestran en la grfica siguiente. Por ejemplo +
1 se convierte a z de + 1,00

Estos conceptos pueden expresarse de manera algo distinta: el rea bajo la curva normal
dentro de ms y menos una desviacin estndar respecto de la media, es 0,6826. El rea
dentro de ms y menos dos desviaciones estndar respecto de la media, es de 0,9544. El
rea dentro de tres desviaciones estndar respecto de la media vale 0,9974

Ejemplo

Un profesor manifiesta que el promedio que los estudiantes obtienen en su asignatura es


de 3,9, con una desviacin estndar de 0,35. Cul es la probabilidad que uno de sus
alumnos obtenga:

a.- Una calificacin superior a 4,4


b.- Inferior a 3,2
c.- Una calificacin mayor o igual a3
SOLUCION:
a.-

Z=

4,4 3,9
Z=
0,35

73
Apuntes de clase Estadstica General

Z= 1,43 A (0,4263)
P(X 4,4) = 0,5 0,4263 = 0,0737= 7,37%


b.- Z=

3,2 3,9
Z=
0,35
Z= 2 A (0,4773)
P(X 3,2) = 0,5 0,4773 = 0,0227= 2,27%


c.-- Z=

3,0 3,9
Z=
0,35
Z= 2,57 A (0,4949)
P(X 3) = 0,5 + 0,4949 = 0,9949
P(X 3) = 99,49%

Ejemplo

Una mquina expendedora de gaseosa se ajusta para servir 7,00 onzas de lquido por
vaso. La desviacin estndar es de 0,10 onzas Cul es la probabilidad de que la mquina
sirva:

a.- Entre 7.10 y 7.25 onzas de gaseosa


b.- 7.25 onzas ms
c.- Entre 6.8 y 7.25 onzas

DISTRIBUCION MUESTRAL DE LA MEDIA

Distribucin de probabilidad que consta de todas las posibles medias de las muestran de
un determinado tamao de muestra de la poblacin y la probabilidad de ocurrencia
asociada con cada media muestral

Teorema:

74
Apuntes de clase Estadstica General

Si se extraen varias muestras de tamao n de un universo, con una distribucin cualquiera,


entonces se cumple que:

=
( )2
2 =

= 2


Pero: = Para una poblacin infinita


= X Para una poblacin finita
1

= Media de la distribucin muestral


= Desviacin estndar de la media muestral o error estndar
de la media


= Factor de correccin finita
1
OBSERVACION

Se puede usar = en una poblacin finita, pero siempre y cuando <0,05

Ejemplo
El tiempo de servicio de los empleados (POBLACION) a nivel de ejecutivo de la empresa
LA PONDEROSA es:

Aos de
Nombre
servicio
JUAN 20
DIANA 22
ROSA, 24
EDUARDO 26
HUGO 28

1 20+22+24+26+28
= = =24
5
( )2 (2024)(2224)(2424)(2624)(2824)
2 = = =8
5
= 2 = 8 = 2,8284

Ahora
a.-Formar muestras tamao 2
b.-Organice las medias en una distribucin de muestras

75
Apuntes de clase Estadstica General

c.- Compare la media de la poblacin y el valor medio de las medias muestrales

Solucin:
Aos de Media Aos de Media
servicio muestral servicio muestral
(n = 2) (n = 2)
20, 22 21 22, 24 23
20, 26 23 22, 28 25
20, 24 22 26, 24 25
20, 28 24 26, 28 27
22, 26 24 24, 28 26

21+23+.+26
= = = 24
16
Luego: =

( ) (2124)2 + (23 24)2 +..+(26 24)2


= = = 3 = 1,7320
10


= X Para una poblacin finita
1

2,8284 5 2
= X
2 5 1
= ,

TEOREMA DEL LIMITE CENTRAL

Se extraen varias muestras de tamao n de cualquier universo, con media y desviacin


estndar ; entonces la distribucin de las medias muestrales se acercar a una de tipo

normal con media y desviacin estndar , si las muestras son grandes (n 30). La

variable estandarizada correspondiente ser:


Z=

Ejemplo:

Se sabe que la produccin de pollos de una determinada granja tiene un peso promedio de
3,50 Kg. Y una desviacin estndar de 0,18 Kg. Cul es la probabilidad de que una
muestra aleatoria de 100 pollos de esta poblacin pesen entre 3,53 y 3,56 Kg.?

76
Apuntes de clase Estadstica General

3,56 3,50
Z= = = 0,18 = 3,33

100

Z3,33 A (0,4996)

3,53 3,50
Z=
= 0,18 = 1,66

100

Z1,66 A (0,4515)

P (3,53 , ) =0,4996 0.4515= ,

Ejemplo

Un fabricante de cierto champ para el cabello,distribuye el tamao profesional de su


producto en 100 salones de belleza de Chiclayo. Se ha determinado que el consumo
promedio de su producto es de 2,800 cojines mensuales, con una desviacion estandar de
280 cojines. Si se toma una muestra probabilistica de 36 salones,Cul es la probabilidad
de que el consumo promedio en un mes sea inferior a 2,700?


Z= =

2,700 2,800
Z= 280 = 2,14
36

, A( 0,4838)

P ( < 2,700) = 0,5 0,4838 = 0,0162=1,62%

Ejemplo

La altura media de los alumnos de un plantel de secundaria es de 1,50 m. Y su desviacin


estndar es de 0,25 m. Determinar la probabilidad de que en una muestra de 36 alumnos,
la media sea superior a 1,60 mts.


Z= =

1,60 1,50
= 0,25 = 2,40

36

Z2,40 A (0,4918)

P= 0,5 0,4918 = 0,0082= 0,82%

77
Apuntes de clase Estadstica General

En aquellos casos de poblaciones finitas, es decir cuando se da informacin


sobre el tamao de la poblacin y cuando el tamao de muestra es mayor al
5% de la poblacin, se puede aplicar el factor de correccin, representado
por:

Luego la desviacin estndar de la muestra se convierte en

Ejemplo

Si en el ejemplo anterior se considera que dicho plantel de secundaria tiene un total de N=


400 alumnos. Cul es la probabilidad, en una muestra de 36 alumnos, de que la media
sea superior a 1,60 m?


Z= =


1

1,60 1,50
Z= = 2,51
0,25 400 36

36 400 1

, A( 0,4940)

P ( > 1,60) = 0,5 0,4940 = 0,006= 0,6

Ejemplo:

1.- Un fabricante declara que la duracin de las bujas que l fabrica sigue una distribucin
normal con media de 36 000 Km y una desviacin estndar de 4 000 Km Para una
muestra aleatoria de diecisis bujas se obtuvo una duracin media de 34 500 Km.
Cul es la probabilidad de obtener una media muestral tan pequea como esta o
menor?

DISTRIBUCION EN EL MUESTREO DE UNA PROPORCION

Es una distribucin probabilstica que consta de todos los valores posibles que pueda
tomar de un tamao de muestra dado, junto a su probabilidad de ocurrencia.

MEDIA Y DESVIACION ESTANDAR DE PARA UNA POBLACION INFINITA

78
Apuntes de clase Estadstica General

Supongamos que la proporcin de la proporcin de la poblacin es p y se obtienen


muestras aleatorias de tamao n entonces:

=P

MEDIA Y DESVIACION ESTANDAR DE PARA UNA POBLACION FINITA

=P=

=
1


Recibe el nombre factor de correccin para una poblacin finita
1

TEOREMA DEL LIMITE CENTRAL, EN LA PROPORCION


Z= =

(1)

Ejemplo

Se tiene que el 4% de las piezas producidas por cierta maquina es defectuosa, Cul es la
probabilidad de que en un grupo de 200 piezas, el 3% o ms sean defectuosas.?


Z= =

(1)

0,03 0,04
Z= =
0,04 0,96

200

0,71

Z (0,71) = A (0,2612)

> , ) = 0,5 + 0,2612 = 0,7612= 76,12%


P (

Ejemplo

Se desea estudiar una muestra de 49 personas para saber la proporcin de las personas
mayores de 40 aos, sabiendo que la proporcin en la poblacin es 0,4. Cul es la
probabilidad de que la proporcin en la muestra sea menor de 0,5?

79
Apuntes de clase Estadstica General


Z= =

(1)

0,5 0,4
Z= = 1,43
0,4 0,6

49

Z (1,43) = A (0,4236)

< , ) = 0,5 + 0,4236 = 0,9236


P (

Ejemplo

Cuarenta y seis por ciento de los sindicatos del pas estn en contra de comercializar con
la China Continental; Cul es la probabilidad de que una encuesta a 100 sindicatos
muestre que ms del 52% tenga la misma posicin?


Z= =

(1)

0,52 0,46
Z= = 1,21
0,44 0,54

100

Z (1,21) = A (0,3869)

> , ) = 0,5 0,3869 = 0,1131= 11,31%


P (

Ejemplo

Se ha estimado que el 43% de los Ingenieros Agrnomos consideran que es muy


importante que se imparta el curso de tica en la Facultad de Agronoma para inculcar
valores morales a los estudiantes. Halle la probabilidad de que ms de la mitad de los 80
Ingenieros Agrnomos de una muestra opinen de este modo.

DISTRIBUCION DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES

80
Apuntes de clase Estadstica General

Se tiene dos poblaciones normales e independientes identificadas la primera por X y la


segunda por Y de tamaos cuyas medias se simbolizan por y sus
desviaciones estndar por Se obtiene un nmero par de muestras posibles,
entonces

( 1 2 ) (1 2 )
Z=
2 2
1+ 2
1 2

( ) ( ) ( ) ( )
Z= =
2 2

+

Se puede aplicar esta distribucin cuando no se conocen las varianzas poblacionales las
cuales pueden ser sustituidas por variancias muestrales siempre que sean mayores de 30.
La frmula ser:

( ) ( )
Z=
2 2
+

Ejemplo

1.- Se obtiene una muestra aleatoria de 100 elementos de una poblacin normal que tiene
media 50 y desviacin estndar 8. Luego se selecciona otra muestra aleatoria de 400
elementos de una poblacin normal, que tiene media 40 y desviacin estndar 12.
Encontrar la probabilidad de que

a.- La media de la primera muestra exceda a la segunda en 8 o ms


b.- Ambas medias difieran, en valor absoluto, en 12 o ms

SOLUCION
= 50 = 40 = 8 = 12 1 = 100 2 = 400

( ) ( ) ( ) ( )
a.- Z=

=

+

8 (50 40)
Z= = 2
64 144
+
100 400

2 = 2 A(0,4772)

81
Apuntes de clase Estadstica General

P [( ) ] = 0,5 + 0,4772 = 0,9772 = 97,72%

12 10
b.- Z= = 2
64 144
+
100 400

2 = 2 A(0,4772)

P [( ) 12] = 0,5 0,4772 = 0,0228

12 10
Z= = 22
64 144
+
100 400

2 = 22 A(0,5)

P [( ) 12] = 0,5 0,5 = 0,0

Luego

P [( ) ||] = 0,0228 + 0,0 = 0,0228= 2,28%

Ejemplo

En un restaurante, el consumo medio por desayuno es de $ 4 980, con una desviacion


estandar de $950. En un segundo restaurante las correspondientes cifras son $4 238 y $
820. Si se eligen al azar 80 boletas de pago del primer retaurante y una muestra aleatoria
de 60 del segundo,Cul es la probabilidadde que la diferencia entre los consumos de
ambas muestras sea mayor que $1 000 en valor absoluto?

= 4 980 = 4 238 = 950 = 820 1 = 80 2 = 60

( ) ( ) ( ) ( )
Z=

=

+

1 000 (4980 4238)


Z= = 1,75
902500 627400
+ 60
80

1,75 = A(0,4599)

1 000 (4980 4238)


Z= = 11,82
902500 627400
+
80 60

82
Apuntes de clase Estadstica General

11,82 = A(0,4999)

A= 0,4999+0,4599=0,9598

P = 10,9598= 0,0402=4,01%

Ejemplo

Dos marcas A y B de tabletas anticidas efervecentes registran el mismo promedio de


disolucion en agua, con desviacion estandar de 12 segundos para la marca A y 24
segundos para B. Suponiendo que el tiempo de disolucin est normalmente distribuido.
Cul es la probabilidad de qu, con una muestra de 36 tabletas de cada marca, las
tabletas B registren un promedio de tiempo de disolucin, cuando menos 5 segundos ms
rpido que A?

( ) ( ) ( ) ( )
Z=

=

+

5 (0)
Z= = 1,12
144 576
+
36 36

1,12 = A(0,3686)

P = 0,50,9598= 0,1314=13,14%

DISTRIBUCION DE DIFERENCIAS ENTRE DOS PROPORCIONES


MUESTRALES

En el caso de dos poblaciones independientes, de tamao 1 2 , distribuidas


binomialmente, con parametros, medias proporcionales 1 2 . El error estandar de las
diferencias entre las dos medias proporcionales estar dada por 1 2 , tendremos:

(1 2 ) (1 2 )
Z=
1 1 2 2
+
1 2

Ejemplo

Dos fabricas A y B , producen articulos similares. La produccion de A contiene 7% de


defectosos, y la de B contiene, 5%. Si se extrae una muestra aleatoria de 2000 de cada
una de las producciones de las fabricas, Cul es la probabilidad de que las dos muestras
revelen una diferencia en el nmero de los defectuosos del 1% ms. En valor absoluto.

83
Apuntes de clase Estadstica General

( ) ( )
0,01 0,02
Z= = = 1,33
(0,07 0,93) (0,05 0,95)
+

+
2000 2000

Z= 1,33 A (0,4082)

0,01 0,02
Z= =4
(0,070,93) (0,05 0,95)
+
2000 2000

Z= 4 A (0,5)

P( |, |) = 0,5 + 0,4082 = 90,82%

Ejemplo

Consideremos dos mquinas que producen un determinado artculo; la primera produce


por trmino medio un 14% de artculos defectuosos , en tanto que otra, produce el 20% de
artculos defectuosos; si se obtienen muestras de 200 unidades en la primera y 100
unidades en la segunda,Cul es la probabilidad de que difiera A de B en 8% o ms?

( ) ( )

Z=

+

0,08 (0,06)
= = 2,98
(0,14)(0,86) (0,2)(0,8)
+
200 100

Z= 2,98 A (0,4986)

P( , ) = 0,5 0,4986 = 0,0014=0,14%

DISTRIBUCION DE t

En problemas referentes a pruebas de hiptesis, cuando se conoce la desviacin estndar


o desviacin tpica poblacional no importa que el tamao de la muestra sea grande o
pequea. Se dice que una muestra es grande, si el nmero de unidades es mayor a treinta
y es pequea si es menor o igual a treinta.

A esta distribucin se le conoce como distribucin t se Student, en honor al estadstico


irlands W.S. Gosset, quien escriba bajo el seudnimo de Student. Fue enunciada en
19908 y ligeramente modificada por R. A. Fisher (1925).

Esta distribucin se expresa en forma acampanada y simtrica, pero ms achatada y con


ms rea en los extremos, es decir las reas que corresponden a las regiones crticas o de
rechazo. Se puede considerar que no hay una distribucin de t, sino ms bien una familia
de distribuciones t dado que las deviaciones estndar se modifican a medida que se va a
aumentando el tamao de la muestra, acercndose a la normal.

84
Apuntes de clase Estadstica General

Grados de libertad, esta expresin fue introducida por Fisher, dice que los grados de
libertad de un conjunto de observaciones, estn dados por el nmero de valores que
pueden ser asignados arbitrariamente, antes de que el resto de las variables queden
completamente determinadas. Ejemplo: Si tengo cuatro valores: 8 +10 + 6 + 20 = 44, se
observa que puedo asignar tres (3) valores arbitrariamente: 16 + 4 + 10 +14= 44, pero el
cuatro debe ser 14 y no lo puedo asignar libremente pues la suma debe ser 44. Por la tanto
= n 1 = 4 - 1 = 3. se lee nu o niu y se emplea para simbolizar los grados de
libertad

ESTIMACIN PUNTUAL Y POR INTERVALO

Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en
estadsticos muestrales, esto es, en funciones de la informacin muestral. La eleccin
apropiada de estos estadsticos depender de cul sea el parmetro de inters de la
poblacin. El verdadero parmetro ser desconocido, y un objetivo ser estimar su valor.

Para estudiar la estimacin de un parmetro desconocido, debe considerarse dos


posibilidades: Estimacin puntual y estimacin por intervalo.

PARMETROS Y ESTADSTICOS

La media y la desviacin estndar de una variable aleatoria poblacional X son


conocidos como parmetros y la media y la desviacin estndar de una muestra son
conocidos como estadsticos. En general a cualquier caracterstica numrica de una
poblacin se le conoce como parmetro y a cualquier cantidad calculada de una muestra
aleatoria se le conoce como estadstico. Los estadsticos se usan para estimar
parmetros.

ESTIMACIN PUNTUAL

Es el valor calculado, a partir de la informacin de muestreo, que se emplea para estimar el


parmetro de poblacin

El estadstico muestral usado para estimar un parmetro de la poblacin se llama


estimador, y un valor observado especfico se denomina estimacin.

Cuando la estimacin de un parmetro de la poblacin est dada solamente por un


nmero, se denomina estimacin puntual. Por ejemplo la media muestral es un
estimador de la media poblacional y un valor simple de es un estimacin puntual.

Se dice que:

es el estimador puntual de la media poblacional


s es el estimador puntual de la desviacin estndar poblacional
= es el estimador puntual de la proporcin poblacional P.

en una determinada muestra se les


Luego a los valores numricos obtenidos para , ,
llama estimados puntuales del parmetro.
Ejemplo:

85
Apuntes de clase Estadstica General

A continuacin se muestra el salario anual de 10 trabajadores de una fbrica y los datos


si concluyeron con un programa de adiestramiento general:

Salario Programa de
anual ($) Adiestramiento gerencial?
9 094,3 Si
3 263,9 Si
9 643,5 Si
9 984,9 Si
7 621,6 No
5924,0 Si
9 092,3 No
1 404,4 Si
3 957,7 No
5 109,7 No

1 +2 +3 +.+10
= = = 6 509.63

2
2 ( )
= = 9.09
1
S 3.01
4
= 0.4
10

Luego para una muestra de 10 trabajadores de una fbrica, el estimado puntual de es


de $ 6 509.63 nuevos soles, el de es de 3.01 y el de p es 0,4

PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Son tres: Insesgo, eficiencia, consistencia

INSESGO:

Si el valor esperado del estadstico de muestra es igual al parmetro poblacional que se


estima, se dice que este estadstico es un estimador insesgado del parmetro poblacional.

EFICIENCIA.

Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener
dos estimadores puntuales del mismo parmetro poblacional. En este caso, preferiramos
usar el estimador puntual con la menor desviacin estndar, porque tiende a proporcionar
estimados ms cercanos al parmetro poblacional. Se dice que el estimador puntual con la
menor desviacin estndar tiene una mayor eficiencia relativa que el otro.

86
Apuntes de clase Estadstica General

CONSISTENCIA.

En trminos generales un estimador puntual es consistente si sus valores tienden a


acercarse al parmetro de la poblacin conforme se incrementa el tamao de la muestra.
En otras palabras, un tamao grande de muestra tiende a proporcionar un mejor estimador
puntual que un tamao pequeo

ESTIMACIN POR INTERVALO DE CONFIANZA

Un intervalo de confianza, es una gama de valores obtenidos a partir de datos de


muestreo, de modo que el parmetro ocurre dentro de esta variedad de valores con una
probabilidad pre establecida llamada nivel de confianza

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN


NORMAL: VARIANZA POBLACIONAL CONOCIDA.

Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de


una poblacin con distribucin normal con una media y una varianza . Si es
conocida y el valor observado de la media muestral es , entonces el intervalo de
confianza del 100 (1- para la media poblacional, viene dada por:

{ x - Z + Z } = 1-

ERROR MUESTRAL

Es el valor absoluto de la diferencia entre un estimador puntual insesgado y el parmetro


poblacional que estima se llama error muestral.

Para el caso en el que la media de una muestra estima a una media poblacional, el error
muestral es:
E = | |

87
Apuntes de clase Estadstica General

Ejemplo.-

1.- Un proceso de envase de bolsas de azcar refinada. El peso del contenido de estas
bolsas tiene una distribucin normal con desviacin estndar de 15 gramos. Los
contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
Calcule un intervalo de confianza del 95% para el verdadero peso medio de todas las
bolsas de azcar producidas por el proceso.


{ + } = 1

15 15
{100 1,96 100 +1,96 } =0,95
25 25

{94,12 105,88} = 0,95

2.- Se desea establecer si la aplicacin de fertilizantes modifica el rendimiento promedio de


una variedad de trigo. Se conoce que la desviacin estndar es = 450Kg. A los
fines de evaluar el efecto de la fertilizacin, se realiz un ensayo que consisti en elegir
20 hectreas (una en cada chacra de la regin), en forma aleatoria a las que se les
aplic fertilizante, evaluando luego su rendimiento a cosecha. La produccin obtenida
fue = 2650 Kg. Encontrar un intervalo de confianza al 90% para el verdadero
rendimiento promedio.

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN CON


VARIANZA DESCONOCIDA Y TAMAO DE MUESTRA GRANDE

Supongamos que tenemos una muestra de n observaciones procedentes de una


distribucin con media . Sean x y s la media y la desviacin estndar de la muestra
observada, respectivamente, entonces si n es grande, n 30 una buena aproximacin de
un intervalo de confianza del 100 (1 ) % para la media dada por:


{Z +Z } = 1

Ejemplo.-

Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que
evaluasen unas determinadas condiciones de trabajo en una escala de 1 (no importante) a
5 (extremadamente importante). La seguridad de trabajo recibi una calificacin media de
4,38 con una desviacin estndar muestral de 0,70. Calcule un intervalo de confianza del
99% para la media poblacional


{Z +Z } = 1

0,70 0,70
{4.38 2.576 4.38 + 2.576 } = 0.95
172 172

88
Apuntes de clase Estadstica General

{4.2427 4,5173} = 0,99

INTERVALOS DE CONFIANZA PARA UNA PROPORCIN DE LA POBLACIN

Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero
de xitos de una muestra entre el nmero total muestreado.

Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo
siguiente:

+ }= 1

{
Como p no se conoce

(1 )
=

Donde
=Valor asignado por el nivel de confianza
= = es la proporcin muestral
n = es el tamao de la muestra
Ejemplo.-

En una muestra aleatoria de 900 votantes, el 55% prefiere al candidato demcrata de


presidente. Halle un intervalo de confianza aproximado para la proporcin de todos los
votantes que prefieren al candidato demcrata con un nivel de confianza del 90%

{ + } = 1-

(1) 0,55(10,55)
= = 0.0165
900

{0,55 1.645(0.0165) 0,55 + 1.645(0.0165) }=1

{0.5229 0,5771 } = 1

Ejemplo.-

Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que
puedan reconocer la marca de un limpiador con base en la forma y el color del recipiente.

89
Apuntes de clase Estadstica General

De 1400 personas 420 pudieron reconocer (identificar) la marca del producto. Si se utiliza
el grado de confianza del 99% Cul sern los intervalos de confianza?

{ + } =1 -
420
= 1400 = 0,30

(1) 0,30(10,30)
= = 0.0122
1400

{0,30 2.576(0.0122) 0,30 + 2.576(0.0122)} = 1

{0.2686 0,3314 } = 1

ESTIMACIN POR INTERVALO PARA LA DIFERENCIA ENTRE DOS MEDIAS


POBLACIONALES

Se puede hacer comparaciones como:

El promedio de dimetros de tallos de plantas tratadas dos tipos diferentes de nutrientes.

Las producciones promedio en una planta qumica que usa materias primas suministradas
por dos proveedores diferentes.

Cuando muestras aleatorias independientes de tamao n1 y n2 observaciones han sido


seleccionadas de entre poblaciones con medias 1 y 2 y variancias y
respectivamente, la prueba estadstica ser:

(x1 x2 ) (1 2 )
Z=
2 2
1+ 2
1 2

Pero si n1 y n2 son grandes (mayores de 30) y , no se conocen, el estimador del


estadstico ser:

( ) ( )
Z=


+

El intervalo de confianza en este caso ser:


{ ( ) z + ( ) + z + } =1-

En caso de que las muestras sean grandes (mayores de 30) y 12 , 22 no se conocen, el


intervalo se podr calcular de la siguiente manera:

90
Apuntes de clase Estadstica General


{ ( ) z + ( )+ z + } =1-

Ejemplo:

Las resistencia al desgaste de dos tipos de llantas para automvil se compararon en


muestras de pruebas de camino de 1 = 2 = 100 llantas para cada tipo. El nmero de
millas hasta el completo desgaste se defini como una cantidad especfica de desgaste de
las llantas. Los resultados de la prueba se muestran a continuacin

LLANTA 1 LLANTA 2
1 = 26400 2 = 25100
12 = 144000 22 = 1960000

Estime (1 - 2), la diferencia en la media de millas hasta el completo desgaste, usando un


intervalo de confianza del 99%. Hay diferencia en el promedio de calidad de desgaste
para los dos tipos de llantas?

Solucin:

La estimacin puntual de (1 2 ) (x1 x2 ) = 26 400 25100 = 1300 millas

12 22
El error estndar = +
1 2

12 12
Que se puede estimar como = +
1 2

1440 000 1960 000


= + = 184,4 millas
100 100

El intervalo de confianza se calcula como:

2 22 12 22
{ (x1 x2 ) z 1 + (x1 x2 ) + z + } =1-
1 2 1 2

1440 000 1960 000 1440 000 1960 000


1300-2,58 100
+ 100
1300+2,58 100
+ 100
}= 0,99

{1300 2,58(184,4) 1300+2,58(184,4)} = 0,99


{824,2 1775,8} = 0,99

ESTIMACIN POR INTERVALO DE LA DIFERENCIA ENTRE DOS


PROPORCIONES POBLACIONALES

Se pueden hacer comparaciones como:

91
Apuntes de clase Estadstica General

Los porcentajes de germinacin se semillas tratadas y semillas no tratadas con un


fungicida
La proporcin de votantes mujeres y la proporcin de votantes hombres que estn a favor
de una enmienda de igualdad de derechos
Suponga que las muestras aleatorias independientes de las observaciones 1 2 han
sido seleccionadas de poblaciones con parmetros 1 2 , respectivamente La distribucin
muestral de la diferencia entre proporciones muestrales:
1 2
( 1 2) = ( )
1 2

La media muestral de ( 1 - 2) es p1 p2

1 1 2 2
El error estndar es= +
1 2

1 1 2 2
Que se estima como = +
1 2

La estimacin cuando 1 2 > 30 ser:






)

{( + ( ) +
+ }=1

La estimacin cuando 1 2 < 30 ser:






)

{( + ( ) +
+ }=1

Ejemplo:
La propuesta de un bono para la construccin de una escuela ser enviada a los votantes
en la siguiente eleccin municipal. Una parte importante del dinero derivado de esta
emisin de bonos se emplear en construir escuelas en una zona de rpido desarrollo de
la ciudad y lo dems se usar para renovar y actualizar los edificios escolares del resto de
sta. Para evaluar la viabilidad de la propuesta de un bono, a una muestra aleatoria de
1 = 50 residentes de la zona de rpido desarrollo y 2 = 100 de las otras partes de la
ciudad, se les pregunt si piensan votar por la propuesta. Los resultados se dan a
continuacin:

Seccin en Resto de
desarrollo la ciudad
Tamao muestral 50 100
Nmero a favor de la propuesta 38 65
Proporcin a favor de la propuesta 0.76 0.65

92
Apuntes de clase Estadstica General

Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con
un 99% de intervalo de confianza.

( 1 2) = 0,76 0,65 = 0,11


1 1 2 2 (0.76)(0,24) (0,65)(0,35)
+ = + = 0,0770
1 2 50 100

1 1 2 2 11 22
{(1 2 ) Z + (1 2 ) + Z + } = 1
1 2 1 2

{0,11 (2,58)(0,0770) < < 0,11 + (2,58)(0,0770) } = 0,99


{ 0,089 < < 0,309 } = 0,99

INTERVALOS DE CONFIANZA USANDO LA DISTRIBUCIN t

Cuando la poblacin bajo estudio tiene una distribucin normal, o aproximadamente


normal, pero no se conoce la desviacin estndar de la poblacin, y el tamao de la
muestra es menor de 30, no podemos usar la distribucin normal para determinar
intervalos de confianza para la media de la poblacin. En este caso usaremos la
distribucin t se Student.

Recordemos que la distribucin de t de Student se utiliza cuando se cumple con las


siguientes condiciones.

1.- La muestra es pequea


2.- desconocida
3.- La poblacin es normal.

CARACTERSTICAS DE LA DISTRIBUCIN t DE STUDENT


La distribucin t de Student fue desarrollada en 1908 por William S. Gossett, un maestro
cervecero de la Guinness Brewey de Irlanda, quien public su investigacin con el
seudnimo de Student. Gossett desarroll una nueva teora estadstica sobre muestras
pequeas al trabajar con muestras pequeas y en experimentos donde intervenan
temperaturas en esta cerveza. A l le interesaba el comportamiento exacto de la expresin:


t=

Cuando S deba usarse como estimador de . En particular le preocupaba la discrepancia


entre s y cuando se calculaba S a partir de una muestra pequea.

Al igual que la distribucin normal estandarizada, la distribucin t tiene forma de campaa y


es simtrica alrededor de la media cero, pero es ms achatada que la distribucin normal
estandarizada debido a su mayor dispersin.

93
Apuntes de clase Estadstica General

LA DISTRIBUCIN t TIENE LAS SIGUIENTES CARACTERSTICAS:

1.- Al igual que la distribucin Z, la distribucin t es una distribucin de variable continua.


2.- Es acampanada y simtrica
3.- No hay una sola distribucin t, sino una familia de distribuciones t.
4.- La distribucin t es ms extendida y menos aguda en el centro, que la distribucin Z.
Sin embargo a medida que n aumenta la curva de la distribucin t se aproxima a la
distribucin normal estandarizada.

El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:
{ (1) + (1) } =1


{ (1) + (1) } =1

Ejemplo.-

Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes
universitarios en el primer mes del ciclo acadmico. La media y la desviacin estndar de
una muestra aleatoria de nueve alumnos fueron de $ 15 782 y $ 3889, respectivamente.
Suponiendo que la poblacin sigue una distribucin normal, calcule el intervalo de
confianza del 95% para el gasto medio poblacional

{ t (n-1) x + t (n1) = 1

{ t (n1) +(1) } = 1

En las tablas (91) 2.3060

3889 3889
{157822.3060 15782+2.3060 } = 1
9 9
{12792.65554 188771,3446} = 1

Ejemplo
Una muestra aleatoria de 26 observaciones tiene una media de 65 y una desviacin
estndar de 4,2. Se piden los lmites de confianza del 95%

94
Apuntes de clase Estadstica General

{ + } = 1

{ + }=1

4,2 4,2
{65 2,0595 65 + 2,0595 } = 0,95
25 25
{63,27 66,73} = 0,95

PARA DOS MEDIAS POBLACIONALES

( )
+( ) ( )
+( )
{( ) t +
+ ( ) + +
+ } =1

( )
+( ) ( )
+( )
{( ) t +
+ ( ) + t +
+ }=1

Ejemplo

En un experimento llevado a cabo para medir la efectividad de dos abonos en dos


parcelas, de 10 hectreas cada una cultivada con maz, se obtuvieron las siguientes
medias, para la primera parcela abonada con el producto A, 81,7 Kg. por hectrea; en la
segunda parcela, 88,3 Kg. por hectrea con el B y las desviaciones estndar de 0,7 y 0,8
respectivamente. Cules son los lmites de confianza para la diferencia de los promedios
con una probabilidad de 95%?

( )
( )
( )
( )

{( ) t + + ( ) + + + } =1-

9(0,49)+9(0,64) 9(0,49)+9(0,64)
{(81,7 88,3) 2,10 10+102
(81,7 88,3) + 2,10 10+102
} = 1

{7,31 , } = 0, 95

PARA LA DIFERENCIA ENTRE DOS PROPORCIONES

Se desea determinar si hay alguna diferencia significativa, segn el sexo, en la preferencia


por margarina o mantequilla. Se realiz una muestra aleatoria entre 26 hombres y 18
mujeres, indicando que 16 y 10 respectivamente, preferan la margarina a la mantequilla

95
Apuntes de clase Estadstica General

10
P1 = = 0,62 2 = 18 = 0,55
t (26+182)(0,05) = 2,018

1 1 2 2 1 1 2 2
{(1 2 ) t + 1 2 (1 2 ) + t + }= 1
1 2 1 2

0,62(0,38) 0,55(0,45) 0,62(0,38) 0,55(0,45)


{(0,62 0,55) 2,018 26
+ 17
1 2 +2,018 26
+ 17
}= 1
{0,24 P1 P2 0,38}

INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIN


NORMAL.

Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este
resultado es clave para construir un intervalo de confianza para la varianza poblacional
cuando se toman muestras de una poblacin

Supongamos que se dispone de una muestra aleatoria de n observaciones procedentes de


una poblacin con distribucin normal con varianza . Si la varianza muestral observada
es , entonces el intervalo de confianza del 100(1- para la varianza poblacional viene
dado por

()
=

( )
( )

() ()

Ejemplo

Un fabricante quiere estimar la variabilidad de los niveles de impurezas de los envos de


materia prima de un determinado proveedor. Extrae para ello una muestra de quince
envos y comprueba que la desviacin estndar muestral en la concentracin de los
niveles de impurezas es de 2,36%. Supngase que la poblacin es normal.

a.- Calcule el intervalo de confianza del 95% para la varianza poblacional.


b.- Sin hacer los clculos, determine si un intervalo de confianza del 99% tendra una
longitud mayor, menor o igual a la del intervalo calculado anteriormente

Solucin

a.- n 15 g.l. 14
0.05

96
Apuntes de clase Estadstica General

( )
( )

() ()

(14)(2,36) (14)(2,36)
2
26,12 5,63

2.99 13.85

Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de
impurezas discurre entre 2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho

Problema VARIANCIA

SE CONOCE LA VARIANZA VARIANZA MUESTRAL


POBLACIONAL 2 2

No importa el tamao de
Muestra grande Muestra pequea
la muestra
n> 30 n< 30

Se utiliza Z
Se utiliza Z Se utiliza t


Z= Z= t=


z= =
z=
2 2 +
2 2
1
+
2 +

1 2 ( ) + ( )
=
+

QUE ES UNA MUESTRA PROBABILISTICA?

MUESTRA PROBABILSTICA.-

97
Apuntes de clase Estadstica General

Muestra que se selecciona de modo que cada integrante de la poblacin en estudio tenga
una probabilidad conocida (no igual a cero) de ser incluido en la muestra

Al utilizar mtodos no probabilstico no todos los integrantes tiene probabilidad de ser


Incluidos en la muestra .En estos casos los resultados pueden estar sesgados, lo que
significa que tales resultados de la muestra pueden no ser representativos de la poblacin.

METODOS DE MUESTREO PROBABILISTICO


MUESTREO ALEATORIO SIMPLE.-
Muestra formulada de manera que cada integrante de la poblacin tenga la misma
probabilidad de quedar incluido.

MUESTREO ALEATORIO SISTEMTICO.-


Los integrantes de la poblacin se ordenan alfabticamente, en un archivo segn la fecha
en que se reciben, o por algn otro mtodo. Se selecciona al azar un punto de inicio y
despus se elija cada K-simo elemento de la poblacin para la muestra.

MUESTREO ALEATORIO ESTRATIFICADO


Una poblacin se divide en subgrupos, denominados estratos y se selecciona una muestra
de cada estrato

MUESTREO POR CONGLOMERADOS:


Se emplea a menudo para reducir el costo de muestrear una poblacin dispersa en un
rea geogrficamente grande.

CALCULO DEL TAMAO DE LA MUESTRA

Cuando se quiere determinar el tamao de una muestra se debo tomar en cuenta los
siguientes factores: el tipo de muestreo, el parmetro a estimar el error muestral admisible,
la variancia poblacional.

Parmetro.- es una medida de resumen que describe una caracterstica de toda una
poblacin
Estadstico.- es una medida de resumen que se calcula para describir una caracterstica
de la muestra

ERROR DE MUESTREO

Diferencia entre un estadstico de muestra y su parmetro de poblacin correspondiente.

NIVEL DE CONFIANZA

Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin


que queremos recoger est distribuida segn una ley de probabilidad

DETERMINACION DEL TAMAO DE MUESTRA PARA POBLACIONES


INFINITAS (MS DE 100 000 INDIVIDUOS)

98
Apuntes de clase Estadstica General

Se pueden presentar dos situaciones:

Para caso de media muestral


n
() ()

Donde:

n = nmero de elementos que debe tener la muestra


= Riesgo o nivel de significacin
Z = Puntuacin de acuerdo a
= Promedio muestral
= Promedio de poblacin
= e = error
Ejemplo
El gerente de personal de una empresa grande desea estimar, con una confianza del 95%,
el tiempo promedio de capacitacin que recibieron los empleados de la compaa y desea
que el error de estimacin no rebase la 0,5 media hora (30 minutos): Con base en
resultados de estudios anteriores, estima que la desviacin estndar del tiempo de
capacitacin de los empleados es de 3 horas .Cual ser el tamao de muestra para el
estudio.

2 2 2 2 1,962 32
n 2
()2
= = 138,30
() 0,52

Cuando se incluye el factor de correccin finita

2 2
n= 2
( 1)+ 2 2

Ejemplo

Un gerente de personal de una empresa que tiene 3 000 empleados desea estimar el
tiempo promedio que les lleva a sus trabajadores trasladarse entre sus casas y la empresa.
Desea construir un intervalo de confianza de 95% y que la estimacin est dentro de un
minuto alrededor de la media verdadera: a travs de una muestra piloto se sabe que la
varianza de los tiempos es de 30 minutos. Determine el tamao de la muestra que se
requiere para la estimacin.

2 2
n=
2 ( 1)+ 2 2

3000(1,96)2 (30)
n= 2 = 111,02
1 (3000 1)+(1,96)2 (30)

Si deseamos estimar una proporcin de una poblacin a partir de una


muestra, puede presentarse dos situaciones
99
Apuntes de clase Estadstica General

a.- Para caso de estimar una proporcin de sujetos que posee una caracterstica a travs
de estudios previos

n
()

Donde:

n = nmero de elementos que debe tener la muestra


= Riesgo o nivel de significacin
Z = Puntuacin de acuerdo a
P = porcentaje estudiado
q = 100 - p
p P = e = error permitido

Ejemplo:

Cuntos sujetos debe tener una muestra si se desea estimar la proporcin de sujetos que
opinan de una determinada manera al nivel de confianza del 99% y un error de estimacin
del 5% sabiendo que p es el 25%?

z2 pq
n
(pP)2

2,962 (25)(75)
= = 657,12 = 658
52

b.- Que desconozcamos la proporcin de sujetos.-En este caso se asume p= 0,50 y

q= 0,50

EJEMPLO:

Qu nmero de sujetos debe tener una muestra si se desea estimar la proporcin de


sujetos que posee una determinada caracterstica al nivel de confianza del 99,7% y error
admitido del 2 %?

z2 pq
n
(pP)2

2,962 (50)(50)
n= = 5476
22

DETERMINACION DEL TAMAO DE MUESTRA PARA POBLACIONES FINITAS


(MENOS DE 100 000 INDIVIDUOS)

Se pueden presentar dos situaciones

100
Apuntes de clase Estadstica General

2
n=
( )2 ( 1) + 2

Donde
N = Es el tamao de la poblacin
= Riesgo o nivel de significancia
Z = Puntuacin correspondiente a
P= Porcentaje estudiado
Q= 100 P
(p P) =e = Error permitido

.Ejemplo

Se desea calcular el nmero de sujetos necesarios para realizar una investigacin en una
provincia en la que 60 000 alumnos terminaron tercero de secundaria. Se establece un
nivel de confianza del 95,44% y el margen de error es del 3% Estudios anteriores indican
que el 50% de los alumnos del tercero de secundaria optan por la Universidad

2
n
( )2 ( 1) + 2

4 50 50 60000
n
9(600001)+4 50 50

n= 1090,93 =1091

Bibliografa:

- Alvarado Pintado Luis y Agurto Meja Hugo. (2009) Estadstica para


Administradores y Economa con aplicaciones en Excel. Editorial San Marcos
E.I.R.L. Per
- Di Rienza Julio Alejandro, Casanoves Fernando, Gonzales Laura Alicia, Tablada
Elena Margot, Diza Mara del Pilar, Robledo Carlos Walter, Balzarini Mnica
Graciela (2008) Estadstica para las ciencias agropecuarias. Sptima edicin.
Argentina
- Toma Inafuko Jorge (2014) Estadstica aplicada segunda parte. Segunda edicin.
Universidad del Pacifico. Lima
- Martnez Bencardino Ciro (2013) Estadstica y Muestreo. Dcima tercera edicin.
Bogot

101

Vous aimerez peut-être aussi