Académique Documents
Professionnel Documents
Culture Documents
MATERIA: ESTADISTICA
ING: ALEJANDRO CASTILLO
INVESTIGACION
UNIDADES III, IV Y V
Contenido
INTRODUCCION................................................................................................................ 4
Distribucin para variables discreta.....................................................................................5
Variable aleatoria............................................................................................. 5
VARIABLES ALEATORIAS DISCRETAS.............................................................................5
VARIABLE ALEATORIA....................................................................................... 6
Funcin de probabilidad y de distribucin (discreta)........................................7
DISTRIBUCIN DE PROBABILIDAD DISCRETA...............................................................7
CALCULO DE MEDIA (valor esperado) Y DESVIACIN ESTNDAR PARA UNA
DISTRIBUCIN DISCRETA................................................................................. 7
Grficos para variables discretas......................................................................................17
Ejemplo........................................................................................................ 18
VARIABLES ALEATORIAS CONTINUAS..........................................................................20
DEFINICION DE MUESTREO..........................................................................................22
Concepto de distribucin de muestreo de la media.......................................24
Distribucin Muestral de Medias....................................................................24
Distribucin muestral de la diferencia entre dos medias con 2. conocida y desconocida.
.......................................................................................................................................... 24
Distribucin Muestral de Diferencia de Medias..............................................24
Introduccin a la calidad total............................................................................................40
Control Estadstico del Proceso........................................................................................41
II.1 Las Siete Herramientas Bsicas de la Calidad..........................................43
II.1.1 Diagrama de Pareto.............................................................................. 43
II.1.2 Diagrama de Causa Efecto....................................................................44
II.1.3 Histogramas.......................................................................................... 44
II.1.4 Diagrama de Dispersin........................................................................45
II.1.5 Estratificacin....................................................................................... 45
2
INTRODUCCION
Una de las reas de la actividad humana en la que la aplicacin de
tcnicas estadsticas ha tenido gran difusin y al mismo tiempo un enorme xito,
3
Una funcin que asocia un nmero real, perfectamente definido, a cada punto muestral.
A veces las variables aleatorias (v.a.) estn ya implcitas en los puntos muestrales.
Los conjuntos pueden ser:
discretos: nmero finito o infinito numerable de elementos.
continuos: nmero infinito no numerable de elementos.
Las v.a. definidas sobre espacios muestrales discretos se llaman v.a. discretas y las
definidas sobre espacios muestrales continuos se llaman continuas.
Una v.a. puede ser continua, aunque nosotros slo podamos acceder a un subconjunto
finito de valores. P.e. la presin arterial es una v.a. continua pero slo podemos acceder a un
conjunto finito de valores por la limitacin de los aparatos de medida.
En general, las medidas dan lugar a v.a. continuas y los conteos a v.a. discretas.
Consideremos el experimento que consiste en elegir al azar 100
sandias de una plantacin y pesarlas. La ley que asocia a cada sanda su peso es
una variable aleatoria (continua).
VARIABLE ALEATORIA
Se dice que hemos definido una variable aleatoria para un experimento
aleatorio cuando hemos asociado un valor numrico a cada resultado del
experimento.
Sea E el espacio muestral asociado a un experimento. Se llama variable
aleatoria a toda aplicacin del espacio muestral E en el conjunto de los nmeros
reales (es decir, asocia a cada elemento de E un nmero real).
Se utilizan letras maysculas X, Y, ... para designar variables aleatorias, y
las respectivas minsculas (x, y, ...) para designar valores concretos de las
mismas.
Si un experimento con espacio muestral E, tiene asociada la variable
aleatoria X, es natural que se planteen preguntas como: Cul es la probabilidad
de que X tome un determinado valor?, esto nos lleva a establecer, por convenio,
la siguiente notacin:
(X=x) representa el suceso "la variable aleatoria X toma el valor x", y
p(X=x) representa la probabilidad de dicho suceso.
(X<x) representa el suceso "la variable aleatoria X toma un valor menor a
x", y
p(X<x) representa la probabilidad de que la v.a. X tome un valor menor a x.
(X x) representa el suceso "la variable aleatoria X toma un valor menor o
igual a x", y
p(X x) representa la probabilidad de que la v.a. X tome un valor menor o igual a
x.
Si una variable aleatoria slo toma valores enteros, es decir, un nmero
finito de valores o infinito numerable diremos que es discreta (los dos primeros
ejemplos). Si tericamente, puede tomar todos los valores de un intervalo de R,
diremos que es continua (los dos ltimos ejemplos).
Funcin de probabilidad y de distribucin (discreta)
Cuando hablamos de la funcin de probabilidad, estamos evaluando la posibilidad de
que una variable aleatoria tome un valor especfico o bien al hablar de una funcin de
distribucin nos referimos al hecho de que una variable aleatoria tom algn valor dentro de un
intervalo (donde una variable aleatoria es una variable continua) pero estos conceptos no
contemplan el hecho de que se requiera conocer la informacin de un valor esperado, valor medio
o esperanza matemtica de una variable aleatoria.
2. p(xi)0 Las probabilidades asociadas a cada uno de los valores que toma
x deben ser mayores o iguales a cero.
E( x ) xi * p( xi )
Donde:
= media de la distribucin
E(x) = valor esperado de x
xi = valores que toma la variable
7
1.
Desviacin estndar. Para determinar la desviacin estndar de la
distribucin discreta se utiliza la siguiente frmula:
( xi ) * p( xi )
Donde:
= desviacin estndar
= media o valor esperado de x
xi = valores que toma la variable x
p(xi) = probabilidad asociada a cada uno de los valores que toma x
Ejemplos:
1.
Segn estadsticas la probabilidad de que el motor de un auto
nuevo, de cierto modelo, y marca sufra de algn desperfecto en los primeros 12
meses de uso es de 0.02, si se prueban tres automviles de esta marca y modelo,
encuentre el nmero esperado de autos que no sufren de algn desperfecto en los
primeros doce meses de uso y su desviacin estndar.
Solucin:
Haciendo uso de un diagrama de rbol, usando las literales siguientes, se
obtiene el espacio muestral como se muestra a continuacin;
N = no sufre de algn desperfecto en el motor los primeros 12 meses de uso
S = sufre de algn desperfecto en el motor los primeros 12 meses de uso
N
S
N
N
S
1er auto
N
S
S
N
2o auto S
3o
p(x=0)=p(SSS)=(0.02)(0.02)(0.02)=0.000008
p(x=1)=p(NSS, SNS, SSN)=(0.98)(0.02)(0.02)+(0.02)(0.98)(0.02)+(0.02)(0.02)
(0.98)=
=0.001176
p(x=2)=p(NNS,NSN,SNN)=(0.98)(0.98)(0.02)+(0.98)(0.02)(0.98)+(0.02)(0.98)
(0.98)==0.057624
p(NNN) = (0.98)(0.98)(0.98) =0.941192
=E(x)
(0.941192)=
xi * p( xi ) (0)(0.000008)+(1)(0.001176)+(2)(0.057624)+(3)
=0.0+0.001176+0.115248+2.823576=2.94 3 autos
desperfecto en el motor en los primeros 12 meses de uso
que
no
sufren
algn
=
2
( xi )* p( xi ) =
=
0.24970.0 autos
que no sufren algn desperfecto en su motor en los primeros 12 meses de uso.
10
Interpretacin:
En este experimento se espera que los 3 autos probados no sufran de algn
desperfecto en su motor en los primeros 12 meses de uso y la variabilidad de este
experimento es de cero.
Nota:
La media y la desviacin estndar se redondean a un valor entero ya que son la
media y desviacin de una distribucin de probabilidad discreta.
1.
Se ha detectado en una lnea de produccin que 1 de cada 10
artculos fabricados es defectuoso; se toman de esa lnea tres artculos uno tras
otro, a) obtenga la distribucin de probabilidad del experimento, b) encuentre el
nmero esperado de artculos defectuosos en esa muestra y su desviacin
estndar.
Solucin:
Tambin haciendo uso de in diagrama de rbol, se obtiene el espacio
muestral
a)
D = objeto defectuoso
N = objeto no defectuoso
=DDD, DDN, DND, DNN, NDD, NDN, NND, NNN
p(x=0)=p(NNN)=(0.9)(0.9(0.9)=0.729
p(x=1)=p(DNN,
(0.1)=0.243
NDN,
NND)=(0.1)(0.9)(0.9)+(0.9)(0.1)(0.9)+(0.9)(0.9)
p(x=2)=p(DDN,
(0.1)=0.027
DND,
NDD)=(0.1)(0.1)(0.9)+(0.1)(0.9)(0.1)+(0.9)(0.1)
p(x=3)=p(DDD)=(0.1)(0.1)(0.1)=0.001
Distribucin de probabilidad
(x)
P
.729
0.
b)
243
.027
xi * p( xi )
.001
(0)(0.729)+(1)(0.243)+(2)(0.027)+(3)(0.001)=
Interpretacin:
Se espera que ninguno de los productos inspeccionados sea defectuoso.
( xi )* p( xi )
2
Interpretacin:
En este experimento se espera que ninguno de los productos inspeccionados
sea defectuoso, pero los resultados de este experimento pueden variar en 1
producto defectuoso, por lo que al inspeccionar los 3 productos el numero de
productos defectuosos puede variar desde 1 producto defectuoso, hasta 1 producto
defectuoso, pero, es posible obtener 1 producto defectuoso?, claro que esto no
puede ocurrir, luego el nmero de productos defectuosos en el experimento variar de
0 a 1 producto defectuoso solamente.
2.
Segn estadsticas, la probabilidad de que un pozo petrolero que se
perfore en cierta regin pueda ser beneficiado es de 0.30. Se perforan tres pozos
en esa regin, encuentre el nmero esperado de pozos que pueden ser
beneficiados y su desviacin estndar.
Solucin:
Se obtiene el espacio muestral , de la misma forma que se ha hecho en los
ejemplos anteriores;
xi * p( xi )
Interpretacin:
Se espera que solo 1 de los tres pozos perforados sea el que pueda ser
beneficiado.
( xi )* p( xi )
2
Interpretacin:
La cantidad esperada de pozos que se pueden beneficiar puede variar en 1 1
pozo, esto es la cantidad de pozos que se pueden beneficiar puede variar de 0 a 2 pozos.
3.
La distribucin de probabilidad de x , el nmero de defectos por
cada 10 metros de una tela sinttica en rollos continuos de ancho uniforme , es
14
p
(x)
0
.41
0
.37
a)
0
.16
0
.05
0
.01
Solucin:
a)
X
(x)
.41
(x)
P
.41
b)
.37
0
.16
0
.78
.05
0
.94
.01
0
.99
1
.0
15
( xi )
Interpretacin:
El nmero de defectos esperado puede variar en 1 defecto, es decir que el
nmero de defectos esperado por cada 10 metros de tela puede variar de 0 a 2.
c)
d)
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de
caras, X, obteniendose los siguientes resultados:
16
17
x
i
n
i
1
n
=8
N
i
1
/8
3
/8
3
/8
1
/8
F
i
1
/8
4
/8
7
/8
8
/8
Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Nmero de
hijos (xi)
1 2 3 4
Frecuencia
s (ni)
1 3 5 3
F.
Absolutas
F.
Relativas
F.
Acumuladas
ni
fi
Ni
0,0
18
83
2
3
12
0,2
50
0,4
16
0,2
50
12
19
Como hemos visto hay variables aleatorias que pueden tomar cualquier
valor de un intervalo real de la forma (a, b), (a, + ), (- , b), (- , + ) o uniones
de ellos. A las variables de este tipo se las denomina variables aleatorias
continuas.
Por ejemplo: Supongamos que vamos a realizar un experimento aleatorio que consiste
en seleccionar una persona y apuntar su peso. Podemos crear una variable aleatoria cuyos valores
20
sean el nmero de kilogramos que pesa la persona observada. En este caso, el rango de valores
posibles se extiende entre los lmites naturales, pero la continuidad de esta variable aleatoria radica
en el carcter continuo de lo que medimos, el peso, es decir, en el hecho de que entre dos valores
posibles se podran obtener infinitos valores intermedios, tambin posibles si utilizramos aparatos
con suficiente precisin. Estos "infinitos" en el interior del rango de la variable es lo que diferencia a
las variables continuas de las discretas.
DEFINICION DE MUESTREO
Aunque la teora que ser desarrollada ms tarde est referida solamente
a muestras aleatorias simples, realizaremos aqu una rpida revisin de posibles
mtodos para la toma de muestras que podemos encontrarnos en la prctica.
Los pasos a seguir para la recoleccin de una muestra son los siguientes:
- Definir la poblacin en estudio especificando las unidades que la componen, el
rea geogrfica donde se realiza el estudio (si procede) y el periodo de tiempo en
el que se realizar el mismo.
- Definir el marco: listado o descripcin de los elementos que forman la poblacin.
- Definir la unidad de muestreo: Ciudades, calles, hogares, individuos, etc.
- Definir las variables a medir o las preguntas que se harn si se trata de una
encuesta.
- Seleccionar el mtodo de muestreo: Probabilstico o No Probabilstico, aunque
son los
primeros los que nos permiten la estimacin correcta de parmetros.
- Calcular el tamao necesario para obtener une determinada precisin en la
estimacin. Este punto se ver con ms detalle en el apartado dedicado a la
estimacin por intervalos.
- Elaborar el plan de muestreo que guiar el trabajo de campo.
En cuanto al tipo de muestreo, algunas de las caractersticas ms importantes de
los muestreos probabilsticos ms usuales se detallan a continuacin:
Muestreo aleatorio simple (mas).
Se trata de un procedimiento de muestreo (sin reemplazamiento), en el que se
seleccionan n unidades de las N en la poblacin, de forma que cualquier posible
21
condiciones necesarias.
Teorema del lmite central.
El Teorema del Lmite Central dice que si tenemos un grupo numeroso de
variables independientes y todas ellas siguen el mismo modelo de distribucin
(cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin
normal.
Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si
lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una
independiente entre si) se distribuye segn una distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables
continuas.
Los parmetros de la distribucin normal son:
Media: n * (media de la variable individual multiplicada por el nmero de
variables independientes)
Varianza: n * (varianza de la variable individual multiplicada por el nmero de
variables individuales)
Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale
cruz
el valor 0. Cada lanzamiento es una variable independiente que se
distribuye segn el modelo de Bernouilli, con media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60
caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto,
segn una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable
normal tipificada equivalente:
(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60
caras es tan slo del 2,28%.
Si se seleccionan muestras aleatorias de n observaciones de una poblacin con
media y desviacin estndar , entonces, cuando n es grande, la distribucin
muestral de medias tendr aproximadamente una distribucin normal con una
media igual a y una desviacin estndar de . La aproximacin ser cada vez ms
exacta a medida de que n sea cada vez mayor.
Ejemplo
Para la dsitribucin muestral de medias del ejercicio pasado, encuentre:
a. El error muestral de cada media
b. La media de los errores muestrales
26
la siguiente manera:
De donde:
p = probabilidad de xito.
q = probabilidad de fracaso.
d = precisin expresada en porcentaje.
En este caso para la estimacin de la varianza, tenemos dos opciones:
a) hacer un premuestreo.
b) asumir varianza mxima.
4.7 Intervalo de confianza para
la diferencia entre dos medias
Estimacin de la Diferencia entre dos Medias
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22,
respectivamente, un estimador puntual de la diferencia entre 1 y 2 est dado por la
estadstica . Por tanto. Para obtener una estimacin puntual de
1- 2, se seleccionan dos muestras aleatorias independientes, una de cada
poblacin, de tamao n1 y n2, se calcula la diferencia , de las medias muestrales.
Recordando a la distribucin muestral de diferencia de medias:
Al despejar de esta ecuacin 1- 2 se tiene:
En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de
muestra sean mayores a 30 se podr utilizar la varianza de la muestra como una
estimacin puntual.
4.8 Una sola muestra: estimacin de la proporcin.
Estimacin de una Proporcin
Un estimador puntual de la proporcin P en un experimento binomial est dado
por la estadstica P=X/N, donde x representa el nmero de xitos en n pruebas.
Por tanto, la proporcin de la muestra p =x/n se utilizar como estimador puntual
del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de
1, se puede establecer un intervalo de confianza para P al considerar la
distribucin muestral de proporciones.
Al despejar P de esta ecuacin nos queda:
En este despeje podemos observar que se necesita el valor del parmetro P y es
precisamente lo que queremos estimar, por lo que lo sustituiremos por la
proporcin de la
38
utilizadas tambin en otros entornos, como puede ser por ejemplo en la monitorizacin de
fallos en operaciones quirrgicas, y su campo de aplicacin est limitado tan slo por
nuestra imaginacin, ya que cualquier actividad humana es susceptible de ser
cuantificada y por tanto monitorizada para mejorar su calidad, desde el tiempo de espera
de un paciente que acude a consulta, hasta el porcentaje de pacientes que cumplen
adecuadamente el tratamiento prescrito, o el mismo registro de datos en la historia clnica
del paciente.
Un elemento fundamental en la filosofa del control de calidad moderno es la
utilizacin generalizada de procedimientos cientficos, incluidos los mtodos estadsticos,
en la planificacin, recogida de datos y anlisis de los mismos, de tal forma que las
decisiones no se sustenten en meras conjeturas.
Aunque en un sistema sanitario fundamentalmente pblico, como es el espaol,
la competencia no constituye el principal acicate para la incorporacin de sistemas de
control de calidad, no cabe ninguna duda de que sin embargo existen mltiples razones
para incorporar estas tcnicas en la gestin de los servicios de atencin sanitaria, como lo
corrobora el hecho del aumento de su difusin y aplicacin en este entorno, razones en
las que de momento no vamos a entrar, por ser la lnea argumental de estos artculos
fundamentalmente estadstica.
mayora de los problemas que se pudiesen encontrar en una empresa, para los
dems mtodos sera recomendable consultar textos especializados en ellos.
Las Herramientas, tanto las siete bsicas como las siete nuevas,
proporcionan una amplia gama de armas para el control de la calidad. Estas
herramientas son aplicables por igual tanto a procesos de fabricacin como a los
orientados al servicio. Algunas de estas herramientas son muy simples en cuanto
a su uso, pero proporcionan datos de valor incalculable para toma de decisiones
relacionadas con la calidad. Como resultado de su uso, las herramientas
proporcionan una base para los procesos de mejora de calidad.
II.1 Las Siete Herramientas Bsicas de la Calidad
II.1.1 Diagrama de Pareto
El Diagrama de pareto es una grfica en donde se organizan diversas
clasificaciones de datos por orden descendente, de izquierda a derecha por medio
de barras sencillas despus de haber reunido los datos para calificar las causas.
De modo que se pueda asignar un orden de prioridades.
Mediante el Diagrama de pareto se pueden detectar los problemas que
tienen ms relevancia mediante la aplicacin del principio de Pareto (pocos vitales,
muchos triviales) que dice que hay muchos problemas sin importancia frente a
solo unos graves. Ya que por lo general, el 80% de los resultados totales se
originan en el 20% de los elementos.
La minora vital aparece a la izquierda de la grafica y la mayora til a la
derecha. Hay veces que es necesario combinar elementos de la mayora til en
una sola clasificacin denominada otros, la cual siempre deber ser colocada en el
extremo derecho. La escala vertical es para el costo en unidades monetarias,
frecuencia o porcentaje.
La grfica es muy til al permitir identificar visualmente en una sola
revisin tales minoras de caractersticas vitales a las que es importante prestar
atencin y de esta manera utilizar todos los recursos necesarios para llevar acabo
una accin correctiva sin malgastar esfuerzos.
Algunos ejemplos de tales minoras vitales seran:
ventas.
42
un proceso.
Mquina (machine)
Material (material)
Mtodo (meted)
II.1.3 Histogramas
Presentacin de datos en forma ordenada con el fin de determinar la
frecuencia con que algo ocurre.
El Histograma muestra grficamente la capacidad de un proceso, y si as
se desea, la relacin que guarda tal proceso con las especificaciones y las
normas. Tambin da una idea de la magnitud de la poblacin y muestra las
discontinuidades que se producen en los datos.
II.1.4 Diagrama de Dispersin
Un Diagrama de Dispersin es la forma mas sencilla de definir si existe o
no una relacin causa efecto entre dos variables y que tan firme es esta relacin,
como estatura y peso. Una aumenta al mismo tiempo con la otra.
El Diagrama de Dispersin es de gran utilidad para la solucin de
problemas de la calidad en un proceso y producto, ya que nos sirve para
comprobar que causas (factores) estn influyendo o perturbando la dispersin de
una caracterstica de calidad o variable del proceso a controlar.
Los motivos mas comunes de este tipo de diagrama son analizar:
Grficos de medias X
Grficos de rangos R
Grficos de medianas X
Grficos de individuos X
47
49
50