Vous êtes sur la page 1sur 95

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA

INGENIERA EN INDUSTRIAS FORESTALES

HERRAMIENTAS ESTADISTICAS PARA


EL CONTROL DE PROCESOS

IIN
NG
G.. E
ED
DU
UA
AR
RD
DO
OD
DIIA
AZZ

LLIIC
C .. D
DA
AN
NIIE
ELL R
RU
UIIZZ

CONTENIDO

Pag

INTRODUCCION

CAPITULO I

CONTROL DE CALIDAD

Objetivos

Introduccin

Conceptos de calidad

Control de calidad

Principios del Control de Calidad

Funciones del Control de Calidad

Costos de Calidad
CAPITULO II

10
15

MEJORAMIENTO CONTINUO E INNOVACIN

15

Investigaciones estadsticas

16

La Estadstica en lo Analtico y en lo Enumerativo

17

Elementos Bsicos sobre Variacin

19

Clasificacin de Procesos

22

El experimento de Deming

27

CAPITULO III.
LA TEORIA MUESTRAL
Necesidad de Muestreo
Tipos de Muestreo
Distribuciones Muestrales
1. Distribucin muestral de medias
2. Distribucin muestral para la diferencia de medias
3. Distribucin muestral de proporciones y diferencias
4. Distribucin muestral de varianzas
Tamao de la muestra

35
35
36
37
40
41
47
51
54
56

CAPITULO IV
CONTROL ESTADISTICO DEL PROCESO
Objetivos
Introduccin
Mtodos Estadsticos
Cartas de control
Diagrama Causa-Efecto
Diagrama de Pareto
Grfico de corridas
Histogramas de Frecuencia
Anlisis de Regresin

61
61
61
62
62
64
75
76
79
80
81

Ajustes de Curvas
BIBLIOGRAFIA

94

INTRODUCCION

El presente trabajo representa un breve, general e introductorio tratado


sobre herramientas estadsticas aplicables al control de procesos, como un
material de apoyo dirigido a los gerentes.
Es de hacer notar que este papel de trabajo est sujeto a revisin y que
cualquier sugerencia al respecto ser muy bien aceptada.
As mismo, es conveniente sealar que los autores no pretenden reclamar
la autora de algunos trabajos a los cuales se hace referencia, dado que los
mismos son productos de congresos, seminarios, lecturas, cursos y de su
experiencia profesional. De esta forma, lo original de este escrito consiste en
haberlos recopilados y en presentarlos de una forma resumida como una gua de
estudio.
Este texto difiere de las publicaciones comunes de estadstica y/o control de
calidad porque su principal propsito es, adems de conceptualizar el control de
calidad, mostrar cmo aplicar la teora estadstica a problemas derivados de la
experiencia del campo laboral. La estadstica descriptiva, per s no resuelve los
problemas de produccin y los mtodos

estadsticos son herramientas que

ayudan a mejorar el proceso, dando objetividad a las observaciones y no serviran


si no son utilizados apropiadamente. De esta forma, se dar mayor importancia a
los hechos que a los conceptos abstractos, utilizando

cifras derivadas de

observaciones reales, aceptando como confiable la informacin proveniente de la


distribucin normal hacia la cual tiende las observaciones cuando son grandes.

Los mtodos estadsticos constituyen un medio efectivo para controlar la


calidad en el proceso de produccin; sin embargo, "lo importante no es el
conocimiento de los mtodos estadsticos sino ms bien la actitud mental hacia su
utilizacin",(Kume, 1992; p.9)).

CAPITULO I.
EL CONTROL DE LA CALIDAD

OBJETIVOS:
Conocer los conceptos bsicos aplicados en el control de calidad y
familiarizar al lector con los principios, funciones y los costos que la calidad
implica.

INTRODUCCIN:
La finalidad de todo proceso industrial es la reproduccin del prototipo de un
producto. Cuando el producto est bien diseado y se fabrica cumpliendo las
normas establecidas, el mismo llenar las expectativas para el cual fue elaborado
y para el usuario. En consecuencia, se hace necesario que todos los productos se
fabriquen ajustados a las normas, el control de calidad interviene para asegurar el
fiel cumplimiento de estas normas por el producto.
Lgicamente no hay dos productos iguales, por lo que la calidad vara
continuamente, dependiendo del nivel de refinamiento tcnico alcanzado.
Puesto que la calidad es variable, va en contraposicin a la uniformidad y
en la prctica esta situacin se obvia llegando a la transaccin entre ambos,
estableciendo

lmites

para

definir

las

variaciones

con

respecto

las

especificaciones cualitativas permisibles y tolerables en el producto final, sin


desmedro del principio de normalizacin.

Sin embargo existen elementos perturbadores que impiden que la


produccin se ajuste lo mejor posible a las especificaciones cualitativas, tales
como:
1.- Irregularidad en las mquinas
2.- Imprecisiones humanas
3.- Errores de los instrumentos de control
4.- Condiciones ambientales
5.- Otros
La desviacin cualitativa del producto representa un aumento de los costos
puesto que implica un gasto extra de materia prima o de tiempo y trabajos para
realizar las correcciones de los defectos del producto acabado.
Este aumento de los costos de produccin sumados a los retrasos de la
produccin, la disminucin del prestigio de la empresa, etc. son hechos graves
como para

no estudiarlos atentamente y buscar las medidas correctivas

necesarias.

El diseo de este trabajo bibliogrfico va orientado a proporcionar los


conocimientos mnimos necesarios que permitan comprender las tcnicas
estadsticas, metodologa e interpretacin y anlisis de resultados. Para ello es
necesario basarse en fundamentos de estadsticas matemticas, as como en
matemticas avanzadas; sin embargo, la mayora de las aplicaciones descritas
slo requieren de conocimientos aritmticos.

2.-

CONCEPTO DE CALIDAD

Calidad es la aptitud de un producto para satisfacer una necesidad al menor


costo posible.

La calidad de un producto implica dos aspectos fundamentales:


a.

Calidad del Diseo:

Es el grado de concordancia entre el diseo y el fin para el cual fue creado;


en la medida que las caractersticas previstas, los materiales y las formas
concebidas por el diseador cumplen con las necesidades del usuario.

b.

Calidad del Producto:

Es el grado de concordancia entre el producto y sus especificaciones.


Siendo el grado en el que el proceso de manufactura y mano de obra han
reproducido el producto lo ms cercano del diseo original.

3.-

CONTROL DE CALIDAD:

Es el proceso mediante el cual se miden las caractersticas de un producto,


se comparan los valores con las normas establecidas y se adoptan las medidas
correctivas convenientes cuando no se ajustan a las normas.

La definicin previa de Calidad tiene varias implicaciones y una de ellas es


que con el slo control estadstico no es posible alcanzar la satisfaccin del
consumidor, por lo tanto para alcanzar esta calidad se requiere adems:
1.

Una adecuada investigacin de mercado (calidad de investigacin del


mercado).

2.

Un producto con un diseo acorde (calidad de diseo).

3.

Un producto fiel al diseo del prototipo (calidad de fabricacin o


concordancia).

4.

Un producto al alcance del consumidor oportunamente (calidad de


distribucin).

5.

Un producto con adecuados componentes de reemplazo (calidad de


servicio).
De esta forma la calidad es una resultante de todos estos elementos

mencionados, que para ser alcanzada requiere de un control total de la calidad.


Entre estos controles se pueden establecer (ver figura 1):
Control Dinmico de la Calidad:
Realizado estrictamente sobre el proceso de fabricacin.
Control Esttico de la Calidad:
Aplicado a los productos semi-elaborados y productos terminados.

ENTRADA
MATERIA
PRIMA

PROCESO DE
FABRICACION

CONTROL
DINAMICO

CONTROL
ESTATICO

FIGURA 1.
GRAFICO DE LOS TIPOS DE CONTROL

PRODUCTO
FINAL

PRINCIPIOS DEL CONTROL DE CALIDAD


1. Con el control de calidad no se obtiene calidad del producto; sta es una
caracterstica inherente al producto mismo. Esto es evidente, para
obtener un buen nivel de calidad hay que fabricarlo puesto que el control
de calidad no agrega calidad a los productos.
2. El equipo productor es el responsable directo de la calidad del producto
de acuerdo a las directrices que el control de calidad establece.
3. No resuelve problemas de fabricacin, slo da las razones para
estudiarlos. Es muy importante que el equipo productor sepa qu
problemas existen y en qu sentido se manifiestan para lograr un buen
nivel de calidad en la fabricacin.
4. Las decisiones deben tomarse sobre la base de datos reales, la
confiabilidad de los datos registrados es el punto inicial para todo
anlisis e interpretacin de resultado.
5. Los datos deben ser compatibles y estar dispuestos de manera tal, que
permitan su anlisis. Esto permitir el empleo de algunas herramientas
estadsticas de las cuales el control de calidad hace uso.
6. El control de calidad debe ser activo, debe prevenir la ocurrencia de
errores o defectos, mantener regulados y bajo control los procesos,
evitar el desperdicio, el reproceso, las devoluciones y tomar las medidas
correctivas oportunamente.

FUNCIONES DEL CONTROL DE CALIDAD:


Antes de iniciar la fabricacin de un producto, se requiere fijar las
especificaciones de lo que se va a hacer. Despus, viene la manufactura real de
este producto y finalmente la comprobacin para verificar si est de acuerdo con
lo especificado. Al pensar en todos los puntos relacionados con la calidad es
conveniente hacerlo en trmino de estas tres funciones: Especificacin,
fabricacin e inspeccin.
El control de calidad estadstico debe ser considerado como un grupo de
herramientas, que pueden influir en las decisiones relacionadas con estas
funciones. Mientras ms personas existan en cargos de supervisin de inspeccin,
de supervisin de produccin, de ingeniera de mtodos, de ingeniera de diseo y
de nivel gerencial, que comprendan los principios bsicos de control de calidad
estadstico, mayor ser la probabilidad de emplear efectivamente estas tcnicas
en una organizacin.
Entre las funciones bsicas del control de calidad relacionadas con las
funciones de especificar, fabricar e inspeccionar un producto tenemos:
1. Intervenir en la estipulacin de

la calidad de diseo mediante la

realizacin de normas de control, preparacin de prescripciones etc.


Esta no es una funcin exclusiva de control de calidad, pues intervienen
otros departamentos, pero jams debe realizarse un diseo sin la
intervencin del departamento de control de calidad.
2. Ejercer el control dinmico de la calidad mediante el control durante el
proceso de fabricacin, con el propsito de obtener productos de
acuerdo al diseo, evitando la fabricacin de piezas defectuosas.

3. Ejercer el control esttico de la calidad mediante el establecimiento del


control de entrada y de salida con el propsito de vigilar el producto
terminado o la materia prima para otros sectores de la planta.

TAREAS ESPECIFICAS DE UN PROGRAMA DE CONTROL DE CALIDAD


A continuacin figuran tareas especficas que pueden cumplirse como parte
de un programa de control de calidad.
a. Determinar las condiciones que deben cumplir los diseos, los proyectos
y las especificaciones para satisfacer las normas de calidad y a su vez
verificar que se cumplan los procedimientos establecidos.
b. Planificar las herramientas, los instrumentos de medicin y el equipo de
control necesario para medir las caractersticas del producto. As mismo
verificar que los instrumentos de medicin estn calibrados.
c. Establecer procedimientos de control de calidad, basados en la
estadstica sobre las operaciones de fabricacin, as como

para las

piezas, materiales y muestreos de recepcin.


d. Crear un sistema para inscribir en un registro los defectos en materia de
calidad y para inscribir datos sobre seguimiento de las medidas
correctoras adoptadas, igualmente recoger las informaciones que
puedan proporcionar mejoras al proceso de fabricacin.
e. Proporcionar formacin para el personal de inspeccin, de pruebas, etc.
f. Establecer los costos de control de calidad.

COSTOS DE CALIDAD
Cada uno de los departamentos de una organizacin debe ser capaz de
justificar su existencia midiendo sus costos y comparndolos con la contribucin
que aporta al cumplimiento de los objetivos de la compaa y a la obtencin de
beneficios. El departamento de control de calidad no es una excepcin. Por
consiguiente, es importante determinar el costo general del control de calidad.
Mejorar el nivel de calidad de un producto hace que el costo de produccin
del mismo se eleve, lgicamente se convierte en un aspecto que debe ser
estudiado detenidamente. En la prctica siempre hay un nivel de rechazos ptimo
para un proceso dado, por lo que carece de sentido esforzarse por reducir los
rechazos. Por lo tanto la calidad de un producto debe ser controlada a una
tolerancia dada y para cierto nivel de rechazos, para obtener la relacin de
compromiso requerida, pretender mejorar la calidad ms all de este nivel es,
hacer la produccin anti-econmica. El costo total del control de calidad bien
puede ser analizado o determinado, agrupando los costos en cuatro categoras
(ver figura 2)
.

CATEGORIAS
DE COSTOS
DE CALIDAD

COSTO
DE
PREVENCION

COSTO
DE
EVALUACION

DEFECTOS
DENTRO
DE LA
ORGANIZACION

Figura 2: CATEGORIAS DE COSTOS DE CALIDAD

DEFECTOS
FUERA
DE LA
ORGANIZACION

1.

Prevencin.- Los costos de prevencin son los de planificacin y

aplicacin del programa de calidad antes de la fabricacin del producto. A


continuacin se dan ejemplos de tareas que pueden clasificarse como de
prevencin de defectos.
a) Revisin del diseo.
b) Programas de formacin y titularizacin de trabajadores.
c) Calificacin de proveedores antes de la subcontratacin.
d) Medios mecnicos para el control de calidad, incluido el diseo de
equipos y herramientas especiales.
e) Control de los procesos para asegurar que los procesos de fabricacin
corresponden a las tolerancias establecidas para el producto.
2. Costo de evaluacin. Los costos de evaluacin son los gastos en que
se incurre para medir la conformidad del producto con las normas; incluidas las
inspecciones y pruebas.
A continuacin se dan ejemplos de tareas cuyo costo puede incluirse en
esta categora:
a)

Inspeccin y prueba de las piezas y materiales suministrados por

proveedores.
b)

Inspeccin y prueba de materiales, piezas, montajes parciales o

productos completos fabricados en la empresa.


c)

Costo de los productos destruidos o daados para realizar pruebas

que destruyen en material o determinan su perodo de vida.

d)

Calibracin y conservacin de instrumentos y equipos de medicin.

e)

Compilacin, registro y comunicacin de datos sobre cuestiones de

calidad.
3. Defectos dentro de la organizacin.- Los defectos dentro de la
organizacin son aquellos que se producen antes de la expedicin (o mientras el
producto sigue perteneciendo a la compaa productora). Estos costos son el
resultado de productos defectuosos (productos que no cumplen las normas).
Entran en esta categora los costos siguientes:
a) Sustitucin de piezas defectuosas.
b) Costos de reparacin.
c) Costos de recepcin y trmite de las quejas.
d) Responsabilidad del fabricante por los peligros que puede suponer el
producto, generalmente en forma de litigios o costo del seguro de
responsabilidad civil.
e) Prdida de pedidos futuros o dao para la reputacin de la empresa por
los defectos comprados por los clientes.
4.-Defectos fuera de la organizacin: Se incluyen en esta categora los
costos relacionados con los defectos que se revelan una vez que el producto es
propiedad del cliente. Se incluyen los siguientes costos:
a) Sustitucin de piezas defectuosas.
b) Costos de reparacin.
c) Costos de recepcin y trmites de reclamos.
d) Costos legales y/o seguros.
e) Prdida de futuros pedidos y daos a la reputacin de la empresa.

Los costos de prevencin y evaluacin constituyen los costos directos del


control de calidad. Por otra parte tenemos a los costos por defectos, tanto dentro
como fuera de la organizacin, que seran los costos indirectos. (ver figura 3). A
medida que los costos directos se reducen, aumenta el nmero de defectos y a
medida que aumenta el nivel de stos, aumenta el costo por defectos.
Los costos totales del control de calidad son la suma de los costos directos
y de los costos por defectos o costos indirectos. En el valor mnimo de la curva de
costos totales, se sita la combinacin ptima de esfuerzos.

COSTOS POR CONCEPTO


DE CALIDAD

COSTOS TOTALES

COSTOS
INDIRECTOS

COSTOS DIRECTOS

AUMENTO DE DEFECTOS
NIVEL DE DEFECTOS DEL PRODUCTO

FIGURA 3. INCIDENCIA DE LOS COSTOS SOBRE LA CALIDAD.

El control de la calidad debe efectuarse sin perder de vista los costos que
implica y los beneficios que de su aplicacin se deriven. Generalmente el control
total de la calidad conduce a una reduccin paulatina de los costos totales de la
calidad en una empresa haciendo nfasis en la prevencin de la ocurrencia de
defectos ms que en cualquier otro caso.
Los costos de prevencin representan el 5% del costo total de la calidad, en
contraste con los costos por fallas, los cuales alcanzan

entre el 70 y 80%

aproximadamente. Los costos de inspeccin representan entre el 15 y 25%.

CAPITULO II
CALIDAD TOTAL.
MEJORAMIENTO CONTINUO E INNOVACIN
El quinto de los 14 postulados de Deming, tambin conocido como el padre
del concepto de calidad total, aboga por la mejora constante y continua de todos
los procesos de planificacin, produccin y servicio. El mejoramiento continuo
disminuye el desperdicio, disminuye costos y aumenta la productividad y crea
condiciones para el disfrute del trabajo.
Mejorar continuamente e innovar en las organizaciones de las que
formamos parte, es contribuir a la construccin de un mundo mejor.
ESTADISTICA SEGN FEDERER (1973).

Es la ciencia que se ocupa de la caracterizacin, el desarrollo y la


aplicacin de tcnicas para:
1. El diseo estadstico de una investigacin, bien sea un experimento
comparativo, una encuesta por muestreo, un estudio de observacin o
un estudio de construccin de un modelo estocstico.
2. El resumen de los hechos de investigacin
3. Las inferencias que se pueden formular a partir de los hechos de la
investigacin, sobre la poblacin bajo estudio.

INVESTIGACIONES ESTADSTICAS.

Los estudios estadsticos de carcter emprico se pueden clasificar de


acuerdo a la finalidad que persiguen en dos tipos:
Estudios Enumerativos: Aquellos en los cuales se estudia un marco
especfico con la finalidad de actuar sobre los elementos que lo conforman.
(Inferencia Estadstica).
Estudios Analticos: Aquellos en los cuales el objetivo es actuar sobre el
sistema de causas o proceso que produjo los elementos del marco estudiado.
(Diseo Estadstico).
La figura que se presenta en la pgina siguiente ilustra este proceso

UNIVERSO
MARCO
Unidad

Caractersticas

nos interesamos en

X, Y, . . ., Z

SISTEMA DE CAUSAS
Cuya medicin u
observacin genera:

Poblacin de valores
Observados o medidos
De la caracterstica

...

Poblacin
Multivariante

Y
...

(X,Y,...,Z)
Z

Procesos y caractersticas de calidad.

SISTEMA

Red interdependiente de componentes que actan


conjuntamente para lograr el fin del sistema
Actividad de la organizacin
Donde se identifican:
1) Entradas

Proceso
A

2) Actividades de
transformacin y
3) Salidas

Proceso B
Caracterstica X
.
.
Caracterstica Z

Proceso
K

Propiedades de las entradas, actividades de transformacin


y salidas que otorgan a estas carcter distintivo

Esquema de un proceso.
E (entradas)
Personas
Mtodos
Ambiente
Equipos
Servicios
Materiales

Proceso
P

S (Salidas)
Personas
Mtodos
Ambiente
Equipos
Servicios
Materiales

VARIACION.
Fenmeno que se manifiesta en la incapacidad de un sistema, proceso,
persona, etc. para reproducir exactamente un comportamiento dado, an bajo
condiciones aparentemente semejantes.
ELEMENTOS BASICOS SOBRE VARIACION. ( Joiner & Gaudard).

La variacin es causal

Hay distintos tipos de variacin

La eliminacin o atenuacin de cada tipo de causa demanda de acciones


radicalmente distintas

Un sistema es estable cuando solo obedece a causas comunes

La cantidad de variacin se puede medir estadsticamente

Causas comunes:

Multitud de factores que siempre estn presentes y que contribuyen en


diversos grados a cambios pequeos y aparentemente aleatorios en el
resultado de un proceso.

Su agregacin resulta en lo que podemos denominar la variacin del


sistema.

Causas especiales:

Factores que actan espordicamente sobre el sistema agregando


variacin adicional sobre la variacin del sistema.

Manifestaciones extremas

Causas asignables.

Causas distintas requieren acciones Distintas.

Asunto crtico

La diferencia ms importante es entre causas comunes y causas especiales

Estrategia para eliminar causas especiales:

Obtener datos oportunos

Prestar atencin a seales de posibles causas especiales

Investigar su origen

Tomar previsiones para que lo malo no recurra

Tomar previsiones para que lo bueno siga ocurriendo

Estrategia para mejorar un sistema de causas comunes:

Todos los datos son importantes

Conocimiento ntimo del sistema

Interferencias Innecesarias.

Ajustes innecesarios efectuados para compensar o corregir la variacin


del sistema y que agregan ms variacin. (ver experimento de Deming).

Exacerbar en lugar de mejorar

Tratar todo como si fuera el resultado de causas especiales (querer explicar


todo)

Errores comunes:

Examinar las ltimas cifras

Suponer que todo lo bueno o malo se debe a la actuacin de las personas


Los grficos y figuras que se muestran a continuacin ilustran estos

procedimientos:

OTRA VISUALIZACIN DEL MEJORAMIENTO


NIVEL Y / O VARIABILIDAD

CLASIFICACION DE PROCESOS

1. Estado Ideal. Proceso bajo control Estadstico y Produccin conforme al


100%.

2. Estado de Caos. Proceso fuera de control Estadstico y Produccin


conforme menor del 100%.

4. Prximo al Estado del Caos. Proceso fuera del Control Estadstico y


produccin conforme al 100%

5. Prximo al Estado Ideal. Proceso bajo control Estadstico y produccin


Conforme menor del 100%.

Experimento de Deming.

Una funcin de los mtodos estadsticos es la de disear


experimentos y utilizar la experiencia relevante de forma que
resulte

eficaz. Cualquier intento de utilizar la experiencia

relevante sin un plan que se base en la teora, es disfrazar la


racionalizacin de una decisin que ya ha sido tomada.1

EXPERIMENTO DE SIMULACIN

Zk
0
Blanco

Deming. Fuera de la crisis. 1984. p. 312

Posicin de la esfera,
resultante en el lanzamiento
K esimo

Reglas para ajustar el embudo.


Se pretende que al dejar caer la esfera a travs del embudo, coincida
con el blanco

Regla No. 1.- Mantener el embudo fijo apuntando al blanco en


todos los lanzamientos.
Regla No. 2.- Desplazar el embudo a una distancia z k de su
ltima posicin para el lanzamiento (k + 1).
Regla No. 3.- Desplazar el embudo a una distancia z k del
blanco para el lanzamiento (k + 1) simo.
Regla No. 4.- Colocar el embudo sobre la posicin que ocup
La esfera en el ltimo lanzamiento.

En las prximas pginas se observa el efecto grficamente.

CAPITULO III.
TEORIA MUESTRAL

La teora de muestreo se refiere al estudio de las relaciones que existen


entre un colectivo o poblacin y las muestras que se extraen de las mismas. El
estudio de las muestras permite hacer estimaciones de caractersticas
desconocidas de la poblacin (tales como media, desviacin tpica, proporciones,
etc). Estas estimaciones se hacen a partir del conocimiento de las caractersticas
de las muestras (media, desviacin tpica, proporcin, etc).
Las caractersticas o medidas obtenidas de una muestra se llaman
estadsticos; y las medidas correspondientes a la poblacin parmetros. Cuando
una medida muestral o estadstico es utilizada como representante de una
caracterstica poblacional o parmetro se denomina estimador.
Ventajas de la utilizacin de las muestras
1) El costo es menor y se puede obtener un mejor rendimiento del dinero
invertido.
2) Se obtiene una disminucin notable del tiempo necesario para alcanzar la
informacin
Cuando una muestra posee 30 o ms datos se denomina grandes muestras y
si la muestra tiene menos de 30 observaciones se denomina pequeas
muestras.

Se denomina muestreo al procedimiento utilizado para elegir una muestra

Necesidad del Muestreo.


1. Poblacin Infinita
2. Poblacin uniforme
3. Proceso de investigacin destructiva
4. Economa de costos
5. Calidad
Muestreo con o sin reemplazamiento:

Con reemplazamiento cuando un elemento de la poblacin puede ser


escogido varias veces para formar parte de la muestra

Sin reemplazamiento cuando un elemento de la poblacin solo puede


ser seleccionado una sola vez para formar parte de la muestra.
Poblacin: es una coleccin de todos los elementos que estamos

estudiando y acerca de los cuales se intenta extraer conclusiones. Puede ser


infinita o finita.
Muestra: Una parte de la poblacin o un subconjunto del conjunto de
unidades obtenidas con el objeto de investigar las propiedades de la poblacin.
Muestreo estadstico: Es un enfoque sistemtico para seleccionar unos
cuantos elementos (una muestra) de un grupo de datos (poblacin) a fin de
hacer algunas inferencias sobre el grupo total. Desde el punto de vista
matemtico, podemos describir las muestras y las poblaciones

mediante

medidas como la media, la moda, la desviacin estndar, etc. No es mas que


el procedimiento a travs del cual se obtienen las muestras.

Tipos de muestreo
Muestreo de juicio o no probabilstico. (opintico). Se basa en el
conocimiento de la poblacin por parte de alguien, quien hace a la muestra
representativa, dependiendo de su intencin, por lo tanto es subjetiva.
Probabilstico (Errtico): Todos los elementos de la poblacin tienen la
posibilidad de pertenecer a la muestra.
Muestreo Aleatorio:
1.

Muestreo aleatorio simple

2.

Muestreo Sistemtico.

3.

Muestreo Estratificado

4.

Muestreo por Conglomerado

Muestreo de juicio: A travs

del conocimiento y la opinin personal,

basada en la experiencia del investigador, se identifican los elementos de la


poblacin que van a formar parte de la muestra. Una muestra seleccionada por
muestreo de juicio

se basa en el conocimiento de la poblacin por parte de

alguien. Por ejemplo, un guardabosques tomar una muestra de juicio si decide


con antelacin que parte de una gran zona reforestada deber recorrer para
estimar el total de metros de madera que pueden cortarse. En ocasiones el
muestreo de juicio sirve de muestra piloto para decidir cmo seleccionar despus
una muestra aleatoria.
Muestreo aleatorio: Cuando se conoce la

probabilidad de que un

elemento de la poblacin figure o no en la muestra, puede ser:

Muestreo Aleatorio Simple (Irrestrictamente Aleatorio):


Un muestreo es aleatorio cuando cada elemento de la poblacin tiene la
misma probabilidad de ser escogido para formar parte de la muestra. Este tipo de
muestreo evita que la muestra sea sesgada evitando por lo tanto que se realice
una mala inferencia estadstica. Por ejemplo, supngase que un investigador
quiera estimar

el mdulo de ruptura promedio

de un material determinado

formado por una poblacin de tamao


N = 500; por ser ensayos destructivos este quiere seleccionar una muestra
de tamao
n = 10 que le permita realizar la inferencia, ahora bien el criterio que us el
investigador para seleccionar dicha muestra fue el de tomar 10 materiales
que estaban ms prximos a l; evidentemente esta muestra no es
representativa de la poblacin, se dice que esta sesgada, por lo que la
inferencia estadstica que se realice ser errnea. Por lo tanto, una muestra
se dice que esta sesgada cuando los elementos seleccionados tenan
mayor probabilidad de pertenecer a la misma.
La forma ms fcil de realizarlo es usando nmeros aleatorios, para esto se
puede recurrir a una tabla o a un generador de nmeros aleatorios. Actualmente,
se recurre a computadora.
Muestreo Sistemtico o Secuencial.
Los elementos se seleccionan de la poblacin con un intervalo uniforme en
el tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere
estudiar una determinada caracterstica de un producto fabricado en serie y se
decide seleccionar a cada veinte producto hasta formar la muestra, para esto se
escoge un punto aleatorio de arranque en los primeros veinte productos y luego se
escoge cada vigsimo producto hasta completar la muestra. Una de las ventajas
de este muestreo es cuando los elementos presentan un patrn secuencial, tal vez

requiera menos tiempo y algunas veces cuesta menos que el mtodo de muestreo
aleatorio.
Muestreo Estratificado.
Para aplicar el muestreo estratificado, se divide la poblacin en grupos
homogneos, llamados estratos, los cuales son hetergeneos entre si. Despus
se recurre a uno de dos mtodos posibles:
a)

Se selecciona al azar en cada estrato un nmero especificado

de elementos correspondientes a la proporcin del estrato de la poblacin


total
b)

Se extrae al azar un nmero igual de elementos de cada

estrato y damos un peso a los resultados de acuerdo a la proporcin del


estrato en la poblacin total
El muestreo estratificado es adecuado cuando la poblacin ya est dividida
en grupos de diferentes tamaos y queremos reconocer este hecho. La ventaja de
las muestras estratificadas, es que cuando se disean bien, reflejan ms
exactamente las caractersticas de la poblacin de donde se extrajeron que otras
clases de muestreo.
Muestreo por Conglomerado.
En el muestreo por conglomerados, se divide la poblacin en grupos o
conglomerados de elementos heterogneos, pero homogneos con respecto a los
grupos entre si. Un procedimiento bien diseado, de muestreo por conglomerados,
puede producir una muestra ms precisa a un costo mucho menor que el de un
simple muestreo aleatorio. Se usa el muestreo estratificado cuando cada grupo
presenta una pequea variacin en su interior, pero existe una amplia variacin
entre ellos. Se usa el muestreo por conglomerado en el caso contrario, cuando

hay considerable variacin dentro de cada grupo pero los grupos son
esencialmente semejantes entre s.
DISTRIBUCIONES MUESTRALES
1 Distribucin muestral de medias
2 Distribucin muestral para diferencias de medias
3 Distribucin muestral de proporciones y diferencias
4 Distribucin muestral de varianzas
Se define la distribucin muestral de un estadstico (distribucin de
muestreo) en una poblacin, como la distribucin de probabilidad de todos los
posibles valores que un estadstico puede asumir para cierto tamao de la
muestra. Especficamente, se trabajar con las distribuciones muestrales para:
medias, proporciones y varianzas.
Una distribucin muestral es una distribucin de probabilidad de un
estadstico muestral calculado a partir de todas las muestras posibles de tamao
n, elegidas al azar en una poblacin determinada. Si la poblacin es infinita,
tenemos que concebir la distribucin muestral como una distribucin muestral
terica, ya que es imposible sacar todas las muestras aleatorias posibles de
tamao n de una poblacin infinita. Si la poblacin es finita y moderada se puede
construir una distribucin muestral experimental, sacando todas las muestras
posibles de un tamao dado, calculando para cada muestra el valor del estadstico
que nos interesa. Ejemplo, supongamos que se tiene una poblacin de tamao N
= 10 y queremos extraer con reemplazamiento todas las muestras posibles de
tamao n = 5, para esto se utiliza la relacin Nn , es decir,
105 = 100000 muestras de tamao n = 5.

En cambio, si el muestreo es sin reemplazamiento, el nmero de muestras de


tamao n = 5 viene dado por la combinatoria:

N
N!
10!
10.9.8.7.6.5!
=
=
=
= 252
muestras.
n n!(N n)! 5!(105)1 5!.5.4.3.2.1

En el caso anterior la distribucin muestral para un estadstico determinado, la


v
media aritmtica ( X )viena dada por:

muestra 1

X1

muestra 2

X2

M
muestra 252 X 252

Por lo tanto, X1 , X 2 , X 3 , K , X 252 conforman la distibucin muestral de medias.

Se puede hacer una aproximacin experimental de distribuciones


muestrales basadas en poblaciones infinitas o finitas grandes, sacando un nmero
de muestras aleatorias y siguiendo el mismo procedimiento anterior.
1) DISTRIBUCIN MUESTRAL DE MEDIAS:
Es la distribucin de probabilidad de todas las medias posibles de

las

muestras, para un tamao n determinado. Ver ejemplo, anterior. Esta distribucin


de probabilidad tiene asociados (parmetros) tales como la media X y

desviacin estndar X . Para calcular, estos parmetros de la distribucin


muestral de medias se utilizan las siguientes relaciones:

X =
X =

N n
para poblaciones finitas

N
1
n

X =

para poblaciones infinitas


n

La expresin

Es la desviacin estndar de la distribucin muestral de medias, se le llama


error tpico o estndar de la media y nos indica la diferencia promedio entre los
diversos valores de X y . Como se observa, a medida que el tamao de la
muestra aumenta este error disminuye, las diversas medias muestrales se hacen
ms uniforme en su valor, y en consecuencia, cualquier media muestral es una
buena estimacin de la media poblacional .
Anteriormente se mostr la manera de calcular la media y la desviacin
estndar de la distribucin de las medias muestrales. Ahora se va a distinguir dos
situaciones:
a)

Muestreo en una poblacin distribuida normalmente: Si X es la

media de la muestra aleatoria de tamao n, tomada de una poblacin distribuida

rmalmente, con media


muestral de X

y desviacin tpica

, entonces la distribucin

est normalmente distribuida. Para hallar la probabilidad asociada

a X , se transforman los valores de X

a valores de la distribucin normal

estandarizada, mediante la frmula:

Z=

X-
/ n

Ejemplo: Cierta marca de neumticos tiene una vida til media de 21.000
Km con una desviacin tpica de 800 Km.
a. suponiendo que las vida til de los neumticos estn distribuidas
normalmente. Cul es la probabilidad de que un neumtico cualquiera
dure menos de 20.900 Km?
b. Cul es la probabilidad de que la vida til media de 64 neumticos sea
inferior a 20.900 Km?

Solucin:
1. Como la variable X = vida til de los neumticos, est distribuida normalmente.
Entonces la probabilidad de que un neumtico cualquiera dure menos de
20.900 km se calcula de la forma siguiente:

Estandarizacin

20.900 21.000

-0,13

20.900 21.000

P ( X 20.900) = P Z
= P(Z 0,13) =0,4483
800

Es decir, el porcentaje de que un neumtico tenga una vida til menor que 20.900
Km es de 44,83 %.
Para calcular esta probabilidad, se recurre a una tabla de distribucin normal
estandarizada.
2. Si se seleccionan todas las muestras posibles de tamao 64 de la poblacin de
neumticos, entonces por lo anteriormente mencionado esta distribucin muestral
de medias es normal, con media y desviacin tpica igual a 21.000 Km y 100 Km
respectivamente.
Luego la probabilidad de que la vida til media de 64 neumticos sea inferior a
20.900 Km se calcula de la forma siguiente:

20.900 21.000
P ( X 20.900) = P Z
= P(Z 1) = 0,1587
800 / 64

Por lo que el porcentaje de que la vida til media de 64 neumticos sea inferior a
20.900 Km es de 15,87 %.

b) Distribucin en poblaciones que no estn distribuidas normalmente.


Existen mtodos que se pueden emplear cuando se necesita hacer inferencia
sobre este tipo de poblacin. Una solucin usada con frecuencia es que se
extraiga una muestra grande. Una vez extrado ese n grande, el investigador
puede utilizar el Teorema del Lmite Central,

el cual se enuncia a

continuacin:
sin tomar en cuenta la forma funcional de la poblacin de donde se
extrae la muestra, la distribucin de medias muestrales, calculadas con
muestras de tamao n extradas de una poblacin con media y
desviacin estndar , se aproxima a una distribucin normal con media
y desviacin / n , cuando n aumenta. Si n es grande, la distribucin
de las medias muestrales puede aproximarse mucho a una distribucin
normal.
Este teorema expresa que sin tomar en cuenta la forma de la poblacin que se
est estudiando, se puede seguir empleando la teora normal para obtener
inferencias sobre la media poblacional a condicin de que obtengamos una
muestra grande, porque la distribucin muestral de X ser aproximadamente
normal cuando n sea grande. Generalmente, muchos investigadores consideran
que a partir de n = 30 se puede usar el teorema del Lmite Central.
Ejemplo:
Una empresa emplea 1500 personas. La cantidad promedio gastada
durante un ao determinado, en servicios mdicos personales por empleados fue
de 25,75 $ y la desviacin estndar de 5,25 $. Cul es la probabilidad de que
una muestra de 100 empleados arroje una media comprendida entre 25 y 27 $?.
En este problema no se especfica si la poblacin es normal, pero como el tamao
de la muestra n = 100 > 30 podemos aplicar el teorema del lmite central, por lo

que la distribucin muestral de X es aproximadamente normal y por lo tanto


podemos hallar su probabilidad, esto es:
25 25,75
27 25,75
= P( 1,48 Z 2,46 ) =0.9237
P (25 X 27) = P
Z
5
,
25
/
100
5
,
25
/
100

Es decir, se tiene un porcentaje del 92,37 % de que el promedio de gastos


mdicos por empleado durante un ao este entre 25 y 27 $.
est distribuido segn la distribucin t de Student con v = n1 + n2 2 grados de
libertad.
c) Distribucin t de student:
Esta distribucin permite realizar inferencias sobre medias poblacionales
cuando se desconoce la varianza de la poblacin con muestras de tamao n < 30.
En consecuencia para hallar la probabilidad asociada a t transformamos los
valores t (de la distribucin normal) a valores de la distribucin normal
estandarizada mediante la siguiente frmula:

t=

X-
S/

Para hallar la probabilidad asociada a t se usa la tabla de distribucin de


Student.
Caractersticas de la distribucin t:
a) tiene forma de campana como la distribucin normal, solo que es
ms ancha en las colas (mayor rea)

b) los grados de libetad vienen dados por: v = n-1


c) Se aproxima a la normal a medida que aumentan los grados de
libertad.
Ejemplo: Considerando el ejemplo anterior, con

= 25, 75 $ y

desconocida. Cul es la probabilidad de que una muestra de 20 empleados, con


una desviacin de 5 $, arroje una media comprendida entre 25 y 27 $ ?.
Solucin: Como n < 30

es desconocida, se tienen pequeas

muestras, por lo que se utiliza la distribucin t de Student:

25 25,75 X 27 25,75

P (25 X 27) = P

= P( 1,12 t 1,12 ) = 0,72


S
5 / 20
5 / 20

Es decir, se tiene una probabilidad de 0,72 (72 %) de que la media de gastos


mdicos por empleado para una muestra de tamao n = 20 est entre 25 y 27 $.
2) DISTRIBUCIN MUESTRAL PARA LA DIFERENCIA DE MEDIAS

X 1 X 2 ).-

A veces interesa hacer inferencias sobre la diferencia poblacional de


medias 1 - 2, o saber si es razonable concluir que dos medias poblacionales no

son iguales, considerando que se tienen sendas muestras para las poblaciones 1
y 2, respectivamente, donde:
Entonces, la diferencia de las medias muestrales X 1 X 2 , estima a

1 -

2. La forma funcional de la distribucin muestral de X 1 X 2 depende de la forma


funcional de las poblaciones donde se extraen las muestras tomando en cuenta:

Si ambas poblaciones son normales la distribucin muestral de la


diferencia de medias es normal.

Si una o ambas de las poblaciones no es normal, la distribucin


muestral de las diferencias de medias X 1 X 2 es normal si n1 +
n2 2 >30 (grandes muestras), este resultado se deduce del
teorema del lmite central.

En estos casos, los parmetros que definen esta distribucin muestral de las
diferencias de medias vienen dados por:

X X = 1 2
1

X X
1

12 2 2
=
+
n1
n2

El cual se aplica para dos casos especficos dependiendo de la muestra:


a) Para grandes muestras, cuando v = n1+n2 - 2 > 30, se trabaja con la
distribucin normal. En estos casos, estandarizando la diferencia
medias muestrales, se tiene:

de

Z=

( X 1 X 2 ) ( 1 2 )

12 2 2
+
n1
n2

Ejemplo: La siguiente tabla nos muestra informacin del tiempo medio en


minutos que tarda un cliente en ser atendido en dos bancos:

Banco A

Banco B

A2 = 3 min
A = 14 min
n A = 20

B2 = 5 min
B = 13 min
nB = 13

Hallar la probabilidad de que la diferencia media entre los dos bancos no


exceda de 2 minutos.
Solucin: como los grados de libertad 20 + 13 2 =33 2=31 > 30, se
tienen grandes muestras se trabaja con la distribucin normal:

( X A X B ) ( A B ) 2 ( A B )
1

= P Z
P ( X A X B 2) = P

= P(Z 1,37) =

0,73
3
5

A2 B2

+
+

20
13
n
n
A
B

0, 9146
Existe un 91,46 % que la diferencia media entre los dos bancos no exceda de 2
minutos.

b) Para pequeas muestras, Cuando v = n1 + n2 2 < 30, se trabaja con la


Distribucin t de Student. Por lo tanto, el valor viene dado por:

t=

( X 1 X 2 ) ( 1 2 )
2

Sp

n1

Sp

n2

donde:
2

Sp

(n 1) S1 + (n 2 1) S 2
= 1
n1 + n 2 2

Ejemplo: Considerando los ingresos mensuales de empleados de dos empresas,


se tiene informacin de dos muestras mediante la siguiente tabla:
Empresa 1
S12 = 400000000 Bs

1 = 180000 Bs
n1 = 20

Empresa 2
S 22 = 342250000 Bs

2 = 210000 Bs
n 2 = 10

Hallar la probabilidad de que la diferencia de medias muestrales sea a lo menos


3500.

Solucin: : como los grados de libertad 20 + 10 2 =30 2=28 < 30, se


tienen pequeas muestras se trabaja con la distribucin t de Student:

( X X ) ( )
A
B
1
2

P ( X 1 X 2 3500) = P
2
2

Sp Sp
+

n1 n2

donde S p2 =

3500 + 30000
33500

= P(t 4,43)
= P t
7564,10
381437500 381437500

20
10

19..400000000 + 9.342250000
= 381437500
28

Entonces para v = 28 gl y usando la tabla t de Student:

P ( X 1 X 2 3500) = P(t 4,43) = 0,99


Es decir, la probabilidad de que la diferencia media de los salarios sea mayor que
3500 es del 0,99.
)
3). DISTRIBUCIN DE UNA PROPORCION MUESTRAL ( P ).Se define una proporcin poblacional como el cociente:

p=

nmero de casos favorables


total de casos

Por ejemplo: si de una poblacin de N = 50, empleados de una empresa, 15


de ellos no cumplen con su horario de trabajo, la proporcin de empleados que no
cumplen horario con relacin al total, viene dado:

P = 15/50 = 0,3; es decir, el 30 % de los empleados no cumplen su horario.


La proporcin muestral ( p ), se define como:

p =

nmero de casos favorables


tamao de la muestra

Ejemplo:
Si se toma una muestra aleatoria de tamao n = 1000 y 425 personas
satisfacen un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5
% de las personas satisfacen dicho evento.
La distribucin de una proporcin muestral, se define de una manera
anloga a a la distribucin de media, o sea:
Muestra 1---- p1
Muestra 2---- p 2
Muestra 3---- p 3
Muestra X---- p k
De esta forma: p1 , p 2 , p 3 ,..., p k corresponden a la distribucin de una
proporcin muestral.
De acuerdo a lo expuesto, la distribucin muestral de proporciones
corresponde a una distribucin de probabilidad de todas las proporciones posibles
de las muestras, para un tamao n determinado.
Los parmetros que definen esta distribucin vienen dados por:

p = p = P
N n
N 1

X =

p.q
n

X =

p.q
para poblacione s infinitas
n

para poblacione s finitas

Para el clculo de probabilidades relativa a proporciones, se trabaja de


manera anloga al caso de la distribucin muestral de medias.
Ejemplo: Un encuestador sabe que en cierta rea el 20 % est a favor de
las emisiones en bonos. Considerando una muestra de 64 personas, hallar la
probabilidad de que la proporcin muestral difiera de la proporcin real a lo sumo
en un 0,06.
Solucin:
p = 0.20 proporcin de personas de la poblacin que estn a favor de la emisin

p = proporcin de personas de la muestra que estn a favor de la emisin


entonces nos estn pidiendo la siguiente probabilidad:

P ( p p 0,06) = P

0,06
p p

0,2.0,8
p.q
n
64

0,06
= P( 0,27 Z 0,27 ) = 0,20 4
0,2.0,8

64

4) DISTRIBUCIN MUESTRAL DE VARIANZAS.


Con esta distribucin, se estudia las probabilidades relativas a la varianza
de una poblacin. De esta forma, la distribucin muestral de varianzas, viene dada
por todas las posibles varianzas de las muestras para un tamao de muestra n

determinado. Para encontrar probabilidades relativas a varianzas se usa la


distribucin 2 (chi cuadrado), para ello se transforman los valores S2 (varianzas
muestrales) a valores de 2 mediante la siguiente relacin:
2 = (n - 1). S2 / 2 para v = n - 1 (grados de libertad).
Nota: El nico requisito para usar la distribucin chi cuadrado es que la
poblacin est distribuida normalmente
Ejemplo:
En una empresa, la desviacin estndar del sueldo de los empleados es de
Bs. 75000, correspondiente a valores distribuidos normalmente. Para un nuevo
estudio se escogen 17 empleados cuyos salarios se muestran a continuacin:

SUELDOS
156000 174000
175000 269000
185000 320000
200000 260000
225000 158000

162000
298000
450000
364000
300000

Se desea conocer si estos resultados muestran consistencia con respecto a


la desviacin, en cuanto a la variabilidad del sueldo de los empleados de dicha
empresa.

Solucin:
Cuando se habla de variabilidad nos referimos a la varianza desviacin
estndar, por lo que debemos calcular la desviacin muestral, esto es S =
87325,99 Bs. Por lo tanto:
(n 1) S 2 16.(87325,99) 2
= P 2 > 21,69 = 0,15 .
P( S > (87325,99) ) = P
>
2
5625000000

2

Los resultados muestran consistencia ya que es ms probable que la


varianza muestral para muestras de tamao n = 17 estn por debajo de Bs.
87325,99
5) DISTRIBUCIN F DE FISHER.
Cuando se quiere estudiar la relacin entre las varianzas de dos
poblaciones distribuidas normalmente se usa la distribucin F de Fisher. Es decir,
dadas dos muestras aleatorias independientes de tamao n1 y n2 de dos
S 2M
poblaciones independientes, la distribucin muestral de la razn F = 2
Sm

(razn

de varianzas) se conoce como distribucin de Fisher, suponiendo que las


varianzas poblacionales son iguales ( 21 = 22 ). Donde:

S M2 : es la varianza mayor
S m2 : es la varianza menor
con (v1 , v 2 ) donde v1 = n 1 1 grados de libertad del numerador
v 2 = n 2 - 1 grados de libertad del denominador

Ejemplo:
Considerando que las varianzas poblacionales de dos poblaciones son
iguales,

21 = 22 , n1= 6 y n2 = 10, hallar la probabilidad de que la razn

de las varianzas muestrales no exceda a 3,48.


Solucin: Cuando se quieren comparar las varianzas muestrales de

dos poblaciones se utiliza la distribucin F de Fisher, por lo tanto, F =

S12
S 22

con v1 = 5 y v2=9 grados de libertad.Tambin la probabilidad pedida viene


dada por:
S12

P 2 3,48 = P(F 3,48) = 1 P( F > 3,48) = 1 0,05 = 0,95


S2

Ntese que an cuando las varianzas de las poblaciones son iguales, la


probabilidad de que la razn de las varianzas de las muestras exceda a 3,48 es
de 0,05 suponiendo tamaos de muestras de n1 = 6 y n2 = 10.

Tamao de la Muestra.
La clave del problema estriba en escoger una muestra cuyo seleccin
garantice la representatividad de la poblacin objeto de estudio. En los estudios
socio-econmicos, una muestra de un 30% de la poblacin, tiene un elevado nivel
de representatividad (Ramrez 1995); sin embargo, esta representatividad
depende mayormente, del tipo de muestreo. Obviamente, que el trabajar con
muestras, por muy confiables que sean, no se obtiene el 100% de exactitud, sin
embargo, ese pequeo error que acompaa siempre a los estudios por muestreo,

es compensado con el tiempo y costo ahorrado al trabajar con grupos pequeos


en vez de toda la poblacin.

Determinacin del Tamao de la Muestra en una poblacin infinita, cuando

se utilizan proporciones:

n= 2

.p.q

Donde:

n: Tamao de la muestra
Z/2: Valor terico en funcin del nivel de confianza. Para 99 %, Z/ 2 es igual a
2,56 y para el 95% a Z/2 le corresponde 1,96

: error de muestreo
p: Nmero de veces que se produce un evento en %
q: Es el porcentaje complementario de p
Ejemplo: Opinin de los electores sobre gestin de gobierno.
Se realiz un estudio piloto de 150 electores donde 60 opinan favorablemente. A
cuantas personas es necesario encuestar si se desea un nivel de confiabilidad de
99 % y un error de muestreo +/- 1.5%?.
Entonces se tiene:

n= 2

.p.q

El valor de p viene dado por:

p = 60 / 150 X 100 = 40%, por lo tanto q = 100 - 40 = 60%.

2,56
De esta forma se tiene: n =
. 0,4. 0,6 = 6.991 .
0,015

Es necesario

encuestar a 6.991 personas para alcanzar cierta confiabilidad en los resultados.

En el caso de una Poblacin Infinita con 95 % de Confiabilidad.


Utilizando el ejemplo anterior, se tiene:
2

1,96
n=
. 0,4. 0,6 = 4098
0,015
Al bajar el coeficiente o el nivel de confiabilidad, tambin baja el tamao de la
muestra.

En el caso de que no exista un Estudio Piloto.


A los valores de p y q se les asigna el valor de 50% a cada uno y es lo que se
denomina Condiciones desfavorables de muestreo. En el caso del ejemplo
citado el tamao de la muestra viene determinado de la siguiente manera:
2

1,96
n=
. 0,5. 0,5 = 4.268
0,015
Esto quiere decir que habr que encuestar a 4.268 personas.

En el caso de poblaciones finitas, el modelo matemtico difiere con el


de las poblaciones infinitas:

n=

Z /2 .p.q.N
2 (N 1) + Z /2 .p.q

Donde: N es el tamao de la poblacin y n el tamao de la muestra.

Se puede aplicar en el siguiente caso: Conocer la opinin de los miembros


de un sindicato, ante un nuevo contrato colectivo. Compuesto por 3.257
obreros. Cuntas obreros se deben entrevistar

para obtener un nivel de

confianza de 99 % y un error de muestreo de +/- 3%, en condiciones


desfavorables?
2,562 . 0,5 . 0,5. 3257
n=
= 1.168
0,032 (3257 1) + 2,562.0,5.0,5

Se requieren encuestar a 1.168 obreros, para lograr cierto grado de


Confianza.

Determinacin del Tamao de la Muestra en una poblacin para medias.


En este caso se utiliza la relacin:

Z.

n= 2

Ejemplo: Se quiere estudiar la vida til media de una marca de


neumticos. Si sabe por estudios anteriores que la desviacin estndar es de
800 Km . Determinar el tamao de la muestra requerido para un nivel de
confianza del 95 %, fijando un error de 40.
Sustituyendo los valores se tiene
2

1,96. 800
1568
n=
=
= 1536,64 1537 neumticos
40
40

En conclusin, la validez en la investigaciones de negocios, est muy


relacionada con la confiabilidad del muestreo y una muestra confiable est en
funcin del tipo de poblacin a estudiar ( finitas o infinitas); asi mismo, en
cuanto al nivel de confiabilidad, sta ser mayor si la muestra es mayor y en
relacin al error de muestreo, ste ser menor cuando la muestra es mayor.
Para determinar el tamao de la muestra de una forma mas rpida y prctica,
se han diseado las Tablas de Harvard, las cuales permiten calcular,
rapidamante el tamao de la muestra a tomar, en funcin del error de
muestreo, niveles de confiabilidad y posibles valores de p y q.
Para profundizar en este aspecto de muestreo, se recomienda consultar los
textos especializados en estas reas. Pues una vez determinado el tamao de
la muestra el paso siguiente que se plantea es lo relacionado al tipo de
muestreo que se va a utilizar para escoger los elementos que integran a la
muestra y sto es un amplio e interesante tema a tratar.

CAPITULO IV
EL CONTROL ESTADSTICO DEL PROCESO

OBJETIVOS:
Conocer los mtodos estadsticos utilizados en el control de procesos y
aplicar las herramientas especficas para cada caso, con la finalidad de detectar y
corregir posibles fallas.
1.

INTRODUCCION:

La estadstica descriptiva y la inferencial as como la teora de


probabilidades, tienen un campo

muy amplio de aplicacin en la industria,

especialmente en el control de la calidad y en el anlisis de procesos.


En los procesos de produccin se generan simultneamente grandes
volmenes de informacin cuantitativa y cualitativa a travs de las cuales se
pueden controlar los costos, la produccin y la calidad, es decir, lo que significa el
control de gestin administrativa de la compaa.
La recopilacin, presentacin y anlisis de este flujo de informacin permite
a la gerencia conocer los resultados y establecer controles y as mismo comparar
los resultados obtenidos con lo deseado, pudiendo establecer acciones correctivas
cuando se observen discrepancias significativas entre ellos.

El Control

Estadstico de la Calidad es el conjunto de acciones

orientadas a cumplir con las metas de calidad previamente establecidas, utilizando


para ello las tcnicas estadsticas aplicables al menor costo posible.

Lo importante del Control de Calidad es que constituye una herramienta


muy eficaz para incrementar la productividad, permitiendo elevar el nivel tcnico
de la empresa, incrementando la produccin y reduciendo los costos de operacin.
De esta forma, el propsito del control de la calidad es fijar la calidad normal,
mantener y mejorar el nivel, la uniformidad y la

confiabilidad de la calidad

garantizando sta y reduciendo los costos de fabricacin, suministrar productos a


la satisfaccin del cliente aumentando los beneficios.
Como se observa, el control de calidad involucra el proceso total de:
comercializacin, investigacin, desarrollo, produccin, transporte, instalacin y
mercadeo, sin soslayar todas aquellas funciones tendientes a maximizar el
beneficio.
2.

METODOS ESTADISTICOS:

Este control moderno de la calidad implica el uso de mtodos estadsticos,


siendo denominado

Control Estadstico de la Calidad cuya aplicacin es

ampliamente utilizada en diferentes reas tales como: anlisis de procesos, control


de procesos, investigacin, desarrollo, etc.
En funcin de ello se puede establecer una estructura basada en:
Ingeniera de Control de Calidad: Encargada del planeamiento de
calidad de una empresa.
Ingeniera en Control de Procesos: Supervisa la aplicacin adecuada del
sistema del control de calidad en la fabricacin.
Ingeniera de equipos de informacin: Disea y desarrolla el equipo para
la inspeccin y el ensayo.

Entre los mtodos estadsticos de mayor uso se tienen:


a.

Grficas de control.

b.

Distribucin de frecuencia, histogramas y diagramas de pareto.

c.

Distribuciones estadsticas.

d.

Ensayo de significacin.

e.

Inspeccin por muestreo.

f.

Diseo de experimento y anlisis de la varianza.

En el cuadro que a continuacin se presenta se resume las diferentes reas


de control y las tcnicas utilizadas en cada una de ellas:

CONTROL
TAREA
Planeamiento
de
la
CONTROL
DE NUEVOS calidad del producto y
proceso,
standard,
DISEOS
costos, especificaciones
del proceso, confiabilidad.
MATERIA
PRIMA

Controles de recepcin y
almacenamiento,
economa y costos.

PRODUCTO
Y PROCESO

Control
del
producto
desde su fabricacin,
establecer
correctivos,
servicios.

Investigaciones y ensayo
ESTUDIOS
ESPECIALES para mejorar la calidad.

TECNICAS UTILIZADAS
Anlisis de la funcin producto, pruebas
ambientales, prototipo, evaluacin ,
estndares de calidad, anlisis de
materia
prima,
inspeccin,
entrenamiento,
almacenamiento
y
transporte.
Evaluacin
de
proveedores,
instrumentos
de
medicin
,
entrenamiento,
muestreo,
especificaciones, caractersticas de
calidad, lotes rechazados y aceptados,
anlisis estadsticos, etc.
Control
de
procesos,
productos
terminados, control de herramientas,
mantenimiento, personal, condiciones
ambientales, inspeccin, cartas de
control, muestreo, planos, auditora,
defectos,
empaque
y
despacho,
servicios.
Grficas. distribucin de frecuencias,
diagramas de fallas, anlisis de pareto,
diferentes
mtodos
estadsticos,
pruebas de hiptesis, distribucin t, chi
cuadrado, anlisis de la varianza,
correlaciones y regresiones, anlisis
secuencial.

El anlisis de procesos no viene a ser ms que la aplicacin de mtodos


cientficos al reconocimiento y a la formulacin de problemas y al desarrollo de
procedimientos para resolverlos. Esto significara: la especificacin matemtica del
problema

para

una

situacin

fsica

determinada

realizar

el

anlisis

pormenorizado para obtener los modelos matemticos, lo cual conducira a la


sntesis y presentacin de los resultados para asegurar su comprensin y posible
aplicacin.
El anlisis estadstico desempea un papel importante en el estudio de los
procesos. El mtodo de encontrar las causas de los productos con defectos, es lo
que se denomina Diagnstico del Proceso. Para reducir el nmero de productos
defectuosos la primera accin es la de hacer un diagnstico correcto para
determinar las causas de los defectos.
Existen muchos mtodos para hacer un diagnstico correcto, algunos
basados en la intuicin y otros en la experiencia. En este trabajo se recurrir al
anlisis estadstico de los datos; la forma estadstica de considerar las cosas y el
uso de los mtodos estadsticos constituye un medio muy valioso para hacer las
observaciones.
1. CARTAS DE CONTROL.
De acuerdo con E.L. Grant (Statistical Quality Control) la calidad medida de
un producto manufacturado, est siempre sujeta a una cierta variacin fortuita.
Algn sistema estable de causas fortuitas es inherente a cualquier esquema
particular de produccin e inspeccin. La variacin propia de este modelo estable
es inevitable, pero las razones para la variacin fuera de este modelo estable
pueden ser descubiertas y corregidas.

La carta control desarrollada por Shewhart (Economic Control of Quality of


Manufatured Product.) es un dispositivo grfico para detectar modelos no
naturales de variacin en los datos resultantes de procesos repetitivos, lo cual
permite fijar un criterio para detectar deficiencias en el control estadstico. En estas
cartas los puntos muestreados son representados grficamente de una forma
secuencial y posteriormente

unidos por una lnea facilitando la interpretacin

visual.

FIGURA 7.GRAFICA DE CONTROL

Las pruebas ms comunes para modelos no naturales son las pruebas de


inestabilidad, las cuales permiten determinar si el sistema de causas est
cambiado, comnmente se les designa como las zonas A, B, y C.
Como referencia a estas zonas, el modelo de variacin observado se dice
que es no natural o que el proceso est fuera de control si ocurre uno o ms de los
siguientes eventos:
1.- Un slo punto cae fuera del lmite de control.
Por ejemplo ms all de la zona A.
2.- Dos de tres puntos sucesivos, caen en la zona B o ms all
3.- Cuatro de cinco puntos sucesivos caen en la zona B o ms all
4.- Ocho puntos sucesivos caen en la zona C o ms all
Estas pruebas se aplican separadamente a ambas mitades de la Carta
Control.
Las cartas ms comnmente usadas son: Carta X, la Carta R, la Carta p, y
la carta c; las dos primeras tratan con datos de medicin, mientras que las dos
ltimas tratan con datos de atributos. (Enumeracin).
FRMULAS PARA LAS CARTAS DE CONTROL:

Carta
_
X

Distribucin
Normal

Normal

Binomial p

Poisson

Lnea
Central
_
X
R

Lmite superior
de control (LSC)
_
X + A2 R
D4 . R

p + 3p (1-p) / n
c

c+3 c

Lmite inferior
de control (LIC)
_
X - A2 R
D3 . R.

p - 3p (1-p) / n
c-3 c

Las constantes A2 , D3 y D4

estn tabuladas (ver anexo), mientras que

las cantidades X, R, p, y c se calculan de los datos suministrados.

Planes de Muestreo:
El muestreo de aceptacin puede ser de dos tipos: muestreo lote por lote
tambin denominado muestreo por atributos y muestreo de produccin continuo o
muestreo variable. Los primeros se refieren a los casos donde cada espcimen es
clasificado simplemente como defectuoso o no defectuoso; en los planes variables
se refiere a los casos en los cuales una medida es tomada y registrada
numricamente en cada espcimen inspeccionado. El plan de muestreo por
atributos que se efecta en base de lote, est definido por tres elementos: el
tamao del lote (N), el tamao de la muestra (n) y el nmero de aceptacin A.

Ejemplo:

La tabla que se exhibe a continuacin muestra los valores


codificados de la resistencia a la compresin de bloques de concreto.

VALORES CODIFICADOS DE LA RESISTENCIA A LA COMPRESIN DE


BLOQUES DE CONCRETO
Nmero de
la Muestra

X1

X2

X3

X4

X5

Media Rango
(X)
(R)

01

11.1

9.4

11.2

10.4

10.1

10.44

1.8

02

9.6 10.8

10.1

10.8

11.0

10.46

1.4

03

9.7 10.0

10.0

9.8

10.4

9.98

0.7

04

10.1

8.4

10.7

9.4

11.0

9.82

2.6

05

12.4 10.0

10.7

10.1

11.3

10.90

2.4

06

10.1 10.2

10.2

11.2

10.1

10.36

1.1

07

11.0 11.5

11.8

11.0

11.3

11.32

0.8

08

11.2 10.0

10.9 11.2

11.0

10.86

1.2

09

10.6 10.4

10.5

10.5

10.9 10.58

0.5

10

8.3 10.2

9.8

9.5

9.8

9.52

1.9

10.2

11.4

10.56

1.5

11

10.6

9.9 107

12

10.8 10.2

10.5

8.4

9.9

9.96

2.4

13

10.7 10.7

10.8

8.6

11.4

10.44

2.8

14

11.3 11.4

10.4

10.6 11.1

10.96

1.0

15

11.4 11.2

11.4

10.1 11.6

11.14

1.5

16

10.1 10.1

9.7

9.8 10.5

10.04

0.8

17

10.7 12.8

11.2

11.2 11.3

11.44

2.1

18

11.9 11.9

11.6

12.4 12.4

11.84

1.0

19

10.8 12.1

11.8

9.4 11.6

11.14

2.7

20

12.4 11.1

10.8

11.0 11.9

11.44

1.6

10.66

1.59

Promedio

De la tabla anterior tenemos que:

_
_
213.20
X = X/K = --------------- =
20
31.8
R= R/K = ---------------- =
20

10.66

1.56
_

De acuerdo a las frmulas establecidas, para la Carta X:

LSC =

_
X + A2 . R

LSC =

10.66 + (0.58) (1.59) = 11.558

LIC =

10.66 - (0.58) (1.59) = 9.74

FIGURA 8. CARTA X

Igualmente para la Carta R:


LSC = D4 . R = (2.12) (1.59) = 3.37
LIC = D3 . R = (0) (1.59) = 0

FIGURA 9. CARTA R

Si tratamos con datos de enumeracin como por ejemplo el nmero de


fusibles defectuosos escogidos en muestras de tamao 50, tomados en tiempos al
azar durante el proceso de produccin; podemos emplear la Carta p.

Nmero de muestra
1.............................
2.............................
3............................
4............................
5............................
6............................
7............................
8............................
9............................
10.........................
11.........................
12.........................
13.........................
14.........................
15.........................
16.........................
17........................
18.........................
19........................
20........................
21.......................
22.......................
23.......................
24.......................
25.......................
26.......................
27......................
28......................
29......................
30.....................
31.....................
32.....................
33.....................
34.....................
35.....................
36....................
37....................
38...................
39...................
40...................

Nmero de defectuosos

Fraccin defectuosa (p)

2
1
2
0
2
3
4
2
0
3
0
1
2
2
3
5
1
2
3
1
1
1
4
2
2
4
1
3
3
2
3
6
2
3
2
3
1
0
2
0

0.04
0.02
0.04
0.00
0.04
0.06
0.08
0.04
0.00
0.06
0.00
0.02
0.04
0.04
0.06
0.10
0.02
0.04
0.06
0.02
0.02
0.02
0.08
0.04
0.04
0.08
0.02
0.06
0.06
0.04
0.06
0.12
0.04
0.06
0.04
0.06
0.02
0.00
0.04
0.00
Promedio.....................

0.042

De esta tabla de valores se comprueba:


p=

p/K

1.68
= = 0.042
40

Aplicando la Ecuacin correspondiente


LSC = p + 3 p (1- p) / n
LSC = 0.042 + 3 (0.042) (0.958) /50 = 0.127
LIC = 0.042 - 3

(0.042) (0.958) /50

= - 0.043

Como el LIC resulta un valor negativo y debido a que la fraccin


defectuosa es una cantidad no negativa, este lmite se toma como
cero, lo cual hace a los lmites de control asimtricos con respecto a la
lnea central.

FIGURA 10. CARTA p

Si interesa determinar el nmero de defectos por unidad, la Distribucin de


Poisson y una carta C sera lo ms apropiado. A continuaccin se presentan los
datos tabulados del nmero de defectos observados en una junta soldada,
realizando cada conteo en una sola junta, soldndose 8 juntas por hora.
Nmero de muestra
Fecha Tiempo de la muestra
1................. Julio 18
8:00 A.M
2.................
9:05 A.M.
3.................
10:10 A.M.
4.................
11:00 A.M.
5.................
12:30 PM.
6.................
1:35 P.M.
7.................
2:20 P.M.
8.................
3:30 P.M.

Nde defectos (c)


2
4
7
3
1
4
8
9

9.................. Julio 19
10................
11.................
12.................
13................
14................
15.................
16.................

8:10 A.M.
9:00 A.M.
10:05 A.M.
11:15 A.M.
12:25 P.M.
1:30 P.M.
2:30 P.M.
3:40 P.M.

17................ Julio 20
18................
19................
20................
21................
22................
23................
24................

8:00 A.M.
8:55 A.M.
10:00 A.M.
11:00 A.M.
12:25 P.M.
1:30 P.M.
2:20 P.M.
3:30 P.M.

6
4
3
9
7
4
7
12

..............

144

Total...................................

5
3
7
11
6
4
9
9

Del cuadro anterior y aplicando las ecuaciones correspondientes tenemos:


144
c= c/K = = 6
24
_
_
LSC = c + 3 c
LSC = 6 + 3
LIC= 6 - 3

6 = 13.35

6 =

- 1.35

FIGURA 11. GRAFICA DE CONTROL


En esa grfica no se presentan puntos por encima del LSC; igualmente, el
mismo patrn aparece cada medio da; este patrn recurrente sugiere un factor de
fatiga que debe ser tomado en cuenta

2. DIAGRAMA DE CAUSA EFECTO


Es una representacin grfica de la relacin entre un efecto y todas las
posibles causas que influyen en l, permitiendo identificarlas y clasificarlas para su
anlisis. Es llamado tambin diagrama de Ishikawa o Espina de Pescado. (Ver
figura en la pgina siguiente).

CAUSAS
METODOS

MAQUINAS

EFECTO
MATERIALES

CALIDAD

MANO DE OBRA

MEDICIONES

FIGURA 12. DIAGRAMA CAUSA-EFECTO

Ejemplo
Despus de haberse realizado un anlisis de las principales causas
que originan bobinas desviadas en el laminador tandem 1, se encontr que
manchas contaminantes afectaba en gran proporcin los resultados de
calidad. El equipo de trabajo realiz un estudio utilizando el diagrama causaefecto el cual se presenta a continuacin:

CAUSAS
METODOS
FALTA DE
COORDINACION

EFECTO

MAQUINAS
FUGA DE
ACEITE

FALTA DE
SECADOR DE
COMUNIC.
BANDAS

EXPERIENCIA DEL
PERSONAL
OPERACION DE
EMULSION

MANO DE OBRA

MATERIAL DE
DECAPADO

ACEITE

EXTRATOR DE
GASES

CRITERIOS NO
UNIFORMES

MATERIALES

PERMANANENCIA
DEL MATERIAL DE
ALMACENAMIENTO
AUSENCIA DE
INSTRUENTOS
DE MEDICION

FALTA DE EQUIPOS
SENSIBLES
AL MATERIAL
MOJADO

FILTRO DE
EMULSION

CALIBRACION DEL
SECADOR EN
FUNCION
DEL ANCHO DE BANDA

MANCHAS
CONTAMINANTES

FALTA DE EQUIPO DETECTOR


DE MANCHAS

MEDICIONES

FIGURA 13. REPRESENTACIN GRAFICA DEL EJEMPLO

3. DIAGRAMA DE PARETO
a. Es un grfico de barras que jerarquiza los problemas, condiciones o
las causas de stos, por su importancia e impacto siguiendo un
orden descendente de izquierda a derecha.
b. Es utilizado cuando se necesita determinar el orden de importancia
de los problemas o condiciones a fin de seleccionar el punto de inicio
para la solucin de dichos problemas o la identificacin de la causa
fundamental de ellos.

FIGURA 14. DIAGRAMA DE PARETO

Ejemplo
Defectos encontrados en una inspeccin
1.- Presencia de xido
2.- Falta de identificacin.
3.- Manchas de aceite.
4.- Mala ubicacin.

FIGURA 14. REPRESENTACIN GRAFICA DEL EJEMPLO

4. GRAFICO DE CORRIDAS
Es una representacin grfica mediante lneas del comportamiento
de una variable en un proceso durante un perodo determinado, es utilizado
cuando se necesita mostrar las tendencias de puntos observados, dentro de
un perodo de tiempo especificado.

FIGURA 15. MODELO DE GRAFICO DE CORRIDAS


PASOS PARA LA ELABORACIN DE UN GRAFICO DE CORRIDAS:
1. Determinar la variable del proceso a medir.
2. Establecer la escala a utilizar en los ejes:
a. El eje horizontal X , representa el perodo de tiempo y
b. El eje vertical Y, representa los valores de la variables del proceso.

3. Indicar con puntos los valores encontrados en cada una de las


mediciones y proceder a unir dichos puntos mediante el uso de lneas.
4. Calcular el promedio de los valores.
5. Representar en el grfico el promedio determinado trazando una lnea
horizontal.
6. Interpretar el grfico resultante.
5. HISTOGRAMA DE FRECUENCIA
Es una grfica de barras que muestra la frecuencia con que ocurre
una determinada caracterstica que es objeto de observacin. Es utilizada
comnmente cuando se requiere mostrar la distribucin de los datos y
representar la variacin propia de un proceso.

FIGURA 15. MODELO DE HISTOGRAMA

6. ANLISIS DE REGRESION
En muchas situaciones que se presentan a menudo en el campo de la
ciencia, la ingeniera o las ciencias econmicas nos encontramos con el problema
de la relacin entre dos variables numricas. Por ejemplo, la relacin entre la
temperatura de un paciente y el nmero de pulsaciones por minuto o la relacin
entre el costo de un producto y el costo de la mano de obra para fabricarlo.
Muchas veces existen ecuaciones matemticas que nos permiten calcular una
variable conociendo el valor de otra de la cual depende.
En general, cuando se nos presentan dos variables numricas X e Y,
podemos encontrar distintos tipos de relacin entre ellas. Puede ocurrir que entre
ellas no exista ningn tipo de relacin. En tal caso, la variacin de una de ellas no
genera una variacin correlativa en la otra. Variacin correlativa significa que cada
vez que X aumenta, Y debe aumentar si hay correlacin positiva o cada vez que X
aumenta, Y debe disminuir en caso de correlacin negativa. Pero si cada vez que
X vara, Y puede aumentar o disminuir al azar en cualquie grado y proporcin,
entonces significa que no hay ninguna correlacin entre ambas:

Variable Y

Ninguna correlacin
50
45
40
35
30
25
20
15
10
5
0
0

6
Variable X

10

12

Cuando hay una relacin funcional entre X e Y, es decir Y=F(X), la


correlacin entre ambas es perfecta. Supongamos que medimos el valor de Y para
un determinado valor de X, y que dicho valor de X lo podemos fijar con exactitud
(En general, esto no va a ser cierto). La ecuacin de la funcin nos da un valor de
Y para ese valor de X. El valor de Y medido y el valor de Y calculado con la
ecuacin, en general, no van a coincidir. Si repitiramos la medicin de Y muchas
veces para el mismo valor de X, tendramos una serie de valores que son
diferentes del valor calculado. Pero si seguimos este proceso, obtendremos una
poblacin de valores de Y cuyo promedio s va a coincidir con el valor calculado.
Es decir, la relacin funcional expresada por la ecuacin matemtica se cumple
para los promedios de los X e Y medidos, porque la mediciones individuales estn
sujetas al error experimental o error de medicin. Vemoslo con un ejemplo. Si
dejamos caer una pelotita desde el borde de una mesa, la distancia que recorre
desde el borde hasta tocar el suelo se puede calcular por medio de la ecuacin
siguiente:

Y = f (t ) =

1
g t2
2

g Aceleracion Gravitatoria

Hay una relacin funcional no lineal entre la altura Y desde la cual cae la
pelotita y el tiempo t que tarda en caer, expresada por la ecuacin anterior. Si
dejamos caer la pelotita midiendo con un cronmetro el tiempo que tarda en llegar
al suelo y medimos tambin la distancia recorrida (la altura de la mesa), los
valores resultantes de la medicin seguramente no cumplen con esa relacin. Esto
lo podemos verificar reemplazando t en la ecuacin por el tiempo obtenido con el
cronmetro. El valor resultante Y seguramente no va a coincidir con nuestra
medicin de la altura de la mesa. Si repetimos esto muchas veces, las mediciones
de tiempo y distancia realizadas en cada ocasin, en general, no van a cumplir la
relacin. Pero si promediamos todas la mediciones de tiempo y luego
reemplazamos t en la ecuacin por este promedio, la distancia calculada con la

ecuacin s va a coincidir con el promedio de todas las mediciones de altura de la


mesa.
Entre las dos posibilidades extremas, la de no tener ninguna relacin entre
las variables y la de tener una relacin funcional, hay infinitas situaciones
intermedias, en las cuales hay un cierto grado de correlacin entre ambas:

Variable Y

Hay alguna correlacin


50
45
40
35
30
25
20
15
10
5
0
0

10

12

Variable X

En muchos problemas prcticos de la industria y de la economa se trata de


conocer en forma emprica la relacin entre dos variables, de tal manera que si se
tiene un valor de la variable X se pueda obtener por clculo o en forma grfica el
valor de la variable Y, sin importar si existe una verdadera relacin funcional entre
ambas variables. Por ejemplo, supongamos que tenemos una grupo muy grande
de personas de sexo masculino, de edad entre 30 y 40 aos. Se nos presenta el
problema de relacionar las variables peso y estatura, de tal manera que,
conociendo la estatura en metros de un individuo del grupo, podamos calcular su
peso en Kg. Entre ambas variables no existe una relacin funcional. Esto lo vemos

fcilmente si tomamos algunos individuos cuya estatura sea la misma, por


ejemplo, 1,75 mts. y medimos el peso de cada una. Resulta claro que las
mediciones van a ser diferentes, una pesar 73 Kg., otra 79 Kg., etc. y estas
diferencias no se deben al error de medicin, sino a diferencias reales en el peso
de las personas:

Grfico de peso vs. altura


130

Peso de personas de
1,75 mts.

120
Peso (Kg.)

110
100
90
80
70
60
50
40
1,60

1,70

1,80

1,90

2,00

2,10

Altura (m ts.)

Quiere decir que para un determinado valor de la variable estatura podemos


encontrar mltiples valores de la variable peso, lo cual niega la existencia de
relacin funcional. No obstante, existe un importante grado de correlacin entre
ambas variables, porque sabemos que a medida que aumenta la estatura de las
personas dentro del grupo, el peso tiende a aumentar. Cmo podemos hacer,
entonces, para estimar el peso de una persona conociendo su estatura?
Para ello, vamos a suponer un procedimiento hipottico: Tomamos del
grupo un nmero muy grande de personas que miden exactamente 1,65 mts., las
pesamos y promediamos los resultados. Repetimos el procedimiento para grupos

que miden 1,70 mts., 1,75 mts., etc. y luego representamos grficamente los
promedios de peso en funcin de dichas alturas:

Regresin del peso sobre la altura


130
120
Peso (Kg.)

110
100
90
80
70
60
50
40
1,60

1,70

1,80

1,90

2,00

2,10

Altura (m ts.)

La representacin resultante se denomina Regresin del peso sobre la


altura, y a la ecuacin correspondiente Ecuacin de Regresin. Una vez hecho
esto, disponemos de una forma sencilla de estimar el peso de una persona del
grupo conociendo la altura: con la misma entramos al grfico y obtenemos el valor
de Y correspondiente. Este valor Y es el promedio de los pesos de las personas
del grupo que miden una altura X, y slo nos sirve como una estimacin
(aproximacin) del peso real de la persona cuyo peso deseamos conocer.
Tambin podemos utilizar la ecuacin de regresin para calcular el peso. La forma
de la representacin grfica puede ser una recta u otro tipo de curva. Cuando es
una recta decimos que es una regresin lineal, y de ahora en mas nos referiremos
a este tipo de regresiones.

El procedimiento real para obtener la regresin utiliza un mtodo que se


conoce como Mtodo de los Cuadrados Mnimos. Se toma una muestra aleatoria
de personas del grupo que cubran todo el rango de alturas y a cada una se le
mide el peso y la altura. Si representamos estos puntos en un grfico, veremos
que se agrupan aproximadamente alrededor de una recta imaginaria, que
representa los puntos de la regresin. Parece lgico pensar que la recta de la
regresin debe pasar muy cerca de los puntos experimentales (las mediciones que
realizamos). Si hacemos pasar esta recta imaginaria por el punto correspondiente
a uno de los individuos la estamos alejando, probablemente, de los otros puntos.
Es decir que, la recta de regresin debe pasar a una distancia ptima de los
puntos experimentales, de tal manera que est lo mas cerca posible de todos
ellos. Esto es lo que se trata de hacer con el mtodo de los cuadrados mnimos.
Entonces, tenemos una serie de valores de la variable X, para cada uno de los
cuales se mide la variable Y:

X
X1
X2
X3
X4
X5
X6
etc.

Y
Y1
Y2
Y3
Y4
Y5
Y6

La ecuacin de la recta de regresin ser de la forma:


Y R = a + bX
Si ingresramos en esta ecuacin los valores X1 , X2 , X3 , etc. obtendramos los
valores de Y de la regresin: Y1R , Y2R , Y3R , etc. Las diferencias entre estos valores
calculados y los valores Y medidos se denominan residuos:

(Y
(Y
(Y

)
Y )
Y )

R
1

Y1

R
2

R
3

...............
etc.
Si elevamos las diferencias o residuos al cuadrado y sumamos estos
cuadrados, obtenemos una cantidad denominada suma de cuadrados alrededor
de la regresin:

(Y

Yi = ( a + b X i ) Yi

De todas las rectas posibles que pasan por los puntos representados en el
grfico, la recta de regresin debe ser la que haga mnima esa suma de
cuadrados. Observemos que en dicha suma de cuadrados conocemos los valores
Xi , Yi (Son la mediciones que realizamos) y deseamos conocer a y b, que son los
coeficientes de la ecuacin de regresin. Para obtenerlos se calcula el mnimo de
la suma de cuadrados y de las ecuaciones resultantes se despejan las frmulas de
ambos coeficientes, que son como sigue:

b=

n X i Yi X i Yi
n X 2

( X )

a = Y b X
donde
X =

X
n

Y=

Son los promedios de Xi e Yi respectivamente y n es el nmero de pares


de observaciones Xi , Yi

De esta forma, Cmo podemos conocer cual es el

grado de vinculacin entre ambas variables? Para ello, calculamos el Coeficiente


de Correlacin, que es un nmero real entre 0 y 1 que nos da el grado de
correlacin entre dos variables X e Y. Cuando este coeficiente es 0, la correlacin
entre ambas variables no existe; cuando es 1, hay una correlacin perfecta, es
decir, tenemos una relacin funcional entre ambas. El coeficiente de correlacin es
el cociente entre la Covarianza y las desviaciones standard de X e Y:

R=

Cov( X , Y )
s X sY

( X

( X

)(

X Yi Y

) (Y Y )
2

AJUSTES DE CURVAS.

Cuando se quiere estudiar la relacin entre


recurrir a dos tipos de modelos:

variables se puede

a) Modelo Determinstico, la relacin viene definida a travs de una


frmula. Por ejemplo, sea y = x2, entonces se dice que y est en funcin
de x, donde y se conoce como variable dependiente y x variable
independiente. La caracterstica fundamental de este modelo es que
para un valor particular de x siempre obtenemos el mismo resultado en
y, esto significa que la relacin entre las variables es perfecta. Ver
grfica.
y
10
8
6
4
2
0
-4

-3

-2

-1

b) Modelo Probabilistico, la relacin entre las variables no es perfecta, ya


que debido a una perturbacin aleatora (ruido) a veces para un mismo valor
de la variable independiente x se obtienen valores diferentes para y. En este
caso, no se obtiene una curva sino un diagrama de dispersin.
Considerando el ejemplo anterior, y = x2 + donde es un ruido. Ver
grfica.

10
8
6
4
2
0
-4

-3

-2

-1

Por tanto, los modelos probabilsticos son tiles cuando se realizan


investigaciones del tipo experimental donde a pesar de mantener fijo los
valores de la variable independiente ocurren fluctuaciones debido
fundamentalmente a errores de medicin, de los equipos, etc. En el
presente trabajo estamos interesados en este tipo de modelos. A
continuacin mencionamos los modelos de ajustes ms usados:
Regresin simple: Se define como la curva que optimiza (minimiza),
mediante el mtodo de los mnimos cuadrados, los saltos o fluctuaciones de
los datos. Es decir, es la curva que mejor ajusta los valores del diagrama de
dispersin convirtiendo el modelo probabilstico en un modelo determinstico
con la finalidad de realizar predicciones. De igual forma, la curva de
regresin permite modelar la tendencia de los valores. Los modelos de
regresin simple vienen definidos por y = f(x)+. A continuacin veamos los
distintos modelos con su respectivo ajuste o curva de regresin:

Modelos Probabilsticos
a) Lineal:

Curva de Regresin
y = ax + b (lnea recta)

y = ax + b +

18

18

16

16

14

14
12

12

10

10

0
0

0
0

b) Polinmico:
orden dos:

y = ax 2 + bx + c +

(parbola)

y = ax 2 + bx + c

30

30

25

25
20

20

15

15

10

10

0
0

orden tres:

y = ax 3 + bx 2 + cx + d +

y = ax 3 + bx 2 + cx + d

800

800
700
600
500

700
600
500
400

400
300
200
100
0

300
200
100
0

10

10

c) Logartmico:

y = aLn( x) + b +

y = aLn( x) + b

12
14

10

12

10

4
2

0
0

10

0
0

10

y = ax b +

d)Potencial:

y = ax b

140

120

120
100

100
80

80

60

60

40

40

20

20

0
0

10

0
0

10

y = ae bx

y = ae bx +

e) Exponencial:

1,00

1,00
0,90
0,80

0,90

0,70
0,60

0,70

0,50

0,50

0,40
0,30

0,40

0,20
0,10

0,20

0,80
0,60

0,30
0,10

0,00
0

10

0,00
0

10

El procedimiento en un anlisis de regresin consiste en calcular


los estimadores ( a , b, c y d ) que definen la curva que mejor ajusta los
datos. En la actualidad, existen paquetes estadsticos que permiten
calcular los estimadores y la curva de regresin directamente, sin
necesidad de realizar los clculos manualmente. (Excell, Statgraph,
SSPS y otros).

REGRESION MULTIPLE:
Existen diferentes modelos de regresin mltiple, pero uno de los que tiene
ms uso es el modelo lineal. Cuando la variable respuesta o dependiente de un
modelo probabilstico est en funcin de dos o ms variables se dice que es un
modelo de regresin mltiple, esto es:

y = f(x1, x2, ...,xn) + .

Regresin mltiple lineal.

Modelo probabilstico:

y =a1x1 +a2x2 +...+anxn +b+

Modelo determinstico:

y = a1 x1 + a 2 x 2 + ... + a n x n

Todo modelo de regresin simple

puede representarse en el plano

Cartessiano (bidimensional) puesto que se requiere de un eje para representar la


variable independiente (x) y otro para las observaciones (y). Para el caso de
regresin mltiple solamente hay una representacin espacial, cuando se tienen
dos ejes para las variables independientes (x1 y x2) y otro para las observaciones
(y), es decir, modelos de la forma y = f(x1, x2). Ver grfica.

En el espacio la ecuacin de
regresin, viene dada por
un plano

Plano de
regresi
n

x2

x1

Para modelos donde el nmero de variables independientes es igual o mayor que 3,


es imposible realizar una representacin grfica, No obstante la ecuacin de
regresin se le llama hiperplano.

BIBLIOGRAFIA

1. ARVELO, Francisco. 525 Problemas. Probabilidad, Estadstica, Matemtica,


Control de Calidad. Ed. Litexto, Caracas.
2. ADAM, E. y EBERT, R.(199

Adminisracin de la Produccin y las

Operaciones. Prentice Hall, U.S.A.


3. AZORIN, Francisco.(1972) Curso de Muestreo y sus Aplicaciones. Aguilar
Madrid.
4. BOWXER, A. Lieberman (1986), G. Estadstica para Ingenieros. Prentice
Hall, Mxico.
5. COCHRAN, William (1964). Sampling Techhiques, John Wiley Sons.USA.
6. DELNU. Servicios Gerenciales S.R.L (1980).

Prcticas de Control de

Calidad. Caracas.
7. DIAZ, Eduardo (1994). Aplicaciones Prcticas de la Estadstica en el
Control de la Calidad. UNEG.
8. GARCIA, Silvio.(1989) Control Estadstico de la Calidad. Folleto Mocarpel,
9. GUERRA , J. y SEVILLA E.(1992) Introduccin al anlisis estadstico para
procesos. Habana.

10. ISHIKAWA, kaoru (1991). Qu es Control de Calidad. Norma.

11.KUME,

Hitoshi.(1992)

Herramientas

Estadsticas

Bsicas

para

el

mejoramiento de la calidad. Editorial Norma. Colombia.


12. MENDENHALL, William (1997). Probabilidad Y Estadstica para Ingeniera.
Prentice Hall.
13. MILLER, Irwin.(1986) Probabilidad y Estadstica para Ingenieros. Irwin
Mxico Prentice-hall Hispanoamericana.