Vous êtes sur la page 1sur 156

UNIVERSIDAD TECNOLGICA DE QUERTARO

MANUAL DE MTODOS ESTADSTICOS PARA TECNICO SUPERIOR UNIVERSITARIO TECNOLOGA AMBIENTAL

Compilador: Joaqun Antonio Quiroz Carranza


1

CONTENIDO INTRODUCCIN .................................................................................................... 3 CONCEPTOS GENERALES ................................................................................... 4 DATO, INFORMACIN Y CONOCIMIENTO ....................................................... 4 RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS ....................... 8 ESTADSTICA: CONCEPTOS GENERALES ......................................................... 9 TABLA DE FRECUENCIAS .................................................................................. 21 DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA CALIDAD ........................................................................................................... 30 MEDIDAS DE TENDENCIA CENTRAL ................................................................. 39 TEORA DE CONJUNTOS .................................................................................... 58 TEORIA DE PROBABILIDAD................................................................................ 78 DISTRIBUCIN DE PROBABILIDAD ................................................................... 91 DISTRIBUCIN DE PROBABILIDAD BINOMIAL ................................................. 92 DISTRIBUCIN DE PROBABILIDAD CONTINUA .............................................. 104 ESTIMACIN DE INTERVALO DE CONFIANZA ............................................... 116 PRUEBA DE HIPOTESIS.................................................................................... 124 REGRESIN LINEAL SIMPLE .......................................................................... 133 GRFICOS DE CONTROL ................................................................................. 141

INTRODUCCIN

Todas las actividades cotidianas que realizan los seres humanos, implican la toma de decisiones. Estas, para asumirse, requieren de informacin y conocimiento, los cuales son resultado de la obtencin, organizacin, procesamiento y anlisis de datos. Por ello se puede afirmar que de forma emprica o sistemtica todos los seres humanos aplican mtodos estadsticos en su vida cotidiana, muchas de las veces sin reconocer esta habilidad. Este Manual de Mtodos Estadsticos tiene el objetivo de que el Tcnico Superior Universitario reflexione diversos conceptos y ejercite habilidades en el manejo y anlisis de datos mediante diversos mtodos estadsticos. Lo ms relevante de estos apuntes es su orientacin hacia el autoaprendizaje o el aprendizaje autnomo, por lo que cada apartado presenta una parte conceptual y otra con ejercicios y repasos Es necesario que como actividad transversal de la asignatura, los estudiantes conformen equipos de trabajo, elijan un tema de inters relacionado con el plan de estudios, busquen informacin bsica, elaboraren un cuestionario sobre el tema, lo apliquen en el lugar correspondiente a un mnimo de 30 personas y procesen los datos con las distintas tcnicas que se presentan a lo largo del curso como son tablas de frecuencia, elaboracin de histogramas, calculo de medidas de tendencia central y dispersin, entre otras. Lo anterior, es con el fin de tener una aplicacin de los mtodos estadsticos, sobre una porcin de la realidad de inters por parte de estudiantes, que conformen cada uno de los equipos. Este Manual de Mtodos estadsticos se complementa con procedimientos detallados para realizar las aplicaciones o clculos en Excell, Word o Power point.

CONCEPTOS GENERALES
DATO, INFORMACIN Y CONOCIMIENTO

El dato es una representacin simblica (numrica, alfabtica, algortmica etc.), un atributo o una caracterstica de una entidad (fenmeno, organismo, organizacin, u objeto). El dato no tiene sentido en s mismo, pero s recibe un tratamiento o procesamiento apropiado, se puede utilizar en la realizacin de clculos o toma de decisiones o en la descripcin de sucesos y entidades. Los datos son comunicados por varios tipos de smbolos tales como las letras del alfabeto, nmeros, movimientos de labios, puntos y rayas, seales con la

mano, dibujos, etc. Estos smbolos se pueden ordenar y reordenar de forma utilizable para generar informacin. Los datos son smbolos que describen condiciones, hechos, situaciones o valores y se caracterizan por no contener ninguna informacin. Un dato puede significar un nmero, una letra, un signo ortogrfico o cualquier smbolo que represente una cantidad, una medida, una palabra o una descripcin. La importancia de los datos est en su capacidad de asociarse dentro de un contexto para convertirse en informacin. Por si mismos los datos no tienen capacidad de comunicar un significado y por tanto no pueden afectar el comportamiento de quien los recibe. Para ser tiles, los datos deben convertirse en informacin para ofrecer un significado, conocimiento, ideas o conclusiones. EL CONCEPTO DE INFORMACIN La informacin no es un conjunto cualquiera de datos. Es una coleccin de hechos significativos y pertinentes para el organismo u organizacin que los percibe ya que describen sucesos o entidades.

Para ser significativos, los datos deben constar de smbolos reconocibles, estar completos y expresar una idea no ambigua. Los smbolos de los datos son reconocibles cuando pueden ser correctamente interpretados. La integridad de los datos significa que todos los datos requeridos para responder a una pregunta especfica estn disponibles. Los datos son inequvocos cuando el contexto es claro. Tenemos que conocer el contexto de estos smbolos antes de poder conocer su significado. Los datos son pertinentes o relevantes cuando son utilizados para responder a preguntas propuestas. Como se dispone de un considerable nmero de hechos en nuestro entorno. Solo los hechos relacionados con las necesidades de informacin son pertinentes. DIFERENCIA ENTRE DATOS E INFORMACIN Los datos a diferencia de la informacin son utilizados con diversos mtodos para organizarlos y presentarlos a fin de permitir una transmisin o

almacenamiento ms eficaces. La cantidad de informacin de un mensaje puede ser entendida como el nmero de smbolos posibles que representan el mensaje, los smbolos que representan el mensaje no son ms que datos significativos. En su concepto ms elemental, la informacin es un mensaje con un contenido determinado emitido por una entidad hacia otra y, como tal, representa un papel primordial en el proceso de la comunicacin, a la vez que posee una evidente funcin social. A diferencia de los datos, la informacin tiene significado para quien la recibe, por eso, los seres humanos siempre han tenido la necesidad de cambiar entre s informacin que luego transforman en acciones. La informacin es un conjunto de datos procesados con significado, propsito y utilidad.

PRINCIPALES CARACTERSTICAS DE LA INFORMACIN En general la informacin tiene una estructura interna y puede ser calificada segn varios aspectos:

Significado: Qu quiere decir?, del significado de una informacin, cada individuo evala las consecuencias posibles y adeca sus actitudes y acciones de manera acorde a las consecuencias previsibles que se deducen del significado de la informacin.

Importancia relativa al receptor: Trata sobre alguna cuestin importante? se refiere al grado en que cambia la actitud o la conducta de los individuos.

Vigencia: Es actual o desfasada? En la prctica la vigencia de una informacin es difcil de evaluar, ya que en general acceder a una informacin no permite conocer de inmediato si dicha informacin tiene o no vigencia.

Validez: El emisor es fiable o puede proporcionar informacin falsa? Valor: Qu tan til resulta la informacin para el destinatario?

USOS DE LA INFORMACIN Se considera que la generacin y/o obtencin de informacin persigue estos objetivos:

Aumentar o mejorar el conocimiento del usuario. Reducir la incertidumbre existente sobre un conjunto de alternativas lgicamente posibles.

Facilitar la gestin y toma decisiones Proporcionar elementos parta la evaluacin y el control.

EL CONCEPTO DE CONOCIMIENTO El conocimiento puede definirse como:

1. Hechos, informacin e ideas adquiridas por una persona a travs de la experiencia o la educacin, la comprensin terica o prctica de un tema. 2. Lo que se conoce en un campo determinado o en su totalidad. 3. Conciencia o familiaridad adquirida por la experiencia de un hecho o situacin. La adquisicin de conocimiento implica procesos asociacin y

cognitivos complejos: percepcin, razonamiento.

aprendizaje, comunicacin,

Las ciencias constituyen uno de los principales tipos de conocimiento. Las ciencias son el resultado de esfuerzos sistemticos y metdicos de investigacin en busca de respuestas a problemas especficos, al funcionamiento y relacin de los fenmenos, y cuya elucidacin procura ofrecernos una representacin adecuada del universo. Hay tambin, muchos tipos de conocimiento que, sin ser cientficos, no dejan de estar perfectamente adaptados a sus propsitos: el saber hacer en la artesana, el saber nadar, entre otros; el conocimiento de la lengua, de las tradiciones, leyendas, costumbres o ideas de una cultura particular; el conocimiento que los individuos tienen de su propia historia: su propio nombre, la historia de sus padres, su pasado, etc., o an los conocimientos comunes a una sociedad dada, incluso a la humanidad: saber para qu sirve un martillo, saber que el agua extingue el fuego, etc. Los conocimientos se adquieren mediante experiencia, una pluralidad de procesos

cognitivos: percepcin, memoria,

razonamiento,

enseanza-

aprendizaje, testimonio de terceros, etc. Estos procesos son objeto de estudio de la ciencia cognitiva. Por su parte, la observacin controlada, la experimentacin, la modelizacin, la crtica de fuentes, las encuestas y otros procedimientos que son especficamente empleados por las ciencias, pueden considerarse como un refinamiento o una aplicacin sistemtica de los anteriores.

El conocimiento se deriva de la informacin, as como la informacin se deriva de los datos. Para que la informacin se convierta en conocimiento es necesario realizar acciones como: Comparacin con otros elementos. Prediccin de consecuencias. Bsqueda de conexiones. Conversacin con otros portadores de conocimiento.

RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS


LA RECOLECCIN DE DATOS La recoleccin de datos se refiere al uso de una gran diversidad

de tcnicas y herramientas que pueden ser utilizadas por el acopio de datos, que permitan desarrollar sistemas de informacin, los cuales pueden ser entrevistas, encuestas, cuestionario, observaciones, diagramas de flujo, censos, registros, entre otros. Todos estos instrumentos se aplican en un momento determinado, con la finalidad de buscar informacin que ser til a una investigacin particular. CLASIFICACIN DE DATOS Las caractersticas o propiedades de los organismos o entidades que son recolectados en forma de datos, son el producto de las observaciones o mediciones que se hace sobre ellos. 8

Los datos o caractersticas de fenmenos u objetos, los cuales una vez organizados y analizados dan informacin sobre su estado, pueden

ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos Los datos cualitativos: representan caractersticas de clase o tipo y no de

cantidad. Ejemplo: Si se desea clasificar a los estudiantes que cursan una determinada asignatura por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos, en unin libre o concubinato. Los datos cuantitativos: son aquellos cuyo valor representa diferentes magnitudes. Ejemplo: Se clasifican los estudiantes por sus notas y se observa que los valores de los notas representan diferentes magnitudes, as mismo pueden clasificarse por su estatura, peso, velocidad, entre otros. Los datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos en diferentes semestres. Los datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo: El nmero de estudiantes de educacin superior en las distintas regiones del pas.

ESTADSTICA: CONCEPTOS GENERALES


La estadstica es una disciplina utilizada para lograr el conocimiento o el estado de un hecho o fenmeno, as como para inferir el comportamiento futuro del mismo. Lo anterior permite la toma de decisiones. POBLACIN Una poblacin es un conjunto finito o infinito de individuos, hechos u objetos que presentan caractersticas comunes o comportamientos afines. El tamao que tiene una poblacin es un factor de suma importancia en 9

el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulta en cuanto a esfuerzo, tiempo y costos necesario para hacerlo. Para solucionar este

inconveniente se utiliza una muestra estadstica. MUESTRA Muestra a una parte de la poblacin que presenta las mismas caractersticas y que la representa. Las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. A travs de la estadstica se analizan datos, previamente recolectados, de una muestra. La informacin generada se utiliza para describir el estado actual de las caractersticas de una poblacin (estadstica descriptiva) o para inferir y predecir su comportamiento futuro (estadstica inferencial) MUESTREO El muestreo es el procedimiento o tcnica para obtener una o ms muestras de una poblacin. Este se realiza una vez que se ha establecido un marco de muestreo representativo de la poblacin. As se procede a la seleccin de los elementos de la muestra. Al tomar varias muestras de una poblacin, los estadsticos que calculamos para cada muestra no necesariamente

sern iguales, y lo ms probable es que variaran de una muestra a otra. TIPOS DE MUESTREO El muestreo no aleatorio o de juicio se basa, para la eleccin de la muestra, en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria 10

ms adelante. Las muestras de juicio evitan el anlisis estadstico para hacer muestras de probabilidad. En el muestreo aleatorio o de probabilidad, todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. VARIABLES Y ATRIBUTOS Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Una variable es un smbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos. Si la variable puede tomar solamente un valor, se llama constante. Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero generalmente estos no suelen presentarse con la misma intensidad, por lo que las variables toman distintos valores. Los distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Los atributos tambin llamados caracteres cualitativos, son aquellos que no son susceptibles de medicin, es decir que no se pueden expresar mediante un nmero, por ejemplo; profesin, estado civil, sexo, nacionalidad, etc. Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas Las variables continuas se caracterizan por el hecho de que para todo tipo de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. 11

Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... no es posible encontrar valores como 1.5 estudiantes FORMAS DE OBSERVAR LA POBLACIN. Observacin directa: cuando se tiene un contacto directo con los elementos o caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se consideran datos estadsticos originales. Observacin Indirecta: cuando se hace uso de datos estadsticos ya conocidos en una investigacin anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenmenos. Observacin contina: cuando se lleva acabo de un modo permanente. Observacin peridica: cuando se lleva a cabo a travs de perodos de tiempo constantes (semanal, trimestral, semestral, anual, etc.). Observacin circunstancial: cuando se efecta en forma ocasional o espordica. Observacin Exhaustiva: cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin se habla de una observacin exhaustiva. Observacin Parcial: dados que las poblaciones en general son grandes, la observacin de todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es observar una parte de esta poblacin. Observacin Mixta: en este tipo de observacin se combinan adecuadamente la observacin exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran

12

bsicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se observa parcialmente. CENSO Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. ENCUESTA Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. Esta se efecta a travs de cuestionarios verbales o escritos que son aplicados a un determinado nmero de personas. ESTADSTICA DESCRIPTIVA Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). ESTADSTICA INDUCTIVA O INFERENCIAL Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. MEDICIN DE CARACTERES MEDICIN Existen diversas definiciones del trmino "medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la

13

cuantificacin

el

proceso

mismo

de

la

construccin de

una escala o instrumento de medicin. En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad. El problema bsico est dado por la asignacin de un numeral que represente la magnitud de la

caracterstica que queremos medir y que dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que le servira al fsico saber que el hierro tiene una

alta temperatura de fusin. NIVELES O ESCALAS DE MEDICIONES Escala Nominal o de clase: consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.

14

La asignacin de nmeros a las distintas categoras no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre stas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin, como por ejemplo la mediana. Escalas de intervalos iguales: est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin. Ejemplo: El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001. Escala de coeficientes o Razones: El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.

15

Ejemplo: En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos. MTODO PARA LA RECOLECCIN DE DATOS: En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que se desea investigar. La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuar a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o investigacin. Desventajas: si el entrevistador no obra de buena fe o no tiene

un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas. Alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes y los supervisores de estos, sobre todo si se trata de una investigacin extensa. Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar interpretaciones errneas. Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal. 16

Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el investigador. Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las preguntas es siempre fcil. Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados. INSTRUMENTOS PARA LA RECOLECCIN DE DATOS: Cuestionarios: Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es necesario elaborar un estudio de preguntas. Los cuestionarios en general, constan de las siguientes partes: a. La identificacin del cuestionario: nombre del patrocinador de la encuesta, (oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha de la entrevista. b. Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc. c. Datos propios de la investigacin, son los datos que interesa conocer para construir el propsito de la investigacin.

17

Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada por no tener ningn tipo de inters para el estudio. Consideraciones que debemos tomar en cuenta:

El cuestionario debe ser conciso; tratar en lo posible de que con el menor nmero de preguntas, se obtenga la mejor informacin.

Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla.

Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.

Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del entrevistado.

Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas procurando que se relacionen unas con otras.

TIPOS DE MUESTREO

Muestreo probabilstico: consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo: Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemtico Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra.

Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el 18

intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,..., 98 Muestreo aleatorio estratificado Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato. En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

La operacin sealada es: 200 x 20 / 600= 6.6 7 150 x 20 / 150= 5 150 x 20 /150= 5 100 x 20 /100= 3.3 3 Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin. 19

Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral.
TABLA DE NMEROS ALEATORIOS

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789 4849 5051 5046 4756 4738 5350 4746 4847 4846 2346 5692 9870 3583 8997 1533 6466 8830 7271 3809 4256 2080 3828 7880 0586 8482 7811 6807 3309 2729 2235 1039 3382 7600 1077 4455 8806 1822 1669 7501 8330 6477 5289 4092 4223 6454 7632 7577 2816 9002 2365 4554 6146 4846 4647 5034 4646 5139 5355 5249 2224 0772 2160 7236 0812 4195 5589 0830 8261 9232 0902 0092 1629 0377 3590 2209 4839 6332 1490 3092 2390 7315 3365 7203 1231 0546 6612 1038 1425 2709 3092 5775 7517 8974 3961 2183 5295 3096 8536 9442 2392 5500 2276 6307 2346 1285 7000 5306 0414 3383 2303 3251 8902 8843 2112 8567 8131 8116 5270 5994 9092 4675 1435 2192 0874 2897 0262 5092 5541 4014 2113 3543 6130 4247 4859 2660 7852 9096 0578 0097 1324 3521 8772 6612 0721 3899 2999 1263 7017 8057 3443 5573 9396 3464 1702 9204 3389 5678 2589 0288 6343 7478 7569 7551 3380 2152 5411 2647 7242 2800 3432 3339 2854 9691 9562 3252 9848 6030 8472 2266 3255 5505 8474 3167 8552 5409 1556 4247 4652 2953 9854 6381 2086 5457 7703 2758 2963 8167 6712 9820 5324 0935 5565 2315 8030 7651 5189 0075 9353 1921 0222 2605 3973 8204 4143 2677 0034 8601 3340 8383 3243 7277 9889 0390 5579 4620 5650 0210 2082 4664 5643 5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

7227 0104 4141 1521 9104 5563 1392 8238 4882 2324 8506 6348 4612 8252 1062 1757 0964 2983 2244 7654 5086 0303 7423 3298 3979 2831 2257 1508 7642 1245 3690 2492 7171 7720 6509 7549 2330 5733 4730 4534 0813 6790 6858 1489 2669 3743 1901 4971 8280 0835 6905 7127 5933 1137 7583 6450 5658 7678 3444 3754 8387 5323 3753 1859 6043 0294 5110 6340 9137 6323 4094 4957 0163 9717 4118 4276 9465 8820 4127 0202 4951 3781 5101 1815 7068 6379 7252 1086 8919 2093 9047 0199 5068 7447 1664 9278 1708 3625 2864 0204 7274 9512 0074 6677 8676 0222 3335 1976 1645 3203 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233 2402 6250 9362 7373 4757 1716 1942 0417 5921 5345 5295 7385 5474 2123 7035 9983 5192 1840 6176 5756 5177 1191 2106 3351 5057 0967 4538 1246 3374 0304 4344 4044 4549 4443 4249 4948 4151 5152 4240 4737 7343 4706 4440 4646 4548 4742 4746 5253 4749 4689

20

TABLA DE FRECUENCIAS
Definicin Las tablas de frecuencias o tabla de relaciones es una herramienta estadstica que se usa para ordenar o tabular datos o valores, que previamente fueron obtenidos de una o ms variables de una muestra. Con ellas, un conjunto de datos desordenados pasa a ser una coleccin ordenada e inteligible. Para construir cualquier tipo de histograma o representacin grfica se necesita primero agrupar los datos en una tabla la cual se conoce como tabla de frecuencias. En el caso de datos numricos continuos (ejemplo: 9.5, 6.7, 8.4) los datos se agrupan en intervalos. Un intervalo es un conjunto de nmeros que se corresponden con los puntos de una recta o segmento, en el que se encuentra un ordenamiento interno entre ellos. El intervalo es el espacio que se da de un punto a otro en el cual se toman en cuenta todos los puntos intermedios. Ejemplo: en una recta tenemos un intervalo: [-2,2] entre este espacio se encuentran los nmeros (-2-1,0,1,2), esto es un intervalo.....ya que el espacio abarca una serie de nmeros consecutivos que se corresponden entre s.

Los intervalos deben poseer las siguientes caractersticas: 1. Todos deben ser del mismo ancho. 2. No se deben solapar. 3. Todos los datos deben caer en uno de los intervalos. 4. Deben haber un total de entre 5 y 15 intervalos (en dependencia del fenmeno de estudio)

21

La frecuencia indica el nmero de repeticiones de cualquier hecho, fenmeno o suceso, la frecuencia de un intervalo es el nmero de datos que se encuentran en l. Construccin de una tabla de frecuencias Las tablas de frecuencia sirven para preparar representaciones grficas como el histograma de frecuencias: Un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En este grfico en su eje vertical (Y) se representan las frecuencias y en el eje horizontal (X) los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Las representaciones grficas se usan para resaltar la diferencia entre las clases en que se han agrupado los datos. El histograma se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso. Para preparar la tabla de frecuencia para un histograma se procede con los siguientes pasos: Primero, se establece el nmero de intervalos que se desea tener. Segundo, se debe determinar el ancho comn de los intervalos. Para esto, se calcula la diferencia del dato mayor y el dato menor, y se divide entre el nmero de intervalos deseados. Este resultado se redondea al entero mayor ms cercano. Por ejemplo, si se desea tener 10 intervalos y encontramos que el dato mayor es 35 y el menor es 12. El ancho comn se determina: 35-12= 23/10= 2.3 o 2 22

Tercero, se determina el lmite superior de cada intervalo. Este valor sirve como demarcador y corresponde al valor mayor que se encontrar en el intervalo. Para determinar el lmite superior de cada intervalo procedemos de la manera siguiente: Ejemplo 1: Al preparar una tabla de frecuencia de cinco intervalos para el conjunto de los siguientes 20 datos: 5, 7, 8, 3, 7, 7, 1, 9, 6, 8 5, 6, 7, 8, 7, 9, 6, 8, 6, 6 1. Definicin de ancho de intervalo: Dato mayor- dato menor / nmero de intervalos deseados 9-1=8 / 5= 1.6 = 2 Como el dato menor es 1, seleccionaremos a 2 como lmite superior del primer intervalo. Entonces, el lmite superior del segundo intervalo ser 2 + 2 = 4; el del segundo ser 4+ 2 = 6 y as sucesivamente, obtenemos que los lmites superiores para los restantes intervalos son: 8, 10, 12. Por tanto, la tabla de frecuencia es:
Frecuencia absoluta
1/20= 0.05 1/20 = 0.05 7/20= 0.35 9/20= 0.45 2/20= 0.1

Datos
1 3 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 9 9

Intervalo
0-2 2-4 4-6 6-8 8-10

Frecuencia
1 1 7 9 2

Frecuencia relativa %
5 5 35 45 10

100

23

Determinacin de la frecuencia en Excell En Excel se puede calcular de manera automtica la tabla de frecuencia de un conjunto de datos. Paso 1: Ingresar los nmeros en la columna A, empezando en A1. Presione la tecla "ENTER" despus de cada uno de los datos. Paso 2: Calcule el ancho comn de los cinco intervalos y las lmites superiores de cada uno: Dato mayor = 9, Dato menor = 1, por tanto Los lmites superiores son: 2, 4, 6, 8, 10. Paso 3: En la columna B, empezando en B1 ingrese 2, 4, 6, 8. No es necesario ingresar el lmite superior del ltimo intervalo 10. Esto se debe a que en Excel, se entiende que el ltimo intervalo contendr a todos los valores mayores que el lmite superior del intervalo anterior. De la misma forma Excel sobre entiende que el primer intervalo incluye todos los valores menores que su lmite inferior. Paso 4: Como el histograma tendr 5 intervalos, contiguas: c3:c7. Paso 5: En la barra men seleccione la opcin frmulas, seleccione el submen ms funciones, posteriormente estadsticas y el botn de frecuencia: =frequencia(a1:a20, b1:b4) Observe que la primera parte contiene la lista de datos entre la a1 y la a20. Despus se coloca una coma y un espacio. La segunda parte contiene la lista de lmites superiores de cada intervalo b1:b4. se seleccionan 5 celdas

24

En la barra de datos se ingresan los valores de la columna a (a1:a20) y en la de grupos los valores de la columna b (b1:b4), se presiona aceptar. Paso 6: Presione simultneamente las teclas Control-Shift-Enter. Ver que se desplegarn una lista de cinco nmeros. Estos corresponden a la frecuencia de cada intervalo. Ejercicios: 1. Para cada uno de los siguientes, se indica el nmero de intervalos deseados, el dato mayor y el dato menor. Determine el ancho comn de los intervalos. 1. Nmero de intervalos deseados es 5; dato mayor = 20; dato menor = 4. 2. Nmero de intervalos deseados es 5; dato mayor = 30; dato menor = 8. 3. Nmero de intervalos deseados es 8; dato mayor = 20; dato menor = 4. 4. Nmero de intervalos deseados es 10; dato mayor = 100; dato menor = 8. 5. Nmero de intervalos deseados es 10; dato mayor = 50; dato menor = 20.

Histograma de frecuencias En estadstica un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables. Tipos de histograma Diagramas de barras simples. Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categora que representa.

25

Polgono de frecuencias. Es un grfico de lneas que se usa para presentar las frecuencias absolutas de los valores de una distribucin en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.

Construccin de un histograma Paso 1 Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. Ejemplo: 9-1= 8 Paso 2 Obtener los nmeros de clases, existen varios criterios para determinar el nmero de clases (o barras), sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30 (nmero de datos) es mayor que cinco, por lo que se seleccionan seis clases. Ejemplo: 20 datos, raz de 20= 4.47 = 5 clases Paso 3 Establecer la longitud de clase: es igual al rango dividido por el nmero de clases. Ejemplo: 8/5= 1.6 =2 Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relacin al resultado del PASO 2 en intervalos iguales. 2 Paso 5 Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un grfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectngulos se obtiene el polgono de frecuencias. 26

Elaboracin de un histograma de frecuencias en Excell

Una vez que est disponible la tabla de frecuencias en el programa Excell, se hace click en datos, opcin del men superior. En datos se busca la opcin anlisis de datos, si no se encuentra disponible, se carga siguiendo las indicaciones de ayuda. Una vez instalado la opcin anlisis de datos, se hace click y se selecciona la opcin histograma, colocando en la celda Rango de entrada el total de los datos de la columna A1 y en la celda Rango de clases los datos de la columna B, damos click en crear grfico y nos despliega una representacin como la siguiente:

Histograma
10 Frecuencia 8 6 4 2 0 2 4 6 Clase 8 y mayor... Frecuencia

Polgono de frecuencias

Un polgono de frecuencias es un grfico que se realiza a travs de la unin de los puntos ms altos de las columnas de un histograma de frecuencia. Un polgono de frecuencias permite representar, por ejemplo, las temperaturas mximas promedio de un pas en un periodo de tiempo. En el eje X (horizontal), pueden sealarse los meses del ao (enero, febrero, marzo, abril, etc.) En el eje Y (vertical), se indican 27

las temperaturas mximas promedio de cada mes (24, 25, 27, etc.). El polgono de frecuencias se crea al unir, con una lnea, todas las temperaturas mximas promedio.

Elaboracin de un Polgono de frecuencias en Excell

Una vez que disponemos del histograma de frecuencias, se coloca en cursor sobre el grfico y se presiona el botn derecho del mouse. En el men que se despliega se puede observar la opcin cambiar tipo de grfico, se hace click y se selecciona el grfico deseado, el cual puede quedar como la siguiente imagen.

Polgono de Frecuencia
Frecuencia 10 5 0 2 4 6 Clase 8 10 Frecuencia

28

Tabla de frecuencia e histograma en Excell


A B

29

DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA CALIDAD


Concepto de Diagrama de Pareto El diagrama de Pareto es una herramienta que se utiliza para priorizar los problemas o las causas que los generan. El nombre de Pareto fue dado por el Dr. Juran en honor del economista italiano WILFREDO PARETO (1848-1923) quien realiz un estudio sobre la distribucin de la riqueza, en el cual descubri que la minora de la poblacin posea la mayor parte de la riqueza y la mayora de la poblacin posea la menor parte de la riqueza.

El Dr. Juran aplic este concepto a la calidad, obtenindose lo que hoy se conoce como la regla 80/20. Segn este concepto, si se tiene un problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del problema y el 80 % de las causas solo resuelven el 20 % del problema. Se recomienda el uso del diagrama de Pareto para: Identificar oportunidades para mejorar Identificar un producto o servicio para el anlisis de mejora de la calidad. Si se requiere llamar la atencin a los problemas o causas de una forma sistemtica. Analizar las diferentes agrupaciones de datos. Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones Evaluar los resultados de los cambios efectuados a un proceso comparando sucesivos diagramas obtenidos en momentos diferentes, (antes y despus) Cuando los datos puedan clasificarse en categoras Cuando el rango de cada categora es importante Para comunicar fcilmente a otros miembros de la organizacin las conclusiones sobre causas, efectos y costes de los errores. 30

Los propsitos generales del diagrama de Pareto son: Analizar las causas Estudiar los resultados Planear una mejora continua La Grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante prestar atencin y de esta manera utilizar todos los recursos necesarios para llevar a cabo una accin de mejora sin malgastar esfuerzos en problemas triviales. Algunos ejemplos de tales minoras de caractersticas vitales seran:

La minora de clientes que representen la mayora de las ventas. La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de desperdicio de los costos de re-trabajo. La minora de rechazos que representa la mayora de quejas de los clientes. La minora de vendedores que est vinculada a la mayora de partes rechazadas. La minora de problemas causantes del grueso del retraso de un proceso. La minora de productos que representan la mayora de las ganancias obtenidas. La minora de elementos que representan la mayor parte del costo de un inventario etc.

Ejemplo de aplicacin del diagrama de Pareto:

Un fabricante de accesorios plsticos desea analizar cules son los defectos ms frecuentes que aparecen en las unidades al salir de la lnea de produccin. Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos:

31

Tipo de defecto Mal color Fuera de medida Mal terminacin Rotura Desbalanceo Aplastamiento Incompleto Mal alabeo Otros

Detalle del problema El color no se ajusta a lo requerido por el cliente Ovalizacin mayor a la admitida Aparicin de rebabas El accesorio se quiebra durante la instalacin El accesorio requiere contrapesos adicionales El accesorio se aplasta durante la instalacin Falta alguno de los insertos metlicos Nivel de alabeo no aceptable Otros defectos

Posteriormente, un inspector revisa cada accesorio a medida que sale de la produccin registrando sus defectos de acuerdo con dichos tipos. Al finalizar la jornada, se obtuvo una tabla como esta. Tipo defecto de Detalle del problema Frec Frec. rel % 42.6 Acum % 42.6

Aplastamiento

El accesorio se aplasta durante la 40 instalacin El accesorio se quiebra durante la 35 instalacin

Rotura

37.2

79.8

Fuera medida Mal color Mal alabeo Mal terminacin

de Ovalizacin mayor a la admitida

8.5

88.3

El color no se ajusta a lo requerido Nivel de alabeo no aceptable Aparicin de rebabas

3 3 2

3.2 3.2 2.1

91.5 94.7 96.8

32

Incompleto Desbalanceo

Falta alguno de los insertos metlicos El accesorio adicionales Otros defectos requiere

2.1 1.1

98.9 100

contrapesos 1

Otros TOTAL

0 94

100

La tercera columna muestra el nmero de accesorios que presenta cada tipo de defecto, es decir, la frecuencia con que se presenta cada defecto. En lugar de la frecuencia numrica podemos utilizar la frecuencia porcentual, es decir, el porcentaje de accesorios en cada tipo de defecto, lo cual se indica en la cuarta columna. En la ltima columna vamos acumulando los porcentajes

Para hacer ms evidente los defectos que aparecen con mayor frecuencia hemos ordenado los datos de la tabla en orden decreciente de frecuencia. Vemos que la categora otros siempre debe ir al final, sin importar su valor. De esta manera, si hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.

Podemos ahora representar los datos en un histograma como el siguiente:

33

Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos encontrados en el lote pertenece slo a 2 tipos de defectos (los pocos vitales), de manera que si se eliminan las causas que los provocan desaparecera la mayor parte de los defectos.

Otro anlisis complementario y sumamente til e interesante, es calcular los costos de cada problema, con lo cual podramos construir un diagrama similar a partir de ordenar las causas por sus costos.

Este anlisis combinado de causas y costos permite obtener la mayor efectividad en la solucin de problemas, aplicando recursos en aquellos temas que son relevantes y alcanzando una mejora significativa.

REPASO No. 1
Concepto 1 Dato Breve descripcin Representacin simblica de un atributo o caracterstica de un objeto (ser o fenmeno) Conjunto de datos significativos y relevantes que describen hechos, sucesos (eventos o fenmenos) Conjunto de informaciones e ideas adquiridas y ejercidas por cada persona Caracterstica o atributo de clase no numrica, ejemplos: estado civil, color de piel, idioma, religin. Caracterstica o atributo descrito en magnitudes ejemplos: altura, velocidad, temperatura, luminosidad, distancia, peso, nmero de integrantes Disciplina que describe el estado (conjunto de datos) sobre un hecho o fenmeno Disciplina que infiere, predice o estima el comportamiento futuro de un

Informacin

Conocimiento

Variable cualitativa Variable cuantitativa

Estadstica descriptiva Estadstica

34

inferencial 8 Poblacin

hecho o fenmeno Conjunto finito o infinito de individuos (objetos o seres) que presentan caractersticas o comportamientos similares: arboles, piedras, artculos, etc. Parte de una poblacin con caractersticas similares Indagatoria sobre las caractersticas de todos los individuos de una poblacin Registro de observaciones sobre una muestra de personas

9 10

Muestra Censo

11

Encuesta

12

Escala nominal

Nivel que agrupar, nombrar o categoriza objetos o fenmenos similares ejemplo: grupo de tornillos, clavos, hojas, escritorios, etc. Sin definir magnitudes Nivel que ordena objetos o fenmenos de acuerdo a sus caractersticas o atributos, usa magnitudes Nivel que organiza objetos o fenmenos en rangos o lapsos (aos, edades, ingresos) Nivel que organiza datos a partir de un punto cero (ausencia de caracterstica), ejemplo: cantidad de hijos 0, 3, 6 Herramienta estadstica para organizar (agrupar) o tabular datos de hechos o fenmenos Espacio que existe entre un punto y otro, tomando en cuenta los puntos intermedios Caracterstica o atributo que muestra valores intermedios (medidas, velocidades, temperatura, etc) Caracterstica o atributo que no muestra valores intermedios (nmero de personas o cosas, etc) Representacin esquemtica de un conjunto de datos para facilitar su observacin

13

Escala ordinal

14

Escala de intervalo Escala de razn

15

16

Tabla de frecuencias Intervalo

17

18

Variable continua Variable discreta Grafico

19

20

35

TAREA No. 1

Nombre:_______________________________________________________ 1. Seala con una X si la variable mencionada es cualitativa o cuantitativa. Si es cuantitativa, indica con una X si es variable discreta o continua. Variable
Presencia de brigadas de emergencia en empresas Peso en kg de plstico recuperado Nmero de trabajadores afiliados al IMSS Nmero de empresas certificadas como empresas limpias Vida til en horas de focos ahorradores Estado civil de los integrantes de una poblacin Registros de la precipitacin en mm en Quertaro Dimetro del tallo de una poblacin de rboles Categora de preferencia sexual de una poblacin humana Defunciones por accidentes automovilsticos en Quertaro

Cualitativa

Cuantitativa Discreta

Continua

2. Un funcionario pblico de la Junta de Agua Potable est interesado en conocer el nivel de cuidado del agua que tienen los habitantes que poseen cisterna o aljibe en sus casas. Est planeando entrevistar a 300 de esos habitantes: Define la poblacin de estudio y menciona cual es la muestra:

Elabora tres preguntas cuantitativas y tres cualitativas para responder a la inquietud planteada. 36

MTODOS ESTADSTICOS PRIMER EXAMEN

N0MBRE_________________________________________________________ Uno. Coloca el nmero del concepto que corresponda a la definicin apropiada 1 Estadstica descriptiva 8 Estado civil, preferencia sexual, opinin, religin, idioma. Mtodos y herramientas que permiten estimar la situacin o comportamiento futuro de hechos, poblaciones o fenmenos. Atributo, caracterstica de un individuo, muestra o poblacin que no es constante. Conjunto de valores entre dos puntos de una recta. Mtodos y herramientas que permiten indagar y describir el comportamiento de hechos, poblaciones o fenmenos. Porcin de una poblacin. Temperatura, luminosidad. velocidad, longitud, altura,

Poblacin

10

Ejemplos de variables 6 cuantitativas Ejemplos discreta Intervalo de variable 5

6 7

Variable Ejemplos continua de

9 variable 3

Ejemplos de variables 7 cualitativas Muestra 2

Grados centgrados, metros, coordenadas geogrficas. Conjunto de individuos con caractersticas similares que ocupan un espacio y tiempo determinado. Automviles, seres humanos, cabezas de ganado.

10

Estadstica inferencial

Dos. Un centro de acopio de residuos generados por actividades humanas recibi durante 50 das diversas cantidades de materiales residuales, los valores 37

fluctuaron entre 57 y 132 kg por da, el responsable desea saber cul es la cantidad ms frecuente. Define el ancho del intervalo si:
Se desean 5 intervalos de clase. = 15 Se desean 6 intervalos de clase. = 12 Se desean 7 intervalos de clase. = 11 Se desean 8 intervalos de clase. = 9 Se desean 9 intervalos de clase. = 8

Tres. En la tabla siguiente se presentan las cantidades en kilogramos de basura que depositan cotidianamente en un tiradero a cielo abierto: 687 834 862 896 925 942 975 1019 700 838 863 902 927 946 980 1044 723 851 871 908 929 949 987 1055 776 855 873 912 929 957 1008 1083 824 855 879 914 941 974 1017 1096

El histograma resultante es:

Histograma
35 30 25 Frecuencia 20 15 Frecuencia 10 5 0 800 1000 Clase 1100 y mayor...

Interpreta brevemente el grfico:

38

MEDIDAS DE TENDENCIA CENTRAL


La tendencia central se refiere al punto medio de una distribucin de datos, las medidas de tendencia central tambin se conocen como medidas de posicin. Con ellas localizamos el centro de una base de datos. La media o promedio, la moda y la mediana son las tres principales medidas de tendencia central utilizadas en la estadstica descriptiva, sirven para describir una poblacin o una muestra.

La media aritmtica o promedio La media es el valor obtenido sumando todas las observaciones y dividiendo el total por el nmero de observaciones que hay en el grupo. La media resume en un valor las caractersticas de una variable teniendo en cuenta todos los valores o datos. Esta medida se simboliza con (x con raya superior) cuando representa la media muestral (estadstico muestral) y para representar la media poblacional (parmetro poblacional). La media o es la suma de todos los valores de la muestra o poblacin, divididos por el nmero de casos. Por ejemplo, los resultados de 5 alumnos en una evaluacin fueron: 39

Alumno 1 2 3 4 5

Resultado 6.0 5.4 3.1 7.0 6.1

Primero: se suman las notas: 6.0+5.4+3.1+7.0+6.1 = 27.6 Segundo: el total se divide entre la cantidad de alumnos: 27.6/5=5.52 Tercero: La media aritmtica en este ejemplo es 5.52 Definicin formal Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas, esto es, tambin puede calcularse para variables agrupadas en intervalos.

40

Propiedades Las principales propiedades de la media aritmtica son:


Su clculo es muy sencillo y en l intervienen todos los datos. Su valor es nico para una serie de datos. Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de una medida de dispersin.

Inconvenientes de su uso Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media. Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes.

En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores extremos.

41

Una debilidad de la media aritmtica es que es sensible a valores extremos de la distribucin y que carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, siempre que sea lo ms usado. La moda es la medida de tendencia central ms fcil de calcular y tambin es la ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin. Por esta razn la moda se suele usar para una evaluacin rpida de la tendencia central. La moda se define como el valor ms frecuente de una distribucin. En una tabla de frecuencias, la frecuencia mayor es la que contiene la moda. Su clculo es sencillo, pues slo necesita un recuento. Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5. Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda.

Propiedades Sus principales propiedades son:

42

Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Este es el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social.

Esta medida se usa ms y tiene ms sentido cuando se describen datos nominales, de hecho es la nica medida de tendencia central que funciona con este tipo de escala. Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin. Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Por ejemplo: Hallar la moda de la distribucin: Datos: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

43

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas. Datos: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. Datos: 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. Datos: 0, 1, 3, 3, 5, 5, 7, 8 3+5=8/2=4 Mo = 4

Clculo de la moda para datos agrupados, si todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

44

66= Limite inferior de la clase modal (Li) 18= frecuencia absoluta inmediatamente inferior a la clase modal (fi-1) 42= Frecuencia absoluta de la clase modal (fi) 27= frecuencia absoluta inmediatamente posterior a la clase modal (fi+1) 3= amplitud de la clase (ai)

Mediana En el mbito de la estadstica, una mediana es el valor de la variable que deja el mismo nmero de datos antes y despus que l, una vez ordenados estos. De acuerdo con esta definicin el conjunto de datos menores o iguales que la

45

mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana Me de un conjunto de mediciones x1, x2, x3,..xn es el valor de x que se encuentra en el punto medio o centro cuando se ordenan los valores de menor a mayor. Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

Me

= (n+1) / 2

Me = (13+1) / 2 Me = 14 / 2=7 En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

46

Existen dos estrategias para calcular la mediana: considerando los datos en forma individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de clase. A continuacin se describe un ejemplo con datos sin agrupar. Datos sin agrupar Sean los datos de una muestra ordenada en orden creciente y

designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin

una vez que

los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: .

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9 => El valor central es el tercero: por encima de l (x4, x5). b) Si n es par, la mediana es la media aritmtica de las dos observaciones centrales. Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las posiciones y . Es decir: . . Este valor, que es la

mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del dos que quedan por encima del siguiente dato y otros . Por tanto, la

mediana de este grupo de datos es la media aritmtica de estos dos datos: .

47

Propiedades e inconvenientes Las principales propiedades de la mediana son: Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero, deja a la mediana inalterada. No se ve afectada por la dispersin. De hecho, es ms representativa que la media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica haciendo que pierda representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos. Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan bien como la media aritmtica. Comparacin entre las diferentes medidas de tendencia central Las tres medidas de tendencia central: media, mediana y moda, no son igualmente tiles para obtener la tendencia central de una distribucin o conjunto de valores (datos). Cada una de las medidas tiene caractersticas que hacen que su empleo sea una ventaja en ciertas condiciones y en otras no.

48

Medida de tendencia central Media

Ventajas y desventajas

Incorpora todos los datos de la variable y su valor suele ser ms estable. Su valor es nico para una serie de datos. Se usa con frecuencia para comparar poblaciones, es ms apropiada acompaarla de una medida de dispersin. La afecta sobremanera la dispersin, cuanto menos homogneos son los datos, menos informacin proporciona. Es sensible a valores extremos de la distribucin y carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda

Mediana

Clculo sencillo. Recomendada para variables cualitativas. Se usa ms y tiene ms sentido para datos nominales. Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. No siempre se sita hacia el centro de la distribucin. Preferida cuando se emplea una escala ordinal (situacin donde el valor asignado slo indica el orden entre los casos). Es menos sensible que la media a oscilaciones de los valores de la variable. No se ve afectada por la dispersin. No se presta a clculos algebraicos tan bien como la media aritmtica.

Para calcular la media, moda y mediana a travs de excell, se realizan los siguientes pasos: 1. Se puede utilizar la va de establecer la formula en la barra de funcin de la siguiente manera: =PROMEDIO(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =MODA(-----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =MEDIANA(-----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =DESVEST(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor.

49

=VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos con el cursor. La otra ruta es presionar el botn FORMULAS, posteriormente el de MAS FUNCIONES y all seleccionar la funcin deseada: media, moda o mediana, etc. En cada una de ellas aparece un cuadro denominado ARGUMENTO DE FUNCIN, en cuya barra inicial se seleccionan todos los valores a procesar, se da clik en aceptar y el resultado aparece en la casilla seleccionada para tal efecto. Otra va es utilizar insertar funcin fx, se despliega un men como el siguiente, donde se selecciona la funcin deseada:

50

MEDIDAS DE DISPERSIN O VARIABILIDAD Las medidas de variabilidad indican la dispersin de los datos de una distribucin. Las medidas de dispersin son intervalos, distancias o un nmero de unidades en la escala de medicin. Este tipo de medida se complementa con las medidas de tendencia central o centralidad y ambas permiten describir a la mayora de las distribuciones. Las medidas de dispersin describen la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos. Las ms comunes son: el rango, la desviacin estndar y la varianza. El rango El rango, recorrido o amplitud de un conjunto de mediciones, es la diferencia entre el valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades, en la escala de medicin, para incluir los valores mnimo y mximo. Cuanto ms grande es el rango, mayor ser la dispersin de los datos de una distribucin. El rango es adecuado para medir la variacin de pequeos conjuntos de datos. La desviacin estndar La desviacin estndar es la medida de dispersin ms ampliamente usada y es la ms estable ya que depende de todos los valores de la distribucin. La raz cuadrada de la suma de las desviaciones alrededor de la media, elevadas al cuadrado y divididas entre el nmero de casos menos uno. Cuando se trabaja con muestras la desviacin estndar se simboliza con una S y con la letra sigma minscula cuando se usan datos de una poblacin. Se calcula como la raz cuadrada de la varianza:

= n1 (xi-)2 / N

S= n1 (xi -)2 / n-1

51

en mayscula se utiliza para indicar sumatoria: 1n xi = x1 + x2 + x3 + x4+xn Donde x es el valor de cada medicin de la variable de estudio e i un ndice que vara de 1 a n. El nmero de datos de la muestra se identifica con la letra n y de la poblacin con N. La desviacin estndar se interpreta como la cantidad o el cunto se desva de la media un conjunto de valores. Este valor se grafica como un intervalo, solo se utiliza con variables continuas u ordinales. Ejemplo de clculo de desviacin estndar S, datos no agrupados:

S=((55-76.1)2+(62-76.1)2+(67-76.1)2+(68-76.1)2+69-76.1)2+(79-76.1)2+(8876.1)2+(89-76.1)2+(92-76.1)2+(92-76.1)2) /9 S= 13.6 La varianza La varianza mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra. La varianza es la desviacin estndar elevada al cuadrado y se simboliza como S2 cuando es muestral y 2 cuando es poblacional. Esta es una medida que se usa en muchas pruebas de hiptesis estadsticas inferenciales. Para fines descriptivos de prefiere usar la desviacin estndar. S2= (x-)2 / n-1 La varianza siempre ser mayor que cero. Mientras ms se aproxima al cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.

52

Para calcular la la desviacin estndar y la varianza a travs de excell, se realizan los siguientes pasos: 1. Se puede utilizar la va de establecer la formula en la barra de funcin de la siguiente manera: =DESVEST(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos con el cursor. La va rpida para el clculo de los estadsticos de tendencia central y dispersin es el uso de botn DATOS, posteriormente el de ANLISIS DE DATOS, que se ubica en la parte superior derecha. Si no est disponible se carga de la siguiente manera: Se presiona el cono de Microsoft, ubicado en la parte superior izquierda y se despliega el men. Se elige el botn de opciones de excell ubicado en la parte inferior de la pantalla anterior. En el men de opciones de excell se elige complementos. En ver y administrar complementos de excell se presiona ir ubicado en la parte inferior y se da aceptar. En complemento, colocar el curso en la casilla de anlisis de datos dar clik y aceptar. Posteriormente se carga el complemento y podemos usarlo. Ya ubicados en anlisis de datos elegimos estadstica descriptiva damos aceptar, colocamos los datos en la casilla de rango de entrada, se marca resumen de estadsticas, finalmente presionamos aceptar 53

El resultado es el siguiente:
Columna1 Media Mediana Moda Desviacin estndar Varianza de la muestra Rango Mnimo Mximo Suma Cuenta o nmero de datos de la distribucin 76.5 74 92 13.19301162 174.0555556 37 55 92 765 10

Coeficiente de variacin de Pearson El coeficiente de variacin o CV, es un cociente entre la desviacin estndar y la media de los datos, expresado en porcentaje. CV= (S/ ) 100 Este coeficiente permite comparar la variabilidad de diferentes muestras en una misma variable o la variabilidad existente entre variables diferentes. Interpretacin de las medidas de tendencia central y de dispersin o variabilidad Al describir los datos de una distribucin deben interpretarse de manera conjunta las medidas de tendencia central y de dispersin. Con la media y la desviacin estndar se pueden construir intervalos donde supuestamente estn l mayora de los datos. La moda, la mediana y el rango pueden completar la informacin sobre los datos y as comprender lo que sucede con la variable de estudio. En una variable continua: La media, la mediana y la moda son puntos en una recta La desviacin estndar y el rango son intervalos.

54

REPASO No. 2

Identifiquen y nombren los siguientes signos o formulas:

Media de la muestra

Media de la poblacin

Formula de la media

Formula de la mediana par

Formula de la mediana impar

Desviacin estndar de la muestra

Desviacin estndar de la poblacin

Formula de la Moda

n 1

(xi-) / N

Formula de la desviacin estndar de la poblacin

S=

n 1

(xi -) / n-1

Formula de la desviacin estndar de la muestra

Signo de sumatoria

55

Varianza muestral

Varianza poblacional

S = (x-) / n-1

Formula de la varianza muestral

Identifica los valores de los siguientes conceptos en la tabla:


Li es el lmite inferior de la clase modal= fi es la frecuencia absoluta de la clase modal= fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal= fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal= ai es la amplitud de la clase=

Amplitud de clase (60,63) (63.66) (66.69) (69.72) (72,75)

Frecuencia absoluta 5 18 42 27 8

Explica el cuadro siguiente:

Estadstica descriptiva Media Mediana Moda Desviacin estndar Rango Mnimo Mximo Suma Cuenta 76.5 74 92 13.1 37 55 92 765 10

56

TAREA No. 2 Nombre:_______________________________________________________

Medidas de tendencia central a) Un fabricante de filtros para chimeneas debe decidir cul de dos modelos diferentes de filtros tiene una mayor eficiencia. El fabricante basar su decisin en los resultados de cinco pruebas para ambos modelos bajo las mismas condiciones de operacin donde el mejor filtro ser aquel que presente un menor porcentaje de luz filtrada. Los resultados son los siguientes: Prueba Filtros A B 1 13.2 13.4 2 13.1 13.5 3 13.1 13.5 4 18.2 13.6 5 13.2 13.5

Con base en los datos anteriores cul de los dos filtros debe elegir el fabricante? por qu? Debera ser diferente la seleccin si el fabricante supiera que hubo un cambio en la intensidad de la energa luminosa durante la cuarta medicin del modelo A? por qu?

b) Suponga que, por un error, se registra un conjunto de datos que contiene la DQO para una muestra de agua de 713, 715, 714, 713, 716, 716 y 176 mg/L, donde el ltimo valor debi haber sido 716 en vez de 176. Muestre que tanto se ven afectadas la media y la mediana por el error cometido. c) Un fabricante de focos ahorradores de energa tom una muestra de 13 piezas de la produccin de un da y las utiliz en forma continua hasta que comenzaron a fallar. El resultado en das de funcionamiento fue: 1142, 1226, 1117, 1345, 1064, 1251, 1349, 1431, 1312, 1066, 1292, 1362, 1098. Calcule la media y la mediana. Qu medida descriptiva parece ser la mejor? Por qu? De qu forma le puede ser til esta informacin al fabricante?

d) Examinando los registros del nmero de extintores sujetos a mantenimiento a la semana por un prestador de este servicio, un auditor toma una muestra de 20 de estos registros: 8, 27, 19, 12, 34, 19, 5, 4, 12, 22, 11, 28, 12, 11, 10, 11, 8, 6, 7, 16 Calcule la media y la mediana. 57

TEORA DE CONJUNTOS
DEFINICIONES DE CONJUNTOS Algunas definiciones de conjunto son: Un conjunto es la reunin en un todo de objetos bien definidos y diferenciables entre s, que se llaman elementos del mismo. Un conjunto es una coleccin de elementos que se agrupan mediante algunas caractersticas en comn y que solo aparecen una sola vez en el grupo respectivo. Es una coleccin bien definida de objetos o cosas, donde, bien definida significa distinguir con claridad los elementos que forman parte del conjunto. Son colecciones, agrupaciones o reuniones de elementos a los cuales identificamos por tener propiedades en comn. Es una coleccin de objetos; en los que a cada uno de los objetos que componen ese conjunto se le denomina elemento del mismo. De lo dicho anteriormente, se introduce la relacin de pertenencia. El smbolo usual para representar esta relacin es el smbolo , una versin de la letra son llamados griega (psilon). Los segundos argumentos de la relacin

conjuntos, y los primeros argumentos son llamados elementos. As, si la frmula

Para representar que un elemento "a" pertenece al conjunto "A" se aplica el smbolo de pertenencia (). De esta forma a A y se lee: "a" pertenece a "A". Esta relacin se conoce como relacin de pertenencia, seala la relacin entre elementos y conjuntos exclusivamente.

58

Si un elemento no pertenece a un conjunto se denota por (), por ejemplo si b no pertenece a A se expresara como b A, que se lee: b no pertenece a A. Algunos ejemplos de pertenencia son: Conjuntos D = Un da de la semana m = mayo M = Un mes del ao l = lunes Z = Un nmero entero n=2 NZ mM Elementos Pertenencia lD

Entonces se puede decir que el smbolo se utiliza para comparar o relacionar un conjunto respecto de un elemento y nos permite relacionar la pertenencia o no, de un elemento en un conjunto. No es correcto utilizar este smbolo para comparar dos conjuntos si no que exclusivamente para relacionar elementos respecto de un conjunto.

59

Formas de describir un conjunto

1).- Enumerando todos los elementos del conjunto (solo se puede hacer si el conjunto es finito) 2).- Por medio de una propiedad caracterstica de los elementos que forman a ese conjunto, esta propiedad puede expresarse de forma ordinaria o utilizando alguna simbologa lgica. Nota: Los conjuntos se nombran con letras maysculas latinas, los elementos se colocan entre llaves, por ejemplo:

A ={0,1,2,3,4,5,6,7,8,9} B = {a,v,e,s} C = {Las soluciones de la ecuacin N = {1,2,3,4,5,6,...} = {los nmeros naturales} L={ donde n=1,2,3,4,...} }

Sin embargo, existen formas ms formales para describir el contenido de un conjunto como son las formas tabular o extensiva y la constructiva o por comprensin. DETERMINACIN DE UN CONJUNTO Para determinar la forma de describir cmo han de agruparse los conjuntos comnmente se utilizan dos formas: la tabular o extensiva y la constructiva o por comprensin.

60

La forma tabular o extensiva. Es cuando el

conjunto es determinado por

extensin (o enumeracin), cuando se da una lista que comprende a todos los elementos del conjunto y slo a esos elementos. Ejemplos: A = { a, e, i, o, u } B = { 0, 2, 4, 6, 8 } C = { c, o ,n , j, u, t, s } D = {A, B, E, C, D, R, I, O}

La forma constructiva o por comprensin. Es cuando un conjunto de elementos poseen una caracterstica o propiedad, la cumplen para todos los elementos del conjunto. Ejemplos: A = { x l x es nmero entero} B = { x I x es un nmero par menor que 10} C = { x I x es una letra de la palabra conjuntos} D = {x I x es una mujer de nacionalidad mexicana} E = {x I x es color bsico}

Cuadro comparativo de cmo describir dos conjuntos mediante la forma tabular o extensin y la forma constructiva o por comprensin.

POR EXTENSIN A = { a, e, i, o, u } POR COMPRENSIN A = { x I x es una vocal}

61

B = { 0, 2, 4, 6, 8 } C = {1, 3, 5, 7, 9 } D = { c, o, n, j, u, t, s} E = { b, c, d, f, g, h, j, .. . } F = { Laura, Javier } G = {mercurio}

B = { x I x es un nmero par menor que 10 } C = { x I x es un nmero impar menor que 10 } D = { x I x es una letra de la palabra conjuntos } E = { x I x es una consonante } F = {x I x es mdico y est en la clase} G = {x I x es un metal lquido }

Los axiomas de Zermelo-Fraenkel

La teora de conjuntos de Zermelo-Fraenkel toma como primitivos los conceptos de conjunto y de pertenencia y consiste de los diez axiomas siguientes:

Axioma de extensionalidad. Dos conjuntos X e Y son iguales (lo que se representa por X = Y) si contienen los mismos elementos. Ms formalmente, y en la simbologa usual,

Conjunto vaco. Existe un conjunto (representado por ) sin elementos. Esto es,

Axioma de pares. Dados cualesquiera conjuntos x e y, existe otro conjunto, representado por {x,y}, cuyos elementos son nicamente x e y. Esto es,

62

Axioma de la unin. Dada cualquier coleccin (conjunto) de conjuntos C, existe un conjunto, representado por y llamado unin de C, que

contiene todos los elementos de cada conjunto de C. Esto es,

Axioma del conjunto potencia Para cualquier conjunto x existe otro conjunto, representado por x. En smbolos, , que contiene todos los subconjuntos de

Esquema axiomtico de especificacin. Sea (v) una frmula de un lenguaje de primer orden que contenga una variable libre v. Entonces, para cualquier conjunto x existe un conjunto y cuyos elementos son aquellos elementos a de x que cumplen (a). Formalmente,

Esquema axiomtico de reemplazo. Si (a,b) es una sentencia tal que para cualquier elemento a de un conjunto x el conjunto existe, entonces existe una funcin

tal que f(a) = y. Formalmente, si

entonces

63

Axioma de infinitud. Existe un conjunto x tal que , entonces . En smbolos, .

y tal que si

Axioma de regularidad. Para todo conjunto no vaco x existe un conjunto tal que . Esto es, en trminos formales,

Axioma de eleccin. El producto cartesiano de cualquier familia no vaca de conjuntos no vacos es no vaco. Este axioma puede expresarse en trminos formales al igual que los otros, aunque resulta ms extenso.

Los axiomas anteriores, excepto el ltimo, constituyen la teora de ZermeloFraenkel, que se representa por ZF. Existen otros axiomas consistentes con los de ZF, como el axioma de constructibilidad y el axioma de eleccin. Una vez incorporado el axioma de eleccin a la teora ZF, la teora de conjuntos resultante se denota por ZFC. Resumen de los axiomas Dos conjuntos son iguales, s y solamente s tienen los mismos elementos. Existe un conjunto sin elementos llamado vaco. Si A y B son dos conjuntos, existe un conjunto cuyos nicos elementos son A y B. La reunin de un conjunto de conjuntos es un conjunto. Para todo conjunto A existe un conjunto que tiene por elementos las partes de A. El producto de una familia de conjuntos no vacos es un conjunto no vaco (axioma de eleccin). Ningn conjunto es elemento de s mismo. 64

CONJUNTOS FINITOS E INFINITOS Un conjunto es finito si consta de un cierto nmero de elementos distintos, es decir si al contar los diferentes elementos del conjunto el proceso de contar puede acabar. En caso contrario, el conjunto es infinito. Ejemplos: M = { x / x es un ro de la tierra } Conjunto finito N = { 0, 1, 2, 3, 4, 5, 6, 7, 8, ... } Conjunto infinito P = { x / x es un pas de la tierra } Conjunto finito V = { 3, 6, 9, 12, 15, 18, 21, 24, 27, ... } Conjunto infinito

DIAGRAMA DE VENN-EULER
El matemtico y lgico britnico, John Venn (1834 1923) es especialmente conocido por su mtodo de representacin grfica de proposiciones (segn su cualidad y cantidad) y silogismos. Los diagramas de Venn permiten, adems, una comprobacin de verdad o falsedad de un silogismo. Entre sus obras destaca Lgica Simblica y los principios de la lgica emprica o inductiva. Sin embargo, tambin fue importante la participacin de Euler en la esquematizacin de las representaciones de algunas operaciones. Cada conjunto de elementos se encuentra encerrado dentro de un circulo, o figura geomtrica, y estos a su vez estn encerrados dentro de otra figura, por lo general est es un rectngulo, se pueden dibujar cada elemento del conjunto o bien solo se puede indicar su existencia. Los diagramas de Venn son una buena herramienta, que nos permite realizar las operaciones entre los diversos conjuntos del universo de una forma ms sencilla.

65

OPERACIONES ENTRE CONJUNTOS UNIN DE CONJUNTOS. La unin de los conjuntos A y B es el conjunto formado por todos los elementos que pertenecen a A o a B o a ambos. Se denota: A U B. La unin de conjuntos se define como: A U B = {x I x A o x B} El grfico es la representacin de la unin A B

INTERSECCIN ENTRE CONJUNTOS. Se define la interseccin de dos conjuntos A y B al conjunto de elementos que son comunes a A y B. Se denota por A B, que se lee: A interseccin B. La interseccin de A y B tambin se puede B={x/x Ayx B } y mediante un diagrama de Venn-Euler:

definir: A

El grfico es la representacin de la interseccin

66

DIFERENCIA ENTRE CONJUNTOS. Se denomina diferencia de dos conjuntos A y B al conjunto formado por todos los elementos de A pero que no pertenecen a B. La diferencia se denota por: A - B que se lee: A diferencia B o A menos B. Se define la diferencia de dos conjuntos tambin como: A - B = {x / x Ayx B}

El grfico representa la diferencia entre conjuntos:

INCLUSIN ENTRE CONJUNTOS: Sean A y B dos conjuntos. El conjunto A est incluido en el conjunto B si se verifica que cada elemento de A pertenece a B. Se lee A es un subconjunto de B. No confundir pertenencia con inclusin: La pertenencia vincula un elemento con un conjunto. La inclusin vincula dos conjuntos. El conjunto A est incluido en el conjunto B. El conjunto A es un subconjunto del conjunto B.

67

Cuando dos conjuntos no tienen ningn elemento en comn se dice que son disjuntos.

Cuando los conjuntos tienen algunos elementos en comn:

68

Cuando todos los elementos de un conjunto estn contenidos en el otro, no es necesario que los conjuntos sean iguales:

TEOREMAS BSICOS DE UNIN E INTERSECCIN: Los conjuntos cuentan con algunas operaciones que son anlogas al lgebra y que pueden ser demostradas. Sean A,B,C cualquier conjunto entonces:

OPERACIN

Propiedad

a) A A = A ; A A =A

IGUALATIVA

b) A B = A B; A B = B A

CONMUTATIVA

c) (A B) C = A (B C) ; (A B) C = A (B C)

ASOCIATIVA

d) A ( B C) = (A B) (A C) ; A ( B C) = (A B) (A C)

DISTRIBUTIVA

69

Elaboracin de diagramas de Venn con Word, Excell o Power point Un diagrama de Venn emplea crculos cuyas intersecciones ilustrar similitudes, diferencias y relaciones entre grupos o conjuntos. Las similitudes se representan en las partes de interseccin de los crculos, mientras que las diferencias se representan en las partes que no lo hacen. Para realizar los grficos se pueden crear usando SmartArt de Word (botn de insertar en el men superior). Al usar un elemento grfico SmartArt, puede crear un diagrama de Venn e incluirlo en una hoja de clculo, un mensaje de correo electrnico, una presentacin o un documento.

Crear un diagrama de Venn 1. En el boton Insertar en el grupo Ilustraciones, haga clic en SmartArt.

2. En la galera Elegir un grfico SmartArt, haga clic en Relacin, haga clic en un diseo de diagrama de Venn (por ejemplo Venn bsico) y, a continuacin, en Aceptar. 3. Para escribir texto para definir un crculo, siga uno de estos procedimientos:

Haga clic en [Texto] en el panel de texto y, a continuacin, escriba el texto. Copie texto desde otra ubicacin o programa, haga clic en [Texto] en el panel de texto y, a continuacin, pegue el texto. 70

NOTA Si el panel de texto no est visible, haga clic en el control.

Haga clic en un crculo en el elemento grfico SmartArt y, a continuacin, escriba el texto

Agregar o eliminar crculos en el diagrama de Venn 1. Haga clic en el elemento grfico SmartArt al que desea agregar otro crculo. 2. Haga clic en el crculo existente que se encuentre ms cerca del lugar donde desea agregar el nuevo crculo. 3. En Herramientas de SmartArt, en la ficha Diseo del grupo Crear grfico, haga clic en Panel de texto.

Si no ve las fichas Herramientas de SmartArt o Diseo, asegrese de que ha seleccionado un elemento grfico SmartArt. 4. Siga uno de estos pasos:

Para insertar un crculo detrs del crculo seleccionado, que se superpondr al mismo, haga clic en Agregar forma detrs.

71

Para insertar un crculo delante del crculo seleccionado, que se superpondr al mismo, haga clic en Agregar forma delante.

NOTAS

Cuando necesite agregar un crculo al diagrama de Venn, pruebe a agregar formas detrs o delante del crculo seleccionado para obtener la ubicacin que desea para el nuevo crculo. Es sencillo solucionar los errores de SmartArt habituales.

Para agregar un crculo desde el panel de texto, haga clic en crculo existente, mueva el cursor antes o despus del texto al que desea agregar el crculo y, a continuacin, presione ENTRAR.

Para eliminar un crculo del diagrama de Venn, haga clic en el crculo que desea eliminar y, a continuacin, presione SUPRIMIR. Mover un crculo en el diagrama de Venn

Para mover un crculo, haga clic en l y, a continuacin, arrstrelo a su nueva ubicacin.

Para mover un crculo en incrementos muy pequeos, presione CTRL mientras presiona las teclas de flecha del teclado. Cambiar a un diseo de diagrama de Venn diferente

1. Haga clic con el botn secundario en el diagrama de Venn que desea modificar y, a continuacin, en Cambiar diseo. 2. Haga clic en Relacin y, a continuacin, siga uno de estos procedimientos:

Para mostrar las relaciones superpuestas en una secuencia, haga clic en Venn lineal.

72

Para mostrar las relaciones resaltando el tamao o la gradacin, haga clic en Venn apilado.

Para mostrar las relaciones superpuestas y la relacin en una idea central, haga clic en Venn radial.

NOTA Tambin puede cambiar el diseo del elemento grfico SmartArt. Para ello, haga clic en la opcin de diseo en el grupo Diseos de la ficha Diseo en Herramientas de SmartArt. Al sealar una opcin de diseo, el elemento grfico SmartArt cambia para mostrar una vista previa del aspecto que tendra con ese diseo. Cambiar los colores del diagrama de Venn Para agregar fcilmente una apariencia y retoques profesionales al elemento grfico SmartArt, puede cambiar los colores o aplicar un estilo SmartArt al diagrama de Venn. Tambin puede agregar efectos, como resplandores, bordes suaves o efectos 3D. Mediante las presentaciones de PowerPoint 2007 podr animar el diagrama de Venn. Puede aplicar combinaciones de colores derivadas de los colores del tema a los crculos del elemento grfico SmartArt. 1. Haga clic en el elemento grfico SmartArt cuyo color desea cambiar. 2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo, haga clic en Cambiar colores. 73

Si no ve las fichas Herramientas de SmartArt o Diseo, asegrese de que ha seleccionado un elemento grfico SmartArt. SUGERENCIA Al colocar el puntero sobre una miniatura, puede ver cmo afectan los colores al elemento grfico SmartArt. Cambiar el color de la lnea o el estilo del borde de un crculo 1. En el elemento grfico SmartArt, haga clic con el botn secundario del mouse en el borde del crculo que desea cambiar y, a continuacin, en Formato de forma. 2. Para cambiar el color del borde del crculo, haga clic en Color de lnea, en Color y, a continuacin, en el color que desea. 3. Para cambiar el estilo del borde del crculo, haga clic en Estilo de lnea y, a continuacin, elija los estilos de lneas que desea. Cambiar el color de fondo de un crculo en el diagrama de Venn 1. Haga clic en el elemento grfico SmartArt que desea cambiar. 2. Haga clic con el botn secundario del mouse en el borde del crculo y, a continuacin, en Formato de forma. 3. Haga clic en Relleno y, a continuacin, en Relleno slido. 4. Haga clic en Color y, a continuacin, en el color que desea.

Para cambiar el fondo de un color que no exista en los colores del tema, haga clic en Ms colores y, a continuacin, haga clic en el color que desea en la ficha Estndar o cree un color personalizado en la ficha Personalizado. Los colores personalizados y los colores de la ficha Estndar no se actualizarn si cambia ms adelante el tema del documento. 74

Para especificar cunto se puede ver a travs del color de fondo, mueva el control deslizante Transparencia o escriba un nmero en el cuadro situado junto a dicho control. El porcentaje de transparencia puede oscilar entre 0% (completamente opaco, el valor predeterminado) y 100% (completamente transparente). Aplicar un estilo SmartArt al diagrama de Venn Un estilo SmartArt es una combinacin de distintos efectos, por ejemplo estilo de lnea, bisel o 3D, que se puede aplicar a los crculos del elemento grfico SmartArt para crear una apariencia nica y de diseo profesional. 1. Haga clic en el elemento grfico SmartArt que desea cambiar. 2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo, haga clic en el estilo SmartArt que desee.

Para ver ms estilos SmartArt, haga clic en el botn Ms NOTAS

Al colocar el puntero sobre una miniatura, puede ver cmo afecta el estilo SmartArt al elemento grfico SmartArt.

Tambin puede personalizar el elemento grfico SmartArt; para ello, puede mover crculos, cambiar el tamao de los crculos, agregar un relleno o un efecto y agregar una imagen. Animar el diagrama de Venn Si usa Microsoft Office PowerPoint 2007, puede animar el diagrama de Venn para resaltar cada crculo. 75

1. Haga clic en el diagrama de Venn que desea animar. 2. En la ficha Animaciones, en el grupo Animaciones, haga clic en Animar y, a continuacin, en Una a una.

NOTA

Si copia un diagrama de Venn con animacin aplicada a otra diapositiva,

tambin se copiar la animacin. REPASO NUM. 3

1. Qu es un conjunto? 2. Define unin entre conjuntos 3. Define la interseccin entre conjuntos. 4. Cul es la diferencia entre una interseccin y una unin? 5. Cul es conjunto formado por la interseccin de los conjuntos: {e, x, i, t, o} y {t, r, i, u, n, f, o}; {l, u, n, a} y B= {t, r, i, u, n, f, o} 6. Sean los conjunto: A = { 1, 2, 3, 4, 5 }; B = { 1, 2 };C = { 1, 5 }:D = { 1, 4 };E = { 1 } Cul de todos ellos es subconjunto de todos los dems? 7. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 },C = { -2,-1, 0,3}, construye los siguientes diagramas de Venn y descrbelos formalmente a).- AUB, b).- AUC, c).- BUC

76

8. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 }, C = { -1,-2, 0,3}, construye los diagramas de Venn y descrbelos formalmente: a).- AB, b).- AC, c).- BC 9. Sean A ={1,2,3,4}; B ={2,4,6,8}; C ={3,4,5,6}

Hallar a).- A U B; b).- A U C; c).- B U C; d).- B U B

77

TEORIA DE PROBABILIDAD
INTRODUCCIN

La teora de la probabilidad es un rea de las matemticas. Se utiliza para el anlisis y entendimiento de la ocurrencia de oportunidad; con ella se estudian los fenmenos o experimentos aleatorios. Un experimento aleatorio es aquel que cuando se repite bajo las mismas condiciones iniciales, el resultado que se obtiene no siempre es el mismo. El ejemplo ms sencillo y cotidiano de un experimento aleatorio es el de lanzar una moneda, un dado o jugar naipes.

En un experimento aleatorio, en principio, no sabemos cul ser el resultado, por lo que conviene agrupar en un conjunto a todos los resultados posibles, ese conjunto, espacio muestral o espacio muestra de un experimento aleatorio es el lugar de todos los posibles resultados del experimento, y se le denota generalmente por la letra griega (omega). Algunos textos prefieren la letra S para denotar al espacio muestral. Esta letra proviene del trmino sampling space o espacio muestral. Por otro lado, llamaremos evento a cualquier subconjunto del espacio muestral y denotaremos a los eventos por las primeras letras del alfabeto en maysculas: A, B, C, etc.

Ejemplo. Si un experimento aleatorio consiste en lanzar un dado y observar el nmero que aparece en la cara superior, entonces claramente el espacio muestral es el conjunto = {1, 2, 3, 4, 5, 6}. Como ejemplo de un evento para este experimento podemos definir el conjunto A = {2, 4, 6}, que corresponde al suceso de obtener como resultado un nmero par. Si al lanzar el dado una vez se obtiene el nmero 4, decimos entonces que se observ la ocurrencia del evento A, y si se obtiene por ejemplo el resultado 1, decimos que no se observ la ocurrencia del evento A.

78

Entonces: Espacio muestral o sampling space: o S: universo de posibles resultados del experimento Evento o suceso: subconjunto del espacio muestral, se denota con A, B, C, etc.

La probabilidad se utiliza para pronosticar o predecir cientficamente la ocurrencia de fenmenos, eventos, comportamientos, hechos, etc. Entenderlos y realizar acciones en consecuencia (toma de decisiones) como: negocios, construir infraestructura, describir el comportamiento de los fenmenos meteorolgicos, el deporte, etc.

En la antigedad tambin se predeca el futuro con base en observaciones de los chamanes, videntes, sacerdotes, etc. En el altiplano central los temporaleros, graniceros o especialistas del tiempo basaban sus acciones predictivas en las observaciones del comportamiento de los fenmenos meteorolgicos: lluvias, serpientes de agua (tornados), nevadas, heladas, etc.

Los conceptos de espacio muestral y evento involucran forzosamente la terminologa de conjuntos, por lo que el espacio muestral designado con la letra omega de un experimento aleatorio es una especie de conjunto universal, y cualquier elemento de lo denotaremos por (omega minscula). El conjunto vaco lo denotaremos por . Otros smbolos usuales son los de pertenencia ( ), o no pertenencia ( ) de un elemento en un conjunto. Recordamos a continuacin las operaciones bsicas de conjuntos: unin, interseccin, diferencia y complemento: Unin: A B Diferencia: A B Interseccin: A B Complemento: A B

79

Mediante un diagrama de Venn ilustramos grficamente las operaciones de unin, interseccin, diferencia y complemento.

Qu es una probabilidad? Una probabilidad (p) es la cualidad de probable, es decir que un evento o fenmeno pueda o no suceder: La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza el experimento aleatorio, el resultado puede ser el xito (P) o el fracaso (Q).

Probabilidad de xito (P), representa la ocurrencia del evento de inters. Probabilidad de fracaso (Q), representa la no ocurrencia del evento de inters.

80

Frmula general para presentar una probabilidad


p(de xito) = No. De xito = No. Resultados exitosos posibles No. De ensayos No. Total de resultados posibles Donde p (de xito) = probabilidad del evento de inters

Ejemplos: Una moneda cualquiera tiene dos lados: guila o sol, cara o cruz

El espacio muestral =(Sol y guila); Al lanzar una sola moneda cul es la probabilidad de obtener Sol?
p(cara) = No. Caras _________ = 1= .5000 No. De posibles resultados 2

Un paquete de cartas de poker se distribuye de la siguiente manera:

Total
4 4 4 4 4 4 4 4 4 4 4 4 4 52

As

As

As

As

2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 Jota Jota Jota Jota Quina Quina Quina Quina Rey Rey Rey Rey 13 13 13 13

81

El espacio muestral = (52 cartas diferentes); Cuando se toma una sola carta al azar de un paquete estndar de 52 cartas
p(rey) = No. De reyes en el paquete Total e cartas en el paquete = = 4 = .0769 52

p(7)

No. De 7 en el paquete __ = 4 = .0769 Total e cartas en el paquete 52 No. De 7 en el paquete = 4 = .0769 Total e cartas en el paquete 52 No. De en el paquete = 13 = .2500 Total e cartas en el paquete 52

p(7)

= =

p()

REGLAS BSICAS DE LA TEORA DE LA PROBABILIDAD Regla 1. Las probabilidades siempre oscilan en 0 y 1 Puesto que las probabilidades son proporciones, su lmite numrico inferior es cero, es decir el evento no puede suceder y su lmite numrico superior es 1, esto es el evento debe suceder. Las probabilidades siempre se calculan entre 0 y 1 (0 % y 100%). Algunos eventos tienen un probabilidad cero de ocurrencia, es decir nunca suceden, por ejemplo: permanecer vivo bajo el agua durante 24 horas sin dispositivos de sobrevivencia. Otros eventos ocurren con una probabilidad del 100% (siempre suceden), por ejemplo que el sol salga maana. Muchos eventos, sin embargo, no estn tan definidos; sus probabilidades de ocurrencia estn en alguna parte entre nunca y siempre. 2. De adicin para eventos alternativos Esta regla establece que la probabilidad de eventos alternativos es igual a la suma de las probabilidades de los eventos individuales. Por consiguiente:
p (rey o as) = p (rey) + p (as)

82

No. De reyes en el paquete + No de ases en el paquete No. de cartas en el paquete No. de cartas en el paquete

= 4 + 4 = 8 = .1538 (aproximadamente 15%) 52 52 52

En la regla de adicin debe sustituirse la letra o por un signo de adicin +. La regla de adicin lleva a un punto importante: la probabilidad de xito o fracaso debe ser 1; es decir, P + Q = 1. De esto se desprende que si conocemos P, entonces Q puede calcularse rpidamente: Q= 1-P; P= 1-Q Por ejemplo, si P=p (rey o as), entonces Q= p (cualquier carta distinta de rey o as) = 1 - p= - .1538 = .8462 (aproximadamente 85%). En otras palabras, si tenemos cerca del 15% de oportunidad de sacar un rey o un as, entonces tenemos aproximadamente 85 % de oportunidad de no sacarlos. Regla 3. Ajuste para las ocurrencias conjuntas A veces el xito para un evento no es directo porque un resultado en particular es exitoso en ms de una manera. Por ejemplo, al sacar una sola carta de un paquete estndar de 52, existe un problema en el siguiente clculo que usa la regla de adicin.
p (rey o reina o corazn) = p (rey) + p (reina) + p (corazn)

= No. De reyes + No. De reinas + No de corazones = 21 = .4038 (incorrecto) No. Total de cartas en el paquete 52

Esta respuesta es incorrecta. Si tomamos un paquete de cartas

y contamos

cartas de xito (reyes, reinas y corazones), encontramos 19, no 21. Este es el caso porque cuando sumamos las probabilidades separadas, contamos al rey y a

83

la reina de corazones dos veces. Siendo un rey y un corazn, el rey de corazones es exitoso dos veces.

Cuando tenemos un evento que tiene doble xito o une dos aspectos de xito, se denomina ocurrencia conjunta. Para calcular la probabilidad correcta, debemos restar cada ocurrencia conjunta para eliminar ese doble conteo.

= (p (rey) + p (reina) + p (corazn) ) ( p ocurrencias conjuntas) = No. De reyes + No. De reinas + No de corazones en el paquete 2 ocurrencias conjuntas No. Total de cartas en el paquete No. Total de cartas en el paquete

= 21 - 2 = 19 = .3654 (correcto) 52 52 52

Regla 4. Multiplicativa para eventos compuestos Algunos eventos tienen dos o ms partes. A estos eventos con partes mltiples los llamamos eventos compuestos, es decir que est compuesto de dos o mas elementos. Por ejemplo, definimos el xito como sacar un par de ases del

paquete de cartas, es decir, sacar un as, regresndolo, barajar una vez ms (es decir al azar), y entonces sacar de nuevo un as. La regla multiplicativa para eventos compuestos seala que la probabilidad de un evento compuesto es igual al mltiplo de las probabilidades de las partes separadas del evento. As,
p (as luego as) = p (as) x p (as)

= 4 x 4 = 16 = .0059 52 52 2704

Nota: se cambia la palabra luego por el smbolo de multiplicacin El simple caso de arrojar una moneda utilizando la regla multiplicativa.

Calculemos la probabilidad de lanzar una moneda dos veces y obtener cara ambas veces.
p (cara luego cara) = p (cara) x p (cara)

84

= .5 x .5 = .2500 (1 de 4)

Regla 5. Explicacin del reemplazamiento con eventos compuestos

En el caso de la regla 4, se mencion que la primera carta obtenida sera devuelta al paquete antes de sacar la segunda. Esta estipulacin para calcular la probabilidad de un evento compuesto se llama con reemplazamiento. Si no se devuelve la primera carta, el clculo se habra realizado sin reemplazamiento y la probabilidad calculada habra sido diferente.
p (as luego as) sin reemplazamiento = p (as) x p (as)

= 4 x 3 = 12 = .0045 52 51 2652

La probabilidad del primer as es la misma con o sin reemplazamiento porque el evento empieza con 52 cartas y cuatro ases. Pero si la primera carta obtenida es un as y no hay reemplazamiento, entonces al sacar la segunda solo hay 51 cartas en el paquete, y solo tres son ases. Nota: en cuestiones de reemplazamientos en eventos compuestos. Se ajustan numeradores y denominadores consecuentemente. Por ejemplo:
p (as luego rey luego as) sin reemplazamiento = p (as) x p (rey) x p (as)

= 4 x 4 x 3 = 48 = .0004 52 51 50 132600

Probabilidad de sucesos Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre s, as como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo de probabilidades.

85

a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso ser menor que la del suceso que lo contiene. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un nmero par. Dijimos que el suceso a) est contenido en el suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50

Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos sucesos son las mismas. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que salga mltiplo de 2. Las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50

c) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o ms sucesos que se intersectan. La probabilidad ser igual a la probabilidad de los elementos comunes. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que sea mayor que 3. La interseccin de estos dos sucesos tiene dos elementos: el 4 y el 6. Su probabilidad ser por tanto: P(A B) = 2 / 6 = 0,33

d) Unin de dos o ms sucesos: la probabilidad de la unin de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso interseccin Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6. 86

P(A) = 3 / 6 = 0,50 P Por lo tanto,

P(B) = 3 / 6 = 0,50

P (A u B) = (0,50 + 0,50) - 0,33 = 0,666 e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos incompatibles ser igual a la suma de las probabilidades de cada uno de los sucesos (ya que su interseccin es el conjunto vacio y por lo tanto no hay que restarle nada). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 2 / 6 = 0,333 Por lo tanto, P(A u B) = 0,33 + 0,166 = 0,50 f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A) Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un nmero par, luego su complementario, suceso (B), es que salga un nmero impar. La probabilidad del suceso (A) es igual a : P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 87 P(B) = 1 / 6 = 0,166

Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 g) Unin de sucesos complementarios: la probabilidad de la unin de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que salga un nmero impar. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 3 / 6 = 0,50 Por lo tanto, P(A U B) = 0,50 + 0,50 = 1 P(B) = 3 / 6 = 0,50

88

REPASO # 4 Completa las siguientes afirmaciones: 1. La probabilidad toma valores entre ________________ 2. Los resultados de la probabilidad tambin pueden ser anotado como__________________________ 3. Un suceso imposible tendr una probabilidad de_____________________ 4. Un suceso seguro tendr una probabilidad de_______________________ 5. Probabilidad de que al lanzar un dado salga el nmero 2: el caso favorable es tan slo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier nmero del uno al seis). Por lo tanto: P(A) = 6. Probabilidad de que al lanzar un dado salga un nmero par: en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) = 7. Probabilidad de que al lanzar un dado salga un nmero menor que 5: en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) = 8. Probabilidad de que nos toque el "Gordo" de Navidad: tan slo un caso favorable, el nmero que jugamos (qu triste...), frente a 100.000 casos posibles. Por lo tanto: P(A) = 9. Que en un paquete completo de naipes previamente barajados obtengamos: p (As de )= p (Rey )= p (Jota )= p (6 )= p ()=

10. Que un paquete completo de naipes previamente barajados obtengamos: p (As de o Rey o Jota o 6 )= Menciona cual es la probabilidad de Q (fracaso) para el ejemplo anterior

PROBABILIDAD CONDICIONAL La probabilidad condicional se refiere probabilidad de ocurrencia del evento A, dada informacin acerca de la ocurrencia de otro evento B.

89

La probabilidad de A dado B es igual a la probabilidad de A y B dividida por la probabilidad de B. P(A B) = P(A y B) P(B) La probabilidad de B dado A es igual a la probabilidad de A y B dividida por la probabilidad de A. P(B A) = P(A y B) P(A) Donde: P(A y B) = probabilidad conjunta de A y B P(A)= probabilidad de A P(B)= probabilidad de B Ejemplo: De 250 hogares donde se planeo comprar un televisor, en 200 realmente se compro. Por lo tanto la probabilidad de que en un hogar realmente se compre un equipo de televisin dado que lo planeo comprar es: P(realmente compro plane comprar) = plane comprar y realmente compr plane comprar

= 200 = 0.80 250

90

DISTRIBUCIN DE PROBABILIDAD
La distribucin de probabilidad de una variable aleatoria, es una funcin (fx) que asigna a cada suceso definido, sobre la variable aleatoria, la probabilidad de que dicho suceso ocurra. Indica la gama de valores que pueden representarse como resultado de un experimento. As mismo describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede disear un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenmenos naturales. Una variable es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes datos. Los datos son los valores observados de las variables, stas pueden ser: Cualitativas: Son las variables que expresan distintas cualidades, caractersticas o modalidades. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal: puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.

91

Cuantitativas o numricas Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas pueden ser:

Variable

discreta:

Es

la

variable

que

presenta

separaciones

interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, etc.) o la altura (1,64 m, 1,65 m, 1,66 m, etc.), que solamente est limitado por la precisin del aparato medidor, en teora permiten que siempre exista un valor entre dos cualesquiera.

DISTRIBUCIN DE VARIABLE PROBABILIDADES DISCRETA

DISCRETA

DISTRIBUCIN

DE

Se denomina distribucin de variable discreta a aquella cuya funcin de probabilidad slo toma valores positivos en un conjunto de valores de X finito o infinito numerable. La distribucin de probabilidad discreta ms utilizada es la binomial.

DISTRIBUCIN DE PROBABILIDAD BINOMIAL


La distribucin de probabilidad binomial (de dos nmeros o dicotmica) se utiliza cuando la variable aleatoria discreta (donde no hay decimales) es el nmero de xitos en una muestra compuesta de n observaciones. 1. La muestra se compone de un nmero fijo de observaciones, n.

92

2. Cada observacin se clasifica en una de dos categoras mutuamente excluyentes, denominadas xito (p) o fracaso (q). 3. La probabilidad de que una observacin se clasifique como xito (p), es constante de una observacin a otra, de la misma forma, la probabilidad de que una observacin se clasifique como fracaso (q) o 1-p, es constante en todas las observaciones. 4. El resultado (es decir, el xito o fracaso) de cualquier observacin es independiente del resultado de cualquier otra observacin. Para garantizar la independencia, las observaciones se deben seleccionar de manera aleatoria, ya sea de una poblacin infinita sin reemplazo o de una poblacin finita con reemplazo. Cuando se cumple estas condiciones, la distribucin binomial proporciona cada resultado posible de los N ensayos y la probabilidad de obtener cada uno de estos resultados. La ecuacin que se utiliza para representar la distribucin de la probabilidad binomial y calcular el nmero de xitos (X), dados los valores n y p, es:

Donde: P(X) = probabilidad de X xitos dados los parmetros n y p n = tamao de la muestra o nmero de observaciones p = probabilidad de xito 1 p = probabilidad de fracaso X = numero de xitos en la muestra (X = 0, 1, 2, .. n)

El trmino

indica la probabilidad de obtener X xitos de n

observaciones en una secuencia especfica.

El trmino

indica cuantas combinaciones de los X xitos entre n

observaciones son posibles. Entonces dado el nmero de observaciones n y la probabilidad de xito p, la probabilidad de X xitos es: 93

P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia especifica)

Ejemplo: Supngase que en cierta poblacin el 52 por ciento de todos los nacimientos que se registraron son varones. Si aleatoriamente se escogen 5 registros de nacimientos dentro de esa poblacin, cul es la probabilidad de que exactamente 3 de ellos sean varones? Tenemos los siguientes datos: n = 5, nmero de ensayos, tamao de muestra o registros X= 3, nmero de xitos (probabilidad de que sean varones) p = 0.52, la probabilidad de xito

P(x)=

n! (n-x)! x!

p (1-p)

n-x

P(x=20)=

5! (5-3)! 3!

(0.52) (1-0.52)

5-3

P(x=20)= 120 (0.140608) (0.2304) (2) 6

En excell se usa la siguiente frmula: =(A1/(B1*C1))*(D1*E1) O bien de la siguiente manera: 1. Seleccionamos Insertar funcin fx 2. Seleccionamos DISTRIB. BINOM. y seleccionamos ACEPTAR 3. Ingresamos la informacin del problema y listo. P(X=3) = 0.3239

94

PROBLEMA Hay una campaa en un centro mdico, sobre paternidad responsable a un grupo de mujeres. Una vez finalizada la charla se les entrega un papelito con una nica pregunta: Deseara usted ser esterilizada? 1. Si 2. No Estamos interesada en investigar si las charlas tienen un efecto favorable en el sentido de que las mujeres se decidan a ser sometidas a la esterilizacin. Ante este tipo de situaciones, tenemos que acudir a las Distribuciones de Probabilidades. En nuestro ejemplo, la variable Deseo ser esterilizada, es una variable cualitativa, discreta. Por lo tanto se requieren de las Distribuciones de Probabilidades Discretas.

VARIABLE ALEATORIA Una variable se dice que es aleatoria, si los posibles valores que puede tomar son determinados por el azar. Es decir se sabe qu valores puede tomar la variable pero no se tiene certeza de su ocurrencia, slo se sabe que puede ocurrir con una cierta probabilidad. Por ejemplo, en una epidemia de clera, se sabe que una persona cualesquiera puede enfermar o no (eventos), pero no se sabe cul de los 95

dos eventos va a ocurrir. Solamente se puede decir que existe una probabilidad de que la persona enferme. Las variables aleatorias se clasifican: 1. Discretas: aquellas que resultan de contar el nmero de casos en los que el evento de inters ocurre, por ejemplo: numero de hijos de una familia, nmero de veces que llega una paciente al servicio de emergencia, etc. 2. Continuas: aquellas que resultan producto de una medicin, por ejemplo: el peso, el nivel de hemoglobina, etc. VALOR ESPERADO El valor esperado se llama tambin esperanza matemtica. Se trata de un operador matemtico que al ser aplicado a la funcin probabilidad permite el clculo de ese valor en el caso discreto, mientras que en el caso continuo se lo aplica a la funcin frecuencia: Sigamos con nuestro ejemplo del centro mdico. Nuestra variable de inters seria: Deseo ser esterilizada. Supongamos que a la charla asistieron tres mujeres, entonces definimos como variable aleatoria a: X : Nmero de mujeres que desearan ser esterilizadas. Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede considerar las posibles respuestas: X = 0 (Ninguna deseara ser esterilizada) X = 1 (Slo una de las mujeres deseara) X = 2 (Dos mujeres desearan) X = 3 (Las tres mujeres desearan) Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuntas estarn de acuerdo en ser esterilizadas, pero si conociera las probabilidades de 96

ocurrencia de cada uno de los posibles valores de la variable podra predecir su ocurrencia con una cierta probabilidad. El conjunto de las probabilidades de ocurrencia de los posibles valores de la variable aleatoria se denomina distribucin de probabilidades.

DISTRIBUCION BINOMIAL Esta distribucin se basa en el proceso de Bernoulli. Se denominan procesos de tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas, caracterizadas por tener resultados que se pueden clasificar en si verifican o no cierta propiedad o atributo, siendo aleatorios e independientes. Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben verificar tres condiciones: 1. Resultados dicotmicos: Los resultados de cada prueba se pueden clasificar en "xito" si verifican cierta condicin, o "fracaso" en el caso contrario. 2. Independencia de las pruebas: El resultado de una prueba cualquiera es independiente del resultado obtenido en la prueba anterior, y no incide en el resultado de la prueba siguiente. 3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado considerado como un xito se mantiene constante a lo largo de toda la serie de pruebas. Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener exactamente r xitos, en una serie de n pruebas, con una probabilidad de xito p, se puede aplicar la frmula de la probabilidad binomial:

X = 0, 1, 2, , n.

97

Veamos el siguiente ejemplo: Sea el caso de una droga X, con una dosis mortal de 1g/100 ml para cobayos experimentales, en el 25% de los casos. Aplicando esta dosis a cien cobayos se desea saber cunto vale la probabilidad de que mueran veinte de ellos. Primero analizaremos si este caso cumple los supuestos bsicos de una distribucin binomial:

Los cobayos mueren (xito) o sobreviven (fracaso). Que un cobayo muera con la dosis, no significa que lo har el siguiente (independencia) pues no se trata de una epidemia.

La probabilidad de que mueran se mantiene constante a lo largo de la serie de pruebas (p = 0,25).

Entonces, como si cumple los supuestos bsicos, aplicamos la formula:

x=20

n=100

p= 0.25

O bien desglosando el ejemplo:


P(x)= n! (n-x)! x! P(x=20)= 100! (0.25) (100-20)! 20!
157 20

p (1-p)

n-x

(1-0.25)

100-20

P(x=20)= 9.3326x10 118 18 (7.1569 x 10 ) 2.4329 x 10

(9.09495 x 10 ) (1.01135 x 10 )

-13

-10

98

Para calcular el factorial (!) se utiliza excell, insertar funcin (Fx), categora matemticas y trigonomtricas, seleccionar fact, insertar el nmero

seleccionado y dar aceptar. Para calcular la potencia se sigue el mismo procedimiento y se selecciona potencia se inserta el nmero y la potencia, se da aceptar.
9.3326x10 118 18 (7.1569 x 10 ) 2.4329 x 10
157

Para resolver la ecuacin tambin se utiliza Excel Insertar funcin (fx) = =(A1/(B1*C1)) = (5.35983 x 1020) (9.09495 x 10-13) (1.01135 x 10-10)
=0.0493 49%

Todo lo anterior se resuelve con Excel de la siguiente forma:

Veamos otro ejemplo: En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra social es del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al negocio y se desea calcular la probabilidad de concretar menos de tres ventas. Si se cumple los supuestos bsicos de la distribucin binomial, entonces: P(x<3) = P(x=0) + P(x=1) + P(x=2)

99

Matemticamente esto se resuelve as:

Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398; Ahora con Excel. Matemticamente P(x<3) = P(x 2) . El Excel calcula siempre o igualdad o menor igual. Cuando queremos menor igual, en la opcin de acumulado ingresamos VERDADERO. Entonces P(x<3) = 0.398

EJERCICIOS DE PROBABILIDAD BINOMIAL El 60% de los estadounidenses leen sus contratos de trabajo, incluyendo las letras pequeas. Suponga que el nmero de empleados que leen cada una de las palabras de su contrato se puede modelar utilizando la distribucin binomial. Considerando un grupo de cinco empleados, encuentre cual es la probabilidad de que:

100

a) Los cinco lean cada una de las palabras de su contrato b) Al menos tres lean cada una de las palabras de su contrato c) Menos de dos lean cada una de las palabras de su contrato d) Cules seran sus respuestas para los incisos a), b) y c) si la probabilidad de que un empleado lea cada una de las palabras de su contrato es de 0.80? Variables:
a) x=5 b) x=3 x=4 x=5 c) x=1 x=0 n=5 n=5 n=5 n=5 n=5 n=5 p= 0.60 p= 0.60 p= 0.60 p= 0.60 p= 0.60 p= 0.60

a) P(x)=

n! p (1-p) (n-x)! x!

n-x

P(x=5)= = 0.0778 b) P(x)= P(x3) P(x=3)= = 0.3456 P(x=4)= = 0.2592 P(x=5)= = 0.0778

5! (0.60) (1-0.60) (5-5)! 5!

5-5

n! p (1-p) (n-x)! x!
3

n-x

5! (0.60) (1-0.60) (5-3)! 3!


2

5-3

5! (0.60) (1-0.60) (5-4)! 4!

5-4

5! (0.60) (1-0.60) (5-5)! 5!

5-5

P(x3) = P(x=3) + p(x=4)+ p(x=5) P(x3) = 0.3456+0.2592+0.0778 = 0.6826

101

c) P(x)= P(x2) P(x=1)= = 0.0768 P(x=0)= = 0.0102

n! p (1-p) (n-x)! x!
1

n-x

5! (0.60) (1-0.60) (5-1)! 1!

5-1

5! (0.60) (1-0.60) (5-0)! 0!

5-0

P(x2) = P(x=1) + p(x=0) P(x2) = 0.0768+0.0102 = 0.0870

Tabla de resultados en Excel distribucin binomial en Excel


0.0778 0.0778 0.3456 0.2592 0.0768 0.0102 0.0870

Ejercicio
a b

n!
120 120 120 120

n-x!
1 1 2 1 24 120

x!
120 120 6 24 1 1

(a2/(b2*c2))
1 1 10 5 5 1

px
0.07776 0.07776 0.216 0.1296 0.6 1

1-p n-x
1 1 0.16 0.4 0.0256 0.01024

d2*e2*f2
0.0778 0.0778 0.3456 0.2592 0.0768 0.0102

solucin en libro
0.0778 0.6826

120 120

Un estudiante presenta un examen de opcin mltiple, en el que cada pregunta tiene cuatro opciones. Suponga que el l no conoce la respuesta correcta de ninguna de las preguntas, y que decidi utilizar una estrategia en la que colocar cuatro pelotas (A, B, C, y D) dentro de una caja. Ahora, para responder cada pregunta, selecciona una pelota de manera aleatoria y la devuelve a la caja. La letra de la pelota determinara su respuesta a la pregunta. El examen se compone de cinco preguntas de opcin mltiple. Cul es la probabilidad de que l obtenga? a) Cinco respuestas correctas? b) Al menos cuatro respuestas correctas? b) Ninguna respuesta correcta? c) No ms de dos respuestas correctas?

102

Variables:
a) x=5 b) x=4 x=5 c) x=0 d) x=2 x=1 x=0 a) P(x)= n! p (1-p) (n-x)! x!
x n-x

n=5 n=5 n=5 n=5 n=5 n=5 n=5

p= 0.25 p= 0.25 p= 0.25 p= 0.25 p= 0.25 p= 0.25 p= 0.25

P(x=5)=

5! (0.25) (1-0.25) (5-5)! 5!


5

5-5

b) P(x=5)=

5! (0.25) (1-0.25) (5-5)! 5! 5! (0.25) (1-0.25) (5-4)! 4! 5! (0.25) (1-0.25) (5-0)! 0! 5! (0.25) (1-0.25) (5-2)! 2! 5! (0.25) (1-0.25) (5-1)! 1! 5! (0.25) (1-0.25) (5-0)! 0!
0 1 2 0 4

5-5

P(x=4)=

5-4

c) P(x=0)=

5-0

d) P(x=2)=

5-2

P(x=1)=

5-1

P(x=0)=

5-0

Tabla de resultados en Excel Distribucin binomial en Excel 0.0010 0.0010 0.0146 0.2373 0.2637 0.3955 0.2373

Ejercicio A B C D

n! 120 120 120 120 120 120 120

n-x! 1 1 1 120 6 24 120

x! 120 120 24 1 2 1 1

(a2/(b2*c2)) 1 1 5 1 10 5 1

px 0.0009 0.0009 0.0039 1 0.0625 0.25 1

1-p n-x 1 1 0.75 0.2373 0.4218 0.3164 0.2373

d2*e2*f2 0.0010 0.0010 0.0146 0.2373 0.2637 0.3955 0.2373

Suma 0.0156

0.8965

103

DISTRIBUCIN DE PROBABILIDAD CONTINUA

La funcin de densidad de probabilidad continua es una expresin matemtica que define la distribucin de los valores para una variable aleatoria continua como el tiempo, la estatura, la distancia, la temperatura, la presin, entre otras; es decir variables que se miden pero no se cuentan.

LA DISTRIBUCIN NORMAL La distribucin normal o gaussiana, es la distribucin continua que se utiliza ms comnmente en estadstica, sta es importante por tres razones: Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan estrechamente a la distribucin normal. La distribucin normal sirve para acercarse a diversas distribuciones de probabilidad discreta como la distribucin binomial y la distribucin de Poisson. La distribucin normal proporciona las bases para la estadstica inferencial clsica por su relacin con el teorema del lmite central.

La distribucin normal se representa por la clsica grfica en forma de campana, con ella se puede calcular la probabilidad de que varios valores ocurran dentro de ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un valor particular dentro de una distribucin normal, es cero. Esta propiedad distingue a las variables continuas, que son medidas (temperatura, peso, velocidad, presin), de las variables discretas, las cuales son contadas (nmero de autos, cantidad de personas). Por tanto es factible determinar, por ejemplo, que la probabilidad de que el tiempo de descarga para una pgina de la web est entre 7 y 10 segundos, entre 8 y 9 segundos o que la probabilidad de que el tiempo de descarga este

104

entre 7.99 y 8.01. Sin embargo, la probabilidad de que el tiempo de descarga sea exactamente de 8 segundos es cero. Distribucin normal estndar La ms simple de todas las distribuciones normales, es la distribucin normal estndar, denominada distribucin Z, est se encuentra distribuida alrededor de una media (=0) con una desviacin estndar (=1). As por ejemplo, el valor Z=1.5 est 1.5 desviaciones estndar por encima de la media y, en general: Cada valor Z es el nmero de desviaciones estndar separado de la media.

Distribucin normal general Una distribucin normal puede tener cualquier y cualquier desviacin estndar . La distribucin normal es simtrica y con forma de campana, lo que implica que la mayora de los datos tiende a agruparse alrededor de la media, la cual por su forma simtrica, es igual a la mediana. Aunque desde el punto de vista terico los valores en una distribucin normal pueden clasificarse del infinito negativo (-) al infinito positivo (+), la forma de la distribucin hace poco posible que ocurran valores extremadamente grandes o muy pequeos. La expresin matemtica que representan la funcin de densidad de probabilidad continua est indicada con el smbolo f(X).Para la distribucin normal, la funcin de densidad de la probabilidad normal se da en la ecuacin

f(X) = _____1_____ e - (1/2)((X-)/)2


2
e= es contante matemtica: 2.71828 = constante matemtica: 3.1416 = es la media = es la desviacin estndar x= es cualquier valor de la variable continua

105

Puesto que

e y son constantes matemticas, las probabilidades de una

variable aleatoria X dependen slo de dos parmetros de la distribucin normal: la media

y la desviacin estndar

Cada vez que se especifique una

combinacin particular

de la media y la desviacin estndar, se genera una

distribucin de probabilidad normal diferente.

La expresin matemtica antes descrita es tediosa de calcular y requiere de clculo integral. Para evitar eso se usan las tablas de probabilidad normal. El primer paso para encontrar probabilidades normales es usar la frmula de transformacin, para convertir cualquier variable aleatoria normal X en una variable aleatoria normal estandarizada Z. Frmula de transformacin El valor Z es igual a la diferencia entre X y la media estndar . Z= X

, dividida por la desviacin

Aunque los datos originales para la variable aleatoria X tenan una media y una desviacin estndar, la variable aleatoria estandarizada Z siempre tendr una media=0 y una desviacin estndar=1. Al sustituir media=0 y desviacin estndar=1 en la ecuacin de funcin de densidad de la probabilidad de una variable normal estandarizada Z. Dicha funcin est dada en la siguiente ecuacin:

- (1/2)Z f(X) = _____1_____ e


2

106

Cualquier conjunto de valores distribuidos normalmente son susceptibles de convertirse a su forma estandarizada. Entonces se determinan las probabilidades deseadas usando la Tabla de Distribucin normal estandarizada acumulativa.

Problema Suponga que desea encontrar la probabilidad de que el tiempo de descarga para un sitio Web sea menor a 9 segundos. La media es =2 Primero utiliza la ecuacin Z= X

=7 y la desviacin estndar

Encontrar P (X9) Para transformar X=9 a unidades estandarizadas Z. Puesto que X=9 es una desviacin estndar por arriba de la media 7+2= 9, Z= +1.00. Z= 9-7 = 2 = +1.00 2 2 En seguida se utiliza la Tabla de distribucin normal estandarizada para encontrar el rea acumulativa bajo la curva normal calculada menor que Z=+1.00 (es decir a la izquierda de Z. Para leer la probabilidad o rea bajo la curva menor que Z=+1.00 se revisa la columna Z de la tabla, hasta localizar el valor Z de inters (en dcimos) en la fila Z de 1.0. A continuacin se lee a travs del rengln hasta que intercepte la columna que contiene el lugar del valor Z en los centsimos.

Por lo tanto, en el cuerpo de la tabla, la probabilidad tabulada para Z=1.00 corresponde con la interseccin de la fila Z=1.0 con la columna Z=.00, esta probabilidad es de 0.8413, es decir hay un 84.13% de posibilidad de que el tiempo de descarga sea menor a 9 segundos.

107

Encontrar P (X9) Cul es la probabilidad de que el tiempo de descarga sea de ms de 9 segundos? Solucin: La probabilidad de que el tiempo de descarga sea menor a 9 segundos es de 0.8413. As, la probabilidad de que el tiempo de descarga sea mayor a 9 segundos es el complemento de que sea menor a 9 segundos, 1-0.8413= 0.1587. Figura 1. Figura 1.

108

Encontrar P (7X9) Cul es la probabilidad de que el tiempo de descarga est entre 7 y 9 segundos?

Solucin: Ya se determino que la probabilidad de que el tiempo de descarga sea menor a 9 segundos es de 0.8413. Ahora se determina la probabilidad de que el tiempo de descarga sea menor a 7 segundos y sustraer esto de la probabilidad de que el tiempo de descarga sea menor a 9 segundos. Usando la ecuacin Z= X Z= 7-7 = 0.00 2 Al utilizar la tabla de distribucin normal estandarizada acumulativa, se sabe que el rea bajo la curva normal menor que la media de Z=0.00 es de 5.000. Por lo tanto, el rea bajo la curva entre Z=0.00 y Z=1.00 es de 0.8413-0.5000 = 0.3413. Figura 2. Figura 2.

109

Encontrar P (X7 O X9) Cul es la probabilidad de que el tiempo de descarga sea menor a 7 segundos o mayor a 9 segundos?

Solucin: La probabilidad de que el tiempo de descarga sea entre 7 y 9 segundos es de 0.3413; ahora la probabilidad de que el tiempo de descarga est por debajo de los 7 segundos o por arriba de los 9 segundos es su complemento, 1-0.3413= 0.6587. Otra manera de resolver el problema es el siguiente. Se calcula de forma separada la probabilidad de tiempo de descarga menor a 7 segundos y la

probabilidad mayor de 9 segundos, y despus sumar estas dos probabilidades para obtener el resultado deseado.

Puesto que la media y la mediana son la misma para los datos distribuidos normalmente, el 50% de los tiempos de descarga estn por debajo de los 7 segundos. Como se calcul, en el primer ejercicio, la probabilidad del tiempo de descarga de ms de 9 segundos P (X9) es de 0.1587. Por lo tanto, la probabilidad de que el tiempo de descarga est por debajo de 7 o por arriba de 9 segundos, P (X7 O X9), es 0.5000+0.1587= 0.6587. Figura 3.

Figura 3.

110

Encontrar P (5X9) Cul es la probabilidad de que el tiempo de descarga este entre 5 y 9 segundos, es decir P (5X9)?

Solucin: Considerando que el rea de inters se localiza entre los valores 5 y 9. Siga los siguientes pasos:

1. Determine la probabilidad de menos de 9 segundos 2. Determine la probabilidad de menos de 5 segundos 3. Sustraiga el resultado menor del mayor

El rea bajo la curva normal menor que 9 segundos es, como se mencion anteriormente, 0.8413. Para encontrar el rea bajo la curva menor que 5 segundos (paso 2)

Z= 5-7 = -1.00 2

En la tabla busque Z= -1.00 y encuentre 0.1587. Para el paso tres, la probabilidad de que el tiempo de descarga sea entre 5 y 9 segundos es 0.8413-0.1587 = 0.6826. Figura 4. Figura 4.

111

Tabla distribucin normal estandarizada acumulativa


Normal 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.99869 0.99906 0.99934 0.99953 0.99968 0.99978 0.99985 0.99990 0.99993 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.99874 0.99910 0.99936 0.99955 0.99969 0.99978 0.99985 0.99990 0.99993 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.99878 0.99913 0.99938 0.99957 0.99970 0.99979 0.99986 0.99990 0.99994 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.99882 0.99916 0.99940 0.99958 0.99971 0.99980 0.99986 0.99991 0.99994 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.99886 0.99918 0.99942 0.99960 0.99972 0.99981 0.99987 0.99991 0.99994 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.99889 0.99921 0.99944 0.99961 0.99973 0.99981 0.99987 0.99992 0.99994 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.99896 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.99900 0.99929 0.99950 0.99965 0.99976 0.99983 0.99989 0.99992 0.99995

112

3.9 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6

0.99995

0.99995

0.99996 0.999970901 0.999981056 0.999987785 0.999992199 0.999995065 0.999996908 0.999998081 0.999998821 0.999999282 0.999999567 0.999999742 0.999999847 0.999999911 0.999999948 0.999999970 0.999999983 0.999999990 0.999999995 0.999999997 0.999999998 0.999999999

0.99996

0.99996

0.99996 0.999974391 0.999983376 0.999989311 0.999993193 0.999995706 0.999997318 0.999998340 0.999998983 0.999999383 0.999999629 0.999999779 0.999999870 0.999999924 0.999999956 0.999999975 0.999999986 0.999999992 0.999999996 0.999999998 0.999999999 0.999999999

0.99996 0.999975464 0.999984088 0.999989779 0.999993497 0.999995902 0.999997442 0.999998419 0.999999032 0.999999413 0.999999648 0.999999790 0.999999877 0.999999928 0.999999958 0.999999976 0.999999987 0.999999992 0.999999996 0.999999998 0.999999999 0.999999999

0.99996 0.999976493 0.999984770 0.999990226 0.999993788 0.999996089 0.999997561 0.999998494 0.999999079 0.999999442 0.999999665 0.999999801 0.999999883 0.999999932 0.999999961 0.999999977 0.999999987 0.999999993 0.999999996 0.999999998 0.999999999 0.999999999

0.99997 0.999977482 0.999985425 0.999990655 0.999994066 0.999996268 0.999997675 0.999998566 0.999999124 0.999999470 0.999999682 0.999999811 0.999999889 0.999999935 0.999999963 0.999999979 0.999999988 0.999999993 0.999999996 0.999999998 0.999999999 0.999999999

0.99997 0.999978431 0.999986052 0.999991066 0.999994332 0.999996439 0.999997784 0.999998634 0.999999166 0.999999496 0.999999698 0.999999821 0.999999895 0.999999939 0.999999965 0.999999980 0.999999989 0.999999994 0.999999996 0.999999998 0.999999999 0.999999999

0.999968329 0.999969641 0.999979342 0.999980217 0.999986654 0.999987231 0.999991460 0.999991837 0.999994587 0.999994831 0.999996602 0.999996759 0.999997888 0.999997987 0.999998699 0.999998761 0.999999207 0.999999245 0.999999521 0.999999545 0.999999713 0.999999728 0.999999830 0.999999839 0.999999900 0.999999906 0.999999942 0.999999945 0.999999967 0.999999968 0.999999981 0.999999982 0.999999989 0.999999990 0.999999994 0.999999994 0.999999997 0.999999997 0.999999998 0.999999998 0.999999999 0.999999999

0.999972112 0.999973274 0.999981862 0.999982635 0.999988315 0.999988824 0.999992545 0.999992876 0.999995288 0.999995502 0.999997051 0.999997187 0.999998172 0.999998258 0.999998877 0.999998931 0.999999317 0.999999351 0.999999589 0.999999609 0.999999755 0.999999767 0.999999855 0.999999863 0.999999915 0.999999920 0.999999951 0.999999954 0.999999972 0.999999973 0.999999984 0.999999985 0.999999991 0.999999991 0.999999995 0.999999995 0.999999997 0.999999997 0.999999998 0.999999999 0.999999999 0.999999999

113

Para valores negativos de Z


Normal 0 -0.1 -0.2 -0.3 -0.4 -0.5 -0.6 -0.7 -0.8 -0.9 -1 -1.1 -1.2 -1.3 -1.4 -1.5 -1.6 -1.7 -1.8 -1.9 -2 -2.1 -2.2 -2.3 -2.4 -2.5 -2.6 -2.7 -2.8 -2.9 -3 -3.1 -3.2 -3.3 -3.4 -3.5 -3.6 -3.7 -3.8 0 0.5 0.01 0.02 0.03 0.488033527 0.448283213 0.409045885 0.370699981 0.333597821 0.298055965 0.264347292 0.232695092 0.203269392 0.176185542 0.151505003 0.129238112 0.109348552 0.091759136 0.07635851 0.063008364 0.051550748 0.041815138 0.033624969 0.026803419 0.02117827 0.016585807 0.012873721 0.009903076 0.007549411 0.005703126 0.004269243 0.003166716 0.0023274 0.00169481 0.001222769 0.000874032 0.000618951 0.00043423 0.000301791 0.00020778 0.000141711 9.57E-05 6.41E-05 0.04 0.484046563 0.444329995 0.405165128 0.366928264 0.329968554 0.294598516 0.2610863 0.229649997 0.200454193 0.17360878 0.14916995 0.127143151 0.107487697 0.090122672 0.0749337 0.061780177 0.050502583 0.040929509 0.032884119 0.026189845 0.020675163 0.016177383 0.012545461 0.00964187 0.007343631 0.005542623 0.004145301 0.003071959 0.002255677 0.001641061 0.001182891 0.000844739 0.000597648 0.000418892 0.000290857 0.000200064 0.000136319 9.20E-05 6.15E-05 0.05 0.480061194 0.440382308 0.401293674 0.363169349 0.32635522 0.291159687 0.257846111 0.226627352 0.197662543 0.171056126 0.146859056 0.125071936 0.105649774 0.088507991 0.07352926 0.060570758 0.049471468 0.040059157 0.032156775 0.02558806 0.020182215 0.015777607 0.012224473 0.009386706 0.007142811 0.005386146 0.004024589 0.002979763 0.002185961 0.00158887 0.001144207 0.000816352 0.000577025 0.000404058 0.000280293 0.000192616 0.00013112 8.84E-05 5.91E-05 0.06 0.476077817 0.436440537 0.397431887 0.359423567 0.32275811 0.287739719 0.254626915 0.223627292 0.194894521 0.168527607 0.1445723 0.123024403 0.103834681 0.086914962 0.072145037 0.059379941 0.048457226 0.039203903 0.031442763 0.024997895 0.01969927 0.015386335 0.011910625 0.009137468 0.006946851 0.005233608 0.003907033 0.002890068 0.002118205 0.001538195 0.001106685 0.000788846 0.000557061 0.000389712 0.000270088 0.000185427 0.000126108 8.50E-05 5.67E-05 0.07 0.47209683 0.432505068 0.393580127 0.355691245 0.319177509 0.284338849 0.251428895 0.220649946 0.192150202 0.166023246 0.142309654 0.121000484 0.102042315 0.085343451 0.070780877 0.058207556 0.047459682 0.03836357 0.030741909 0.024419185 0.019226172 0.015003423 0.011603792 0.008894043 0.006755653 0.005084926 0.003792562 0.002802815 0.002052359 0.001488999 0.001070294 0.000762195 0.000537737 0.000375841 0.000260229 0.000178491 0.000121275 8.16E-05 5.44E-05 0.08 0.468118628 0.428576284 0.389738752 0.351972708 0.315613697 0.280957309 0.24825223 0.217695438 0.189429655 0.163543059 0.14007109 0.119000107 0.100272568 0.083793322 0.069436623 0.057053433 0.046478658 0.03753798 0.030054039 0.023851764 0.018762766 0.014628731 0.011303844 0.008656319 0.006569119 0.004940016 0.003681108 0.002717945 0.001988376 0.001441242 0.001035003 0.000736375 0.000519035 0.000362429 0.000250707 0.000171797 0.000116617 7.84E-05 5.22E-05 0.09 0.464143607 0.424654565 0.385908119 0.348268273 0.312066949 0.277595325 0.245097094 0.214763884 0.186732943 0.16108706 0.137856572 0.117023196 0.098525329 0.082264439 0.068112118 0.055917403 0.045513977 0.036726956 0.02937898 0.023295468 0.0183089 0.014262118 0.011010658 0.008424186 0.006387155 0.004798797 0.003572601 0.002635402 0.001926209 0.001394887 0.001000782 0.000711364 0.000500937 0.000349463 0.00024151 0.000165339 0.000112127 7.53E-05 5.01E-05

0.496010644 0.492021686

0.460172163 0.456204687 0.452241574 0.420740291 0.416833837 0.412935577 0.382088578 0.378280478 0.374484165 0.344578258 0.340902974 0.337242727 0.308537539 0.305025731 0.301531788 0.274253118 0.270930904 0.267628893 0.241963652 0.238852068 0.235762498 0.211855399 0.208970088 0.206108054 0.184060125 0.181411255 0.158655254 0.156247645 0.17878638 0.15386423

0.135666061 0.133499513 0.131356881 0.11506967 0.113139446 0.111232437

0.096800485 0.095097918 0.093417509 0.080756659 0.079269841 0.077803841 0.066807201 0.065521712 0.064255488 0.054799292 0.053698928 0.052616138 0.044565463 0.043632937 0.042716221 0.035930319 0.035147894 0.034379502 0.02871656 0.028066607 0.02742895

0.022750132 0.022215594 0.021691694 0.017864421 0.017429178 0.017003023 0.013903448 0.013552581 0.013209384 0.01072411 0.008197536 0.010444077 0.010170439 0.00797626 0.007760254

0.006209665 0.006036558 0.005867742 0.004661188 0.004527111 0.004396488 0.003466974 0.00255513 0.00336416 0.003264096

0.002477075 0.002401182

0.001865813 0.001807144 0.001750157 0.001349898 0.001306238 0.001263873 0.000967603 0.000935437 0.000904255 0.000687138 0.000663675 0.000640953 0.000483424 0.00046648 0.000450087

0.000336929 0.000324814 0.000313106 0.000232629 0.000224053 0.000215773 0.000159109 0.000153099 0.000147302 0.0001078 7.23E-05 0.00010363 6.95E-05 9.96E-05 6.67E-05

114

-3.9 -4 -4.1 -4.2 -4.3 -4.4 -4.5 -4.6 -4.7 -4.8 -4.9 -5 -5.1 -5.2 -5.3 -5.4 -5.5 -5.6 -5.7 -5.8 -5.9 -6

4.81E-05 3.17E-05 2.07E-05 1.33E-05 8.54E-06 5.41E-06 3.40E-06 2.11E-06 1.30E-06 7.93E-07 4.79E-07 2.87E-07 1.70E-07 9.96E-08 5.79E-08 3.33E-08 1.90E-08 1.07E-08 5.99E-09 3.32E-09 1.82E-09 9.87E-10

4.61E-05 3.04E-05 1.98E-05 1.28E-05 8.16E-06 5.17E-06 3.24E-06 2.01E-06 1.24E-06 7.55E-07 4.55E-07 2.72E-07 1.61E-07 9.44E-08 5.48E-08 3.15E-08 1.79E-08 1.01E-08 5.65E-09 3.12E-09 1.71E-09 9.28E-10

4.43E-05 2.91E-05 1.89E-05 1.22E-05 7.80E-06 4.94E-06 3.09E-06 1.92E-06 1.18E-06 7.18E-07 4.33E-07 2.58E-07 1.53E-07 8.95E-08 5.19E-08 2.98E-08 1.70E-08 9.55E-09 5.33E-09 2.94E-09 1.61E-09 8.72E-10

4.25E-05 2.79E-05 1.81E-05 1.17E-05 7.46E-06 4.71E-06 2.95E-06 1.83E-06 1.12E-06 6.83E-07 4.11E-07 2.45E-07 1.45E-07 8.48E-08 4.91E-08 2.82E-08 1.60E-08 9.01E-09 5.02E-09 2.77E-09 1.51E-09 8.20E-10

4.07E-05 2.67E-05 1.74E-05 1.12E-05 7.12E-06 4.50E-06 2.81E-06 1.74E-06 1.07E-06 6.49E-07 3.91E-07 2.33E-07 1.37E-07 8.03E-08 4.65E-08 2.66E-08 1.51E-08 8.50E-09 4.73E-09 2.61E-09 1.43E-09 7.71E-10

3.91E-05 2.56E-05 1.66E-05 1.07E-05 6.81E-06 4.29E-06 2.68E-06 1.66E-06 1.02E-06 6.17E-07 3.71E-07 2.21E-07 1.30E-07 7.60E-08 4.40E-08 2.52E-08 1.43E-08 8.02E-09 4.46E-09 2.46E-09 1.34E-09 7.24E-10

3.75E-05 2.45E-05 1.59E-05 1.02E-05 6.50E-06 4.10E-06 2.56E-06 1.58E-06 9.68E-07 5.87E-07 3.52E-07 2.10E-07 1.23E-07 7.20E-08 4.16E-08 2.38E-08 1.35E-08 7.57E-09 4.21E-09 2.31E-09 1.26E-09 6.81E-10

3.59E-05 2.35E-05 1.52E-05 9.77E-06 6.21E-06 3.91E-06 2.44E-06 1.51E-06 9.21E-07 5.58E-07 3.35E-07 1.99E-07 1.17E-07 6.82E-08 3.94E-08 2.25E-08 1.27E-08 7.14E-09 3.96E-09 2.18E-09 1.19E-09 6.40E-10

3.45E-05 2.25E-05 1.46E-05 9.34E-06 5.93E-06 3.73E-06 2.32E-06 1.43E-06 8.76E-07 5.30E-07 3.18E-07 1.89E-07 1.11E-07 6.46E-08 3.72E-08 2.13E-08 1.20E-08 6.73E-09 3.74E-09 2.05E-09 1.12E-09 6.01E-10

3.30E-05 2.16E-05 1.39E-05 8.93E-06 5.67E-06 3.56E-06 2.22E-06 1.37E-06 8.34E-07 5.04E-07 3.02E-07 1.79E-07 1.05E-07 6.12E-08 3.52E-08 2.01E-08 1.14E-08 6.35E-09 3.52E-09 1.93E-09 1.05E-09 5.64553E-

115

ESTIMACIN DE INTERVALO DE CONFIANZA


En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro, con una probabilidad determinada. Se llama intervalo de confianza a un par de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. INTERVALO DE CONFIANZA: Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico La probabilidad de xito en la estimacin se denomina nivel de confianza y se simboliza (1 ) x 100. NIVEL DE CONFIANZA: Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9% (alfa) es el llamado error aleatorio o nivel de significacin o de significancia, esto es, una medida de las posibilidades de fallar o equivocar en la estimacin mediante tal intervalo. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar. Es habitual que el parmetro se distribuya normalmente. Segn diferentes niveles de confianza el coeficiente de Z vara, as: 1- =90%, Z=1.64; 1- =97.5%, Z=2.24; 1- =95%, 1- =99%, Z=1.96 Z=2.58

116

Para determinar el valor de Z, se realiza el siguiente procedimiento:


Nivel de confianza % 50 68.27 80 90 95 95.45 96 97.5 98 99 99.73 Nivel de confianza 1- 0.50 0.6827 0.80 0.90 0.95 0.9545 0.96 0.975 0.98 0.99 0.9973 Nivel de significancia /2 0.25 0.1586 0.10 0.05 0.025 0.02275 0.02 0.0125 0.01 0.005 0.00135 0.75 0.8413 0.90 0.95 0.975 0.97725 0.98 0.9875 0.99 0.995 0.9986 Sumatoria 1- + /2 Buscar en la Tabla de distribucin normal acumulativa y unir los valores de la columna y rengln de Z=Valor crtico Z=0.67 Z=1.00 Z=1.28 Z= 1.64 Z= 1.96 Z=2.00 Z=2.06 Z= 2.24 Z=2.33 Z= 2.58 Z=2.99

La notacin /2, representa que estamos en una grfica de dos colas, por esta razn (alfa) o nivel de significancia se divide entre dos. Se llama valor crtico al valor de Z necesario para construir un intervalo de confianza para la distribucin. El 95% de confianza corresponde a un valor de de 0.05. El valor crtico Z correspondiente al rea acumulativa de 0.9750 es 1.96.

117

Este valor nos dice que la media de la muestra se encuentran en un 95% de los casos como mximo a 1.96 desviaciones tpicas de la media buscada. Estimacin del intervalo de confianza para la media ( conocida) Formula de intervalo de confianza para la media ( conocida) Z /n o - Z /n - Z /n

Ejemplo estimacin del intervalo de confianza para la media con 95% de confianza Un fabricante de papel tiene un proceso de produccin continuo. Se espera que el papel tenga una media de longitud de 11 pulgadas y una desviacin estndar de 0.02 pulgadas. Se selecciona una muestra para determinar si la media es igual a 11 pulgadas. Se selecciona una muestra aleatoria de 100 hojas; la media de longitud de papel es de 10.998 pulgadas. Construya una estimacin de intervalo de confianza del 95% para la media poblacional de la longitud del papel. Z /n = 10.998 (1.96) 0.02 100 = 10.9980.00392

El intervalo de confianza es: 10.99408 11.00192

Se concluye que con un 95% de confianza, se concluye que la media poblacional est entre 10.99408 y 11.00192 pulgadas. Como el intervalo incluye al 11, valor que indica que el proceso de produccin funciona adecuadamente, no hay razn para creer que algo est mal.

118

Ejemplo estimacin del intervalo de confianza para la media con 99% de confianza Z /n = 10.998 (2.58) 0.02 100 = 10.998 0.00516

El intervalo de confianza es:

10.99284 11.00316

Una vez ms, puesto que el 11 est incluido dentro de la amplitud de intervalo, no hay razn para creer que algo est mal.

Problemas a resolver

1.- El Ayuntamiento, para planificar su poltica social, ha realizado una encuesta en un barrio, basada en un muestreo aleatorio a 36 adultos, sobre los ingresos medios mensuales, obtenindose 728 pesos de media y 120 pesos de desviacin estndar. Estimar el valor medio de los ingresos en dicho barrio con un intervalo de confianza del 95% y del 99%. 2.- Una encuesta realizada sobre 40 aviones comerciales, revela que la antigedad media de estos es de 13,41 aos, con una desviacin estndar de la muestra es s=8,28 Cul es con un 90% de confianza la antigedad media de toda la flota comercial? 3.- En una muestra de 50 jvenes encontramos que la dedicacin media diaria al ocio es de 400 minutos y la desviacin estndar de la muestra de 63 minutos. Calcular el intervalo de confianza de la media de la poblacin al 95% de nivel de confianza. 4.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl (miligramos por decilitro) en medidas de colesterol. Suponiendo que la desviacin

119

estndar de la variable que mide las unidades de colesterol es s=28 mg/dl, se pide: a) Calcular el intervalo de confianza, con un nivel de confianza 0'95 para la media de la poblacin.

Estimacin del intervalo de confianza para la media ( desconocida) As como la media poblacional suele ser desconocida, rara vez se conoce la desviacin estndar real de la poblacin . Por lo tanto se requiere desarrollar una estimacin del intervalo de confianza de usando solo los estadsticos de muestra: y S (media y desviacin estndar de la muestra). La distribucin t (de t-Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de muestra es pequeo. Se utiliza para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza cuando se desconoce la desviacin estndar de una poblacin y sta debe ser estimada a partir de los datos de una muestra Formula de intervalo de confianza para la media ( desconocida) tn-1 S/n Ejercicio: Una empresa de remodelaciones selecciona una muestra de 100 facturas de la poblacin de facturas de ventas durante el mes; la media de la muestra de las 100 facturas de ventas es de $110.27, con una desviacin estndar de $28.95. Para un nivel de confianza del 95% y 99 grados de libertad. o - tn-1 S/n + tn-1 S/n

120

Para determinar el valor crtico (tn-1) se busca en la Tabla de valores crticos de t (ver tabla al final) Las columnas de la tabla representan el rea de la cola superior de la distribucin t. Cada fila representa el valor t determinado para cada grado de libertad especfico.

Por ejemplo, con 99 grados de libertad, si se quiere un nivel de confianza del 95% significa que el 2.5% de los valores, es decir un rea de 0.025, se encuentra en cada extremo de la distribucin. Buscando en la columna para un rea de la cola superior de 0.025 y en la fila correspondiente a 99 grados de libertad, se obtiene un valor crtico para t de 1.9842 (ver figura). Entonces sustituimos: tn-1 S/n = 110.27 (1.9842) 28.95 100 =110.27 (1.9842) 2.895 =110.27 5.74 $104.53 $116.01

121

122

123

PRUEBA DE HIPOTESIS
Una hiptesis es una proposicin aceptable que ha sido formulada a travs de la recoleccin de informacin y datos, aunque no est confirmada sirve para responder de forma tentativa a un problema con base cientfica. Una hiptesis puede usarse como una propuesta provisional que no se pretende demostrar estrictamente, o puede ser una prediccin que debe ser verificada por el mtodo cientfico. En el primer caso, el nivel de veracidad que se otorga a una hiptesis depender de la medida en que los datos empricos apoyan lo afirmado en la hiptesis. Esto es lo que se conoce como contrastacin emprica de la hiptesis o bien proceso de validacin de la hiptesis. Este proceso puede realizarse mediante confirmacin (corroborar, dar validez) o mediante verificacin (demostrar o comprobar que es verdadera una cosa de la que se dudaba). Hiptesis nula y alternativa En un trabajo de investigacin generalmente se plantean dos hiptesis mutuamente excluyentes: la hiptesis nula o hiptesis de nulidad (H0) y la hiptesis alternativa o de investigacin (H1). La hiptesis nula (H0), siempre es una de status quo: expresa que el fenmeno o proceso est funcionando de manera adecuada, de acuerdo con la norma o las especificaciones. La hiptesis de investigacin (H1), es una afirmacin especial cuya validez se pretende demostrar, si las pruebas empricas no apoyan decididamente la hiptesis de investigacin se aceptar la hiptesis nula y se abandona la hiptesis de investigacin. La hiptesis alternativa es opuesta a la hiptesis nula, la primera es cierta si la segunda es falsa. El anlisis estadstico de los datos servir para determinar si se puede o no aceptar H1. Cuando se rechaza H0, significa que el factor estudiado ha influido significativamente en los resultados y es informacin relevante para apoyar la 124

hiptesis de investigacin H1. Plantear hiptesis de investigacin (H1) que no sea excluyente con H0 supondra una aplicacin incorrecta del razonamiento estadstico. Ejemplo: Es el peso medio de las cajas de cereal incluidas en la muestra de una empresa de cereales un valor congruente con lo que usted esperara si la media de toda la poblacin de cajas de cereales es de 368 gr? o puede usted inferir que la media poblacional no es igual a 368 gramos porque la media muestral es

significativamente diferente a 368 gramos?. Hiptesis nula (H0): El llenado medio concuerda con la especificacin de 368 gramos. H0: = 368 Hiptesis de investigacin o alternativa (H1): El llenado medio no concuerda con la especificacin de 368 gramos. H1: 368 En la metodologa de prueba de hiptesis, no poder rechazar la hiptesis nula no comprueba que sea cierta. Usted nunca podr demostrar que la hiptesis nula es correcta, porque la decisin se basa solo en informacin de la muestra, no en toda la poblacin. Por lo tanto, si no se rechaza la hiptesis nula, solo puede concluir que no existe evidencia suficiente para garantizar su rechazo. Los siguientes puntos fundamentales resumen las hiptesis nula y alternativa. La hiptesis nula H0 representa al status quo o creencia actual en una situacin La hiptesis alternativa H1 es lo opuesto a la hiptesis nula H0 y representa una afirmacin de investigacin o inferencia especfica que quisiera demostrar. Si se rechaza la hiptesis nula, tiene una prueba estadstica de que la hiptesis alternativa es correcta. 125

Si no se rechaza la hiptesis nula, entonces no ha podido demostrar la hiptesis alternativa. El no poder demostrar la hiptesis alternativa no quiere decir que haya demostrado la hiptesis nula.

La hiptesis nula siempre se refiere a un valor especfico del parmetro poblacional , no a un estadstico de muestra (). El enunciado que describe la hiptesis nula siempre contiene un signo de igual relacionado con el valor especfico del parmetro poblacional. El enunciado que describe la hiptesis alternativa nunca contiene un signo de igual relacionado con el valor especfico del parmetro poblacional.

Valor crtico del estadstico de prueba La lgica subyacente a la metodologa de prueba de hiptesis radica en determinar qu tan probable es que la hiptesis nula sea cierta, considerando la informacin recabada en una muestra. El estadstico () es una estimacin del parmetro poblacional (). Si la hiptesis nula es cierta cabe esperar que el estadstico () sea cercano al parmetro (). Si es cercano a , no se cuenta con evidencia suficiente para rechazar H0. Pero si existe una gran diferencia entre y establecida en la hiptesis, usted concluir que sta ltima es falsa. Regiones de rechazo y aceptacin La distribucin muestral del estadstico de muestra , se divide en dos regiones: una de rechazo o regin crtica y una de aceptacin o no rechazo. Si el estadstico de prueba queda en la regin de aceptacin o de no rechazo, no rechace la hiptesis nula. Por el contrario si queda en la regin de rechazo, se rechaza la hiptesis nula.

126

Error tipo I y II Al utilizar un estadstico de muestra para tomar decisiones sobre el parmetro poblacional, existe el riesgo de llegar a una conclusin equivocada, se puede cometer error tipo I y el error tipo II. El error tipo I se presenta cuando se rechaza la hiptesis nula H0 siendo cierta y no debera rechazarse. La probabilidad de que se presente un error tipo I es . El error tipo II se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa y debera rechazarse. La probabilidad de que se presente un error tipo II es . La probabilidad de cometer un error tipo denotado por , se denomina nivel de significancia del estadstico de prueba, por lo general se seleccionan nivel de 0.01, 0.5 o 0.10. Despus de especificar el valor de , usted conoce el tamao de la regin de rechazo, porque es la probabilidad de rechazo bajo la hiptesis nula. A partir de este hecho, se determina el valor o valores crticos que dividen las zonas de rechazo y aceptacin. El complemento de la probabilidad de un error tipo I (1- ) se denomina coeficiente de confianza. Al multiplicarlo por cien (1- ) x 100, el coeficiente de confianza produce el nivel de confianza. El coeficiente de confianza (1- ), expresa la probabilidad de que la hiptesis nula no se rechace cuando es cierta y no debe rechazarse. El nivel de confianza de una prueba de hiptesis es (1- ) x 100.

127

La posibilidad de cometer el error tipo II () depende de la diferencia que existe entre los valores hipotticos y real del parmetro poblacional. Si la diferencia que existe entre los valores hipottico y real del parmetro poblacional es grande, es pequea y si la diferencia entre los valores hipottico y real del parmetro poblacional es pequeo es mayor. Prueba Z de hiptesis para la media con conocida Cuando se conoce la desviacin estndar poblacional (), y si tiene una distribucin normal se utiliza la prueba de Z de hiptesis para la media ( conocida): Z= - n Si la poblacin no tiene una distribucin normal, todava se puede utilizar la prueba Z si el tamao de la muestra es lo bastante grande como para que tenga efecto el teorema del lmite central. La ecuacin anterior define el estadstico de prueba Z para determinar la diferencia que existe entre la media muestral y la media poblacional cuando se conoce la desviacin estndar poblacional .

El resultado obtenido de la prueba Z, se compara con los valores crticos. Si se utiliza un nivel de significancia de 0.05, este valor de divide entre dos 0.05/2= 0.025. De esta forma la distribucin normal tiene como resultado un rea acumulada de 0.025 bajo el valor crtico inferior (izquierda de la grfica) y un rea acumulada de 0.975 bajo el valor critico superior. Con este nivel de confianza, de acuerdo a la Tabla de distribucin normal estandarizada acumulativa los valores crticos que dividen las regiones de rechazo y aceptacin son -1.96 y + 1.96. Los valores de Z mayores que + 1.96 y menores que -1.96 indican que la media muestral est muy alejada de la media poblacional , por lo que sera muy poco probable que se presentara uno de estos valores si Ho fuera verdadera.

128

Por lo tanto la regla de decisin es: Rechace Ho si Z +1.96 o si Z -1.96 De lo contrario, no rechace Ho.

Ejemplo:

Una empresa de empaquetado de cereales quiere determinar si el proceso de llenado de cereal funciona de manera adecuada, es decir sus paquetes presentan los 368 gramos especificados y no requiere accin correctiva. Para evaluar esto, se toma una muestra aleatoria de 25 cajas, pesa cada una y define una hiptesis nula y alternativa: Hiptesis nula (H0): El llenado medio concuerda con la especificacin de 368 gramos. H0: = 368 Hiptesis de investigacin o alternativa (H1): El llenado medio no concuerda con la especificacin de 368 gramos. H1: 368

El resultado del pesado de las 25 cajas indica una media muestral de =372.5 gramos y que la desviacin estndar de la poblacin es de 15 gramos

129

Z= - = 372.5-368 = +1.50 15 n 25

Puesto que el estadstico de prueba Z= +1.50 se encuentra entre 11.96 y + 1.96, no se rechaza Ho, la conclusin se redacta de la siguiente manera: no existe suficiente evidencia de que el llenado medio sea diferente a 368 gramos

Prueba t de hiptesis para la media ( desconocida)

En la mayora de las situaciones de prueba de hiptesis que implican datos numricos, no se conoce la desviacin estndar poblacional . En su lugar, se utiliza la desviacin estndar de la muestra S. Si se supone que la poblacin tiene una distribucin normal, la distribucin muestral de la media seguir una distribucin t con n-1 grados de libertad. Si la poblacin no tiene una distribucin normal se puede utilizar la prueba t si el tamao es suficientemente grande ( 120).

La ecuacin siguiente define al estadstico prueba t para determinar la diferencia que existe entre la media muestral y la media poblacional cuando se utiliza la desviacin estndar muestral S. t= - S n 130

En los ltimos cinco aos una empresa presenta un monto medio por factura de 120 pesos. Se utiliza la prueba de hiptesis para tratar de demostrar que el monto medio por factura est aumentando o disminuyendo. Paso 1. Definir hiptesis nula y de investigacin. Ho: = 120 H1: 120

La hiptesis de investigacin H1 contiene la informacin que se trata de comprobar, si se rechaza la hiptesis nula, se tendrn evidencias estadsticas de que la cantidad media por factura no supera los 120. Si la conclusin estadstica es no rechazar H0, entonces se concluir que existe n evidencias suficientes para demostrar que la cantidad media es distinta de la media a largo plazo de 120. Paso 2. Se selecciona un tamao de muestra, que en este caso es n= 12. Se decide utilizar un nivel de significancia =0.05 Paso 3. Puesto que no se conoce , se utiliza la distribucin t y el estadstico de prueba t. Se supone que la poblacin de facturas tiene una distribucin normal.

Paso 4. Para una muestra de tamao n, el estadstico de prueba t sigue una distribucin t con n-1 grados de libertad. En la tabla valores crticos de t. Para localizar el rea de cola superior, el nivel de significancia se divide entre dos: =0.05/2= 0.025, con este dato y n-1 grados de libertad= 12-1=11, se localiza

131

Determinacin del valor crtico para un rea de 0.025 en cada cola, con 11 grados de libertad, a partir de la tabla de valores crticos de t. Puesto que la hiptesis de investigacin H1 de que 120 es no direccional, el rea en la regin de rechazo de la cola izquierda (inferior) de la distribucin t es 0.025, y el rea en la regin de rechazo de la cola derecha (superior) de la distribucin t es de 0.025. A partir de la tabla t, los valores crticos son 2.201. La regla de decisin es: Rechazar Ho si t -t11 = - 2.201 O si t -t11 = + 2.201

Paso 5. Los siguientes datos son las cantidades de la muestra de 12 facturas, con la media y la desviacin estndar S:
110.59 75.71 127.46 128.58 107.26 135.11 112.85 108.98 93.32 152.22 91.97 111.45 111.56 20.79

Media

desviacin estndar

132

t= - S n

=112.85-120 =-1.19 20.80 12

Paso 6. Puesto que 2.201 t=-1.19+2.201, no se rechaza la hiptesis nula. No existen evidencias suficientes para concluir que la cantidad media por factura no supera los 120. Debe sugerirse que el monto medio por factura no ha cambiado.

REGRESIN LINEAL SIMPLE


INTRODUCCIN Si se presenta una relacin entre una variable denominada dependiente y otra denominada independiente, como, por ejemplo, las existentes entre la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc., puede darse el problema de que la variable dependiente asuma mltiples valores para una combinacin de valores de las variables independientes. La variable dependiente es la variable que desea predecir. La variable independiente es aqulla que es manipulada por el investigador en un experimento con el objeto de estudiar cmo incide sobre la expresin de la variable dependiente. Variable dependiente e independiente

133

Una variable independiente a aqulla que es manipulada por el investigador en un experimento con el objeto de estudiar cmo incide sobre la expresin de la variable dependiente. Esto significa que las variaciones, ejercidas por el investigador sobre la variable independiente repercutirn en variaciones en la variable dependiente. Tambin se la conoce como variable explicativa y suele denotarse como X

A la variable dependiente se la conoce como variable explicada. Esta dependen de los valores que tome la otra variable. En una funcin suele estar representada por Y, en el eje ordenadas (vertical).

La variable Y est en funcin (depende) de la variable X, que es la variable independiente.

Ejemplos El precio que pagamos por frutas, verduras u otra mercanca depende del nmero de kilogramos que compremos.

x = Kg de mercanca y = P r ec i o e n $

1 2

2 4

3 6

4 8

5 10

El eje de ordenadas o eje Y es el eje vertical de un sistema de coordenadas cartesianas, el eje de las abscisas, o eje X, es el eje horizontal. 134

Si se dan las relaciones descritas, se suele recurrir a los estudios de regresin en los cuales se obtiene una nueva relacin pero de un tipo especial denominado funcin, en la cual la variable independiente se asocia con un indicador de tendencia central de la variable dependiente. Cabe recordar que en trminos generales, una funcin es un tipo de relacin en la cual para cada valor de la variable independiente le corresponde uno y slo un valor de la variable dependiente. Adems de predecir los valores de la variable dependiente, el anlisis de regresin tambin permite identificar el tipo de relacin matemtica que existe entre la variable dependiente e independiente, para cuantificar el efecto que los cambios ejercidos sobre la variable independiente tienen sobre la variable dependiente.

REGRESIN LINEAL SIMPLE La regresin lineal simple y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna relacin funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple. "Y es una funcin de X" Y = f(X) Como Y depende de X, Y es la variable dependiente, y 135

X es la variable independiente.

En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente. Este modelo establece que Y es una funcin de slo una variable independiente y se representa as:

Y = f (X) "Y est regresando por X"

La variable dependiente Y es la variable que se desea explicar o predecir. Tambin se le llama regresando o variable de respuesta. La variable independiente X se le denomina variable explicativa o regresor y se le utiliza para explicar Y.

ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE En el estudio de la relacin funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de prediccin y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notacin:

Yi = 0 + 1 Xi + ei Donde: Yi = variable dependiente (de respuesta) 0 = interseccin en Y para la poblacin 1= pendiente para la poblacin Xi = variable independiente (explicatoria) ei= error aleatorio en Y para la observacin i ECUACIN DE REGRESIN LINEL SIMPLE 136

Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El mtodo de estimacin es el Mtodo de Mnimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuacin de regresin muestral estimada es: Que se interpreta como: Yi= valor predicho de Y para la observacin i Xi= valor de X para la observacin i bo= interseccin de la muestra en Y b1= pendiente de la muestra a es el estimador de a

Yi=bo + b1Xi

Est expresado en las mismas unidades de Y por cada unidad de X. Indica el nmero de unidades en que vara Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresin). Un valor negativo de b sera interpretado como la magnitud del decremento en Y por cada unidad de aumento en X. PROBLEMA Se desea pronosticar las ventas anuales para todas las tiendas nuevas de una marca, con base en el tamao de los establecimientos. Para examinar la relacin entre la superficie de la tienda (en pies cuadrados) y las ventas anuales, se selecciono una muestra de 14 tiendas (ver tabla).

137

TIENDA
1 2 3 4 5 6 7 8 9 10 11 12 13 14

PIES 2
1.7 1.6 2.8 5.6 1.3 2.2 1.3 1.1 3.2 1.5 5.2 4.6 5.8 3

VENTAS ANUALES
3.7 3.9 6.7 9.5 3.4 5.6 3.7 2.7 5.5 2.9 10.7 7.6 11.8 4.1

Para realizar el anlisis por el Mtodo de mnimos cuadrados mediante Excel, se hace de la siguiente forma: 1) En la barra de men seleccionar Datos, 2) Anlisis de datos, 3) Regresin, 4) Aceptar, 5) En rango Y de entrada colocar variables dependientes (ventas anuales), 6) En rango X de entrada colocar variables independientes (pies2), 7) marcar con nivel de confianza, residuos, residuos estndares, grficos residuales, curva de regresin ajustada y grfico de probabilidad normal; dar aceptar.

138

8) los resultados obtenidos con Excel son los siguientes: Tabla 1. Estadsticas de regresin

Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones Tabla 2. Anlisis de varianza (ANOVA)
Grados de libertad Suma de cuadrados

0.95088 0.90418 0.89619 0.96638 14.00000

Promedio de los cuadrados

Valor crtico de F

Regresin Residuos Total

1.00000 12.00000 13.00000

105.74761 11.20668 116.95429

105.74761 0.93389

113.23351

0.00000

Tabla 3. Tabla de coeficientes Coeficientes Intercepcin Variable X 1 0.96447 (b0) 1.66986 (b1) Error tpico 0.52619 0.15693 Estadstico Probabilidad t 1.83293 10.64112 0.09173 0.00000 Inferior 95% -0.18200 1.32795 Superior 95% 2.11095 2.01177 Inferior 95.0% -0.18200 1.32795 Superior 95.0% 2.11095 2.01177

139

En la tabla 3 se observan los coeficientes b0= 0.964 y b1= 1.669. Por lo tanto, la lnea de prediccin para estos datos es: Yi= 0.964 + 1.669i

La pendiente b1 es+ 1.669. Esto significa que para cada incremento de 1 unidad en X, se estima que el valor promedio de Y se incrementar por 1.669 unidades. En otras palabras por cada incremento de 1.0 mil pies cuadrados en el tamao de la tienda, se estima que la media de ventas anuales se incrementar por 1.669 millones. Por lo tanto la pendiente representa la porcin de las ventas anuales que se estima que variar de acuerdo con el tamao de la tienda.

Variable X 1 Curva de regresin ajustada


14 12 Y VENTAS ANUALES 10 8 6 4 2 0 0 1 2 3 4 5 6 7 Y Pronstico para Y

Variable X 1 SUPERFICIE DE LA TIENDA

140

GRFICOS DE CONTROL

Las grficas de control son una herramienta ampliamente utilizada para analizar el proceso de recoleccin secuencial de datos, permiten monitorear la variacin de una caracterstica de productos o servicios a lo largo del tiempo. Con ellas se estudia el desempeo pasado, se evalan las condiciones presentes o predicen las condiciones futuras. La informacin obtenida al analizar una grfica de control, constituye la base para el proceso de mejoramiento. Con ellas se analizan variables categricas, discretas y continuas. Las grficas de control hacen nfasis en separar las causas de variacin especiales de las causas comunes de variacin. De esta forma la idea convencional de inspeccionar el producto final y eliminar las unidades que no cumplen con las especificaciones una vez terminado el proceso, es reemplazada por una estrategia ms econmica de prevencin antes y durante del proceso, con el fin de lograr que precisamente estos productos o servicios lleguen al consumidor sin defectos. Pues las variaciones de calidad producidas antes y durante el proceso pueden ser detectadas y corregidas gracias al empleo masivo de Grficas de Control. Como se menciono, para el enfoque de las grficas de control existen dos tipos de variacin. El primer tipo es una variabilidad aleatoria debido a "causas al azar" o "causas comunes". Estas representan cambios que existen en un proceso, son fluctuaciones que operan aleatoriamente o por casualidad. El segundo tipo de variabilidad, en cambio, representan un cambio real en el proceso atribuible a "causas especiales" o causas asignables de variacin, las cuales, por lo menos tericamente, pueden ser identificadas y eliminadas. Representan grandes fluctuaciones proceso. en los datos que no son inherentes al

141

De esta forma, un proceso se encuentra bajo control estadstico cuando la variabilidad se debe slo a "causas comunes" y est fuera de control cuando se debe a causas especiales. La distincin entre las dos causas de variacin es importante porque las causas especiales no forman parte del proceso y son corregibles, sin cambiar el sistema, Las causas comunes se reducen cambiando el sistema.

Errores comunes en las grficas de control El primer tipo de error implica la creencia de que un valor observado representa una causa especial, cuando en realidad se debe a una causa comn; tratar una causa comn como especial tiene como consecuencia el sobreajuste o manipulacin de un proceso, lo que aumenta la variacin del proceso. El segundo tipo de error implica tratar una causa especial como si fuera comn y da como resultado no tomar una accin correctiva inmediata cuando es necesaria.

Situaciones de las grficas de control Para cada uno de los grficos de control, existen dos situaciones diferentes; a) cuando no existen valores especificados y b) cuando existen valores especificados. Antes de utilizar las Grficas de Control por variables, debe tenerse en consideracin lo siguiente: El proceso debe ser estable y los datos o deben obedecer a una distribucin normal El nmero de datos a considerar debe ser de aproximadamente 20 a 25 subgrupos con un tamao de muestras de 4 a 5, para que las muestras consideradas sean representativas de la poblacin. Los datos deben ser clasificados teniendo en cuenta que, la dispersin debe ser mnima dentro de cada subgrupo y mxima entre subgrupos Se deben disponer de tablas estadsticas 142

Construccin de grficos de control Para construir un grfico de control, se recolectan muestras (subgrupos) de las salidas de un proceso a lo largo del tiempo. Para cada subgrupo o muestra se calcula un estadstico asociado con una variable: Los estadsticos utilizados incluyen la fraccin disconforme1, la media y el rango de una variable numrica. Entonces se grafican los valores contra el tiempo y se agregan los lmites de control a la grfica. La forma ms comn de grafica de control establece limites de control que estn 3 desviaciones estndar de la medida estadsitica de inters. La ecuacin media del proceso 3 desviaciones estndar define, en general, los lmites de control superior e inferior para la grficas de control. El lmite superior (LCS o UCL) es = media del proces + 3 desviaciones estndar, y el lmite inferior (LIC o LCL) = media del proceso - 3 desviaciones estndar. Entonces se grafican los valores contra el tiempo y se agregan los lmites de control a la grfica.

Patrones de las grficas de control

El porcentaje o fraccin disconforme se define como el cociente del nmero de artculos disconformes de una poblacin entre el nmero total de artculos que contiene sta ltima. Los artculos pueden tener varias caractersticas de calidad que el inspector examina simultneamente. Si no est conforme con el estndar de una o ms caractersticas, se clasificar como disconforme.

143

Panel A. No existe un patrn aparente de los valores a lo largo del tiempo y no hay puntos que caigan fuera del lmite de control de 3 desviaciones estndar. El proceso parece estable y contiene causas comunes de variacin. Panel B. Contiene dos puntos que caen fuera de los lmites de control de las 3 desviaciones estndar. Se debe investigar estos puntos para tratar de determinar las causas especiales que llevan a su ocurrencia. Panel C. No tienen ningn punto fuera de los lmites de control, tiene una serie de puntos consecutivos por arriba del valor promedio y una serie de puntos consecutivos por debajo del valor promedio. Adems se observa claramente una tendencia global descendente, se debe investigar para determinar que ha causado este patrn.

Tipos de control de procesos

Cuando una grfica de control exhibe un punto fuera de los lmites de control o una tendencia (como en B y C) est fuera de control y es impredecible. Un proceso fuera de control contiene tanto causas comunes de variacin como causas especiales y estas ltimas no forman parte del diseo del proceso, si las causas especiales de variacin actan en detrimento del producto o servicio, se requiere elaborar planes para eliminar la causa; por el contrario si stas incrementan la calidad del producto o servicio, se debe cambiar el proceso para incorporarla dentro del diseo del proceso.

Un proceso bajo control, contiene nicamente causas comunes de variacin puesto que son inherentes al proceso en s mismo. Un proceso bajo control es predecible. En ocasiones se denomina que estn en un estado de control estadstico.

144

Tipos de grficas de control La grfica p, control para la proporcin de artculos disconformes Las graficas de atributos se utilizan para variables categricas o discretas, como la grfica p, que se utiliza cuando los elementos que son muestreados se clasifican de acuerdo a si se conforman o no con los requerimientos definidos operacionalmente. La grfica p ayuda a monitorear y analizar la proporcin de elementos disconformes que estn en muestras repetidas (subgrupos) que se seleccionan de un proceso. Una empresa hotelera quiere conocer la proporcin de habitaciones con ausencia de comodidad o mal funcionamiento de electrodomsticos. Se recolectaron los datos de las disconformidades de una muestra de 200 habitaciones (tabla 1) durante 28 das. Frmula de lmites de control para la grfica: p 3 p (1-p) n Lmite superior de control (LSC)= p+ 3 p (1-p) n Lmite inferior de control (LIC)= p- 3 p (1-p) n k p= pi i=1 k En donde: Pi= xi/ni = proporcin de elementos disconformes en el subgrupo i n= tamao promedio del subgrupo k= nmero de subgrupos seleccionados

145

Tabla 1
Da 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 k=28 Habitaciones estudiadas 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 n=200 Habitaciones no preparadas 16 7 21 17 25 19 16 15 11 12 22 20 17 26 18 13 15 10 14 25 19 12 6 12 18 15 20 22 proporcin =c2/b2 0.080 0.035 0.105 0.085 0.125 0.095 0.080 0.075 0.055 0.060 0.110 0.100 0.085 0.130 0.090 0.065 0.075 0.050 0.070 0.125 0.095 0.060 0.030 0.060 0.090 0.075 0.100 0.110 2.315 pi=2.315

146

Para los datos de la tabla anterior k=28 Pi= 2.315 n= 200 k= 28 p=


k

pi

i=1

p=

pi

=2.315 28

=0.0827

i=1

0.0827 (0.0827)(0.9173) = 0.0584 p 3 p (1-p) n LSC= LIC= 200

0.0827+0.0584= 0.1411 0.0827-0.0584=0.0243

147

Grafica p, control para la proporcin de artculos disconformes


0.140 0.120 0.100 0.080 0.060 0.040 0.020 0.000 1 3 5 7 9 11 13 15 17 19 21 23 25 27

La figura presenta un proceso en estado de control estadstico, con los puntos individuales alrededor de p sin ningn patrn y con todos los puntos dentro de los lmites de control. Por lo tanto cualquier mejora en el proceso analizado deber provenir de la reduccin de la causa comn de variacin. Tal reduccin requiere un cambio en el proceso. Procedimiento para realizar la grfica p en Excel Una vez que se tiene la base de datos como la tabla 1 se elige el men insertar, posteriormente dentro de ste se seleccionan grficos de lnea, all se opta por grficas de lnea con marcadores.

148

Una vez seleccionada la opcin anterior aparece un recuadro en blanco, se coloca el cursor sobre ste y se da clik en el botn derecho, all parece un men y se elige seleccionar datos

Aparecer la siguiente ventana, donde se selecciona agregar

Y subsecuentemente la ventana siguiente:

149

En la lnea de nombre de la serie se colocan para ste caso los das y en valores de las serie los datos de proporcin y finalmente se arregla el formato de la grfica.

Grafca p para control de la proporcin de artculos disconformes


0.140 0.120 0.100 0.080 0.060 0.040 0.020 0.000 Das

Como se observa en la grfica la lnea de 0.080 corresponde al valor de p, el lmite superior de control esta en 0.1411 y el lmite inferior de control est en 0.0243.

150

Grfica de control para el rango y la media Las variables numricas comunes incluyen tiempo, dinero y peso, las grficas de control de variables son ms sensibles para detectar la variacin por causas especiales respecto a la grfica p. Las grficas de control, generalmente se usan en parejas, una permite monitorear la dispersin o variabilidad, y la otra monitorea el promedio del proceso. Primero se debe examinar la grfica de dispersin porque, si indica la presencia de condiciones fuera de control, la interpretacin del diagrama para la media ser falseada. La grfica R Se utiliza la grfica de rango nicamente cuando el tamao de muestra sea de 10 o menos, si es mayor de 10 es preferible utilizar una grfica de desviacin estndar. La grfica R permite determinar si la variabilidad en un proceso est bajo control o si los cambios en la cantidad de variabilidad se estn dando a lo largo del tiempo. Si el rango del proceso est bajo control, entonces la cantidad de variacin en el proceso es consistente a lo largo del tiempo, y los resultados de la grfica R sern tiles para desarrollar los lmites de control del promedio. Para desarrollar los lmites de control para el rango, se requiere una estimacin del rango promedio y de la desviacin estndar del rango. Estos lmites dependen de dos constantes: factor d2, que representa la relacin entre la desviacin estndar y el rango para tamaos de muestra que varan, y el factor d3, que representa la relacin entre la desviacin estndar y el error estndar del rango para tamaos de muestra que varan.

Lmites de control para el rango R3R d3 d2

151

Lmite de control superior (LCS)= R+3R d3 d2 Lmite de control inferior (LCI)= R-3R d3 d2

k Donde: R= Ri i=1 k

Problema: Se defini operacionalmente la cantidad de tiempo para entregar el equipaje. Se registraron datos durante un periodo de 4 semanas. Se seleccionaron subgrupo (muestras) de cinco entregas del turno de la tarde de cada da (ver tabla 2). Tabla 2. TIEMPOS DE ENTREGA DE EQUIPAJE EN MINUTOS
DIA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 A 6.7 7.6 9.5 9.8 11 8.3 9.4 11.2 10 8.6 10.7 10.8 9.5 12.9 7.8 11.1 9.2 B 11.7 11.4 8.9 13.2 9.9 8.4 9.3 9.8 10.7 5.8 8.6 8.3 10.5 8.9 9 9.9 9.7 C 9.7 9 9.9 6.9 11.3 9.7 8.2 10.5 9 8.7 9.1 10.6 7 8.1 12.2 8.8 12.3 D 7.5 8.4 8.7 9.3 11.6 9.8 7.1 9 8.2 9.5 10.9 10.3 8.6 9 9.1 5.5 8.1 E 7.8 9.2 10.7 9.4 8.5 7.1 6.1 9.7 11 11.4 8.6 10 10.1 7.6 11.7 9.5 8.5 MEDIA 8.68 9.12 9.54 9.72 10.46 8.66 8.02 10.04 9.78 8.8 9.58 10 9.14 9.3 9.96 8.96 9.56 RANGO 5 3.8 2 6.3 3.1 2.7 3.3 2.2 2.8 5.6 2.3 2.5 3.5 5.3 4.4 5.6 4.2

152

18 19 20 21 22 23 24 25 26 27 28

9 9.9 10.7 9 10.7 10.2 10 9.6 8.2 7.1 11.1

8.1 10.1 9.8 10 9.8 10.5 11.1 8.8 7.9 11.1 6.6

10.2 8.9 10.2 9.6 9.4 9.5 9.5 11.4 8.4 10.8 12

9.7 9.6 8 10.6 7 12.2 8.8 12.2 9.5 11 11.5

8.4 7.1 10.2 9 8.9 9.1 9.9 9.3 9.2 10.2 9.7 Sumas:

9.08 9.12 9.78 9.64 9.16 10.3 9.86 10.26 8.64 10.04 10.18 265.38

2.1 3 2.7 1.6 3.7 3.1 2.3 3.4 1.6 4 5.4 97.5

k= nmero de subgrupos seleccionados = 28 k Ri = sumatoria de rangos = 97.5 i=1

k R= Ri = 97.5 = 3.482 i=1 k n= 5 28

R3R d3 d2

LCS= R+3R d3 d2

LCI= R-3R d3 d2

Constantes

d2= 2.362

d3= 0.864

153

3.4823 (3.482) [ 0.864 ] = 3.4823.880 2.326 Por lo tanto LCS= 3.482+3.880= 7.362 LCI= 3.482-3.8800 El LCI no existe porque es imposible obtener un rango negativo.

La grfica La grfica de control utiliza subgrupos cada uno de tamao n para k periodos consecutivos de tiempo. Para calcular los lmites de control para el promedio, se necesita calcular la media de los promedios de los subgrupos (denominada ), y la desviacin estndar de la media (que se denomina error estndar de la media ). El estimado de la desviacin estndar de la media es una funcin del factor d2 , 154

que representa la relacin entre la desviacin estndar y el rango para tamao de muestras variables.

Lmite de control para la grfica

=X3 R___ d2 n

LCS= X+3 R___ d2n

LCI= X-3 R___ d2n

Donde k X= k R=

Xi
i=1 k

Ri
i=1 k

A partir de los datos de la Tabla 2 tiempos de entrega de equipaje en minutos k= nmero de subgrupos seleccionados = 28 k

Xi = sumatoria de las medias de los subgrupos seleccionados


i=1 k

= 265.38

Ri = sumatoria de los rangos de los subgrupos seleccionados= 97.5


i=1

= X=

k R=

Xi = 265.38 = 9.478
i=1

Ri = 97.5 = 3.482
i=1 k 28

28

155

Aplicando

=X3 R___ d2 n

LCS= X+3 R___ d2n

LCI= X-3 R___ d2n

= 9.478 3 3.482 = 2.3625 = 9.478 2.008 Por tanto: LCS= 9.478 + 2.008 = 11.486 LCI= 9.478 - 2.008 = 7.470 Graficando

Grfica X barra para los tiempos de entrega de equipaje


12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

La grfica no revela ningn punto fuera de los lmites de control as como tampoco una tendencia. Aunque existe una cantidad considerable de variabilidad entre las medias de los 28 subgrupos, y como ambas grficas R y X barra estn bajo control, el proceso de entrega de equipaje se encuentra en estado de control estadstico. Si se desea reducir la variacin o la media del tiempo de entrega, entonces se necesita cambiar el proceso. 156