Académique Documents
Professionnel Documents
Culture Documents
GUADEESTUDIODELAASIGNATURA: ESTADSTICA
2PARTE|PLANDETRABAJOYORIENTACIONESPARASUDESARROLLO
2013-2014
VicenteNovoSanjurjo yBienvenidoJimnezMartn
ESTADSTICA
RESULTADOS ALCANZADOS
TIEMPO
Tema 1: Estadstica Descriptiva Comprender el manejo de los datos estadsticos y ser capaz de estudiar variables discretas o continuas. Manejar las distribuciones de frecuencias y las representaciones grficas usuales, as como los Estudie el tema 1 del libro de teora. parmetros estadsticos de centralizacin y de Realice los ejercicios de autocomdispersin, y sus principales propiedades. probacin de ese tema. Comprender y manejar las distribuciones de ms de una variable, las medidas de asociacin lineal entre variables, la covarianza y el coeficiente de correlacin. Tema 2: Probabilidad Reconocer los fenmenos deterministas y los fenmenos aleatorios. Estudie el tema 2 del libro de teora. Comprender el concepto de probabilidad y manejar sus principales propiedades. Realice los ejercicios del tema 1 del Manejar los teoremas fundamentales del producto, de libro de problemas. la probabilidad total y de Bayes. Realice los ejercicios de autocomprobacin de ese tema. Comprender los fenmenos aleatorios compuestos y el concepto de probabilidad condicionada. Tema 3: Variables aleatorias Entender los conceptos de variable aleatoria, de Estudie los temas 3 y 4 del libro de funcin de densidad y de funcin de distribucin. teora. Manejar las principales caractersticas de las variables Realice los ejercicios del tema 2 del aleatorias. libro de problemas. Podr construir modelos de probabilidad. Realice los ejercicios de autocom Podr determinar las principales caractersticas de una probacin de estos temas. variable aleatoria tanto univariante como multivariante. Tema 4: Funciones caracterstica y generatriz. Operaciones con variables aleatorias Manejar las funciones caracterstica y generatriz de Estudie el tema 5 del libro de teora. momentos y comprender su utilidad de cara a las aplicaciones. Realice los ejercicios del tema 3 del libro de problemas, excluyendo la Comprender la utilidad de las transformaciones de seccin 3.4 y los problemas 3.23 a variables aleatorias. 3.28. Podr calcular los momentos a partir de una funcin Realice los ejercicios de autocomgeneratriz. Podr obtener la suma, el producto y el cociente de probacin de ese tema. variables aleatorias.
ESTADSTICA
MDULO 2: MODELOS DE PROBABILIDAD Tiempo de estudio: 3 semanas.
PLAN DE ACTIVIDADES DE APRENDIZAJE RESULTADOS ALCANZADOS TIEMPO
Tema 5: Distribuciones de probabilidad de variable discreta Comprender el significado de los modelos usuales de probabilidad. Estudie el tema 6 del libro de teora. Realice los ejercicios 4.1 a 4.12 del Manejar las distribuciones de variable discreta de tema 4 del libro de problemas. Bernouilli, binomial, hipergeomtrica, binomial negativa y de Poisson. Realice los ejercicios de autocomprobacin de ese tema. Conocer las principales caractersticas de las distribuciones anteriores y ser capaz de calcularlas. Tema 6: Distribuciones de probabilidad de variable continua Comprender la distribucin normal y sus principales propiedades. Manejar diferentes distribuciones normales. Estudie el tema 7 del libro de teora. Manejar las distribuciones uniforme y exponencial. Realice los ejercicios 4.15 a 4.49 del Conocer las definiciones de las distribuciones Gamma, tema 4 del libro de problemas. de Pearson, de Student y de Snedecor y manejar las Realice los ejercicios de autocomtablas de estas distribuciones de probabilidad. probacin de ese tema. Podr aplicar las propiedades de las distribuciones discretas y continuas a diferentes problemas. Tema 7: Distribuciones multivariantes Conocer las propiedades de las distribuciones multinomial Estudie el tema 8 del libro de teora. Realice los ejercicios 4.13 y 4.14 del Conocer las propiedades de la distribucin normal multivariante. tema 4 del libro de problemas. Tema 8: Distribuciones en el muestreo Comprender las distribuciones en el muestreo y el concepto de estimador. Ser capaz de obtener las distribuciones en el muestreo de diferentes estimadores. Estudie el tema 10 del libro de teora. Conocer las distribuciones en el muestreo de poblaciones paramtricas (media, diferencia de medias, Realice los ejercicios del tema 5 del varianza y razn de varianzas). libro de problemas. Realice los ejercicios de autocom- Conocer las distribuciones en el muestreo de probacin de ese tema. poblaciones no paramtricas (del mnimo valor muestral, del mximo valor muestral, del recorrido y de la mediana). Se aconseja que realice la prueba de evaluacin continua que se propondr en el curso virtual
RESULTADOS ALCANZADOS
TIEMPO
Tema 9: Estimacin puntual Estudie el tema 11 del libro de Entender las propiedades que debe de cumplir un buen estimador. teora. Realice los ejercicios 6.1 a 6.17 del Ser capaz de estudiar estas propiedades de un estimador dado. tema 6 del libro de problemas. Realice los ejercicios de autocom- Manejar los mtodos para obtener estimadores. probacin de ese tema. Tema 10: Estimacin por intervalos Comprender el mtodo de estimacin por intervalos de Estudie el tema 12 del libro de confianza. teora. Podr construir intervalos de confianza de la media con Realice los ejercicios 6.19 a 6.33 del distintas suposiciones sobre la poblacin. tema 6 del libro de problemas. Podr construir igualmente intervalos de confianza de la Realice los ejercicios de autocomvarianza, de la diferencia de medias y de proporciones. probacin de ese tema. Tema 11: Contrastes de hiptesis. Contrastes paramtricos Conocer otra metodologa esencial en inferencia, como son los contrastes o test de hiptesis. Estudie el tema 13 del libro de Manejar los conceptos de error de tipo I y de tipo II, de nivel de significacin y de potencia de un test. teora. Realice los ejercicios 7.1 a 7.13 del Manejar los contrastes de la media, de la diferencia de medias, de proporciones, de diferencia de proporciones tema 7 del libro de problemas. y los relacionados con varianzas. Realice los ejercicios de autocomprobacin de ese tema. Entender la estrecha relacin entre estos contrastes paramtricos y los intervalos de confianza. Tema 12: Contrastes no paramtricos Conocer los contrastes no paramtricos y sus diferencias con los paramtricos. Estudie el tema 14 del libro de Manejar los contrastes de bondad de ajuste de teora. Pearson y de Kolmogorov-Smirnov. Realice los ejercicios 7.14 a 7.30 del Podr aplicar los contrastes de homogeneidad e tema 7 del libro de problemas. independencia. Realice los ejercicios de autocom Manejar otros contrastes no paramtricos: el test de probacin de ese tema. los signos, el test de rango con signo, el test de la suma de rangos y el contraste de Kruskal-Wallis.
ESTADSTICA
MDULO 4: MODELOS LINEALES, CALIDAD Y FIABILIDAD Tiempo de estudio: 3 semanas.
PLAN DE ACTIVIDADES DE APRENDIZAJE RESULTADOS ALCANZADOS TIEMPO
Tema 13: Anlisis de la varianza. Diseo de experimentos Comprender la descomposicin de la variabilidad en los problemas de clasificacin simple o problemas con Estudie el tema 15 del libro de un solo factor a estudio. teora. Entender su papel en la tcnica de anlisis de la Realice los ejercicios 8.1 a 8.6 del varianza. tema 8 del libro de problemas. Podr disear y evaluar los resultados de experimentos Realice los ejercicios de autocomsencillos a travs de la tcnica de ADEVA. probacin de ese tema. Conocer y podr aplicar en casos prcticos diseos sencillos de ms de un factor. Tema 14: El modelo de regresin lineal simple Comprender los modelos de regresin lineal simple. Estudie el tema 17 del libro de Podr ajustar modelos lineales a conjuntos de datos y analizar los resultados. teora. Realice los ejercicios del tema 9 del Podr valorar la existencia o no de relacin por medio del coeficiente de correlacin lineal. libro de problemas. Realice los ejercicios de autocom- Ser capaz de aplicar los contrastes de regresin y de probacin de ese tema. linealidad, y de construir intervalos de confianza de la respuesta media e intervalos de prediccin. Tema 15: Grficos de control de calidad Conocer los grficos de control estadstico de calidad Estudie el tema 19 del libro de y su relacin con los intervalos de confianza. teora. Podr construir los grficos de variables y valorar el Realice los ejercicios 10.1 a 10.5 del resultado en casos prcticos. tema 10 del libro de problemas. Podr construir los grficos de atributos y valorar su Realice los ejercicios de autocomresultado en casos prcticos. probacin de ese tema. Tema 16: Introduccin a la fiabilidad Entender que la fiabilidad es un concepto probabilstico y, en consecuencia, la utilidad de los Estudie el tema 20 del libro de mtodos estadsticos en el estudio de la fiabilidad. teora. Conocer los modelos estadsticos ms utilizados en el Realice los ejercicios 10.6 a 10.14 estudio de la fiabilidad de componentes o de sistemas. del tema 10 del libro de problemas. En el caso de los sistemas, podr estudiar los montajes Realice los ejercicios de autocomen serie y en paralelo, y a partir de ellos otros sistemas probacin de ese tema. complejos. Podr aplicar los contrastes o test de vida en fiabilidad. Realice un repaso general de la asignatura y prepare la prueba presencial
Resultados alcanzados La asignatura tiene como primer objetivo el conocimiento de los mtodos y tcnicas estadsticas propias del anlisis de fenmenos no deterministas. Estos mtodos y tcnicas sern herramientas imprescindibles para resolver diversos problemas que se plantearn a lo largo de toda la carrera y de la vida profesional. En consecuencia, el alumno deber comprender el papel de la Estadstica en la solucin de problemas reales que se encontrar en la actividad profesional y las tcnicas estadsticas usuales. Una vez que haya realizado el trabajo y las actividades del curso, debera de conocer, comprender y manejar las herramientas bsicas de los mtodos estadsticos que se presentan en el programa de la asignatura. Una descripcin ms detallada de los resultados esperados se encuentra en el apartado 2 de esta gua. Aqu se enumeran una serie de objetivos generales a conseguir. Al finalizar el estudio de esta asignatura, deber de ser capaz de: - Conocer la esencia de los fenmenos aleatorios. - Manejar los resultados bsicos del Clculo de Probabilidades. - Conocer y manejar los modelos de probabilidad. - Definir poblaciones que puedan ser estudiadas estadsticamente. - Realizar hiptesis sobre la distribucin poblacional. - Estimar los parmetros de la poblacin. - Contrastar las hiptesis del modelo elegido. - Evaluar el ajuste del modelo. - Disear un experimento aleatorio. - Estimar los efectos y contrastar la validez del modelo. - Construir modelos de regresin lineal para predecir valores de una variable en funcin de otras. - Comprobar su validez para la muestra dada. - Conocer las tcnicas estadsticas usuales en control de calidad y fiabilidad.
El mtodo de trabajo en esta asignatura es el comn a cualquier asignatura de Ciencias y se basa, por un lado, en conseguir tener los conceptos muy claros (si esto no se consigue en una primera aproximacin, es preferible dejarlo reposar y, posteriormente, seguir insistiendo en su clarificacin antes de pasar al siguiente) y, por otro lado, en la aplicacin de la lgica, la distincin entre tesis, hiptesis y el uso del razonamiento nos permiten conseguir el objetivo. Adems del valor en s mismo de los contenidos, lo fundamental es que van a tener aplicacin directa en otras materias y en la actividad profesional posterior. Para el estudio se recomienda siempre el uso de lpiz y papel, de forma que se pueda ir tomando notas de los principales resultados o de las dudas que vayan surgiendo, para plantearlas en el curso virtual o en la tutora, y realizando los ejercicios y problemas propuestos en los textos. El estudio de la asignatura se desarrolla en base a los libros de teora y de problemas que figuran en la bibliografa bsica, con el apoyo de las tutoras presenciales o virtuales. El plan de trabajo ya est detallado
ESTADSTICA
en el punto anterior, pero se considera muy conveniente insistir en que cuando se ha estudiado un tema, se trabaje con otros ejercicios o problemas que se encuentran en el libro de problemas bsico o en los libros recomendados y, por ltimo, que se hagan los ejercicios de autocomprobacin del tema y se valore el nivel de conocimientos adquirido. No se ha fijado como estrategia del aprendizaje la memorizacin de todos los contenidos de los distintos temas ya que se permitir el uso de un formulario para la realizacin de la prueba presencial. Por el contrario, se propone una lectura minuciosa y comprensiva del material y la elaboracin de cuadros, resmenes y notas aclaratorias, que conducen a la adecuada asimilacin de los conceptos sin recurrir a un innecesario esfuerzo memorstico. Aunque los exmenes ponen ms nfasis en la resolucin prctica de ejercicios y problemas, tambin habr una parte de preguntas de carcter terico o terico-prctico, ya que, en esta materia, no debe dejarse de lado el estudio de los fundamentos tericos. Es muy importante tener claro que no se trata slo de tener recetas para resolver determinadas situaciones, sino que se ha de tratar de conseguir una base de formacin en estadstica que nos permita enfrentarnos a planteamientos ms complejos en los que se tenga que decidir entre la utilizacin de un mtodo u otro y se pueda argumentar sobre la decisin adoptada. La importancia del estudio de la Estadstica dentro de la formacin de un graduado en ingeniera est hoy fuera de toda duda y la aplicacin de los mtodos y tcnicas estadsticas avanzadas ha proporcionado grandes xitos en Ingeniera y en la Industria. 2.2. Materiales de estudio
La Bibliografa bsica, que se considera suficiente, para la preparacin de la asignatura est formada por un libro de teora y un libro de problemas resueltos. Teora: Novo, V.: Estadstica Terica y Aplicada. Editorial Sanz y Torres, 2004. Edicin revisada 2011. Problemas: Novo, V.: Problemas de Clculo de Probabilidades y Estadstica. Editorial Sanz y Torres, 2003. Edicin revisada 2011. El esquema de relacin entre los temas del programa y los captulos de los libros de teora y de problemas recomendados como bibliografa bsica se muestra en la tabla siguiente. Hay 2 temas en que se debe suprimir un apartado del captulo correspondiente ya que no ser objeto de examen, este hecho se refleja tambin en la tabla.
TEMA DEL PROGRAMA 1 2 3 4 5 6 LIBRO DE TEORA 1 2 3y4 5 6 7 (excepto 12) 1 2 3 4 4 LIBRO DE PROBLEMAS
7 8 9 10 11 12 13 14 15 16
8 10 11 (excepto 13) 12 13 14 15 17 19 20
4 5 6 6 7 7 8 9 10 10
Adems de estos textos bsicos se utiliza la siguiente Gua-Formulario, que es muy conveniente manejar desde el principio ya que junto con una calculadora no programable ser el nico material permitido para la realizacin de la prueba presencial. Novo, V., Jimnez, B.: Gua-Formulario y Tablas. Estadstica. Ingenieras Industriales de la UNED. Editorial Sanz y Torres, 2010. Edicin revisada 2011. Tanto para los libros de teora y de problemas como para la gua-formulario, son vlidas las ediciones revisadas y las anteriores. En la parte I de la Gua de Estudio, se incluye tambin una bibliografa complementaria, en la que se facilitan una serie de libros de teora que pueden ser de inters para consultas puntuales y, sobre todo, una relacin de libros de problemas resueltos que se pueden utilizar para completar la preparacin de la asignatura. 2.3. Conocimientos previos
Los conocimientos previos necesarios para una correcta comprensin y asimilacin de los contenidos son los habituales en los cursos de lgebra y Clculo que se imparten en el primer curso del grado, por lo que no parece necesario hacer una exposicin exhaustiva de estos conocimientos. 2.4. Ejercicios de autoevaluacin
Al final de cada tema del texto de teora aparecen los ejercicios de autocomprobacin con soluciones que el alumno deber de desarrollar para llevar a cabo su autoevaluacin. 2.5. Estrategias de aprendizaje
Como el nivel de conocimientos es diferente para cada estudiante, es muy importante que cada estudiante se apoye en las herramientas complementarias de aprendizaje que considere ms adecuadas con la orientacin de su profesor tutor o del equipo docente.
ESTADSTICA
Debe tener siempre presente que no est solo en su formacin. Los foros del curso virtual son una herramienta muy til para resolver dificultades en el aprendizaje y conocer dudas de otros compaeros que pueden mostrarle problemas no percibidos. Intente resolver las dudas planteadas por sus compaeros y acceda a los foros con frecuencia. Adems, recomendamos que al finalizar cada tema realice los ejercicios de autocomprobacin que figuran en el libro de teora para poder detectar las posibles carencias que no haya resuelto con el estudio de estos temas. As, podr repasar los aspectos que no le hayan quedado claros antes de continuar su estudio. 2.6. Mdulo 1. Estadstica descriptiva y probabilidad
2.6.1. Introduccin En este mdulo se introducen diversos conceptos que van a ser clave durante el desarrollo de la asignatura. Se comienza con la descripcin y el anlisis estadstico de una y de varias variables, es decir con la Estadstica Descriptiva y se completa el mdulo con la parte central del mismo, dedicada al fundamento matemtico de la estadstica, es decir, al Clculo de Probabilidades que es bsico para cualquier aplicacin estadstica y para el seguimiento y asimilacin de los contenidos de la asignatura. En los dos epgrafes siguientes, se presentan los resultados concretos del aprendizaje y se contextualizan y comentan en detalle los contenidos de este mdulo tema por tema. 2.6.2. Resultados del aprendizaje Al terminar el estudio de este mdulo, el estudiante habr adquirido los conocimientos suficientes y en el nivel adecuado para poder abordar los contenidos de los temas posteriores. Como resultados ms concretos: Comprender el manejo de los datos estadsticos. Ser capaz de clasificar una variable estadstica como discreta o continua. Manejar con soltura las distribuciones de frecuencias. Conocer y manejar las representaciones grficas usuales en Estadstica. Podr obtener los parmetros estadsticos de centralizacin y de dispersin, y conocer sus principales propiedades. Comprender y manejar las distribuciones de ms de una variable. Podr calcular las medidas de asociacin lineal entre variables, la covarianza y el coeficiente de correlacin. Reconocer los fenmenos deterministas y los fenmenos aleatorios. Comprender el concepto de probabilidad. Manejar y aplicar las principales propiedades de la probabilidad. Podr aplicar a casos prcticos los teoremas fundamentales del producto, de la probabilidad total y de Bayes. Comprender el concepto de probabilidad condicionada y de sucesos independientes. Comprender los fenmenos aleatorios compuestos. Entender el concepto de variable aleatoria y los conceptos de funcin de densidad y de distribucin. Manejar las principales caractersticas de las variables aleatorias y comprender sus propiedades. Podr construir modelos de probabilidad. Podr determinar las caractersticas de una variable aleatoria univariante. Podr determinar las caractersticas de una variable multivariante. Manejar las funciones caracterstica y generatriz de momentos. Comprender su utilidad de cara a las aplicaciones. Podr calcular los momentos a partir de una funcin generatriz.
UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA 10
Comprender la utilidad de las transformaciones de variables aleatorias. Podr obtener la distribucin de transformaciones de variables aleatorias. Podr obtener la distribucin de la suma, del producto o del cociente de variables aleatorias.
2.6.3. Contextualizacin y descripcin de contenidos En el tema 1 se estudia la naturaleza de los datos, lo ms frecuente es que stos sean numricos, pero no siempre es as. Las variables estadsticas se clasifican en cualitativas (no medibles) y cuantitativas (medibles) y stas en discretas (toman un conjunto de valores finito o numerable) y continuas (toman todos los valores de un intervalo). Se introducen las tablas de frecuencias que recogen de una forma abreviada y ordenada los datos obtenidos y las representaciones grficas ms usuales: diagrama de barras, grfico de sectores, histograma y polgono de frecuencias. El histograma es una excelente herramienta para la presentacin de los datos y nos informa con un simple golpe de vista de la distribucin de dichos datos. Los parmetros estadsticos son medidas que recogen la informacin muestral y se clasifican en parmetros de centralizacin y parmetros de dispersin. Se estudian como parmetros de centralizacin la media, la mediana y la moda, con especial atencin a la media para la que se demuestra que es invariante por transformaciones lineales. Este hecho es importante ya que las transformaciones son una herramienta que se va a utilizar durante todo el curso. No existe una manera nica de medir las cosas y no hay ningn motivo para analizar los datos en la misma mtrica en que vienen dados, en este sentido las transformaciones lineales son muy tiles para simplificar los datos. Como parmetros de dispersin se estudian la varianza, la desviacin tpica y la desviacin media, con especial atencin a la primera. Se generalizan estos conceptos introduciendo los momentos centrados y no centrados de orden r. El momento no centrado de orden uno es la media y el momento centrado de orden dos es la varianza. Se estudian la relacin entre la varianza y los momentos no centrados de orden uno y dos que resulta de gran utilidad prctica, y se introducen los coeficientes de asimetra y apuntamiento de Fisher que miden la forma de la distribucin. En la segunda parte del tema se estudia la descripcin conjunta de varias variables. Cuando los datos que se investigan incluyen valores de varias variables es necesario su estudio conjunto con objeto de analizar las relaciones que puedan existir entre ellas. Se introduce el concepto de distribucin de frecuencias conjunta, con especial atencin al caso de dos variables, as como las distribuciones marginales y las distribuciones condicionadas. Se estudian la covarianza y el coeficiente de correlacin como medidas de asociacin lineal entre variables. En el caso de las variables k-dimensionales es conveniente adoptar la notacin vectorial, considerando a cada elemento o individuo como un vector. Se definen el vector de medias y la matriz de varianzas y covarianzas. Aunque una buena descripcin de los datos es necesaria, uno de los principales objetivos del mtodo estadstico es obtener conclusiones acerca de una poblacin a partir de los elementos de una muestra. Los modelos matemticos apropiados para describir una poblacin son las distribuciones de probabilidad. La teora de probabilidad es bsica en cualquier aplicacin estadstica y constituye el fundamento matemtico de la Estadstica. Su comprensin y manejo ser esencial para el seguimiento eficaz del resto del programa. Se dedican tres temas, del 2 al 4, a esta parte del programa. En el tema 2 se establece la diferencia entre fenmenos determinsticos y fenmenos aleatorios, se describen el espacio muestral y el lgebra de sucesos de un fenmeno aleatorio y se da la nocin de espacio probabilizable. Se introduce la axiomtica de Kolmogorov, el concepto de espacio probabilstico y a partir de la axiomtica las principales propiedades de la probabilidad. A continuacin, se introduce el concepto de probabilidad condicionada y se demuestran los teoremas del producto, de la probabilidad total y de Bayes. Se estudian la dependencia e independencia de sucesos aleatorios que son conceptos clave en el desarrollo posterior del programa, y se tratan los experimentos compuestos.
11
ESTADSTICA
En el tema 3 se introducen los conceptos de variable aleatoria, funcin de densidad y funcin de distribucin. Se trata, en primer lugar, el caso unidimensional y posteriormente el caso de las variables aleatorias multidimensionales. Se definen las distribuciones de probabilidad conjunta, marginales y condicionadas y la idea de variables aleatorias independientes, para las que la funcin de densidad conjunta es el producto de las densidades marginales. En la segunda parte de este tema se introduce el concepto de esperanza matemtica. A continuacin se estudia la varianza, su relacin con la media y la influencia que sobre ella tienen las transformaciones lineales. Se demuestran el teorema de Markov y la acotacin de Tchebycheff que da una cota conservadora de la probabilidad de que una variable aleatoria diste de su media ms de k veces la desviacin tpica y que tiene un enorme inters puesto que, por una parte justifica la utilizacin de la desviacin tpica, y en consecuencia de la varianza, como medida de dispersin, y por otra constituye un ejemplo de un primer mtodo para obtener intervalos de confianza que se estudiar en el mdulo 3. Se concluye esta parte definiendo los momentos y las caractersticas de forma. A continuacin se trata el caso de las variables n-dimensionales. Se definen los momentos, la esperanza matemtica, la matriz de covarianzas y el coeficiente de correlacin, demostrndose que es cero si las variables son independientes. Se dan las medidas condicionadas, se demuestra que la varianza de la suma de variables aleatorias independientes es la suma de las varianzas y se introducen las rectas de regresin de mnimos cuadrados que se tratarn en mayor profundidad en la parte dedicada a los modelos de regresin. En la primera parte del tema 4 se estudian las funciones caracterstica y generatriz de momentos, que resultan de gran utilidad en el estudio de las distribuciones de sumas de variables aleatorias independientes al simplificar considerablemente los clculos. En algunas ocasiones, se utiliza la funcin generatriz de momentos en sustitucin de la funcin caracterstica debido a que es una funcin real de variable real mientras que la funcin caracterstica es una funcin compleja de variable real. La desventaja de la funcin generatriz es que puede no existir. Se demuestra la relacin entre estas funciones y los momentos y que la funcin caracterstica (resp. generatriz) de la suma de variables aleatorias independientes es el producto de las funciones caractersticas (resp. generatrices). La segunda parte del tema se dedica al estudio de las transformaciones de variables aleatorias. Muy a menudo, en Estadstica, es preciso obtener la distribucin de probabilidad de una funcin de una o ms variables aleatorias. Se dan los correspondientes teoremas de transformacin de variables y se estudian, en particular, la suma, el producto y el cociente de variables aleatorias. 2.7. Mdulo 2. Modelos de probabilidad
2.7.1. Introduccin En este mdulo se estudian los modelos de probabilidad ms usuales en Estadstica y las distribuciones en el muestreo. Se estudian los modelos de probabilidad univariantes y multivariantes de variable discreta y de variable continua. Uno de los problemas centrales en Estadstica es el de inferir las caractersticas y propiedades de una cierta poblacin a partir de los datos de una muestra. Para ello es necesario disponer de modelos matemticos de referencia que nos permitan describir la poblacin, estos modelos vienen dados por las distribuciones de probabilidad. En los dos epgrafes siguientes, se presentan los resultados concretos del aprendizaje y se contextualizan y comentan en detalle los contenidos de este mdulo tema por tema. 2.7.2. Resultados del aprendizaje
12
Al terminar el estudio de este mdulo, el estudiante conocer y manejar los modelos de probabilidad ms usuales en la prctica de la Estadstica y las distribuciones en el muestreo fundamentales para entender la parte inferencial de la Estadstica. En particular: Comprender el significado de los modelos usuales de probabilidad. Manejar las distribuciones de variable discreta de Bernouilli, binomial, hipergeomtrica, binomial negativa y de Poisson. Conocer las principales caractersticas de las distribuciones anteriores y ser capaz de calcularlas. Comprender la distribucin normal y sus principales propiedades. Manejar diferentes distribuciones normales. Conocer las principales distribuciones de variable continua. Manejar las distribuciones uniforme y exponencial. Conocer las definiciones de las distribuciones Gamma, de Pearson, de Student y de Snedecor. Manejar las tablas de estas distribuciones de probabilidad. Podr aplicar las propiedades de las distribuciones discretas y continuas a diferentes problemas. Conocer la definicin y propiedades de la distribucin multinomial. Conocer la definicin y propiedades de la distribucin normal multivariante. Comprender las distribuciones en el muestreo y el concepto de estimador. Ser capaz de obtener las distribuciones en el muestreo de diferentes estimadores. Conocer las distribuciones en el muestreo de poblaciones paramtricas. Manejar las distribuciones en el muestreo de la media, la diferencia de medias, la varianza y la razn de varianzas. Podr aplicar esas distribuciones a casos prcticos. Conocer las distribuciones en el muestreo de poblaciones no paramtricas. Manejar las distribuciones en el muestreo del mnimo valor muestral, del mximo valor muestral, del recorrido y de la mediana. 2.7.3. Contextualizacin y descripcin de contenidos Se dedican los tres primeros temas de esta segunda unidad didctica a la descripcin de los modelos de probabilidad. En el tema 5 se estudian las distribuciones de probabilidad de variable discreta, en el 6, las de variable continua, en ambos casos para variables unidimensionales y, en el tema 7, las distribuciones de probabilidad de variables multidimensionales con especial atencin a la normal multivariante. Se empieza el tema 5 definiendo la variable de Bernouilli y, a travs del proceso de pruebas de Bernouilli repetidas e independientes, se introduce la distribucin binomial para la que se estudian sus principales caractersticas: media, varianza, funcin generatriz, etc., as como el teorema de la adicin que establece que la suma de binomiales independientes, con el mismo parmetro p, es una variable binomial. A continuacin se dan las definiciones y principales propiedades de las distribuciones hipergeomtrica, geomtrica y binomial negativa. La ltima parte del tema se dedica al estudio de la distribucin de Poisson. Esta distribucin es un modelo apropiado para describir el nmero de ocurrencias de un suceso en un intervalo de tiempo dado, por ejemplo el nmero de llamadas que se reciben en una central telefnica en un perodo de tiempo fijado, el nmero de vehculos que llegan a un control de peaje en una autopista, etc. Se estudian sus principales caractersticas, en particular que su media y su varianza coinciden, que esta distribucin es reproductiva, es decir, que la suma de variables de Poisson independientes es una variable de Poisson y que se puede obtener como lmite de la distribucin binomial cuando n tiende a infinito. En el tema 6 se tratan las distribuciones de probabilidad de variable continua con especial atencin a la distribucin normal. En primer lugar se describe la distribucin uniforme, luego la distribucin gamma, demostrndose que es reproductiva y como caso particular de ella la exponencial que tiene muchas
UNIVERSIDAD NACIONAL DE EDUCACIN A DISTANCIA 13
ESTADSTICA
aplicaciones en Estadstica, concretamente en reas como la teora de fiabilidad, los tiempos de espera o la teora de colas. Se estudia a continuacin la distribucin de Weibull que se utiliza en fiabilidad. Sin duda la distribucin de probabilidades ms importante es la normal, porque describe bien muchos fenmenos de la naturaleza o de la industria y por su gran inters en inferencia estadstica. Se estudia la normal estndar o N(0,1) y la normal general de media y desviacin tpica dadas, el manejo de tablas y la variable tipificada. Se demuestra que la suma de variables normales independientes es una variable normal y que la media de variables normales independientes e igualmente distribuidas segn una normal es tambin una variable normal. Se demuestra por ltimo que la distribucin binomial tiende a la distribucin normal lo que permite dar aproximaciones de probabilidades binomiales por la normal. Las distribuciones unidimensionales de probabilidad que se estudian a continuacin son las ms utilizadas en inferencia estadstica. Se define la variable de Pearson como suma de cuadrados de variables normales N(0,1) independientes, se obtienen sus principales caractersticas y se demuestra su carcter reproductivo. Esta distribucin se utilizar posteriormente en las pruebas de validacin de modelos y en los contrastes de homogeneidad e independencia. Se define a continuacin la variable t de Student que es de gran utilidad en estimacin por intervalos de confianza y en contrastes de hiptesis relacionados con la media de una poblacin normal al ser su funcin de densidad independiente de la desviacin tpica, lo que la hace especialmente til en el estudio de problemas de estimacin para muestras pequeas. Se introduce seguidamente la distribucin F de Snedecor como cociente de variables de Pearson independientes, cada una de ellas dividida por su nmero de grados de libertad. En el tema 7 se estudian los modelos de probabilidad multivariantes ms usuales como son la distribucin multinomial y la distribucin normal multivariante. La parte inferencial de la Estadstica se desarrolla a partir de la Unidad Didctica 3. El nexo que une el Clculo de Probabilidades con la Inferencia Estadstica son las distribuciones en el muestreo que se estudian en el tema 8. Los problemas de inferencia pueden clasificarse en funcin de la informacin relevante que decidimos incluir. Si la poblacin est determinada salvo uno o varios parmetros estaremos ante un problema paramtrico, de forma que el conocimiento del valor de ese parmetro o parmetros, determina completamente la distribucin de la poblacin. Si, por el contrario, utilizamos nicamente la informacin contenida en los datos muestrales tendremos un problema de inferencia no paramtrica. En el tema 8 se estudian las distribuciones en el muestreo. Se introducen en primer lugar los distintos tipos de muestreo. El objetivo de un plan de muestreo es obtener informacin relevante sobre la poblacin con el menor coste posible. El tipo de muestreo ms sencillo es el muestreo aleatorio simple, en el cual cada elemento de la muestra es elegido al azar por medio de elecciones independientes. A continuacin se introduce un concepto fundamental en inferencia que es el de estimador o estadstico, como una aplicacin que asigna a cada muestra un nmero real que para una muestra dada es una estimacin. Al variar las muestras se obtiene, a travs del estadstico, una nueva variable aleatoria para la que ser preciso conocer su distribucin que se denomina distribucin en el muestreo. En particular, se define la media muestral y se obtiene su esperanza y su varianza en el muestreo, as como su distribucin bajo distintas suposiciones sobre la distribucin poblacional. Se define la varianza muestral, se obtiene su esperanza matemtica y su distribucin. Se concluye esta parte del tema con el estudio de las distribuciones de la diferencia de medias. Se finaliza el tema tratando el caso de las distribuciones en el muestreo de poblaciones no paramtricas. Se introduce, en primer lugar, el concepto de estadstico ordenado y se estudian las distribuciones en el muestreo del mnimo valor muestral, del mximo valor muestral, del recorrido y de la mediana.
14
2.8. Mdulo 3. Inferencia estadstica 2.8.1. Introduccin Como ya hemos indicado anteriormente, uno de los problemas fundamentales en Estadstica es el de obtener conclusiones sobre una poblacin a partir de la informacin contenida en una muestra. Este problema es el de la Inferencia Estadstica; sus principales tcnicas son los mtodos de estimacin y los contrastes de hiptesis que se estudian en este mdulo 3. En los dos epgrafes siguientes, se presentan los resultados concretos del aprendizaje y se contextualizan y comentan en detalle los contenidos de este mdulo tema por tema. 2.8.2. Resultados del aprendizaje Con el estudio de este mdulo el estudiante conocer y utilizar en las aplicaciones las principales tcnicas de la Inferencia Estadstica. Con ms detalle: Entender las propiedades que debe de cumplir un buen estimador. Ser capaz de estudiar las propiedades esenciales para un estimador dado. Podr estudiar si un estimador es insesgado y de varianza mnima. Manejar los mtodos para obtener estimadores y, en particular, podr obtener estimadores de mxima verosimilitud y por el mtodo de los momentos. Comprender el mtodo de estimacin por intervalos de confianza. Podr construir intervalos de confianza de la media con distintas suposiciones sobre la poblacin. Podr construir intervalos de confianza de la varianza, de la diferencia de medias, y de proporciones. Entender las limitaciones y riesgos que comportan las decisiones estadsticas. Conocer otra metodologa esencial en inferencia, como son los contrastes o test de hiptesis. Manejar los conceptos de error de tipo I y de tipo II. Entender y manejar en la prctica el nivel de significacin de un test. Manejar los contrastes de la media bajo distintas suposiciones. Manejar los contrastes de la diferencia de medias, de proporciones, de diferencia de proporciones y los relacionados con varianzas. Entender la estrecha relacin entre estos contrastes paramtricos y los intervalos de confianza correspondientes. Conocer los contrastes no paramtricos. Entender sus diferencias con los contrastes paramtricos. Manejar los contrastes de bondad de ajuste de Pearson y de Kolmogorov-Smirnov. Podr aplicar los contrastes de homogeneidad e independencia relacionados con la distribucin de Pearson. Manejar otros contrastes paramtricos: el test de los signos, el test de rango con signo, el test de la suma de rangos y el contraste de Kruskal-Wallis. 2.8.3. Contextualizacin y descripcin de contenidos En el tema 9 se estudian las tcnicas de estimacin puntual. Se trata de definir estimadores de los parmetros poblacionales que nos permitan, a partir de una muestra, dar las mejores estimaciones posibles del parmetro poblacional. La pregunta que se plantea es evidente. Cual ser el mejor estimador de un cierto parmetro poblacional? La respuesta tambin es clara: el mejor estimador de un parmetro es aquel que toma para cualquier muestra el valor del parmetro, es decir, es aquel que tiene por esperanza el parmetro poblacional y varianza cero. En la prctica, esta situacin ideal no se da, pero con esta idea tan simple disponemos de una referencia para clasificar y comparar los distintos estimadores. Cuanto ms cercano est el estimador a esta situacin ideal mejor ser.
15
ESTADSTICA
Se introduce la definicin de estimador insesgado como aquel cuya esperanza matemtica es el parmetro poblacional. Como ejemplo, se demuestra que la media muestral es un estimador insesgado de la media poblacional, mientras que no ocurre lo mismo con la varianza muestral respecto de la poblacional. Se construye un estimador insesgado de la varianza poblacional conocido como cuasivarianza muestral. Si existiera un estimador insesgado de varianza cero, este sera el ideal. Al no darse esta situacin en la prctica, es claro que un estimador insesgado ser tanto mejor cuanto menor sea su varianza. Cramer, Rao y Frchet demostraron, bajo condiciones diferentes, que la varianza de un estimador no puede ser menor que un valor que depende de la distribucin poblacional y del tamao muestral. Este valor se conoce como la cota de Cramer-Rao. Se definen los estimadores eficientes como aquellos que son insesgados y de mnima varianza. La cota de Cramer-Rao da una condicin suficiente para que un estimador insesgado sea eficiente, que sin embargo no es una condicin necesaria. Se introducen los conceptos de estimador consistente y suficiente. Se estudian a continuacin los mtodos para construir estimadores. En primer lugar se estudia el mtodo de mxima verosimilitud. Este mtodo de estimacin est basado en el concepto de funcin de verosimilitud dado por Fisher. La idea del mtodo consiste en considerar como mejor estimador del parmetro el valor que haga mxima la verosimilitud para una muestra dada, con lo que el mtodo se reduce al estudio de un problema de optimizacin. Se demuestra que los estimadores de mxima verosimilitud son invariantes por transformaciones biyectivas, que si existen estimadores eficientes (resp. suficientes) el estimador de mxima verosimilitud es eficiente (resp. funcin del estimador suficiente) y que sin embargo, en general, pueden no ser insesgados. A continuacin se estudia el mtodo de los momentos o de analoga que consiste en igualar los momentos muestrales a los poblacionales. Los estimadores que se obtienen por este mtodo son consistentes aunque en general no son insesgados. Si en lugar de utilizar una funcin de los valores de la muestra (estimacin puntual), utilizamos dos funciones y damos la estimacin del parmetro por medio del intervalo que tiene por extremos los valores de dichas funciones para una muestra dada, se dice que hemos dado una estimacin del parmetro por intervalos o que hemos construido un intervalo de confianza. En su construccin hay dos elementos esenciales. La amplitud del intervalo que nos dar la precisin de la estimacin y la probabilidad de que el valor del parmetro pertenezca al intervalo. Se dedica el tema 10 al mtodo de estimacin por intervalos. Se estudian los intervalos de confianza de la media con distintas suposiciones sobre la poblacin, los de la varianza, los de la diferencia de medias, los de razn de varianzas y los de proporciones. Se estudia por ltimo el problema de la fijacin del tamao de la muestra cuando se pretende dar una estimacin del parmetro con una precisin y una confianza dadas. Otra metodologa de la Inferencia Estadstica es el contraste de hiptesis. Una hiptesis estadstica es una aseveracin sobre la distribucin de la poblacin o sobre uno o varios parmetros poblacionales. El problema consiste en decidir si los datos obtenidos en la muestra son consistentes con la hiptesis, en cuyo caso ser aceptada o si por el contrario debe rechazarse al obtener resultados significativamente diferentes de los que cabra esperar bajo esa hiptesis. Como en el caso de las distribuciones en el muestreo, los contrastes de hiptesis se clasifican en paramtricos y no paramtricos. En el tema 11 se dan las cuestiones de tipo general y se estudian los contrastes paramtricos. Se establece una hiptesis que se denomina hiptesis nula y frente a ella una hiptesis denominada alternativa. Se clasifican los contrastes en unilaterales y bilaterales y las hiptesis en simples y compuestas. Se dan las definiciones de error de tipo I y error de tipo II y el concepto de potencia de un test. El nivel de significacin del test limita la probabilidad de error de tipo I. Se estudian los contrastes de la media, de la diferencia de medias, de proporciones, de diferencia de proporciones, de varianzas y de la razn de verosimilitudes
16
haciendo notar el paralelismo existente entre estos contrastes paramtricos y los intervalos de confianza correspondientes.
Si las hiptesis que se realizan son sobre el modelo y no slo sobre algn parmetro, tenemos los contrastes no paramtricos a los que se dedica el tema 12. Se trata de construir reglas de decisin que nos permitan concluir si el modelo propuesto en la hiptesis es aceptable o no. La aceptacin o rechazo del modelo estar en funcin de las diferencias entre los resultados obtenidos en la muestra y aquellos que cabra esperar suponiendo que la hiptesis es cierta. Se estudian los contrastes de Pearson, llamado tambin contraste de la bondad del ajuste y el de Kolmogorov-Smirnov conocidos como contrastes de validacin del modelo. Se concluye esta parte del tema con la descripcin de dos contrastes no paramtricos de gran utilidad relacionados con la distribucin de Pearson como son el contraste de homogeneidad y el contraste de independencia. Se completa el tema describiendo otros contrastes no paramtricos. El test de los signos permite decidir si es aceptable la hiptesis de una media dada cuando no se dispone de otra informacin sobre la poblacin. Esta prueba utiliza slo el signo de la diferencia de cada dato con la media, pero no la magnitud de esta diferencia. Una prueba que utiliza el signo y la magnitud es la prueba de rango con signo de Wilcoxon. En esta prueba se supone que la poblacin es simtrica y continua. Una variante de esta prueba, que se estudia a continuacin, es el test de la suma de rangos para decidir sobre la igualdad de dos medias en poblaciones independientes. En el tema 13 se estudia, por medio del anlisis de la varianza, una prueba para determinar la igualdad de ms de dos medias; esta prueba exigir normalidad. Una alternativa no paramtrica, en este caso, es el contraste de Kruskal-Wallis, que es una generalizacin del test de la suma de rangos. 2.9. Mdulo 4. Modelos lineales, calidad y fiabilidad
2.9.1. Introduccin Este mdulo se dedica a los modelos lineales y dos aplicaciones importantes de la Estadstica para los futuros graduados en Ingeniera. En primer lugar se introduce el diseo de experimentos y se estudian los modelos de regresin lineal. La segunda parte del mdulo se dedica al estudio de las tcnicas estadsticas de control de calidad y la fiabilidad. En los dos epgrafes siguientes, se presentan los resultados concretos del aprendizaje y se contextualizan y comentan en detalle los contenidos de este mdulo tema por tema. 2.9.2. Resultados del aprendizaje En la primera parte de este mdulo se introducen las tcnicas de anlisis de la varianza en el diseo de experimentos y los modelos de regresin, y en la segunda parte dos aplicaciones de los mtodos estadsticos de gran utilidad en ingeniera y en la industria, como son los grficos de control y la fiabilidad. En concreto, al finalizar el estudio de este mdulo, el estudiante: Comprender la descomposicin de variabilidad en los problemas de clasificacin simple o problemas con un solo factor a estudio. Entender su papel en la tcnica de anlisis de la varianza (ADEVA). Podr obtener una tabla ADEVA. Podr evaluar los resultados de experimentos sencillos a travs de la tcnica de ADEVA. Conocer diseos sencillos de ms de un factor. Podr aplicar en casos prcticos diseos de bloques aleatorizados o de cuadrados latinos. Comprender los modelos de regresin lineal simple de mnimos cuadrados. Podr ajustar modelos lineales a conjuntos de datos y analizar los resultados. Podr valorar la existencia o no de relacin por medio del coeficiente de correlacin lineal. Ser capaz de aplicar los contrastes de regresin. Podr construir intervalos de confianza de la respuesta media e intervalos de prediccin.
17
ESTADSTICA