Vous êtes sur la page 1sur 60

Mdulo de Estadstica

UNIDAD I: DESCRIPCIN Y ORGANIZACIN DE LA INFORMACIN Definicin de Estadstica La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin, presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms efectiva. Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y anlisis. La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima. Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra.

Por qu estudiar Estadstica?

La primera razn es que la informacin numrica est en todas partes. Por ejemplo en los peridicos, revistas de noticias, revistas de negocios, revistas de inters general, revistas del hogar, revistas deportivas, revistas de coches, noticias de televisin, radio, etc., se encuentra gran informacin numrica. Para ser consumidores educados en esta informacin, es necesario poder leer las tablas y grficas, as como entender el anlisis de la informacin numrica. El entendimiento de los conceptos de la estadstica bsica ser de gran ayuda Una segunda razn para tomar un curso de estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria, que afectan nuestro bienestar personal. Una tercera razn es que el conocimiento de los mtodos estadsticos ayudar a entender cmo se toman las decisiones y a comprender de qu manera nos afectan. En cualquier lnea de trabajo habr que tomar decisiones en las que el entendimiento del anlisis de datos ser muy til. Para tomar una decisin informada se tendr que poder: Determinar si la informacin existente es adecuada o si se necesita informacin adicional. 1 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Recopilar informacin adicional, en caso de ser necesaria, de manera que no proporcione resultados errneos. Resumir la informacin en forma til y organizada. Analizar la informacin disponible. Sacar conclusiones y hacer deducciones al tiempo que se evala el riesgo de una conclusin incorrecta. Clases de Estadstica La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica Descriptiva y la Inferencial. Estadstica Descriptiva o Deductiva Consiste sobre todo en la presentacin de datos en forma de tablas y grficas. Esta comprende cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales. Se calcula a partir de los datos de una muestra o de una poblacin. Ejemplo: Durante los ltimos dos das se han informado un total de ocho homicidios. En una entrevista a 1100 electores, se obtuvo la siguiente informacin: el candidato del Partido Conservador obtuvo la preferencia de un 44% de los encuestados, mientras que un 45% opt por el candidato del Partido Liberal y an se mantiene un 11% indeciso.

Estadstica Inferencial o Inductiva Se deriva de muestras, de observaciones hechas slo acerca de una parte de un conjunto numeroso de elementos y esto implica que su anlisis requiere de generalizaciones que van ms all de los datos. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada. Es decir, que para un anlisis estadstico inferencial se requiere utilizar tcnicas, procesamientos y anlisis estadsticos ms avanzados con los datos estadsticos obtenidos de la muestra, para as confirmar la veracidad de las inferencias que se haga sobre la respectiva poblacin a que corresponde la muestra. Generalmente, este tipo de anlisis emplea como herramienta bsica el clculo de probabilidades y se lleva cabo para exponer relaciones de causa y efecto, as como probar hiptesis y teoras cientficas. Ejemplo: Los estudiantes de Psicologa que obtuvieron un IQ de inteligencia sobre 120, probablemente obtendrn sobre 700 puntos en cada rea de la prueba de admisin para ingreso a la universidad. Si an hay un 11% de los electores indecisos y si la poblacin electoral es de cerca de 88 millones electores, quiere decir que an hay cerca de 10 millones de electores quienes realmente decidirn cul va a ser el candidato ganador. Niveles de Medidas El nivel de medida de una variable en matemticas y estadstica, tambin llamado escala de medicin, es una clasificacin acordada con el fin de describir la naturaleza de la informacin contenida dentro de los nmeros asignados a los objetos y, por lo tanto, dentro de una variable. 2 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Segn la teora de las escalas de medida, varias operaciones matemticas diferentes son posibles dependiendo del nivel en el cual la variable se mide. Las escalas de medicin, pueden ser clasificadas de acuerdo a una degradacin de las caractersticas de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales. Segn pasa de una escala a otra el atributo o la cualidad aumenta. Las escalas de medicin ofrecen informacin sobre la clasificacin de variables discretas o continuas. Toda vez que dicha clasificacin determina la seleccin de la grfica adecuada. Niveles de Clasificacin Un nivel de medicin es la escala que representa una jerarqua de precisin dentro de la cual una variable puede evaluarse, en funcin de las caractersticas que rigen las escalas. Por ejemplo, la variable estatura puede analizarse en diferentes niveles de medida. Un conjunto de personas pueden clasificarse en altos y bajos, A y B respectivamente, creando dos grupos. Para ello no es necesario recurrir a ninguna cinta mtrica, simplemente basta observar quienes destacan sobre los dems (el grupo de altos) y el resto completarn el grupo de bajos. El nivel de medicin que corresponde a esta forma de medir es nominal. Tambin podran alinearse a los sujetos y ordenarlos segn su altura, el primero sera el ms alto y el ltimo el ms bajo, el resto se organizara de forma que cada persona tuviese delante a uno ms alto y detrs a uno ms bajo. El nivel de medicin en este caso es ordinal. Hasta el momento no es posible decir cunto es una persona ms alta que otra. A travs del nmero de personas que hay entre dos sujetos, por ejemplo, Andra y Juan en la fila ordenada anteriormente. En este caso adems del orden se conoce la magnitud de la altura. Si en lugar de utilizar el nmero de personas se recurre a una regla se puede ofrecer otra medida de la altura. Esta forma de medir es propia del nivel de intervalos, que permite saber la magnitud de los elementos comparando unos con otros.

La cuarta posibilidad es utilizar un metro que sita el cero en el mismo suelo, y por lo tanto, la altura se define en funcin de la distancia desde la cabeza al suelo (valor cero absoluto donde se sita la ausencia de altura). En ciencias sociales es poco frecuente encontrar variables en niveles de razn, normalmente son nominales, ordinales y en ocasiones de intervalos, rara vez de razn. Una caracterstica de esta clasificacin es que las propiedades de una escala se cumplen en el nivel superior.

En la estadstica descriptiva y con el fin de realizar pruebas de significancia, las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida: Medida Nominal El nivel nominal de medicin, de la palabra latina comn (nombre) describe variables de naturaleza categrica que difieren en calidad ms que en cantidad (Salkind, 1998: 113). Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categora o grupo. Cada grupo o categora se denomina con un nombre o nmero de forma arbitraria, es decir, que se etiqueta en funcin de los deseos o conveniencia del investigador.

3 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Este nivel de medicin es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

Por ejemplo, los sujetos que son del curso de A de 2 y los de B generan dos grupos. Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de calidad) y no cuantitativo puesto que indica donde est cada sujeto y no "cuanto es de un curso y no de otro". En este ejemplo los nmeros 2 y 3 pueden sustituir las letras A y B, de forma que 2 y 3 son simples etiquetas que no ofrecen una valoracin numrica sino que actan como nominativos.

En esta escala hay que tener en cuenta dos condiciones:

No es posible que un mismo valor o sujeto est en dos grupos a la vez. No se puede ser de 2 y 3 a la vez. Por lo tanto este nivel exige que las categoras sean mutuamente excluyentes entre s. Los nmeros no tienen valor ms que como nombres o etiquetas de los grupos. En este tipo de medidas, se asignan nombres o etiquetas a los objetos. La asignacin se lleva a cabo evaluando, de acuerdo con un procedimiento, la similaridad de la instancia a ser medida con cada conjunto de ejemplares nominados o definiciones de categoras. El nombre de la mayora de los ejemplares nominados o definiciones es el valor asignado a la medida nominal de la instancia dada. Si dos instancias tienen el mismo nombre asociado a ellas, entonces pertenecen a la misma categora, y ese es el nico significado que las medidas nominales tienen. Esta escala comprende variables categricas que se identifican por atributos o cualidades. Las variables de este tipo nombran e identifican distintas categoras sin seguir un orden. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un nmero es para identificar. Un nmero no tiene mayor valor que otro. Un ejemplo son los nmeros de las camisetas de los jugadores de un equipo de bisbol. El nmero mayor no significa que tiene el mayor atributo que el nmero menor, es aleatorio o de capricho personal a quien otorga el nmero. Para el procesamiento de datos, los nombres pueden ser remplazados por nmeros, pero en ese caso el valor numrico de los nmeros dados es irrelevante. El nico tipo de comparaciones que se pueden hacer con este tipo de variables es el de igualdad o diferencia. Las comparaciones mayor que o menor que no existen entre nombres, as como tampoco operaciones tales como la adicin, la substraccin, etc. Ejemplos de medidas nominales son algunas de estas variables: estado marital, gnero, raza, credo religioso, afiliacin poltica, lugar de nacimiento, el nmero de seguro social, el sexo, los nmeros de telfono, entre otros. La nica medida de tendencia central que se puede hacer es la moda. La dispersin estadstica se puede hacer con tasa de variacin, ndice de variacin cualitativa, o mediante entropa de informacin. No existe la desviacin estndar. Medida Ordinal 4 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En este caso las variables no slo se asignan a grupos sino que adems pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos. Por ejemplo, se puede ordenar al conjunto de alumnos del mdulo de diversificacin curricular en funcin de la calificacin obtenida en el ltimo examen. Las variables de este tipo adems de nombrar se considera el asignar un orden a los datos. Esto implica que un nmero de mayor cantidad tiene un ms alto grado de atributo medido en comparacin con un nmero menor, pero las diferencias entre rangos pueden no ser iguales. Las operaciones matemticas posibles son: contabilizar los elementos, igualdad y desigualdad, adems de ser mayor o menor que. En esta clasificacin, los nmeros asignados a los objetos representan el orden o rango de las entidades medidas. Los nmeros se denominan ordinales, las variables se denominan ordinales o variables de rango. Se pueden hacer comparaciones como mayor que, menor que, adems de las comparaciones de igualdad o diferencia. Las operaciones aritmticas como la sustraccin a la adicin no tienen sentido en este tipo de variables. Ejemplos de variables ordinales son: la dureza de los minerales, los resultados de una carrera de caballos, actitudes como preferencias, conservatismo o prejuicio, el nivel socioeconmico, orden de llegada de los corredores, entre otros. Las medidas de tendencia central de una variable ordinal pueden representarse por su moda o su mediana. La mediana proporciona ms informacin. Medida de intervalo o intervalar El nivel de intervalo procede del latn interval lun (espacio entre dos paredes). Este nivel integra las variables que pueden establecer intervalos iguales entre sus valores. Las variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores, ms la suma y la resta. En este tipo de medida, los nmeros asignados a los objetos tienen todas las caractersticas de las medidas ordinales, y adems las diferencias entre medidas representan intervalos equivalentes. Esto es, las diferencias entre una par arbitrario de medidas puede compararse de manera significativa. Estas variables nombran, ordenan y presentan igualdad de magnitud. Por lo tanto, operaciones tales como la adicin, la sustraccin tienen significado. En estas variables el punto cero de la escala es arbitrario y se pueden usar valores negativos, no significa ausencia de valor y existe una unidad de igualdad entre los valores. Las diferencias se pueden expresar como razones. Las medidas de tendencia central pueden representarse mediante la moda, la mediana al promedio aritmtico. El promedio proporciona ms informacin. Las variables medidas al nivel de intervalo se llaman variables de intervalo o variables de escala. Ejemplos de este tipo de variables son la fecha, la temperatura, las puntuaciones de una prueba, la escala de actitudes, las puntuaciones de IQ, conjuntos de aos, entre otros. Medida de razn o racional

5 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
El nivel de razn, cuya denominacin procede del latn ratio (clculo), integra aquellas variables con intervalos iguales pueden situar un cero absoluto. Estas variables nombran orden, presentan intervalos iguales y el cero significa ausencia de la caracterstica. El cero absoluto supone identificar una posicin de ausencia total del rasgo o fenmeno. Tiene caractersticas importantes: El valor cero no es arbitrario (no responde a las conveniencias de los investigadores). Un ejemplo claro es la temperatura. La existencia de un cero en la escala Celsius no supone la ausencia de temperatura, puesto que el cero grados centgrados est situado por arbitrio de los creadores de la escala. Por el contrario, la escala Kelvin s tiene un cero absoluto, precisamente all donde las molculas cesan su actividad y no se produce por lo tanto roce entre los componentes moleculares. El cero absoluto de la escala Kelvin se sita a unos -273 grados centgrados. La presencia de un cero absoluto permite utilizar operaciones matemticas ms complejas a las otras escalas. Hasta ahora se poda asignar, establecer la igualdad (nominal), mayor o menor que (ordinal), sumar y restar (intervalo) a las que se aade multiplicar, dividir, etc. Los nmeros asignados a los objetos tienen todas las caractersticas de las medidas de intervalo y adems tienen razones significativas entre pares arbitrarios de nmeros. Operaciones tales como la multiplicacin y la divisin tienen significado. La posicin del cero no es arbitraria para este tipo de medida. Las variables para este nivel de medida se llaman variables racionales. La mayora de las cantidades fsicas, tales como la masa, longitud, energa, se miden en la escala racional, as como tambin la temperatura (en Kelvins) relativa al cero absoluto. Las medidas de tendencia central de una variable medida a nivel racional pueden representarse por la moda, la mediana, el promedio aritmtico o su promedio geomtrico. Lo mismo que con la escala de intervalos, el promedio aritmtico proporciona la mayor informacin. Por ejemplo; el ingreso; el cero representara que no recibe ingreso en virtud de un trabajo, la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razn comienza desde el cero y aumenta en nmeros sucesivos iguales a cantidades del atributo que est siendo medido. Usos y abusos de la Estadstica

Usos: 1. 2. 3. 4. Conocer el porcentaje de la poblacin que necesita agua. Conocer el porcentaje de poblacin que tiene diabetes. Conocer el porcentaje de personas que utilizan tomate para preparar sus comidas Conocer el porcentaje de personas mexicanas que consumen tortilla.

Abusos: 1. Aprovechar dicho resultado para el aumento de precio. 2. Aprovechar el resultado para el aumento del precio de las medicinas. 6 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
3. Conocer el resultado de dicho estudio y aumentarles el $. Fines de la Estadstica El fin de la estadstica es determinar las leyes a que obedecen los fenmenos sociales. No opera sino con grandes cantidades, a fin de que la libertad moral quede eliminada o reducida a la mnima expresin y slo se manifieste la causa fsica o material del fenmeno. El mtodo que se emplea es el de todas las ciencias de observacin que 'pueden medir las circunstancias de los fenmenos y los efectos de las causas. En cada caso hay que empezar por la reunin de datos y material de informacin, para lo cual hay que fijar un plan y atenerse a reglas sistemticas. Luego viene su clasificacin y tabulacin y su presentacin sinttica y grfica. Con ello se forman las series estadsticas, los anlisis de tendencias y frecuencias y su distribucin entre lo que es general y lo accesorio. Despus, los anlisis por series con expresin de las tendencias por mtodos lineales o no-lineales. A seguido, el estudio de los series peridicas y de las cclicas. Objetivos de la Estadstica Objetivo de la Estadstica: La estadstica como ciencia se encarga de recopilar, e interpretar datos que en el futuro servirn para proyectar posibles problemticas futuras, consiguiendo segn estos datos, la solucin ms viable y rpida. El objetivo bsico de la estadstica es hacer inferencia acerca de una poblacin con base a la informacin contenida en una muestra, qu significa esto?. Inferir significa inducir una cosa de otra, llevar consigo, conducir a un resultado. Es decir se pretende establecer inferencia acerca de una poblacin, entendiendo a la poblacin como un conjunto de individuos, organismos o entes inanimados de los cuales queremos conocer alguna o algunas caractersticas para que nos ayuden a tomar una decisin u obtener alguna conclusin de suma importancia, y nada sabemos sobre la distribucin, existencia, ubicacin, valor de esta o estas caractersticas que nos interesa saber. Ejemplo: Que estamos interesados si nuestra poblacin juvenil consume o no droga. Con mayor precisin, necesitamos saber en la actualidad qu fraccin de nuestra poblacin consume drogas, entendiendo que el consumo de drogas lo tenemos tipificado en alguna escala o nivel. De manera que nuestro objetivo es saber con toda la exactitud posible, que fraccin de toda nuestra poblacin juvenil consume droga. Por razones materiales, de recursos humanos, de imposibilidad fsica y en definitiva de costos, no podemos efectuar una encuesta a toda la poblacin. Necesitamos entonces hacer una consulta a un gran nmero de jvenes, donde este nmero ser concomitante con la eliminacin de las barreras que impiden consultar a toda la poblacin juvenil. Definido este nmero de jvenes a los cuales, mediante tcnicas de consulta adecuadas, se entender como una muestra de la poblacin en estudio. Sobre esta muestra haremos anlisis estadstico para poder inferir qu fraccin de jvenes de la poblacin juvenil consume drogas. Objetivo de la estadstica descriptiva:

7 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Describir las caractersticas principales de los datos reunidos. Objetivo de la inferencia estadstica: Extraer las conclusiones tiles sobre la totalidad de todas las observaciones posibles basndose en la informacin recolectada. Utilidad e Importancia de la Estadstica Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas descriptivas. Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones. Aplicaciones de la estadstica La estadstica es un potente auxiliar de muchas ciencias y actividades humanas: sociologa, sicologa, geografa humana, economa, etc. Es una herramienta indispensable para la toma de decisiones. Tambin es ampliamente empleada para mostrar los aspectos cuantitativos de una situacin. La estadstica est relacionada con el estudio de proceso cuyo resultado es ms o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. El resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser de naturaleza cualitativa o cuantitativa y, en este ltimo caso, discreta o contina. Son muchas las predicciones de tipo socilogo, o econmico, que pueden hacerse a partir de la aplicacin exclusiva de razonamientos probabilsticos a conjuntos de datos objetivos como son, por ejemplo, los de naturaleza demogrfica. Las predicciones estadsticas, difcilmente hacen referencia a sucesos concretos, pero describen con considerable precisin en el comportamiento global de grandes conjuntos de sucesos particulares. Son predicciones que, en general, no acostumbran resultar tiles. Para saber quien, de entre los miembros de una poblacin importante, va a encontrar trabajo o a quedarse sin l; o en cuales miembros va a verse aumentada o disminuida una familia concreto en los prximos meses. Pero que, en cambio puede proporcionar estimaciones fiables del prximo aumento o disminucin de la taza de desempleo referido al conjunto de la poblacin; o de la posible variacin de os ndices de natalidad o mortalidad. Mtodo Estadstico

8 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
El mtodo estadstico consiste en una secuencia de procedimientos para el manejo de los datos cualitativos y cuantitativos de la investigacin. Dicho manejo de datos tiene por propsito la comprobacin, en una parte de la realidad, de una o varias consecuencias verificables deducidas de la hiptesis general de la investigacin. Las caractersticas que adoptan los procedimientos propios del mtodo estadstico dependen del diseo de investigacin seleccionado para la comprobacin de la consecuencia verificable en cuestin. El mtodo estadstico tiene las siguientes etapas: Recoleccin (medicin) Recuento (cmputo) Presentacin Sntesis Anlisis Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste, de manera resumida, en lo siguiente: Recoleccin (medicin) En esta etapa se recoge la informacin cualitativa y cuantitativa sealada en el diseo de la investigacin. En vista de que los datos recogidos suelen tener diferentes magnitudes o intensidades en cada elemento observado (por ejemplo el peso o la talla de un grupo de personas), a dicha informacin o datos tambin se les conoce como variables. Por lo anterior, puede decirse que esta etapa del mtodo estadstico consiste en la medicin de las variables. La recoleccin o medicin puede realizarse de diferentes maneras; a veces ocurre por simple observacin y en otras ocasiones se requiere de complejos procedimientos de medicin; en algunas ocasiones basta con una sola medicin y en otras se requiere una serie de ellas a lo largo de amplios perodos de tiempo. La calidad tcnica de esta etapa es fundamental ya que de ella depende que se disponga de datos exactos y confiables en los cuales se fundamenten las conclusiones de toda la investigacin. Es tan grande la importancia. De esta etapa que algunas clasificaciones de las investigaciones se basan en la forma en que ocurre la medicin; por ejemplo si la informacin es recogida en una sola ocasin suele decirse que la investigacin es transversal; en cambio, si la informacin es recogida a lo largo del tiempo se denomina longitudinal a la investigacin. En ocasiones, la recoleccin de la informacin debe ocurrir en grupos tan grandes de individuos que se hace imprctico tratar de abarcar a todos ellos; entonces es cuando se ponen en prctica procedimientos de muestreo. Tales procedimientos de muestreo estn subordinados a la consecuencia verificable que se desea comprobar y al diseo de investigacin seleccionado. Recuento (cmputo) 9 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
En esta etapa del mtodo estadstico la informacin recogida es sometida a revisin, clasificacin y cmputo numrico. A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o palotes; en otras ocasiones se requiere el empleo de tarjetas con los datos y, en investigaciones con mucha informacin y muchos casos, puede requerirse el empleo de computadoras y programas especiales para el manejo de bases de datos. En trminos generales puede decirse que el recuento consiste en la cuantificacin de la frecuencia con que aparecen las diversas caractersticas medidas en los elementos en estudio; por ejemplo: el nmero de personas de sexo femenino y el de personas de sexo masculino o el nmero de nios con peso menor a 3 kilos y el nmero de nios con peso igual o mayor a dicha cifra. Presentacin En esta etapa del mtodo estadstico se elaboran los cuadros y los grficos que permiten una inspeccin precisa y rpida de los datos. La elaboracin de cuadros, que tambin suelen llamarse tablas, tiene por propsito acomodar los datos de manera que se pueda efectuar una revisin numrica precisa de los mismos. La elaboracin de grficos tiene por propsito facilitar la inspeccin visual rpida de la informacin. Casi siempre a cada cuadro con datos le puede corresponder una grfica pertinente que represente la misma informacin. Presentar la misma informacin tanto en un cuadro como en su correspondiente grfico permite obtener una clara idea de la distribucin de las frecuencias de las caractersticas estudiadas. Sntesis En esta etapa la informacin es resumida en forma de medidas que permiten expresar de manera sinttica las principales propiedades numricas de grandes series o agrupamientos de datos. La condensacin de la informacin, en forma de medidas llamadas de resumen, tiene por propsito facilitar la comprensin global de las caractersticas fundamentales de los agrupamientos de datos. Tales medidas de resumen, al ser comunicadas , permiten a los interlocutores evocar de una misma manera la esencia de los datos; por ejemplo, cuando alguien informa que el promedio de calificaciones de un grupo de alumnos es 9.6, en una escala que va del O al 10, la imagen que se transmite es la de un grupo con buen aprovechamiento escolar; igualmente, cuando se dice que el porcentaje de defunciones con una cierta tcnica quirrgica es de 80%, las personas que escuchan se imaginan que se trata de un procedimiento peligroso. 10 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
La informacin cualitativa, como el sexo, la ocupacin o los tipos de enfermedades, requiere ser condensada a travs de medidas de resumen diferentes a la que se usan para sintetizar la informacin cuantitativa o numrica como el peso, la talla o la concentracin de glucosa. Entre las principales medidas de resumen para sintetizar a los datos cualitativos se encuentran las razones, las proporciones y las tasas. Entre las principales medidas para sintetizar los datos cuantitativos se encuentra la moda y la amplitud, la mediana y los percentiles y el promedio y la desviacin estndar. Anlisis En esta etapa, mediante frmulas estadsticas apropiadas y el uso de tablas especficamente diseadas, se efecta la comparacin de las medidas de resumen previamente calculadas: por ejemplo, si antes se han calculado los promedios de peso de dos grupos de personas sometidas a diferentes dietas, el anlisis estadstico de los datos consiste en la comparacin de ambos promedios con el propsito de decidir si parece haber diferencias significativas entre tales promedios. Existen procedimientos bien establecidos para la comparacin de las medidas de resumen que se hayan calculado en la etapa de descripcin, tales procedimientos, conocidos como pruebas de anlisis estadstico cuentan con sus frmulas y procedimientos propios. Cada prueba de anlisis estadstico debe utilizarse siempre en funcin del tipo de diseo de investigacin que se haya seleccionado para la comprobacin de cada consecuencia verificable deducida a partir de la hiptesis general de investigacin.

Conceptos Estadsticos Poblacin Es el conjunto completo de individuos, objetos que posee una o ms caractersticas observables en un mbito geogrfico determinado y en un lapso de tiempo. Muestra Es un subconjunto representativo de la poblacin, cuando hablamos de representatividad nos referimos a que debe ser lo ms parecido a posible a la poblacin desde el punto de vista cuantitativo y cualitativo. El muestreo puede ser: Muestreo al azar simple, cuando el azar es el criterio bsico de eleccin de las unidades de muestreo. Muestreo estatificado basado en la subdivisin de la poblacin en subconjuntos o estratos mutuamente excluyentes. Muestreo por reas, cuando se trabaja en funcin de unidades geogrficas o conglomerados

11 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Muestreo sistemtico, cuando se sigue un patrn de eleccin basado en nmeros aleatorios elegidos al azar o un factor de eleccin, ejemplo se elige aplicar la encuesta a cada quince visitantes al museo. En todos los casos se debe aplicar el criterio de probabilidad, es decir que cada elemento de la poblacin tenga la misma probabilidad de ser elegido en la muestra. Este es un aspecto fundamental pues hacerlo de otra manera (eleccin subjetiva) impedira medir el nivel de confianza y / o de error de los resultados obtenidos. Las Variables Las variables son las caractersticas, atributos o cualidades del objeto de investigacin se pueden clasificar de muchas maneras. Ejemplo:

Datos Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la poblacin o muestra. Ejemplo 1: El conjunto de 54 cantidad de miembros recolectados de 54 familias residentes en Espaa. Ejemplo2: El conjunto de las calificaciones de los 43 estudiantes de estadstica de la carrera de Sistemas Por qu hay que ORGANIZAR la Informacin? Porque la cantidad de informacin que muchas veces se tiene, por las diferentes mediciones que se hacen en un proceso, es demasiado grande y nuestra mente no logra resumirlos en forma tal que le trasmitan un conocimiento exacto de ese proceso. Una persona puede pasar, horas y horas, leyendo y releyendo la informacin bruta sin que pueda llegar a conocer las 12 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
caractersticas fundamentales del proceso en estudio. Si los datos se ORGANIZAN, se hace fcil conocer el comportamiento de un proceso. Cmo se organiza la informacin? Hay tres maneras de ORGANIZAR la informacin: TABULACIN: Presentar los datos del proceso en una tabla o cuadro. GRAFICACIN: Presentar grficos de los datos que han sido tabulados. ( histograma, polgono de frecuencias, ojiva). PARMETROS: Utilizar unos pocos datos representativos del proceso. Proceso de organizacin de la informacin Para el caso de la organizacin de la informacin recolectada, se establece un mtodo denominado distribucin de frecuencias. La distribucin de frecuencias es un mtodo para organizar y resumir datos. Bajo este mtodo, los datos que componen una serie se clasifican y se ordenan, indicndose el nmero de veces que se repite el valor. A la hora de realizar una investigacin estadstica, se pueden considerar dos opciones. Una investigacin exhaustiva, y se llama as a la investigacin que toma en cuenta las caractersticas de todos y cada una de las unidades que componen un universo o poblacin. La segunda opcin es realizar una investigacin parcial, tomando muestras, en donde se considera muestras a las unidades que componen una poblacin o universo. Dichas caractersticas o caracteres de estas unidades pueden ser cualitativas o cuantitativas. Las caractersticas cualitativas se denominan atributos, y son todas aquellas caractersticas de las unidades de una poblacin que se pueden describir con palabras; por ejemplo: la ciudad de origen de los estudiantes de una escuela, el gnero de las personas, la ocupacin, la profesin, su procedencia racial, etc. Las caractersticas cuantitativas son todas aquellas que se expresan en cantidades y las cuales se denominan variables; Por ejemplo: el peso, la estatura, el nmero de hijos, el nmero de hermanos, el salario mensual, etc. Por lo general, a cada variable le corresponde una serie de valores o escala de valores que la miden; Por ejemplo: la variable peso podra tomar la escala de valores 40 Kg, 50 Kg, 60 Kg, 70 Kg o ms. A su vez, las variables se pueden dividir en discretas y continuas. Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no admiten valores intermedios; Por ejemplo: la variable nmero de hijos, ser discreta ya que una familia no tendr dos hijos y medio. 13 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Mientras que las variables continuas son aquellas que admiten valores decimales o fraccionarios, pudindose establecer intervalos. Por ejemplo: la variable estatura puede tener valores como 1,65 mts. Tablas de Frecuencias La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi.

14 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

Este tipo de tablas de frecuencias se utiliza con variables discretas. Intervalo de clase Los intervalos de clase se emplean si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

15 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase (A) La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase (ci) La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Rango (R) Diferencia entre valor mximo y valor mnimo. R =(Xmax) - (Xmin)

Construccin de una tabla con Intervalos de clase 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos de queramos poner. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.

16 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Material extrado de: http://www.google.com.ec/#hl=es&source=hp&biw=1280&bih=500&q=para+que+estudiar+estadistica&oq=para+que+estudiar+es &aq=0&aqi=g2&aql=&gs_sm=c&gs_upl=68852l74607l0l20l20l0l5l5l0l440l3563l1.6.4.3.1&fp=81fdcff4c86bbed8 http://ec.globedia.com/clases-de-estadistica http://es.wikipedia.org/wiki/Nivel_de_medida http://www.monografias.com/trabajos56/lecciones-estadistica/lecciones-estadistica.shtml http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/estadistica.htm http://www.monografias.com/trabajos60/estadistica/estadistica.shtml http://www.monografias.com/trabajos10/esta/esta.shtml http://www.cobatab.edu.mx/descargasgrales/academico2011/PRODUCTOS%202011B/DESARROLLO%20DE%20PROGRAMAS %20DE%20CAPACITACION%20DE%20IV%20SEM/Desarrollo%20Comunitario/SUB%20MODULO%204%20DES%20COM/ MATERIAL%20BIBLIOGRAFICO/metodo%20estadistico.pdf http://www.mailxmail.com/curso-estadistica-basica-supervisores-aplicada-control-procesos/estadistica-organizacion-informacion http://es.scribd.com/doc/14666985/Proceso-de-organizacion-de-la-informacion http://www.vitutor.com/estadistica/descriptiva/a_3.html

17 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
UNIDAD II. ESTADGRAFOS DE TENDENCIA Y DISPERSIN Medidas de posicin Son aquellas medidas que nos ayudan a saber donde estn los datos pero sin indicar como se Distribuyen. Medidas de posicin central

Media aritmtica simple La media aritmtica o promedio simple ( X ) muestra el valor central de los datos constituyendo ser la medida de ubicacin que ms se utiliza. En general, es calculada sumando los valores de inters y dividiendo entre el nmero de valores sumados. Propiedades Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por dicho nmero Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad. Ventajas y desventajas del uso de la media aritmtica La media aritmtica viene expresada en las mismas unidades que la variable. En su clculo intervienen todos los valores de la distribucin. Es el centro de gravedad de toda la distribucin, representando a todos los valores observados. Es nica. Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeos de la distribucin. Datos No Agrupados La media aritmtica ( X ), de una cantidad finita de nmeros (X1, X2, X3.Xn), es igual a la suma de todos ellos dividida entre el nmero de sumandos (n). Simblicamente se expresa as:

Datos Agrupados La frmula correspondiente para su clculo es la siguiente:

18 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Aplicacin Media Aritmtica Se desea estimar el rendimiento promedio de las llantas de cierta marca. Para ello se toma una muestra de cuatro automviles a los que se les coloca esta marca de llanta. Una vez las llantas se desgastan completamente se anota el nmero de kilmetros recorridos por cada auto, encontrndose los siguientes valores:

Media ponderada Una media ponderada ( X w) es una media o promedio de cantidades a las que se ha asignado una serie de coeficientes, llamados pesos, para tener en cuenta adecuadamente su importancia relativa. Datos No Agrupados La media ponderada de un grupo de datos X1, X2, ...Xn, con sus correspondientes pesos w1, w2, ...,wn, pude obtenerse a travs de la siguiente frmula:

Aplicaciones de la media ponderada: Cuando se trabaja con la media aritmtica simple, se asume que a cada observacin se le da la misma importancia. Sin embargo, en ciertos casos, puede querer darse mayor peso o importancia a algunas de las observaciones y entonces se plica la media ponderada. A continuacin se muestran algunos ejemplos de aplicacin de la media ponderada. En la clase de Probabilidad y Estadstica, para determinar la nota que un alumno obtendr en el curso se asignan pesos de importancia, de la siguiente forma: Unidad I (20% del curso), Unidad II (35% del curso), Unidad III (20% del curso), Unidad IV (15% de la calificacin), Unidad V (20% de la calificacin).

19 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Si las calificaciones de un alumno son 80 en la primera unidad, 50 en la segunda, 80 en la tercera unidad, 100 en la cuarta unidad y 80 en la ltima unidad, obtiene la siguiente tabla:

Media geomtrica La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la ensima raz del producto de n nmeros. Ventajas y desventajas: En su clculo intervienen todos los valores de la distribucin. Los valores extremos tienen menor influencia que en la media aritmtica. Es nica. Su clculo es ms complicado que el de la media aritmtica. Solo se puede calcular si no hay observaciones negativas.

Datos no Agrupados La frmula para su clculo es:

Datos Agrupados

donde MG es media geomtrica, yi es marca de clase, fi la frecuencia de clase correspondiente, n el nmero total de datos utilizados. Cundo se debera utilizar este tipo de media? Lo veremos a travs de un par de ilustraciones. 20 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Aplicaciones de la media geomtrica: Es til para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento. Se usa cuando se trabaja con observaciones, donde cada una tiene una razn aproximadamente constante respecto a la anterior. Para mostrar los efectos multiplicativos en el tiempo de los clculos del inters compuesto, la inflacin y el crecimiento poblacional. En estadstica para calcular el crecimiento o decrecimiento de las poblaciones, en donde los valores estn dados en sucesin geomtrica. Se sugiere usar la media geomtrica siempre que se desee calcular el cambio porcentual promedio en el tiempo para algunas variables. En ciertas situaciones, las respuestas obtenidas con la media aritmtica no difieren mucho de las correspondientes a la media geomtrica, pero incluso diferencias pequeas pueden generar malas decisiones.

Media armnica La media armnica (MH) se define como la recproca de la media aritmtica de los recprocos de un conjunto de datos. Datos no agrupados La frmula correspondiente para su clculo es la siguiente:

donde MH es la media armnica, n es el numero de datos, yi cada valor correspondiente a la variable de inters. Obsrvese que la inversa de la media armnica es la media aritmtica de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeos. Ventajas y desventajas: En su clculo intervienen todos los valores de la distribucin Su clculo no tiene sentido cuando algn valor de la variable tomo valor cero Es nica

21 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Datos agrupados La frmula correspondiente para su clculo es la siguiente:

donde M H es la media armnica, n es el numero de datos, fi el valor de cada frecuencia, y i cada valor observado correspondiente a la variable de inters. Cundo se debera utilizar este tipo de media? Aplicaciones de la media armnica Esta medida se emplea para promediar variaciones con respecto al tiempo tales como productividades, tiempos, rendimientos, cambios, etc., tal como se describe a continuacin. Precio promedio Si se compran varios tipos de productos con distintas cantidades de unidades de cada tipo, pero gastando en ellos igual cantidad de dinero, el precio promedio por unidad es igual a la media armnica de los precios por unidad de cada tipo de producto. Rendimiento promedio de produccin En un grupo puede haber operarios con distinta velocidad para producir un artculo. Si cada una de estas personas tiene que elaborar igual cantidad de artculos, el promedio de velocidad de rendimientos de tal grupo, es igual al promedio armnico de las velocidades de rendimiento de cada una de los operarios que lo integran. Rendimiento Promedio de la Produccin Si v1, v2, vn son las velocidades de rendimiento de cada uno de las operarios, que aunque sea en distinta cantidad de tiempo, producen igual cantidad de productos, el promedio de velocidad de rendimiento del grupo es: MH = n / (1/v1 + 1/v2 + 1/vn) donde n es el nmero de operarios. Aplicacin Si un mensajero conduce 100 millas en una va rpida a 60 millas/hora y las siguientes 10 millas despus de la va rpida las conduce a 30 millas/hora. Cul es la velocidad promedio? Distancia recorrida = 20 millas Tiempo recorrido: Va rpida = 0.1667 horas Va normal = 0333 horas Tiempo total = 0.5 horas El promedio del tiempo es 20/0.5 = 40 millas / h 22 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
MH = n / (1/yi) = 2 /(1/60+1/30) = 40 millas/h Por lo tanto, el promedio de la velocidad en que conduce el mensajero es de 40 millas por hora. Media cuadrtica Una media cuadrtica (MC) se define como la raz cuadrada de la media aritmtica de los cuadrados de los valores de la variable. Datos No Agrupados Para datos no agrupados su frmula puede expresarse como:

donde MC es la media cuadrtica, yi el valor correspondiente a cada dato observado de la variable de inters, n el nmero total de datos. Datos Agrupados Para datos agrupados se puede encontrar mediante la siguiente frmula:

donde MC es la media cuadrtica, yi el valor correspondiente a cada dato observado de la variable de inters, fi la frecuencia correspondiente a cada valor observado, n el nmero total de datos. Cundo se debera utilizar este tipo de media? Este tipo de media se utiliza mucho en clculos cientficos.

23 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Mediana (Me) Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se puede hallar slo para variables cuantitativas. Datos No Agrupados Ordenamos los datos de menor a mayor. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5 Datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre.

Li

Es el lmite inferior de la clase donde se encuentra la mediana. Es la semisuma de las frecuencias absolutas.

Fi-1 ai

Es la frecuencia acumulada anterior a la clase mediana. Es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos. Ejemplo 24 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

Cuartiles, Percentiles y Deciles Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los percentiles. Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles: - El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos - El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos - El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos Datos no agrupados: Qi= Ejercicio: Q1=
N= Me= Q1= =26/4 Me= =(3*26)/4

N= nmero de datos y K =nmero de cuartil

1. 2.

Ordenar los datos: Realizar los clculos 26 10 6,5 Aprox. 10 19,5 Q3= 14 7

Q2= Q3= 1 2 3 4 5 6 3 4 4 5 6 7

Q2= Q3=

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 7 8 8 9 9 10 10 10 10 11 12 13 13 14 16 16 17 18 18 20

Q1

Q2

Q3

25 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Datos agrupados: En primer lugar buscamos la clase donde se encuentra:
Li es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase.

Ejercicio: Calcular los cuartiles de la distribucin de la tabla: fi 60 70 80 90 100 110 60 70 80 90 100 110 120 8 10 16 14 10 5 2 Fi 8 18 34 48 58 63 65

Clculo del pri mer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

26 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Percentiles: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% Moda (Mo) La moda es el valor que tiene mayor frecuencia absoluta. Datos no agrupados Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Datos agrupados Todos los intervalos tienen la misma amplitud. Mo = 4

Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi-1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase.

27 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Ejercicio con datos Agrupados Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla fi 60 63 66 69 72 63 66 69 72 75 5 18 42 27 8 100

Medidas de Dispersin Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica. Di = x La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Ejemplo:

28 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo: Calcular la desviacin media de la distribucin: xi 10 15 20 25 30 15 20 25 30 35 12,5 17,5 22,5 27,5 32,5 fi 3 5 7 4 2 21 xi fi 37,5 87,5 157,5 110 65 457,5 - | 9,280 4,280 0,720 5,720 10,720 - | fi 27,84 21,40 5,04 22,88 21,44 98,60

Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

29 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla: xi 10 20 20 40 50 60 70 20 30 40 50 60 70 80 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 Xi*fi 15 200 350 405 440 260 150 1820 xi^2*fi 225,00 5.000,00 12.250,00 18.225,00 24.200,00 16.900,00 11.250,00 88.050,00

30 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Propiedades de la varianza La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un nmero la varianza no vara. Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

31 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica

Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla: xi 10 20 30 40 50 60 70 20 30 40 50 60 70 80 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 xi*fi 15 200 350 405 440 260 150 1.820,0 x^2*fi 225,0 5.000,0 12.250,0 18.225,0 24.200,0 16.900,0 11.250,0 88.050,0

32 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Propiedades de la desviacin tpica La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

33 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Formas de una distribucin Cuando dos distribuciones coinciden en sus medidas de posicin y dispersin, no tenemos datos analticos para ver si son distintas. Una forma de compararlas es mediante su forma. Bastar con comparar la forma de sus histogramas o diagramas de barras para ver si se distribuyen o no de igual manera. Para efectuar este estudio de la forma en una sola variable, hemos de tener como referencia una distribucin modelo. Como convenio, se toma para la comparacin la distribucin Normal de media 0 y varianza 1. En particular, es conveniente estudiar si la variable en cuestin est ms o menos apuntada que la Normal. Y si es ms o menos simtrica que sta, para lo que se definen los conceptos de Asimetra y Curtosis, y sus correspondientes formas de medida. Asimetra

El objetivo de la medida de la asimetra es, sin necesidad de dibujar la distribucin de frecuencias, estudiar la deformacin horizontal de los valores de la variable respecto al valor central de la media. Las medidas de forma pretenden estudiar la concentracin de la variable hacia uno de sus extremos. Una distribucin es simtrica cuando a la derecha y a la izquierda de la media existe el mismo nmero de valores, equidistantes dos a dos de la media, y adems con la misma frecuencia. Una distribucin es Simtrica = Me = Mo

En caso contrario, decimos que la distribucin es Asimtrica, y entonces puede ser de dos tipos: Asimtrica a la izquierda. Es el caso en que Mo >= Me>= x

34 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Coeficiente de asimetra de Fisher En una distribucin simtrica los valores se sitan en torno a la media aritmtica de forma simtrica. El coeficiente de asimetra de Fisher se basa en la relacin entre las distancias a la media y la desviacin tpica. En una distribucin simtrica x = Me = Mo y m3 = 0. Por eso define como:

Si g1 > 0, la distribucin es asimtrica positiva o a la derecha. Si g1 = 0, la distribucin es simtrica. Si g1 < 0, la distribucin es asimtrica negativa o a la izquierda. Coeficiente de asimetra de Pearson Se basa en el hecho de que en una distribucin simtrica, la media coincide con la moda. A partir de este dato se define el coeficiente de asimetra de Pearson como:

Si AP > 0, la distribucin es asimtrica positiva o a la derecha. Si AP = 0, la distribucin es simtrica. Si AP < 0, la distribucin es asimtrica negativa o a la izquierda. Este coeficiente no es muy bueno para medir asimetras leves. La curtosis y su medida El concepto de curtosis o apuntamiento de una distribucin surge al comparar la forma de dicha distribucin con la forma de la distribucin Normal. De esta forma, clasificaremos las distribuciones segn sean ms o menos apuntadas que la distribucin Normal.

35 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Coeficiente de Curtosis de Fischer El Coeficiente de Curtosis o Apuntamiento de Fischer pretende comparar la curva de una distribucin con la curva de la variable Normal, en funcin de la cantidad de valores extremos e la distribucin. Basndose en el dato de que en una distribucin normal se verifica que:

se define el Coeficiente de Curtosis de Fisher como:

Una distribucin es Mesocrtica si la distribucin de sus datos es la misma que la de la variable Normal. En ese caso, su coeficiente de curtosis es cero.

La distribucin es Leptocrtica si est ms apuntada que la Normal. En ese caso, su coeficiente de curtosis es positivo.

Si la distribucin est menos apuntada que la Normal, entonces es Platicrtica, y su coeficiente de Fisher es negativo.

36 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

http://www.tec.url.edu.gt/boletin/URL_07_BAS01.pdf http://www.vitutor.com/estadistica/descriptiva/a_9.html http://www.vitutor.com/estadistica/descriptiva/a_8.html http://www.vitutor.net/2/11/medidas_dispersion.html http://es.wikipedia.org/wiki/Coeficiente_de_variaci%C3%B3n http://es.wikipedia.org/wiki/Asimetr%C3%ADa_estad%C3%ADstica http://es.wikipedia.org/wiki/Curtosis

37 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
UNIDAD III: REGRESIN Y CORRELACION Correlacin Es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos variables. El principal objetivo del anlisis de correlacin consiste en determinar que tan intensa es la relacin entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersin. Diagrama de Dispersin.- es aquel grafico que representa la relacin entre dos variables. Variable Dependiente.- es la variable que se predice o calcula. Cuya representacin es Y Variable Independiente.- es la variable que proporciona las bases para el clculo. Cuya representacin es: X1,X2,X3. Coeficiente de Correlacin.- Describe la intensidad de la relacin entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relacin lineal entre dos variables. El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal entre las dos variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar que ms dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe relacin lineal. Anlisis de regresin.- Es la tcnica empleada para desarrollar la ecuacin y dar las estimaciones. Ecuacin de Regresin.- es una ecuacin que define la relacin lineal entre dos variables. Ecuacin de regresin Lineal: Y = a + Bx Ecuacin de regresin Lineal Mltiple: Y = a + b1X1 + b2X2 + b3X3 Principio de Mnimos Cuadrados.- Es la tcnica empleada para obtener la ecuacin de regresin, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de Y y los valores pronosticados Y. Tipos de Correlacin La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables; es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas. Correlacin directa La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

38 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Correlacin inversa La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

Correlacin nula La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

Correlacin nula

39 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Distribuciones bidimensionales Cuando sobre una poblacin estudiamos simultneamente los valores de dos variables estadsticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribucin bidimensional. Ejemplo 1: Las notas de 10 alumnos en Matemticas y en Lengua vienen dadas en la siguiente tabla:

MATEMTICAS 2 LENGUA 2

4 2

5 5

5 6

6 5

6 7

7 5

7 8

8 7

9 10

Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribucin bidimensional. Idea de correlacin En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en Matemticas, mejor es la de lengua. Nube de puntos o diagrama de dispersin La primera forma de describir una distribucin bidimensional es representar los pares de valores en el plano cartesiano. El grfico obtenido recibe el nombre de nube de puntos o diagrama de dispersin.

CORRELACIN LINEAL Y RECTA DE REGRESIN. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as ocurre diremos que hay correlacin lineal. La recta se denomina recta de regresin.

40 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a una recta y ser cada vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta. En el grfico observamos que en nuestro ejemplo la correlacin es bastante fuerte, ya que la recta que hemos dibujado est prxima a los puntos de la nube. Cuando la recta es creciente la correlacin es positiva o directa: al aumentar una variable, la otra tiene tambin tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlacin es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir. Ejemplo 2: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la grfica se describen el n de errores que corresponden a los intentos realizados. Observa que hay una correlacin muy fuerte (los puntos estn "casi" alineados) y negativa (la recta es decreciente).

41 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Ejemplo 3: A 12 alumnos de un centro se les pregunt a qu distancia estaba su residencia del Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:

Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 Nota media 8,4 4

1,2 2,1 2,5

5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlacin es prcticamente inexistente, es decir, no tiene nada que ver con el rendimiento acadmico la distancia del domicilio al instituto. Medida de la correlacin La apreciacin visual de la existencia de correlacin no es suficiente. Usaremos un parmetro, llamado coeficiente de correlacin que denotaremos con la letra r, que nos permite valorar si sta es fuerte o dbil, positiva o negativa. El clculo es una tarea mecnica, que podemos realizar con una calculadora o un programa informtico. Nuestro inters est en saber interpretarlo. Antes de ponernos a trabajar destacaremos una de sus propiedades:

-1 < r < 1
Coeficiente de correlacin de Pearson El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. En el caso de que se est estudiando dos variables aleatorias x e y sobre una poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza con la letra x,y, siendo la expresin que nos permite calcularlo:

42 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
La ecuacin para el coeficiente de correlacin es:

Donde: Cov(x,y) es la covarianza de (X,Y) X es la desviaciones tpicas de la variable X Y es la desviaciones tpicas de la variable Y

La frmula para el coeficiente de correlacin del momento del producto Pearson, r, es:

donde x e y son las medias de muestra PROMEDIO(matriz1) y PROMEDIO(matriz2).

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante. Si 0 < r < 1, existe una correlacin positiva. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todava relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante. Coeficiente de correlacin de Spearman Se lo representa con, (ro) es una medida de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas. Para calcular , los datos son ordenados y reemplazados por su respectivo orden.

donde D es la diferencia entre los correspondientes estadsticos de orden de x - y. N es el nmero de parejas. Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si stos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximacin a la distribucin t de Student

43 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlacin pero no independencia. Estimacin mediante la recta de regresin Es evidente que no todos dibujaramos exactamente la misma recta para una nube de puntos, aunque la correlacin fuera bastante fuerte. De todas las rectas posibles los matemticos han elegido como la mejor aproximacin la llamada de los mnimos cuadrticos, Su clculo es tambin algo mecnico que podemos hacer con calculadora o un ordenador. En el siguiente apartado encontrars un ejercicio para estudiar sus propiedades. La recta de regresin sirve para hacer estimaciones, teniendo en cuenta que: Los valores obtenidos son aproximaciones en trminos de probabilidad: es probable que el valor correspondiente a x0 sea y0. La fiabilidad es mayor cuanto ms fuerte sea la correlacin. La fiabilidad aumenta al aumentar el nmero de datos. La estimacin es ms fiable para los valores de x prximos a la media.

Ejemplo 1:
Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemticas y en Lengua), podemos contestar con aproximacin a la siguiente cuestin: si un alumno no realiz el examen de lengua, pero s el de matemticas, obteniendo un 7, qu nota cabe esperar que obtuviera en lengua?

MATEMTICAS 2 LENGUA 2

4 2

5 5

5 6

6 5

6 7

7 5

7 8

8 7

9 10

Observa el punto amarillo, cuya abscisa corresponde a la nota de matemticas y su ordenada a la nota que esperamos que tenga en lengua. Es resultado es aproximado y relativamente fiable, ya que la correlacin es fuerte Y el valor de la nota no est muy prximo a la media, aunque el n de datos que tenemos no es muy alto. Puedes cambiar el valor de la nota de matemticas sin ms que cambiar su valor en el recuadro de la parte inferior. Propiedades de la recta de regresin de los mnimos cuadrticos. En la siguiente escena puedes comprobar las principales propiedades de la recta de regresin mnimo-cuadrtica. 1. Observa la recta blanca, cuyos coeficientes a y b puedes hacer variar en los recuadros inferiores de la escena, bien con las flechas o introduciendo los valores deseados. Observa 44 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
los segmentos denominados di, que marcan las distancias de los puntos de la nube a la recta en la direccin del eje OY. Haz variar los valores de a y de b. Cuando la recta coincida con la recta de regresin mnimocuadrtica (en color azul claro) la suma de los cuadrados de las distancias di es la mnima posible. 2. Observa el punto P(p,q), cuyas coordenadas puedes hacer variar en los recuadros orrespondientes de la parte inferior de la escena. Observa lo que ocurre si le das a p y a q los valores de las medias de la distribucin (puedes escribir mx en la casilla de p y pulsar intro y escribir my en la casilla de q y pulsar intro). Mueve ahora los puntos rojos y repite el ejercicio. qu propiedad puedes deducir?

El coeficiente de determinacin El coeficiente de determinacin o coeficiente de correlacin mltiple al cuadrado, es una medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a lo datos, ya que mide la capacidad predictiva del modelo ajustado. Se define como el cociente entre la variabilidad explicada por la regresin y la variabilidad total, esto es:

. Devuelve el cuadrado del coeficiente de correlacin de momento del producto Pearson mediante los puntos de datos de conocido_y y conocido_x. El valor R cuadrado puede interpretarse como la proporcin de la varianza de y que puede atribuirse a la varianza de x. El coeficiente de determinacin mltiple, es una generalizacin del valor de .

Se utiliza para medir la reduccin en la variabilidad total de variables regresoras . Un valor grande de

debido a la inclusin de las

no necesariamente implica que el , ya sea que grande sean

modelo es bueno. Adicionar variables al modelo siempre incrementa el valor de las variables contribuyan o no al modelo. Es posible que modelos con valor de malos en la prediccin o estimacin. OBSERVACIONES 1. mide la correlacin entre y y . alcance el valor de

2. Si existe error puro, es imposible que

. La nica manera en que , lo

podra dar , sera que se tuviera un perfecto ajuste de los datos en el cual cual es un improbable evento en la prctica,

45 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
3. Si , esto es si . (suponiendo que el modelo

ha sido ajustado), entonces 4.

es una medida de la utilidad de los trminos en el modelo diferentes de

La estadstica R2 ajustada

46 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
UNIDAD IV:NMEROS NDICES Un nmero ndice mide qu tanto una variable ha cambiado con el tiempo. Mide la variacin relativa entre las variables econmicas: Variaciones en los precios, en los salarios, en los ingresos, etc. Se calculan para 2 perodos de una serie de tiempo o para todos los perodos de una serie de tiempo con respecto a un perodo fijo llamado perodo base. Porqu usar Nmeros ndices? Pueden utilizarse en diferentes contextos. Un ndice es una forma conveniente de expresar un cambio en un grupo heterogneo de elementos. Por ejemplo, el IPC comprende ms de 50 artculos. El usar el IPC permite conocer el cambio global de precios al consumidor. La conversin de los datos a ndices tambin facilita la estimacin de la tendencia en una serie compuesta por nmeros muy grandes. Ejemplo 1: En resumen, algunas razones por las cuales se usan los nmeros ndices : 1. Permite comparar dos o ms series de tiempo que tienen diferentes unidades de medida. 2. Se pueden reducir nmeros de magnitud considerable a cantidades manejables. 3. Permiten comparar cambios en la produccin de un conjunto de artculos, los que no pueden expresarse en una misma unidad de medida. Tipos de nmeros ndices - Indice de precios : IPC, IPP o IPM - Indice de cantidad (o volumen) : Indice de volumen de exportacin Indice de Valor : IGB, ISB, Dow Jones (Cotizacin de acciones en la Bolsa de Valores de NY) Indices Especiales : Indice de Precio de las Principales exportaciones tradicionales, Indice de productividad, Indice del comercio, etc. Clculo de nmeros ndices La construccin y clculo de los nmeros ndices nos presenta los siguientes problemas: Existe dificultad para hallar datos adecuados para calcular un ndice. Los elementos incluidos en un ndice responden a un inters o pregunta en particular. 47 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Si existen cambios sustanciales en los componentes del ndice, estos ya no son bien comparables: Los pesos seleccionados deberan representar la importancia relativa de los diferentes elementos. Lo que resulta apropiado en un perodo puede volverse inapropiado en un lapso muy corto. Una ponderacin no apropiada de factores puede distorsionar un ndice: Debe seleccionarse el perodo base en forma correcta. El perodo base debe ser un perodo normal (que no corresponda ni a un pico, ni a una depresin). El clculo considera 2 mtodos para elaborar ndices: El No ponderado y El Ponderado ndices no ponderados o ndices simples Indice Simple de Precios o Precio relativo (Ip) Mide la variacin en el precio de un solo artculo en el perodo dado (t) con respecto al perodo base (o) Ip = Pt x 100 Po Indice Simple de Cantidades o Cantidad relativa (Iq) Iq = qt x 100 qo = Cantidad del bien en el perodo dado qo qt = Cantidad del bien en el perodo base Ejemplo 2: ndices compuestos (Agregados, Ponderados) Indices agregados simples de precios y cantidades. P = Pti Q = Qti Poi Qoi Desventaja del ndice : No considera ponderaciones ni medidas en distintas Unidades Indices alternativos : Pp = (Pti/ Poi) Qp = (Qti/Qoi) ndices Ponderados de Precios y Cantidades: Laspeyres y Paasche Difieren slo con respecto al precio (o cantidad) usado para la ponderacin. Un ndice de cantidad, por ejemplo, se usa a menudo para medir mercancas que estn sujetas a una variacin considerable de precios. Por lo que utilizamos precios o valores como pesos. Indice de Precio de Laspeyres Pb = pt qo x 100 Pondera con las cantidades del ao 48 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
po qo base (o) Supone que no cambia los hbitos de consumo. Slo flucta el precio

Indice de Precio de Paasche Usa ponderaciones de los aos actuales. Osea pondera con las cantidades del ao dado (t) Necesita actualizarse el consumo cada ao; por lo que el de Laspeyres se usa es el ms usado.

Pt = pt qt x 100 poqt

Indice de Cantidad de Laspeyres Pondera con los precios del ao base(o) Supone que cantidades slo fluctan las

Qb = po qt x 100 po qo

Deflactacin Operacin que convierte las series monetarias en valores reales Los valores monetarios de conjuntos de bienes son agregados donde intervienen precios y cantidades .Son del tipo

y para poder transformarla en valores reales hemos de obtener otra serie valorada a precios constantes que ser

en la que hemos eliminado las variaciones de los precios y obtenemos una serie deflactada

El ndice elegido para efectuar dicha transformacin recibe el nombre de Deflactor

49 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

La eleccin de un deflactor adecuado es importante. El ndice que debe utilizarse es un ndice de precios Paasche pero si no se dispone de un ndice de Paasche se emplea otro ndice, que generalmente es el I P C

50 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
UNIDAD V: SERIES DE TIEMPO Y PRONSTICOS Una SERIE cronolgica es un conjunto de observaciones (ordenado en trminos de tiempo). Algunos ejemplos de series cronolgicas serian aspectos tales registros de precipitacin pluvial diaria, las ventas semanales, el producto nacional bruto trimestral, mediciones de la temperatura. El objeto de analizar tales datos es determinar si se presentan ciertos patrones o pautas no aleatorias. Algunas veces se trata de descubrir patrones no aleatorios que se puedan utilizar para predecir el futuro. En otras coacciones, el objetivo es asegurarse de que no haya patrones no aleatorios. En estos casos, dichos patrones son considerados como una seal de que un sistema o proceso est fuera de control. La siguiente explicacin tiene relacin con el anlisis intrnseco, el cual se concentra en los datos histricos de la variable de estudio. Cabria destacar que el anlisis intrnseco es ampliamente empleado en los negocios y en la industria. El objetivo reconocido del anlisis intrnseco es describir ms que explicar los patrones histricos de los datos (es decir, identificar diversos patrones). Adems el supuesto en el que se basa el anlisis intrnseco, estable que existe un constante sistema causal relacionado con el tiempo, el cual influye en los datos. En otras palabras, los datos histricos supuestamente reflejan la influencia de todos los factores de manera uniforme a travs del tiempo. Por ejemplo, un estudio de ventas realizadas en un periodo de 14 aos puede revelar que las ventas han aumentado de manera uniforme a razn de casi 10% anual. Con base en esto se lleva a cabo una proyeccin de las ventas futuras, suponiendo que cualesquiera que fuesen las fuerzas que hayan dado lugar a este patrn, continuaran en el futuro. Tendencia La tendencia secular se refiere a desplazamientos de los datos a largo plazo hacia arriba o hacia abajo. Existen 2 objetivos bsicos para aislar el componente de la tendencia de una serie cronolgica. Es identificar la tendencia y utilizarla, como por ejemplo, al hacer una prediccin o pronstico. El otro consiste en eliminar la tendencia, de manera que se puedan estudiar los otros componentes de una serie cronolgica. As, en trminos de predicciones, la investigacin de la tendencia puede proporcionar cierta idea con respecto a la direccin a largo plazo de una serie de tiempo. Es identificar, a fin de que sea posible tomar en cuenta la tendencia en las decisiones de planeacin. Ejemplo:

51 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
En la siguiente taba se presentan datos de series cronolgicas en lo referente a un periodo de 20 aos

toneladas 10 11 9 11 12 15 13 17 16 13 14 10 18 16 20 22 14 21 17 21

ao 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973

Ahora obtengamos una recta de tendencia mediante las formulas siguientes: b= n"tY-"t"Y n"t"2 - ("t)"2 a="Y-b"tn Sustituyendo: ao 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 Periodo t 1 2 3 4 5 6 7 8 9 10 11 toneladas 10 11 9 11 12 15 13 17 16 13 14 t*y 10 22 27 44 60 90 91 136 144 130 154 t*2 1 4 9 16 25 36 49 64 81 100 121 52 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
1965 1966 1967 1968 1969 1970 1971 1972 1973 12 13 14 15 16 17 18 19 20 10 18 16 20 22 14 21 17 21 120 234 224 300 352 238 378 323 420 144 169 196 225 256 289 324 361 400

Aplicando las formulas b= 20(3497)-210(300) =0.52 20(2870)-(210) "2 a= 300-0.52 =9.52 20 Y=9.52+0.52t En la cual Yt =valor predicho de la serie cronolgica a= valor de Yt cuando t=0 b= pendiente de la recta t= nmero de periodos ** No hay que olvidar que n es l numero de observaciones. Por consiguiente, para fines prcticos, los clculos son idnticos a los que se ilustraron anteriormente. Promedios mviles Un segundo mtodo para el anlisis de la tendencia es utilizar un promedio mvil, el cual es un valor medio de los ltimos K puntos de datos, digamos, las ultimas 10, 15 o 22 observaciones. Por ejemplo, si se supone que el promedio est compuesto de las ultimas 12 observaciones (k=12), entonces, a medida que se considere cada nueva observacin (incluida en el promedio), se suprime la ms antigua (el dato 12). Un promedio mvil es el valor medio aritmtico de las k observaciones. PM=" Y I=t-k .

53 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
K Considrese las siguientes series, para las cuales se ha desarrollado un promedio mvil de cinco periodos.

Y 9 10 12 8 6 14 20 16 6

Total Mvil (5 periodos) TM/5 PM

45(=9+10+12+8+6) 50(=45+14-9) 60(=50+20-10) 64(=60+16-12) 62(=62+8-8)

45/5=9 50/5=10 60/5=12 64/5=12.8 62/5=12.4

Observe que primero se calcula el Total mvil (la suma de las ultimas 5 observaciones), y que el promedio mvil se obtienen dividiendo el total mvil entre l numero de periodos (valores) en dicho total. De este modo, siempre habr k observaciones en el total mvil, por lo que el promedio se mueve a medida que se agregan nuevos puntos y se suprimen los puntos ms antiguos. Por tanto, para obtener el siguiente promedio, se suprime el valor ms antiguo y se agrega un nuevo valor. La prctica usual es ubicar al promedio mvil en un punto que se encuentre a la mitad entre los puntos cronolgicos de las observaciones ms recientes y ms antigua, o bien, en un punto en el tiempo que corresponda a la observacin ms actual. Este ltimo mtodo se ilustra en el ejemplo anterior. Si el propsito es predecir el siguiente valor, se deber utilizar el valor actual del promedio mvil. Si el intento es nicamente alisar los datos, entonces es ms apropiado colocar en el centro el promedio mvil, entre el primer y ltimo puntos. En realidad, de los dos enfoques el mtodo de centrado es el que se usa con ms frecuencia.

Variaciones cclicas e irregulares Las variaciones cclicas son de tipo peridico y presentan ms de un ao de duracin. Comnmente, tales variaciones no se pueden apartar de las de naturaleza irregular, por lo que se analizaran juntas. Para aislar las variaciones cclicas, las otras variaciones (de tendencia y estacionales) se deben separar de los datos de las series cronolgicas. Las variaciones estacionales se suprimen en forma efectiva utilizando cifras anuales (ya que las variaciones estacionales se definen como ciclos de un ao o menos duracin, las cifras anuales no mostraran fluctuaciones estacionales) o bien - analizar cifras mensuales - Utilizando un promedio mvil de doce meses. A continuacin se extrae la tendencia de los datos, y lo que queda se considera como el total de fluctuaciones cclicas e irregulares.

54 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Para eliminar la tendencia se requiere obtener una recta (o curva) de tendencia. Esto se puede realizar utilizando una ecuacin de regresin o un promedio mvil de largo plazo. La eliminacin de la tendencia a partir de los datos depende de s se utiliza el modelo aditivo o el multiplicativo. En el primero, cada observacin se resta del valor correspondiente de la tendencia. El resultado es una serie de desviaciones con respecto a esta.

En esta grfica se muestran los datos con eliminacin de l a tendencia, dejando solo los ciclos.

En esta grfica se muestran los datos originales con tendencia y ciclos. En este ejemplo se muestra el mtodo para eliminar la tendencia en los datos del modelo aditivo, dada una ecuacin de regresin lineal que se deriva de los mismos. Datos originales Y 12 15 18 19 20 21 22 25 28 31 34 35 36 Datos sin tendencia Y-Yt 0 1 2 1 0 -1 -2 -1 0 1 2 1 0 55 Preparado: Ing. Bethy Arteaga

t 1 2 3 4 5 6 7 8 9 10 11 12 13

Tendencia Yt=10+2t 12 14 16 18 20 22 24 26 28 30 32 34 36

Mdulo de Estadstica
14 15 16 17 18 19 20 37 38 41 44 47 50 51 38 40 42 44 46 48 50 -1 -2 -1 0 1 2 1

Variaciones estacionales Las fluctuaciones estacionales son variaciones que se repiten regularmente en un periodo de un ao. Existen 2 objetivos generales para aislar el componente estacional de una serie cronolgica. El primero es eliminar ese patrn a fin de estudiar las fluctuaciones cclicas. La segunda finalidad es identificar factores estacionales, de esta manera que se puedan considerar en la toma de decisiones. Por ejemplo si una compaa productora se da cuenta de que existen fluctuaciones estacionales en la demanda de un determinado, producto, es posible que desee ajustar sus presupuestos, mano de obra e inventarios, teniendo esto en mente. Por lo general tales ajustes resultan muy costosos. Por ejemplo, compaa puede buscar un producto complementario. El cual presente variaciones estacionales en su de manda opuesta alas del mismo. La demanda de equipo de calefaccin. Para probar y encarar los patrones estacionales, es necesario identificar y determinar primero la extensin de estas variaciones. La Tcnica ms difundida para el anlisis estacional es el mtodo de la razn al promedio mvil. Mtodo de la razn al promedio mvil Este mtodo produce ndices semanales, mensuales o trimestrales, que establecen observaciones de series cronolgicas, en trminos de un porcentaje el total anual (es decir, como relativos estacionales). Por ejemplo, si el mes de junio tiene un ndice estacional de 0.80, esto indica que las ventas medias en junio 80% del promedio mensual. Si un trimestre presenta un ndice estacional del 2.00, esto quiere decir que las ventas para un trimestre son aproximadamente el doble de la cantidad promedio para todos los trimestres. A continuacin se presenta el desarrollo paso a paso. El primer paso es obtener un promedio mvil anual, a fin de suprimir las variaciones estacionales. Por lo tanto, si los datos se presentan en forma trimestral, se va a requerir un 56 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
promedio mvil de 4 periodos; si se consideran datos mensuales, se necesitara un promedio mvil de 12 periodos. Si los datos se presentan en forma anual ser imposible determinar ndices estacionales, ya que las variaciones estacionales automticamente se suprimiran. Si se utiliza un nmero par de periodos, para obtener el promedio mvil anual, surgir un problema en el centrado de los datos, puesto que el centro no corresponder a ninguno de los datos originales. Una forma de resolver este problema es encontrar un promedio mvil de 2 periodos de los promedios mviles, lo cual dar lugar que corresponda a un punto de los datos: A continuacin se ilustra dicha solucin.

Punto central de los centros

1 2 3 4 5 6

centro centro

El siguiente paso consiste en dividir los datos originales entre los valores correspondientes del promedio mvil. En efecto, esto elimina las variaciones de tendencia y cclicas de los datos, dejando solo las variaciones estacionales, irregulares y aleatoria simblicamente esto es Y = T*C*E*I=E*I PM T*C A Continuacin se agrupan los relativos de periodos semejantes y se obtiene la razn estacional promedio para cada periodo; por ejemplo, si se utilizan datos mensuales, se agrupan todos los de enero y se calcula su promedio; se renen todos los de febrero y se determina su problema; y as sucesivamente; por lo general se calcula un valor medio modificado; esto comprende la eliminacin de las cifras ms altas y ms bajas de cada grupo antes de obtener el promedio. Por ultimo, las cifras resultantes se estandarizan. Esto lleva a cabo mediante el ajuste de los ndices relativos, de manera que se sumen al nmero de periodos. Por tanto, si hubiera 12 periodos, en total de los relativos estacionales debera ser 12. En el ejemplo que se presenta a continuacin hay cuatro periodos por lo que la suma de los periodos ser igual a cuatro. De igual modo, debido al redondeo, las cifras tambin suman cuatro. Supngase que la cifra desarrollada sea 5 en lugar de 4. El ajuste se llevara a cabo multiplicando cada relativo estacional por 4/5. De este modo, se divide el nmero de periodos del promedio mvil entre la suma de relativos y se multiplica cada relativo por el resultado.

57 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica

Ejemplo Dados los datos de ventas trimestrales, utilice el mtodo de razn al promedio mvil, para obtener relativos trimestrales, mediante el procedimiento explicado anteriormente. Agrupado los relativos (Y/B) por trimestres, se obtienen los resultados siguientes: I 1.02 1.01 1 1.02 0.99 3.03 1.01 II 0.89 0.87 0.88 0.86 0.87 2.62 0.87 III 1.02 0.94 1.03 1.03 1.05 3.08 1.03 IV 1.07 1.09 1.1 1.09 1.1 3.28 1.09

http://es.wikipedia.org/wiki/Archivo:Oldfaithful3.png http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_12.htm http://es.scribd.com/doc/2452626/Minimos-Cuadrados http://www.tec.url.edu.gt/boletin/URL_07_BAS01.pdf

58 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Actividades Sesin 1: Actividad 1: Consultar otras definiciones de estadstica Actividad 2: Leer el Material de Apoyo sobre los Niveles de Medicin y escribir un ejemplo de cada uno. Actividad 3: Elaborar un ensayo sobre la importancia de la estadstica Actividades Sesin 2: Actividad 1 Consultar qu son las variables continuas, discretas, independientes, dependientes y citar un ejemplo de cada una. Actividad 2 Investigar y elaborar un resumen sobre los errores estadsticas

Actividades Sesin 3: Actividad 1 Elaborar una tabla de frecuencias con los datos propuestos en el mdulo pag.16 Actividades Sesin 4: Actividad 1 Construir la tabla de frecuencias para datos no agrupados y agrupados con 30 notas. Actividad 2 Representar en forma grfica los datos de la tabla de frecuencias de la actividad anterior Actividades Sesin 5 y Sesin 6: Actividad 1. Calcular las medidas de Posicin para datos no agrupados y agrupados con los datos propuesto en el mdulo. Actividad 2. Calcular las medidas de Posicin para datos no agrupados y agrupados con los datos de la tabla de frecuencias de las 30 notas. Actividades Sesin 7: Actividad 1. Calcular los Cuartiles Q1, Q2, Q3 con los datos del mdulo Actividad 2. Calcular los Cuartiles Q1, Q2, Q3 con las 30 notas de la tabla de frecuencias. 59 Preparado: Ing. Bethy Arteaga

Mdulo de Estadstica
Actividades Sesin 8 y 9: Actividad 1. Calcular las medidas de dispersin para datos no agrupados y agrupados con los datos propuesto en el mdulo. Actividad 2. Calcular las medidas de dispersin para datos no agrupados y agrupados con los datos de la tabla de frecuencias de las 30 notas. Actividad Sesin 10 Actividad 1: Analizar los datos de la tabla de frecuencias trabajada a lo largo de las sesiones anteriores y establecer los niveles de asimetra y curtosis. Actividad 2: Ejercicios con Anlisis de Correlacin y determinacin Actividades Sesin 11 Actividad 1. Ejercicios con clculos de ndices Actividades Sesin 12 Actividad 1. Ejercicios con series de tiempo y pronsticos Actividades Sesin 13 Actividad 1. Elaborar un resumen de todas las frmulas estadsticas estudiadas Actividad 2. Desarrollar taller 1 Desarrollar taller 2

60 Preparado: Ing. Bethy Arteaga

Vous aimerez peut-être aussi