Vous êtes sur la page 1sur 34

Modelos analticos

Unidad 2.2
Esperanza matemtica

Ing. Ernesto Mungua 18/11/2011 Revisin 1A

Introduccin
La palabra estadstica procede de un aejo vocablo que significaba relativo al Estado. Ello se debe a que en tiempos antiguos las personas que dominaban el arte de escribir y realizar clculos organizaban grficamente la informacin para facilitar su anlisis, y en consecuencia, permitir a los polticos tomar decisiones fundamentadas. Hoy en da, la estadstica descriptiva nos ofrece un gran caudal de herramientas y recursos con el mismo fin: ordenar los datos para luego examinarlos y tomar decisiones mejor informadas, aunque no slo en el mbito de la poltica, sino en muchos otros. Estadstica La estadstica es una rama de las matemticas que se ocupa de recoger, organizar, presentar, resumir y extraer informacin relevante y til de un conjunto de datos obtenidos. Esta informacin aparece en forma de nmeros, porcentajes tablas o a travs de graficas. La estadstica actual es producto del encuentro, en el siglo XIX, de dos disciplinas: la estadstica antigua y el clculo de probabilidades, lo que permiti el desarrollo de procedimientos para extrapolar conclusiones obtenidas a partir de un conjunto de datos a otro conjunto de observaciones potenciales. Esta rama se conoce como estadstica inferencial, y se considera a Karl Pearson (1854-1936) y Ronald Fisher (1890-1962) sus fundadores. Estadstica inferencial Incluye las tcnicas que permiten que las conclusiones a las que se llega con la muestra, se generalicen a toda una coleccin de objetos o individuos semejantes a la muestra, denominada poblacin. Por otra parte, los mtodos que organizan y resumen datos constituyen la rama de la estadstica que llamamos descriptiva. Estadstica descriptiva Es el proceso de recolectar, agrupar y presentar datos de una manera tal que describa fcil y rpidamente dichos datos.

Poblacin o universo
La poblacin es la coleccin completa de individuos u objetos de inters para el investigador. La poblacin de inters debe definirse cuidadosamente y se considera que est completamente definida slo cuando se especifica la lista de elementos que pertenecen a ella. Por lo general se piensa que una poblacin es un grupo de personas. No obstante en estadstica el trmino poblacin tiene un sentido ms amplio, ya que puede estar formado por personas u otros seres vivos, cosas, reas geogrficas o la coleccin de cualquier cosa. Por ejemplo: empleados de un taller, piezas producidas en una fbrica, alumnos de una universidad, municipios de un estado, etc. Una poblacin puede ser finita o infinita. Ser poblacin finita cuando es posible enumerar fsicamente todos los elementos que pertenecen a ella, cuando los elementos de una poblacin son ilimitados, la poblacin es infinita.

Poblacin o universo En estadstica, es el conjunto completo de individuos sobre los que pueden realizarse observaciones de inters.

Individuo o unidad esencial


Un individuo puede ser algo con existencia real o bien abstracta. Por ejemplo: un empleado; una pieza fabricada; un mes, un ao, un municipio. Un individuo es cada una de las unidades elementales sobre las que se realiza el estudio.

Muestra
Imaginemos que en una universidad se puso en marcha un nuevo sistema de inscripciones por telfono, en el que los estudiantes pueden elegir cursos y horarios por medio de un telfono de tonos. El consejo administrativo est interesado en conocer la opinin de los alumnos acerca de la eficacia del sistema, pero encuestar a todos y cada uno de ellos resulta muy costoso y supone demasiado tiempo. Por ello, elegir una muestra de 400 estudiantes, a quienes se preguntar, entre otras cosas, cuantos intentos requirieron para conectarse al sistema, cuntos cursos eligieron y en cuanto tiempo terminaron la inscripcin. Muestra Es una parte representativa de la poblacin que se selecciona para ser estudiada ya que la poblacin es demasiado grande para analizarla en su totalidad.

Ejemplo: Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula el ingreso promedio de una muestra de varios miles asalariados seleccionados entre la poblacin total de 121 millones de trabajadores. El promedio de esta muestra se utiliza luego como una estimacin del ingreso promedio para toda la poblacin. Las muestras son necesarias porque estudiar las poblaciones completas resulta muy costoso y consume demasiado tiempo

Parmetro
Un parmetro es toda medida descriptiva de una poblacin. Algunos ejemplos son: el ingreso promedio de todos los asalariados de Estados Unidos, o la produccin total de todas las plantas manufactureras. El punto clave es que un parmetro describe una poblacin. Parmetro Es una medida descriptiva de la poblacin total de todas las observaciones de inters para el investigador.

Estadstico o estadgrafo
Un estadstico es una medida descriptiva de una muestra. El ingreso promedio de esos varios miles de trabajadores, calculado por el Ministerio de Trabajo, es un estadstico. El estadstico es a la muestra lo que el parmetro es a la poblacin. El estadstico sirve como una estimacin del parmetro. Aunque en realidad el inters se fija en el valor del parmetro de la poblacin, con frecuencia debe haber conformidad con slo calcularlo con un estadstico de la muestra que se ha seleccionado. Estadstico o estadgrafo Es un elemento que describe una muestra y sirve como una estimacin del parmetro de la poblacin correspondiente.

Variable o caracterstica
Una variable es la caracterstica de la muestra o poblacin que se est observando. Si el asesor estadstico del alcalde de San Francisco est interesado en la distancia que deben recorrer cada maana las personas que viajan diariamente largas distancias hacia el trabajo, la variable es millas recorridas. En un estudio respecto al ingreso de los asalariados de Estados unidos, la variable es ingreso. Variable Es una caracterstica de la poblacin que se esta analizando en un estudio estadstico. Ejemplos: De los estudiantes de una universidad podemos estudiar: aprovechamiento acadmico, sexo, nmero de integrantes en la familia, el grupo sanguneo. De las piezas producidas en una fbrica podemos estudiar: el tamao, la calidad el peso. De los municipios de Sinaloa podemos realizar estudios sobre: nmero de habitantes, capacidad hotelera, nmero de escuelas secundarias, nmero de accidentes de trnsito.

Una variable puede ser cuantitativa o cualitativa. Si las observaciones pueden expresarse numricamente entonces es una variable cuantitativa. Los ingresos de todos los asalariados son un ejemplo de una poblacin cuantitativa. Otros ejemplos incluyen la estatura de las personas en las que se est interesado, los puntajes que los estudiantes reciben en un examen final de estadstica, y el nmero de millas que las personas recorren cada maana al ir a su sitio de trabajo. En cada caso las observaciones se miden numricamente. Variable cualitativa o de atributo Variable que se presenta bajo cualidades no medibles. Las operaciones aritmticas, como sumar y obtener promedios, no son significativas para datos que resultan de una variable cualitativa. Ejemplo: Una muestra de cuatro clientes de un saln de belleza fue cuestionada en cuanto al color de su cabello y la colonia que habita. Las dos variables son ejemplos de variables cualitativas (de atributo), ya que ambas describen alguna caracterstica de las personas.

Una variable cualitativa se mide de manera no numrica. El estado civil de quienes solicitan crdito, el sexo de los estudiantes en una clase estadstica, la raza, el color de cabello, preferencia religiosa de las personas que recorren largas distancias a su trabajo, son ejemplos de variables cualitativas. En cada caso las observaciones se miden de manera no numrica. Variable cuantitativa o numrica Variable que es medible. Las operaciones aritmticas como sumar y obtener promedios, s son significativas para datos que resultan de una variable cuantitativa. Ejemplo: El costo total de los libros de texto adquiridos por cada estudiante es un ejemplo de variable cuantitativa (numrica), el nmero de hermanos de cada estudiante sera otra variable cuantitativa. Adems las variables pueden ser continuas o discretas. Una variable continua es aquella que puede tomar cualquier valor dentro de un rango dado. No importa qu tan cerca puedan estar dos observaciones, si el instrumento de medida es lo suficientemente preciso, puede hallarse una tercera observacin que se encuentre entre las dos primeras. Una variable continua generalmente resulta de la medicin. Variable cuantitativa continua Cuando los posibles valores distintos que puede tomar la variable son todos los valores de un intervalo y por tanto son infinitos valores. Ejemplo: El peso y la talla de una persona. La temperatura.

Una variable discreta esta limitada a ciertos valores, generalmente nmeros enteros. Con frecuencia son el resultado de la enumeracin o del conteo. El nmero de estudiantes de la clase y el nmero de autos vendidos por General Motors son algunos ejemplos. En ningn caso se observaran valores fracciones. Variable cuantitativa discreta Cuando los posibles valores distintos que puede tomar la variable son aislados. El caso ms frecuente es aquel en el que la variable slo toma valores enteros. Ejemplo: El nmero de hijos. El nmero de carros en un estacionamiento.

A continuacin se muestra en forma esquemtica, la clasificacin de las variables:

Variables

Cualitativas
Ejemplos: -Sexo -Religin -Origen -Color de ojos

Cuantitativas

Discretas
Ejemplos: -Nmero de studiantes -Cantidad de baos

Continuas
Ejemplos: -Tiempo de viaje entre dos ciudades -Duracion de una bateria de tlefono celular

Ejemplo Supongamos que nos interesa determinar el nmero de libros comprados por cada alumno, el deporte preferido y el tiempo semanal dedicado al estudio de los estudiantes de la universidad. 1. La poblacin es la coleccin de todos los alumnos que estudian en la universidad. 2. Una muestra es cualquier subconjunto de esa poblacin. Por ejemplo, los alumnos de un determinado saln. 3. Las variables de inters son: nmero de libros comprados, deporte preferido y tiempo semanal dedicado al estudio. 4. La variable nmero de libros comprados es cuantitativa discreta, la variable deporte preferido es cualitativa y la variable tiempo semanal dedicado al estudio es cuantitativa continua. 5. Un dato para cada variable podra ser: 5 libros comprados, beisbol y 6 horas. 6. El estadgrafo es el valor que se obtiene de todos los integrantes de la muestra. Por ejemplo: a. El 60% compr 4 libros. b. El 80% prefiere el baseball. c. El 10% estudia 15 horas semanales. 7. El parmetro es el valor para la toda la poblacin: a. 60% pequeo error. b. 80% pequeo error. c. 10% pequeo error.

Dato
Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser numrico, una palabra o un smbolo. Ejemplo: En el estudio de la variable calificaciones un dato obtenido puede ser: 9.

Datos
Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la poblacin o muestra. Ejemplo: El conjunto de 40 calificaciones recolectadas de 40 estudiantes es un ejemplo de un conjunto de datos.

Experimento
Actividad planeada y sometida a control cuyos resultados producen un conjunto de de datos.

Exactitud del muestreo


La exactitud de toda estimacin es de enorme importancia. Esta exactitud depende en gran parte de la forma como se tom la muestra, y del cuidado que se tenga para garantizar que la muestra proporcione una imagen confiable de la poblacin. Sin embargo, con mucha frecuencia se comprueba que la muestra no es del todo representativa de la poblacin y resultar en un error de muestreo. El error de muestreo es la diferencia entre el estadstico de la muestra utilizada para cualquier parmetro de la poblacin y el valor real pero desconocido del parmetro. Error de muestreo Es la diferencia entre el parmetro desconocido de la poblacin y el estadstico de la muestra utilizado para calcular el parmetro. Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo es el azar en el proceso de muestreo. Debido al factor azar en la seleccin de elementos de la muestra, es posible seleccionar sin darse cuenta, elementos atpicos que no representan la poblacin. Por ejemplo, en el esfuerzo por estimar la media poblacional es factible que se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo as una estimacin de la media poblacional. Por otro lado, el azar puede producir un gran nmero de elementos de muestra que sean inusualmente pequeos, produciendo una subestimacin del parmetro. En cualquiera de los dos casos, ha ocurrido un error de muestreo. Una forma mas seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre cuando hay alguna tendencia a seleccionar determinados elementos de muestra en lugar de otros. Si el proceso de muestreo se disea de manera incorrecta y tiende a promover la seleccin de demasiadas unidades con una caracterstica en especial, a expensas de las unidades que no tienen dicha caracterstica, se dice que la muestra esta sesgada. Por ejemplo, el proceso de muestreo puede favorecer de manera inherente la seleccin de hombres excluyendo a las mujeres o de personas casadas excluyendo a las solteras. Sesgo muestral Es la tendencia a favorecer la seleccin de ciertos elementos de muestra en lugar de otros.

Mtodos de agrupacin de datos


Pueden utilizarse varias herramientas y resumir un conjunto grande de datos. La manera ms simple, pero quizs la ms significativa es la serie ordenada. Se asume que los puntajes de CI de cinco recin graduados de la Universidad de Podunk son 75, 73, 91, 83, 80. Una serie ordenada simplemente enumera tales observaciones en orden ascendente o descendente. Los cinco valores pueden aparecer como 73, 75, 80, 83, 91. La serie ordenada proporciona alguna agrupacin al conjunto de datos; por ejemplo, se puede ver de inmediato que los dos valores extremos son 73 y 91. Sin embargo, la utilidad de una serie ordenada es limitada. Se necesitan mejores tcnicas para describir el conjunto de datos.

Distribucin de frecuencias
La distribucin de frecuencias es una tabla til para organizar de forma compacta conjuntos de datos muy grandes. Presenta cada categora con su frecuencia y frecuencia relativa. Frecuencia y frecuencia relativa La frecuencia es el nmero de veces que aparece un valor o una categora en el conjunto de datos. Por su parte, la frecuencia relativa es la proporcin del conjunto de datos observados en una categora; se obtiene dividiendo cada frecuencia entre el nmero total de observaciones en el conjunto.

El porcentaje es la frecuencia relativa multiplicada por 100. Representa el tanto por ciento de individuos que presentan dicha modalidad o valor.

Si el conjunto de datos es categrico, cada respuesta posible es una categora. La frecuencia relativa se suele interpretar como el porcentaje del total de observaciones que pertenecen a la categora. Por ejemplo, si una categora tiene frecuencia relativa igual a 0.25, indica que 25% de las observaciones pertenecen a dicha categora.

Ejemplo: Pensemos en un grupo de 72 deportistas que practican alguno de estos deportes

Se pregunta a cada uno de ellos a que deporte se dedica y el conjunto de datos obtenidos es el siguiente: F B G F F F N T F B B B F T B F B B F N T T T N F N B F F B B B F F F T T F F G F B B F F G T F F G N B B F B T T G N T T B B N N T T T G N T Y

En este conjunto de datos F es ftbol; B, basquetbol; T, tenis; N, natacin; G, gimnasia. La frecuencia de una categora se obtiene contando el nmero de veces que sta aparece en el conjunto de datos (por ejemplo, como se muestra abajo, F aparece 22 veces, y sa es su frecuencia). En este caso, la tabla de distribucin de frecuencias es la siguiente: Categora 1 Futbol 2 Basquetbol 3 Tenis 4 Natacin 5 Gimnasia 22 18 17 9 6 Frecuencia Frecuencia relativa

La frecuencia relativa representa el porcentaje del grupo de atletas que practica cada deporte. Por ejemplo, 25% de ellos juega basquetbol y 12.5%, natacin. Veamos ahora un conjunto de datos numrico y discreto. Se registra para una muestra de 708 conductores de autobs, el nmero de accidentes en los que ha estado implicado cada uno de ellos durante un periodo de cuatro aos. Observamos que las respuestas pueden ser:

Que es un conjunto de valores discreto; por tanto cada, valor corresponde a una categora. A continuacin se presenta la distribucin de frecuencias:

Categora: numero de accidentes 0 1 2 3 4 5 6 7 8 9 10 11

Frecuencia 117 157 158 115 78 44 21 7 6 1 3 1

Frecuencia relativa

En ocasiones, si el conjunto de categoras resulta muy grande es posible reducirlas agrupando los valores en intervalos, que se llaman clases. En este caso, en lugar de tener 12 categorias podramos usar las cuatro clases siguientes:

Y obtener una distribucin de frecuencias con datos agrupados cojmo sigue: Categora: Numero de accidentes 0-2 3-5 6-8 9 - 11 Frecuencia 432 237 34 5 Frecuencia relativa

Recordemos que el objetivo de las tablas de distribucin de frecuencias es resumir la informacin; sin embargo, es importante no perder de vista aspectos relevantes, lo que puede ocurrir si se resumen demasiado las categoras. Se puede seguir una regla simple para aproximar el nmero de clases a utilizar que es:

Determinacin del nmero de clases

Donde: es el nmero de clases. es el nmero de observaciones. Despejando obtenemos:

El punto medio de la clase, M, se calcula como promedio de los lmites superior e inferior de dicha clase. El intervalo de clase es el rango de valores encontrados dentro de una clase. Se determina restando el lmite superior (o inferior) de una clase del lmite inferior (o superior) de la clase siguiente. Es deseable que todos los intervalos de clase sean de igual tamao, ya que facilita las interpretaciones estadsticas en usos subsiguientes. En la construccin original de una tabla de frecuencia, el intervalo de clase puede determinarse como: Intervalo de clase para una tabla de frecuencia

En caso de tener un conjunto de datos continuo, existe la desventaja de que no hay categoras definidas naturalmente, como en los dos casos anteriores, de modo que debemos definirlas de acuerdo con el conjunto de datos Las frecuencias se usan para responder a preguntas tales como: Cuntas observaciones o datos corresponden a una clase o a la una categora en particular? Qu porcentaje de observaciones corresponden a una clase? Cuntas observaciones corresponden a las primeras tres clases?

Para contestar esta ltima pregunta y otras similares se deben sumar las frecuencias correspondientes. De ah definimos lo siguiente: Frecuencia acumulada y frecuencia relativa acumulada La frecuencia acumulada es la suma de la frecuencia de una clase con la frecuencia de las clases anteriores en la tabla. Por su parte, la frecuencia relativa acumulada es la suma de la frecuencia relativa de una clase con las frecuencias relativas de las clases que aparecen antes en la tabla.

Tablas de contingencia
Las tablas de frecuencia pueden organizar datos de slo una variable a la vez. Si se desea examinar o comparar dos variables, una tabla de contingencia resulta de mucha utilidad.

Grficos estadsticos
Muchas veces es ms til, aunque no sea tan preciso, resumir la informacin a travs de grficos. Las representaciones graficas deben conseguir que un simple anlisis visual ofrezca la mayor informacin posible. El valor de las grficas radica en el hecho de que permiten apreciar la situacin de un grupo o un individuo con mayor rapidez y de forma mas intuitiva que las representaciones numricas.

Diagrama de tallo y hoja


El diagrama de tallo y hoja es una forma de organizar y desplegar la informacin, con lo que se facilita el anlisis visual de la distribucin de datos del conjunto. Para construir un diagrama de tallo y hoja se considera que cada observacin (cada dato registrado) consta de dos partes. Uno o ms de los dgitos principales que la componen forman el tallo, en tanto que el resto constituyen la hoja. Por ejemplo, si el conjunto de datos consiste en la puntuacin obtenida de una prueba y los resultados son enteros entre 200 y 800, se puede elegir el primer dgito del lado izquierdo (centenas) como el tallo y el resto (unidades) como hoja, de modo que si una observacin es 641, su tallo es 6 y su hoja, 41. La eleccin del tallo y la hoja depende de los datos observados (observaciones) en el conjunto. Si en ste todas las puntuaciones se hallan entre 500 y 599, entonces se pueden elegir los dos primeros dgitos como tallo, pues de lo contrario todas las observaciones tendran tallo igual a 5. As, si un dato fuera 538 sera 53 (decenas) y su hoja, 8 (unidades).

Construccin de un diagrama de tallo y hoja stos son los pasos para elaborar un diagrama de tallo y hoja: 1. 2. 3. 4. Se ordenan los datos de forma ascendente: del menor al mayor. Se eligen uno o ms dgitos para formar el tallo y el resto de los dgitos para la hoja. Se enumeran en una columna vertical los diferentes valores de tallo observados. Para cada tallo se enumeran, de manera horizontal y al lado derecho del tallo correspondiente las hojas de todas las observaciones. 5. Se indican las unidades de los tallos y las hojas.

Ejemplo: Un problema que preocupa a la poblacin es la incidencia del crimen; por ello, existe una gran cantidad de estudios estadsticos relacionados con el tema. En la tabla siguiente se presenta el nmero de asaltos por cada 100 000 residentes registrados en los 50 estados de la Unin Americana:

Asaltos por cada 100 000 residentes 32.9 53.6 72.9 32.5 40.9 27.3 43.3 39.4 42.6 37.9 46.2 18.4 27.9 40.4 88.1 29.0 49.9 42.2 52.4 19.7

45.7 33.7 77.6 34.0 44.9 32.5 24.4 30.0 62.2 31.3

29.8 49.7 29.8 34.3 17.8 46.8 47.0 46.9 25.8 24.7

53.7 34.3 49.5 51.5 37.9 25.9 31.0 64.0 23.6 20.7

En este caso, una buena eleccin del tallo es el digito de las decenas, de modo que la hoja consistir en las unidades y las dcimas. Por citar un caso, si la observacin es 32.9, el tallo es 3 y la hoja, 29. Construimos as el diagrama de tallo y hoja: 1 2 3 4 5 6 7 8 78, 84, 97 07, 36, 44, 47, 58, 73, 79, 90, 98, 98 00, 10, 13, 25, 25, 29, 37, 40, 43, 43, 78, 79, 94 04, 09, 22, 26, 33, 41, 57, 62, 68, 69, 70, 95, 97, 99 15, 24, 36, 37 22, 40 29,76 81

Tallo: decenas Hoja: unidades y dcimas

El diagrama muestra de inmediato que el menor valor es el 17.8 y el mayor, 88.1. Adems, puede verse que la mayor parte de las observaciones se encuentran entre 20 y 65. En general un diagrama de tallo y hoja permite identificar la extensin en que se dispersan las observaciones. Si hay observaciones inusualmente grandes o pequeas, conocidas como datos atpicos, resultan fcilmente identificables. De hecho, es comn que aparezcan en un rengln adicional, con una leyenda que lo indique. Consideramos una muestra de 10 estudiantes cuyos promedios en un curso de espaol:

Como la mayor parte de los datos se encuentran entre 5.5 y 7.8, 10 es un dato atpico (DA). Podemos elegir las unidades para el tallo y las dcimas para las hojas y construir el diagrama:

5 6 7 DA:

5, 6 4, 5, 8 2, 3, 7, 8, 10

DA indica que el valor del rengln correspondiente es un dato atpico, y nos evita agregar renglones para los tallos 8 y 9, que no tendran hojas.

Diagramas o grficos de barras. Es un grfico que se utiliza si la variable es cualitativa o cuantitativa con valores no agrupados. Se traza sobre ejes cartesianos en el que distribuimos en el eje de las abscisas las modalidades o valores distintos de la variable. Sobre stos, se levantan barras o rectngulos de igual base (que no se traslapen) cuya altura sea proporcional al a frecuencia que representan. Se aconseja que el eje de las ordenadas sea una cuarta parte ms pequeo que el de las abscisas.

Todas las representaciones grficas deben ser completamente autosuficientes. Esto incluye un ttulo descriptivo significativo, identificacin de las escalas vertical y horizontal, y la fuente. Construccin de un grfico de barras 1. En el eje horizontal se marcan las categoras, cuyos nombres se colocan en intervalos de separacin constante. 2. Para cada categora se traza un rectngulo con altura igual a su frecuencia (o frecuencia relativa). Todos los rectngulos deben tener el mismo ancho. 3. En el eje vertical se marca la escala de valores.

Ejemplo: Numero de alumnos que ingresan y egresan en Mxico, por nivel educativo (ao 2000) (Por cada 100) Nivel educativa Primaria Secundaria Preparatoria Universidad Ingresan 100 52 26 11 Egresan 62 40 15 8*

* De estos egresados, slo 2 se titulan. Fuente: El Debate de Culiacn.

100 90 80 70 60 50 40 30 20 10 0 Primaria Secundaria Preparatoria Universidad Ingresan Egresan

Histograma
El histograma es un grfico que se utiliza para las variables agrupadas en intervalos. Se dibuja sobre ejes cartesianos, se representan sobre el eje de abscisas los intervalos de clase y sobre el eje de las ordenadas se localizan las frecuencias absolutas o las relativas; para construir el histograma se levantan rectngulos que tienen como base la longitud de los distintos intervalos y una altura tal que el rea del rectngulo sea proporcional a la frecuencia correspondiente al intervalo. Cuando los intervalos son de la misma longitud, la altura es igual a la frecuencia; si no es as, hay que modificar la altura para mantener la proporcin entre el rea y la frecuencia correspondiente. Generalmente, una grfica ayuda ms a visualizar la informacin que una tabla con valores numricos, adems de que se nos graba en la mente por ms tiempo. Por ello, en estadstica las graficas se emplean con gran frecuencia y resulta de enorme importancia. El histograma de frecuencias consiste en representar con una barra rectangular cada frecuencia, en tanto que el histograma de frecuencias relativas representa con una barra rectangular cada frecuencia relativa. Construccin de un histograma de frecuencias (o frecuencias relativas) para un conjunto de datos discreto 1. En el eje horizontal se marcan los posibles valores. 2. Para cada valor se traza un rectngulo con altura igual a su frecuencia (o frecuencia relativa). Todos los rectngulos deben tener el mismo ancho y deben estar centrados en el valor al que se refieren. 3. En el eje vertical se marca la escala de valores.

Ejemplos:

Frecuencia
180 160 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 7 8 9 10 11 Frecuencia

Frecuencia relativa
0.25

0.2

0.15 Frecuencia relativa 0.1

0.05

0 0 1 2 3 4 5 6 7 8 9 10 11

Tambin notemos que el histograma de frecuencias y el de frecuencias relativas son grficas prcticamente iguales, excepto por la escala de valores que aparece en el eje vertical.

Polgono de frecuencias
Son grficos lineales que se utilizan en el caso de una variable cuantitativa. El polgono de frecuencias se usa para representar frecuencias relativas de un conjunto de datos numrico. Para que este polgono quede cerrado, se agregan al inicio y al final clases con frecuencia cero.

Construccin de un polgono de frecuencias para un conjunto de datos categrico El polgono de frecuencias consiste en una serie de segmentos de recta que unen los puntos cuyas abscisas son los valores centrales de cada clase y cuyas ordenadas son las frecuencias (relativas). As, para construirlo hay que ubicar en el eje y las frecuencias, dibujar los puntos correspondientes y luego unirlos. Ejemplo: A un grupo de 30 estudiantes se les pregunto cual era su edad en meses. Los resultados fueron: 200, 205, 192, 203, 208, 218, 216, 209, 205, 192, 201, 202, 207, 209, 211, 208, 210, 214, 216, 215, 227, 205, 200, 208, 210, 215, 222, 216, 218, 216. La tabla de frecuencias es la siguiente: Intervalos 192 197 198 203 204 209 210 215 216 221 222 227 Frecuencia 2 5 9 6 6 2 Frecuencia acumulada 2 7 16 22 28 30

Edades en meses
10 9 8 7 6 5 4 3 2 1 0 186-191 192-197 198-203 204-209 210-215 216-221 222-227 228-232 Frecuencias

Frecuencia acumulada y ojiva


Una grfica de frecuencias acumuladas es la ojiva. Se trata de una grfica poligonal en la cual cada punto representa el lmite superior de la clase en el eje de las abscisas y la frecuencia acumulada en el eje de las ordenadas; despus se une cada par de puntos consecutivos con un segmento de recta.

Intervalos 192 197 198 203 204 209 210 215 216 221 222 227

Frecuencia 2 5 9 6 6 2

Frecuencia acumulada 2 7 16 22 28 30

Frecuencia acumulada
35 30 25 20 15 10 5 0 192-197 198-203 204-209 210-215 216-221 222-227 Frecuencia acumulada

Grfica circular
Una grfica circular; tambin conocida como grfica de pastel, se usa para representar frecuencias relativas de un conjunto de datos categrico. Una desventaja que presenta es que slo resulta til cuando el nmero de categoras es pequeo. Construccin de una grfica circular para un conjunto de datos categrico Una grfica circular o de pastel se construye dividiendo un crculo en sectores, de forma que cada sector equivalga al porcentaje de una categora. Para cada categora se calcula el ngulo correspondiente (en grados), de acuerdo con frmula siguiente:

Categora 1 Futbol 2 Basquetbol 3 Tenis 4 Natacin 5 Gimnasia

Frecuencia relativa 0.306 0.25 0.236 0.125 0.083

ngulo

Deporte practicado
8.30% 12.50% 30.60% Futbol Basquetbol Tenis 23.60% 25.00% Natacin Gimnasia

Medidas numricas representativas


La descripcin de datos por medio de tablas y grficas nos brinda un panorama del fenmeno de donde proceden, lo que resulta til para realizar un primer anlisis. Posteriormente se busca describir y caracterizar el conjunto de una forma compacta y precisa. Para ello se calculan algunas medidas representativas que nos ofrecen informacin resumida acerca del comportamiento de los datos. Existen dos tipos de medidas representativas principales: de tendencia central y de variabilidad o dispersin. Antes de explicar cada una de ellas, conviene repasar el tema de la sumatoria; de otro modo, las frmulas y operaciones relacionadas con las medidas numricas podran resultar incomprensibles.

Introduccin a la sumatoria
La sumatoria es un smbolo que se utiliza para representar de forma abreviada una suma que consta de n sumandos. El smbolo es la letra mayscula sigma:

Entonces, en lugar de escribir una suma como

podemos abreviarlo as con la sumatoria:

Expresin que se lee como la suma de desde que vale 1 hasta . La letra es el ndice de la sumatoria y puede ser sustituida por cualquier otra, como k, j, etctera, excepto por la n, pues sta representa el nmero de sumandos que implica la operacin. Es importante sealar que el ndice de la sumatoria no siempre comienza en 1, sino que puede empezar de un entero diferente.

Propiedades de la sumatoria

Ejemplo: Representemos las sumas siguientes por medio de la sumatoria:

Medidas de tendencia central


Como su nombre lo indica, una medida de tendencia central es la que describe un valor central para ubicar la localizacin del conjunto de datos. Las ms populares son la media y la mediana.

La media
La media es un conjunto de datos numrico es un promedio que se obtiene sumando los valores observados dividiendo entre el nmero total de observaciones. Si las observaciones provienen de una muestra la llamamos media muestral, en tanto que si proceden de toda la poblacin recibe el nombre de media poblacional.

Media aritmtica Es la medida de la tendencia central que normalmente era considerada como el promedio. La media de una muestra numrica se obtiene mediante la formula

y se representa por . La media poblacional se representa por la letra .

Ejemplo: Determinemos a partir de una muestra de 14 fsiles la altura promedio (media) de un hueso frontal. Para cada fsil en la muestra (xi, con i igual al nmero de la observacin) se mide el hueso (en milmetros, mm) y se obtienen los datos siguientes: x1 42 x2 27 x3 25 x4 40 x5 33 x6 31 x7 42 x8 34 x9 35 x10 25 x11 29 x12 30 x13 29 x14 35

El conjunto observado es una muestra, as que obtenemos la media muestral sumando primero los datos que aparecen en la tabla:

Para despus dividir el resultado entre el nmero de datos u observaciones, que es 14, y entonces:

Por ello podemos indicar que la media (la altura promedio en este caso), un valor representativo de la muestra de fsiles, es 32.6 mm, es decir, la altura toma valores que varan alrededor de 32.6 mm. En ocasiones se cuenta con la informacin acerca de una poblacin completa y entonces es posible obtener un promedio de todos los valores, o sea, la media poblacional, que suele simbolizarse con la letra griega minscula mu, . Sin embargo, en muchos casos no se cuenta con informacin sobre toda la poblacin y entonces se analiza una muestra de ella, y usando algunos resultados de probabilidad es posible obtener conclusiones acerca de a partir de la media de una muestra en particular. Una desventaja de la media es que puede resultar muy afectada cuando existen datos inusualmente grandes o muy pequeos con relacin al resto del conjunto. Como hemos sealado, este tipo de datos se llaman atpicos. Citemos por caso una muestra de ocho libros de ficcin; un alumno debe elegir cul de ellos leer, por lo cual registra el nmero de pginas de cada uno y los resultados son los siguientes:

La media muestral es:

Notemos que la media 318.6 es mayor que todos los datos excepto uno, por lo cual no parece una medida muy representativa. Si eliminamos el mayor valor, que es 780, entonces la media sera 252.7, un valor ms centrado dentro del conjunto de datos. Veamos ahora otra medida de tendencia central que no es tan sensible como la anterior en presencia de datos atpicos.

La mediana
La mediana es el valor que se encuentra justo en medio de los datos, una vez que estos han sido ordenados de forma ascendente, del menor al mayor. Es evidente que cuando la muestra tiene un nmero de datos impar slo hay un valor medio, pero cuando es par existen dos; en este caso, los promediamos para obtener la mediana.

Mediana La mediana de una muestra se obtiene ordenando los datos de menor a mayor, incluidos los valores que se repiten, de forma que todos los datos aparezcan en la lista ordenada. Luego, Valor de en medio si el nmero de datos es impar. Mediana = Promedio de los dos valores de en medio si es par.

Ejemplo: Calculemos la mediana para los datos del ejemplo de la altura del hueso frontal medida (en mm) a una muestra de fsiles. En la tabla siguiente se presenta en el primer rengln, los datos, y en el segundo los datos ordenados: 42 25 27 25 25 27 40 29 33 29 31 30 42 31 34 33 35 34 25 35 29 35 30 40 29 42 35 42

Como el nmero de datos es par, hay dos valores en medio que son los valores sombreados en gris, los cuales se promedian (se suman y dividen entre dos en este caso) para obtener:

La mediana es 32, lo que nos indica, al igual que la media, alrededor de que valor se encuentra el conjunto de datos. Recordemos que la media para estos datos es 32.6, as que, en este ejemplo, la media y la mediana son valores cercanos y ambos representan o caracterizan el conjunto de datos.

La moda
La moda es el valor ms frecuente del conjunto de datos, es decir, aquel que tiene mayor frecuencia y mayor frecuencia relativa. En muchas ocasiones la moda no es nica, pues puede existir ms de un valor con la misma frecuencia dentro del conjunto de observaciones. Moda Es el valor mas frecuente del conjunto de datos.

Proporcin
Por otra parte, es comn que en algunos estudios estadsticos se tengan slo dos categoras o dos posibles valores de respuesta; por ejemplo, hombre o mujer, fuma o no fuma, tiene o no licencia para conducir. En estas situaciones es conveniente llamar xito a una de las dos posibles respuestas, y fracaso a la otra.

Entonces es posible calcularla para una muestra la proporcin de xitos que representa la proporcin de xitos, que representa la proporcin de respuestas que caen en la categora que llamamos xito. Proporcin En una muestra con n datos, la proporcin de xitos, que simbolizamos con p, se obtiene como:

Ejemplo: Queremos determinar la proporcin de fumadores en un grupo de 15 personas. Las posibles respuestas son: Fumador (xito) o no fumador (fracaso). Si resulta que nueve personas son fumadores, entonces la proporcin de xito es:

Esto es, 60% del grupo es fumador.

Medidas de dispersin o variabilidad


En nuestro esfuerzo por describir un conjunto de nmeros hemos visto que es de utilidad ubicar el centro del conjunto de datos. Pero identificar una medida de tendencia central rara vez es suficiente. Un descripcin mas completa del conjunto de datos puede obtenerse si se mide qu tan dispersos estn los datos alrededor de dicho punto central. Esto es precisamente lo que hacen las medidas de dispersin. Indican cunto se desvan las observaciones alrededor de su media. Medidas de dispersin Miden qu tanto se dispersan las observaciones alrededor de su media.

Se tomar por ejemplo los tres conjuntos pequeos de datos que se observan aqu. Conjunto de datos 1 0, 5, 10 Conjunto de datos 2 4, 5, 6 Conjunto de datos 3 5, 5, 5

Los tres tienen una media de cinco. Se debe por tanto concluir que los conjuntos de datos son similares? Claro que no. Sin embargo, si se informa slo sus medias, sin ver las observaciones, se puede concluir que hay similitud. Una imprecisin ms notoria de los conjuntos de datos resultara si se compara el grado en el cual se dispersaron las observaciones individuales en cada conjunto de datos o se expandieron alrededor de la media cinco. Las observaciones en el primer conjunto de datos estn muy dispersas por encima y por debajo de la media, mientras que aquellas en el segundo grupo de datos estn comparativamente cerca de sta. El primer conjunto de datos tiene una media de

dispersin mayor que la segunda. El tercer conjunto de datos no tiene dispersin, todas las observaciones son iguales a la media. Sabiendo esto, sera poco probable asumir de manera errnea cualquier similitud en los conjuntos de datos simplemente en base a su media. En este sentido, las medidas de dispersin son muy tiles e informativas.

El rango
La medida de dispersin ms simple (y menos til) es el rango o recorrido. El rango es simplemente la diferencia entre la observacin ms alta y la ms baja. Su ventaja es que es fcil de calcular. Su desventaja es que considera slo dos de los cientos de observaciones que hay un conjunto de datos. El resto de las observaciones se ignoran. Los rango0s de los tres conjuntos de datos anteriores son 10, 2 y 0 respectivamente. Ejemplo: Consideremos tres conjuntos de datos que tienen media = mediana = 45, es decir, se encuentran centrados alrededor del mismo valor; entonces el rango ser:

20

30

40

50

60

70

20

30

40

50

60

70

20

30

40

50

60

70

Rectas numricas con puntos que representan los datos con que obtuvimos el rango.

Al observar los datos podemos concluir que los dos primeros tienen mayor variabilidad que el tercero; ms an, el primero tiene mayor variabilidad que el segundo. Si calculamos el rango de cada uno de ellos tenemos que en el tercer conjunto es de 10 y que en los dos primeros es de 50. Pero hay menos dispersin en el segundo que en el primero pues la variabilidad de un conjunto no slo depende de la distancia entro los valores ms alejados, sino tambin la distancia de cada valor al centro.

Desvo o desviacin
El desvo es el concepto fundamental que nos permitir comprender posteriormente otras medidas de dispersin. El desvo de cada observacin es la diferencia entre la observacin y la media, se denota por d: Como ilustracin consideremos los siguientes datos: Elaboremos la siguiente tabla: 1 2 3 4 4 4 5 6 7 .

La suma de todas las desviaciones es cero.

Para cualquier grupo de datos la suma de todos los desvos es nula; por tal razn, los desvos as tratados, no proporcionan una buena medida de dispersin.

Varianza
La forma comn de evitar que se eliminen las desviaciones positivas con las negativas consiste en elevarlas al cuadrado antes de sumarlas, de manera que todos los valores que se sumen sean positivos. En la tabla siguiente se presentan las desviaciones y desviaciones cuadradas para la muestra 1: 20 40 50 30 60 70 Suma 625 25 25 225 225 625 1 750

Al promediar las desviaciones cuadradas obtenemos una de las medidas de variabilidad ms importantes: la varianza.

Varianza La varianza muestral es un promedio de las desviaciones de la media; se simboliza con formula: y se obtiene mediante la

La varianza de la poblacin, por su parte, se representa con y se obtiene dividiendo la suma de desviaciones entre (vale recordar que la media poblacional se simboliza con ):

Nota: como se observa en la formula correspondiente, el denominador de la varianza muestral es en lugar de , lo cual se debe a que se ha demostrado que se aproxima mas al valor de que si la suma de desviaciones se dividiera entre . Es importante mencionar que si los valores de estn expresados en cierta unidad (como minutos, metros, kilogramos, etc.), tanto las desviaciones cuadradas como la varianza, que es un promedio de stas, lo estarn en la unidad cuadrada correspondiente (min2, m2, kg2). Por ello si se quiere tener una medida que est en las unidades originales se calcula la raz cuadrada. La medida resultante se conoce como desviacin estndar.

Desviacin estndar. La desviacin estndar muestral es la raz cuadrada positiva de la varianza, se simboliza con y se obtiene mediante la formula:

La desviacin estndar de la poblacin se representa con poblacional:

y se obtiene como la raz cuadrada positiva de la varianza

EJEMPLO DE VARIACIN EN LOS PROCESOS Este ejemplo permitir conocer la importancia de la desviacin estndar en la vida diaria: Considere la compra de una pizza, la cual Ud. ordena en la pizzera que est de camino a su casa. Se dispone de dos pizzeras de las cuales se tiene la siguiente informacin en cuanto a tiempos de preparacin (en minutos), para 10 pizzas: Pizzera A Tiempo en minutos 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7 Pizzera B Tiempo en minutos 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0

Utilizando herramientas estadsticas comunes, tales como la media, mediana y moda, se obtienen los siguientes resultados: Pizzera A: Media = 7,15 - Mediana = 7,20 - Moda = 7,7 Pizzera B: Media = 7,15 - Mediana = 7,20 - Moda = 7,7 De estos resultados se puede observar que ambas pizzeras tienen las mismas medidas de tendencia central; es decir, en promedio, los clientes de ambas esperan por sus pizzas el mismo tiempo. Basado en estos resultados, es difcil distinguir diferencias en ambos procesos como para tomar alguna decisin al respecto. Tomando los datos del ejemplo del ejemplo anterior y calculando su desviacin, su varianza, y su desviacin estndar tenemos las siguientes tablas: Pizzera A Desviacin (min) Varianza (min2) 0.3025 0.4225 0.2025 0.1225 0.0025 0.0225 0.0625 0.3025 0.3025 0.3025 min2 min

Tiempo en minutos 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7 Total

Pizzera B Tiempo en minutos 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0 Total Desviacin (min) Varianza (min2) 8.7025 3.0625 1.8225 0.9025 0.2025 0.3025 0.3025 1.8225 4.6225 8.1225 min2 min

Si se observan nuevamente los datos de tiempos de preparacin, se puede observar una mayor variacin (o dispersin) en los tiempos de la pizzera B. Si todas las dems caractersticas de calidad de ambas pizzeras son iguales, es probable que los clientes prefieran comprar sus pizzas en la A, por sus tiempos de preparacin ms consistentes y menos variables. En el mundo de los negocios se requiere de algo ms preciso y confiable para medir y cuantificar la variacin de los procesos; para ello se dispone de las medidas de dispersin como la desviacin estndar. Por qu es importante la desviacin estndar? Porque es una de las formas ms sencillas de controlar la variabilidad, llmese presupuestos, ventas, productos, tiempos de atencin y para todo el nuevo conjunto de indicadores que estn de moda. Por medio de la desviacin estndar se pueden analizar encuestas a clientes y determinar que tan concluyentes son las respuestas, se puede inferir la probabilidad de que se alcancen las metas, que los productos estn fuera de especificacin, que un empleado llegue tarde, que un estudiante no logre la nota mnima etc. La desviacin estndar sirve para conocer si los procesos tienen capacidad para cumplir con los requerimientos del cliente, por medio de lo que se conoce como anlisis del Cpk (ndice de capacidad de proceso), o Cp. Con la desviacin estndar es posible calcular el nivel sigma, en lo que hoy est de moda y se conoce como "Six Sigma", sigma es la palabra griega para la desviacin estndar. Sirve para comparar dos procesos totalmente diferentes como lo podra ser un proceso en el departamento de Recursos Humanos y otro en planta o en finanzas, mediante la utilizacin del coeficiente de variacin.

La desviacin estndar ayuda a calcular los lmites naturales de variacin de un proceso, para establecer la fluctuacin en las metas de venta. Para saber si el valor de la desviacin estndar es un valor significativo, no se hace en trminos absolutos, sino ms bien en trminos relativos, es decir, se debe comparar con su media. Si la desviacin es, por ejemplo 1000 y la media es 1000, entonces la desviacin es grande, pero si la media es un milln vers que la desviacin estndar se considera pequea. Una forma emprica de saber si la desviacin estndar es pequea, podemos dividir la desviacin estndar entre la media y si se obtiene un valor menor o igual a 10%, se podra decir que la desviacin es pequea.

No es una ley, pero digamos que si al dividir la desviacin estndar entre la media se obtiene un resultado menor o igual al 10% se podra decir que la desviacin es pequea. El valor que tiene un significado es la desviacin estndar, la varianza no lo tiene, solo que es necesaria calcularla para luego obtener la su raz cuadrada, que es la desviacin estndar.

Propiedades de la media
Las propiedades de la media son las siguientes: - La media de una constante es la propia constante. - La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas variables. - La media del producto de una constante por una variable, es igual a la constante por la media de la variable. - La media de una combinacin lineal de dos o ms variables es igual a la combinacin lineal de las medias de dichas variables. - La media es el centro de gravedad de la distribucin, ya que las desviaciones respecto a la media suman 0.

Propiedades de la varianza
- La varianza es siempre positiva o cero. - La varianza de una constante es cero. - La varianza de la suma o diferencia de una variable y una constante es igual a la varianza de la variable. - La varianza de un producto de una constante por una variable es igual al cuadrado de la constante por la varianza de la variable.

Propiedades de la desviacin estndar


Las propiedades de la desviacin estndar son: - La desviacin estndar es siempre positiva o cero. - La desviacin estndar de una constante es cero. - La desviacin estndar de una constante por una variable es igual a la constante por la desviacin tpica de la variable. - La desviacin estndar de la suma o diferencia de una variable y una constante es igual a la desviacin tpica de la variable.

Teorema de Chebyshev
El teorema de Chebyshev (algunas veces escrito teorema de Tchebysheff) fue formulado por el matemtico ruso P.L. Chebyshev (1821 - 1894). Establece que para todo conjunto de datos, por lo menos de las observaciones estn dentro de de K desviaciones estndar de la media, donde K es cualquier nmero mayor que 1. Teorema de Chebyshev [ ]

As, por ejemplo, si se forma un intervalo K = tres desviaciones estndar por encima de la media hasta tres desviaciones estndar por debajo de la media, entonces por lo menos

de todas las observaciones estn dentro de dicho intervalo. Ejemplo: Una aerolnea tiene una media de 78.7 pasajeros por da, con una desviacin estndar de 12.14. Para programar los tiempos para una nueva ruta que fue abierta, la gerencia desea saber con qu frecuencia los pasajeros estn dentro de K = dos desviaciones estndar de la media, y cual es dicho intervalo. Solucin: Si se transportan dos desviaciones estndar se tendr un intervalo de Se puede estar seguro de que por lo menos pasajeros por encima y por debajo de la media de 78.7, pasajeros.

del tiempo, el nmero de pasajeros diarios estuvo entre 54 y 103. En por lo menos el 75% de los das (es decir, 75% de 50 es igual a 37 das), el numero de pasajeros estuvo entre 54 y 103.

Preguntas
1.- Qu es la estadstica? 2.- Qu es la estadstica inferencial? 3.- Qu es la estadstica descriptiva? 4.- Defina poblacin 5.- Qu es una muestra? 6.- Qu es la variable? 7.- Cul es la diferencia entre variable y parmetro? 8.- Cules son las variables cualitativas? 9.- Cules son las variables cuantitativas? 10.- Cules son los tipos de variables cuantitativas? 11.- Qu es el error de muestreo? 12.- Qu es la distribucin de frecuencias? 13.- Qu es la frecuencia acumulada? 14.- Qu diferencia existe entre un histograma y un grfico de barras? 15.- Cules son las medidas de tendencia central? 16.- Qu es la mediana? 17.- Qu es la moda? 18.- Para que sirven las medidas de dispersin o variabilidad? 19.- Qu es el rango? 20.- Qu indica una desviacin estndar muy alta?

Problemas
1.- Frecuencia relativa y frecuencia relativa acumulada 1.1- En el consultorio de un nutrilogo se registr el peso en kilogramos (kg) de un grupo de 50 pacientes y los resultados fueron los siguientes: 55.8 45.9 83.2 75.3 60.7 60.9 49.1 40.0 71.4 77.1 37.0 45.5 41.7 65.2 59.1 69.0 74.5 68.2 65.0 66.3 76.0 47.2 40.0 39.8 87.1 60.6 61.5 56.3 78.8 47.1 43.8 61.2 94.6 61.8 64.9 42.3 71.7 47.3 48.0 69.8 65.8 44.6 62.3 58.2 69.3 91.3 56.0 36.7 52.6 49.5

a) Construya una tabla de frecuencias y frecuencias relativas agrupando los datos en clases. b) Calcule adems las frecuencias acumuladas y las frecuencias relativas acumuladas. 1.2- En una escuela se registra el nmero de faltas de sus profesores en un mes. Los resultados del mes pasado fueron:

a) Cuntos profesores faltaron menos de tres veces? b) Qu porcentaje de profesores faltaron tres veces o menos?

1.3- A finales de 2008, los Estados Unidos experimento un gran declive econmico que se piensa fue debido a los crditos subprime que muchas instituciones de crdito hicieron en aos anteriores. Cuando la burbuja inmobiliaria estallo, muchas instituciones experimentaron severos problemas. Como resultado, los prestadores de crdito se volvieron muy conservadores en otorgar hipotecas, lo cual hizo que la compra y venta de casas se dificultara. Para demostrar la magnitud del problema en la Ciudad de Kansas, la Asociacin de Agentes de Bienes Races hizo una encuesta a 16 agencias en el rea y recolect los datos sobre el nmero de transacciones de bienes races que se realizaron en diciembre de 2008. Los siguientes datos fueron observados: 3 1 0 2 0 2 2 1 0 2 1 4 1 0 0 2

Los analistas de bienes races desean construir una tabla de distribuciones de frecuencia y frecuencias relativas para el numero de transacciones realizadas. a) Dibuje una tabla de distribucin de frecuencias y frecuencias relativas. b) Cul es el porcentaje de agencias que no reportaron ninguna transaccin?

2.- Medidas de tendencia central

2.1- Para mantenerse competitiva, United Airlines, debe de actualizar su flota de aviones. Supngase que eligen sus aviones de una lista de 17 aviones posibles, incluidos los modelos como el Boeing 747-100, Air Bus 300-B4, y el DC 9-10. En una reunin reciente, el jefe de operaciones pregunto a un miembro de su equipo que determine el promedio de combustible consumido por hora de cada uno de los aviones. Los datos obtenidos se muestran en la siguiente tabla: Consumo (gal/hr) B747-100 3,529 L-1011-100/200 2,215 DC-10-10 2,174 A300-B4 1,482 A310-300 1,574 B767-300 1,503 B767-200 1,377 B757-200 985 B727-200 1,249 MD-80 882 B737-300 732 DC-9-50 848 B727-100 806 B737-100/200 1,104 F-100 631 DC-9-30-11 804 DC-9-10 764 Encuentre el promedio de galones de combustible consumidos por hora. 2.2- Dominique & Associates es una firma que busca talentos para compaas que buscan llenar una posicin de trabajo de gerencia. Han seleccionado una muestra de 7 personas recientemente contratadas y sus salarios iniciales son los que se muestran a continuacin: Avin

a) Cul es el salario promedio inicial? b) Cul es la mediana? 2.3- Los dueos de Smoky Mountain Pizza estn planeando expandir su restaurante para incluir un espacio a campo abierto. Antes de finalizar el diseo, los administradores desean saber cual es el tamao del grupo de personas que ms frecuentemente ordenan una pizza, para as, poder organizar el arreglo de asientos que mejor cumplan con la demanda. El numero de personas por grupo y su frecuencia se muestra a continuacin:

Cul es la moda? 2.4- Una muestra al azar de 15 artculos tomados de la revista Fortune mostraron el siguiente conteo de palabras por artculo: 5,176 6,005 5,052 4,132 5,736 5,381 5,002 4,573 4,209 Calcule la media, y la mediana para estos valores de la muestra. 5,310 4,983 5,611 4,188 4,3423 4,568

3.-Medidas de varianza o dispersin


3.1.- Boydson Shipping Company posee y opera una flotilla de buques que transportan mercanca entre los pases del mundo. En los pasados seis meses, la compaa ha tenido siete contratos de transporte entre Vancouver, Canad, y Londres, Inglaterra. Por muchas razones, el tiempo de viaje varia entre estos dos lugares como se muestra a continuacin:

El administrador esta interesado en conocer la varianza y la desviacin estndar de los tiempos de transporte de estos siete envos. Calcular la varianza y la desviacin estndar de este conjunto de datos. 3.2- El gerente de control de calidad de Zenith Systems, un productor de equipo usado en el negocio de perforado de pozos petrolferos y de gas, recientemente realizo 10 pruebas independientes en partes relacionadas con el equipo que la compaa hace. En cada prueba, 100 partes fueron examinadas y el numero de partes defectuosas registrado. Se analiz una muestra de estas pruebas y se obtuvieron los siguientes resultados: Prueba 1 2 3 4 5 6 7 8 9 10 Defectos = x 4 7 1 0 5 0 3 2 6 2

Con estos datos calcule la varianza muestral y la desviacin estndar muestral. 3.3- Google es conocido por sus grandes beneficios para empleados. Los siguientes datos reflejan el nmero de das de vacaciones que una muestra de empleados de Google tomaron antes del final del ao: 3 5 4 0 1 3 2 3 1 0 0 8 1 0 4 3 1 2 5 3 4 2 3 0

a) Calcule el rango para estos datos. b) Calcule la varianza. c) Calcule la desviacin estndar.

Vous aimerez peut-être aussi