DEFINICIN DE ESTADSTICA: es un conjunto de teoras y mtodos
desarrollados para la recopilacin, representacin y el uso de datos sobre una o
varias caractersticas de inters con el objeto de tomar decisiones, extraer conclusiones o emprender acciones. ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga de organizar, resumir y describir las caractersticas principales de los datos. Generalmente se resumen en forma tabular, grafica o numrica. El anlisis se limita en si mismo a los datos coleccionados y no se realiza inferencia alguna o generalizaciones acerca de la totalidad de donde provienen esas observaciones. ESTADSTICA INFERENCIAL: Es la que trata de estimar las caractersticas de una poblacin a travs del estudio de una muestra. POBLACION: La poblacin se define como la totalidad del fenmeno a estudiar donde las unidades de poblacin posee una caracterstica comn la cual se estudia y da origen a los datos de la investigacin. MUESTRA: Es el grupo de individuos que se toma de la poblacin, para estudiar un fenmeno estadstico. VARIABLE: Toda caracterstica que puede tomar diferentes valores (Ej. nmero de hijos, precio de la habitacin) Las variables se suelen denotar por letras maysculas: X, Y,... Tipos de variables: 1. Cualitativas o Categricas: aquellas que no son medibles, es decir, aquellas cuyas observaciones no tienen carcter numrico. Expresan cualidades o categoras. Ej. estado civil, sexo o profesin.(A las variables cualitativas tambin se les llama atributos).
2. Cuantitativas: aquellas que son medibles, es decir sus observaciones tienen carcter numrico. Estas se dividen a su vez en: Discretas: toman valores enteros en un conjunto numerable. Ej. Nmero de habitaciones de un hotel, nmero de hijos de una familia, nmero de obreros de una fbrica. Continuas: toman valores en un conjunto no numerable (los nmeros reales o un intervalo). Ej. peso, estatura.
DATO: cada valor observado de la variable. Si representamos por X a la variable, representaremos por x i cada dato diferente observado en la muestra, el subndice i indica el lugar que ocupa si los ordenamos de menor a mayor.
MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de acuerdo a ciertas reglas o smbolos. Una medicin se puede definir como la manera de obtener smbolos para representar propiedades de personas, objetos, eventos o estados cuyos smbolos tienen la misma relacin relevante entre si igual a las entidades que representan.
ESCALAS DE MEDICIN DE LAS VARIABLES Las escalas de medicin son el conjunto de los posibles valores que determinada variable puede tomar. Por tal razn, los tipos de escala de medicin estn ntimamente ligadas con los tipos de variables a estudiar.
Al elaborar estadsticas con datos y su caracterstica es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin como el proceso de asignar nmeros o establecer una correspondencia uno a uno entre objetivos y observaciones. Las escalas de medicin s clasifican de la siguiente forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y Escalas de razn o Proporcin.
Escala de Medicin Nominal: Consiste en clasificar a los elementos, personas, animales, etc, asignndoles smbolos o nombres. Los datos que se obtienen para una variable cualitativa se miden en una escala nominal y simplemente se clasifican en distintas categoras que no implican orden. La escala nominal es la forma ms dbil de medicin porque no se puede aplicar operaciones aritmticas ni intentar el conteo de las diferencias dentro de una categora determinada o especificar cualquier orden o direccin a lo largo de las diversas categoras.
Propiedades de la Escala Nominal 1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos. 2. No existe un orden especfico para esta categora. 3. No presentan el cero. 4. No se basa en diferencia cuantitativa.
Escala de Medicin Ordinal: Establece una relacin de orden entre los elementos (personas, animales, objetos, etc.), en atencin a una caracterstica, sin que reflejen distancia entre ellos. La diferencia entre dos nmeros ordinales no tiene significado cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no dice cuanto es uno que el otro. La escala ordinal sigue siendo una forma de medicin dbil porque no se pueden hacer planteamientos numricos significativos con respecto a las diferencias entre las categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o preferida; y no se habla cunto es mayor, mejor o ms preferida.
Propiedades de la Escala Ordinal 1. Las observaciones o elementos se les ordena en rangos o categoras diferentes. 2. Las categoras son mayores o menores que otras categoras, es decir, que existe una clasificacin de mayor a menor (jerarqua). 3. Las categoras son mutuamente excluyentes y exhaustivas. 4. No presentan el cero.
Escala de Medicin de Intervalos: Tiene todas las caractersticas de una escala ordinal, adems permite conocer la distancia entre dos nmeros cualquiera. Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa.
La escala de intervalos posee adems, de las caractersticas de la escala nominal y ordinal, la propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite a esta escala un mayor grado de perfeccin, ya que proporciona nmeros que manifiestan diferencias palpables entre individuos, objetos o cosas.
Propiedades de la escala de Intervalo: 1. Esta escala implica la cuantificacin de los datos 2. En ests medidas se utilizan unidades constantes de medicin (capacidad, peso, Cntimos, grados Fahrenheit o centgrados) los cuales producen intervalos iguales entre puntos de la escala. 3. Proporcionan nmeros que manifiestan diferencias palpables entre individuos, objetos o cosas. 4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario. 5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del coeficiente de variacin. 6. Son mutuamente exclusivas y exhaustivas.
Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de medicin, posee todas las caractersticas de las escalas nominales, ordinales y de intervalos; adems tiene un cero absoluto o natural que tiene significado fsico. Si en ella la medicin es cero, significa ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones aritmticas. Los nmeros indican los valores concretos de la propiedad que s esta midiendo; peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala de razn. Cuando se emplea este tipo de escala, los nmeros indican razones o cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos ms elaborados.
Propiedades de la escala a razn: 1. La distancia entre los nmeros es un tamao conocido y constante. 2. Los datos tienen un punto cero significativo. 3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de variacin. 4. Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico siendo arbitrario nicamente la unidad de medida.
DISTRIBUCIONES DE FRECUENCIAS La distribucin de frecuencia es una disposicin tabular de datos estadsticos, ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada dato. Las frecuencias pueden ser:
FRECUENCIA ABSOLUTA (f i ): Es el nmero de veces que se repite un determinado valor de la variable (x i ). Se designa por f i.
PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de observaciones (n).
FRECUENCIA ACUMULADA (F i ): Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una distribucin de frecuencia, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras F i . Se calcula:
PROPIEDAD: La ltima frecuencia acumulada absoluta es igual al total de observaciones.
FRECUENCIA RELATIVA (h i ): Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero total de datos. Las frecuencias relativas se designan con las letras h i. Se calcula:
FRECUENCIA RELATIVA ACUMULADA (H i ): Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre nmero total de datos. Se designa con las letras H i . Se calcula;
PROPIEDAD: La ltima frecuencia relativa acumulada es la unidad. DISTRIBUCION DE FRECUENCIAS ABSOLUTAS Es la representacin estructurada en forma de tabla de toda la informacin que se ha recogido sobre la variable que se estudia, es decir, es una tabla que presenta de manera ordenada los distintos valores de una variable y sus correspondientes frecuencias. DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva. La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad. Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales: El numero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos. Cada observacin debe estar incluida en una y solo una clase o intervalo. El valor mas pequeo y mas grande deben entrar en la clasificacin. No deben existir brechas o vacos entre clases sucesivas. Los intervalos no se deben sobreponer. En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos.
COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIAS DE CLASES 1.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados con caractersticas comunes. Para organizar los valores de la serie de datos hay que determinar un nmero de clases que sea conveniente. En otras palabras, que ese nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un nmero de clases pequeo puede ocultar la naturaleza natural de los datos y un nmero muy alto puede provocar demasiados detalles como para observar alguna informacin de gran utilidad en la investigacin. A las fronteras del intervalo, la llamaremos, lmites inferior y superior de la clase y los denotaremos por L i-1 , L i .
2.- Punto medio o Marca de clase (X&).- Es la semisuma del lmite inferior y superior de una clase, tal como lo indica la siguiente formula:
3.- Amplitud , Longitud o Tamao del Intervalo.- Los intervalos de clases pueden ser de tres tipos: Clases de igual tamao, clases de tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao son los ms utilizados y recomendados para los clculos estadsticos. Se designa por las letras Ic. Nota: Al nmero de observaciones de una clase se le llama frecuencia de clase, si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia relativa de clase, y del mismo modo que lo hacamos para datos sin agrupar definiramos Hi, y Fi. PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADA EN INTERVALOS 1. Determinar el mximo y mnimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o rango, es decir, R=X max -X min
2. Calcular el nmero de clases a utilizar. Existen diversos criterios para determinar el numero de clases, ante tanta diversidad de criterios, se ha considerado que lo mas importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica.
3. Cuando se tenga dudas en determinar el numero de intervalos de clases, es de gran utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizar este mtodo siempre y cuando el mismo sea aplicable. Determinamos la amplitud o tamao de los intervalos travs de la siguiente formula:
MTODOS GRFICOS
La forma de la distribucin de frecuencias se percibe ms rpidamente si la representamos grficamente. Se resume la informacin de la muestra de forma grafica con fines clarificadores o para enfatizar y descubrir determinadas caractersticas que de otra manera seria muy difcil de apreciar. Un grafico siempre es mas inmediato de comprender que un conjunto de datos estadsticos. Las representaciones graficas varan segn el tipo de variable:
a. Grficos para variables Discretas y Categricas
DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables cuantitativas discretas o para variables cualitativas. En el eje de ordenadas representamos los diferentes valores de la variable (x i ). Sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa).
DIAGRAMA DE SECTORES O DE PASTEL: Es el ms usual en variables cualitativas. Se representan mediante crculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia.
Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones locales de un partido poltico: Ancho o tamao del intervalo
Para construir el diagrama de sectores partimos del hecho de que un circulo encierra un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos sectores, de acuerdo con cada porcentaje; tenemos as que para determinar el sector correspondiente al 50%, resolvemos la ecuacin:
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuacin, con ayuda de un transportador, sealaremos el sector circular de medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representacin grafica.
b. Grficos para variables continuas
HISTOGRAMA: Es la representacin grfica de las frecuencias agrupadas de una variable continua sobre intervalos. A diferencia de los diagramas de barras, los histogramas dibujan rectngulos unidos entre si, lo que significa que existe continuidad en la variable cuyos valores se representan en el eje horizontal que se haya dividido en intervalos de igual amplitud. Las reas de los rectngulos son proporcionales a las frecuencias que representan.
El histograma o diagrama de barras proporcionan mucha informacin respecto a la estructura de los datos, nos permite evidenciar fundamentalmente tres caractersticas:
1. Forma de la distribucin. 2. Acumulacin o tendencia posicional (valor central de la distribucin). 3. Dispersin o variabilidad.
Cuando nos encontramos en distribuciones donde los intervalos no tienen la misma amplitud, las barras del histograma tienen que tener un rea proporcional a la frecuencia que queramos representar.