Vous êtes sur la page 1sur 5

Clase 1 ESTADSTICA La estadstica es un conjunto de mtodos y procedimientos para: Recoger informacin Clasificar la informacin Resumir informacin Representar los

los datos Analizar la variabilidad y encontrar patrones Los mtodos estadsticos se disean de tal modo que contribuyan al proceso interpretar la variabilidad de algn fenmeno. La Estadstica se divide en dos reas: Descriptiva y Inferencial Estadstica Descriptiva: Utiliza mtodos numricos y grficos para describir un grupo de datos. Recolecta, presenta y describe datos muestrales. Estadstica Inferencial: Mtodos que se apoyan en el clculo de las probabilidades y a partir de datos muestrales estima, predice y generaliza sobre una poblacin. Algunos conceptos Poblacin: conjunto de individuos, elementos, objetos, etc. que tienen caractersticas comunes y son de inters de Una poblacin puede ser finita o infinita dependiendo si se pueden o no contarse sus elementos. Ej. Todos los escolares de enseanza bsica. Muestra: subconjunto extrado de la poblacin. Se estudia la muestra y se espera concluir resultados para toda la poblacin. Ej.: un grupo de escolares de enseanza bsica. La muestra se elige de tal modo que sea representativa de toda la poblacin. Muestreo: tcnicas para la seleccin de una muestra representativa. El mtodo de seleccin es decisivo en las conclusiones que se pueden obtener de la muestra. Existen varias formas de seleccin y algunas de ellas son: - Muestreo aleatorio simple - Muestreo estratificado - Muestreo por conglomerado - Muestreo sistemtico M. aleatorio simple: Todos los elementos de una poblacin finita tienen igual probabilidad de ser elegidos (equiprobables). La muestra tamao n se selecciona aleatoriamente (nmeros aleatorios) de un total de N elementos. M. sistemtico: es til cuando la poblacin es infinita (ordenada). Aleatoriamente se elige un punto de partida y se van seleccionando los elementos cada k posiciones.

M. estratificado: La poblacin es clasificada en conjuntos llamados estratos. Los elementos dentro de cada estrato, son homogneos. Sin embargo, entre los estratos existe heterogeneidad. La muestra contiene elementos seleccionados de cada estrato. M. por conglomerado: La poblacin es clasificada en conjuntos llamados conglomerados. Los elementos dentro de cada conglom., son homogneos. Sin embargo, entre los conglom. existe heterogeneidad. Parmetro: Medida que resume los datos de una poblacin. Ej: promedio de los sueldos de todos los profesores de colegios. Se estiman en base a la muestra. Estadstico: Medida que resume los datos de una muestra. Ej: promedio de los sueldos de un grupo de profesores de colegios. (vara por cada muestra). Son calculados con los datos muestrales. Dato: valor asociado a un elemento de la poblacin o muestra. Relacin entre poblacin muestra y parmetro estadstico

Variable: caracterstica medible que se estudia a las observaciones. Ej.: - edad - comuna de residencia - nmero de alumnos por carrera - nivel socioeconmico Las variables se clasifican segn si son numricas o no lo son.

Variables cuantitativas: son caractersticas con respuesta numrica. Se subdividen en

- discretas: si la respuesta es un valor entero. Ej. Nde alumnos por curso - continuas: si la respuesta es un valor real. Ej. Estaturas medidas en cm. Ej. Concentracin de nitrito en el agua, en mg/l. Variables cualitativas: son caractersticas con respuesta no numricas. Se subdividen en - nominales: si la respuesta es una caracterstica cuyas categoras no tienen jerarqua. Ej. Enfermedades del Auge - ordinales: si la caracterstica es tiene una jerarqua natural. Ej. Clasificar la satisfaccin de un servicio desde muy malo hasta muy bueno. Clase 2 Todo conjunto de datos tiene al menos dos caractersticas principales: Centro y dispersin Los grficos de barra, histogramas, de puntos, entre otros, nos dan cierta idea sobre ellos. Observe el siguiente grfico Claramente, tienen distinto centro y las barras blancas muestran datos con menor dispersin que los datos de las barras oscuras.

Estadsticos: Los estadsticos son resmenes de los datos muestrales. Describen una distribucin segn cmo se comporta el centro, su dispersin y su forma. Se pueden agrupar en: de tendencia central de posicin de dispersin, variabilidad de forma. Estadsticos de tendencia central: Se ubican al centro de la distribucin de los datos. Son tres: - media aritmtica (centro de gravedad de los datos) - moda (valor de la variable con mayor frecuencia) - mediana (valor central en el 50%)

Relacin entre media, moda y mediana: Si media=moda=mediana distribucin simtrica perfecta Si media > mediana distribucin asimtrica con cola a la derecha Si media < mediana distribucin asimtrica con cola a la izquierda La media es un estadstico sensible a valores extremos. Basta que algn dato dentro de la muestra sea muy alto o muy bajo, el promedio se ver alterado. La mediana, en cambio, es un estadstico robusto. Aunque los extremos de los datos se vean alterados, la mediana permanece invariable. Estadsticos de posicin: Son valores de la variable que dividen a la muestra en partes de igual porcentaje. Los percentiles separan la muestra en grupos de 1% cada uno (son 99) Cuartiles: agrupan 25% c/u (son 3) Quintiles: agrupan 20% c/u (son 4) Deciles: agrupan 10% c/u (son 9) - En datos sin tabular: Ordenar de menor a mayor los n datos Obtener A = n x k /100 1. Si A es entero, entonces el percentil k corresponde al valor medio de las observaciones ubicadas en las posiciones A y A+1. 2. Si A no es un entero, el percentil k corresponde a la observacin ubicada en la posicin entera siguiente, es decir, [A+1] Ejemplo Determine los percentiles 25 y 60 de los siguientes datos: 3, 5, 5, 8, 12, 15, 21, 23, 25, 26, 29, 35 P25 A= 12 x 25 /100 = 3 resulta un entero, por tanto el P25 corresponde al promedio de las observaciones en las posiciones 3y 4, es decir, P25= (5+8)/2 = 6,5 P60 A = 12 x 60 / 100 = 7,2. Dado que no es un entero, nos movemos al entero siguiente. Es decir, P60 = 23 (observacin en la 8posicin) - En datos tabulados:

j es el porcentaje hasta donde se desea acumular.

Un grfico asociado a los cuartiles es el boxplot: en un eje se ubican los siguientes 5 nmeros extrados de una muestra: mnimo, cuartil 1, cuartil 2, cuartil 3 y mximo.

Una regla para determinar si un dato es anmalo es: Si un dato es < Q1 - 1,5(Q3-Q1) Si un dato es > Q3 + 1,5(Q3-Q1)

Vous aimerez peut-être aussi