Académique Documents
Professionnel Documents
Culture Documents
Se define
como aquellos mtodos que incluyen la recoleccin,
presentacin y caracterizacin de un conjunto de datos con el fin de describir
apropiadamente las diversas caractersticas de ese conjunto. Se pueden
encontrar dos tipos de estudios estadsticos descriptivos.
Los estudios enumerativos involucran la toma de decisiones respecto a una
poblacin y/o sus caractersticas.
Los estudios analticos involucran realizar alguna actividad sobre un
proceso para mejorar el desempeo en el futuro. La atencin de un estudio
analtico est puesta sobre la prediccin del comportamiento futuro de un
proceso y sobre la comprensin y perfeccionamiento de ese proceso. En un
estudio analtico no existe un universo identificable, como sucede en un estudio
enumerativo y en consecuencia tampoco hay un marco.
Tambin la estadstica descriptiva es la rama de las Matemticas que
recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de
una poblacin, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) con el fin de describir apropiadamente las diversas
caractersticas de ese conjunto.
Al conjunto de los distintos valores numricos que adopta un carcter
cuantitativo se llama variable estadstica.
Las variables pueden ser de dos tipos:
Variables cualitativas o categricas: no se pueden medir numricamente (por
ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).
Las variables tambin se pueden clasificar en:
Variables unidimensionales: slo recogen informacin sobre una caracterstica
(por ejemplo: edad de los alumnos de una clase)
Variables bidimensionales: recogen informacin sobre dos caractersticas de
la poblacin (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informacin sobre tres o ms
caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de diferentes observaciones, con frecuencia es
conveniente resumir la informacin con un solo nmero. Este nmero que, para
tal fin, suele situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin.
Cuando se hace referencia nicamente a la posicin de estos parmetros
dentro de la distribucin, independientemente de que sta est ms o menos
centrada, se habla de estas medidas como medidas de posicin.
Entre las medidas de tendencia central tenemos:
Media aritmtica
Media ponderada
Media geomtrica
Media armnica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posicin o medidas de tendencia se
usan de acuerdo al tipo de variable que se est observando.
Media aritmtica
La media aritmtica es el valor obtenido por la suma de todos sus
valores dividida entre el nmero de sumadores. La media aritmtica es,
probablemente, uno de los parmetros estadsticos ms extendidos. Se le
llama tambin promedio o, simplemente, media.
Propiedades de la Media Aritmtica
Las principales propiedades de la media aritmtica son:
Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado
acompaarla de una medida de dispersin.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de
datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos
respecto de su propio valor
Es una medida a cuyo significado afecta sobremanera la dispersin, de modo
que cuanto menos homogneos sean los datos, menos informacin
proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin
pueden tener la misma media. 4 Por ejemplo, un equipo de baloncesto con cinco
jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media
de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin
embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15
m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede
comprobarse, una estatura media de 1,95 m, valor que no representa a casi
ninguno de sus componentes.
Media ponderada
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una
media ponderada.
Si
son nuestros datos y
son sus "pesos"
respectivos, la media ponderada se define de la siguiente forma:
Media muestral
Esencialmente, la media muestral es el mismo parmetro que el anterior,
aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la
MEDIDAS DE DISPERSION
Las medidas de dispersin, tambin llamadas medidas de variabilidad,
muestran la variabilidad de una distribucin, indicando por medio de un nmero
si las diferentes puntuaciones de una variable estn muy alejadas de la media.
Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea,
ms homognea ser a la media. As se sabe si todos los casos son parecidos
o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se
adoptan dos clases de estrategias para salvar este problema. Una es tomando
las desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).
Desviacin Media:
La desviacin media es la divisin de la sumatoria del valor absoluto de las
distancias existentes entre cada dato y su media aritmtica y el nmero total de
datos
Varianza
Propiedades
La varianza es siempre positiva o 0:
Si a los datos de la distribucin les sumamos una cantidad constante la
varianza no se modifica.
Propiedad distributiva:
, siempre y cuando las variables
sean
independientes
Desviacin tpica
La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadrticas. Para evitar ese problema se define otra medida de dispersin, que
es la desviacin tpica, o desviacin estndar, que se halla como la raz
cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su
valor, ms dispersos estarn los datos. Esta medida viene representada en la
mayora de los casos por S, dado que es su inicial de su nominacin en ingls.
Desviacin tpica muestral[editar]
Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las
puntuaciones estn relacionadas entre s. La formulacin clsica se simboliza
Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos
variables si ambas utilizan una escala de medida a nivel de intervalo/razn
(variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones
diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su
forma insesgada).
Este estadstico refleja la relacin lineal que existe entre dos variables. El
resultado numrico flucta entre los rangos de +infinito a -infinito. Al no tener
unos lmites establecidos no puede determinarse el grado de relacin lineal que
existe entre las dos variables, solo es posible ver la tendencia.