Vous êtes sur la page 1sur 7

ESTADISTICA DESCRIPTIVA

Se define
como aquellos mtodos que incluyen la recoleccin,
presentacin y caracterizacin de un conjunto de datos con el fin de describir
apropiadamente las diversas caractersticas de ese conjunto. Se pueden
encontrar dos tipos de estudios estadsticos descriptivos.
Los estudios enumerativos involucran la toma de decisiones respecto a una
poblacin y/o sus caractersticas.
Los estudios analticos involucran realizar alguna actividad sobre un
proceso para mejorar el desempeo en el futuro. La atencin de un estudio
analtico est puesta sobre la prediccin del comportamiento futuro de un
proceso y sobre la comprensin y perfeccionamiento de ese proceso. En un
estudio analtico no existe un universo identificable, como sucede en un estudio
enumerativo y en consecuencia tampoco hay un marco.
Tambin la estadstica descriptiva es la rama de las Matemticas que
recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de
una poblacin, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) con el fin de describir apropiadamente las diversas
caractersticas de ese conjunto.
Al conjunto de los distintos valores numricos que adopta un carcter
cuantitativo se llama variable estadstica.
Las variables pueden ser de dos tipos:
Variables cualitativas o categricas: no se pueden medir numricamente (por
ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto,
ingresos anuales).
Las variables tambin se pueden clasificar en:
Variables unidimensionales: slo recogen informacin sobre una caracterstica
(por ejemplo: edad de los alumnos de una clase)
Variables bidimensionales: recogen informacin sobre dos caractersticas de
la poblacin (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informacin sobre tres o ms
caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de diferentes observaciones, con frecuencia es
conveniente resumir la informacin con un solo nmero. Este nmero que, para
tal fin, suele situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin.
Cuando se hace referencia nicamente a la posicin de estos parmetros
dentro de la distribucin, independientemente de que sta est ms o menos
centrada, se habla de estas medidas como medidas de posicin.
Entre las medidas de tendencia central tenemos:
Media aritmtica
Media ponderada
Media geomtrica

Media armnica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posicin o medidas de tendencia se
usan de acuerdo al tipo de variable que se est observando.
Media aritmtica
La media aritmtica es el valor obtenido por la suma de todos sus
valores dividida entre el nmero de sumadores. La media aritmtica es,
probablemente, uno de los parmetros estadsticos ms extendidos. Se le
llama tambin promedio o, simplemente, media.
Propiedades de la Media Aritmtica
Las principales propiedades de la media aritmtica son:
Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado
acompaarla de una medida de dispersin.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de
datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos
respecto de su propio valor
Es una medida a cuyo significado afecta sobremanera la dispersin, de modo
que cuanto menos homogneos sean los datos, menos informacin
proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin
pueden tener la misma media. 4 Por ejemplo, un equipo de baloncesto con cinco
jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media
de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin
embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15
m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede
comprobarse, una estatura media de 1,95 m, valor que no representa a casi
ninguno de sus componentes.
Media ponderada
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una
media ponderada.
Si
son nuestros datos y
son sus "pesos"
respectivos, la media ponderada se define de la siguiente forma:

Media muestral
Esencialmente, la media muestral es el mismo parmetro que el anterior,
aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la

media aritmtica se calcula para un subconjunto de la poblacin objeto de


estudio.
La media muestral es un parmetro de extrema importancia en la inferencia
estadstica, siendo de gran utilidad para la estimacin de la media poblacional,
entre otros usos.
Moda
La moda es el dato ms repetido de la encuesta, el valor de la variable con
mayor frecuencia absoluta.5 En cierto sentido la definicin matemtica
corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la
variable, se recurre a la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 57-4-6-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se encuentran tres o ms modas,
entonces es multimodal. Por ltimo, si todas las variables tienen la misma
frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la
moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor
frecuencia absoluta.
Sus principales propiedades son:
Clculo sencillo.
Interpretacin muy clara.
Al depender solo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una
poblacin no es posible realizar otros clculos, por ejemplo, cuando se
enumeran en medios periodsticos las caractersticas ms frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot". 6
Mediana
La mediana es un valor de la variable que deja por debajo de s a la mitad de
los datos, una vez que stos estn ordenados de menor a mayor. Por ejemplo,
la mediana del nmero de hijos de un conjunto de trece familias, cuyos
respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una
vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn


valor de la variable, por lo que se conviene en tomar como mediana el valor
intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce
datos como los siguientes:

Las principales propiedades de la mediana son:

Es menos sensible que la media a oscilaciones de los valores de la variable.


Un error de transcripcin en la serie del ejemplo anterior en, pongamos por
caso, el ltimo nmero, deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos,
incluso cuando alguno de ellos no est acotado.
No se ve afectada por la dispersin. De hecho, es ms representativa que la
media aritmtica cuando la poblacin es bastante heterognea. Suele darse
esta circunstancia cuando se resume la informacin sobre los salarios de un
pas o una empresa. Hay unos pocos salarios muy altos que elevan la media
aritmtica haciendo que pierda representatividad respecto al grueso de la
poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta
gente que gana ms dinero que l, como que gana menos.
MEDIDAS DE FORMA
Comparan la forma que tiene la representacin grfica, bien sea el histograma
o el diagrama de barras de la distribucin, con la distribucin normal.
Entre las medidas de forma de estadstica descriptiva se encuentran los
siguientes:
Asimetra:
Es una medida de forma de una distribucin que permite identificar y describir
la manera como los datos tiende a reunirse de acuerdo con la frecuencia con
que se hallen dentro de la distribucin. Permite identificar las caractersticas de
la distribucin de datos sin necesidad de generar el grfico. Diremos que una
distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Tipos de Asimetra:
La asimetra presenta las siguientes formas:
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la
minora de los datos est en la parte izquierda de la media. Este tipo de
distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribucin de los datos tiene a la izquierda una cola ms larga que a la
derecha. Tambin se dice que una distribucin es simtrica a la izquierda o
tiene sesgo negativo cuando el valor de la media aritmtica es menor que la
mediana y ste valor de la mediana a su vez es menor que la moda,
en smbolos
Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se
aparta de la simetra.
Simtrica.- Se da cuando en una distribucin se distribuyen aproximadamente
la misma cantidad de los datos a ambos lados de la media aritmtica. No tiene
alargamiento o sesgo. Se representa por una curva normal en forma de
campana llamada campana de Gauss (matemtico Alemn 1777-1855) o
tambin conocida como de Laplace (1749-1827).Tambin se dice que una

distribucin es simtrica cuando su media aritmtica, su mediana y su moda


son iguales, en smbolos Md=Mo
Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la
minora de los datos est en la parte derecha de la media aritmtica. Este tipo
de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribucin de los datos tiene a la derecha una cola ms larga que a la
izquierda.
Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmtica es mayor que la mediana y ste
a valor de la mediana a su vez es mayor que la moda, en
smbolos
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe
asimetra a la derecha y negativo cuando existe asimetra a la izquierda.

MEDIDAS DE DISPERSION
Las medidas de dispersin, tambin llamadas medidas de variabilidad,
muestran la variabilidad de una distribucin, indicando por medio de un nmero
si las diferentes puntuaciones de una variable estn muy alejadas de la media.
Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea,
ms homognea ser a la media. As se sabe si todos los casos son parecidos
o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se
adoptan dos clases de estrategias para salvar este problema. Una es tomando
las desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).
Desviacin Media:
La desviacin media es la divisin de la sumatoria del valor absoluto de las
distancias existentes entre cada dato y su media aritmtica y el nmero total de
datos
Varianza

La varianza es una medida estadstica que mide la dispersin de los valores


respecto a un valor central (media), es decir, es el cuadrado de las
desviaciones:

Propiedades
La varianza es siempre positiva o 0:
Si a los datos de la distribucin les sumamos una cantidad constante la
varianza no se modifica.

Si a los datos de la distribucin los multiplicamos por una constante, la varianza


queda multiplicada por el cuadrado de esa constante.

Propiedad distributiva:
, siempre y cuando las variables

sean

independientes
Desviacin tpica
La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadrticas. Para evitar ese problema se define otra medida de dispersin, que
es la desviacin tpica, o desviacin estndar, que se halla como la raz
cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su
valor, ms dispersos estarn los datos. Esta medida viene representada en la
mayora de los casos por S, dado que es su inicial de su nominacin en ingls.
Desviacin tpica muestral[editar]

Desviacin tpica poblacional[editar]

Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las
puntuaciones estn relacionadas entre s. La formulacin clsica se simboliza

por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se


obtiene sobre una muestra, se designa por la letra " ".
La frmula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos
variables si ambas utilizan una escala de medida a nivel de intervalo/razn
(variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones
diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su
forma insesgada).
Este estadstico refleja la relacin lineal que existe entre dos variables. El
resultado numrico flucta entre los rangos de +infinito a -infinito. Al no tener
unos lmites establecidos no puede determinarse el grado de relacin lineal que
existe entre las dos variables, solo es posible ver la tendencia.

Vous aimerez peut-être aussi