Académique Documents
Professionnel Documents
Culture Documents
DESCRIPTIVA
MEDIA
Definimos media (también llamada promedio o media aritmética) de un conjunto de datos
(X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma de todas las
observaciones dividido por el número total de datos.
Es decir:
Visto desde un punto de vista más conceptual, la media aritmética es el centro de los datos en
el sentido numérico, ya que intenta equilibrarlos por exceso y por defecto. Es decir, si sumamos
todas las diferencias de los datos a la media da cero.
MEDIANA
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN) que deja
a izquierda y derecha la mitad de valores.
Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el 50% de
los elementos son menores o iguales y el otro 50% mayores o iguales.
MODA
La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor
cuya frecuencia relativa es mayor. En un conjunto puede haber más de una moda.
MEDIA GEOMÉTRICA
La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN)
es la raíz N-ésima del producto de los N elementos.
Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese
cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del
cero.
MEDIA ARMÓNICA
La media armónica (H) de un conjunto de elementos no nulos (X1, X2,…,XN) es el recíproco de
la suma de los recíprocos (donde 1/Xi es el recíproco de Xi)) multiplicado por el número de
elementos del conjunto (N).
MEDIA CUADRÁTICA
La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X1, X2,…,XN) es
una medida de posición central. Esta se define como la raíz cuadrada del promedio de los
elementos al cuadrado.
MEDIA PONDERADA
La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada
observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento.
Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
RELACIÓN ENTRE MEDIAS
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la media
ponderada porque depende de los pesos. Sean:
H la media armónica
MG la media geométrica
x la media aritmética
RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales, es decir
si: x1 = x2 = x3 = … = xN.
PERCENTILES
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que
dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo
número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:
RANGO
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de un
conjunto de elementos.
RANGO INTERCUARTÍLICO
El rango intercuartílico (IQR) (o rango intercuartil) es una estimación estadística de la dispersión
de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico
es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya
que este estadístico es insensible a posibles irregularidades en los extremos).
VARIANZA
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a
la media no se anulan entre sí. Además, resaltan los valores alejados.
DESVIACIÓN TÍPICA
La desviación típica es la medida de dispersión (S) asociada a la media. Mide el promedio de
las desviaciones de los datos respecto a la media en las mismas unidades de los datos.
INFERENCIAL
Un estimador puntual de un parámetro θ es una predicción de θ que puede considerarse
representativo. El estimador es una función de la muestra.
Ejemplos:
1. Seleccionamos aleatoriamente una muestra de 500 personas de una ciudad y las medimos.
Queremos predecir cuál es la media de la altura de la población de la ciudad sabiendo que
la altura sigue una distribución normal.
2. Ver si una moneda está equilibrada y la lanzamos al aire 100 veces. Queremos estimar que
la probabilidad de que salga cara es 0,5, sabiendo que sigue una distribución Bernouilli de
parámetro p (Be(p)).
Los métodos de estimación puntual son:
Método de momentos
Tenemos una variable aleatoria X. Tenemos dos casos: que la variable siga una distribución
puntual (pX(x)) o que siga una distribución continua (fX(x)).
Definimos los momentos de orden k como:
El método de los momentos consiste en igualar los momentos poblacionales con los
momentos muestrales, para hacer un sistema de k ecuaciones con k incógnitas, siendo k el
número de parámetros que se quiere estimar.
Método de máxima verosimilitud
Sea (X1,…,Xn) una muestra aleatoria con una función de distribución f(x|θ).
Definimos la función de verosimilitud como:
Un intervalo de confianza es un rango de valores en los cuales se estima que estará el valore
verdadero de un parámetro.
Tengamos X=(X1,…,Xn) una muestra aleatoria, sea θ un parámetro desconocido y 0<α<1.
Entonces S(X)=(θ(1) (X),θ(n)(X)) es un intervalo de confianza con nivel de confianza 100(1-α)%
si
El método del pivote para estimar intervalos de confianza es uno de los principales.
Consiste en identificar una función pivote p(T,θ) la distribución de la cual es independiente
de θ y conocida. El pivote es función de θ y de una estimación puntual del parámetro.
Después elegimos un nivel de confianza 1-α y buscamos el intervalo de confianza [a,b]
tal que a y be cumplen que:
Tendremos que manipular y resolver esta desigualdad para encontrar los valores a y b.
Podemos ver los intervalos de confianza calculados mediante el método de los momentos
en varios ejemplos de intervalo de confianza.