Vous êtes sur la page 1sur 9

15/08/2018

DESCRIPTIVA
MEDIA
Definimos media (también llamada promedio o media aritmética) de un conjunto de datos
(X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma de todas las
observaciones dividido por el número total de datos.

Es decir:

Visto desde un punto de vista más conceptual, la media aritmética es el centro de los datos en
el sentido numérico, ya que intenta equilibrarlos por exceso y por defecto. Es decir, si sumamos
todas las diferencias de los datos a la media da cero.

MEDIANA
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN) que deja
a izquierda y derecha la mitad de valores.

Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el 50% de
los elementos son menores o iguales y el otro 50% mayores o iguales.
MODA
La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor
cuya frecuencia relativa es mayor. En un conjunto puede haber más de una moda.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

MEDIA GEOMÉTRICA
La media geométrica (MG) de un conjunto de números estrictamente positivos (X1, X2,…,XN)
es la raíz N-ésima del producto de los N elementos.

Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese
cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del
cero.

MEDIA ARMÓNICA
La media armónica (H) de un conjunto de elementos no nulos (X1, X2,…,XN) es el recíproco de
la suma de los recíprocos (donde 1/Xi es el recíproco de Xi)) multiplicado por el número de
elementos del conjunto (N).

MEDIA CUADRÁTICA
La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X1, X2,…,XN) es
una medida de posición central. Esta se define como la raíz cuadrada del promedio de los
elementos al cuadrado.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

MEDIA PONDERADA
La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada
observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento.

Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
RELACIÓN ENTRE MEDIAS
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la media
ponderada porque depende de los pesos. Sean:
 H la media armónica
 MG la media geométrica
 x la media aritmética
 RMS la media cuadrática
Entonces:

En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales, es decir
si: x1 = x2 = x3 = … = xN.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

MEDIDAS DE POSICIÓN NO CENTRAL


Las medidas de posición no central (o medidas de tendencia no central) permiten
conocer puntos característicos de una serie de valores, que no necesariamente tienen que ser
centrales. La intención de estas medidas es dividir el conjunto de observaciones en grupos con
el mismo número de valores.
CUARTILES
Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro porciones
iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El segundo (Q2) deja a
izquierda y derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la derecha el 25%
de valores. Los tres cuartiles son:

PERCENTILES
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que
dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el mismo
número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:

Donde Pi es la posición del percentil buscado en la serie ordenada de datos.


Los percentiles están pensados para conjuntos de elementos de más de cien elementos.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión o medidas de variabilidad muestran la variabilidad de un conjunto
de datos, indicando la mayor o menor concentración de datos respecto a las medias de
centralización.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

RANGO
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de un
conjunto de elementos.

RANGO INTERCUARTÍLICO
El rango intercuartílico (IQR) (o rango intercuartil) es una estimación estadística de la dispersión
de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico
es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya
que este estadístico es insensible a posibles irregularidades en los extremos).

VARIANZA
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.

Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto a
la media no se anulan entre sí. Además, resaltan los valores alejados.
DESVIACIÓN TÍPICA
La desviación típica es la medida de dispersión (S) asociada a la media. Mide el promedio de
las desviaciones de los datos respecto a la media en las mismas unidades de los datos.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

El cuadrado de la desviación típica es la varianza.

COEFICIENTE DE VARIACIÓN DE PEARSON


El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la media,
sin tener en cuenta las unidades en la que están.

El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa


que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden
a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto
por cien.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

INFERENCIAL
Un estimador puntual de un parámetro θ es una predicción de θ que puede considerarse
representativo. El estimador es una función de la muestra.
Ejemplos:
1. Seleccionamos aleatoriamente una muestra de 500 personas de una ciudad y las medimos.
Queremos predecir cuál es la media de la altura de la población de la ciudad sabiendo que
la altura sigue una distribución normal.
2. Ver si una moneda está equilibrada y la lanzamos al aire 100 veces. Queremos estimar que
la probabilidad de que salga cara es 0,5, sabiendo que sigue una distribución Bernouilli de
parámetro p (Be(p)).
Los métodos de estimación puntual son:

Método de momentos
Tenemos una variable aleatoria X. Tenemos dos casos: que la variable siga una distribución
puntual (pX(x)) o que siga una distribución continua (fX(x)).
Definimos los momentos de orden k como:

Y definimos los momentos muestrales de orden k como:

El método de los momentos consiste en igualar los momentos poblacionales con los
momentos muestrales, para hacer un sistema de k ecuaciones con k incógnitas, siendo k el
número de parámetros que se quiere estimar.
Método de máxima verosimilitud
Sea (X1,…,Xn) una muestra aleatoria con una función de distribución f(x|θ).
Definimos la función de verosimilitud como:

El estimador puntual de θ en el método de máxima verosimilitud es el valor que maximiza la


función de verosimilitud. Este valor se llama estimador de máxima verosimilitud (EMV(θ)).

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

Normalmente calcularemos el máximo del logaritmo de la función de verosimilitud puesto que


los máximos coinciden y este resultará más fácil. Sea:

Por lo que el estimador de máxima verosimilitud viene definido como:

Un intervalo de confianza es un rango de valores en los cuales se estima que estará el valore
verdadero de un parámetro.
Tengamos X=(X1,…,Xn) una muestra aleatoria, sea θ un parámetro desconocido y 0<α<1.
Entonces S(X)=(θ(1) (X),θ(n)(X)) es un intervalo de confianza con nivel de confianza 100(1-α)%
si

En otras palabras, en el 1-α% de veces que hiciésemos el intervalos de confianza, éste


contendría el verdadero valor. Por lo general se trabaja en intervalos de confianza del 95% o
incluso del 99%.
La inferencia puntual depende directamente de la muestra escogida. Podría variar en el caso
de que escogiésemos otra muestra, dando la sensación de que la estimación no es correcta.
Por lo tanto, es preferible perder precisión en la estimación pero ganar en confianza de
predicción del estimador. Es preferible dar un intervalo de valores en el que tengamos
confianza en que el valor del parámetro está dentro.

Método del pivote

El método del pivote para estimar intervalos de confianza es uno de los principales.
Consiste en identificar una función pivote p(T,θ) la distribución de la cual es independiente
de θ y conocida. El pivote es función de θ y de una estimación puntual del parámetro.
Después elegimos un nivel de confianza 1-α y buscamos el intervalo de confianza [a,b]
tal que a y be cumplen que:

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA
15/08/2018

Tendremos que manipular y resolver esta desigualdad para encontrar los valores a y b.

Podemos ver los intervalos de confianza calculados mediante el método de los momentos
en varios ejemplos de intervalo de confianza.

Karla Alejandra Rodríguez Flores


BIOESTADÍSTICA

Vous aimerez peut-être aussi