Académique Documents
Professionnel Documents
Culture Documents
Entre ellas figuran: las medias, la mediana, la moda y los cuartiles (que también están incluidas
en las medidas de síntesis).
Estas medidas cumplen dos requisitos mínimos: como son el estar comprendidas entre los valores
extremos de la variable y el no tener que coincidir siempre ambas, aplicándose según el caso.
El que una medida sea robusta desde el punto de la estadística descriptiva, es algo relativo por
ejemplo la medina es más robusta que la media, pero ambas son robustas.
Se dice que una medida es robusta cuando la inclusión de valores atípicos en su cálculo no
supone un cambio fuerte en su valor. Son muy robustas: la mediana, la moda y los cuartiles (no la
media aritmética, que es sensible aunque robusta si la comparamos con otros estadísticos).
Los procedimientos estadísticos robustos permiten efectuar inferencias válidas cuando hay
desviaciones a la normalidad y son al mismo tiempo, altamente eficientes bajo datos no
normales (forman parte de la parte básica de la estadística que podemos denominar no
paramétrica). O cuando la muestra que se dispone es reducida (como ocurre en ciertos casos
en psicología).
Estadísticos robustos: Son aquellos que no se ven influidos (o solo ligeramente) por pequeños
cambios en los datos (insistimos).
Evidentemente, la media es un estadístico muy poco resistente a cambios en los datos (es
sensible), dado que se ve influida por todos y cada uno de ellos.
1- La media recortada
Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos,
no considerándose una determinada proporción p por cada extremo. (p se expresa
normalmente como porcentaje).
Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en
cuenta ni los 4 valores menores ni los 4 valores mayores.
2- Media Winsorizada
Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son
sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media
winsorizada.
Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2
menores:
3, 4, 4, 5, 5, 6, 7, 8, 9, 11
3- La trimedia
Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son
sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media
winsorizada.
Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2
menores:
3, 4, 4, 5, 5, 6, 7, 8, 9, 11
Pero en realidad el mejor estimador desde el punto de la robustez es la mediana (salvo raras
excepciones)
Cuando manejamos muestras diversas nos interesa un promedio que no varié excesivamente de
una a otra, este requisito de estabilidad lo posee la media .
La mediana: es el valor de la variable que deja a un lado y al otro el mismo número de variables
si están ordenadas creciente o decreciente (es decir el 50% en cada grupo).
Posee el inconveniente de no manejar toda la información. En cambio tiene la ventaja de que los
valores observados anormalmente grandes o pequeños no influyen.
Es un promedio muy interesante cuando existe una clara y decidida tendencia a concentrarse
alrededor de un sólo valor.
Finalmente si tiene forma de "U" los tres promedios tienen poca fuerza.
En consecuencia, el tipo de distribución nos dará el promedio más adecuado, y en caso de duda,
debe seguirse la regla: emplear la media aritmética.
En una distribución normal, la media, moda y mediana tienen un valor idéntico (Figura 15).
Esto en realidad es evidente, dado que una distribución normal es perfectamente simétrica, y
Una distribución bimodal tiene dos puntos máximos (Figura 15). Esto hace que la media y la
mediana no sean de utilidad, puesto que sus valores estarán en algún lugar entre los dos
puntos máximos y distorsionarán enormemente la descripción de la distribución. La moda, y
observe que en este caso hay dos modas, pasa a ser la única medida útil de tendencia central.
Sin embargo, una distribución bimodal es poco común y en general podemos decir que consta
de dos distribuciones que se pueden analizar en forma independiente.