Académique Documents
Professionnel Documents
Culture Documents
Definición de estadística.
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para sus intereses
cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en función de unos fines económicos o
militares. El estado quiere conocer censo de personas, de infraestructura, de recursos en general, para poder
obtener conclusiones de esta información.
Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado. Podríamos decir que se
encuentra en la totalidad del resto de ciencias. La razón es clara: por una parte la estadística proporciona técnicas
precisas para obtener información, (recogida y descripción de datos) y por otra parte proporciona métodos para el
análisis de esta información.
De ahí el nombre de ESTADÍSTICA DESCRIPTIVA, ya que el objetivo será, a partir de una muestra de datos
(recogida según una técnica concreta), la descripción de las características más importantes, entendiendo como
características, aquellas cantidades que nos proporcionen información sobre el tema de interés del cual hacemos el
estudio.
La variable se denota por las mayúsculas de letras finales del alfabeto castellano. A su vez
cada una de estas variables puede tomar distintos valores , colocando un subíndice, que
indica orden:
Muestra: Conjunto de elementos que forman parte de población . La muestra representa a esta población.
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado.
Dicho de otra forma, cada valor observado de la variable.
Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por
uno, siendo su valor -iésimo
ni
fi
n
La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad .
Frecuencia absoluta acumulada: es la suma de los distintos valores de la frecuencia absoluta tomando como
referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos:
N1 = n1
N2 = n1+ n2
Nn = n1 + n2 + . . . . . . + nn-1 + nn=n
Frecuencia relativa acumulada, es el resultado de dividir cada frecuencia absoluta acumulada por el número
total de datos, se la suele representar con la notación: F i
De igual forma, también se puede definir a partir de la frecuencia relativa, como suma de los distintos valores de la
frecuencia relativa, tomando como referencia un individuo dado. La última frecuencia relativa acumulada es igual a
la unidad.
xi ni Ni fi Fi
x1 n1 N1 f1 F1
x2 n2 N2 f2 F2
x3 n3 N f3 1
ni=N 1
Para operar utilizaremos la marca de clase, el punto medio de un intervalo. Para calcularla podemos definirla como
la semisuma de los valores extremos del intervalo, esto es sumar los extremos, y dividir entre 2.
La amplitud del intervalo, sería la longitud del intervalo, se representa por: a = L i - L i-1
NOTA: ¿Cómo obtener, a partir de los datos, una tabla de frecuencias agrupada?
Nº de intervalos: A partir de la raíz cuadrada del número de datos, decidimos, redondeando el
número de intervalos.
Recorrido: Valor mayor, menos valor menor de los datos. Re= x n-x1
Amplitud: División entre el Recorrido y el número de intervalos que hayamos decidido. Se
Re
puede redondear también. a i
N º de int ervalos
NOTA: Si los intervalos no son de la misma amplitud hay que calcular la densidad de frecuencia del intervalo
-iésimo, como el cociente entre el número total de observaciones de un intervalo y la amplitud del mismo
n
di i
ai
Ejemplo 1
El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior.
Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Se pide:
Solución:
Por otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos ante un caso de media
aritmética ponderada, que puede definirse de la siguiente manera
Definición:
Sea dado un conjunto de observaciones, tales como X1, X2; X3; … ; Xn; y un conjunto de valores p1, p2; p3; … ; pn;
asociado con cada observación Xi respectivamente, que reciben el nombre de factores de ponderación, entonces la
media ponderada se calcula como:
Ejemplo:
En el curso de estadística del Prof. Cabrera la nota semestral se calcula como una media ponderada. Por cuanto
que el promedio de laboratorios representa el 30% de la nota semestral. El promedio de ejercicios parciales
representa el 30% y el examen semestral el restante 40%.
Si obtiene en este curso los siguientes promedios al final del semestre: laboratorios 90 pts. Parciales 75% pts. Y en
el examen semestral 70 pts.; el promedio semestral se calcula de la siguiente forma.:
La Moda:
La moda es el valor que aparece con mayor frecuencia en la serie de datos.
La Moda para datos agrupados (Mo.):
La Moda puede deducirse de una distribución de frecuencia o de un histograma a partir de la fórmula.
Mo. = Li + [ ( ∆1 / ∆1+∆2 ) ] C
Donde;
Li = límite inferior de la clase modal (clase de mayor frecuencia absoluta (fa)
∆1 = diferencia de las frecuencias absolutas de la clase modal y premodal.
∆2 = diferencia de las frecuencias absolutas de la clase modal y postmodal
C = amplitud de la clase modal.
Propiedades de la moda
- La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa).
- La moda tiene la ventaja de no ser afectada por valores extremos.
- Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
- En muchas series de datos no hay moda porque ningún valor aparece más de una vez.
- En algunas series de datos hay más de una moda.
Relación empírica entre la media, la mediana y la moda
En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor.
En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:
Media – Moda = 3(Media – Mediana
Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e
izquierda respectivamente, para curvas simétricas los tres valores coinciden
Como este sistema de cálculo resulta muy difícil de emplear, máxime cuando son números grandes o largas series
de datos, en la práctica se recurre a los logaritmos.
G = antilog (∑ log xi)/n
así la G del ejemplo se calcularía así : G = antilog (log 3+log4+log 9 +log12)/4
G = antilog (0.477 + 0.602 + 0.954 + 1.079)/4
G = antilog (3.11)/4; G = antilog 0.78 ; G = 6
Propiedades de la media geométrica (G)
- La media geométrica esta basada en todas las observaciones, por lo que está afectada por todos los valores de la
variable. Sin embargo, da menos pesos a los valores extremadamente grandes que el que les da la media
aritmética.
- La media geométrica es igual a cero si algunos de los valores es cero, y se puede volver imaginaria si ocurren
valores negativos. Con la excepción de estos dos casos, su valor siempre es definitivo y está rígidamente definido.
- La media geométrica es la que se debe utilizar cuando lo que se va a promediar son tasas de cambios o
proporciones, y se intenta dar igual peso a tasas de cambios iguales.