Vous êtes sur la page 1sur 8

ESTADÍSTICA JJE.

CEPA Caligrama
Ámbito Científico-Tecnológico

ESTADÍSTICA
Estadística: ciencia que se ocupa de la recogida de datos, su organización y análisis, así como
de las predicciones que, a partir de estos datos, pueden hacerse.
Distinguimos dos tipos de Estadística:
❖ Estadística descriptiva: se ocupa de tomar los datos de un conjunto, organizarlos en tablas o
gráficos y calcular unos números que nos resumen el conjunto estudiado.
❖ Estadística inferencial: se ocupa de elaborar conclusiones para la población, partiendo de los
resultados de una muestra y del grado de fiabilidad de estas conclusiones.
Algunas definiciones necesarias:
• Población: conjunto de todos los elementos a estudiar.
• Individuo: cada elemento de la población.
• Muestra: subconjunto de la población.
• Tamaño de la muestra: número de individuos que componen la muestra.
• Variables o caracteres estadísticos: propiedades de los elementos de una población.
▪ Variables cualitativas: las que no se pueden medir.
▪ Variables cuantitativas: las que se pueden medir.
o Variables cuantitativas discretas: sólo pueden tomar un número finito de valores.
o Variables cuantitativas continuas: pueden tomar cualquier valor en un intervalo.

TABLA DE FRECUENCIAS
TABLA DE FRECUENCIAS DE VARIABLE DISCRETA
Los siguientes datos corresponden al número de hermanos en una clase de 20 alumnos:
3, 1, 1, 2, 3, 4, 3, 2, 5, 2, 2, 3, 4, 2, 1, 4, 2, 3, 1, 2
xi fi Fi hi Hi pi Pi
1 4 4 4/200,20 4/200,20 20% 20%
2 7 11 7/200,35 11/200,55 35% 55%
3 5 16 5/200,25 16/200,80 25% 80%
4 3 19 3/200,15 19/200,95 15% 95%
5 1 20 1/200,05 20/201 5% 100%
N  20

Con estos datos se crea la siguiente tabla:


• N: número total de datos
• xi : distintos valores de la variable o carácter estadístico objeto de estudio
• fi : frecuencia absoluta (nº de veces que se repite cada valor)
• Fi : frecuencia absoluta acumulada
fi
• hi : frecuencia relativa hi 
N
Fi
• Hi : frecuencia relativa acumulada H i 
N
• pi : porcentaje (frecuencia relativa en porcentaje)
• Pi : porcentaje acumulado

TABLA DE FRECUENCIAS DE VARIABLE CONTINUA


Cuando la variable es continua (puede tomar cualquier valor), los datos se agrupan en intervalos
(a ser posible de la misma amplitud).
Veamos un ejemplo con estos datos:
38 32 54 47 50 58 46 61 43 54 47 55 60 43 60 45 48 52 40 30 40 53 59 48 39 48 56 34 44 62
52 48 55 60 53 43 52 48 51 52 46 55 56 54 48 39 50 51 52 39

Los agrupamos en intervalos de amplitud 10


Intervalo xi fi Fi hi Hi pi Pi
[30,40) 35 7 7 7/50=0,14 7/50=0,14 14% 14%
[40,50) 45 17 24 17/50=0,34 24/50=0,48 34% 48%
[50,60) 55 21 45 21/50=0,42 45/50=0,90 42% 90%
[60,70) 65 5 50 5/50=0,10 50/50=1 10% 100%
N = 50

En este caso las xi (marcas de clase) son los puntos medios de cada intervalo
GRÁFICOS ESTADÍSTICOS
DIAGRAMA DE BARRAS
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores
de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los
datos se representan mediante barras de una altura proporcional a la frecuencia.

Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha
dado el siguiente resultado:
Grupo Sanguineo
Grupo
Alumnos
Sanguíneo
10
xi fi 9
8
A 6 7
6
B 4 5
4
3
AB 1
2
1
O 9 0
A B AB O
20

POLÍGONO DE FRECUENCIAS
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. También
se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante
segmentos.
Página 2 de 8
ESTADÍSTICA JJE. CEPA Caligrama
Ámbito Científico-Tecnológico
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Hora Temperatura 16

6 7º 14

12
9 12º
10
12 14º
8
15 11º 6

18 12º 4

2
21 10º
0
24 8º 6 9 12 15 18 21 24

DIAGRAMA DE SECTORES
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para
las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector
360º
es proporcional a la frecuencia absoluta correspondiente.   fi
N
El diagrama circular se construye con la ayuda de un transportador de ángulos.
Ejemplo
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el
resto no practica ningún deporte.
360º 360º
1   12  144º 2   3  36º
30 30

360º 360º
3   9  108º 4   6  72º
30 30

Alumnos Ángulo

Baloncesto 12 124º

Natación 3 36º

Fútbol 9 108º

Sin deporte 6 72º

Total 30 360º

HISTOGRAMA
Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para
variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado
en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es
proporcional a la frecuencia de los valores representados.

Página 3 de 8
POLÍGONO DE FRECUENCIAS
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de
cada rectángulo.
Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:

ci fi Fi 18

[50,60) 55 8 8 16

14
[60,70) 65 10 18
12
[70,80) 75 16 34
10
[80,90) 85 14 48
8
[90,100) 95 10 58 6

[100,110) 105 5 63 4

[110,120) 115 2 65 2

0
65
[50,60) [60,70) [70,80) [80,90) [90,100) [100,110) [110,120)

Histograma y polígono de frecuencias acumuladas


Si se representan las frecuencias acumuladas de
una tabla de datos agrupados se obtiene el
histograma de frecuencias acumuladas o su
correspondiente polígono.

PIRÁMIDE DE POBLACIÓN
Consiste en dos histogramas, uno para hombres
y otro para mujeres, repartidos por edades.
Son muy útiles para estudiar la situación
demográfica y buscar explicación a hechos
presentes y futuros.

CARTOGRAMA
Se trata de un mapa en el que se representa con
diferentes colores o texturas los datos que se
pretenden poner de manifiesto.

Página 4 de 8
ESTADÍSTICA JJE. CEPA Caligrama
Ámbito Científico-Tecnológico

Parámetros estadísticos
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución
estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por
una gráfica.
TIPOS DE PARÁMETROS ESTADÍSTICOS
Hay tres tipos parámetros estadísticos:
 De centralización.
 De posición.
 De dispersión.
MEDIDAS DE CENTRALIZACIÓN
Nos indican en torno a qué valor (centro) se distribuyen los datos. Las medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es
decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una distribución.
MEDIDAS DE POSICIÓN
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
Las medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles
Los percentiles dividen la serie de datos en cien partes iguales.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la
media.
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
PARÁMETROS DE CENTRALIZACIÓN
Media aritmética (o simplemente media) es el cociente entre la suma de todos los valores y el
número total de éstos. Se representa por x

• Cálculo de la media para valores simples x 


x i

Página 5 de 8
Ejemplo:
3  4  5  6 7
Datos: 3, 4, 5, 6, 7 x  25
5

• Cálculo de la media para valores con frecuencias x


x f
i i

N
Ejemplo. Con los datos de la tabla adjunta:
xi fi
3 2
3  2  4  3  5  5  6  7  7  2  8 1
4 3 x  5,35
5 5 20
6 7
7 2 Por tanto, x  5,35
8 1
N = 20

• Cálculo de la media para valores agrupados en intervalos x 


x f i i

N
Ejemplo:

Intervalo xi fi
5 1  15  2  25  5  35  4  45  3
[ 0,10) 5 1 x  29
[10,20) 12 2
15
[20,30) 25 5 Por tanto, x  29
[30,40) 35 4
[40,50) 45 3
N = 15

Moda es el valor que más se repite. Se representa por Mo. La moda no es única (puede haber
varias modas)
• Cálculo de la moda para valores simples
Ejemplo 1:
Datos: 3, 4, 5, 5, 6, 7 Mo  5
Ejemplo 2:
Datos: 3, 4, 4, 5, 5, 6, 7 Mo  4 y Mo  5
• Cálculo de la moda para valores con frecuencias
La moda es el valor (xi) con mayor frecuencia (fi)
xi fi
3 2 Ejemplo. Con los datos de la tabla adjunta:
4 3
5 5 El mayor fi es 7 que corresponde al valor xi  6
6 7 Por tanto, Mo6
7 2
8 1
N20
Intervalo xi fi
[ 0, 10) 5 1
• Para valores agrupados en intervalos [10, 20) 15 2
Buscamos la clase modal (intervalo con mayor frecuencia) Ejemplo: [20, 30) 25 5
[30, 40) 35 4
Intervalo modal: [20, 30) [40, 50) 45 3
N15
Página 6 de 8
ESTADÍSTICA JJE. CEPA Caligrama
Ámbito Científico-Tecnológico
La mediana es el valor que, una vez ordenados los datos, deja a su izquierda el mismo número
de datos de los que deja a su derecha. Se representa por Me.
Cálculo de la mediana para valores simples
En primer lugar, se ordenan los datos.
• Si el número de datos es impar, la mediana es el valor central
• Si el número de datos es par, la mediana es la media de los dos datos centrales
Ejemplo 1
Datos: 5, 4, 9, 1,3. Los ordenamos: 1, 3, 4, 5, 9. Entonces Me  4
Ejemplo 2
4 6
Datos ya ordenados: 1, 3, 4, 6, 9, 11. Entonces Me  5
2
Cálculo de la mediana para valores con frecuencias
1) Necesitamos la columna de las frecuencias absolutas acumuladas (Fi)
N
2) Buscamos el primer valor, xi tal que Fi  , una vez localizado, distinguimos dos casos (lo supera
2
o lo iguala):
N
• Si Fi   Me  xi
2
N x  xi 1
• Si Fi   Me  i
2 2
Ejemplo 1
N 25
xi fi Fi   12,5
5 5 5 2 2
6 7 12 El primer Fi  12,5 es Fi  20
7 8 20
8 5 25
Como 20 > 12,5 entonces Me  xi  7
N25 Por tanto, Me  7

Ejemplo 2
N 22
xi fi Fi   11
5 5 5 2 2
6 6 11 El primer Fi  11 es Fi  11
7 7 18 6 7
8 4 22 Como 11  11 entonces Me   6,5
N22 2
Por tanto, Me  6,5
Cálculo del intervalo mediano para valores agrupados en intervalos
1) Necesitamos la columna de frecuencias absolutas acumuladas (Fi)
N Intervalo xi fi Fi
2) Buscamos el primer intervalo tal que Fi  [ 0, 10) 5 1 1
2
[10, 20) 15 2 3
(Intervalo mediano) [20, 30) 25 5 8
[30, 40) 35 4 12
Ejemplo: [40, 50) 45 3 15
Intervalo mediano: [20,30) N15

Página 7 de 8
PARÁMETROS DE POSICIÓN
Los cuartiles, deciles, percentiles, ... son una generalización de la mediana
Los cuartiles dividen los datos en cuatro partes iguales:
• Hasta el primer cuartil (Q1) está el 25% de los datos
• El segundo cuartil (Q2) coincide con la mediana (Q2  Me)
• Hasta el tercer cuartil (Q3) está el 75% de los datos
Los deciles (D1, D2, ..., D9) dividen los datos en 10 partes iguales
Los percentiles (P1, P2, ..., P99) dividen los datos en 100 partes iguales
Para calcular cuartiles, deciles, percentiles, ... usamos las mismas fórmulas que para la mediana,
N
cambiando por la fracción correspondiente:
2
N
• Para el primer cuartil (Q1) usaríamos
4
3N
• Para el tercer cuartil (Q3) usaríamos
4
7N
• Para el decil D7 usaremos
10
42N
• Para el percentil P42 usaremos
100
PARÁMETROS DE DISPERSIÓN
Llamamos Rango o Recorrido (y lo expresamos por R) a la diferencia entre el mayor y el menor
de los datos.
Ejemplo:
Datos: 8, 7, 5, 9, 3, 5, 4, 6 R936
La varianza es la media aritmética de los cuadrados de las desviaciones de todos los datos
respecto a la media. Se representa por s2

Para calcular la varianza usaremos la fórmula: s 2



x 2
i  fi
 x2
N
  xi  x   fi
2

También se puede usar la siguiente fórmula: s 


2

La desviación típica es la raíz cuadrada de la varianza: s  x 2


i  fi
 x2
N

Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
s
C.V. 
x
s
El coeficiente de variación se suele expresar en porcentajes: C.V.   100
x
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre
que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se
obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

Página 8 de 8

Vous aimerez peut-être aussi