Vous êtes sur la page 1sur 87

ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 1
CONCEPTOS GENERALES
0. TERMINOLOGÍA

El término estadística se refiere a datos numéricos, tales como promedios,


medianas, porcentajes y números índices que ayudan a entender una gran variedad de
negocios y situaciones económicas. Sin embargo, como se verá, el campo de la
estadística es mucho más que datos numéricos. En un sentido amplio, la estadística se
define como el arte y la ciencia de reunir datos, analizarlos, presentarlos e
interpretarlos. Especialmente en los negocios y en la economía, la información
obtenida al reunir datos, analizarlos, presentarlos e interpretarlos proporciona a
directivos, administradores y personas que deben tomar decisiones una mejor
comprensión del negocio o entorno económico, permitiéndoles así tomar mejores
decisiones con base en mejor información

CONTADURÍA
Las empresas de contadores públicos al realizar auditorías para sus clientes
emplean procedimientos de muestreo estadístico. Por ejemplo, suponga que una
empresa de contadores desea determinar si las cantidades en cuentas por cobrar que
aparecen en la hoja de balance del cliente representan la verdadera cantidad en
cuentas por cobrar. Por lo general, el gran número de cuentas por cobrar hace que su
revisión tome demasiado tiempo y sea muy costosa. Lo que se hace en estos casos es
que el personal encargado de la auditoría selecciona un subconjunto de las cuentas al
que se le llama muestra. Después de revisar la exactitud de las cuentas tomadas en la
muestra (muestreadas) los auditores concluyen si la cantidad en cuentas por cobrar
que aparece en la hoja de balance del cliente es aceptable.

1.1. DEFINICIÓN DE ESTADÍSTICA


La estadística se ocupa del conjunto de técnicas que se emplean para recolectar,
organizar, analizar e interpretar datos, los cuales pueden ser cuantitativos, valores
expresados numéricamente, o cualitativos, característica tales como las preferencias
del consumidor organizados en una tabla. La estadística se usa en los negocios para
ayudar a tomar mejores decisiones mediante la comprensión de las fuentes de
variación y el descubrimiento de patrones y relaciones con los datos de negocios.

1
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

1.2. ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INDUCTIVA


Estadística Descriptiva o Deductiva: La estadística descriptiva comprende las
técnicas que se emplea para resumir y describir datos numéricos con objeto de
facilitar su interpretación. Estas técnicas pueden ser métodos gráficos o incluir
análisis computacional (por ejemplo, edad de una población, altura de los estudiantes
de una escuela, el volumen de venta mensual de un producto, y otros).

Estadística Inferencial o Inductiva: Se orienta a la solución del problema, de


lograr generalizaciones amplias o inferencias, tratando de obtener información sobre
una población estadísticos sólo con base en la observación de una muestra. Debido a
que estas decisiones se toman en condiciones de incertidumbre, se requiere emplear
los conceptos de probabilidad (por ejemplo, censo de personas desocupadas, el
promedio de calificaciones obtenidos por los estudiantes de estadísticas, y otros)

1.3. VARIABLES DISCRETA Y VARIABLE CONTINUA


Variable Discreta: Es aquella que puede tomar valores en puntos aislados de una
escala de valores. En la estadística de negocios datos de este tipo se generan mediante
un proceso de conteo; así, por lo general estos valores se expresan mediante números
enteros (por ejemplo, números de personas por familia, el número de unidades de un
artículo en un inventario, y otros).

Variable continua: es aquella que puede tomar valores en cualquier punto a lo


largo de un intervalo de valores determinados. Los datos continuos se generan
mediante un proceso de medición (por ejemplo: el peso promedio de un embarque, el
número promedio de personas por familia).

1.4. POBLACIÓN O UNIVERSO Y MUESTRA


Población o Universo: Conjunto completo de individuos, objetos o medidas que
poseen alguna característica común observable. (Por ejemplo, todos los estudiantes
inscritos en Contaduría Pública diurno y nocturno).

Población o Universo Estadístico: Conjunto de observaciones de una


determinada variable, sobre la cual queremos sacar conclusiones. El concepto de
población en estadística, nunca se refiere a individuos, sino a observaciones.
La población se representa con la letra (N).

2
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Muestra: Es un sub-conjunto de la población o universo. Una muestra puede estar


constituida por todos los elementos de la población menos uno, o por un sólo
elemento de la población. Una muestra puede pertenecer a más de una población (por
ejemplo, el número de estudiantes de Contaduría Pública inscrito en el régimen
nocturno)
La muestra se representa con la letra (n).

1.5. MUESTREO ESTADÍSTICO O ALEATORIO


Muestreo Aleatorio: Es un tipo de muestro en el que cada elemento de la
población que se estudia, o población objeto, tiene una posibilidad conocida, y
generalmente la misma de ser elegida para tomar parte de la muestra. El tener una
muestra de este tipo garantiza que los elementos de la muestra se elijan sin sesgo y
suministra la base estadística para la determinación de la confianza que puede
atribuirse a las inferencias. Una muestra aleatoria también se denomina muestra
probabilística o muestra científica

Muestra Aleatoria Simple: Al seleccionar una muestra simple al azar, las


observaciones son elegidas de tal modo que cualquier observación en la población
incluida en ella tenga tanta probabilidad como otra de ser elegida, y que cada elección
sea independiente de cualquier otra. Sólo cuando se cumplen estas condiciones es
lícito decir que la muestra ha sido elegida aleatoriamente

Muestra Sistemática: Es una muestra aleatoria en la cual los elementos de la


población se eligen de una lista o intervalos uniformes (por ejemplo, escoger para la
muestra cada décima de cuenta por cobrar). Las primeras de las 10 cuentas que se
incluirán en la muestra se escogen de manera aleatoria (empleando una tabla de
números aleatorios).

1.6. REDONDEO DE DATOS


Redondeo: Redondear un número quiere decir reducir el número de cifras
manteniendo un valor parecido. El resultado es menos exacto, pero más fácil de usar
Ejemplo para redondear a dos decimales:
1. Cuando el residuo que aparece después del último dígito que queremos conservar es
MAYOR QUE CINCO, se aumenta el dígito hasta el número superior-.
19,63𝟔 → 19,64 0,41𝟖 → 0,42
2. Cuando el residuo que aparece después del último dígito que queremos conservar es
MENOR QUE CINCO, el dígito permanece sin modificación
19,63𝟒 → 19,63 0,41𝟏 → 0,41

3
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

3. Cuando el residuo que aparece después del último dígito que queremos conservar es
CINCO, se dan dos alternativas:

a) Si ES CINCO MÁS UN RESIDUO, por mínimo que sea, se aumenta el dígito hasta el
número superior:
24,32𝟓001 → 24,33 1,73𝟓08 → 1, 734
b) Si ES CINCO SIN NINGUN RESIDUO, hay dos casos:
- Cuando el último dígito es par no sufre cambio.
12,745000 → 12,74 0,82500 → 0,82
- Cuando el último dígito es impar, se aumenta el número superior
12,715000 → 12,72 0,83500 → 0,84

4
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 1
1. Dados los siguientes tipos de valores, indique cuales son variables discretas y
variables continuas:
a) El peso del contenido de un paquete de cereal
b) El diámetro de una rueda
c) El número de artículos defectuosos producidos
d) El número de personas que reciben su pensión en un área geográfica.
e) El monto de las ventas de dólares
f) Relación entre activos presentes y pasivos presentes

2. Indique cuales de los siguientes términos u operaciones están relacionados con una
muestra o con muestreo, y cuales se refiere a una población
a) Medidas de grupo llamadas parámetros.
b) El uso de estadística inferencial.
c) La realización de un censo
d) Los estudiantes de un aula de clase de una Universidad
e) La inspección de cada uno de los artículos ensamblados
f) Universo

3. Se tiene una lista de 30 observaciones y queremos escoger una muestra aleatoria


de 10. Explique cómo se obtiene la muestra:
a) Mediante muestreo aleatorio simple
b) Mediante muestreo aleatorio sistemático

4. Suponga que desea tomar una muestra aleatoria de 10 cuentas por cobrar de una
población de 25 cuentas. Explique cómo se obtiene la muestra:
a) Mediante muestreo aleatorio simple
b) Mediante muestreo aleatorio sistemático

5. Redondear a dos decimales las siguientes cifras:


a) 439,6565 f) 437,005
b) 99,0942 g) 699,995
c) 100,4501 h) 0,054
d) 109,0940 i) 1.099,095
e) 78,8950 j) 27,694

5
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 2
PRESENTACIONES ESTADÍSTICAS
2.1. DISTRIBUCIÓNES DE FRECUENCIAS
Una distribución de frecuencia es una tabla en la cual los valores que puede tomar
una variable se agrupan en clases, y se registra la cantidad de valores observados de
clase. A los datos organizados en una distribución de frecuencia se les llama datos
agrupados. En cambio, en el caso de datos no agrupados se hace una lista con cada
uno de los valores observados de la variable aleatoria.

Datos no Agrupados: Una forma de tabular las puntuaciones o datos es ordenarlos


según su magnitud y colocar al lado el número de veces que se repite cada uno de
ellos, o sea, su frecuencia (f).

Ejemplo.
Dadas las siguientes puntuaciones:
15 – 22 – 17 – 30 – 22 – 27 – 18 – 20 – 14 – 24
34 – 28 – 21 – 05 – 10 – 09 – 12 – 23 – 16 – 31
Se ordenan en forma creciente, desde la puntuación menor, hasta la puntuación
mayor.

x f x f
05 1 21 1
09 1 22 2
10 1 23 1
12 1 24 1
14 1 27 1
15 1 28 1
16 1 30 1
17 1 31 1
18 1 34 1
20 1

6
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

2.2. TABLAS DE FRECUENCIAS DE INTERVALOS


DATOS AGRUPADOS:
Las razones por las cuales se agrupan los datos en intervalos de clase son las
siguientes:
a) Es Antieconómico y poco práctico tratar con un gran número de casos
distribuidos en muchos puntajes, a menos que se disponga de calculadoras
automáticas.
b) Algunos de los puntajes tienen asociada una frecuencia tan baja, que no se
justifica mantenerlos como entidades distintas y separadas.

Al agrupar los puntajes, sin embargo, se pierde parte de la información, por


ejemplo los puntajes individuales.

2.3. PASOS PARA LA ELABORACIÓN DE UNA DISTRIBUCIÓN DE


FRECUENCIA DE INTERVALOS DE CLASE, FÓRMULA DE STUGER

1. Determinar el rango: Es la distancia entre el mayor y el menor de los valores de los


datos. Es uno (1) más la diferencia entre la puntuación mayor y la puntuación menor.
𝑅 = 1 + (𝑃𝑀 − 𝑃𝑚 )
Ejemplos:
1 − 2 − 3 − 4 − 5 ; 𝑅 = 1 + (5 − 1) = 1 + 4 = 5
7 − 8 − 9 − 10 − 11 ; 𝑅 = 1 + (11 − 7) = 1 + 4 = 5
3 − 5 − 6 − 9 − 12 ; 𝑅 = 1 + (12 − 3) = 1 + 9 = 10

2. Determinar el intervalo de clases: Debe tener la misma amplitud en todas las


clases de la distribución. Se divide el rango por el número de clases que deseamos:
𝑅 𝑙𝑜𝑔𝑁
𝑖𝑐 = 𝑁° 𝑐𝑙𝑎𝑠𝑒𝑠 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = √𝑁 𝑁° 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 ≥ 𝑙𝑜𝑔2

Ejemplo:
Datos: R =30; N° Clases =?
Solución:
Cálculo del N° de clases
√𝑁 ⟹ √20 = 4,47 ≈ 5

Como, 𝑃𝑀 − 𝑃𝑚 = 34 − 5 = 29 y el múltiplo de 5 más cercano a 29 es 6,


tomaremos 6 como el número de clases de longitud 5

7
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Por lo tanto
30
𝑖𝑐 = =5
6
Si el intervalo de clases nos da un número decimal, redondeamos al número impar
más cercano, para que la mitad del intervalo (punto medio), sea un número entero
30
𝑖𝑐 = = 4,29 ≈ 5
7
Es siempre recomendable que el intervalo de clases sea un número impar
3. Determinar el límite de clases: Se toma el puntaje más bajo como el Límite
inferior (𝐿𝑖 ) del primer intervalo de clases, para obtener el Límite Superior (𝐿𝑠 ) al
Límite inferior se le suma el intervalo de clases menos 1 para obtener el primer
intervalo de clases.
𝐿𝑠 = 𝐿𝑖 + (𝑖𝑐 − 1)
Ejemplo:
Determinar el Límite superior si el puntaje más bajo es 5 y el intervalo de clase es
cinco.
Datos: 𝐿𝑆 =? 𝐿𝑖 = 5 𝑖𝑐 = 5
Solución
𝐿𝑠 = 5 + (5 − 1) = 5 + 4 = 9
Por lo tanto el primer intervalo será: 5 - 9, que abarca los puntajes 5 – 6 – 7 – 8 y 9
Después para determinar las demás clases, se le suma a cada límite (tanto inferior,
como superior) el intervalo de clases y así obtendremos la clase siguiente.
Primera Clase: 5 - 9 5 - 9
Segunda clase: 𝐿𝑖 + 𝑖𝑐 - 𝐿𝑆 + 𝑖𝑐 5+5 - 9 + 5 10 - 14
Tercera clase: 𝐿𝑖 + 𝑖𝑐 - 𝐿𝑆 + 𝑖𝑐 10 + 5 - 14 + 5 15 - 19
Cuarta clase: 𝐿𝑖 + 𝑖𝑐 - 𝐿𝑆 + 𝑖𝑐 15 + 5 - 19 + 5 20 - 24
Quinta clase: 𝐿𝑖 + 𝑖 𝑐 - 𝐿𝑆 + 𝑖𝑐 20 + 5 - 24 + 5 25 - 29
Sexta clase: 𝐿𝑖 + 𝑖 𝑐 - 𝐿𝑆 + 𝑖𝑐 25 + 5 - 29 + 5 30 - 34

4. Elaborar la tabulación de frecuencia:

CLASES TABULACIÓN f
5 ------ 9 2
10 ------ 14 3
15 ------ 19 4
20 ------ 24 6
25 ------ 29 2
30 ------ 34 3

8
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

2.4 ALGUNAS REGLAS ARBITRARIAS SOBRE EL INTERVALO DE


CLASES
a) Todos los intervalos deben ser del mismo ancho.
b) Los intervalos deben ser continuos a lo largo de la distribución, no se puede
eliminar un determinado intervalo, aunque no exista frecuencia en el mismo
c) El intervalo que contiene el puntaje más alto debe estar en la parte de debajo
de la distribución.

LIMITES VERDADEROS O REALES DE UN INTERVALO DE CLASES:


Un intervalo de clases se extiende desde “0,5” por debajo del límite inferior, hasta
“0,5” por arriba del límite superior
Ejemplo:
𝐿𝐼𝑀𝐼𝑇𝐸𝑆 𝐴𝑃𝐴𝑅𝐸𝑁𝑇𝐸𝑆: 30 − 34
𝐿𝐼𝑀𝐼𝑇𝐸𝑆 𝑅𝐸𝐴𝐿𝐸𝑆 ∶ 29,5 − 34,5

PUNTO MEDIO O MARCA DE CLASE DE UN INTERVALO DE CLASES:


Es la mitad de la suma del límite superior más el límite inferior.
𝐿𝑆 + 𝐿𝑖
𝑥=
2
Ejemplo

34 + 30 64
𝑥= = = 32
2 2

DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS


Una distribución de frecuencia acumulada indica el número de observaciones
acumulado debajo del límite superior exacto de cada clase en la distribución y se
determina sumando la frecuencia de la clase más baja, con la frecuencia de la clase
siguiente luego la de ésta con la sucesiva y así hasta llegar a la clase más alta

CLASES f fa
5 ------ 9 2 2
10 ------ 14 3 5
15 ------ 19 4 9
20 ------ 24 6 15
25 ------ 29 2 17
30 ------ 34 3 20

9
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

DISTRIBUCIONES DE FRECUENCIA RELATIVA


Se obtiene sacando el porcentaje de la frecuencia acumulada en cada clase, en
relación con la frecuencia acumulada más alta, siendo ésta el 100%

Ejemplo
CLASES f fa fr.(%)
5 ------ 9 2 2 10
10 ------ 14 3 5 25
15 ------ 19 4 9 45
20 ------ 24 6 15 75
25 ------ 29 2 17 85
30 ------ 34 3 20 100

2.5. REPRESENTACIÓN GRÁFICA DE FRECUENCIA

HISTOGRAMAS Y POLÍGONOS DE FRECUENCIA

Histograma de frecuencia: Un histograma es una gráfica de barras de una


distribución de frecuencia. Lo que se acostumbra hacer es colocar en el eje de las
abscisas tantas divisiones como clases hay en la distribución, que corresponden a los
puntos medios de cada clase

7
6
5
Frecuencia

4
3
2
1
0
7 12 17 22 27 32
Puntos medios de clase
.
Como puede observarse sobre cada punto medio se levanta una barra hasta la altura
que marca la frecuencia correspondiente:

10
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Polígono de Frecuencia: Su construcción es similar a la del histograma, y se


elabora trazando una línea perpendicular sobre cada punto medio en las abcisas, hasta
la altura que corresponde a su frecuencia, posteriormente se unen todos los puntos de
intersección y queda construido el Polígono de Frecuencia.

7
6
5
4
3
2
1
0
2 5 9 15 17 20

Curva de Frecuencia Acumulada: Este gráfico se construye con los límites reales
de cada clase en las abcisas y con la frecuencia acumulada hasta cada clase en las
ordenadas.

20
18
16
frecuencia acumulada

14
12
10
8
6
4
2
0
9.5 14.5 19.5 24.5 29.5 34.5
Límite Superior Real

11
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Curva de Frecuencia Relativa: Este gráfico se construye con los límites reales de
cada clase en las abcisas y con la frecuencia relativa (%) hasta cada clase en las
ordenadas.
100
90
frecuencia Relativa % 80
70
60
50
40
30
20
10
0
9.5 14.5 19.5 24.5 29.5 34.5
Límite Superior Real

Ojiva: Es un gráfico de línea que se diseña utilizando en el eje horizontal los límites
superiores de una distribución de frecuencias. La información se obtiene de la
columna de frecuencias acumuladas (absoluta o relativa).

25 Ojiva
Frecuencia acumulada

20

15

10

0
9 14 19 24 29 34
Limite Superior

12
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 2

EJERCICIOS POR RESOLVER

1. En un centro comercial, se consultó la edad a todas las personas que entraban entre
las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:
175 173 181 169 195 196 177 174 170 168
185 173 170 168 172 179 184 183 176 188
179 177 172 180 193 195 178 187 190 192
188 180 172 169 171 176 184 183 180 179

2. Se está desarrollando un estudio para caracterizar un grupo de jóvenes a los que se


le ha aplicado un programa comunitario de salud y para ello se tomó una muestra en
la que se relaciona la estatura de 40 personas en cm.

15 36 20 22 4 54 73
42 45 21 17 70 1 3
29 33 48 51 65 61 73
27 25 3 16 19 69 55
36 34 3 36 34 58 11
26 42 47 23 17 4 10
3. En una prueba de
admisión, un grupo de 100 estudiantes obtuvo los siguientes puntajes:

25 18 32 24 17 23 15 28 14 26 12 34 25 16 23 21 9 33 24 15
29 19 35 22 31 20 27 13 25 30 19 24 12 23 32 26 5 24 32 21
22 18 33 20 36 22 25 16 29 19 38 23 35 17 28 11 26 41 20 31
27 18 26 39 24 16 29 21 25 30 23 14 26 37 23 18 32 25 29 20
22 33 21 30 27 15 28 22 31 17 21 34 27 19 28 13 34 10 7 24

4. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta
Personas:

60 66 77 70 66 68 57 70 66 52
75 65 69 71 58 66 67 74 61 63
69 80 59 66 70 67 78 75 64 71
81 62 64 69 68 72 83 56 65 74
67 54 65 65 69 61 67 73 57 62
67 38 63 67 71 68 76 61 62 63
76 61 67 67 64 72 64 73 79 58
67 71 68 59 69 70 66 62 63 66

De los ejercicios del 1 al 4


Determinar: a) el rango; b) el intervalo de clases; c) el N° de clases d) las clases o
intervalos
Elaborar la tabla que contenga: a) la frecuencia fi; b) frecuencia acumulada fa; c)
frecuencia relativa; c) Marca de clase xi
Dibujar: Histogramas, curvas de frecuencias y ojivas

13
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 3

MEDIDAS DE TENDENCIA CENTRAL


3.1. MEDIDAS DE TENDENCIA CENTRAL
Son un índice de localización central empleado en la descripción de las
distribuciones de frecuencia.
Como el centro de una distribución puede ser definido de diferentes maneras, habrá
también diferentes medidas de Tendencia Central.

3.2. NOTACIÓN DE INDICES, SUMA


Notación de Índice: Denotemos por 𝑋𝑗 (léase “X sub j”) cualquiera de los N
valores 𝑋1 , 𝑋2 , 𝑋3 , … . . 𝑋𝑁 que toma una variable

Notación de Suma: Para denotar la suma de todos los desde hasta, utilizamos la
letra sygma (Σ), letra mayúscula del abecedario griego .Esta letra griega será la
responsable de denotar la suma de todos los Así pues, por definición;

3.3. PROMEDIO O MEDIDAS DE TENDENCIA CENTRAL


Promedio: Un promedio es un valor típico o representativo de un conjunto de
datos. Como tales valores suelen situarse hacia el centro del conjunto de datos
ordenados por magnitud, los promedios se conocen como Medidas de Tendencia
Central.
Se definen varios tipos, siendo los más comunes la media aritmética, la mediana,
la moda, la media geométrica y la media armónica. Cada una tiene ventajas y
desventajas, según los datos y el objetivo perseguido.

3.4. CARACTERÍSTICA DE LAS DISTRIBUCIONES DE FRECUENCIAS


a) Con frecuencia los datos se acumulan alrededor de un valor central situado
entre los dos extremos de la variable que se estudia (Medidas de Tendencia
Central).
b) Los datos pueden tender a dispersarse y distribuirse alrededor de un valor
central, en forma tal que esta tendencia puede ser especificada
cuantitativamente (Medidas de Dispersión)

14
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

3.5. MEDIA ARIMÉTICA


La media Aritmética, o simplemente media de un conjunto de N números
𝑋1 , 𝑋2 , 𝑋3 , … . . 𝑋𝑛 se denota por 𝑋̅ (Léase “X barra”) y se define como la suma de las
calificaciones o de los valores de una variable, dividida por su número (N).

𝑋1 + 𝑋2 + 𝑋3 … . . +𝑋𝑁 ∑𝑁
𝑗=1 𝑋𝑗 ∑𝑋
𝑋̅ = = =
𝑁 𝑁 𝑁

𝑋̅ = Media Aritmética
X = Puntajes u observaciones
N = Número de observaciones
𝛴 = Sumatoria

Ejemplo.

La Media Aritmética de los números 8, 3, 5, 12 y 10 es:

∑ 𝑋 8 + 3 + 5 + 12 + 10 38
𝑋̅ = = = = 7,6
𝑁 5 5

3.6 MEDIA ARIMÉTICA ARBITRARIA


Se toma como Media Arbitraria (𝑋̅𝑎) cualquier puntaje, comprendido entre el
puntaje mayor y el puntaje menor, la Media Aritmética arbitraria es:

∑(𝑋 − 𝑋̅𝑎)
𝑋̅ = 𝑋̅𝑎 +
𝑁
Ejemplo.
X (𝑋 − 𝑋̅𝑎)
8 8–5=3
3 3 – 5 = -2
5 5–5=0
12 12 – 5 = 7
10 10 – 5 = 5
N=5 ∑(𝑋 − 𝑋̅𝑎) = 13

Aplicamos la fórmula:

∑(𝑋 − 𝑋̅𝑎) 13
𝑋̅ = 𝑋̅𝑎 + ⟹ 𝑋̅ = 5 + = 7,6
𝑁 5

15
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

3.7 CALCULO DE LA MEDIA EN DISTRIBUCIÓN DE FRECUENCIA NO


AGRUPADAS
Se emplea la siguiente fórmula:
∑ 𝑓𝑖 ∙ 𝑋
𝑥̅ =
∑𝑓
Ejemplo:
Tenemos la siguiente distribución.
X fi fi.X
7 1 7
8 2 16
9 2 18
10 6 60
12 4 48
13 2 26
14 2 28
16 1 16
∑ 𝑓𝑖 = 20 ∑ 𝑓𝑖. 𝑋 = 219

Aplicamos la fórmula.
∑ 𝑓𝑖 ∙ 𝑋 219
𝑥̅ = ⟹ 𝑥̅ = = 10,95
∑𝑓 20

3.7 MEDIA ARIMÉTICA PONDERADA


Cuando cada término de la serie se encuentra influido por un factor cuantitativo
que lo modifica totalmente, ese factor cuantitativo se llama Peso o Ponderación.

Fórmula:
∑(𝑃 ∙ 𝑋)
𝑋̅𝑝 =
∑𝑃

𝑋̅𝑝 = Media ponderada


P = Peso o ponderación
X = Términos de la serie (Puntajes)
∑ 𝑃 = Sumatoria de las ponderaciones

16
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo.
La media de 30 estudiantes de Contaduría es de 7, la de 15 estudiantes de
Ingeniería es de 6,5 y la de 10 estudiantes de Economía es de 6. ¿Cuál es la media
ponderada de todas las medias.

P X .
P X
30 7 210
15 6,5 97,5
10 6 60
∑ 𝑃 = 55 ∑(𝑃 ∙ 𝑋) = 367,5

Aplicamos la fórmula:

∑(𝑃 ∙ 𝑋) 367,5
𝑋̅𝑝 = ⟹ 𝑋̅𝑝 = = 6,68
∑𝑃 55
3.9. PROPIEDADES DE LA MEDIA ARIMÉTICA
a) La suma algebraica de las desviaciones de un conjunto de números con
respecto a su media aritmética es cero.

Ejemplo,
Las desviaciones de los números 8, 3, 5, 12 y 10 en relación con su media
aritmética 7,6 son:
8 – 7,6 = 0,4
3 – 7,6 = - 4,6
5 – 7,6 = - 2,6
12 – 7,6 = 4,4
10 – 7,6 = 2,4

0,4 – 4,6 – 2,6 + 4,4 + 2,4 = 0

b) La suma de los cuadrados de las desviaciones de un conjunto de números X,


con respecto de un cierto número “A” es mínima si y solo si 𝐴 = 𝑋̅
𝑛

∑(𝑋𝑖 − 𝐴)2
𝑖=1
c) Si 𝑓1 números tiene media 𝑚1 , 𝑓2 números tiene media 𝑚2 ,…..𝑓𝐾 números
tiene media 𝑚𝐾 , entonces la media de todos los números es:

𝑓1 𝑚1 + 𝑓2 𝑚2 + … . . +𝑓𝐾 𝑚𝑘 ∑𝑘𝑗=1 𝑓𝑗 𝑚𝑗
𝑋̅ = = (2)
𝑓1 + 𝑓2 + … . 𝑓𝐾 ∑𝐾𝑗=1 𝑓𝑗

17
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Es decir una media aritmética ponderada de todas las medias


d) Si A es una media aritmética supuesta o conjeturada (que puede ser cualquier
número) y si 𝑑𝑗 = 𝑋𝑗 − 𝐴 son las desviaciones de 𝑋𝑗 respecto de A, las
ecuaciones (1) y (2) se convierten respectivamente, en:

∑𝑁
𝑗=𝑖 𝑑𝑗 ∑𝑑 ∑𝑘
𝑗=1 𝑓𝑗 𝑑𝑗 ∑ 𝑓𝑑
𝑋̅ = 𝐴 + 𝑁
=𝐴+ 𝑁
⟹ 𝑋̅ = 𝐴 + ∑𝐾
= 𝐴+
𝑗=1 𝑓𝑗 𝑁

Donde 𝑁 = ∑𝐾
𝑗=1 𝑓𝑗 = ∑ 𝑓 estas dos fórmulas se resumen la ecuación

3.10. CALCULO DE LA MEDIA ARITMÉTICA PARA DATOS AGRUPADOS


Fórmulas

∑𝑓 𝑥 ∑ 𝑓∙𝑑
𝑋̅ = ∑ 𝑓𝑖 ; 𝑋̅ = 𝑋̅𝑎 + ∑ 𝑓 ; 𝑑 = 𝑋 − 𝑋̅𝑎
𝑖 𝑖

Ejemplo 1
Tenemos la siguiente distribución:
Clases 𝒇𝒊 x 𝒇𝒊 ∙ 𝒙
20 - 24 5 22 110
25 - 29 20 27 540
30 - 34 50 32 1.600
35 - 39 15 37 555
40 - 44 10 42 420
∑ 𝑓𝑖 =100 ∑ 𝑓𝑖 𝑥 = 3.225
Solución.
∑ 𝑓𝑖 𝑥 3.225
𝑋̅ = ⟹ 𝑋̅ = = 32,25
∑ 𝑓𝑖 100

Ejemplo 2
Clases 𝒇𝒊 x ̅𝒂
𝒅=𝑿−𝑿 𝒇𝒊 ∙ 𝒅
20 - 24 5 22 22 – 32 = -10 -50
25 - 29 20 27 27 – 32 = -5 - 100
30 - 34 50 32 32 - 32 = 0 0
35 - 39 15 37 37 – 32 = 5 75
40 - 44 10 42 42 – 32 = 10 100
∑ 𝑓𝑖 =100
∑ 𝑓𝑖 ∙ 𝑑 = 25

18
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Solución.
∑ 𝑓∙𝑑 25
𝑋̅ = 𝑋̅𝑎 + ∑ 𝑓 ⟹ 𝑋̅ = 32 + 100 = 32,25
𝑖

3.11. LA MEDIANA (Md)


La Mediana de un grupo de elementos es el valor del elemento de en medio, una
vez que todos los elementos del grupo se han ordenado en orden ascendente o
descendente de acuerdo con su valor. En un grupo en el que el número de elemento
es par, se considera que la mediana es el promedio de los dos valores de en medio.

Ejemplo

a) Tenemos la siguiente serie de observaciones:


4 – 3 – 5 – 8 – 7 – 10 ⟹ par
Se ordena en forma ascendente
3 – 4 – 5 – 7 – 8 – 10

Se toman las dos observaciones centrales


5+7
𝑀𝑑 = =6
2
b) Tenemos la siguiente serie de observaciones:
8 - 3 – 5 – 4 – 10
Se ordena en forma ascendente
3 - 4 – 5 – 8 – 10
Se toman la observación central

𝑀𝑑 = 5

3.12. CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS.


Fórmula
𝑓
∑ 𝑖 − 𝑓𝑎𝑒
𝑀𝑑 = 𝐿𝑖𝑟 + ( 2 ) ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
∑ = La que corresponda (debe ubicarse)
2
𝑓𝑖
𝑓𝑎𝑒 = La frecuencia acumulada que está encima de ∑ 2
𝑓𝑖
𝑓𝑖𝑑 = La frecuencia que está por debajo de ∑ 2
𝐿𝑖𝑟 = Límite inferior real de la clase que corresponde a 𝑓𝑎𝑒
ic =intervalo de clase que corresponda

19
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo 1
Tenemos la siguiente distribución:
Clases 𝒇𝒊 𝒇𝒂
20 - 24 5 5
25 - 29 20 25 𝑓𝑖
←∑ = 50
2
30 - 34 50 75
35 - 39 15 90
40 - 44 10 100
∑ 𝑓𝑖 =100
Entonces tenemos
100
∑ 𝑓𝑖/2 = = 50
2
𝑓𝑎𝑒 = 25
𝑓𝑖𝑑 = 50
𝐿𝑖𝑟 = 29,5
𝑖𝑐 = 5

Aplicamos la fórmula
𝑓𝑖

− 𝑓𝑎𝑒 50 − 25
𝑀𝑑 = 𝐿𝑖𝑟 + ( 2 ) ∙ 𝑖𝑐 ⟹ 𝑀𝑑 = 29,5 + ( ) ∙ 5 = 32
𝑓𝑖𝑑 50

Ejemplo 2

Tenemos la siguiente distribución:


Clases 𝒇𝒊 𝒇𝒂
100 - 109 5 5
𝑓𝑖
110 - 119 20 25 ←∑ = 25
2
120 - 129 10 35
130 - 139 15 50
∑ 𝑓𝑖 =50

Entonces tenemos
50
∑ 𝑓𝑖/2 = = 25
2
𝑓𝑎𝑒 = 5
𝑓𝑖𝑑 = 20
𝐿𝑖𝑟 = 109,5
𝑖𝑐 = 10

20
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Aplicamos la fórmula

𝑓
∑ 𝑖 − 𝑓𝑎𝑒 25 − 5
𝑀𝑑 = 𝐿𝑖𝑟 + ( 2 ) ∙ 𝑖𝑐 ⟹ 𝑀𝑑 = 109,5 + ( ) ∙ 10 = 119,5
𝑓𝑖𝑑 20

3.13. LA MODA (Mo)


La moda es el valor que se presenta con mayor frecuencia en un conjunto de
valores. Una distribución de este tipo se dice que es unimodal. En un conjunto
pequeño de datos en el cual ninguno de los valores medidos se repiten, no hay moda.
Cuando dos valores no contiguos tienen la misma frecuencia máxima, se dice que la
distribución es bimodal, Las distribuciones de mediciones que tienen varias modas se
denominan multimodales.

Ejemplo.
Tenemos las siguientes series de observaciones:

3 - 4 - 8 - 4 - 12 - 4 - 8 - 4 - 7

Como podemos observar el 4 es el que más se repite, luego la moda es 4

3.14. CÁLCULO DE LA MODA PARA DATOS AGRUPADOS.


Fórmula:
∆1
𝑀𝑜 = 𝐿𝑖𝑟 + ( ) ∙ 𝑖𝑐
∆1 + ∆2
∆1 = La diferencia entre la frecuencia mayor y la frecuencia del intervalo que esta por
Encima.
∆2 = La diferencia entre la frecuencia mayor y la frecuencia del intervalo que esta
Por debajo
𝐿𝑖𝑟 = El de la clase correspondiente a la frecuencia mayor
ic = El intervalo de clase correspondiente.

Ejemplo:

Tenemos la siguiente distribución:


Clases 𝒇𝒊
20 - 24 5
25 - 29 20
30 - 34 50
35 - 39 15
40 - 44 10

21
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Aplicamos la fórmula:
∆1 50−20
𝑀𝑜 = 𝐿𝑖𝑟 + (∆1+∆2) ∙ 𝑖𝑐 ⟹ 𝑀𝑜 = 29,5 + [(50−20)+(50−15)] ∙ 5 = 31,81

3.15. RELACIÓN EMPÍRICA ENTRE MEDIA, MEDIANA Y MODA


Para curvas de frecuencia unimodal, que sean moderamente sesgadas o
asimétricas, se tiene la siguiente relación empírica:

𝑀𝑒𝑑𝑖𝑎 − 𝑚𝑜𝑑𝑎 = 3(𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎)

Las figuras que se muestran a continuación indican las posiciones relativas de la


media, mediana y la moda para curvas de frecuencia sesgadas a la derecha y a la
izquierda, respectivamente. Para curvas simétricas, los valores de la media, mediana y
la moda coinciden.

3.16. LA MEDIA GEOMÉTRICA (G) Y LA MEDIA ARMÓNICA (H)


LA MEDIA GEOMÉTRICA (G): La media geométrica G de un conjunto de N
números positivos 𝑋1 , 𝑋2 , 𝑋3 , … . . , 𝑋𝑁 es la raíz N-ésimas del producto de esos
números:
𝑁
Fórmula para datos no agrupados: 𝐺 = √𝑋1 ∙ 𝑋2 ∙ 𝑋3 ∙∙∙∙∙ 𝑋𝑁

∑ log 𝑋 ∙ 𝑓𝑖
log 𝐺 =
𝑁
Ejemplo:
3 3
La media geométrica de los números 2, 4 y 8, es: √2 ∙ 4 ∙ 8 = √64 = 4
∑ log 𝑥𝑖∙𝑓𝑖
Fórmula para datos agrupados: log 𝐺 = ∑ 𝑓𝑖

22
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo:
Tenemos la siguiente distribución:

Clases 𝒇𝒊 𝒙𝒊 𝐥𝐨𝐠 𝒙𝒊 𝒍𝒐𝒈𝒙𝒊 ∙ 𝒇𝒊


20 - 24 5 22 1,34 6,7
25 - 29 20 27 1,43 28,6
30 - 34 50 32 1,51 75,5
35 - 39 15 37 1,57 23,55
40 - 44 10 42 1,62 16,2
∑ 𝑓𝑖 = 100 ∑ log 𝑓𝑖 ∙ 𝑥𝑖 = 150,55

Aplicamos la fórmula:
∑ log 𝑥𝑖∙𝑓𝑖 150,55
log 𝐺 = ∑ 𝑓𝑖
⟹ log 𝐺 = 100

log 𝐺 = 1,5055 ⟹ 𝐺 = 32,03

LA MEDIA ARMÓNICA (H): La media armónica H de un conjunto de N números


positivos 𝑋1 , 𝑋2 , 𝑋3 , … . . , 𝑋𝑁 es el recíproco de la media aritmética:
𝑁
Fórmula para datos no agrupados 𝐻 = 1

𝑋
𝑁 𝑁
𝐻= 𝑓 = 𝑓1 𝑓2 𝑓3 𝑓
∑ 𝑖 + + +⋯…+𝑋𝑛
𝑋 1 𝑋2 𝑋3
𝑋 𝑛
Ejemplo:

La media armónica de los números 2, 4 y 8, es:


3 3
𝐻=1 1 1 = 7 = 3,43
+ + 8
2 4 8

Ejemplo datos agrupados


Tenemos la siguiente distribución:
Clases 𝒇𝒊 xi fi/xi
20 - 24 5 22 0,23
25 - 29 20 27 0,74
30 - 34 50 32 1,56
35 - 39 15 37 0,41
40 - 44 10 42 0,24
∑ 𝑓𝑖= 100 ∑ 𝑓𝑖⁄𝑥𝑖 = 3,18

23
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Aplicamos la fórmula
∑ 𝑓𝑖 100
𝐻= 𝑓𝑖 ⟹ 𝐻= = 31,45
∑ 3,18
𝑥𝑖

3.17. RELACIÓN ENTRE LA MEDIA ARITMÉTICA, GEOMÉTRICA Y

ARMÓNICA
La media geométrica de un conjunto de números positivos 𝑋1 , 𝑋2 , 𝑋3 , … . . , 𝑋𝑁 es
menor o igual a su media aritmética, pero es mayor o igual a su media armónica,
Es decir:
𝐻 ≤ 𝐺 ≤ 𝑋̅

Ejemplo:

El conjunto 2, 4 y 8, tiene
2 + 4 + 8 14
𝑋̅ = = = 4,67
3 3
3
𝐺 = √2 ∙ 4 ∙ 8 = 4
3 3
𝐻= = = 3,43
1 1 1 7
2+4+8 8

3.18. LA MEDIA CUADRÁTICA (MC):


La media cuadrática MC de un conjunto de números 𝑋1 , 𝑋2 , 𝑋3 , … . . , 𝑋𝑁 algunas
veces se simboliza por √𝑋̅ 2 y se define como:
Fórmula para datos no agrupados
2 ∑ 𝑋2
𝑀𝐶 = √𝑋̅ = √
𝑁

Ejemplo:

La media cuadrática de los números 2, 4 y 8, es:

22 +42 +82 4+16+64 84


𝑀𝐶 = √ =√ =√ = √28 = 5,29
3 3 3

24
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Fórmula para datos agrupados:

∑ 𝑓𝑖∙𝑥𝑖 2
𝑀𝐶 = √ ∑ 𝑓𝑖

Ejemplo:

Clases fi xi xi² fi.xi²


5–9 5 7 49 245
10 - 14 7 12 144 1008
15 - 19 9 17 289 2601
20 - 24 10 22 484 4840
25 - 29 6 27 729 4374
30 - 34 4 32 1024 4096
∑ 𝑓𝑖 =41 ∑ 𝑓𝑖 ∙ 𝑥𝑖 2 =17.164

Aplicamos la fórmula:

∑ 𝑓𝑖∙𝑥𝑖 2 17.164
𝑀𝐶 = √ ∑ 𝑓𝑖
⟹ 𝑀𝐶 = √ = 20,46
41

3.19. MEDIDA DE DIVISIÓN, CUARTILES, DECILES Y PERCENTILES


Ya sabemos que la Mediana divide en dos partes una serie de observaciones;
además tenemos otras medidas de división. Extendiendo esta idea, es posible
considerar los valores que dividen al conjunto en cuatro (4) partes iguales. Estos
valores, denotados por 𝑄1 , 𝑄2 , 𝑄3 , 𝑄4 , se denominan como primero, segundo tercero y
cuarto cuartiles, respectivamente, donde 𝑄2 es igual a la mediana. El cuartil 4 (𝑄4 )
nos indica que el valor obtenido tiene bajo sí el 100% de la distribución de datos. Por
lo general no se calcula, ya que es un hecho que el último valor de la distribución él
lo representa

De forma similar, los valores que dividen los datos en diez (10) partes iguales son
llamados Deciles, los cuales se denotan por 𝐷1 , 𝐷2 , … … , 𝐷9 , mientras que los valores
que dividen los datos en cien (100) partes iguales se conocen como Percentiles y se
indican con 𝑃1 , 𝑃2 . 𝑃3 , … . . , 𝑃99 . El quinto decil y el 50o percentil coinciden con la
mediana, los percentiles 25o y 75o corresponden al primero y tercer cuartiles,
respectivamente.
De manera conjunta, cuartiles, deciles y percentiles, lo mismo que otros valores
obtenidos por medio de subdivisiones iguales de los datos, son denominados
cuantiles.

25
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Cálculo de cuartiles para datos no agrupados

Fórmula:
𝑁
𝑄𝑘 = 𝑘 ∙ ( )
4
Ejemplo

En 20 pruebas de evaporación, de una sustancia, se registran las siguientes


variaciones de temperaturas a presión atmosférica: 41°, 50°, 29°, 33°, 40°, 42°, 53°,
35°, 28°, 39°, 37°, 43°, 34°, 31°, 44°, 57°, 32°, 45°, 46°, 48°.

Ordenamos los datos de menor a mayor.


28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°,
53°, 57°.
Calculando el valor del cuartil 1:
Ubicamos la posición del valor que le corresponde al Q1:
𝑁 20
𝑄𝑘 = 𝑘 ∙ ( ) ⟹ 𝑄1 = 1 ∙ ( ) = 1 ∙ 5 = 5
4 4
Al revisar la serie de datos la posición 5 le corresponde a 33°
El valor para el Q1 es 33°
Nos dice: que los valores entre 28° y 33° representan el 25 % de la serie de datos.

Calculando el valor del cuartil 2:


Ubicar la posición del valor que le corresponde al Q2:
𝑁 20
𝑄𝑘 = 𝑘 ∙ ( ) ⟹ 𝑄2 = 2 ∙ ( ) = 2 ∙ 5 = 10
4 4
Al revisar la serie de datos la posición 10 le corresponde a 40°
El valor para el Q2 es 40°
Nos dice: que la temperatura que deja bajo si el 50 % de la serie de datos es 40°.

Calculando el valor del cuartil 3:


Ubicar la posición del valor que le corresponde al Q3:
𝑁 20
𝑄𝑘 = 𝑘 ∙ ( ) ⟹ 𝑄3 = 3 ∙ ( ) = 3 ∙ 5 = 15
4 4

Al revisar la serie de datos la posición 15 le corresponde a 45°


El valor para el Q3 es 45°
Nos dice: que los valores entre 28° y 45 representan el 75 % de la serie de datos.

Calculando el valor del cuartil 4:


𝑁 20
𝑄𝑘 = 𝑘 ∙ ( ) ⟹ 𝑄4 = 4 ∙ ( ) = 4 ∙ 5 = 20
4 4

26
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Al revisar la serie de datos la posición 20 le corresponde a 57°


El valor para el Q4 es 57°
Nos dice: la temperatura que deja bajo si el 100 % de la serie de datos es 57°.

Cálculo de cuartiles para datos agrupados

𝑓𝑖
1 ∙ (∑ 4 ) − 𝑓𝑎𝑒
𝑄1 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
2 ∙ (∑ 4 ) − 𝑓𝑎𝑒
𝑄2 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
3 ∙ (∑ 4 ) − 𝑓𝑎𝑒
𝑄3 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

Cálculo de deciles para datos agrupados

𝑓𝑖
1 ∙ (∑ 10) − 𝑓𝑎𝑒
𝐷1 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
2 ∙ (∑ 10) − 𝑓𝑎𝑒
𝐷2 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
9 ∙ (∑ 10) − 𝑓𝑎𝑒
𝐷9 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

27
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Cálculo de percentiles para datos agrupados

𝑓𝑖
1 ∙ (∑ 100 − 𝑓𝑎𝑒)
𝑃1 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
2 ∙ (∑ 100) − 𝑓𝑎𝑒
𝑃2 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

𝑓𝑖
99 ∙ (∑ ) − 𝑓𝑎𝑒
100
𝑃99 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐
𝑓𝑖𝑑

Ejemplo: Calcular los cuartiles en la siguiente distribución, El decil 7 (𝐷7 ) y El


percentil 48 (𝑃48 )
Tenemos la siguiente distribución:

Clases 𝒇𝒊 𝒇𝒂
20 - 24 5 5
25 - 29 20 25
30 - 34 50 75
35 - 39 15 90
40 - 44 10 100
∑ 𝑓𝑖 =100

PRIMER CUARTIL:

𝑓𝑖
1∙(∑ )−𝑓𝑎𝑒 1∙(25)−25
4
𝑄1 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐 ⟹ 𝑄1 = 29,5 + [ ] ∙ 5 = 29,5 + 0 = 29,5
𝑓𝑖𝑑 50

SEGUNDO CUARTIL

𝑓𝑖
2∙(∑ )−𝑓𝑎𝑒 2∙(25)−25
4
𝑄2 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐 ⟹ 𝑄2 = 29,5 + [ ] ∙ 5 = 29,5 + 2,5 = 32
𝑓𝑖𝑑 50

28
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

TERCER CUARTIL

𝑓𝑖
3∙(∑ )−𝑓𝑎𝑒 3∙(25)−25
4
𝑄3 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐 ⟹ 𝑄3 = 29,5 + [ ] ∙ 5 = 29,5 + 5 = 34,5
𝑓𝑖𝑑 50

DECIL SIETE
𝑓𝑖
7∙(∑ )−𝑓𝑎𝑒 7∙(10)−25
10
𝐷7 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐 ⟹ 𝐷7 = 29,5 + [ ] ∙ 5 = 29,5 + 4,5 = 34
𝑓𝑖𝑑 50

PERCENTIL CUARENTA Y OCHO

𝑓𝑖
48∙(∑ )−𝑓𝑎𝑒 48∙(1)−25
100
𝑃48 = 𝐿𝑖𝑟 + [ ] ∙ 𝑖𝑐 ⟹ 𝑃48 = 29,5 + [ ] ∙ 5 = 29,5 + 2,3 = 31,8
𝑓𝑖𝑑 50

29
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 3

1. Completar los datos que faltan en la siguiente tabla estadística, donde fi, fa y fr(%)
representan, respectivamente, la frecuencia absoluta, acumulada y relativa. Calcula La Media
Aritmética, La Mediana y La Moda

x f fa fi.xi
240 8
255 10 510
265 2 12
280 14
290 1 15
300 1 16 300
305 17 305
325 1 18
330 19
340

2. Calcular la Media Geométrica, La Media Armónica y La Media Cuadrática de las


siguientes calificaciones estadísticas

X fi
4 5
6 8
8 9
9 10
10 8

3. Calcular la Media Aritmética, La Mediana, La Moda, La Media Geométrica, La Media


Armónica y La Media Cuadrática de las siguientes distribuciones:
CLASES fi CLASES fi CLASES fi
24 - 26 4 0,1 - 0,5 8 42 - 46 1
27 - 29 6 0,6 - 1 22 47 - 51 10
30 - 32 12 1,1 - 1,5 30 52 - 56 14
33 - 35 15 1,6 - 2 20 57 - 61 15
36 - 38 7 2,1 - 2,5 12 62 - 66 7
39 - 41 4 2,6 - 3 8 67 - 71 2
42 - 44 2 72 - 76 1

4. Se ha pasado un test de 80 preguntas a 600 personas. El número de respuestas correctas se


refleja en la siguiente tabla:

CLASES fi
preguntas
0 - 10 40
10 - 20 60
20 - 30 75
30 - 40 90
40 - 50 105
50 - 60 85
60 - 70 80
70 - 80 65

30
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

a) Calcular la media, la mediana, la moda, los cuartiles 20 y los percentiles 85.


b) ¿Cuál es el percentil de una persona que tiene 65 respuestas correctas?

5. Se desea determinar cómo variaban las estaturas (en pulgadas) de las obreras de
una empresa y el cual se toma una muestra de 50 mujeres y se obtuvo la siguiente
tabla,

CLASES fi
Estaturas
53 - 56 2
56 - 59 5
59 - 62 9
62 - 65 15
65 - 68 12
68 - 71 5
71 - 74 2

Calcular La Media Geométrica, La Media Armónica y La Media Cuadrática de las siguientes


distribuciones, determinar 𝑄1 , 𝐷3 , 𝑃30 , 𝑃15 ,

6. Determinar el primer cuartil, el séptimo decil y el treintavo percentil, Calcular La


Media Geométrica, La Media Armónica y La Media Cuadrática de la siguiente tabla:

CLASES fi

200 - 299 85
300 - 399 90
400 - 499 120
500 - 599 70
600 - 699 62
700 - 799 36
.

31
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 4

MEDIDAS DE DISPERSIÓN
4.1. INTRODUCCIÓN
Mientras los estadísticos de tendencia central nos indican los valores alrededor de
los cuales se sitúan un grupo de observaciones, los estadísticos de variabilidad o
dispersión muestran si los valores de las observaciones están próximos entre sí o
están muy separados. Dos conjuntos de datos pueden tener la misma localización
central y no obstante, ser muy distintos si uno de ellos se halla más disperso que el
otro.
Por ejemplo, a continuación se te presenta el monto en bolívares de ventas
mensuales en el segundo semestre de las empresas “X” y “Y”

MESES Empresa “X” Empresa “Y”


Julio 1.500.000 4.800.000
Agosto 1.800.000 3.900.000
Septiembre 2.000.000 2.000.000
Octubre 2.300.000 1.400.000
Noviembre 2.500.000 700.000
Diciembre 2.800.000 100.000
TOTAL 12.900.000 12.900.000

Calculamos la media aritmética de ambas empresas:

Empresa “X”

12.900.000
𝑥̅ = = 2.150.000
6
Empresa “Y”

12.900.000
𝑥̅ = = 2.150.000
6
Ambas tienen la misma media en ventas, pero si realizamos el análisis
considerando cada una de las ventas del mes podemos apreciar que la situación de la
empresa “Y” es muy delicada, debido a que el último mes de facturación se aleja
mucho de la media. Por esto la importancia de las medidas de dispersión.

32
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

4.2. DISPERSIÓN.
Es el grado en que los datos numéricos tienden a extenderse alrededor de un valor
medio. La dispersión de la distribución suministra información complementaria que
permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos están
ampliamente dispersos, la localización central será menos representativa de los datos en
su conjunto lo que sería en el caso de datos que se acumulasen más alrededor de la
media. Además, si no conviene tener una amplia dispersión de valores respecto al centro
o si esa dispersión implica un riesgo inaceptable, deberemos ser capaces de reconocerlo y
no escoger las distribuciones que presentan la máxima dispersión.

4.3. RANGO O RECORRIDO.


Es la diferencia entre el valor más alto y el más bajo observado y se denota con la
letra “𝑅"

Fórmula: 𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛 datos no agrupados

𝑅 = 𝐿𝑆 − 𝐿𝑖 Datos agrupados

Un rango pequeño indica poca variación, uno grande indica una gran variabilidad.

Observaciones:
a. No es muy útil porque solo toma en cuenta los valores máximos y mínimos de
una distribución por lo que no da una idea de la verdadera concentración de
los valores. Igual rango pero diferente variabilidad.
b. No se puede utilizar en distribuciones que contenga intervalos abiertos.
c. Puede ser afectados por observaciones externas.

4.4. DESVIACIÓN MEDIA D.M.


Se llama Desviación Media de una distribución a la media aritmética de los
valores absolutos de las distribuciones de las características con respecto a la Media
Aritmética.
Representa la dispersión promedio de las calificaciones con respecto a la Media

CALCULO DE LA DESVIACIÓN MEDIA PARA DATOS AGRUPADOS

Fórmula:

∑ 𝑓 ∙ (|𝑋 − 𝑥̅ |)
𝐷. 𝑀 =
∑ 𝑓𝑖

33
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo:

Dada la siguiente distribución, hallar la Desviación Media

CLASES 𝒇𝒊 𝑿𝒊 𝒇𝒊. 𝑿𝒊 (|𝑿𝒊 − 𝒙


̅|) 𝒇𝒊 ∙ (|𝑿𝒊 − 𝒙
̅|)
20 - 24 5 22 110 |22 − 32,25| = 10,25 51,25
25 - 29 20 27 540 |27 − 32,25| = 5,25 105
30 - 34 50 32 1.600 |32 − 32,25| = 0,25 12,5
35 - 39 15 37 555 |37 − 32,25| = 4,75 71,25
40 - 44 10 42 420 |42 − 32,25| = 9,75 97,5
∑ 𝑓𝑖 = 100 ∑ 𝑓𝑖 𝑥 = 3.225 337,5

Calculo de la Media Aritmética


∑ 𝑓𝑖 𝑥 3.225
𝑋̅ = ⟹ 𝑋̅ = = 32,25
∑ 𝑓𝑖 100

Aplicamos la fórmula

∑ 𝑓 ∙ (|𝑋 − 𝑥̅ |) 337,5
𝐷. 𝑀 = ⟹ 𝐷. 𝑀 = = 3,375
∑ 𝑓𝑖 100

4.5. EL RANGO INTERCUARTIL, SEMI–INTERCUARTIL Y EL


PERCENTIL 10-90
El Rango Intercuartil “RIQ”. Es la diferencia entre los valores de 𝑄1 𝑦 𝑄3 , esta
diferencia refleja la variabilidad de las observaciones del 50% intermedio de los datos
y tiene la ventaja de no verse influenciado por valores extremos:

Fórmula:
𝑅𝐼𝑄 = 𝑄1 − 𝑄3
Gráficamente.

25% 25%
datos datos

𝑋𝑚𝑒𝑛𝑜𝑟 𝑄1 𝑄2 𝑄3 𝑋𝑚𝑎𝑦𝑜𝑟

A través del rango intercuartil podemos ver (aproximadamente), qué tan lejos de la
mediana tenemos que ir en cualquiera de las dos direcciones antes de que podamos recorrer
una mitad de los valores del conjunto de datos. Sin embargo una de las medidas más utilizada
es el rango semi-intercuartil.

34
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

El Rango Semi-Intercuartil RSIQ. Es la semi diferencia entre los valores de


𝑄1 𝑦 𝑄3 , al igual que el rango intercuartilico tiene la ventaja de no verse influenciado
por los valores extremos.

Fórmula:
𝑄1 − 𝑄3
𝑅𝑆𝐼𝑄 =
2

El Rango Percentil 10-90. Se define como la diferencia de los valores de 𝑃90 𝑦 𝑃10
Fórmula:
𝑃10−90 = 𝑃90 − 𝑃10

4.6. LA VARIANZA Y LA DESVIACIÓN TÍPICA O ESTÁNDAR


La Varianza: Es la suma de los cuadrados de las desviaciones de las observaciones
con respecto a la media Aritmética dividida por el número total de datos.

𝜎 2 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑁𝑜𝑡𝑎𝑐𝑖ó𝑛: { 2
𝑆 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Fórmulas:

Datos no agrupados Datos agrupados


∑𝑁
𝑖=1(𝑋𝑖 − 𝑥̅ )
2
2
∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖
2 𝜎 =
𝜎 =
𝑁 ∑ 𝑓𝑖
∑𝑁
𝑖=1(𝑋𝑖 − 𝑥̅ )
2 ∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖
𝑆2 = 𝑆2 =
𝑁−1 𝑁−1

Desviación Típica o Estándar: La desviación estándar es un índice numérico de la


dispersión de un conjunto de datos (o población). Mientras mayor es la desviación
estándar, mayor es la dispersión de la población. La desviación estándar es un
promedio de las desviaciones individuales de cada observación con respecto a la
media de una distribución. Así, la desviación estándar mide el grado de dispersión o
variabilidad. Se define como la raíz cuadrada positiva de la varianza.

35
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Fórmulas:

Datos no agrupados Datos agrupados

∑𝑁
𝑖=1(𝑋𝑖 − 𝑥̅ )
2 ∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖
𝜎= √ 𝜎=√
𝑁 ∑ 𝑓𝑖

∑𝑁 (𝑋𝑖 − 𝑥̅ )2 ∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖
𝑆 = √ 𝑖=1 𝑆=√
𝑁−1 𝑁−1

Ejemplo:

Dada la siguiente distribución, hallar la Varianza y la Desviación típica

CLASES 𝒇𝒊 𝑿𝒊 𝒇𝒊. 𝑿𝒊 𝑋𝑖 − 𝑥̅ (𝑋𝑖 − 𝑥̅ )2 ̅)𝟐 ∙ 𝒇𝒊


(𝑿𝒊 − 𝒙
20 - 24 5 22 110 22 − 32,25 = −10,25 105,06 525,30
25 - 29 20 27 540 27 − 32,25 = −5,5 30,25 605,00
30 - 34 50 32 1.600 32 − 32,25 = −0,25 0,06 3,00
35 - 39 15 37 555 37 − 32,25 = 4,75 22,56 338,40
40 - 44 10 42 420 42 − 32,25 = 9,75 95,06 950,60
∑ 𝑓𝑖 = 100 ∑ 𝑓𝑖 𝑥 = 3.225 ̅)𝟐 ∙ 𝒇𝒊 =
∑(𝑿𝒊 − 𝒙 2422,30

Solución:

Calculo de la Media Aritmética

∑ 𝑓𝑖 𝑥 3.225
𝑋̅ = ⟹ 𝑋̅ = = 32,25
∑ 𝑓𝑖 100

Cálculo de la Varianza

∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖 2.422,30
𝜎2 = ⟹ 𝜎2 = = 24,22
∑ 𝑓𝑖 100

Cálculo de la Desviación Típica

∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖
𝜎=√ ⟹ 𝜎 = √24,22 = 4,92
∑ 𝑓𝑖

36
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

4.7. LA DESVIACIÓN DE CHARLIER Y CORRECCIÓN DE SHEPPARD


La Desviación o Comprobación de Charlier: La comprobación de Charlier en los
cálculos de la media y de la desviación estándar, por medio del método de codificación,
hace uso de las identidades:

Comprobación de la media

∑ 𝑓(𝑢 + 1) = ∑(𝑓𝑢 + 𝑓) = ∑ 𝑓𝑢 + ∑ 𝑓 = ∑ 𝑓𝑢 + 𝑁

Comprobación de la Desviación estándar

∑ 𝑓(𝑢 + 1)2 = ∑ 𝑓(𝑢2 + 2𝑢 + 1) = ∑(𝑓𝑢2 + 2𝑓𝑢 + 𝑓) = ∑ 𝑓𝑢2 + 2 ∑ 𝑓𝑢 + 𝑁

Ejemplo

Calcular la Desviación de Charlier, para la Media y la Desviación Estándar

𝑋𝑖 − 𝑥̅ 𝑎
CLASES 𝒇𝒊 𝑿𝒊 𝑢= 𝑓𝑢 𝑢2 𝑓𝑢2
𝑖𝑐
22 − 32
20 - 24 5 22 = −2 -10 4 20
5
27 − 32
25 - 29 20 27 = −1 -20 1 20
5
32 − 32
30 - 34 50 32 =0 0 0 0
5
37 − 32
35 - 39 15 37 =1 15 1 15
5
42 − 32
40 - 44 10 42 =2 20 4 40
5
∑ 𝑓𝑖 = 100 ∑ 𝑓𝑢= 5 95

Aplicamos la fórmula

Para la Media Aritmética

∑ 𝑓𝑢 + 𝑁 = 5 + 100 = 105

Para La Desviación Estándar

∑ 𝑓𝑢2 + 2 ∑ 𝑓𝑢 + 𝑁 = 95 + 10 + 100 = 205

37
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Corrección de Sheppard para la Varianza SC: Cuando en una serie clasificada los
límites de clase comprenden varias unidades se introducen un error al agrupar los
datos en clase (llamado error de agrupamiento), debido a que los puntos medios o
marcas no coinciden con los respectivos promedios de los datos agrupados en cada
clase.

Los puntos medios o marcas de clase tienen mayor dispersión que los promedios lo
que da lugar a un error en la varianza en exceso, este error se corrige mediante la
corrección Sheppard con lo cual se obtiene la varianza ajustada o corregida para lo
𝑖𝑐 2
cual a la varianza calculada se le resta la constante
12

Se determina mediante la aplicación de la siguiente fórmula:


𝑖𝑐 2
𝑆𝐶 = √𝑆 2 −
12

Donde ic es el tamaño del intervalo de clase. La corrección (que se resta) es llamada


corrección de Sheppard.

Ejemplo

Calcular la corrección Sheppard del siguiente cuadro de distribución

CLASES xi fi 𝑥𝑖 2 𝑓𝑖. 𝑥𝑖 2 𝑓𝑖 ∙ 𝑥𝑖 (𝑥𝑖 − 𝑥̅ ) (𝑥𝑖 − 𝑥̅ )2 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2


45 - 55 50 4 2500 10.000 200 -19,6 384,16 1.536,64
55 - 65 60 12 3600 43.200 720 -9,6 92,16 1.105,92
65 - 75 70 20 4900 98.000 1.400 0,4 0,16 3,2
75 - 85 80 10 6400 64.000 800 10,4 108,16 1.081,6
85 - 95 90 4 8100 32.400 360 20,4 416,16 1.664,64
∑ 𝑓𝑖 = 50 247.600 ∑ 𝑓𝑖 𝑥= 3.480 ∑ 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2 = 5.392

Calculo de la Media Aritmética

∑ 𝑓𝑖 𝑥 3.480
𝑋̅ = ⟹ 𝑋̅ = = 69,6
∑ 𝑓𝑖 50

Cálculo de la Varianza:

∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖 5.392
𝑆2 = ⟹ 𝑆2 = = 107,84
𝑓𝑖 50

𝑖𝑐 = 10 ⟹ 𝑖𝑐 2 = 100

38
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Cálculo de la corrección Sheppard

𝑖𝑐 2 100
𝑆𝐶 = √𝑆 2 − ⟹ 𝑆𝐶 = √107,84 − = √99,50666 = 9,975302
12 12

Relaciones empíricas entre medidas de dispersión. Para distribuciones


moderamente sesgada, se tienen las fórmulas empíricas:
4
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 = (𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟)
5
2
𝑅𝑎𝑛𝑔𝑜 𝑠𝑒𝑚𝑖𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙𝑎𝑟 = 3 (𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟)
Dispersión absoluta y relativa: Coeficiente de Variación.

La variación real o dispersión, determinada a partir de la desviación estándar u otra


medida de dispersión, se denomina dispersión absoluta.
Si la desviación absoluta es la desviación estándar s y el promedio es la media
aritmética 𝑥̅ , entonces la dispersión relativa se denomina coeficiente de variación o
coeficiente de dispersión; la misma se denota con V y está dada por:
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 (𝑉) = ∙ 100
𝑥̅
Que por lo general se presenta en forma de porcentaje. Obsérvese que el coeficiente de
variación es independiente de las unidades usadas. Por este motivo es útil para comparar
distribuciones con unidades diferentes. Una desventaja del coeficiente de variación es
que no sirve cuando la media es cercana a cero.

Ejemplo.

Calcular el Coeficiente de Variación y la variable estandarizada

CLASES xi fi 𝑥𝑖 2 𝑓𝑖. 𝑥𝑖 2 𝑓𝑖 ∙ 𝑥𝑖 (𝑥𝑖 − 𝑥̅ ) (𝑥𝑖 − 𝑥̅ )2 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2


45 - 55 50 4 2500 10.000 200 -19,6 384,16 1.536,64
55 - 65 60 12 3600 43.200 720 -9,6 92,16 1.105,92
65 - 75 70 20 4900 98.000 1.400 0,4 0,16 3,2
75 - 85 80 10 6400 64.000 800 10,4 108,16 1.081,6
85 - 95 90 4 8100 32.400 360 20,4 416,16 1.664,64
∑ 𝑓𝑖 = 50 247.600 ∑ 𝑓𝑖 𝑥= 3.480 ∑ 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2 = 5.392

Calculo de la Media Aritmética


∑ 𝑓𝑖 𝑥 3.480
𝑋̅ = ⟹ 𝑋̅ = = 69,6
∑ 𝑓𝑖 50

Cálculo de la Varianza:

2
∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖 5.392
𝑆 = ⟹ 𝑆2 = = 110,04
𝑁−1 49

39
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Cálculo de la Desviación estándar

∑𝑁 2
𝑖=1(𝑋𝑖 − 𝑥̅ ) ∙ 𝑓𝑖 5.392
𝑆=√ ⟹𝑆=√ = 10,49
𝑁−1 49

Cálculo del coeficiente de Variación.

𝑆 10,49
𝑉= ∙ 100 ⟹ 𝑉= = 0,1507 ∙ 100 = 15,07%
𝑥̅ 69,6

Variable Estandarizada o Tipificadas: Unidades estándar:


La variable que mide la desviación respecto de la media, en unidades de la desviación
estándar, se denomina variable estandarizada; es una cantidad adimensional (es decir, es
independiente de las unidades utilizadas) y está dada por:

𝑥𝑖 − 𝑥̅
𝑧=
𝑆
Si las desviaciones en relación con la media se dan en unidades de la desviación estándar,
se dice que están expresadas en unidades estándar o medidas estándar. Son muy útiles
para comparar distribuciones.

Ejemplo.

En un examen final de Matemática Financiera la media aritmética fue 15 y la


desviación Estándar fue 5 y en el examen de Estadística fue 13 y la desviación
estándar fue 4. Una alumna obtuvo 17 y 16 respectivamente de notas finales en ambas
asignaturas ¿En qué asignatura obtuvo un puesto relativamente más alto?

Matemática Financiera

𝑥𝑖 = 17 ; 𝑥̅ = 15 ; 𝑆 = 5

𝑥𝑖 − 𝑥̅ 17 − 15
𝑧= ⟹ 𝑧= = 0,40
𝑆 5

Estadística

𝑥𝑖 = 16 ; 𝑥̅ = 13 ; 𝑆 = 4

𝑥𝑖 − 𝑥̅ 16 − 13
𝑧= ⟹ 𝑧= = 0,75
𝑆 4

40
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Luego ha obtenido una desviación estándar de 0,40 y 0,75 por encima de la media,
siendo por lo tanto su puntuación superior en estadística.

Generalmente para hallar la desviación típica se utiliza la fórmula abreviada:

∑ 𝑥𝑖 2 ∙ 𝑓𝑖
𝑆=√ − 𝑥̅ 2
𝑁

Ejemplo.

Tipificar o normalizar los valores de la distribución de la siguiente tabla.

𝑥𝑖 𝑓𝑖 𝑥𝑖 ∙ 𝑓𝑖 𝑥𝑖 2 𝑥𝑖 2 ∙ 𝑓𝑖 𝑧𝑖
2 4 8 4 16 -1,71
4 6 24 16 96 - 0,84
6 10 60 36 360 0,03
8 7 56 64 448 0,90
10 3 30 100 300 1,77
N= 30 ∑ 𝑥𝑖 ∙ 𝑓𝑖 =178 ∑ 𝑥𝑖 2 ∙ 𝑓𝑖 = 1220

Fórmulas:
𝑥𝑖 − 𝑥̅ ∑ 𝑥𝑖 2 ∙ 𝑓𝑖
𝑧= ; 𝑆=√ − 𝑥̅ 2
𝑆 𝑁

Calculo de la Media Aritmética

∑ 𝑓𝑖 𝑥 178
𝑋̅ = ⟹ ̅𝑋 = = 5,93
∑ 𝑓𝑖 30

Calculo de la desviación Típica

∑ 𝑥𝑖 2 ∙ 𝑓𝑖 1.220
𝑆=√ − 𝑥̅ 2 ⟹ 𝑆=√ − 5,932 = √40,67 − 35,16 = 2,3
𝑁 30

Calculo de la Variable Tipificada

𝑥𝑖 − 𝑥̅
𝑧=
𝑆
2−5,93 4−5,93 6−5,93
𝑧1 = = −1,7 ; 𝑧2 = = −0,84 ; 𝑧3 = = 0,03
2,3 2,3 2,3

8−5,93 10−5,93
𝑧4 = 2,3
= 0,90 ; 𝑧5 = 2,3
= 1,77

41
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 4

1. Calcular la Desviación Media, el rango intercuartil, el semi-intercuartil, y el rango


Percentil 10-90 de la siguiente distribución.

CLASES fi CLASES fi
20 - 30 16 60 - 62 5
30 - 40 25 63 - 65 18
40 - 50 51 66 - 68 42
50 - 60 80 69 - 71 27
60 - 70 20 72 - 74 8
70 - 80 8

2. Calcular la Varianza, la Desviación Típica y el Coeficiente de variación de las


siguientes distribuciones estadísticas
CLASES fi CLASES fi
42 - 46 1 CLASES fi
0 - 10 40
47 - 51 10
10 - 20 60 45 - 55 6
52 - 56 14
57 - 61 25 20 - 30 75 55 - 65 10
62 - 66 7 30 - 40 90 65 - 75 19
67 - 71 2 40 - 50 105 75 - 85 11
72 - 76 1 50 - 60 85 85 - 95 4
60 - 70 80
70 - 80 65

3. Calcular la desviación de Charlier, la corrección de Sheppard y las variables


tipificadas de las siguientes distribuciones estadísticas

CLASES fi CLASES fi CLASES fi


0 - 15 17 50 - 55 2 30 - 40 6
15 - 30 130 40 - 50 18
55 - 60 7
30 - 45 180 50 - 60 76
60 - 65 17
45 - 60 30 60 - 70 70
60 - 75 10 65 - 70 30 70 - 80 22
75 - 90 5 70 - 75 14 80 - 90 8
75 - 80 7
80 - 85 3

4. Un alumno A saca una puntuación de 85 en un examen cuyas puntuaciones tienen


una media de 79 con una desviación típica de 8. Un alumno B saca 74 en un examen
cuyas puntuaciones tienen una media de 70 y desviación típica de 5. ¿Cuál de los dos
alumnos obtuvo una puntuación mejor? La respuesta, desde el punto de vista de la
"unidad tipificada"

42
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 5

MOMENTOS, SESGOS Y CURTOSIS


5.1 MOMENTOS:
Los momentos de una distribución son medidas obtenidas a partir de todos sus datos
y de sus frecuencias absolutas. Estas medidas caracterizan de tal forma a las
distribuciones que si los momentos de dos distribuciones son iguales, diremos que las
distribuciones son iguales. Podemos decir que dos distribuciones son más semejantes
cuanto mayor sea el número de sus momentos que coinciden.

Dados N valores, 𝑋1 , 𝑋2 , … . , 𝑋𝑛 que toma la variable X, se define la cantidad:

𝑋1 𝑟 + 𝑋2 𝑟 + ⋯ + 𝑋𝑛 𝑟 ∑ 𝑋 𝑟
̅̅̅
𝑥𝑟 = =
𝑁 𝑁
A la que se llama el r-ésimo momento. El primer momento, en el que r = 1 es la
media aritmética 𝑥̅ .

El r-ésimo momento respecto a la media 𝑥̅ se define como;

∑(𝑋 − 𝑥̅ )𝑟
𝑚𝑟 = ̅̅̅̅̅̅̅̅̅̅̅
= (𝑋 − 𝑥̅ )𝑟
𝑁
Si r = 1 entonces 𝑚1 = 0. Si r = 2 entonces 𝑚2 es la Varianza

El r-ésimo momento respecto a cualquier origen A se define de la manera siguiente:

∑(𝑋 − 𝐴)𝑟 ∑ 𝑑 𝑟
𝑚′𝑟 = = ̅̅̅̅̅̅̅̅̅̅̅
= (𝑋 − 𝑥̅ )𝑟
𝑁 𝑁
Donde las 𝑑 = 𝑋 − 𝐴 son las desviaciones de X con respecto de A (marca de clase de
la mayor frecuencia absoluta)

Cálculo de los momentos con respecto a la media aritmética

Si 𝑋1 , 𝑋2 , … . , 𝑋𝑘 se presentan con frecuencia 𝑓1 , 𝑓2 , … . , 𝑓𝑘 , respectivamente, los


momentos anteriores están dado por

43
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

𝑚1 = 0
2
𝑚2 = 𝑚′2 − 𝑚′1
3
𝑚3 = 𝑚′3 − 3𝑚′1 𝑚′ 2 + 2𝑚′1
2 4
𝑚4 = 𝑚′4 − 4𝑚′1 𝑚′ 3 + 6𝑚′1 𝑚′ 2 − 3𝑚′1

Etcétera. Obsérvese que 𝑚′1 = 𝑥̅ − 𝐴


Cálculo de los momentos con respecto a la media aritmética arbitraria

∑ 𝑓𝑖 ∙ 𝑢
𝑚′1 = 𝑖𝑐 ∙
∑ 𝑓𝑖


∑ 𝑓𝑖 ∙ 𝑢2
2
𝑚 2 = 𝑖𝑐 ∙
∑ 𝑓𝑖


∑ 𝑓𝑖 ∙ 𝑢33
𝑚 3 = 𝑖𝑐 ∙
∑ 𝑓𝑖
′ 4
∑ 𝑓𝑖 ∙ 𝑢4
𝑚 4 = 𝑖𝑐 ∙
∑ 𝑓𝑖
Ejemplo

Tenemos la siguiente distribución:

CLASES 𝑓𝑖 𝑥𝑖 𝑢 𝑓𝑖 ∙ 𝑢 𝑢2 𝑓𝑖 ∙ 𝑢2 𝑢3 𝑓𝑖 ∙ 𝑢3 𝑢4 𝑓𝑖 ∙ 𝑢4
60 - 62 5 61 -2 -10 4 20 -8 -40 16 80
63 - 65 18 64 -1 -18 1 18 -1 -18 1 18
66 - 68 42 67 0 0 0 0 0 0 0 0
69 - 71 27 70 1 27 1 27 1 27 1 27
72 - 74 8 73 2 16 4 32 8 64 16 128
∑ 𝑓𝑖 = 100 ∑ 𝑓𝑖 ∙ 𝑢 = 15 ∑ 𝑓𝑖 ∙ 𝑢2 = 97 ∑ 𝑓𝑖 ∙ 𝑢3 = 33 ∑ 𝑓𝑖 ∙ 𝑢4 = 253

Calculamos la media arbitraria


𝑋𝑖 − 𝑥̅ 𝑎
𝑢=
𝑖𝑐
61−67 64−67 67−67 70−67 73−67
𝑢= = −2 ; 𝑢 = = −1 ; 𝑢 = =0 ; 𝑢= =1 ; 𝑢= =2
3 3 3 3 3

Calculamos primero los Momentos con respecto a la Media Arbitraria

∑ 𝑓𝑖 ∙ 𝑢 15
𝑚′1 = 𝑖𝑐 ∙ ⟹ 𝑚′1 = 3 ∙ = 0,45
∑ 𝑓𝑖 100

∑ 𝑓𝑖 ∙ 𝑢2 97
𝑚′ 2 = 𝑖𝑐 2 ∙ ⟹ 𝑚′ 2 = 9 ∙ = 8,73
∑ 𝑓𝑖 100

44
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑ 𝑓𝑖 ∙ 𝑢3 33
𝑚′ 3 = 𝑖𝑐 3 ∙ ⟹ 𝑚′ 3 = 27 ∙ = 8,91
∑ 𝑓𝑖 100

∑ 𝑓𝑖 ∙ 𝑢4 253
𝑚′ 4 = 𝑖𝑐 4 ∙ ⟹ 𝑚′ 4 = 81 ∙ = 204,93
∑ 𝑓𝑖 100

Calculamos los Momentos con respecto a la Media Aritmética

𝑚1 = 0
2
𝑚2 = 𝑚′ 2 − 𝑚′1

𝑚2 = 8,73 − (0,45)2 = 8,73 − 0,02025 = 8,53


3
𝑚3 = 𝑚′ 3 − 3𝑚′1 𝑚′ 2 + 2𝑚′1

𝑚3 = 8,91 − 3. (0,45). (8,73) + 2(0,45)3 = 8,91 − 11,7855 + 0,18225 = −2,69


2 4
𝑚4 = 𝑚′ 4 − 4𝑚′1 𝑚′ 3 + 6𝑚′1 𝑚′ 2 − 3𝑚′1

𝑚4 = 204,93 − 4(0,45)(8,91) + 6(0,45)2 (8,73) − 3(0,45)4 = 199,38

5.2 COMPROBACIÓN DE CHARLIER Y CORRECIÓN DE SHEPPARD


La Comprobación de Charlier: La comprobación de Charlier al calcular momentos
mediante el método de compilación emplea las siguientes identidades:

∑ 𝑓(𝑢 + 1) = ∑(𝑓𝑢 + 𝑓) = ∑ 𝑓𝑢 + 𝑁
∑ 𝑓(𝑢 + 1)2 = ∑ 𝑓𝑢2 + 2 ∑ 𝑓𝑢 + 𝑁
∑ 𝑓(𝑢 + 1)3 = ∑ 𝑓𝑢3 + 3 ∑ 𝑓𝑢2 + 3 ∑ 𝑓𝑢 + 𝑁
∑ 𝑓(𝑢 + 1)4 = ∑ 𝑓𝑢4 + 4 ∑ 𝑓𝑢3 + 6 ∑ 𝑓𝑢2 + 4 ∑ 𝑓𝑢 + 𝑁

La Corrección de Sheppard: Las correcciones de Sheppard para momentos son las


siguientes:
1
𝑚2 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚2 − 𝑖𝑐 2
12
1 7
𝑚4 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚4 − 𝑖𝑐 2 𝑚2 + 𝑖𝑐 4
2 240
Los momentos 𝑚1 y 𝑚3 no necesitan corrección

45
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Momentos adimensionales: Para evitar usar unidades particulares, se definen


momentos adimensionales con respecto a la media como:
𝑚𝑟 𝑚𝑟
𝑎𝑟 = 𝑟 =
𝑆 √𝑚2 𝑟
Dónde 𝑆 = √𝑚2 es la Desviación Estándar. Como 𝑚1 = 0 y 𝑚2 = 𝑆 2, se tiene 𝑎1 =
0 y 𝑎2 = 1

Ejemplo.

Utilizar la Comprobación de Charlier y la Corrección de Sheppard en la siguiente


distribución:

CLASES 𝑓 𝑥𝑖 𝑢 𝑓. 𝑢 𝑢2 𝑓. 𝑢2 𝑢3 𝑓. 𝑢3 𝑢4 𝑓. 𝑢4
21 − 27
20 - 22 3 21 = −2 -6 4 12 -8 -24 16 48
3
24 − 27
23 - 25 10 24 = −1 - 10 1 10 -1 -10 1 10
3
27 − 27
26 - 28 25 27 =0 0 0 0 0 0 0 0
3
30 − 27
29 - 31 7 30 =1 7 1 7 1 7 1 7
3
33 − 27
32 - 34 5 33 =2 10 4 20 8 40 16 80
3
∑𝑓 = ∑ 𝑓.u = 2 3 ∑𝑓𝑢 = 4
50 1 ∑𝑓𝑢 = 49 ∑𝑓𝑢 = 13 145

Solución:

Comprobación de Charlier
∑ 𝑓(𝑢 + 1) = ∑ 𝑓𝑢 + 𝑁 = 1 + 50 = 51
∑ 𝑓(𝑢 + 1)2 = ∑ 𝑓𝑢2 + 2 ∑ 𝑓𝑢 + 𝑁 = 49 + 2 ∙ 1 + 50 = 101
∑ 𝑓(𝑢 + 1)3 = ∑ 𝑓𝑢3 + 3 ∑ 𝑓𝑢2 + 3 ∑ 𝑓𝑢 + 𝑁 = 13 + 3 ∙ 49 + 3 ∙ 1 + 50 = 213
∑ 𝑓(𝑢 + 1)4 = ∑ 𝑓𝑢4 + 4 ∑ 𝑓𝑢3 + 6 ∑ 𝑓𝑢2 + 4 ∑ 𝑓𝑢 + 𝑁 = 145 + 4 ∙ 13 + 6 ∙ 49 + 4 ∙ 1 + 50 = 545

Corrección de Sheppard

1
a) 𝑚2 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚2 − 𝑖𝑐 2
12

2
𝑚2 = 𝑚′ 2 − 𝑚′1

∑ 𝑓𝑖 ∙ 𝑢 1
𝑚′1 = 𝑖𝑐 ∙ ⟹ 𝑚′1 = 3 ∙ = 0,06
∑ 𝑓𝑖 50
∑ 𝑓𝑖 ∙ 𝑢2 49
𝑚′ 2 = 𝑖𝑐 2 ∙ ⟹ 𝑚′ 2 = 9 ∙ = 8,82
∑ 𝑓𝑖 50

46
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

2
𝑚2 = 𝑚′ 2 − 𝑚′1 = 8,82 − (0,06)2 = 8,82

1 2 1
𝑚2 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚2 − 𝑖𝑐 = 8,82 − 32 = 8,82 − 0,75 = 8,07
12 12
1 7
b) 𝑚4 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚4 − 2 𝑖𝑐 2 𝑚2 + 240 𝑖𝑐 4

2 4
𝑚4 = 𝑚′ 4 − 4𝑚′1 𝑚′ 3 + 6𝑚′1 𝑚′ 2 − 3𝑚′1

∑ 𝑓𝑖 ∙ 𝑢3 13
𝑚′ 3 = 𝑖𝑐 3 ∙ ⟹ 𝑚′ 3 = 27 ∙ = 7,02
∑ 𝑓𝑖 50

∑ 𝑓𝑖 ∙ 𝑢4 145
𝑚′ 4 = 𝑖𝑐 4 ∙ ⟹ 𝑚′ 4 = 81 ∙ = 234,9
∑ 𝑓𝑖 50
𝑚4 = 234,9 − 4 ∙ 0,06 ∙ 7,02 + 6 ∙ (0,06)2 ∙ 8,82 − 3 ∙ (0,06)4 = 233,41

1 7
𝑚4 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 233,41 − ∙ 9 ∙ 8,82 + ∙ 81 = 191,36
2 240
𝑚1 Y 𝑚3 no necesitan correcciones

CLASES 𝑓 𝑥𝑖 𝑢 (𝑢 + 1) 𝑓(𝑢 + 1) 𝑓(𝑢 + 1)2 𝑓(𝑢 + 1)3 𝑓(𝑢 + 1)4


20 - 22 3 21 -2 -1 -3 3 -3 3
23 - 25 10 24 -1 0 0 0 0 0
26 - 28 25 27 0 1 25 25 25 25
29 - 31 7 30 1 2 14 28 56 112
32 - 34 5 33 2 3 15 45 135 405
∑ = 51 ∑ = 101 ∑ = 213 ∑ = 545

∑ 𝑓(𝑢 + 1) = 51
∑ 𝑓(𝑢 + 1)2 = 101
∑ 𝑓(𝑢 + 1)3 = 213
∑ 𝑓(𝑢 + 1)4 = 545

5.3 SESGO
Medida de Sesgo: En un análisis estadístico de una serie de valores, no sólo interesa
conocer el promedio y la dispersión de los datos, sino también cómo se refleja o
acerca esta serie a una distribución simétrica.

Sesgo: Es el grado de asimetría de una distribución. Si una curva de frecuencias


(polígono de frecuencias suavizados) de una distribución tiene una cola más larga
hacia la derecha del máximo central que hacia la izquierda, se dice que la distribución
es sesgada a la derecha, o que tiene sesgo positivo. Si ocurre lo contrario, se dice que
es sesgada a la izquierda o que tiene un sesgo negativo.

47
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

En las distribuciones sesgadas, la media tiende encontrarse del mismo lado que la
cola más larga opuesto al de la moda. Por lo tanto, una medida de la simetría (o
sesgo) se obtiene de la siguiente manera:

𝑥̅ − 𝑀𝑜
𝑆𝑒𝑠𝑔𝑜 =
𝑆
Para evitar el uso de la moda se puede utilizar la fórmula empírica y definir:

3(𝑥̅ − 𝑀𝑑)
𝑆𝑒𝑠𝑔𝑜 =
𝑆
A estas ecuaciones se les llama respectivamente, primer coeficiente de sesgo de
Pearson y segundo coeficiente de sesgo de Pearson.

Ejemplo.

Hallar el primer y segundo coeficiente de Pearson en la siguiente distribución

Clases 𝒇𝒊 𝒙𝒊 𝒇𝒂 𝒇𝒊 ∙ 𝒙𝒊 𝒙𝒊 𝟐 𝒇𝒊 ∙ 𝒙𝒊 𝟐
20 - 24 5 22 5 110 484 2.420
25 - 29 20 27 25 540 729 14.580
30 - 34 50 32 75 1.600 1.024 51.200
35 - 39 15 37 90 555 1.369 20.535
40 - 44 10 42 100 420 1.764 17.640
∑ 𝑓𝑖 =100 ∑ 𝑓𝑖 𝑥𝑖 = 3.225 ∑ 𝑓𝑖 ∙ 𝑥𝑖 2 = 106.375

Solución:

Cálculo de la Media Aritmética


∑𝑓 𝑥 3.225
𝑋̅ = ∑ 𝑓𝑖 ⟹ ̅𝑋 = 100 = 32,25
𝑖

48
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Cálculo de la Desviación Típica

∑ 𝑓𝑖 ∙𝑥𝑖 2 106.375
𝑆=√ − 𝑥̅ 2 = √ − 32,252 = √1.063,75 − 1.040,06
𝑁 100

𝑆 = √23,6875 = 4,87

Cálculo de la Mediana
𝑓
∑ 𝑖 − 𝑓𝑎𝑒 50 − 25
𝑀𝑑 = 𝐿𝑖𝑟 + ( 2 ) ∙ 𝑖𝑐 ⟹ 𝑀𝑑 = 29,5 + ( ) ∙ 5 = 32
𝑓𝑖𝑑 50

Cálculo de la Moda

∆1 50−20
𝑀𝑜 = 𝐿𝑖𝑟 + (∆1+∆2) ∙ 𝑖𝑐 ⟹ 𝑀𝑜 = 29,5 + [(50−20)+(50−15)] ∙ 5 = 31,81

Cálculo del primer coeficiente de sesgo

𝑥̅ − 𝑀𝑜
𝑆𝑒𝑠𝑔𝑜1 =
𝑆
32,25 − 31,81
𝑆𝑒𝑠𝑔𝑜1 = = 0,09
4,87

Cálculo del segundo coeficiente de sesgo

3(𝑥̅ − 𝑀𝑑)
𝑆𝑒𝑠𝑔𝑜 =
𝑆
3(32,25 − 32)
𝑆𝑒𝑠𝑔𝑜 = = 0,15
4,87

5.4 CURTOSIS
La curtosis indica qué tan puntiaguda es una distribución; esto por lo regular es en
relación con la distribución normal.
A una distribución que tiene un pico relativamente se le llama Leptocurtica, en tanto
que si es relativamente aplastado se le dice platicúrtica. Una distribución normal, que
no es ni puntiaguda ni muy aplastada se llama mesocúrtica.
En una medida de curtosis se emplea el cuarto momento respecto a la media
aritmética, expresada en forma adimensional (que no tiene dimensiones), esta medida
se encuentra dada por:

49
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

𝑚4
𝑎2 =
𝑚2 2
Dónde:
𝑎2 : Es el coeficiente de Curtosis
𝑚4 : Momento cuatro
𝑚2 : Momento dos.
Cuando 𝑎2 − 3 = 0 , la distribución es Mesocúrtica
Cuando 𝑎2 − 3 > 0 , la distribución es Leptocurtica
Cuando 𝑎2 − 3 < 0 , la distribución es Platicúrtica

Ejemplo:

Calcular el coeficiente de Curtosis si 𝑚4 = 233,41 y 𝑚2 = 8,82


𝑚4 233,41 233,41
𝑎2 = ⟹ 𝑎 2 = = =3
𝑚2 2 8,822 77,79

𝑎2 − 3 = 3 − 3 = 0 La distribución es Mesocúrtica

50
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 5

1. La tabla muestra una distribución de frecuencia de los salarios semanales de 65


empleados de la empresa “XYZ”. Con los datos de esta tabla calcular los momentos
con respecto a la media arbitraria y la media aritmética, La comprobación de Charlier
y la corrección de Sheppard

SALARIOS 𝑓
25.000 - 25.999 8
26.000 - 26.999 10
27.000 - 27.999 16
28.000 - 28.999 14
29.000 - 29.999 10
30.000 - 30.999 5
31.000 - 31.999 2

2. En la siguiente tabla de distribución de frecuencia encontrar: El primer coeficiente


de sesgo de Pearson y el segundo coeficiente de sesgo de Pearson. Utilice la fórmula
abreviada, para hallar la desviación típica

CLASES fi
60 - 62 5
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8

3. Calcular el coeficiente de curtosis en la siguiente distribución, los coeficientes de


Pearson

CLASES fi
45 - 55 6
55 - 65 10
65 - 75 19
75 - 85 11
85 - 95 4

51
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 6

REGRESIÓN Y CORRELACIÓN
6.1. REGRESIÓN:
La regresión estadística o regresión a la media es la tendencia de una medición
extrema a presentarse más cercana a la media en una segunda medición. La regresión
se utiliza para predecir una medida basándonos en el conocimiento de otra. Es una
técnica estadística utilizada para simular la relación existente entre dos o más
variables. Por lo tanto se puede emplear para construir un modelo que permita
predecir el comportamiento de una variable dada.

Análisis de regresión

El objetivo principal del análisis de regresión es estimar el valor de una variable


aleatoria (la variable dependiente) dado que se conoce el valor de una variable
asociada (la variable independiente). La variable dependiente también se denomina
variable de respuesta, mientras que la variable independiente también se denomina
variable predictora.
La ecuación de regresión es la fórmula algebraica mediante la cual se determina el
valor estimado de la variable dependiente o variable respuesta, y representa al modelo
de regresión lineal simple

𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖

𝑌𝑖 = valor de la variable dependiente en el ensayo u observación i-ésima

𝛽0 = primer parámetro de la ecuación de regresión, que indica el valor de Y cuando


X=0

𝛽1 = segundo parámetro de la ecuación de regresión, llamado coeficiente de


regresión, que indica la pendiente de la recta de regresión.

𝑋𝑖 = valor especificado de la variable independiente en el ensayo u observación


i-ésima.
𝜀𝑖 = error aleatorio de muestreo en el ensayo u observación i-ésima
𝜀𝑖 = 𝑦𝑖 − 𝑦̅

52
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ecuación estimada de regresión (lineal simple)

Los parámetros, 𝛽0 y 𝛽1, del modelo se estiman por los estadísticos muestrales
𝑏𝑜 y 𝑏1 , los cuales se calcula utilizando el método de mínimos cuadrados.

𝑦̂ = 𝑏0 + 𝑏1 𝑥

En la regresión lineal simple, la gráfica de la ecuación de regresión se llama Línea


de Regresión Estimada 𝑦̅ es el valor estimado de 𝑦𝑖 para un valor específico 𝑥𝑖 . El
método de mínimos cuadrados consiste en hallar los valores de 𝑏𝑜 y 𝑏1 que hacen
mínima la suma de los cuadrados de las desviaciones entre los valores observados de
la variable dependiente 𝑦𝑖 , y los valores estimados de la misma 𝑦𝑖 . Es decir se
minimiza la suma ∑(𝑦𝑖 − 𝑦̅𝑖 )2 .
Al aplicar el método se llega al sistema de ecuaciones simultáneas (llamadas
ecuaciones normales de la recta de regresión de y en x), cuya solución da los valores
de 𝑏𝑜 y 𝑏1 es:

∑ 𝑦𝑖 = 𝑛𝑏𝑜 + (∑ 𝑥𝑖 )𝑏1
{
∑ 𝑥𝑖 𝑦𝑖 = (∑ 𝑥𝑖 )𝑏0 + (∑ 𝑥𝑖 2 )𝑏1

Dónde:

𝑏0 = 𝑦̅ − 𝑏1 𝑥̅

∑ 𝑥𝑖 ∑ 𝑦𝑖
∑ 𝑥𝑖 𝑦𝑖 − 𝑆𝑥𝑦
𝑏1 = 𝑛 =
∑ 𝑥𝑖 2 −
(∑ 𝑥𝑖 )2 𝑆𝑥 2
𝑛

6.2. DIAGRAMA DE DISPERSIÓN


Un diagrama de dispersión es una gráfica en la cual cada punto representa un par
de valores observados de las variables independiente y dependiente. El valor de la
variable independiente X se grafica en el eje horizontal, y el valor de la variable
dependiente Y en el eje vertical.
La forma de la relación que se representa en el diagrama de dispersión puede ser
curvilínea en lugar de ser lineal.

Ejemplo.

Determine la ecuación de regresión con los datos dados y el Diagrama de dispersión


de la siguiente tabla:

53
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖 2
2 58 116 4
6 105 630 36
8 88 704 64
8 118 944 64
12 117 1.404 144
16 137 2.192 256
20 157 3.140 400
20 169 3.380 400
22 149 3.278 484
26 202 5252 676
∑ 𝑥𝑖 =140 ∑ 𝑦𝑖 =1300 ∑ 𝑥𝑖 𝑦𝑖 = 21.040 2
∑ 𝑥𝑖 = 2.528

∑ 𝑥𝑖 140
𝑥̅ = = = 14
𝑁 10
∑ 𝑦𝑖 1300
𝑦̅ = = = 130
𝑁 10
∑ 𝑥𝑖 ∑ 𝑦𝑖
∑ 𝑥𝑖 𝑦𝑖 − 𝑆𝑥𝑦
𝑏1 = 𝑛 =
∑ 𝑥𝑖 2 −
(∑ 𝑥𝑖 )2 𝑆𝑥 2
𝑛
𝑏0 = 𝑦̅ − 𝑏1 𝑥̅

Solución:

140 ∙ 1300
21.040 − 21.040 − 18.200 2.840
𝑏1 = 10 = = =5
140 2 2.528 − 1.960 568
2.528 − 10

𝑏0 = 130 − 5 ∙ 14 = 130 − 70 = 60

La ecuación de regresión:
𝑦̂ = 𝑏0 + 𝑏1 𝑥

𝑦̂ = 60 + 5𝑥

54
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Gráfica

250

200

150
Valores Y
100 Linear (Valores Y)
50

0
0 10 20 30

Ejemplo
Las notas de 12 alumnos de una clase de Contabilidad y Estadística son las
siguientes:

CONTABILIDAD 2 3 4 4 5 6 6 7 7 8 10 10
ESTADÍSTICA 1 3 2 4 4 4 6 4 6 7 9 10

Diagrama de dispersión

12

10
ESTADISTICA

6
Valores Y
4
Linear (Valores Y)
2

0
0 5 10 15
CONTABILIDAD

55
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

6.3. CORRELACIÓN
Es el grado de asociación entre dos o más variable, cuando la relación se hace
entre dos variables diremos que hay correlación simple y cuando la relación, se hace
con más de dos variables diremos que la correlación es múltiple.

El coeficiente de correlación se simboliza "𝑟" y puede estar entre – 1 y 1


−1 ≤ 𝑟 ≤ 1
Si no hay ninguna relación entre las dos variables tendremos un coeficiente de
correlación igual a cero.
A mayor relación entre las dos variables el coeficiente de correlación se aproxima
más a uno.

TABLA PARA DETERMINAR LA CORRELACIÓN DE ACUERDO AL COEFICIENTE

Cuando 𝑟 < 0,20 Correlación Suave


Cuando 𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 0,21 − 0,40 Correlación Baja
Cuando 𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 0,41 − 0,70 Correlación Moderada
Cuando 𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 0,71 − 0,90 Correlación Alta
Cuando 𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 0,91 − 1 Correlación muy alta

Estos mismos valores de la tabla con signo negativo corresponden a la mis ma correlación
pero negativa.

CÁLCULO DEL COEFICIENTE DE CORRELACIÓN (FÓRMULA DE SPEARMAN)

(Para datos no Agrupados)


6 ∑ 𝐷2
𝑟 =1−
𝑁(𝑁 2 − 1)

𝑟 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛

𝐷 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑟𝑎𝑛𝑔𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑥 𝑒 𝑦

𝑁 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠

56
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo;

RANGO
ALUMNOS ESTADISTICA FINANZAS 𝐷 =𝑋−𝑌 𝐷2
𝑋 𝑌
A 18 20 2 1 1 1
B 20 12 1 4 -3 9
C 12 13 4 3 1 1
D 15 18 3 2 1 1
∑ 𝐷2 =12
Aplicamos la fórmula de Spearman:
6 ∑ 𝐷2
𝑟 =1−
𝑁(𝑁 2 − 1)
6 ∙ 12 72 −12
𝑟 =1− =1− = = −0,20
4(16 − 1) 60 60

𝑟 < 0,20 Correlación suave negativa

Representación gráfica:

4.5
4
3.5
3
FINANZAS

2.5
2 Valores Y
1.5
Linear (Valores Y)
1
0.5
0
0 2 4 6
ESTADÍSTICA

CÁLCULO DEL COEFICIENTE DE CORRELACIÓN POR CALIFICACIONES


ORIGINALES.

(Datos no agrupados)

Fórmula 1. Calificaciones Originales:


𝑁(∑ 𝑋𝑌) − ∑ 𝑋 ∙ ∑ 𝑌
𝑟=
√[𝑁(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝑁(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

57
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Fórmula 2, Con respecto a la Media Aritmética

∑(𝑋 − 𝑥̅ )(𝑌 − 𝑦̅)


𝑟= 𝑁
∑(𝑋 − 𝑥̅ ) 2 ∑(𝑌 − 𝑦̅)2
√( ) ( )
𝑁 𝑁
Ejemplo.

Tenemos las siguientes puntuaciones:

Para X = 0, 4, 1, 5 y 10.

Para Y = 8, 6, 15, 4, y 2

Construimos la tabla:

𝑋 𝑌 𝑋∙𝑌 𝑋2 𝑌2
0 8 0 0 64
4 6 24 16 36
1 15 15 1 225
5 4 20 25 16
10 2 20 100 4
∑ 𝑋 =20 ∑ 𝑌 = 35 ∑ 𝑋𝑌 = 79 ∑ 𝑋 2 = 142 ∑ 𝑌 2 = 345

Aplicamos la fórmula1.

𝑁(∑ 𝑋𝑌) − ∑ 𝑋 ∙ ∑ 𝑌
𝑟=
√[𝑁(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝑁(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

5 ∙ 79 − 20 ∙ 35 − 305 −305
𝑟= = = = −0,77
√[5 ∙ 142 − (20)2 ][5 ∙ 345 − (35)2 ] √(310)(500) 393,7

𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 − 0,90 𝑦 − 071 Correlación Alta Negativa

Aplicamos la fórmula 2, con respecto a la Media Aritmética.

𝑋 𝑌 (𝑋 − 𝑥̅ ) (𝑌 − 𝑦̅) (𝑋 − 𝑥̅ )(𝑌 − 𝑦̅) (𝑋 − 𝑥̅ )2 (𝑌 − 𝑦̅)2


0 8 -4 1 -4 16 1
4 6 0 -1 0 0 1
1 15 -3 8 -24 9 64
5 4 1 -3 -3 1 9
10 2 6 -5 -30 36 25
∑ 𝑋 =20 ∑ 𝑌 = 35 ∑(𝑋 − 𝑥̅ )(𝑌 − 𝑦̅)= -61 ∑(𝑋 − 𝑥̅ )2 = 62 ∑(𝑌 − 𝑦̅)2 = 100

58
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑(𝑋 − 𝑥̅ )(𝑌 − 𝑦̅)


𝑟= 𝑁
∑(𝑋 − 𝑥̅ ) 2 ∑(𝑌 − 𝑦̅)2
√( ) ( )
𝑁 𝑁

−61
5 −12,2
𝑟= = = −0,77
62 100 15,75
√ ∙
5 5

𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 − 0,90 𝑦 − 071 Correlación Alta Negativa

6.4. EL COEFICIENTE DE CORRELACIÓN DE PEARSON


El coeficiente de correlación de Pearson, pensado para variables cuantitativas
(escala mínima de intervalo), es un índice que mide el grado de covariación entre
distintas variables relacionadas linealmente. Adviértase que decimos "variables
relacionadas linealmente". Esto significa que puede haber variables fuertemente
relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la
correlación de Pearson. Por ejemplo, la relación entre la ansiedad y el rendimiento
tiene forma de U invertida; igualmente, si relacionamos población y tiempo la
relación será de forma exponencial. En estos casos (y en otros muchos) no es
conveniente utilizar la correlación de Pearson. Insistimos en este punto, que parece
olvidarse con cierta frecuencia.

El coeficiente de correlación de Pearson viene definido por la siguiente expresión:

∑ 𝑍𝑋 𝑧𝑌
𝑟𝑥𝑦 =
𝑁
Esto es, el coeficiente de correlación de Pearson hace referencia a la media de los
productos cruzados de las puntuaciones estandarizadas de X y de Y. Esta fórmula
reúne algunas propiedades que la hacen preferible a otras. A operar con puntuaciones
estandarizadas es un índice libre de escala de medida. Por otro lado, su valor oscila,
en términos absolutos, entre 0 y 1
Téngase en cuenta que las puntuaciones estandarizadas muestran, precisamente, la
posición en desviaciones tipo de un individuo respecto a su media. Reflejan la medida
en que dicho individuo se separa de la media. En este sentido, supongamos que para
cada individuo tomamos dos medidas en X e Y. La correlación entre estas dos
variables será perfecta positiva cuando cada individuo manifieste la misma
superioridad o inferioridad en cada una de ellas. Esto se cumple cuando su posición
relativa sea la misma, es decir, cuando sus puntuaciones tipo sean iguales (Zx= Zy).
En este caso la fórmula de la correlación se transforma en:

59
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑ 𝑍𝑋 𝑧𝑌 ∑ 𝑍𝑋 𝑍𝑋 ∑ 𝑍𝑋 2
𝑟𝑥𝑦 = = = =1
𝑁 𝑁 𝑁
Cuando la correlación es perfecta negativa los valores de Zx y Zy son exactamente
iguales pero de signo contrario, resultando los productos cruzados de Zx y Zy
negativos. En este caso, el valor de la correlación es el mismo que anteriormente pero
de signo negativo.
Cuando la correlación es nula, para un valor obtenido de X se podrá obtener
cualquier valor de Y; es decir, para un valor determinado de Zx la misma cantidad de
valores positivos y negativos de Zy. De todo ello resulta que la suma de productos
cruzados valdrá cero ya que habrá tantos productos positivos como negativos. Así
pues:
∑ 𝑍𝑋 𝑧𝑌
𝑟𝑥𝑦 = =0
𝑁
Otra fórmula de la correlación de Pearson en Puntuaciones Directa es:

∑ 𝑋𝑌 ̅ ̅
− 𝑋𝑌
𝑟𝑋𝑌 = 𝑁
𝑆𝑋 𝑆𝑌
Dónde:

∑ 𝑋2 ∑𝑋
𝑆𝑋 = √ − 𝑋̅ 2 ⟹ 𝑋̅ = 𝑁
𝑁

∑ 𝑌2 ∑𝑌
𝑆𝑌 = √ − 𝑌̅ 2 ⟹ 𝑌̅ = 𝑁
𝑁

Podemos expresar, igualmente, el coeficiente de correlación de Pearson en


puntuaciones diferenciales o centradas mediante la siguiente formula:
∑ 𝑥𝑦
𝑟𝑥𝑦 =
√∑ 𝑥 2 √∑ 𝑦 2
Dónde:
𝑥 = 𝑋 − 𝑋̅ e 𝑦 = 𝑌 − 𝑌̅
Ejemplo

Tenemos las siguientes puntuaciones en las variables X (inteligencia) e Y


(rendimiento académico):

X: 105 116 103 124 137 126 112 129 118 105
Y: 4 8 2 7 9 9 3 10 7 6

60
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Calcular el coeficiente de correlación de Pearson: a) en puntuaciones directas, b)


puntuaciones diferenciales y c) puntuaciones estandarizadas.

Solución:
a) Puntuaciones directas:
Fórmula:

∑ 𝑋𝑌 ̅ ̅
− 𝑋𝑌
𝑟𝑋𝑌 = 𝑁
𝑆𝑋 𝑆𝑌

Configuremos la siguiente tabla

𝑋 𝑌 𝑋2 𝑌2 𝑋𝑌
105 4 11.025 16 420
116 8 13.456 64 928
103 2 10.609 4 206
124 7 15.376 49 868
137 9 18.769 81 1.233
126 9 15.876 81 1.134
112 3 12.544 9 336
129 10 16.641 100 1.290
118 7 13.924 49 826
105 6 11.025 36 630
∑ 𝑋 =1175 ∑ 𝑌 =65 ∑ 𝑋 2 =139.245 ∑ 𝑌 2 =489 ∑ 𝑋𝑌 =7.871

Calculamos la Media Aritmética

∑ 𝑋 1.175
𝑋̅ = = = 117,5
𝑁 10
∑ 𝑌 65
𝑌̅ = = = 6,5
𝑁 10
Cálculo de la Desviaciones Estándar de X e Y

∑ 𝑋2 139.245
𝑆𝑥 = √ − 𝑋̅ 2 ⟹ 𝑆𝑥 = √ − (117,5)2 = √13.924,5 − 13.806,25
𝑁 10

𝑆𝑥 = √118,25 = 10,874

∑ 𝑌2 489
𝑆𝑌 = √ − 𝑌̅ 2 ⟹ 𝑆𝑌 = √ − (6,5)2 = √48,9 − 42,25
𝑁 10

61
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

𝑆𝑌 = √6,65 = 2,579

Aplicamos la fórmula:

∑ 𝑋𝑌 ̅ ̅ 7.871
− 𝑋𝑌 − (117,5) ∙ (6,5) 787,1 − 763,75
𝑟𝑋𝑌 = 𝑁 ⟹ 𝑟𝑋𝑌 = 10 =
𝑆𝑋 𝑆𝑌 (10,874)(2,579) 28,044

23,35
𝑟𝑋𝑌 = = 0,8327
28,044

b) Puntuaciones Diferenciales o Centradas


Se hace la siguiente transformación:
𝑥 = 𝑋 − 𝑋̅
𝑦 = 𝑌 − 𝑌̅

𝑋 𝑌 𝑋̅ 𝑥 𝑌̅ 𝑦 𝑥2 𝑦2 𝑥𝑦
105 4 117,5 -12,50 6,5 -2,50 156,25 6,25 31,25
116 8 117,5 -1,50 6,5 1,50 2,25 2,25 -2,25
103 2 117,5 -14,50 6,5 -4,50 210,25 20,25 65,25
124 7 117,5 6,50 6,5 0,50 42,25 0,25 3,25
137 9 117,5 19,50 6,5 2,50 380,25 6,25 48,75
126 9 117,5 8,50 6,5 2,50 72,25 6,25 21,25
112 3 117,5 -5,50 6,5 -3,50 30,25 12,25 19,25
129 10 117,5 11,50 6,5 3,50 132,25 12,25 40,25
118 7 117,5 0,50 6,5 0,50 0,25 0,25 0,25
105 6 117,5 -12,50 6,5 -0,50 156,25 0,25 6,25
∑ 𝑋 =1175 ∑ 𝑌 =65 ∑ 𝑥 =0 ∑𝑦 = 0 ∑ 𝑥 2 =1182,5 ∑ 𝑦 2 = 66,5 ∑ 𝑥𝑦 =233,5

Aplicamos la Fórmula:
∑ 𝑥𝑦 233,5 233,5
𝑟𝑥𝑦 = ⟹ 𝑟𝑥𝑦 = =
√∑ 𝑥 2 ∙ √∑ 𝑦 2 √1.182,5 ∙ √66,5 (34,387)(8,155)
233,5
𝑟𝑥𝑦 = = 0,8326
280,43
c) Puntuaciones Estandarizadas
Fórmulas:
∑ 𝑍𝑋 𝑧𝑌
𝑟𝑥𝑦 =
𝑁
𝑋 − 𝑋̅ 𝑌 − 𝑌̅
𝑍𝑥 = ; 𝑍𝑦 =
𝑆𝑋 𝑆𝑌

62
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Configuremos la tabla:

𝑋 𝑌 𝑋̅ 𝑆𝑋 𝑍𝑥 𝑌̅ 𝑆𝑌 𝑍𝑦 𝑍𝑥 𝑍𝑦
105 4 117,5 10,874 -1,15 6,5 2,579 -0,97 1,11
116 8 117,5 10,874 -0,14 6,5 2,579 0,58 -0,08
103 2 117,5 10,874 -1,33 6,5 2,579 -1,74 2,33
124 7 117,5 10,874 0,60 6,5 2,579 0,19 0,12
137 9 117,5 10,874 1,79 6,5 2,579 0,97 1,74
126 9 117,5 10,874 0,78 6,5 2,579 0,97 0,76
112 3 117,5 10,874 -0,51 6,5 2,579 -1,36 0,69
129 10 117,5 10,874 1,06 6,5 2,579 1,36 1,44
118 7 117,5 10,874 0,05 6,5 2,579 0,19 0,01
105 6 117,5 10,874 -1,15 6,5 2,579 -0,19 0,22
∑ 𝑋 =1175 ∑ 𝑌 =65 ∑ Zx = 0 ∑ 𝑍𝑦 = 0 ∑ 𝑍𝑥 𝑍𝑦 = 8,34

Aplicamos la fórmula:

∑ 𝑍𝑋 𝑧𝑌 8,34
𝑟𝑥𝑦 = ⟹ 𝑟𝑥𝑦 = = 0,834
𝑁 10

6.5. EL COEFICIENTE DE TAU-Y DE GOODMAN Y KRUSKAL

El coeficiente de Tau-y de Gooddman y Kruskall es una medida asimétrica que


varía entre el valor 0,0, para la ausencia de reducción en el error, y el valor 1,0, que
representa una reducción perfecta de error. El coeficiente Tau-y ha sido ideado para
tratar el problema de la predicción de la distribución de la variable dependiente Y.
En esto difiere del coeficiente lambda, que está indicado para predecir un valor
óptimo de la variable dependiente, la moda

El coeficiente Lambda de Goodman y Kruskall. Llamado también “Coeficiente de


predictibilidad de Guttman” se basa en la reducción proporcional del error en la
predicción de la moda, es decir número de aciertos que proporciona el conocer la
distribución dividido por el número de errores sin conocerla.

Fórmula:
(𝑁 − 𝑀𝑜𝑦 ) − (𝑁 − ∑ 𝑚𝑦 ) ∑ 𝑚𝑦 − 𝑀𝑜𝑦
𝜆𝑥𝑦 = =
𝑁 − 𝑀𝑜𝑦 𝑁 − 𝑀𝑜𝑦
Dónde:

𝑀𝑜𝑦 : La frecuencia modal global


∑ 𝑚𝑦 : La suma de frecuencias modales
N: Número total de casos

63
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

El numerador sería pues el número de aciertos cometidos bajo la predicción II


(conociendo la distribución de segunda variable) ∑ 𝑚𝑦 menos los aciertos de la
predicción I (sin conocer la distribución) 𝑀𝑜𝑦 . Al dividir por los errores de la
predicción I me debe dar una cifra entre 0, ninguna reducción (independencia total ya
que una variable no predice la otra o 1, si la puede predecir de forma total).

REDUCCIÓN PROPORCIONAL DEL ERROR (RPE)


Las medidas de tipo RPE consiste en simple cocientes o ratios de la cantidad de
error cometido al predecir la variable dependiente en dos situaciones: primeramente,
la predicción se realiza cuando no se conoce más que la distribución de la propia
variable dependiente y, en segundo lugar, la predicción se realiza cuando se dispone
del conocimiento adicional de una variable independiente y de la forma en que la
variable dependiente se distribuye dentro de las categorías de dicha variable
independiente.

Medida de asociación 𝑅𝑃𝐸


𝐸1 = 𝑁 − 𝑀𝑜𝑦
𝐸2 = 𝑁 − ∑ 𝑚𝑦
𝐸1 : Errores cometidos con predicción I
𝐸2 : Errores cometidos con predicción II
𝐸1 − 𝐸2
𝜆𝑥𝑦 =
𝐸1

Ejemplo:
Tras el hundimiento del Titanic de las 1285 personas que viajaban en él perecieron
800 y murieron 485 en función del sexo la distribución fue:

V M total %
Mueren 637 163 800 62,3
Sobreviven 138 347 485 37,7
Total 775 510 1.285 100
% 60,3 39,78
Solución.

Si pretendo acertar el destino de un pasajero cualquiera, sin saber nada más, me


aventuraría por decir que murió, ya que fueron mayoría los que perecieron (intervalo
modal) y tendría una posibilidad de errar de 𝑀𝑜𝑦 = 485.
Sabiendo que es hombre la posibilidad de que fallara mi pronóstico sería 𝑚1 = 138 .
Por el contrario si sé que es mujer, la posibilidad de errar es 𝑚2 = 163.

64
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

El error al conocer la distribución de la segunda variable es menor que si no la


conozco.

Error univariado bajo la predicción de la frecuencia modal global = 485

Error bivariado si es hombre =138

Error bivariado total =138+163=301

𝐸1 = 𝑁 − 𝑀𝑜𝑦 ⟹ 𝐸1 = 1.285 − 800 = 485

𝐸2 = 𝑁 − ∑ 𝑚𝑦 ⟹ 𝐸2 = 1.285 − (637 + 347) = 1.285 − 984 = 301

∑ 𝑚𝑦 − 𝑀𝑜𝑦 984 − 800 184


𝜆𝑥𝑦 = ⟹ 𝜆𝑥𝑦 = = = 0,38 ∙ 100 = 38%
𝑁 − 𝑀𝑜𝑦 1.285 − 800 485

También:

𝐸1 − 𝐸2 485 − 301 184


𝜏−𝑦 = 𝜆𝑥𝑦 = = = = 0,38
𝐸1 485 485

Ejemplo:
Supongamos que estamos estudiando la situación matrimonial de los cabezas de
familia y que hemos obtenido, a partir de una muestra representativa de la población,
los datos que se presentan en la siguiente tabla de distribución de frecuencia absoluta

tipo de familia
El cabeza de familia es hombre El cabeza de familia es mujer
Hay niño No hay niño Hay niño No hay niño
Situación matrimonial menores de 15 menores de 15 menores de 15 menores de 15
del cabeza de familia años años años años Total
Casado 6.444 4.804 78 50 11.376
Separado 20 126 250 106 502
Divorciado 19 237 284 276 816
Viudo 47 300 236 1.614 2.197
Total ∑ 𝑚𝑥 = 6.530 5.467 848 2.046 14.891

Nuestro interés concreto consiste en realizar predicciones sobre la situación


matrimonial de las personas que son cabezas de familia. A partir de la información
que contiene la tabla, nos va a resultar más fácil predecir, por ejemplo, que cabezas
de familia están casados. Así, si conocemos que el valor modal de la variable
situación matrimonial es “casado”, entonces el valor que más racionalmente se puede
predecir en relación de un cabeza de familia es que se encuentre casado, ya que si se

65
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

elige dicha categoría acertaremos con mayor frecuencia que si hubiéramos elegido el
resto de la categoría.
Esto es, si hubiéramos supuesto, antes de visitar a cada uno de los 14.891 cabezas
de familia entrevistados, que cada uno de ellos estaba casado, habríamos
acertado11.376 veces y nos hubiésemos equivocados (14.891 − 11.376 = 3.515)
ocasiones, Esta última cantidad representaría el número total de errores se predicción
que se cometería si predijéramos simplemente la moda global de la situación
matrimonial de la variable cabeza de familia.

Solución:

Fórmula:
∑ 𝑚𝑦 − 𝑀𝑜𝑦
𝜆𝑥𝑦 =
𝑁 − 𝑀𝑜𝑦

∑ 𝑚𝑦 = 6.444 + 4.804 + 284 + 1.614 = 13.146

𝑀𝑜𝑦 = 11.376

𝑁 = 14.891

13.146 − 11.376 1.770


𝜆𝑥𝑦 = = = 0,5035 ∙ 100 = 50,35%
14.891 − 11.376 3.515
El numerador expresa, la reducción de error conseguido al mejorar la información
que suministra la variable independiente, y el denominador expresa el error cometido
al disponer del mínimo de información que suministra el dolo conocimiento de la
variable dependiente,

𝐸1 = 𝑁 − 𝑀𝑜𝑦 ⟹ 𝐸1 = 14.891 − 11.376 = 3.515


𝐸2 = 𝑁 − ∑ 𝑚𝑦 ⟹ 𝐸2 = 14.891 − 13.146 = 1.745

𝐸1 − 𝐸2 3.515 − 1.745 1.770


𝜏−𝑦 = = = = 0,5035 ∙ 100 = 50,35%
𝐸1 3.515 3.515

EL COEFICIENTE DE TAU-Y DE GOODDMAN Y KRUSKALL

El coeficiente de Tau-y de Gooddman y Kruskall ser calcula a partir de la


siguiente fórmula:

𝐸1 − 𝐸2
𝜏−𝑦 =
𝐸1

66
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Dónde:
𝑁−𝑓𝑖
𝐸1 = ∑ [ ∙ (𝑓𝑖 )]
𝑁

𝐸1 : 𝑃𝑟𝑒𝑑𝑖𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑖𝑝𝑜 𝐼
𝑓𝑖 : 𝐸𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑡𝑒𝑔ℎ𝑜𝑟í𝑎 𝑖 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑁 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠

𝑁𝑖 − 𝑛𝑖
𝐸2 = ∑ ∑ [ ∙ (𝑛𝑖 )]
𝑁𝑖

𝐸2 : 𝑃𝑟𝑒𝑑𝑖𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑖𝑝𝑜 𝐼𝐼
𝑛𝑖 : 𝐸𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑒𝑙𝑑𝑖𝑙𝑙𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎 𝑖 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑐 𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
𝑁𝑖 = 𝐸𝑠 𝑒𝑙 𝑝𝑎𝑟𝑐𝑖𝑎𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒
𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
Ejemplo:

Tipo de familia (X)


El cabeza de familia es hombre El cabeza de familia es mujer
Situación matrimonial Hay niño No hay niño Hay niño No hay niño Total
del cabeza de familia menores de menores de menores de menores de 𝑓𝑖
(Y) 15 años (𝑛𝑖 ) 15 años (𝑛𝑖 ) 15 años (𝑛𝑖 ) 15 años (𝑛𝑖 )
Casado 6.444 4.804 78 50 11.376
Separado 20 126 250 106 502
Divorciado 19 237 284 276 816
Viudo 47 300 236 1.614 2.197
Total ∑ 𝑚𝑥 = 6.530 5.467 848 2.046 𝑁 =14.891

Solución:
Errores que se cometería al predecir la situación matrimonial a partir de los datos de
la tabla:
Errores bajo la predicción I (𝐸1 ),sin conocer la distribución de la variable
independiente

𝑁−𝑓𝑖
𝐸1 = ∑ [ ∙ (𝑓𝑖 )]
𝑁

14.891−11.376
14.891
∙ (11.376) = 2.685,29 Errores para la categoría de casados

67
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

14.891−502
∙ (502) = 485,08 Errores para la categoría de separados
14.891

14.891−816
∙ (816) = 771,28 Errores para la categoría de divorciados
14.891

14.891−2.197
∙ (2.197) = 1.872,86 Errores para la categoría de viudos
14.891

𝐸1 = 2.685,29 + 485,08 + 771,28 + 1.872,86 = 5.814,51

Errores bajo la predicción I (𝐸2 ) conociendo la distribución de la variable


independiente

𝑁𝑖 −𝑛𝑖
𝐸2 = ∑ ∑ [ ∙ (𝑛𝑖 )]
𝑁𝑖

𝑁𝑖 −𝑛𝑖 6.530−6.444
∙ (𝑛𝑖 ) = ∙ (6.444) = 84,87 Errores para la categoría de casados
𝑁𝑖 6.530

𝑁𝑖 −𝑛𝑖 6.530−20
∙ (𝑛𝑖 ) = ∙ (20) = 19,94 Errores para la categoría de separados
𝑁𝑖 6.530

𝑁𝑖 −𝑛𝑖 6.530−19
∙ (𝑛𝑖 ) = ∙ (19) = 18,94 Errores para la categoría de divorciados
𝑁𝑖 6.530
𝑁𝑖 −𝑛𝑖 6.530−47
∙ (𝑛𝑖 ) = ∙ (47) = 46,66 Errores para la categoría de viudos
𝑁𝑖 6.530
𝑁𝑖 −𝑛𝑖
∑[ ∙ (𝑛𝑖 )] = 170,41,
𝑁𝑖

Error esperado para la categoría cabeza de familia varón con niños menores de 15
años = 170,41
𝑁𝑖 −𝑛𝑖 5.467−4.804
∙ (𝑛𝑖 ) = ∙ (4.804) = 582,60 Errores para la categoría de casados
𝑁𝑖 5.467

𝑁𝑖 −𝑛𝑖 5.467−126
∙ (𝑛𝑖 ) = ∙ (126) = 123,09 Errores para la categoría de separados
𝑁𝑖 5.467

𝑁𝑖 −𝑛𝑖 5.467−237
∙ (𝑛𝑖 ) = ∙ (237) = 226,73 Errores para la categoría de divorciados
𝑁𝑖 5.467

𝑁𝑖 −𝑛𝑖 5.467−300
∙ (𝑛𝑖 ) = ∙ (300) = 283,54 Errores para la categoría de viudos
𝑁𝑖 5.467

𝑁𝑖 −𝑛𝑖
∑[ ∙ (𝑛𝑖 )] = 1.215,96
𝑁𝑖

68
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Error esperado para la categoría cabeza de familia varón sin niños menores de 15
años = 1.215,96

𝑁𝑖 − 𝑛𝑖 848 − 78
∙ (𝑛𝑖 ) = ∙ (78) = 70,83
𝑁𝑖 848

𝑁𝑖 − 𝑛𝑖 848 − 250
∙ (𝑛𝑖 ) = ∙ (250) = 176,29
𝑁𝑖 848

𝑁𝑖 − 𝑛𝑖 848 − 236
∙ (𝑛𝑖 ) = ∙ (284) = 204,96
𝑁𝑖 848

𝑁𝑖 − 𝑛𝑖 848 − 236
∙ (𝑛𝑖 ) = ∙ (236) = 170,32
𝑁𝑖 848
𝑁𝑖 −𝑛𝑖
∑[ ∙ (𝑛𝑖 )] = 622,40
𝑁𝑖

Error esperado para la categoría cabeza de familia mujer con niños menores de 15
años = 622,40

𝑁𝑖 − 𝑛𝑖 2.046 − 50
∙ (𝑛𝑖 ) = ∙ (50) = 48,78
𝑁𝑖 2.046

𝑁𝑖 − 𝑛𝑖 2.046 − 106
∙ (𝑛𝑖 ) = ∙ (106) = 100,51
𝑁𝑖 2.046

𝑁𝑖 − 𝑛𝑖 2.046 − 276
∙ (𝑛𝑖 ) = ∙ (276) = 238,77
𝑁𝑖 2.046

𝑁𝑖 − 𝑛𝑖 2.046 − 1.614
∙ (𝑛𝑖 ) = ∙ (1.614) = 340,79
𝑁𝑖 2.046
𝑁𝑖 −𝑛𝑖
∑[ ∙ (𝑛𝑖 )] = 728,85
𝑁𝑖

Error esperado para la categoría cabeza de familia mujer sin niños menores de 15
años = 728,85
𝑁𝑖 −𝑛𝑖
𝐸2 = ∑ ∑ [ ∙ (𝑛𝑖 )] = 170,41 + 1.215,96 + 622,40 + 728,85
𝑁𝑖

𝐸2 = 2.737,62

69
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Aplicamos los valores obtenidos en 𝐸1 𝑦 𝐸2 en la fórmula

𝐸1 − 𝐸2 5.814,51 − 2.737,62
𝜏−𝑦 = ⟹ 𝜏−𝑦 = = 0,53𝑥100 = 53%
𝐸1 5.814,51

Esto nos indica que se han reducido en un 53% los errores cometidos al predecir la
colocación de los casos las categorías de la variable dependiente, mediante la
información que aporta la distribución de los casos en la variable independiente.
Naturalmente, si en lugar de haber considerado independiente la variable “tipo de
familia” hubiéramos estados interesados en la predicción de esta variable a partir de
la distribución se la variable “situación matrimonial”, se hubiese obtenido un valor de
𝜏−𝑦 diferente porque se trata de una medida asimétrica.

70
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIO UNIDAD 6

1. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe


de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
calcular la ecuación de regresión con los datos dados y el Diagrama de dispersión

N° de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40

2. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:


Estatura (X) 186 189 190 192 193 193 198 201 203 205
Peso (Y) 85 85 86 90 87 91 93 103 100 101
Calcular la ecuación de regresión con los datos dados, el peso estimado de un jugador
que mide 208 cm. y el Diagrama de dispersión

3. A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a


unidades producidas (Y), determinar la recta de regresión de Y sobre X, el
coeficiente de correlación lineal e interpretarlo.
Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62
Producción (Y) 300 302 315 330 300 250 300 340 315 330 310 240

4. Dados los siguientes casos, calcular el coeficiente de correlación por rango y,


construir la gráfica correspondiente a cada uno de ellos:
a)
Alumno Matemática Contabilidad
A 20 20
B 20 12
C 12 12
b) D 15 12

Alumno Finanzas Estadística


A 12 15
B 12 15
C 12 15
D 12 15
c)
Alumno Financiera Contabilidad
A 10 13
B 11 12
C 12 11
D 13 10

5. Dados los siguientes casos, calcular el coeficiente de Correlación por calificaciones


originales y a la media originales

Para X = 4, 3, 5, 2, y 1
Para Y = 6, 2, 0, 4 y 3

71
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

6. Dados los siguientes casos, calcular el coeficiente de Correlación por calificaciones


originales y con relación a la media originales,

Para X = 2, 7, 4, 3, y 5
Para Y = 1, 6, 9, 2 y 4

7. Una compañía desea hacer predicciones del valor anual de sus ventas totales en
cierto país a partir de la relación de éstas y la renta nacional. Para investigar la
relación cuenta con los siguientes datos:

Renta Nacional (X) 189 190 208 227 239 252 257 274 293 308 316
Ventas (Y) 402 404 412 425 429 436 440 447 458 469 469

X representa la renta nacional en millones de Dólares e Y representa las ventas de la


compañía en miles de Dólares en el periodo que va desde 2012 hasta 2014 (ambos
inclusive). Calcular: El coeficiente de correlación de Pearson: a) en puntuaciones
directas, b) puntuaciones diferenciales y c) puntuaciones estandarizadas.

8. En una encuesta realizada entre la población juvenil, se obtuvo la siguiente


distribución de la identificación religiosa de los jóvenes según el lugar de residencia.

LUGAR DE RESIDENCIA
Religiosidad Rural Semi-urbano Urbano Metropolitano
Católico practicante 320 305 188 80
Católico no practicante 432 290 170 62
Indiferente 280 212 126 66
No creyente 60 35 20 3

Calcular el valor de la asociación entre ambas variables mediante el coeficiente de


Lambda, considerando el lugar de residencia como la variable independiente, aplique
el coeficiente Tau-y de Goodman y Kruskal

72
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

UNIDAD 7
SERIES CRONOLÓGICAS

0. NÚMEROS INDICES
Generalmente las magnitudes socioeconómicas varían en el espacio y/o en el
tiempo y normalmente surge la necesidad de hacer comparaciones en función del
tiempo y/o el espacio, tanto por separado como por grupos o conjunto de las mismas.
Con el fin de poder realizar estas comparaciones es necesario elaborar series de
indicadores económicos, siendo los números índices uno de ellos. La teoría de los
números índices se ha desarrollado, fundamentalmente, para el estudio de las
variaciones de precios, tratando de medir el nivel general de precios e inversamente,
el poder adquisitivo del dinero. Sin embargo, la aplicabilidad de estos indicadores no
se limita al estudio de los precios, utilizándose en todos los campos de la actividad
humana que se pueden observar y cuantificar estadísticamente. En economía tienen
un gran empleo, existiendo números índice de salarios, producción, precios, comercio
exterior, y otros.

7.1 DEFINICIÓN
Los números índices constituyen una técnica para analizar y comparar un conjunto
de datos en distintos momentos del tiempo y/o del espacio. Mediante los números
índices se pretende estudiar las variaciones de un fenómeno complejo por medio de
una expresión que permita comparar dos o más situaciones distintas en el tiempo y/o
el espacio. Actualmente, los números índice son muy utilizados y cada vez más
conocidos, digamos: ¿Quién no ha escuchado hablar del índice de Precios al
Consumidor (IPC) que se emite mensualmente, del índice de inflación que emite el
Banco Central trimestralmente, del índice de precios y cotizaciones que maneja la
Bolsa de Valores, del promedio industrial Dow Jones, del índice Nasdaq o del
Promedio accionario Estándar & Poor?
El período de referencia se llama también período base y a veces se toma como tal
no un solo período sino el promedio de varios de ellos, como cuando se dice, por
ejemplo, que el consumo de un artículo es de130% respecto a la década .2010-2015

73
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

7.2 NATURALEZA.
Los números índices pueden tener distinta naturaleza:
a) NATURALEZA ESTADISTICA, cuando se obtienen sin tener en cuenta las
posibles relaciones funcionales de las magnitudes en estudio, y
b) NATURALEZA FUNCIONAL, cuando se obtienen suponiendo una relación
funcional entre los valores de las variables y su entorno. En este tema nos
centraremos en los números índices de naturaleza estadística y comentaremos los de
naturaleza funcional en un anexo.
En resumen, podemos decir que un número índice, indica, mediante sus
variaciones, los cambios de una magnitud que no es susceptible de medición exacta
en sí misma, ni de una evaluación directa en la práctica.

7.3 CLASIFICACIÓN
Atendiendo a la naturaleza estadística, podemos establecer la siguiente
clasificación de los números índice:
Índices Simples: Los números índices simples se refieren a un solo artículo o
concepto, lo cual se traduce a trabajar con una variable unidimensional. Son simples
relaciones o porcentajes entre los valores de un artículo o concepto correspondientes
a dos épocas o lugares que desean compararse. La comparación se realiza entre el
valor correspondiente a un periodo fijo (periodo base) y el valor alcanzado por la
magnitud en cualquier otro momento i.

Un índice simple representa el porcentaje de variación del renglón en el año


considerado respecto al año base.
El índice así definido nos da el tanto por uno en que se ha modificado la magnitud
P desde el periodo 0 al periodo i. Normalmente se utiliza el índice en términos
porcentuales:
𝑝 𝑞
𝐼𝑝𝑖⁄ (𝑃) = 𝑝 𝑖 𝑥100 𝐼𝑞𝑖⁄ (𝑃) = 𝑞 𝑖 𝑥100
𝑝0 𝑜 𝑞0 𝑜

Dónde:

𝑝0 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑑𝑒𝑙 𝑏𝑖𝑒𝑛 𝑒𝑛 𝑒𝑙 𝑎ñ𝑜 𝑏𝑎𝑠𝑒


𝑝𝑖 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑑𝑒𝑙 𝑏𝑖𝑒𝑛 𝑒𝑛 𝑒𝑙 𝑎ñ𝑜 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑑𝑜
𝑞0 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑏𝑖𝑒𝑛 𝑒𝑛 𝑒𝑙 𝑎ñ𝑜 𝑏𝑎𝑠𝑒
𝑞𝑖 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑏𝑖𝑒𝑛 𝑒𝑛 𝑒𝑙 𝑎ñ𝑜 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑑𝑜

74
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Ejemplo:
La siguiente serie se refiere a los derechos liquidados en el Banco Industrial:

a) Calcular un índice simple para estudiar la evolución de los pagos, tomando como
periodo de referencia el año 2010
b) Interpretar algunos de los índices
c) Calcular un índice simple para estudiar la evolución de los pagos, tomando como
periodo de referencia el promedio de los años 2011 y 2012

𝑡 (Años) 𝑃𝑡 (Millones de Bs.) Índice Simple de Precio


2010 13.429 100
2011 14.454 107,6
2012 16.663 124,1
2013 18.085 134,7
2014 4.768 35,5
2015 5.210 38,8

a) Hallar los índices simples respecto al período 𝑝0 = 2010


𝑝
𝐼𝑝𝑖⁄ (𝑃) = 𝑝 𝑖 𝑥100
𝑝0 𝑜

13.429
𝐼2010⁄ (𝑃) = 𝑥100 = 1𝑥100 = 100%
2010 13.429
14.454
𝐼2011⁄ (𝑃) = 𝑥100 = 1,076𝑥100 = 107,6%
2010 13.429
16.663
𝐼2012⁄ (𝑃) = 𝑥100 = 1,241𝑥100 = 124,1%
2010 13.429
18.085
𝐼2013⁄ (𝑃) = 𝑥100 = 1,347𝑥100 = 134,7%
2010 13.429
4.768
𝐼2014⁄ (𝑃) = 𝑥100 = 0,355𝑥100 = 35,5%
2010 13.429
5.210
𝐼2015⁄ (𝑃) = 𝑥100 = 0,388𝑥100 = 38,8%
2010 13.429

b) Interpretar alguno de los índices.


Por ejemplo en el 2012 se liquidó 7,6% más que en 2010 mientras que en 2015
apenas se llegó liquidar el 38,8% de lo que se hizo en el 2010.

c) Índice simple para estudiar la evolución de los pagos, utilizando el promedio


(14.454+16.663) 31.117
Período Base: (2011 + 2012) = = = 15.558,50
2 2

13.429
𝐼2010⁄2010 (𝑃) = 15.558,50 = 0,863𝑥100 = 86,3%

75
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

14.454
𝐼2011⁄2010 (𝑃) = 15.558,50 = 0,929𝑥100 = 92,9%

16.663
𝐼2012/2010 (𝑃) = 15.558,50 = 0,1071𝑥100 = 107,1%

18.085
𝐼2013⁄2010 (𝑃) = 15.558,50 = 0,1162𝑥100 = 116,2%

4.768
𝐼2014⁄2010 (𝑃) = 15.558,50 = 0,307𝑥100 = 30,7%

5.210
𝐼2015⁄2010 (𝑃) = 15.558,50 == 0,335𝑥100 = 33,5%

Números Índices Compuestos: Los números índices compuestos hacen referencia a


varios artículos o conceptos a la vez (magnitudes complejas) y su evolución en el
espacio y/o el tiempo.
Supongamos que una empresa tiene tres productos 𝐴, 𝐵 y 𝐶; cada uno de los cuales
tiene su correspondiente precio (𝑃𝐴, 𝑃𝐵 𝑦 𝑃𝐶). Si nos interesara la evolución de cada
precio individualmente, hallaríamos los índices simples de 𝑃𝐴, 𝑃𝐵 y 𝑃𝐶, pero si lo
que queremos analizar es la evolución del precio general de la empresa, tendremos
que tener en cuenta la evolución conjunta de todos ellos. Esto lo podemos hacer de
dos formas:

a) Suponiendo que cada producto tiene la misma importancia relativa dentro de la


empresa, en este caso calcularíamos los INDICES COMPUESTO NO
PONDERADO.

b) Suponiendo que cada producto tiene distinta importancia relativa dentro de la


empresa. Calcularíamos los INDICES COMPUESTOS PONDERADOS.

Índices No Ponderados: Los índices no ponderados son los más sencillos de los
compuestos pero su utilidad es muy limitada. Los índices no ponderados de
agregados se construyen como el porcentaje de la suma de los agregados para cada
año, en relación del año base:
∑𝑝 ∑𝑞
𝐼𝑝𝑖⁄ (𝑃) = ∑ 𝑝 𝑖 𝑥100 𝐼𝑞𝑖⁄ (𝑃) = ∑ 𝑞 𝑖 𝑥100
𝑝0 𝑜 𝑞0 𝑜

Ejemplo
Los siguientes renglones constituyen los precios promedios para cada quinquenio
de las tres clases de tela usadas en la confección de vestido. Calcular los respectivos
índices compuestos agregados, tomando como base el quinquenio 2.000-2.004, y los
índices no ponderados.

76
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

a) Índice simple de la evolución de los precios tomando como periodo de referencia


el quinquenio 2.000 - 20004

𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠./𝑚2 Índices Simple de Precio


Años Tela A Tela B Tela C Tela A Tela B Tela C
2000 - 04 56 15 32 (56 ⁄ 56) ∙ 100 = 100 (15 ⁄ 15) ∙ 100 = 100 (32 ⁄ 32) ∙ 100 = 100
2005-09 62 18 50 (62 ⁄ 56) ∙ 100 = 110,7 (18 ⁄ 15) ∙ 100 = 120 (50 ⁄ 32) ∙ 100 = 156,3
2010-14 72 23 51 (72 ⁄ 56) ∙ 100 = 128,6 (23 ⁄ 15) ∙ 100 = 153,3 (51 ⁄ 32) ∙ 100 = 159,4

b) Índice conjunto de la evolución de los precios utilizando la media aritmética:

𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠./𝑚2

Años Tela A Tela B Tela C Media Aritmética

2000 - 04 56 15 32 34,33
2005-09 62 18 50 43,33
2010-14 72 23 51 48,67

c) Índice conjunto de la evolución de los precios utilizando la media geométrica:

𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠./𝑚2
3
Tela A Tela B Tela C 𝐴∙𝐵∙𝐶 𝐺 = √𝐴 ∙ 𝐵 ∙ 𝐶
Años
2000 - 04 56 15 32 26.880 163,95
2005-09 62 18 50 55.800 236,22
2010-14 72 23 51 84.456 290,61

d) Índice conjunto de la evolución de los precios utilizando la media ponderada:

𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠./𝑚2
Tela A Tela B Tela C Media Ponderada
Años
(56 + 15 + 32)
2000 - 04 56 15 32 𝑥100 = 100
(56 + 15 + 32)
(62 + 18 + 50)
2005-09 62 18 50 𝑥100 = 126,21
(56 + 15 + 32)
(72 + 23 + 51)
2010-14 72 23 51 𝑥100 = 141,75
(56 + 15 + 32)

77
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑𝑝
𝐼𝑝𝑖⁄ (𝑃) = ∑ 𝑝 𝑖 𝑥100
𝑝0 𝑜

Para 2.000-2004
(56+15+32)
𝐼2000−04⁄ (𝑃) = 𝑥100 = 100%
2000−04 (56+15+32)
(62+18+50)
𝐼2005−09⁄ (𝑃) = 𝑥100 = 126,21%
2000−04 (56+15+32)

(72+23+51)
𝐼2010−14⁄ (𝑃) = 𝑥100 = 141,75%
2000−04 (56+15+32)

El principal inconveniente consiste en que adjudica igual importancia a todos los


renglones

Índice no ponderado relativo: Son aquellos que tienen que ver con los precios (p) o
cantidades (q)
𝑘
1 𝑝𝑖
𝐼𝑡⁄0 (𝑃) = ∙ ∑
𝐾 𝑝0
𝑖=1
𝑘
1 𝑞𝑖
𝐼𝑡⁄0 (𝑄) = ∙ ∑
𝐾 𝑞0
𝑖=1

Es una media aritmética de los índices simple

Ejemplo

Una empresa fabrica el producto 𝐻 cuyos componentes son 𝐴, 𝐵 y 𝐶, suponiendo


que todos los componentes tienen la misma importancia relativa en 𝐻. Calcular
𝐼𝑡⁄0 (𝑄) e interpretar los resultados según la siguiente tabla:

𝑡 𝐴 𝐵 𝐶
0 2 1 3
1 4 2 2
2 5 1 1
3 7 3 1
4 9 4 4

78
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Solución:
a) Cálculo de los índices simples con respecto al instante 0 y los Índices no
Ponderados

𝑡 𝐴 𝐵 𝐶 𝐼𝑡⁄0 (𝐴) 𝐼𝑡⁄0 (𝐵) 𝐼𝑡⁄0 (𝐶) Índices no ponderados


1
0 2 1 3 1 1 1 ∙ (1 + 1 + 1) = 1𝑥100 = 100%
3
1
1 4 2 2 4⁄2 = 2 2⁄1 = 2 2⁄3 = 0,7 ∙ (2 + 2 + 0,7) = 1,6𝑥100 = 160%
3
1
2 5 1 1 5⁄2 = 2,5 1⁄1 = 1 1⁄3 = 0,3 ∙ (2,5 + 1 + 0,3) = 1,3𝑥100 = 130%
3
1
3 7 3 1 7⁄2 = 3,5 3⁄1 = 3 1⁄3 = 0,3 ∙ (3.5 + 3 + 0,3) = 2,3𝑥100 = 230%
3
1
4 9 4 4 9⁄2 = 4,5 4⁄1 = 4 4⁄3 = 1,3 ∙ (4,5 + 4 + 1,3) = 3,3𝑥100 = 330%
3

b) Interpretación: El producto H, en el momento 1, tiene 1,6 unidades por cada unidad


que tenía en el instante 0; en el momento 2, tiene 1,3 con respecto 0; etc. Una vez
calculados los índices para cada instante t en relación al periodo inicial podemos
calcular el incremento porcentual que ha tenido la magnitud H desde el instante 0 al
período actual:

Incremento del índice:


𝑞𝑡 − 𝑞𝑜
∆𝐼𝑡⁄ (𝑄) = 𝑥100
0 𝑞0

𝑞1 − 𝑞𝑜 1,6 − 1
∆𝐼1⁄ (𝑄) = 𝑥100 = = 0,6𝑥100 = 60%
0 𝑞0 1

𝑞2 − 𝑞𝑜 1,3 − 1
∆𝐼2⁄ (𝑄) = 𝑥100 = = 0,3𝑥100 = 30%
0 𝑞0 1

𝑞3 − 𝑞𝑜 2,3 − 1
∆𝐼3⁄ (𝑄) = 𝑥100 = = 1,3𝑥100 = 130%
0 𝑞0 1

𝑞4 − 𝑞𝑜 3,3 − 1
∆𝐼4⁄ (𝑄) = 𝑥100 = = 2,3𝑥100 = 230%
0 𝑞0 1

Índices Ponderados: Su objetivo es solucionar los problemas planteados por los


índices complejos sin ponderar. Los índices complejos ponderados tienen en cuenta la
importancia relativa de las distintas magnitudes simples que lo componen, que
denominaremos 𝑤 𝑖 . Por construcción se debe de cumplir:
𝑘

∑ 𝑤𝑡 𝑖 = 1
𝑖=1

79
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Para todo t, siendo k, el número de magnitudes simples que forman la magnitud


compleja.

Por ejemplo: ¿Qué importancia tiene la ponderación? Si queremos obtener un índice


de precios de consumo de una familia deberíamos:

1º Determinamos los elementos (magnitudes) que componen el consumo habitual de


una familia,

2º Averiguamos los precios de esos elementos.

3º Averiguamos la importancia relativa 𝑤 𝑖 de cada elemento en el consumo habitual


de la familia.

Es evidente que todas las familias consumen alimentos, vestido, vivienda y


energía; pero también es evidente que la importancia de cada uno de estos elementos
en el consumo habitual de una familia es muy distinta. Si diéramos la misma
importancia a todos ellos (índice complejo sin ponderar) obtendríamos un Índice de
Precios de Consumo (IPC) que poco tiene que ver con la realidad.

En función de la relación entre las ponderaciones 𝑤𝑡 𝑖 , podemos definir distintos


tipos de índices.

Índice de Laspeyres: De forma general, llamamos índice sintético de Laspeyres de la


magnitud compleja (𝑃) (formada por 𝑘 magnitudes simples) en el instante 𝑡, con
respecto al instante 0:
Cuando para un bien hay dos observaciones en cada período; precios y cantidades
de un artículo; escolaridad y cantidad de personas y otros, Laspeyres construye un
índice para cada período considerando la variación de una de las observaciones y
ponderándola con el valor de la otra en el período base.

∑ 𝑝𝑡 𝑖 ∙ 𝑞0 𝑖 ∑ 𝑞𝑡 𝑖 ∙ 𝑝0 𝑖
𝐿𝑝 = 𝑥100 𝐿𝑞 = 𝑥100
∑ 𝑝0 𝑖 ∙ 𝑞0 𝑖 ∑ 𝑞0 𝑖 ∙ 𝑝0 𝑖

𝑝 = 𝑝𝑟𝑒𝑐𝑖𝑜 ; 𝑞 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑

Ejemplo: El consumo nacional de los artículos M y N, en tres (3) años consecutivos


fue:
Años 2013 2014 2015
Miles de 𝑚3 (𝑞) 4.000 4.300 5.000
M 𝐵𝑠⁄
𝑚3 (𝑝) 2,00 2,20 2,50
Miles de 𝑚3 (𝑞) 1.500 2.000 2.200
N 𝐵𝑠⁄
𝑚3 (𝑝) 5,00 5,00 5,30

80
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑ 𝑝𝑡 𝑖 ∙ 𝑞0 𝑖
𝐿𝑝 = 𝑥100
∑ 𝑝0 𝑖 ∙ 𝑞0 𝑖

Año Base 2013


Para M: 𝑝01 = 2,00 ; 𝑞01 = 4.000

𝑁: 𝑝01 = 5,00 ; 𝑞01 = 1.500

Para 2.013
(2,00𝑥4.000) + (5,00𝑥1.500)
𝐿2013⁄2013 (𝑃) = 𝑥100 = 1𝑥100 = 100%
(2,00𝑥4.000) + (5,00𝑥1.500)

Para 2.014
(2,20𝑥4.000) + (5,00𝑥1.500)
𝐿2014⁄2013 (𝑃) = 𝑥100 = 1,052𝑥100 = 105,2%
(2,00𝑥4.000) + (5,00𝑥1.500)

Para 2.015
(2,50𝑥4.000) + (5,30𝑥1.500)
𝐿2015⁄2013 (𝑃) = 𝑥100 = 1,161𝑥100 = 116,1%
(2,00𝑥4.000) + (5,00𝑥1.500)

Estos índices construidos para los precios y ponderados con las cantidades
correspondiente al año base, expresan la variación porcentual hipotética del
rendimiento en el año considerado si se hubieran consumido las mismas cantidades
del año base 2.013

El índice 116,1 para 2.015 indica que, debido a la variación de los precios, si en
este año de hubieran consumido las mismas cantidades de 2.013, el costo hubiese
aumentado en un 16,1%. Es claro que no se toma en cuenta que las cantidades
también han variado.

Índice de Paasche: Llamamos índice sintético de Paasche de la magnitud compleja P


(formada por k magnitudes simples), en el instante t con respecto al instante 0, y lo
denotaremos por 𝑃𝑡⁄0 (𝑃) .
Este indicador, como el de Laspeyres, es un índice de agregados ponderados pero
la diferencia está en que las ponderaciones se hacen con las cantidades
correspondientes a cada uno de los lapsos considerados.

∑ 𝑝𝑡 𝑖 ∙ 𝑞𝑡 𝑖 ∑ 𝑞𝑡 𝑖 ∙ 𝑝𝑡 𝑖
𝑃𝑝 = 𝑥100 ; 𝑃𝑞 = 𝑥100
∑ 𝑝0 𝑖 ∙ 𝑞𝑡 𝑖 ∑ 𝑞0 𝑖 ∙ 𝑝𝑡 𝑖

81
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

La diferencia fundamental entre los índices de Laspeyres y Paasche estriba en las


ponderaciones, mientras que en Laspeyres, 𝑞 𝑖 se refiere al periodo base (𝑞0 𝑖 ), en
Paasche se refiere al periodo actual (𝑞𝑡 𝑖 ). Esto hace que su cálculo sea más difícil
puesto que en cada instante hay que calcular 𝑞𝑡 𝑖 .

Ejemplo:

Para los datos del ejemplo anterior (año base 2.013)

Para M: 𝑝01 = 2,00 ; 𝑞01 = 4.000


𝑁: 𝑝01 = 5,00 ; 𝑞01 = 1.500

Para 2.013

(2,00𝑥4.000) + (5,00𝑥1.500)
𝑃𝑝 = 𝑥100 = 1𝑥100 = 100%
(2,00𝑥4.000) + (5,00𝑥1.500)

Para 2.014

Para M: 𝑝0 2 = 2,20 ; 𝑞0 2 = 4.300


𝑁: 𝑝0 2 = 5,00 ; 𝑞0 2 = 2.000

Entre M: 𝑝01 = 2,00 ; 𝑞0 2 = 4.300


𝑁: 𝑝01 = 5,00 ; 𝑞0 2 = 2.000

(2,20𝑥4.300) + (5,00𝑥2.000)
𝑃𝑝 = 𝑥100 = 1,0107𝑥100 = 101,07%
(2,00𝑥4.300) + (5,00𝑥2.000)

Para 2015

Para M: 𝑝0 3 = 2,50 ; 𝑞0 3 = 5.000


𝑁: 𝑝0 3 = 5,30 ; 𝑞0 2 = 2.200
Entre:
M: 𝑝0 3 = 2,50 ; 𝑞0 3 = 5.000
𝑁: 𝑝0 2 = 5,00 ; 𝑞0 3 = 2.200

(2,50𝑥5.000) + (5,30𝑥2.200)
𝑃𝑝 = 𝑥100 = 1,1505𝑥100 = 115,05
(2,50𝑥5.000) + (5,00𝑥2.200)

82
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Índice de Fisher: Los indicadores de Laspeyres y de Paasche expresan situaciones


hipotéticas distintas que significan parcialidades de una realidad. Fischer construyó
un índice, a partir de los anteriores, que alcanza a cumplir algunas de las décimas
exigibles a un buen número de índice, aunque resulta más laboriosa su construcción.

El indicado de Fisher es la media geométrica de las dos anteriores:

𝐹𝑝 = √𝐿𝑝 ∙ 𝑃𝑝 Para los precios

𝐹𝑞 = √𝐿𝑞 ∙ 𝑃𝑞 Para las cantidades

Para los datos del ejemplo anterior (año base 2.013)

Para 2013 = año base = 100

Para 2.014 = 𝐹𝑝 = √𝐿𝑝 ∙ 𝑃𝑝 = √105,2 ∙ 101,7 = 1,0311𝑥 100 = 103,11

Para 2.015 = 𝐹𝑝 = √𝐿𝑝 ∙ 𝑃𝑝 = √116,1 ∙ 115,05 = 1,1557𝑥 100 = 115,57

Estas cantidades sr acerca más al verdadero indicador del rendimiento, teniendo en


cuenta tanto la variación de los precios como las cantidades

Ejemplo:

Dada la siguiente información sobre precios y cantidades vendidas (en miles de


bolívares) de determinados artículos:
Determinar:
Los índices de precios y cantidades de Laspeyres, Paasche y Fisher para el año 2014,
con respecto al año base 2012

AÑOS
2012 2013 2014
BIENES
𝑝 𝑞 𝑝 𝑞 𝑝 𝑞
Papas 50 150 60 140 75 135
Azúcar 150 430 180 450 200 460
Aceite 180 300 200 310 220 325
Pollo 1000 250 1150 270 1300 300

83
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

Solución:

Bienes 𝑝12 ∙ 𝑞12 𝑝12 ∙ 𝑞14 𝑝14 ∙ 𝑞12 𝑝14 ∙ 𝑞14


Papas 7.500 6.750 11.250 10.125
Azúcar 64.500 69.000 86.000 92.000
Aceite 54.000 58.500 66.000 71.500
Pollo 250.000 300.000 325.000 390.000
Sumas 376.000 434.250 488.250 563.625

a) Índice de precios de Laspeyres, Paasche y Fisher

∑ 𝑝 𝑖 ∙𝑞 𝑖 ∑𝑝 𝑖 ∙𝑞 𝑖 488.250
𝐿𝑝 = ∑ 𝑝𝑡 𝑖 ∙𝑞0 𝑖 𝑥100 ⟹ 𝐿𝑝 = ∑ 𝑝14 𝑖 ∙𝑞12𝑖 𝑥100 = 376.000 𝑥100 = 129,85
0 0 12 12

∑ 𝑝 𝑖 ∙𝑞 𝑖 ∑ 𝑝 𝑖 ∙𝑞 𝑖 563.625
𝑃𝑝 = ∑ 𝑝𝑡 𝑖 ∙𝑞𝑡 𝑖 𝑥100 ⟹ 𝑃𝑝 = ∑ 𝑝14𝑖 ∙𝑞14𝑖 𝑥100 = 434.250 𝑥100 = 129,79
0 𝑡 12 14

𝐹𝑝 = √𝐿𝑝 ∙ 𝑃𝑝 = √129,85 ∙ 129,79 = 129,82

b) Índice de cantidad de Laspeyres, Paasche y Fisher

∑ 𝑞 𝑖 ∙𝑝 𝑖 ∑𝑞 𝑖 ∙𝑝 𝑖 434.250
𝐿𝑞 = ∑ 𝑞 𝑡 𝑖 ∙𝑝0 𝑖 𝑥100 ⟹ 𝐿𝑞 = ∑ 𝑞14𝑖 ∙𝑝12𝑖 𝑥100 = 376.000 = 115,49
0 0 12 12

∑ 𝑞 𝑖 ∙𝑝 𝑖 ∑𝑞 𝑖 ∙𝑝 𝑖 563.625
𝑃𝑞 = ∑ 𝑞 𝑡 𝑖 ∙𝑝𝑡 𝑖 𝑥100 ⟹ 𝑃𝑞 = ∑ 𝑞14 𝑖 ∙𝑝14 𝑖 𝑥100 = 488.250 = 115,44
0 𝑡 12 14

𝐹𝑞 = √𝐿𝑞 ∙ 𝑃𝑞 ⟹ 𝐹𝑞 = √115,49 ∙ 115,44 = 115,46

Índices de Valor: Los indicadores anteriores se han construido, de una o de otra


manera, específicamente para expresar cambios porcentuales en los precios o en las
cantidades pero los índices de valor están concebidos de manera que reflejen el
cambio simultáneo en ambos renglones.

Expresando el valor (𝑣) como el producto del precio (𝑝) por la cantidad (𝑞):
𝑣 =𝑝∙𝑞

Un índice de valor es la relación porcentual entre el valor en el lapso considerado y el


del lapso base
𝑝𝑖 ∙ 𝑞𝑖
𝑉= ∙ 100
𝑝0 ∙ 𝑞0

Pero cuando el bien en estudio está constituido por la agregación de varios bienes
elementales (como el valor de la alimentación esta fórmula se convierte en:

84
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

∑ 𝑝𝑖 ∙ 𝑞𝑖
𝑉= ∙ 100
∑ 𝑝0 ∙ 𝑞0

Ejemplo:

Supongamos, de una manera muy simple, que la participación de piezas de plástico


ha venido aumentando en la construcción de una determinada máquina y que también
lo ha hecho el costo de la materia prima y su elaboración, de acuerdo a la siguiente
tabla:
Plástico Mano de Obra
Años
Bs./Kgs. Kgs. Bs. / h. Horas
2012 1,20 20 39 97
2013 1,20 30 42 131
2014 1,45 35 47 149

Para conocer la variación porcentual del valor agregado del plástico incorporado a la
construcción de la máquina, se construirá los índices de valor como el año 2012 como
base.
Solución:
Para 2012 = Año base = 100,00

Para 2013

∑ 𝑝𝑖 ∙ 𝑞𝑖 (1,20𝑥30) + (42𝑥131) 36 + 5.502 5.538


𝑉= ∙ 100 = ∙ 100 = ∙ 100 = ∙ 100 = 145,47
∑ 𝑝0 ∙ 𝑞0 (1,20𝑥20) + (39𝑥97) 24 + 3.783 3.807

Para 2014

(1,45𝑥35) + (47𝑥149) 50,75 + 7.003 7.053,75


𝑉= ∙ 100 = ∙ 100 = ∙ 100 = 185,28
(1,20𝑥20) + (39𝑥97) 24 + 3.783 3.807

Lo que debe interpretarse como incremento del 45,47% y 85,28% respectivamente para los años 2013
y 2014 en el valor añadido del plástico en la construcción de la máquina.

85
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

EJERCICIOS UNIDAD 7

1. Construir los índices simples para las ventas en serie tomando como período base
el promedio de las ventas en 2012 de acuerdo a la siguiente tabla:

Venta de cemento de la compañía X


(Millones de Bs.)
Trimestre 2012 2013 2014 2015
1° 3 1 2 2
2° 2 1 0,9 1
3° 1 0,9 0,9 2
4° 3 2 2 3

2. Construir los índices simples para los precios de la serie de acuerdo a la siguiente
tabla, tomando como año base 2009

Promedio anual del precio del artículo A


Años 2009 2010 2011 2012 2013 2014
Bs. 50 52 24 56 58 57

3. La siguiente serie se refiere a los costos de producción de un cierto artículo para los
años que se indican. Calcúlense los índices compuestos de agregados no ponderados
y los índices no ponderados relativos tomando como base el año 2012

Años Bs. Bs.


Mano de Obra Materiales
2011 12 120
2012 14 125
2013 16 130

4. Calcúlense los índices compuestos no ponderados de relativos que correspondan,


para los años de la siguiente serie, referentes a lo consumido en la fabricación de un
determinado artículo. Tómese 2009 como año base.

Años Plástico Mano de Obra Energía


Kgrs. horas Kw.
2008 2,5 1,3 5,1
2009 2,5 1,4 5,1
2010 2,5 1,2 5,8
2011 2,7 1,3 5,9

86
ESTADÍSTICA 1 PROFESOR MIGUEL ANGEL RONDÓN

5. Obtenga los índices de precios y cantidades de Laspeyres, Paasche y Fisher, de los


siguientes artículos tomando como base el periodo2009.

Artículo A Artículo B
Años
𝑝 𝑞 𝑝 𝑞
2009 3 3.000 5 1.500
2010 4 3.500 6 2.000
2011 5 4.000 7 2.200

6. Elaborar los índices de precios y cantidades de Laspeyres, Paasche, Fisher y de


valor dela siguiente tabla como base en el promedio simple de los tres años:

Artículo A Artículo B Artículo C


Años
𝑝 𝑞 𝑝 𝑞 𝑝 𝑞
2011 2,5 200 7,0 100 20 10
2012 3,0 300 7,0 70 30 10
2013 3,5 400 7,5 100 27 4

7. Elaborar los índices de valor, con base en el año 1999, para los siguientes datos,
referentes a las importaciones de mineral de hierro por U.S.A, procedentes de los
países que se indican:

Años 1999 2000 2001 2002 2003


Países 𝑝 𝑞 𝑝 𝑞 𝑝 𝑞 𝑝 𝑞 𝑝 𝑞
Canadá 12,22 24,30 12,94 20,67 13,42 18,46 14,20 21,97 17,07 20,02
Venezuela 8,20 13,23 8,68 13,18 9,00 11,10 9,54 13,36 12,11 15,62
𝑝: 𝑒𝑛 $ 𝐹𝑂𝐵 𝑝𝑜𝑟 𝑇𝑚.
𝑞: 𝑒𝑛 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑇𝑚.
FOB (del inglés Free On Board, «Libre a bordo, puerto de carga convenido»)

87

Vous aimerez peut-être aussi