Vous êtes sur la page 1sur 49

1

a
2018

ESTADĺSTICA I

Ing. Jorge Luis Saint-Hilaire


J.L.S.R
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
27/06/2018
2

PROGRAMA DE ESTADISTICA I (MAT-130)

UNIDAD I: CONCEPTO BÁSICO SOBRE ESTADÍSTICA.

- Origen y evolución de la estadística.


- Definición de: Estadística descriptiva e inferencial.
- Población y muestra. .
- Variables discretas y continuas
- Números, medidas y escala de valores, redondeo de datos.

UNIDAD II: RECOLECCIÓN DE DATOS Y FORMAS DE PRESENTAR LA INFORMACIÓN.

- Toma de datos.
- Frecuencias.
- Distribución de frecuencias,
- Elementos para elaborar una distribución de frecuencia.
- Rango, amplitud total, clases, número de clase, valor del intervalo.
- Límites reales de clases.
- Columna que componen una distribución de frecuencia.
- Presentación gráfica: Histograma de frecuencia, Polígono de frecuencia, ojiva y gráfico
circular.

UNIDAD III: MEDIDAS DE TENDENCIA CENTRAL.

- Media aritmética.
- Media aritmética para datos no agrupados.
- Media aritmética pondera.
- Media aritmética para datos agrupados.
- Mediana.
- Mediana para datos no agrupados
- Mediana para datos agrupados.
- La moda.
- La moda para datos no agrupados
- La moda para datos agrupados.
- Media geométrica.
- Aplicaciones de la media geométrica.
- Media geométrica para datos agrupados
- Media armónica datos no agrupados
- Media armónica datos agrupados
- Medidas de posición (Cuartiles, deciles y percentiles).

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
3

UNIDAD IV: MEDIDAS DE DISPERSION.

- Dispersión.
- Recorrido o amplitud (Rango).
- Desviación media.
- Desviación media para datos agrupados y no agrupados.
- Desviación cuartilítica.
- La varianza.
- Desviación típica.
- Desviación típica para datos agrupados y no agrupados.

UNIDAD V: TEORÍA ELEMENTAL DE LA PROBABILIDAD.

- Concepto de la probabilidad.
- Experimento aleatorio, espacio muestral.
- Probabilidad a priori y a posteriori.
- Axiomas de la probabilidad.
- Elementos mutuamente excluyentes y no excluyentes.
- Probabilidad condicionada.
- Sucesos independientes.
- Valor esperado o esperanza matemática.
- Propiedad del valor esperado

BIBLIOGRAFÍA BASICA

- Webster, Allen. (2002). Estadística Aplicada a los negocios y la Economía. (3 ra. Ed.).
Pennsylvania, USA: McGraw-Hill.

BIBLIOGRAFIA COMPLEMENTARIA:

- Perez F. Victor P. (2005). Estadística Descriptiva. (1ra. Ed.). Santo Domingo, Rep. Dom.
Impresora Soto Castillo S. A..

- Perez F. Victor P. (2005). Estadística Inferencial. (1ra. Ed.). Santo Domingo, Rep. Dom.
Impresora Soto Castillo S. A..

- Murray R. Spiegel. (2002). Estadística. (4ta. Ed.). Bogotá, Colombia: McGraw-Hill.

- Kreysig, Grwin. Introducción a la Estadística Matemática (2002)

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
4

DEFINICIONES DE ESTADISTICA

 La estadística es la ciencia que tiene por objeto agrupar metódicamente todos los
hechos que se prestan a una evaluación numérica como por ejemplo: La población,
impuestos, recursos naturales,producción,etc.

 La estadística es un método científico de investigación que recoge informaciones o


datos, los organiza, presenta, analiza y saca conclusiones para tomar decisiones.

IMPORTANCIA Y CAMPO DE APLICACION DE LA ESTADISTICA

La estadística permite resumir los datos más destacados de los elementos que
componen a un conjunto logrando así captar más fácilmente su contenido. Es
fundamental en la investigación científica, porque ella permite decir con numero cualquier
tipo de análisis de la realidad.

Difícilmente podríamos encontrar un campo de actividades cognitivas en el cual la


estadística no tenga su aplicación. La misma es aplicable tanto en la economía como en la
administración, salud pública, educación, ingeniería.

DEFINICION DE: ESTADISTICA DESCRIPTIVA E INFERENCIAL.

Estadística Descriptiva: Incluye las técnicas que se relacionan con el resumen y la


descripción de datos numéricos. Estos datos pueden ser gráficos o pueden incluir análisis
computacional.

Estadística Inferencia: Comprende aquellas técnicas por medio de las cuales se toman
decisiones sobre una población estadística basadas en una muestra observada en un juicio
obtenido.

DEFINICION DE POBLACION Y MUESTRA

POBLACION (N): Es el conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones.

Muestra (n): Parte de una población que se considera representativa de la mimas , para
obtener resultados validos.

Población (N)

Muestra (n)
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
5

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 : Indique en cada caso cual es la población y cuál es la muestra:

1. Se quiere saber la preferencia de color de los estudiante de la escuela Prof. Juan Bosch
de Santiago. Cuál será la población y cuál será la muestra.

Población: Todo los estudiantes de la escuela.


Muestra: Selección de estudiantes por cursos.

2. Se requiere saber la preferencia musical de los estudiantes de UTESA de Santiago. Cuál


será la población y cuál será la muestra.

Población: Todos los estudiantes de UTESA de Santiago


Muestra: Selección de los estudiantes por carrera.

VARIABLE ESTADISTICA:

Esta pueden ser de dos tipos:

- Cualitativas
Variable
Estadística
- Discretas
-Cuantitativas
- Continua

1. Cualitativas: Son aquellas que no se pueden medir numéricamente , esta se refiere a


cualidades, por ejemplo: nacionalidad, color de la piel, sexo, etc.

2. Cuantitativas: Son aquellas que tienen valor numérico, por ejemplo: edad, precio de un
producto, ingreso anuales, etc).

 Variable Discreta: Son aquellas que pueden tomar valores enteros (1,2,3,4,...etc).
por ejemplo numero de hermanos ( puede ser 1, 2, 3... etc, pero nunca puede ser
numero decimales 3.45)
 Variable Continua: Puede tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehículo puede ser 90.4k/h , 95.6 km/h, , también
estatura, ejemplo 1.75m, 1.80m, 1.50m, etc.

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
6

DISTRIBUCION DE FRECUENCIA

Para un mejor análisis de los datos es necesario reunirlos en grupo de magnitudes


denominados clases o categorías.

20 − 30

L. Inf L. Sup

Cada clase tiene una frecuencia (f) y esa frecuencia es la cantidad de datos que
pertenecen a esa clase.

COMO SE CONSTRUYE UNA DISTRIBUCION DE FRECUENCIA?

Pasos que debemos dar.

1. Rango( R): Diferencia entre el dato mayor y el menor del conjunto de datos dado.

𝐑 = 𝐱𝐧 − 𝐱𝟏

𝐃𝐨𝐧𝐝𝐞:

𝐱 𝐧 = Mayor valor de los datos no agrupado


𝐱 𝟏 = Menor valor de los datos no agrupado

2. Numero de clase( 𝐍𝐜 ): Para determinar el número de clase que debe formarse para
analizar los datos se ha establecido que no debes ser menor de cinco (5) ni más de quince
(15). Basado en ellos el señor H.A. Sturges ideo la siguiente fórmula para determinar el
número de clase exacto a formar.

𝐍𝐜 = 𝟏 + 𝟑. 𝟑 𝐥𝐨𝐠 𝐧

𝐃𝐨𝐧𝐝𝐞:

𝐍𝐜 = Numero de clase
𝐧 = Total de los datos

Nota: El numero de clase debemos redondearlo: Ejemplo Nc=2.5 = 3 ; Ejemplo Nc= 2.3= 2

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
7

3. Intervalo de clase 𝚰𝐂 : Diferencia entre el dato mayor y el menor del conjunto de


datos dado, dividido entre el numero de clase Nc .

𝐑 𝐱𝐧 − 𝐱𝟏
𝚰𝐂 = ≈
𝐍𝐜 𝐍𝐜

Nota: el intervalo de clase debemos redondearlo: Ejemplo 𝚰𝐂 = 𝟏𝟐. 𝟕 ≈ 𝟏𝟑, Ejemplo


𝚰𝐂 = 𝟐𝟑. 𝟖𝟑 ≈ 𝟐𝟒

4. Frecuencia absoluta simple de una clase o grupo (𝐟): Es el número de veces que se
repite la clase. Es la cantidad de datos o valores que hay en dicha clase.

5. Punto medio o marca de clase (𝐱): Es la suma del límite superior y el límite inferior
divido entre dos.

𝐋𝐢𝐦𝐢𝐭𝐞 𝐒𝐮𝐩. + 𝐋𝐢𝐦𝐢𝐭𝐞 𝐈𝐧𝐟𝐞𝐫𝐢𝐨𝐫


𝐱=
𝟐

6. Frecuencia relativa simple de una clase (𝐟𝐫 ): Es el cociente de la frecuencia absoluta


simple de la clase entre el total de los datos multiplicado por cien. Es el porcentaje de
datos que hay en la clase.

𝐟
𝐟𝐫 = × 𝟏𝟎𝟎
𝐧

7. Frecuencia acumulada de una clase o grupo (𝐅𝐚 ): Es la suma de la frecuencia


acumulada de la clase anterior mas la frecuencia absoluta simple de la clase buscada o
analizada. Esta puede ser ascendente (𝐅𝐚 ↑), o descendente (𝐅𝐚 ↓).

(Fa ↑): Es la sumatoria de f de arriba hacia abajo

Fa ↓ : Es la sumatoria de f de abajo hacia arriba

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
8

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 I : Construya una distribución de frecuencia o tabulación de datos.

Los datos siguientes son los ingresos por hora de los obreros de la construcción de la
República Dominicana en el 2018.

60, 36, 68, 132, 95, 89, 112, 152, 45, 65, 75, 90, 88, 97, 124, 138, 52, 73, 83, 100, 85, 109,
130, 147, 170, 179, 124, 118, 115, 86

𝐒𝐨𝐥𝐮𝐜𝐢𝐨𝐧:

Determinar el número de clase 𝐍𝐜


𝐍𝐜 = 𝟏 + 𝟑. 𝟑 𝐥𝐨𝐠 𝐧
Nc = 1 + 3.3 log 30 = 5.87 ≈ 6
Nc = 6

Determinar el intervalo clase 𝚰𝐂


𝐑 𝐱𝐧 − 𝐱𝟏
𝚰𝐂 = =
𝐍𝐜 𝐍𝐜

179 − 36
ΙC = = 23.83 ≈ 24
6

ΙC = 24

Clase Frecuencia Marca de Clase Frec. RelativaFrec. Acumulada Frec. Acumulada


(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n= 30 ∑ =100

Nota: En la frecuencia no incluir el límite superior de clase

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
9

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈 : Construya una distribución de frecuencia o tabulación de datos.

Los datos siguientes son las calificaciones obtenidas en un examen de física tomados por
40 estudiantes de los estudiantes 4to A, del liceo Prof. Juan Bosch

42, 64, 91, 55, 87, 69, 86, 81, 21, 60, 74, 68, 29, 77, 87, 90, 46, 87, 70, 74,34, 75, 67, 75, 69,
81, 65, 66, 59, 47, 69, 82, 81, 73, 49, 37, 97, 82, 57, 94

𝐒𝐨𝐥𝐮𝐜𝐢𝐨𝐧:

Determinar el número de clase 𝐍𝐜


𝐍𝐜 = 𝟏 + 𝟑. 𝟑 𝐥𝐨𝐠 𝐧
Nc = 1 + 3.3 log 40 = 6.3 ≈ 6
Nc = 6

Determinar el intervalo clase 𝚰𝐂


𝐑 𝐱𝐧 − 𝐱𝟏
𝚰𝐂 = =
𝐍𝐜 𝐍𝐜

97 − 21
ΙC = = 12.67 ≈ 13
6

ΙC = 13

Clase Frecuencia Marca de Clase Frec. RelativaFrec. Acumulada Frec. Acumulada


(f) x fr % Fa↑ Fa↓
21-34 2 27.5 5.0 % 2 40
34-47 4 40.5 10.0 % 6 38
47-60 5 53.5 12.5 % 11 34
60-73 10 66.5 25.0 % 21 29
73-86 11 79.5 27.5 % 32 19
86-99 8 92.5 20.0 % 40 8
TOTAL n= 40 ∑= 100

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
10

PRESENTACION DE LOS DATOS DE UNA DISTRIBUCION DE FRECUENCIA:

Pueden hacerse de tres forma distintas

1. Forma escrita o textual


Presentación
de los datos 2. Forma tabular o estadístico
3. Forma grafica o de dibujo

1. Forma escrita o textual:

Presenta los datos mediante un conjunto de texto o escritura donde queda expresado el
contenido general de la variable.

2. Forma tabular o cuadro estadístico:

Presenta los datos mediante un conjunto de fila y columna donde se coloca las
clasificaciones que hacemos de la variable y las cifras asociadas a dichas clasificaciones.

Todo cuadro estadístico consta de las siguientes partes:

 Titulo del cuadro: Se coloca encima del cuadro dando el significado del mismo.
Este debe responder a las preguntas que , como, donde y cuando.
 Los encabezados: Son subtítulos que encabezan cada columna del cuadro dando el
significado de ellas.
 La columna matriz: Es la primera columna del cuadro la cual nos da la clasificación
de la variable.
 El cuerpo: Son todas las demás columna del cuadro, el cual nos da la parte
numérica del mismo.
 La fuente: Se coloca debajo del cuadro y ella dice de donde se extrajeron los datos.

Existen dos elementos secundarios en el cuadro que son: Las notas introductoria y las
notas al pie del cuadro. Ellas se utilizan cuando es necesario hacer algún llamado u
observaciones especiales sobre el contenido general del cuadro.

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
11

Parque vehicular de la República Dominicana Según Clase de Vehículo 2016 Vs 2017


Unidades

CLASE 2016 2017 Variacion


Absoluta Relativa
Motocicletas 2,096,196.00 2,238,671.00 142,475.00 6.8%
Automoviles 1/ 816,470.00 865,186.00 48,716.00 6.0%
Jeep 386,706.00 419,442.00 32,736.00 8.5%
Carga 2/ 405,292.00 418,573.00 13,281.00 3.3%
Autobuses 92,144.00 96,473.00 4,329.00 4.7%
Maquinarias Pesadas 21,411.00 22,293.00 882.00 4.1%
Volteo 19,974.00 20,293.00 319.00 1.6%
Otros 3/ 15,845.00 16,446.00 601.00 3.8%
Total 3,854,038.00 4,097,377.00 243,339.00 6.3%

Notas: Cifras generadas al 15 de febrero de 2018.


Incluye únicamente vehículo con placa definida (primera placa)
1/Incluye privados, públicos Urbanos e Inter-urbanos.
2/ Incluye camionetas y camiones
3/ Incluye remolques, ambulancias, montacargas y fúnebres.
Fuente: Gerencia de estudios económicos y tributarios DGII

3. Representación grafica:
Consiste en un esquema o dibujo donde una sola unidad quede expresado el contenido
general de la variable.

Es la forma más rápida de observar el contenido de la variable, pero no la más precisa la


cual corresponde a la forma tabular o cuadro estadístico.

Este grafico al igual que el cuadro debe tener el titulo, la fuente, la leyenda y cualquier
otro detalle que aclare al mismo. Lo más comunes son: Histograma, polígono de
frecuencia, la ojiva, el grafico de barras, etc.

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
12

 HISTOGRAMA: Es la grafica de una distribución de frecuencia. En el eje horizontal


se coloca la fronteras de clases (Base de cada rectángulo) y en el eje vertical la
frecuencia correspondiente a cada clase (Altura del rectángulo).

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈 : Grafico de Histograma.∑

Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n=30 ∑= 100.0 %

HISTOGRAMA DE FRECUENCIA
9

7
Frecuenia absoluta (f)

0 Intervalo de clase
36-60 60-84 84-108 108-132 132-156 156-180

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
13

 POLIGONO DE FRECUENCIA: Es la grafica lineal de una distribución de frecuencia y


consiste en dos ejes que se cortan en forma perpendicular donde en el eje
horizontal se coloca los puntos medios de cada clase y en el eje vertical la
frecuencia correspondiente a cada clase.

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈 : Polígono de frecuencia

Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n= 30 ∑= 100

Poligono de frecuencia
Frecuencia
absoluta (f) 9

0
48 72 96 120 144 168 Punto medio o
marca de clase (x)

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
14

 OJIVA: Es la representación grafica de las frecuencias acumuladas de la variable,


tanto ascendente como descendente.

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈𝐈: Grafico de Ojiva.

Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n=30 ∑= 100

Ojiva
40
Frecuencia acumulada ↑

30

20

10

0
36-60 60-84 84-108 108-132 132-156 156-180
Intervalo de clase

Ojiva
40
Frecuencia acumula↓

30

20

10

0
36-60 60-84 84-108 108-132 132-156 156-180
Intervalo de clase

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
15

 GRAFICO CIRCULAR O DE PASTEL: Este grafico representa la frecuencia de cada


valor de las variables estadísticas mediante sectores circulares.

Para determinar el ángulo central que corresponde a una frecuencia absoluta utilizamos

f
≮ = 360∘ × ό 360∘ × fr
n

Clase Frecuencia Frec. Relativa Grado


(f) fr % Abertura
36-60 3 10.0 % 36°
60-84 6 20.0 % 72°
84-108 8 26.7 % 96°
108-132 7 23.3 % 84°
132-156 4 13.3 % 48°
156-180 2 6.7 % 24°
TOTAL n=30 ∑= 100.0 % ∑= 360°

Ingresos obreros/ horas


156-180
7%

36-60
10%
132-156
13%
60-84
20%

108-132
23%
84-108
27%

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
16

MEDIDAS DE TENDENCIA CENTRAL O PROMEDIO

Son indicadores estadísticos que resumen con un solo valor el conjunto de datos o variable
estudiado. Su valor estará ubicado cerca del centro del conjunto de datos o variable.

Las principales características de estas es que sea representativas del conjunto de datos o variable
a la cual trata de explicada.

La más usadas son:

a. Media aritmética o promedio (X)

b. Mediana Me
c. Moda o valor modal Mo
d. Media geométrica (Mg)
Medidas de
tendencia e. Media Armónica (MA )
central
f. Cuartiles (Qk )
g. Deciles (Dk )
h. Percentiles (Pk )

a) Media aritmética o promedio:

Es una medida de tendencia central que se define como la suma de todos los valores de la
variable o conjunto de datos, dividió entre la cantidad de dicho valores. Su valor está
ubicado cerca del centro del conjunto de datos.

 Datos no agrupado
n
i=1 xi xf xf
Media x= Media x= =
aritmética o n Ponderada n f
promedio  Datos agrupados

xf
x=
n

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
17

Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Las calificaciones de un estudiante en un cuatrimestre de estadísticas son:


50, 60, 75, 80, 98. Cuál es la media aritmética 𝐱
n
i=1 xi
x= ; Donde xi = Datos dados, n = Total de los datos dados
n
50 + 60 + 75 + 80 + 98 363
x= = = 72.6 ≈ 73
5 5

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Las comisiones registradas en los primeros 6 meses del año de un vendedor
son las siguientes $25,000.00, $32,0000.00 ,$45,000.00, $63,750.55, $85,763.20,
$28,350.20. Cuál es la media aritmética o promedio.
n
i=1 xi
x=
n
$25,000.00 + $32,000.00 + $45,000.00 + $63,750.55 + $85763.20 + $28,350.20
x=
6
$279,863.95
x= = $45,643.99
6
Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈 : Encuentre la media aritmética de la siguiente distribución de frecuencia

Clase Frecuencia Marca de Clase xf


(f) x
36-60 3 48 144.00
60-84 6 72 432.00
84-108 8 96 768.00
108-132 7 120 840.00
132-156 4 144 576.00
156-180 2 168 336.00
TOTAL n= 30 ∑= 3,096.00

Datos agrupados

xf 3,096.00
x= = = 103.20
n 30

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
18

Media Ponderada:

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: A 14 empleados de una empresa le pagan $120.00 la hora de trabajo, a otro


12 les pagan $115 y a otros 7 a $90.00. Encuentre la media ponderada de esos datos .

xf xf
x= =
f n
14 $120 + 12 $115 + 7($90) $3,690.00
x= = = 111.82
14 + 12 + 7 33

b) Mediana 𝐌𝐞 :

Es una medida de tendencia central que divide el conjunto ordenado de datos en dos
partes iguales. Es aquel valor de la variable por debajo del cual se encuentra el 50% de los
datos y por encima el otro 50%. Su valor está ubicado exactamente en el centro del
conjunto de datos o variable. Ella presenta las siguientes características.

 Es numérica y no se calcula en variable cualitativas.


 No está afectada por valores extremos en la variable, porque en su cálculo no
intervienen todos los datos.
 Se puede calcular en clases abiertas por limites indefinidos.

 Datos no agrupado Par


Mediana Se ordena la serie en forma ascendente o descendente; entonces los dos
datos del centro se divide entre dos
 Datos no agrupados impar
Se ordena la serie, y la mediana es justo el dato que está en el centro.

 Datos agrupados
Mediana n
− Fa1 ↑
𝐌𝐞 = Li + 2 × 𝐼𝐶
f

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
19

Datos no agrupados para serie par de datos

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la mediana 𝐌𝐞 de los siguientes conjuntos de datos:

x = 8, 12, 10, 5, 18, 20, 16, 300

Ordenando los datos en orden ascendente

𝑥 = 5, 8, 10, 𝟏𝟐 𝟏𝟔, 18, 20,300

12 + 16 28
Me = = = 14
2 2

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Encuentre la mediana 𝐌𝐞 de los siguientes conjuntos de datos:

x = 8, 12, 10, 5, 18, 20, 16, 300

Ordenando los datos en orden ascendente

𝑥= 4, 7, 8, 𝟖 𝟏0, 15, 18,20

8 + 10 18
Me = = =9
2 2

Datos no agrupados para serie impar de datos

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Encuentre la mediana 𝐌𝐞 de los siguientes conjuntos de datos:

x = 15, 7, 3,21, 17, 11, 500

Ordenando los datos en orden ascendente


𝑥 = 3, 7, 11, 𝟏𝟓, 17, 21, 500
50% 50%

𝑀𝑒 = 15

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
20

Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈𝐈: Encuentre la mediana 𝐌𝐞 de los siguientes conjuntos de datos


agrupado:

Clase Frecuencia Frec. Acumulada


(f) Fa↑ Calculo de n/2
36-60 3 3
60-84 6 9 n 30
= = 𝟏𝟓
84-108 8 17 2 2
108-132 7 24 Con el numero 15 entramos a la tabla y
132-156 4 28
buscamos un número en Fa↑
156-180 2 30
inmediatamente mayor o igual que 15 que
TOTAL n= 30
es el 17

𝐧
− 𝐅𝐚𝟏 ↑
𝐌𝐞 = 𝐋𝐢 + 𝟐 × 𝐈𝐂
𝐟

Donde:
𝐧
= Clase mediana
𝟐

𝐋𝐢 = Limite Inferior
𝐧 = Cantidad de datos
𝐅𝐚𝟏 ↑= Frecuencia acumulada anterior
𝐈𝐂 = Intervalo de clase
𝐟 = Frecuencia de la clase

Clase mediana: Es aquella que tiene una frecuencia acumulada inmediatamente superior al valor
n/2, y con esto entramos a la tabla

30
−9
Me = 84 + 2 × 24
8

30
−9
Me = 84 + 2 × 24
8

Me = 102

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
21

Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐕: Encuentre la mediana 𝐌𝐞 de los siguientes conjuntos de datos


agrupado:

Clase Frecuencia Frec. Acumulada


(f) Fa↑ Calculo de n/2
20-40 5 5
40-60 8 13 n 35
= = 𝟏𝟕. 𝟓
60-80 12 25 2 2
80-100 7 32 Con el numero 17.5 entramos a la tabla y
100-120 3 35 buscamos un número en Fa↑ inmediatamente
TOTAL n= 35 mayor o igual que 17.5 que es el 25

n
− Fa1 ↑
Me = Li + 2 × IC
f

35
− 13
Me = 60 + 2 × 20
12

Me = 60 + 7.5

Me = 67.5

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
22

c) Moda o valor modal 𝐌𝐨

Es una medida de tendencia central que define como el valor más típico o frecuente de
una distribución o conjunto de datos. Es el valor que más se repite. Esta presenta las
siguientes características.

 Se puede obtener en una variable de tipo cualitativa y cuantitativa.


 No está afectada por valores extremos en la variable.
 Se puede calcular en clases abiertas, ya que en su cálculo no intervienen todos los
datos.

 Datos no agrupado
Es el dato que más se repite.

Donde:
Moda  Datos agrupados Li = Limite Inferior
fm − f1 fm = Frencuencia modal
𝐌𝐨 = Li + × IC
fm − f1 + fm − f2 f1 = Frencuencia clase anterior
f2 = Frencuencia clase despues
IC = Intervalo de clase
Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la moda de las siguientes distribución de frecuencia.

x = 𝟖, 10, 𝟖, 12, 11, 6, 4

𝐌𝐨 = 8 Unimodal

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Encuentre la moda de las siguientes distribución de frecuencia.

x = 𝟏𝟓, 𝟐𝟎, 𝟏𝟓, 18, 𝟐𝟎, 22, 250

𝐌𝐨 = 15 y 20 Bimodal

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈𝐈: Encuentre la moda de las siguientes distribución de frecuencia.

x = 500, 300, 450, 400, 1000

𝐌𝐨 = No hay moda ; es A modal

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
23

Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈 : Encuentre la moda 𝐌𝐎 de los siguientes conjuntos de datos agrupado

Clase Frecuencia
(f)
16-24 7 Moda: Es aquella que tiene mayor frecuencia
24-32 8 f1 absoluta
32-40 12 fm
fm − f1
40-48 3 f2 𝐌𝐨 = Li + × IC
fm − f1 + fm − f2
48-56 6
TOTAL n= 36

12 − 8
Mo = 32 + ×8
12 − 8 + 12 − 3

4
Mo = 32 + ×8
4 + 9

Mo = 34.46

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈 : Encuentre la moda 𝐌𝐎 de los siguientes conjuntos de datos agrupado

Clase Frecuencia
(f)
20-40 9 Moda: Es aquella que tiene mayor frecuencia
40-60 12 f1 absoluta
60-80 15 fm
fm − f1
80-100 10 f2 𝐌𝐨 = Li + × 𝐼𝐶
fm − f1 + fm − f2
100-120 6
TOTAL n= 52

15 − 12
Mo = 60 + × 20
15 − 12 + 15 − 10

3
Mo = 60 + × 20
3 + 5

Mo = 60 + 7.5 = 67.50

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
24

d). Media geométrica 𝐌𝐠

Es una medida de tendencia central y se define como la raíz enésima del producto
de los valores de la variable. Se utiliza para obtener el promedio de una variable que
experimenta crecimiento geométrico, como por ejemplo la población de persona, la tasa
de interés del dinero, etc. Esta presenta las siguientes características.

 Se toma en cuenta todos los valores de la variable


 Es afectada por valores extremos
 No puede ser calculada en distribución con clases abiertas

𝐧
𝐌𝐠 = 𝐱 𝟏 𝐱𝟐 𝐱𝟑 … 𝐱 𝐧 Datos no agrupados

𝐟 𝐥𝐨𝐠 𝐱
𝐌𝐠 = 𝐀𝐧𝐭𝐢 𝐥𝐨𝐠 Datos no agrupados
𝐧

También
𝐧
𝐌𝐠 = 𝐱 𝟏 𝐟𝟏 𝐱 𝟐 𝐟𝟐 𝐱 𝟑 𝐟𝟑 … 𝐱 𝐧 𝐟𝐧 Datos no agrupados

Donde:

x= Marca de clase
f= Frecuencia de cada clase
n= Total de los datos

Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la media geométrica 𝐌𝐠 de los siguientes conjuntos de datos


no agrupado

x = 4, 8, 16, 12, 10
5
Mg = 4 8 16 12 10
5
Mg = 61,440.00 = 9.07

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
25

Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la media geométrica 𝐌𝐠 de los siguientes conjuntos de datos


agrupados.

.
Clase Frecuencia Marca de Clase f log x
(f) x
36-60 3 48 5.044
60-84 6 72 11.144
84-108 8 96 15.858
108-132 7 120 14.554
132-156 4 144 8.633
156-180 2 168 4.451
TOTAL n= 30 ∑= 59.684

𝐟 𝐥𝐨𝐠 𝐱
𝐌𝐠 = 𝐀𝐧𝐭𝐢 𝐥𝐨𝐠
𝐧

59.684
Mg = Anti log
30

Mg = Anti log 1.989 ; El anti logaritmo se calcula shift log

Mg = 97.499 ≈ 97.5

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
26

Aplicación de la Media Geométrica 𝐌𝐠

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Si la población de la Rep. Dom. en el 2000 fue de 8.4 millones de habitantes, y


en el 2007 es de 9.5 millones. Cuál es la tasa de crecimiento promedio anual?

n PMayor
r= −1
Pmenor

7 9.5 millones
r= − 1 = 0.018 ≈ 1.8% tasa de crecimiento
8.4 millones

Cuál será la población del 2015?


𝐧
𝐏𝐧 = 𝐏𝟎 𝟏 + 𝐫

Datos

 Puede tomar a P0 el 2000 o 2007, cualquiera, yo tome el 2007


 n=2015-2007= 8
 La tasa (r)=0.018
𝐧
𝐏𝐧 = 𝐏𝟎 𝟏 + 𝐫
8
P2015 = 9.5 1 + 0.018 = 10.96 millones

Cuál será la población del 2030?


𝐧
𝐏𝐧 = 𝐏𝟎 𝟏 + 𝐫

Datos

 Puede tomar a P0 el 2000 o 2007, cualquiera, yo tome el 2007


 n=2030-2007= 23
 La tasa (r)=0.018
𝐧
𝐏𝐧 = 𝐏𝟎 𝟏 + 𝐫
23
P2015 = 9.5 1 + 0.018 = 14.32 millones

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
27

e). Media armónica 𝐌𝐀

Es una medida de tendencia central que se define como el inverso de la media aritmética
de los reciproco de los valores de la variable. Ella se utiliza para obtener promedio de una
variable de movimiento, como la velocidad y la distancia recorrida.
n
𝐌𝐀 = Datos sin agrupar
1
x
n
𝐌𝐀 = Datos agrupado
f
x
Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la media armónica 𝐌𝐀 de los siguientes conjuntos de datos no


agrupado

x = 8, 5, 10, 3
n
𝐌𝐀 =
1
x
4 4
𝐌𝐀 = = = 5.27
1 1 1 1 91
8 + 5 + 10 + 3 120
Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre la media armónica de la siguiente distribución de frecuencia

Clase Frecuencia Marca de Clase f/x


(f) x
36-60 3 48 0.063
60-84 6 72 0.083 n
𝐌𝐀 = Datos agrupados
84-108 8 96 0.083 f
108-132 7 120 0.058 x
132-156 4 144 0.028 30
156-180 2 168 0.012 𝐌𝐀 = = 91.74
0.327
TOTAL n= 30 ∑= 0.327

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
28

f). Cuartiles (𝐐𝐤 ) :

Son medidas de tendencia central de posicionamiento que dividen a un conjunto


ordenados en cuatro partes iguales. Ellos se obtienen tres valores cuartilicos.

Min Q1 Q2 Q3 Max

25% 50% 75%

 Cuartil uno (𝐐𝟏 ): Es aquel valor de la variable por debajo del cual se encuentra el
25% de los datos y por encima el 75%.
 Cuartil dos (𝐐𝟐 ): Por definición es igual a la mediana (50% y 50%)
 Cuartil dos (𝐐𝟑 ): Es aquel valor de la variable por debajo del cual se encuentra el
75% de los datos, y por encima el 25%.

 Datos no agrupado impares

k n+1
Posicion = ; K = 1, 2, 3
4

Cuartiles (𝑸𝒌 )  Datos no agrupado pares

kn
Posicion = ; K = 1, 2, 3
4
 Datos agrupados
nk
− Fa1↑
Q K = Li + 4 × Ic
f

Donde:

𝐤 = El numero del cuartil que vamos a a calcular


𝐋𝐢 = Limite Inferior
𝐧 = Cantidad de datos
𝐅𝐚𝟏 ↑= Frecuencia acumulada anterior
𝐈𝐂 = Intervalo de clase
𝐟 = Frecuencia de la clase

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
29

Datos no agrupados Cuartiles

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre cuartiles, de los siguientes conjuntos de datos:

x = 20, 8,15,13,6,3,12,10,18
Nota: Si la posición me da un numero
Ordenando los datos en forma ascendente entero el cuartil va ser la posición que
𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20 me dio.

Si me da un numero decimal el cuartil


Posición: 1 2 3 4 5 6 7 8 9 será la posición anterior + (posición
−𝟓 −𝟒 −𝟑 −𝟐 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓 mayor - la posición anterior)
multiplicado por la parte decimal.
Cuartil
−𝟓 − 𝟒1 −𝟑 −𝟐 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓

k n+1
Posicion =
4
1 9+1
Posicion = = 𝟐. 𝟓𝟎 𝐏𝐨𝐬𝐢𝐜𝐢ό𝐧, el cuartil Q1 esta entre la posiciόn 2 y 3
4
Q1 = 6 + 8 − 6 𝟎. 𝟓𝟎

Q1 = 7 → El 25% está por debajo de 7 y el 75% está por encima de7

Cuartil 2

k n+1
Posicion =
4
2 9+1
Posicion = =𝟓
4
La posición me dio un numero entero 𝑄2 es la posición que me dio el numero entero

Q2 = 12 → El 50% está por debajo de 12.5 y el otro 50% por encima

Cuartil 3

k n+1
Posicion =
4
3 9+1
Posicion = = 𝟕. 𝟓𝟎 𝐏𝐨𝐬𝐢𝐜𝐢ό𝐧, el cuartil Q3 esta entre la posiciόn 7 y 8
4
Q3 = 15 + 18 − 15 𝟎. 𝟓𝟎
Q3 = 16.5 → El 75% está por debajo de 16.50 y el otro 25% está por encima de 16.5

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
30

Otra forma de determinar los cuartiles para datos no agrupados, es determinando la


mediana

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre cuartiles, de los siguientes conjuntos de datos:

x = 20, 8,15,13,6,3,12,10,18

Ordenando los datos en forma ascendente


𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20

Solución:

Sabemos que Q2 = Mediana

Esta serie es impar

𝑥 = 3, 6, 8, 10, 𝟏𝟐, 13, 15, 18, 20

50% 50%
Q2 = 12

Determinando Cuartil 1:

La serie que me quedo es par, para determinar la mediana para serie par ser realiza de la
siguiente manera

𝑥 = 3, 6, 8, 10, 𝟏𝟐, 13, 15, 18, 20


𝑸𝟐

6+8
Q1 = =7
2
Determinando Cuartil 3:

La serie que me quedo es par, para determinar la mediana para serie par ser realiza de la
siguiente manera

𝑥 = 3, 6, 8, 10, 𝟏𝟐, 13, 15, 18, 20


𝑸𝟐

15 + 18
Q3 = = 16.5
2

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
31

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Encuentre cuartiles, de los siguientes conjuntos de datos:

x = 2 , 3 , 4, 6, 9, 10

Solución:

Sabemos que Q2 = Mediana

Esta serie es par

x = 2 , 3 , 4, 6 , 9, 10

50% 50%

4+6
Q2 = =5
2

x = 2 , 3 , 4 6, 9, 10

50% 50%

𝑸𝟐 = 𝟓

Determinando Cuartil 1:

La serie que me quedo impar, para determinar la mediana para serie par ser realiza de la
siguiente manera

x = 2 , 3 , 4 6, 9, 10

50%

Q1 = 3

Determinando Cuartil 3:

La serie que me quedo impar, para determinar la mediana para serie par ser realiza de la
siguiente manera

x = 2 , 3 , 4 6, 9, 10

50%
𝑸𝟐 = 𝟓

Q3 = 9

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
32

Datos agrupados Cuartiles

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre el cuartil 𝐐𝟑 , de los siguientes conjuntos de datos agrupados.

Clase Frecuencia Frec. Acumulada


(f) Fa↑
20-40 8 8
40-60 10 18
60-80 14 32
80-100 12 44
100-120 7 51
TOTAL n= 51

Calculo
Cuartil 3; K=3
𝑛𝑘 51 3
= = 𝟑𝟖. 𝟐𝟓
nk 4 4
− Fa1↑
QK = Linf + 4 × Ic Con el numero 38.25 entramos a la tabla y
f
buscamos un número en Fa↑ inmediatamente
38.25 − 32
Q3 = 80 + × 20 mayor o igual que 38.25 que es el 44
12
Q3 = 90.42

El 75% de los datos esta por debajo de 90.42 y el 25% esta por encima 90.25

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
33

g). Deciles (𝐃𝐤 ) :

Son medidas de posición que divide a un conjunto ordenados de datos en diez partes
iguales.

Min D1 D2 D3 D4 D5 D6 D7 D8 D9 Max

10% 10% 10% 10% 10% 10% 10% 10% 10%

 Decil 𝐃𝟐 : Significa que el 20% de los datos está por debajo, y que 80% restante
por encima.
 Decil 𝐃𝟑 ∶ Significa que el 30% de los datos está por debajo, y que 70% restante
por encima.
 Decil 𝐃𝟓 ∶ Por definición es igual a la mediana y significa que el 50% de los datos
está por debajo, y que 50% restante por encima.
 Decil 𝐃𝟖 : Significa que el 80% de los datos está por debajo, y que 20% restante
por encima.

 Datos no agrupado impares

k n+1
Posicion = , K = 1, 2, 3, 4, 5, 6, 7, 8, 9
10
 Datos no agrupado pares
Deciles (𝑫𝒌 )
kn
Posicion = , K = 1, 2, 3, 4, 5, 6, 7, 8, 9
10
 Datos agrupados
nk
− Fa1↑
DK = Li + 10 × Ic
f

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
34

Datos no agrupados Deciles

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre decil, de los siguientes conjuntos de datos:

x = 20, 8,15,13,6,3,12,10,18
Nota: Si la posición me da un numero
Ordenando los datos en forma ascendente
entero el cuartil va ser la posición que
𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20, me dio.

Si me da un numero decimal el cuartil


Posición: 1 2 3 4 5 6 7 8 9 será la posición anterior + (posición
−𝟓 −𝟒 −𝟑 −𝟐 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓 mayor - la posición anterior)
multiplicado por la parte decimal.
Decil
−𝟓 −4𝟒 −𝟑 −𝟐 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓

k n+1
Posicion =
10
4 9+1
Posicon = =𝟒
10
La posición me dio un numero entero, 𝐷4 es la posición que me dio el numero entero

𝐷4 = 10 → El 40% de los datos están por debajo de 10 , y el otro 60% por encima de 10.

Decil 6

k n+1
Posicion =
10
6 9+1
Posicion = =𝟕
10
La posición me dio un numero entero, 6 es la posición que me dio el numero entero

𝐷6 = 13 → El 60% de los datos están por debajo de 13 , y el otro 60% por encima de 13.

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
35

Datos agrupados Decil

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre el decil 𝐃𝟑 de los siguientes conjuntos de datos agrupados.

Clase Frecuencia Frec. Acumulada


(f) Fa↑
20-40 8 8
40-60 10 18
60-80 14 32
80-100 12 44
100-120 7 51
TOTAL n= 51

Decil 3; K=3 Calculo

nk 𝑛𝑘 51 3
− Fa1↑ = = 𝟏𝟓. 𝟑
DK = Linf + 10 × Ic 10 10
f
Con el numero 38.25 entramos a la tabla y
15.30 − 8 buscamos un número en Fa↑ inmediatamente
D3 = 40 + × 20
10 mayor que 15.3 que es el 18
D3 = 54.60

El 30% de los datos esta por encima de 54.60 y el 70% esta por encima54.60

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
36

h). Percentiles (𝐏𝐤 ) :

Divide un conjunto ordenados en 100 partes iguales.

Min P1 P2 P3 P4 P5 P6 P7 P8 … P99 Max

1% 1% 1% 1% 1% 1% 1% 1% 1%

 Percentil 𝐏𝟑 : Significa que el 3% de los datos está por debajo, y que 97%
restante por encima.
 Percentil 𝐏𝟐𝟓 ∶ Significa que el 25% de los datos está por debajo, y que 75%
restante por encima.
 Percentil 𝐏𝟓𝟎 ∶ Por definición es igual a la mediana y significa que el 50% de los
datos está por debajo, y que 50% restante por encima.
 Percentil 𝐏𝟖𝟎 : Significa que el 80% de los datos está por debajo, y que 20%
restante por encima.

 Datos no agrupado impares


NOTA:
k n+1
Posicion = ; K = 1,2, 3, 4, 5 ,6, 7 … 99
100 Se puede comprobar lo
siguiente
 Datos no agrupado pares
P50 = D5 = Q2
Percentiles kn
(𝑷𝒌 ) Posicion = ; K = 1,2, 3, 4, 5 ,6, 7 … 99 P30 = D3
100
 Datos agrupados P60 = D6
nk P75 = Q3
− Fa1↑
PK = Li + 100 × Ic
f P25 = Q1

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
37

Datos no agrupados Percentil

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre percentil, de los siguientes conjuntos de datos:

x = 20, 8,15,13,6,3,12,10,18

Ordenando los datos en forma ascendente Nota: Si la posición me da un numero


𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20, entero el cuartil va ser la posición que
me dio.

Posición: 1 2 3 4 5 6 7 8 9 Si me da un numero decimal el cuartil


−𝟓 − 𝟒 𝐏−𝟔𝟐
Percentil 𝟑 −𝟐 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓 será la posición anterior + (posición
mayor - la posición anterior)
−𝟓 −𝟒 k
−𝟑 n−+𝟐 1 −𝟏 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓
Posicion = multiplicado por la parte decimal.
100
62 9 + 1
Posicion = = 𝟔. 𝟐𝟎 𝐏𝐨𝐬𝐢𝐜𝐢ό𝐧, el decil P62 está entre la posiciόn 6 y 7
100
P62 = 13 + 15 − 13 𝟎. 𝟐𝟎

P62 = 13.40 , El 62% de los datos está por debajo de 13.40 y el 38% por encima .

Percentil 𝐏𝟔𝟎

k n+1
Posicon =
100
60 9 + 1
Posicon = =𝟔
100
La posición me dio un numero entero, 𝑃60 es la posición que me dio el numero entero

P60 = 13 El 60% de los datos está por debajo de 13 y el otro 40% por encima.

NOTA:

Se puede comprobar lo siguiente

P50 = D5 = Q2
P30 = D3
P60 = D6
P75 = Q3
P25 = Q1

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
38

Datos agrupados Percentil

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Encuentre el Percentil 𝐏𝟔𝟐 de los siguientes conjuntos de datos


agrupados.

Clase Frecuencia Frec. Acumulada


(f) Fa↑
20-40 8 8
40-60 10 18
60-80 14 32
80-100 12 44
100-120 7 51
TOTAL n= 51

Percentil 𝐏𝟔𝟐 , 𝐊 = 𝟔𝟐 Calculo

nk 𝑛𝑘 51 62
− Fa1↑ = = 𝟑𝟏. 𝟔𝟐
PK = Linf + 100 × Ic 100 100
f
Con el numero 31.62 entramos a la tabla y
31.62 − 18 buscamos un número en Fa↑ inmediatamente
P62 = 60 + × 20
14 mayor que 31.62 que es el 32
P62 = 79.45

El 62% de los datos esta por debajo de 79.45 y el 38% esta por encima 79.45

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
39

MEDIDAS DE DISPERSION O VARIABILIDAD

Son indicadores que miden la variación o dispersión de los datos con respecto a una
medida de tendencia central o promedio.

Sirven para completar o suplementar a un promedio, lo más comunes o usuales son:

a. Recorrido o rango (R x )

b. Desviación cuartilica DQ
Medidas de
c. Desviación media Dm
dispersión o
variabilidad
d. La varianza (s2 = r 2 )
e. Deviación típica o estándar (s = r)
f. Coeficiente de variación o dispersión(C. V)

a). Recorrido o rango 𝐑 𝐱 :

Es la diferencia entre el valor más alto y el más bajo del conjunto de datos. Es una medida
tosca de dispersión porque solo intervienen dos valores en sus cálculos.

𝐑 𝐱 = 𝐱𝐧 − 𝐱𝐢

b). Desviación cuartilica 𝐃𝐐 :

Se define como la diferencia del Cuartil tres y el Cuartil 1 , divida entre dos. Es una media
burda de dispersión lo que en sus cálculos no intervienen los datos.

𝐐𝟑 − 𝐐𝟏
𝐃𝐐 =
𝟐

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
40

c). Desviación media 𝐃𝐦

Se define como la suma del valor absoluto de las desviaciones de la variable, divida entre
la cantidad de valores. Es una medida rustica de dispersión ya que deja de lado el signo
algebraico.

𝐱𝐢 − 𝐱
𝐃𝐦 = 𝐩𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐧𝐨 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
𝐱−𝐱 ×𝐟
𝐃𝐦 = 𝐩𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨s
𝐧

Donde:

𝐱 = Marca de clase
xf
𝐱= ; la media aritmetica datos agrupados
n
𝐧 = numero de datos

d). La varianza (𝐬𝟐 = 𝐫 𝟐 )

Es una medida de dispersión absoluta que se define como la suma de las desviaciones
cuadradas dividas entre cantidad de valores. Su resultado viene expresado en unidades
cuadráticas.

𝐱𝐢 − 𝐱 𝟐
𝐬𝟐 = 𝐫 𝟐 = , 𝐏𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐧𝐨 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
𝟐
𝟐 𝟐
𝐱−𝐱 ×𝐟
𝐬 =𝐫 = , 𝐏𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
Donde:

𝐱 = Marca de clase
xf
𝐱= ; la media aritmetica datos agrupados
n
𝐧 = numero de datos
𝐟 = frecuencia absoluta

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
41

e). Deviación típica o estándar (𝐬 = 𝐫)

Es una de las medidas de dispersión absoluta que se define como la raíz cuadrada de la
varianza. La desviación estándar es una medida estadística de la dispersión de un grupo o
población. Una gran desviación estándar indica que la población está muy dispersa
respecto de la media. Una desviación estándar pequeña indica que la población está muy
compactada alrededor de la media.

𝐬=𝐫= 𝐫 𝟐 ό 𝐬𝟐

f). Coeficiente de variación o dispersión(𝐂. 𝐕)

Es una medida de dispersión relativa que se define como el coeficiente de la desviación


típica entre la media aritmética multiplicado por cien. Esto mide el porcentaje de
dispersión de los datos con respecto a su media aritmética.

𝐫
𝐂. 𝐕 = × 𝟏𝟎𝟎
𝐱

Escala de coeficiente de variación

0 - 10 Excelente
10 - 20 Muy bueno
20 - 30 Bueno
30 - 40 Regular
40 - 50 Malo

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
42

Datos no agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Dado los siguientes datos.


𝐱 = 𝟏𝟎, 𝟖, 𝟓 , 𝟑, 𝟗

Determine:

a) Rango R X
b) Desviacion Cuartilica DQ
c) Media aritmetica o promedio x
d) Desviacion Media DM
e)Varianza s2 = r 2
f)Desviacion tipica o estandar s = r
g)Coeficiente de Variacion C. V

Ordenando los datos


x = 3 ,5, 8, 9 , 10

𝐚) 𝐑𝐚𝐧𝐠𝐨 𝐑 𝐗
R x = xn − xi

R x = 10 − 3 = 7

𝐛) 𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢𝐨𝐧 𝐂𝐮𝐚𝐫𝐭𝐢𝐥𝐢𝐜𝐚 𝐃𝐐
𝑄3 − 𝑄1
DQ =
2
x = 3 ,5, 𝟖, 9 , 10

3+5 9 + 10
𝑄1 = = 4 ; 𝑄2 = 8 ; 𝑄3 = = 9.5
2 2
9.5 − 4
𝐃𝐐 = = 2.75
2
𝐜) 𝐌𝐞𝐝𝐢𝐚 𝐚𝐫𝐢𝐭𝐦𝐞𝐭𝐢𝐜𝐚 𝐨 𝐩𝐫𝐨𝐦𝐞𝐝𝐢𝐨 𝐱
n
xi
i=1
x=
n
3 + 5 + 8 + 9 + 10
x=
5
x=7

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
43

𝐝) 𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢𝐨𝐧 𝐌𝐞𝐝𝐢𝐚 𝐃𝐌
xi − x
DM =
n
3 − 7 + 5 − 7 + 8 − 7 + 9 − 7 + 10 − 7
DM =
5
4+2+1+2+3
DM =
5
DM = 2.4

𝐞)𝐕𝐚𝐫𝐢𝐚𝐧𝐳𝐚 𝐬𝟐 = 𝐫 𝟐
𝟐
𝐱𝐢 − 𝐱
𝐬𝟐 = 𝐫 𝟐 =
𝐧
2 2 2 2 2
2 2
3−7 + 5−7 + 8−7 + 9−7 + 10 − 7
s =r =
5
2 2 2 2 2
2 2
−4 + −2 + 1 + 2 + 3
s =r =
5
16 + 4 + 1 + 4 + 9
s2 = r2 =
5
s2 = r 2 = 6.8

𝐟)𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢𝐨𝐧 𝐭𝐢𝐩𝐢𝐜𝐚 𝐨 𝐞𝐬𝐭𝐚𝐧𝐝𝐚𝐫 𝐬 = 𝐫

s=r= r2 ό s2

s = r = 6.8

s = r = 2.608

𝐠)𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐕𝐚𝐫𝐢𝐚𝐜𝐢𝐨𝐧 𝐂. 𝐕
r
C. V = × 100
x
2.608
C. V = × 100
7
s = r = 37.25%

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
44

Datos agrupados

𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈: Dado el siguiente conjunto de datos agrupados.

Determine:

a) Media aritmetica o promedio x


b) Desviacion Media DM
c)Varianza s2 = r 2
d)Desviacion tipica o estandar s = r
e)Coeficiente de Variacion C. V

Clases Frecuencia M. Clase x.f |x- x ̅| |x- x ̅|f |x-x ̅|² |x-x ̅|².f
f x
0-2 3 1 3 4.23 12.69 17.89 53.68
2-4 5 3 15 2.23 11.15 4.97 24.86
4-6 8 5 40 0.23 1.84 0.05 0.42
6-8 6 7 42 1.77 10.62 3.13 18.80
8-10 4 9 36 3.77 15.08 14.21 56.85
Total n= 26 ∑= 136 ∑= 51.38 ∑= 154.62

a) Media aritmetica o promedio x d)Desviacion tipica o estandar s = r


x. f 136 s=r= r2 ό s2
x= = = 5.23
n 26
s = r = 5.95

b) Desviacion Media DM s = r = 2.44

x−x ×f
Dm =
n e)Coeficiente de Variacion C. V
51.38 r
Dm = = 1.976 C. V = × 100
26 x
2.44
C. V = × 100
5.23
c)Varianza s2 = r 2
C. V = 46.65 %
2
x−x ×f 154.64
s2 = r2 = = = 5.95
n 26

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
45

PROBABILIDADES

Probabilidad:
Es la mayor o menor posibilidad de que ocurra un determinado suceso. En otras palabras,
su noción viene de la necesidad de medir o determinar cuantitativamente la certeza o
duda de que un suceso ocurra o no.
Esta establece una relación entre el numero de sucesos favorables y el número total de
sucesos posibles.
A = Eventos simples

Numeros de sucesos favorables de "A"


P A = × 100
Numeros de sucesos de casos total

Experimento aleatorios: Son aquellos en los que no se puede predecir el resultado.


Ejemplos:
 Al lanzar una moneda es un experimento aleatorio ya que no sabemos si
obtendremos cara o cruz.
 Al lanzar un dado es un experimento aleatorio ya que no podemos predecir el
numero que obtendremos.
Experimento determinista: Es aquel que si se puede predecir el resultado.
Ejemplos:
 Al extraer una bola de una urna que solo contiene bolas rojas es un experimento
determinista ya que podemos predecir que la bola extraída seria roja.

Espacio Muestral (E):


Es el conjunto de todos los resultados posible de un experimento.

Espacio Muestral.
E = 1 ,2 ,3 ,4 ,5 ,6

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
46

Suceso aleatorio: Es un elemento del espacio maestral. Es decir cada uno de los
resultados de un experimento aleatorio es un suceso aleatorio.
Ejemplo.
 En el lanzamiento de una moneda los sucesos son aleatorio: Sale cara o cruz.

Ejemplo: Probabilidad simple

Dadas las siguientes figuras ∆∆∆ ⊡⊡⊡⊡⊡ ⨀⨀⨀⨀, determine:

1. Cuál es la probabilidad de seleccionar ⨀?

Casos favorables = 4
Casos totales = 12

4
P ⨀ = × 100 = 33.33%
12
2. Cuál es la probabilidad de que no salga ⨀?

Casos favorables = 8
Casos totales = 12

8
P ⨀ = × 100 = 66.67%
12
3. Cuál es la probabilidad de que salga ⨀ ∧ ⊡ ?

Casos favorables = 9
Casos totales = 12

0
P ⨀⋀⊡ = × 100 = 0 ; es excluyete, no pueden salir amba a la vez
12
4. Cuál es la probabilidad de que salga ⨀ ό ⊡ ?

Casos favorables = 9
Casos totales = 12
9
P ⨀ό ⊡ = × 100 = 75%
12

5. Cuál es la probabilidad de que no salga ∆ ό ⊡ ?

Casos favorables = 8
Casos totales = 12
8
P ∆ό⊡ = × 100 = 66.67%
12
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
47

Ejemplo II : Probabilidad simple

Dadas las siguientes bolas


5 bolas amarillas
6 Bolas rojas
7 bolas negras
3 verdes

Total de bolas 21

Determine la probabilidad de que al extraer una bola sea:


a) Amarilla o verde
b) Negra o rojas o verdes
c) Negra y amarilla
d) Que no salga amarilla
e) Que no salga verde
f) De que no salga roja
g) De que salga roja

a) Cuál es la probabilidad de que salga amarilla o verde ?

Casos favorables = 8
Casos totales = 21
8
P ό = × 100 = 38.10%
21

b) Cuál es la probabilidad de que salga negra o rojas o verde ?

Casos favorables = 16
Casos totales = 21
16
P ό ό = × 100 = 76.19%
21

c) Cuál es la probabilidad de que salga negra y amarilla?

Casos favorables = 12
Casos totales = 21

0
P ⋀ = × 100 = 0 ; es excluyete, no pueden salir amba a la vez
21

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
48

d) Cuál es la probabilidad de que no salga amarilla?

Casos favorables = 16
Casos totales = 21

16
P = × 100 = 76.19%
21

e) Cuál es la probabilidad de que no salga verde?

Casos favorables = 18
Casos totales = 21

18
P = × 100 = 85.71%
21

f) Cuál es la probabilidad de que no salga roja?

Casos favorables = 15
Casos totales = 21

15
P = × 100 = 71.43%
21

g) Cuál es la probabilidad de que salga roja?

Casos favorables = 15
Casos totales = 21

6
P = × 100 = 28.57%
21

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
49

Eventos mutuamente excluyente:

Cuando la ocurrencia de un evento anula la probabilidad de que el resto de los eventos se


presenten. Aquí utilizamos la regla especial de la suma.

𝐏 𝐀 ό 𝐁 = 𝐏 𝐀 + 𝐏(𝐁)

Eventos no mutuamente excluyente:


Son aquellos en los cuales los hechos pueden ocurrir simultáneamente.

J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ

Vous aimerez peut-être aussi