Académique Documents
Professionnel Documents
Culture Documents
a
2018
ESTADĺSTICA I
- Toma de datos.
- Frecuencias.
- Distribución de frecuencias,
- Elementos para elaborar una distribución de frecuencia.
- Rango, amplitud total, clases, número de clase, valor del intervalo.
- Límites reales de clases.
- Columna que componen una distribución de frecuencia.
- Presentación gráfica: Histograma de frecuencia, Polígono de frecuencia, ojiva y gráfico
circular.
- Media aritmética.
- Media aritmética para datos no agrupados.
- Media aritmética pondera.
- Media aritmética para datos agrupados.
- Mediana.
- Mediana para datos no agrupados
- Mediana para datos agrupados.
- La moda.
- La moda para datos no agrupados
- La moda para datos agrupados.
- Media geométrica.
- Aplicaciones de la media geométrica.
- Media geométrica para datos agrupados
- Media armónica datos no agrupados
- Media armónica datos agrupados
- Medidas de posición (Cuartiles, deciles y percentiles).
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
3
- Dispersión.
- Recorrido o amplitud (Rango).
- Desviación media.
- Desviación media para datos agrupados y no agrupados.
- Desviación cuartilítica.
- La varianza.
- Desviación típica.
- Desviación típica para datos agrupados y no agrupados.
- Concepto de la probabilidad.
- Experimento aleatorio, espacio muestral.
- Probabilidad a priori y a posteriori.
- Axiomas de la probabilidad.
- Elementos mutuamente excluyentes y no excluyentes.
- Probabilidad condicionada.
- Sucesos independientes.
- Valor esperado o esperanza matemática.
- Propiedad del valor esperado
BIBLIOGRAFÍA BASICA
- Webster, Allen. (2002). Estadística Aplicada a los negocios y la Economía. (3 ra. Ed.).
Pennsylvania, USA: McGraw-Hill.
BIBLIOGRAFIA COMPLEMENTARIA:
- Perez F. Victor P. (2005). Estadística Descriptiva. (1ra. Ed.). Santo Domingo, Rep. Dom.
Impresora Soto Castillo S. A..
- Perez F. Victor P. (2005). Estadística Inferencial. (1ra. Ed.). Santo Domingo, Rep. Dom.
Impresora Soto Castillo S. A..
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
4
DEFINICIONES DE ESTADISTICA
La estadística es la ciencia que tiene por objeto agrupar metódicamente todos los
hechos que se prestan a una evaluación numérica como por ejemplo: La población,
impuestos, recursos naturales,producción,etc.
La estadística permite resumir los datos más destacados de los elementos que
componen a un conjunto logrando así captar más fácilmente su contenido. Es
fundamental en la investigación científica, porque ella permite decir con numero cualquier
tipo de análisis de la realidad.
Estadística Inferencia: Comprende aquellas técnicas por medio de las cuales se toman
decisiones sobre una población estadística basadas en una muestra observada en un juicio
obtenido.
POBLACION (N): Es el conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones.
Muestra (n): Parte de una población que se considera representativa de la mimas , para
obtener resultados validos.
Población (N)
Muestra (n)
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
5
1. Se quiere saber la preferencia de color de los estudiante de la escuela Prof. Juan Bosch
de Santiago. Cuál será la población y cuál será la muestra.
VARIABLE ESTADISTICA:
- Cualitativas
Variable
Estadística
- Discretas
-Cuantitativas
- Continua
2. Cuantitativas: Son aquellas que tienen valor numérico, por ejemplo: edad, precio de un
producto, ingreso anuales, etc).
Variable Discreta: Son aquellas que pueden tomar valores enteros (1,2,3,4,...etc).
por ejemplo numero de hermanos ( puede ser 1, 2, 3... etc, pero nunca puede ser
numero decimales 3.45)
Variable Continua: Puede tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehículo puede ser 90.4k/h , 95.6 km/h, , también
estatura, ejemplo 1.75m, 1.80m, 1.50m, etc.
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
6
DISTRIBUCION DE FRECUENCIA
20 − 30
L. Inf L. Sup
Cada clase tiene una frecuencia (f) y esa frecuencia es la cantidad de datos que
pertenecen a esa clase.
1. Rango( R): Diferencia entre el dato mayor y el menor del conjunto de datos dado.
𝐑 = 𝐱𝐧 − 𝐱𝟏
𝐃𝐨𝐧𝐝𝐞:
2. Numero de clase( 𝐍𝐜 ): Para determinar el número de clase que debe formarse para
analizar los datos se ha establecido que no debes ser menor de cinco (5) ni más de quince
(15). Basado en ellos el señor H.A. Sturges ideo la siguiente fórmula para determinar el
número de clase exacto a formar.
𝐍𝐜 = 𝟏 + 𝟑. 𝟑 𝐥𝐨𝐠 𝐧
𝐃𝐨𝐧𝐝𝐞:
𝐍𝐜 = Numero de clase
𝐧 = Total de los datos
Nota: El numero de clase debemos redondearlo: Ejemplo Nc=2.5 = 3 ; Ejemplo Nc= 2.3= 2
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
7
𝐑 𝐱𝐧 − 𝐱𝟏
𝚰𝐂 = ≈
𝐍𝐜 𝐍𝐜
4. Frecuencia absoluta simple de una clase o grupo (𝐟): Es el número de veces que se
repite la clase. Es la cantidad de datos o valores que hay en dicha clase.
5. Punto medio o marca de clase (𝐱): Es la suma del límite superior y el límite inferior
divido entre dos.
𝐟
𝐟𝐫 = × 𝟏𝟎𝟎
𝐧
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
8
Los datos siguientes son los ingresos por hora de los obreros de la construcción de la
República Dominicana en el 2018.
60, 36, 68, 132, 95, 89, 112, 152, 45, 65, 75, 90, 88, 97, 124, 138, 52, 73, 83, 100, 85, 109,
130, 147, 170, 179, 124, 118, 115, 86
𝐒𝐨𝐥𝐮𝐜𝐢𝐨𝐧:
179 − 36
ΙC = = 23.83 ≈ 24
6
ΙC = 24
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
9
Los datos siguientes son las calificaciones obtenidas en un examen de física tomados por
40 estudiantes de los estudiantes 4to A, del liceo Prof. Juan Bosch
42, 64, 91, 55, 87, 69, 86, 81, 21, 60, 74, 68, 29, 77, 87, 90, 46, 87, 70, 74,34, 75, 67, 75, 69,
81, 65, 66, 59, 47, 69, 82, 81, 73, 49, 37, 97, 82, 57, 94
𝐒𝐨𝐥𝐮𝐜𝐢𝐨𝐧:
97 − 21
ΙC = = 12.67 ≈ 13
6
ΙC = 13
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
10
Presenta los datos mediante un conjunto de texto o escritura donde queda expresado el
contenido general de la variable.
Presenta los datos mediante un conjunto de fila y columna donde se coloca las
clasificaciones que hacemos de la variable y las cifras asociadas a dichas clasificaciones.
Titulo del cuadro: Se coloca encima del cuadro dando el significado del mismo.
Este debe responder a las preguntas que , como, donde y cuando.
Los encabezados: Son subtítulos que encabezan cada columna del cuadro dando el
significado de ellas.
La columna matriz: Es la primera columna del cuadro la cual nos da la clasificación
de la variable.
El cuerpo: Son todas las demás columna del cuadro, el cual nos da la parte
numérica del mismo.
La fuente: Se coloca debajo del cuadro y ella dice de donde se extrajeron los datos.
Existen dos elementos secundarios en el cuadro que son: Las notas introductoria y las
notas al pie del cuadro. Ellas se utilizan cuando es necesario hacer algún llamado u
observaciones especiales sobre el contenido general del cuadro.
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
11
3. Representación grafica:
Consiste en un esquema o dibujo donde una sola unidad quede expresado el contenido
general de la variable.
Este grafico al igual que el cuadro debe tener el titulo, la fuente, la leyenda y cualquier
otro detalle que aclare al mismo. Lo más comunes son: Histograma, polígono de
frecuencia, la ojiva, el grafico de barras, etc.
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
12
Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n=30 ∑= 100.0 %
HISTOGRAMA DE FRECUENCIA
9
7
Frecuenia absoluta (f)
0 Intervalo de clase
36-60 60-84 84-108 108-132 132-156 156-180
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
13
Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n= 30 ∑= 100
Poligono de frecuencia
Frecuencia
absoluta (f) 9
0
48 72 96 120 144 168 Punto medio o
marca de clase (x)
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
14
Clase Frecuencia Marca de Clase Frec. Relativa Frec. Acumulada Frec. Acumulada
(f) x fr % Fa↑ Fa↓
36-60 3 48 10.0 % 3 30
60-84 6 72 20.0 % 9 27
84-108 8 96 26.7 % 17 21
108-132 7 120 23.3 % 24 13
132-156 4 144 13.3 % 28 6
156-180 2 168 6.7 % 30 2
TOTAL n=30 ∑= 100
Ojiva
40
Frecuencia acumulada ↑
30
20
10
0
36-60 60-84 84-108 108-132 132-156 156-180
Intervalo de clase
Ojiva
40
Frecuencia acumula↓
30
20
10
0
36-60 60-84 84-108 108-132 132-156 156-180
Intervalo de clase
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
15
Para determinar el ángulo central que corresponde a una frecuencia absoluta utilizamos
f
≮ = 360∘ × ό 360∘ × fr
n
36-60
10%
132-156
13%
60-84
20%
108-132
23%
84-108
27%
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
16
Son indicadores estadísticos que resumen con un solo valor el conjunto de datos o variable
estudiado. Su valor estará ubicado cerca del centro del conjunto de datos o variable.
Las principales características de estas es que sea representativas del conjunto de datos o variable
a la cual trata de explicada.
b. Mediana Me
c. Moda o valor modal Mo
d. Media geométrica (Mg)
Medidas de
tendencia e. Media Armónica (MA )
central
f. Cuartiles (Qk )
g. Deciles (Dk )
h. Percentiles (Pk )
Es una medida de tendencia central que se define como la suma de todos los valores de la
variable o conjunto de datos, dividió entre la cantidad de dicho valores. Su valor está
ubicado cerca del centro del conjunto de datos.
Datos no agrupado
n
i=1 xi xf xf
Media x= Media x= =
aritmética o n Ponderada n f
promedio Datos agrupados
xf
x=
n
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
17
Datos no agrupados
𝐄𝐣𝐞𝐦𝐩𝐥𝐨 𝐈𝐈: Las comisiones registradas en los primeros 6 meses del año de un vendedor
son las siguientes $25,000.00, $32,0000.00 ,$45,000.00, $63,750.55, $85,763.20,
$28,350.20. Cuál es la media aritmética o promedio.
n
i=1 xi
x=
n
$25,000.00 + $32,000.00 + $45,000.00 + $63,750.55 + $85763.20 + $28,350.20
x=
6
$279,863.95
x= = $45,643.99
6
Datos no agrupados
Datos agrupados
xf 3,096.00
x= = = 103.20
n 30
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
18
Media Ponderada:
xf xf
x= =
f n
14 $120 + 12 $115 + 7($90) $3,690.00
x= = = 111.82
14 + 12 + 7 33
b) Mediana 𝐌𝐞 :
Es una medida de tendencia central que divide el conjunto ordenado de datos en dos
partes iguales. Es aquel valor de la variable por debajo del cual se encuentra el 50% de los
datos y por encima el otro 50%. Su valor está ubicado exactamente en el centro del
conjunto de datos o variable. Ella presenta las siguientes características.
Datos agrupados
Mediana n
− Fa1 ↑
𝐌𝐞 = Li + 2 × 𝐼𝐶
f
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
19
12 + 16 28
Me = = = 14
2 2
8 + 10 18
Me = = =9
2 2
𝑀𝑒 = 15
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
20
Datos agrupados
𝐧
− 𝐅𝐚𝟏 ↑
𝐌𝐞 = 𝐋𝐢 + 𝟐 × 𝐈𝐂
𝐟
Donde:
𝐧
= Clase mediana
𝟐
𝐋𝐢 = Limite Inferior
𝐧 = Cantidad de datos
𝐅𝐚𝟏 ↑= Frecuencia acumulada anterior
𝐈𝐂 = Intervalo de clase
𝐟 = Frecuencia de la clase
Clase mediana: Es aquella que tiene una frecuencia acumulada inmediatamente superior al valor
n/2, y con esto entramos a la tabla
30
−9
Me = 84 + 2 × 24
8
30
−9
Me = 84 + 2 × 24
8
Me = 102
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
21
Datos agrupados
n
− Fa1 ↑
Me = Li + 2 × IC
f
35
− 13
Me = 60 + 2 × 20
12
Me = 60 + 7.5
Me = 67.5
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
22
Es una medida de tendencia central que define como el valor más típico o frecuente de
una distribución o conjunto de datos. Es el valor que más se repite. Esta presenta las
siguientes características.
Datos no agrupado
Es el dato que más se repite.
Donde:
Moda Datos agrupados Li = Limite Inferior
fm − f1 fm = Frencuencia modal
𝐌𝐨 = Li + × IC
fm − f1 + fm − f2 f1 = Frencuencia clase anterior
f2 = Frencuencia clase despues
IC = Intervalo de clase
Datos no agrupados
𝐌𝐨 = 8 Unimodal
𝐌𝐨 = 15 y 20 Bimodal
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
23
Datos agrupados
Clase Frecuencia
(f)
16-24 7 Moda: Es aquella que tiene mayor frecuencia
24-32 8 f1 absoluta
32-40 12 fm
fm − f1
40-48 3 f2 𝐌𝐨 = Li + × IC
fm − f1 + fm − f2
48-56 6
TOTAL n= 36
12 − 8
Mo = 32 + ×8
12 − 8 + 12 − 3
4
Mo = 32 + ×8
4 + 9
Mo = 34.46
Clase Frecuencia
(f)
20-40 9 Moda: Es aquella que tiene mayor frecuencia
40-60 12 f1 absoluta
60-80 15 fm
fm − f1
80-100 10 f2 𝐌𝐨 = Li + × 𝐼𝐶
fm − f1 + fm − f2
100-120 6
TOTAL n= 52
15 − 12
Mo = 60 + × 20
15 − 12 + 15 − 10
3
Mo = 60 + × 20
3 + 5
Mo = 60 + 7.5 = 67.50
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
24
Es una medida de tendencia central y se define como la raíz enésima del producto
de los valores de la variable. Se utiliza para obtener el promedio de una variable que
experimenta crecimiento geométrico, como por ejemplo la población de persona, la tasa
de interés del dinero, etc. Esta presenta las siguientes características.
𝐧
𝐌𝐠 = 𝐱 𝟏 𝐱𝟐 𝐱𝟑 … 𝐱 𝐧 Datos no agrupados
𝐟 𝐥𝐨𝐠 𝐱
𝐌𝐠 = 𝐀𝐧𝐭𝐢 𝐥𝐨𝐠 Datos no agrupados
𝐧
También
𝐧
𝐌𝐠 = 𝐱 𝟏 𝐟𝟏 𝐱 𝟐 𝐟𝟐 𝐱 𝟑 𝐟𝟑 … 𝐱 𝐧 𝐟𝐧 Datos no agrupados
Donde:
x= Marca de clase
f= Frecuencia de cada clase
n= Total de los datos
Datos no agrupados
x = 4, 8, 16, 12, 10
5
Mg = 4 8 16 12 10
5
Mg = 61,440.00 = 9.07
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
25
Datos agrupados
.
Clase Frecuencia Marca de Clase f log x
(f) x
36-60 3 48 5.044
60-84 6 72 11.144
84-108 8 96 15.858
108-132 7 120 14.554
132-156 4 144 8.633
156-180 2 168 4.451
TOTAL n= 30 ∑= 59.684
𝐟 𝐥𝐨𝐠 𝐱
𝐌𝐠 = 𝐀𝐧𝐭𝐢 𝐥𝐨𝐠
𝐧
59.684
Mg = Anti log
30
Mg = 97.499 ≈ 97.5
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
26
n PMayor
r= −1
Pmenor
7 9.5 millones
r= − 1 = 0.018 ≈ 1.8% tasa de crecimiento
8.4 millones
Datos
Datos
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
27
Es una medida de tendencia central que se define como el inverso de la media aritmética
de los reciproco de los valores de la variable. Ella se utiliza para obtener promedio de una
variable de movimiento, como la velocidad y la distancia recorrida.
n
𝐌𝐀 = Datos sin agrupar
1
x
n
𝐌𝐀 = Datos agrupado
f
x
Datos no agrupados
x = 8, 5, 10, 3
n
𝐌𝐀 =
1
x
4 4
𝐌𝐀 = = = 5.27
1 1 1 1 91
8 + 5 + 10 + 3 120
Datos agrupados
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
28
Min Q1 Q2 Q3 Max
Cuartil uno (𝐐𝟏 ): Es aquel valor de la variable por debajo del cual se encuentra el
25% de los datos y por encima el 75%.
Cuartil dos (𝐐𝟐 ): Por definición es igual a la mediana (50% y 50%)
Cuartil dos (𝐐𝟑 ): Es aquel valor de la variable por debajo del cual se encuentra el
75% de los datos, y por encima el 25%.
k n+1
Posicion = ; K = 1, 2, 3
4
kn
Posicion = ; K = 1, 2, 3
4
Datos agrupados
nk
− Fa1↑
Q K = Li + 4 × Ic
f
Donde:
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
29
x = 20, 8,15,13,6,3,12,10,18
Nota: Si la posición me da un numero
Ordenando los datos en forma ascendente entero el cuartil va ser la posición que
𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20 me dio.
k n+1
Posicion =
4
1 9+1
Posicion = = 𝟐. 𝟓𝟎 𝐏𝐨𝐬𝐢𝐜𝐢ό𝐧, el cuartil Q1 esta entre la posiciόn 2 y 3
4
Q1 = 6 + 8 − 6 𝟎. 𝟓𝟎
Cuartil 2
k n+1
Posicion =
4
2 9+1
Posicion = =𝟓
4
La posición me dio un numero entero 𝑄2 es la posición que me dio el numero entero
Cuartil 3
k n+1
Posicion =
4
3 9+1
Posicion = = 𝟕. 𝟓𝟎 𝐏𝐨𝐬𝐢𝐜𝐢ό𝐧, el cuartil Q3 esta entre la posiciόn 7 y 8
4
Q3 = 15 + 18 − 15 𝟎. 𝟓𝟎
Q3 = 16.5 → El 75% está por debajo de 16.50 y el otro 25% está por encima de 16.5
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
30
x = 20, 8,15,13,6,3,12,10,18
Solución:
50% 50%
Q2 = 12
Determinando Cuartil 1:
La serie que me quedo es par, para determinar la mediana para serie par ser realiza de la
siguiente manera
6+8
Q1 = =7
2
Determinando Cuartil 3:
La serie que me quedo es par, para determinar la mediana para serie par ser realiza de la
siguiente manera
15 + 18
Q3 = = 16.5
2
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
31
x = 2 , 3 , 4, 6, 9, 10
Solución:
x = 2 , 3 , 4, 6 , 9, 10
50% 50%
4+6
Q2 = =5
2
x = 2 , 3 , 4 6, 9, 10
50% 50%
𝑸𝟐 = 𝟓
Determinando Cuartil 1:
La serie que me quedo impar, para determinar la mediana para serie par ser realiza de la
siguiente manera
x = 2 , 3 , 4 6, 9, 10
50%
Q1 = 3
Determinando Cuartil 3:
La serie que me quedo impar, para determinar la mediana para serie par ser realiza de la
siguiente manera
x = 2 , 3 , 4 6, 9, 10
50%
𝑸𝟐 = 𝟓
Q3 = 9
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
32
Calculo
Cuartil 3; K=3
𝑛𝑘 51 3
= = 𝟑𝟖. 𝟐𝟓
nk 4 4
− Fa1↑
QK = Linf + 4 × Ic Con el numero 38.25 entramos a la tabla y
f
buscamos un número en Fa↑ inmediatamente
38.25 − 32
Q3 = 80 + × 20 mayor o igual que 38.25 que es el 44
12
Q3 = 90.42
El 75% de los datos esta por debajo de 90.42 y el 25% esta por encima 90.25
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
33
Son medidas de posición que divide a un conjunto ordenados de datos en diez partes
iguales.
Min D1 D2 D3 D4 D5 D6 D7 D8 D9 Max
Decil 𝐃𝟐 : Significa que el 20% de los datos está por debajo, y que 80% restante
por encima.
Decil 𝐃𝟑 ∶ Significa que el 30% de los datos está por debajo, y que 70% restante
por encima.
Decil 𝐃𝟓 ∶ Por definición es igual a la mediana y significa que el 50% de los datos
está por debajo, y que 50% restante por encima.
Decil 𝐃𝟖 : Significa que el 80% de los datos está por debajo, y que 20% restante
por encima.
k n+1
Posicion = , K = 1, 2, 3, 4, 5, 6, 7, 8, 9
10
Datos no agrupado pares
Deciles (𝑫𝒌 )
kn
Posicion = , K = 1, 2, 3, 4, 5, 6, 7, 8, 9
10
Datos agrupados
nk
− Fa1↑
DK = Li + 10 × Ic
f
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
34
x = 20, 8,15,13,6,3,12,10,18
Nota: Si la posición me da un numero
Ordenando los datos en forma ascendente
entero el cuartil va ser la posición que
𝑥 = 3, 6, 8, 10, 12, 13, 15, 18, 20, me dio.
k n+1
Posicion =
10
4 9+1
Posicon = =𝟒
10
La posición me dio un numero entero, 𝐷4 es la posición que me dio el numero entero
𝐷4 = 10 → El 40% de los datos están por debajo de 10 , y el otro 60% por encima de 10.
Decil 6
k n+1
Posicion =
10
6 9+1
Posicion = =𝟕
10
La posición me dio un numero entero, 6 es la posición que me dio el numero entero
𝐷6 = 13 → El 60% de los datos están por debajo de 13 , y el otro 60% por encima de 13.
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
35
nk 𝑛𝑘 51 3
− Fa1↑ = = 𝟏𝟓. 𝟑
DK = Linf + 10 × Ic 10 10
f
Con el numero 38.25 entramos a la tabla y
15.30 − 8 buscamos un número en Fa↑ inmediatamente
D3 = 40 + × 20
10 mayor que 15.3 que es el 18
D3 = 54.60
El 30% de los datos esta por encima de 54.60 y el 70% esta por encima54.60
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
36
1% 1% 1% 1% 1% 1% 1% 1% 1%
Percentil 𝐏𝟑 : Significa que el 3% de los datos está por debajo, y que 97%
restante por encima.
Percentil 𝐏𝟐𝟓 ∶ Significa que el 25% de los datos está por debajo, y que 75%
restante por encima.
Percentil 𝐏𝟓𝟎 ∶ Por definición es igual a la mediana y significa que el 50% de los
datos está por debajo, y que 50% restante por encima.
Percentil 𝐏𝟖𝟎 : Significa que el 80% de los datos está por debajo, y que 20%
restante por encima.
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
37
x = 20, 8,15,13,6,3,12,10,18
P62 = 13.40 , El 62% de los datos está por debajo de 13.40 y el 38% por encima .
Percentil 𝐏𝟔𝟎
k n+1
Posicon =
100
60 9 + 1
Posicon = =𝟔
100
La posición me dio un numero entero, 𝑃60 es la posición que me dio el numero entero
P60 = 13 El 60% de los datos está por debajo de 13 y el otro 40% por encima.
NOTA:
P50 = D5 = Q2
P30 = D3
P60 = D6
P75 = Q3
P25 = Q1
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
38
nk 𝑛𝑘 51 62
− Fa1↑ = = 𝟑𝟏. 𝟔𝟐
PK = Linf + 100 × Ic 100 100
f
Con el numero 31.62 entramos a la tabla y
31.62 − 18 buscamos un número en Fa↑ inmediatamente
P62 = 60 + × 20
14 mayor que 31.62 que es el 32
P62 = 79.45
El 62% de los datos esta por debajo de 79.45 y el 38% esta por encima 79.45
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
39
Son indicadores que miden la variación o dispersión de los datos con respecto a una
medida de tendencia central o promedio.
a. Recorrido o rango (R x )
b. Desviación cuartilica DQ
Medidas de
c. Desviación media Dm
dispersión o
variabilidad
d. La varianza (s2 = r 2 )
e. Deviación típica o estándar (s = r)
f. Coeficiente de variación o dispersión(C. V)
Es la diferencia entre el valor más alto y el más bajo del conjunto de datos. Es una medida
tosca de dispersión porque solo intervienen dos valores en sus cálculos.
𝐑 𝐱 = 𝐱𝐧 − 𝐱𝐢
Se define como la diferencia del Cuartil tres y el Cuartil 1 , divida entre dos. Es una media
burda de dispersión lo que en sus cálculos no intervienen los datos.
𝐐𝟑 − 𝐐𝟏
𝐃𝐐 =
𝟐
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
40
Se define como la suma del valor absoluto de las desviaciones de la variable, divida entre
la cantidad de valores. Es una medida rustica de dispersión ya que deja de lado el signo
algebraico.
𝐱𝐢 − 𝐱
𝐃𝐦 = 𝐩𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐧𝐨 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
𝐱−𝐱 ×𝐟
𝐃𝐦 = 𝐩𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨s
𝐧
Donde:
𝐱 = Marca de clase
xf
𝐱= ; la media aritmetica datos agrupados
n
𝐧 = numero de datos
Es una medida de dispersión absoluta que se define como la suma de las desviaciones
cuadradas dividas entre cantidad de valores. Su resultado viene expresado en unidades
cuadráticas.
𝐱𝐢 − 𝐱 𝟐
𝐬𝟐 = 𝐫 𝟐 = , 𝐏𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐧𝐨 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
𝟐
𝟐 𝟐
𝐱−𝐱 ×𝐟
𝐬 =𝐫 = , 𝐏𝐚𝐫𝐚 𝐝𝐚𝐭𝐨𝐬 𝐚𝐠𝐫𝐮𝐩𝐚𝐝𝐨𝐬
𝐧
Donde:
𝐱 = Marca de clase
xf
𝐱= ; la media aritmetica datos agrupados
n
𝐧 = numero de datos
𝐟 = frecuencia absoluta
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
41
Es una de las medidas de dispersión absoluta que se define como la raíz cuadrada de la
varianza. La desviación estándar es una medida estadística de la dispersión de un grupo o
población. Una gran desviación estándar indica que la población está muy dispersa
respecto de la media. Una desviación estándar pequeña indica que la población está muy
compactada alrededor de la media.
𝐬=𝐫= 𝐫 𝟐 ό 𝐬𝟐
𝐫
𝐂. 𝐕 = × 𝟏𝟎𝟎
𝐱
0 - 10 Excelente
10 - 20 Muy bueno
20 - 30 Bueno
30 - 40 Regular
40 - 50 Malo
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
42
Datos no agrupados
Determine:
a) Rango R X
b) Desviacion Cuartilica DQ
c) Media aritmetica o promedio x
d) Desviacion Media DM
e)Varianza s2 = r 2
f)Desviacion tipica o estandar s = r
g)Coeficiente de Variacion C. V
𝐚) 𝐑𝐚𝐧𝐠𝐨 𝐑 𝐗
R x = xn − xi
R x = 10 − 3 = 7
𝐛) 𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢𝐨𝐧 𝐂𝐮𝐚𝐫𝐭𝐢𝐥𝐢𝐜𝐚 𝐃𝐐
𝑄3 − 𝑄1
DQ =
2
x = 3 ,5, 𝟖, 9 , 10
3+5 9 + 10
𝑄1 = = 4 ; 𝑄2 = 8 ; 𝑄3 = = 9.5
2 2
9.5 − 4
𝐃𝐐 = = 2.75
2
𝐜) 𝐌𝐞𝐝𝐢𝐚 𝐚𝐫𝐢𝐭𝐦𝐞𝐭𝐢𝐜𝐚 𝐨 𝐩𝐫𝐨𝐦𝐞𝐝𝐢𝐨 𝐱
n
xi
i=1
x=
n
3 + 5 + 8 + 9 + 10
x=
5
x=7
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
43
𝐝) 𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢𝐨𝐧 𝐌𝐞𝐝𝐢𝐚 𝐃𝐌
xi − x
DM =
n
3 − 7 + 5 − 7 + 8 − 7 + 9 − 7 + 10 − 7
DM =
5
4+2+1+2+3
DM =
5
DM = 2.4
𝐞)𝐕𝐚𝐫𝐢𝐚𝐧𝐳𝐚 𝐬𝟐 = 𝐫 𝟐
𝟐
𝐱𝐢 − 𝐱
𝐬𝟐 = 𝐫 𝟐 =
𝐧
2 2 2 2 2
2 2
3−7 + 5−7 + 8−7 + 9−7 + 10 − 7
s =r =
5
2 2 2 2 2
2 2
−4 + −2 + 1 + 2 + 3
s =r =
5
16 + 4 + 1 + 4 + 9
s2 = r2 =
5
s2 = r 2 = 6.8
s=r= r2 ό s2
s = r = 6.8
s = r = 2.608
𝐠)𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐕𝐚𝐫𝐢𝐚𝐜𝐢𝐨𝐧 𝐂. 𝐕
r
C. V = × 100
x
2.608
C. V = × 100
7
s = r = 37.25%
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
44
Datos agrupados
Determine:
Clases Frecuencia M. Clase x.f |x- x ̅| |x- x ̅|f |x-x ̅|² |x-x ̅|².f
f x
0-2 3 1 3 4.23 12.69 17.89 53.68
2-4 5 3 15 2.23 11.15 4.97 24.86
4-6 8 5 40 0.23 1.84 0.05 0.42
6-8 6 7 42 1.77 10.62 3.13 18.80
8-10 4 9 36 3.77 15.08 14.21 56.85
Total n= 26 ∑= 136 ∑= 51.38 ∑= 154.62
x−x ×f
Dm =
n e)Coeficiente de Variacion C. V
51.38 r
Dm = = 1.976 C. V = × 100
26 x
2.44
C. V = × 100
5.23
c)Varianza s2 = r 2
C. V = 46.65 %
2
x−x ×f 154.64
s2 = r2 = = = 5.95
n 26
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
45
PROBABILIDADES
Probabilidad:
Es la mayor o menor posibilidad de que ocurra un determinado suceso. En otras palabras,
su noción viene de la necesidad de medir o determinar cuantitativamente la certeza o
duda de que un suceso ocurra o no.
Esta establece una relación entre el numero de sucesos favorables y el número total de
sucesos posibles.
A = Eventos simples
Espacio Muestral.
E = 1 ,2 ,3 ,4 ,5 ,6
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
46
Suceso aleatorio: Es un elemento del espacio maestral. Es decir cada uno de los
resultados de un experimento aleatorio es un suceso aleatorio.
Ejemplo.
En el lanzamiento de una moneda los sucesos son aleatorio: Sale cara o cruz.
Casos favorables = 4
Casos totales = 12
4
P ⨀ = × 100 = 33.33%
12
2. Cuál es la probabilidad de que no salga ⨀?
Casos favorables = 8
Casos totales = 12
8
P ⨀ = × 100 = 66.67%
12
3. Cuál es la probabilidad de que salga ⨀ ∧ ⊡ ?
Casos favorables = 9
Casos totales = 12
0
P ⨀⋀⊡ = × 100 = 0 ; es excluyete, no pueden salir amba a la vez
12
4. Cuál es la probabilidad de que salga ⨀ ό ⊡ ?
Casos favorables = 9
Casos totales = 12
9
P ⨀ό ⊡ = × 100 = 75%
12
Casos favorables = 8
Casos totales = 12
8
P ∆ό⊡ = × 100 = 66.67%
12
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
47
Total de bolas 21
Casos favorables = 8
Casos totales = 21
8
P ό = × 100 = 38.10%
21
Casos favorables = 16
Casos totales = 21
16
P ό ό = × 100 = 76.19%
21
Casos favorables = 12
Casos totales = 21
0
P ⋀ = × 100 = 0 ; es excluyete, no pueden salir amba a la vez
21
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
48
Casos favorables = 16
Casos totales = 21
16
P = × 100 = 76.19%
21
Casos favorables = 18
Casos totales = 21
18
P = × 100 = 85.71%
21
Casos favorables = 15
Casos totales = 21
15
P = × 100 = 71.43%
21
Casos favorables = 15
Casos totales = 21
6
P = × 100 = 28.57%
21
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ
49
𝐏 𝐀 ό 𝐁 = 𝐏 𝐀 + 𝐏(𝐁)
J.L.S.R
ING. JORGE LUIS SAINT- HILAIRE RODRIGUEZ