Académique Documents
Professionnel Documents
Culture Documents
Estadística II
“La inferencia puede tener conclusiones que pueden NO ser ciertas en forma absoluta;
por lo que es necesario que éstas sean dadas con una medida de confiabilidad. Ésta
medida de confiabilidad es la probabilidad “.
POBLACIÓN Y MUESTRA:
Población: Conjunto de elementos (personas, objetos, etc.) en los que se pueden observar
o medir, una o más características de naturaleza cualitativa o cuantitativa.
Por ejemplo, los empleados en una empresa ABC, constituyen una población en la que
cada empleado (unidad estadística) tiene muchas características a ser observadas, como:
género, estado civil, procedencia, grado de instrucción, religión, etc. (variables
cualitativas) o números de hijos, ingreso mensual, etc. (variables cuantitativas). El
resultado de observar o medir una característica en una unidad estadística, se denomina
dato estadístico, valor observado o simplemente observación.
Muestra: Es una parte de la población seleccionada de acuerdo con un plan o una regla
con el fín de obtener información acerca de la población de la cual proviene.
En la Población:
Parámetros (letras
griegas)
Análisis
Estadístico
Muestra: Estadígrafos
VARIABLE ESTADÍSTICA: Es una característica definida en una población y que asume por
lo menos dos valores: cualidad o cantidad.
Población.
Unidad Característica.
Estadística. Valor.
Cualidad.
Valor. Discreta.
Cantidad.
Contínua.
Una variable estadística es denotada por X y sus valores observados en una muestra de
“n” unidades estadísticas escogidas en una población se denotarán por x1, x2, x3, ….. xn.
Ejemplo 1: Los alumnos del curso de Estadística para los Negocios II en la Universidad Alas
Peruanas Filial Piura - 2018. En ellos se pueden identificar las variables cualitativas tales
como género, estado civil, religión, color favorito, música preferida, etc. y variables
cuantitativas tales como edad, estatura, número de hermanos, créditos por cursos
matriculados, etc. (Hoja Excel en laboratorio)
Todo análisis estadístico se realiza para una población o muestra, y los métodos para
encontrar parámetros o estadígrafos se realizan para las variables estadísticas observadas.
Es decir el trabajo estadístico se realiza en cada variable estadística.
DISTRIBUCIÓN DE FRECUENCIAS:
Después de la recopilación de los datos de una tarea o investigación estadística, éstos son
pasados a una hoja de datos. Cada columna de una hoja de datos es una variable
estadística.
Donde:
ci vs fi
8
0
c1 c2 c3 c4 c5
63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
HISTOGRAMA: Es una gráfica básica que consiste de barras rectangulares, dibujada con
una orientación vertical u horizontal. Viene dada por (Ci o Ii) vs fi
Histograma
9
8
7
6
5
4 frecuencias
3
2
1
0
A B C D E F G
Polígono de Frecuencias
8
7
6
5
4
frecuencias
3
2
1
0
A B C D E F G
Frecuencias
Clases
DISTRIBUCIONES SIMÉTRICAS:
Curvas Simétricas
DISTRIBUCIONES ASIMÉTRICAS:
DISTRIBUCIÓN MULTIMODAL:
LA MEDIANA: (Me) Es el número que separa a la serie de datos ordenados en dos partes
de igual número de datos. La mediana es la medida promedio que depende del número de
orden de los datos y no de los valores de éstos datos.
Ordenar los datos de forma creciente y luego se ubica el valor central Me. Si n es impar, la
mediana es el dato ordenado del centro. Si n es par, la mediana es la semisuma de los dos
valores ordenados centrales.
𝐴(0.50 − 𝐻𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
ℎ𝑖
LA MODA: (Mo) Es el valor que se define como el dato que ocurre con mayor frecuencia.
En la distribución de frecuencias por intervalos la moda se ubica en el intervalo que tiene
la mayor frecuencia.
𝑑1
𝑀𝑜 = 𝐿𝑖 + 𝐴. ( )
𝑑1 + 𝑑2
∑𝑛𝑖=1 𝑥𝑖
𝑋̅ =
𝑛
∑𝑛
𝑖=1 𝑓𝑖 .𝑋𝑖
Para variable cuantitativa discreta: 𝑋̅ =
𝑛
∑𝑛
𝑖=1 𝑓𝑖 .𝑚𝑖
Para variable cuantitativa contínua: 𝑋̅ =
𝑛
∑𝑛
𝑖=1 ℎ𝑖 .𝑚𝑖
Usando la frecuencia relativa y marca de clase: 𝑋̅ =
𝑛
∑𝑁
𝑖=1 𝑥𝑖
𝜇 =
𝑁
𝑋̅ = 𝑀𝑒 = 𝑀𝑜
𝑀𝑜 < 𝑀𝑒 < 𝑋̅
𝑋̅ < 𝑀𝑒 < 𝑀𝑜
a Simétricas Simétricas
𝑋̅ = 𝑀𝑒 = 𝑀𝑜
LA MEDIA GEOMÉTRICA ( ̅
𝑿𝑮 ) Se aplica para promediar: razones, índices, proporciones,
tasas de cambio, etc.
𝑋̅𝐺 = 𝑛√𝑥1 . 𝑥2 . 𝑥3 … 𝑥𝑛
NOTA: ̅
𝑿𝑯 ≤ ̅ ̅
𝑿𝑮 ≤ 𝑿
Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de tendencia central. Esto es media (promedio
aritmético), mediana y moda.
Recomendación: Realizar los ejercicios propuestos de las páginas 54 -61 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora. Pontificia
Universidad Católica del Perú. (5° Edición).
MEDIDAS DE DISPERSIÓN:
Son números reales que miden el grado o nivel de separación de los datos con respecto a
un valor central, que generalmente es la media aritmética.
Q1 Q3
3.- Varianza: Es la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.
∑𝑛𝑖=1 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
∑𝑛𝑖=1 𝑓𝑖 . 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
∑𝑛𝑖=1 𝑓𝑖 . 𝑚𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
𝑆𝑛
𝑐𝑣 =
𝑋̅
También se puede expresar como porcentaje. Es una medida de dispersión relativa, libre
de unidades de medición. Se utiliza para comparar la variabilidad de dos o más series de
datos que tengan medias iguales o diferentes, o que tengan unidades de medidas iguales
o diferentes.
NOTA:
Varianza de la población:
∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁
Además:
2
∑𝑁
𝑖=1 𝑥𝑖
2
𝜎 = − 𝜇2
𝑁
Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de dispersión. Esto es rango de la variable, el
rango intercuartil, varianza y desviación estándar.
VALORES ESTANDARIZADOS:
𝑋 − 𝑋̅
𝑍=
𝑆𝑛
En matemáticas:
14−13
𝑍= = 0.3333
3
En historia:
16−17
𝑍= = -0.25
4
DESIGUALDAD DE CHEBYSHEV:
[𝑋̅ − 𝑘. 𝑆𝑛 , 𝑋̅ + 𝑘. 𝑆𝑛 ]
1
Contiene por lo menos (1 − 𝑘 2) por ciento de los datos.
1
El porcentaje de datos que se ubican fuera del intervalo es menor que ( 𝑘 .100%)
Ejemplo 8: Si los salarios no agrupados de 120 obreros, tienen una media de $300 y una
desviación estándar de $30.
INDICES DE ASIMETRÍA:
Se dice que una distribución de frecuencias de variable discreta es simétrica si son iguales
las frecuencias de sus valores equidistantes del valor central.
Se dice que una distribución de frecuencias por intervalos es simétrica, si son iguales las
frecuencias de los intervalos equidistantes del intervalo central.
a Simétricas Simétricas
a Simétricas
3(𝑋̅ −𝑀𝑒 )
Usando la mediana 𝐴𝑠 = 𝑆
Consiste en encontrar la curva ajustada y = a + bx, para el cual los valores asociados se
calculan mediante:
Además: 𝑎 = 𝑦̅ − 𝑏. 𝑥̅
∑𝑛
𝑖=1 𝑦𝑖 ∑𝑛
𝑖=1 𝑥𝑖
Donde: 𝑦̅ = 𝑥̅ =
𝑛 𝑛
Ejemplo 9:La empresa textil “Puno Moda” SRL, le envía los siguientes datos de confección de chompas en el
año 2013. La confección detallada en meses fue de la planta 01 ubicada a 20 km de la Ciudad de Puno. Así
mismo, las cantidades están dadas por docenas de chompas fabricadas por mes. Encuentre la ecuación lineal
que mejor se ajuste a la distribución de los datos, interprete resultados y enuncie conclusiones.
∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖
LA COVARIANZA: 𝐶𝑜𝑣 𝑥𝑦 = − 𝑋̅. 𝑌̅
𝑛
Mide el nivel de variabilidad (dispersión) conjunta de los datos de las variables en pareja (X,Y) con
respecto a sus medias respectivas (𝑋̅, 𝑌̅).
𝐶𝑜𝑣 𝑥𝑦
𝑟=
𝑆𝑥 . 𝑆𝑦
Si r=0, se dice que no hay una correlación entre las dos variables.
𝐶𝑜𝑣 𝑥𝑦
NOTA: En el método de los mínimos cuadrados: 𝑏= 𝑆𝑥 ²
En la variable bidimensional (X, Y): Cuando una de las variables es el tiempo (en días, meses, años)
la regresión se denomina serie de tiempo.
Recomendación: Realizar los ejercicios propuestos de las páginas 103, 108 - 113 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).
PROBABILIDAD:
Es una ciencia exacta que se desarrolla en forma axiomática.
Experimento aleatorio: Es todo proceso que consiste de la ejecución de un acto (o prueba) una o
más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede
predecir con certeza. (Ejemplo, lanzar un dado).
Espacio muestral (Ω): Conjunto de todos los resultados posibles de un experimento aleatorio. A
cada elemento de un espacio muestral se le denomina punto muestral.
Ejemplo 10: El experimento aleatorio de lanzar un dado y observar el resultado en la cara superior.
Solución: Ω = { 1, 2, 3, 4, 5, 6 }
C
C
S
C
C
S
S
Lanzamiento 1
C
C
S
S
C
S
S
De donde se tiene el espacio muestral: Ω = { CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS }
𝑛!
𝑉𝑘𝑛 =
(𝑛 − 𝑘)!
Permutaciones simples: 𝑃𝑛 = 𝑛!
𝑃𝐶 𝑛 = (𝑛 − 1)!
𝑛!
𝐶𝑘𝑛 =
𝑘! (𝑛 − 𝑘)!
PROBABILIDAD DE UN EVENTO:
Definición: Sea Ω el espacio muestral asociado a un experimento aleatorio. La
probabilidad de cualquier evento A de Ω es el número real P(A) que satisface:
TEOREMA: Si A y B son dos eventos tales que A⊂B entonces P(A) ≤ P(B)
NOTAS:
Consecuentemente: 0 ≤ P(A) ≤ 1
CÁLCULO DE PROBABILIDADES:
Ésta ecuación es llamada “La Regla de Laplace“. Ejemplos en la pág. 157, 166 – 171 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵/𝐴) =
𝑃(𝐴)
NOTAS:
2) Observe que (𝐴 ∩ 𝐵) ⊂A, entonces cada vez que se calcula P(B/A) estamos realmente
calculando P(B) cuando el evento A ha ocurrido.
𝑃(𝐵)
5) Si B⊂A entonces 𝑃(𝐵/𝐴) = 𝑃(𝐴)
Ejemplos en la pág. 172 - 173, además ejercicios resueltos 188 – 190, y ejercicios propuestos 191 -
198 del libro “Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).
w X (función)
x = X(w)
Una v.a. X es una función definida en Ω, talque para w ∈ Ω se le asocia un número real
x=X(w).
Rx = { x∈R / x=X(w); w ∈ Ω }
Ejemplo 12: Sea Ω el espacio muestral que resulta del experimento aleatorio de lanzar al aire una
moneda tres veces consecutivas y observar la cara superior.
Solución: Tenemos Ω = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}
Por lo tanto, si Rx = {x1, x2, … , xn} y si B = {xi} es un evento unitario en Rx, entonces:
Ejemplo 13: Si la v.a. X es el número de caras que resultan al lanzar una moneda tres veces.
Entonces Rx = {0, 1, 2, 3}. Por lo tanto en Rx se tiene:
𝑃𝑥 (𝐵) = 𝑃(𝐴)
Además:
b) ∑ 𝑝𝑖 = 1
xi∈ Rx
3.-Para todo número real x≠xi donde xi∈ Rxse define: P[X=x] = P(φ) = 0
FUNCIÓN DE PROBABILIDAD:
Sea X una variable aleatoria (v.a. discreta). Se denomina función (ley, modelo o
distribución) de probabilidad de X a la función f(x) definida por f(x) = P[X=x] en todo x∈R,
que satisface:
i) f(x) ≥ 0, ∀ x∈ 𝑅
ii)∑ 𝑓(𝑥𝑖 ) = 1
𝑥𝑖 ∈ 𝑅𝑥
∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … , xn} es finito.
∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … } es infinito.
Además:
Valores xi de X x1 x2 x3 … xn
Probabilidad pi=P[X=xi] p1 p2 p3 … pn
Ejemplo 14: Sea X la v.a. definida como el número de caras que ocurre al lanzar una moneda 4
veces.
En efecto:
Rx = {0, 1, 2, 3, 4}
.f(2) = P[X=2]= P({SSCC ó SCSC ó SCCS ó CSSC ó CSCS ó CCSS })= 6/16
De manera que:
xi .pi=f(xi)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16
Se dice que la función f(x) es una función de densidad de probabilidad de la v.a. contínua
X si satisface:
NOTAS:
La condición (i) indica que la gráfica de f(x) no tiene puntos por debajo del eje de las
abscisas.
.f(x)
P[a≤x≤b]
0 X
a b
Distribución de probabilidad F.