Estadística II CURSO

2019
Estadística II
JOSÉ LUIS ECHE CALDERÓN

Universidad Alas Peruanas.
Estadística II
NOCIONES DE ESTADÍSTICA DESCRIPTIVA:

Estadística: Ciencia aplicada que nos proporciona un conjunto de métodos, técnicas o
procedimientos para: Recopilar, Organizar (Clasificar, Agrupar), Presentar y Analizar datos;
con el fin de describirlos o de realizar generalizaciones válidas.
Recopilar Organizar Presentar Analizar
¡Para una mejor toma de decisiones!!!
Estadística Descriptiva: Conjunto de métodos estadísticos que se relacionan con el

resumen y descripción de los datos, como tablas, gráficas y el análisis mediante algunos
cálculos.
Inferencia Estadística: Conjunto de métodos con el que se hacen la generalización o la

inferencia sobre una población utilizando una muestra.
“La inferencia puede tener conclusiones que pueden NO ser ciertas en forma absoluta;
por lo que es necesario que éstas sean dadas con una medida de confiabilidad. Ésta
medida de confiabilidad es la probabilidad “.
POBLACIÓN Y MUESTRA:
Población: Conjunto de elementos (personas, objetos, etc.) en los que se pueden observar
o medir, una o más características de naturaleza cualitativa o cuantitativa.
A cada elemento de la población se le denomina unidad elemental ó unidad estadística.
Por ejemplo, los empleados en una empresa ABC, constituyen una población en la que
cada empleado (unidad estadística) tiene muchas características a ser observadas, como:
género, estado civil, procedencia, grado de instrucción, religión, etc. (variables
cualitativas) o números de hijos, ingreso mensual, etc. (variables cuantitativas). El
resultado de observar o medir una característica en una unidad estadística, se denomina
dato estadístico, valor observado o simplemente observación.
Lic. José Luis Eche Calderón 2

Estadística II
Parámetro: Se denomina parámetro a una medida descriptiva que resume una

característica definida en la población, tal como la media (μ) o la varianza (σ2), etc.,
calculada a partir de los datos observados de toda la población.
La población se clasifica en finita o infinita. La población es finita si tiene un número finito

N de elementos.
Muestra: Es una parte de la población seleccionada de acuerdo con un plan o una regla
con el fín de obtener información acerca de la población de la cual proviene.
La muestra debe ser seleccionada de manera que sea representativa de la población.
DEFINICIÓN: Se denomina estadística, estadígrafo o estadístico a una medida descriptiva

que resuma una característica definida en una muestra aleatoria, tal como la media (𝑋̅) o
la varianza (𝑆𝑛2 ) etc., calculada a partir de los datos observados en la muestra.
En la Población:
Parámetros (letras
griegas)
Análisis
Estadístico
Muestra: Estadígrafos

Estadística II
VARIABLE ESTADÍSTICA: Es una característica definida en una población y que asume por
lo menos dos valores: cualidad o cantidad.
Identificación de una variable estadística:
Población.
Unidad Característica.
Estadística. Valor.
Cualidad.
Valor. Discreta.
Cantidad.
Contínua.
Una variable estadística es denotada por X y sus valores observados en una muestra de
“n” unidades estadísticas escogidas en una población se denotarán por x1, x2, x3, ….. xn.
Ejemplo 1: Los alumnos del curso de Estadística para los Negocios II en la Universidad Alas
Peruanas Filial Piura - 2018. En ellos se pueden identificar las variables cualitativas tales
como género, estado civil, religión, color favorito, música preferida, etc. y variables
cuantitativas tales como edad, estatura, número de hermanos, créditos por cursos
matriculados, etc. (Hoja Excel en laboratorio)
Todo análisis estadístico se realiza para una población o muestra, y los métodos para
encontrar parámetros o estadígrafos se realizan para las variables estadísticas observadas.
Es decir el trabajo estadístico se realiza en cada variable estadística.

Estadística II
DISTRIBUCIÓN DE FRECUENCIAS:
Después de la recopilación de los datos de una tarea o investigación estadística, éstos son
pasados a una hoja de datos. Cada columna de una hoja de datos es una variable
estadística.
Para el análisis estadístico de los valores de una variable, es necesario organizarlos y

presentarlos en forma tal, que facilite su comprensión y su posterior utilización. Los datos
son organizados o agrupados en un cuadro numérico y presentados en gráficas
estadísticas.
Todo cuadro numérico, básicamente debe contener:
- Un título adecuado, para evitar confusiones y para expresar brevemente su

contenido.
- El cuerpo o agrupación de datos.
- La fuente de los datos, si no son datos propios.
El cuadro numérico de una sola variable estadística se denomina distribución de

frecuencias. (Para los datos de una muestra)
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA:
Categoría de la Frecuencia Absoluta Frecuencia Relativa Frecuencia

Variable X fi hi Porcentual pi
c1 f1 h1 p1
c2 f2 h2 p2
… … … …
ck fk hk pk
TOTAL n 1.00 100.00
Donde:
Frecuencia absoluta: fi(resulta del conteo)
Frecuencia Relativa: hi y se calcula como hi = fi /n
Frecuencia Porcentual: pi = hi * 100%

Estadística II
GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA: ci vs fi
ci vs fi
8
0
c1 c2 c3 c4 c5
Gráfica de la distribución de frecuencia para var. Cualitativa Xi
Ejemplo 2: Hojas Excel en laboratorio.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUANTITATIVA DISCRETA:
Si n valores de una variable discreta X, observados en una muestra de una población,

tienen k (k ≤ n) valores distintos x1, x2, …, xk que se repiten respectivamente f1, f2, … , fk
veces. Entonces, la organización o agrupación de estos “n” datos, origina el siguiente
cuadro:
Valores de la Frecuencias Frecuencias Frecuencias

Variable X Absolutas fi Relativas hi Porcentuales pi
x1 f1 h1 p1
x2 f2 h2 p2
… … … …
xk fk hk pk
TOTAL n 1.00 100.00
La gráfica de la distribución de variable cuantitativa discreta, tiene como representación

más común a la llamada gráfica de bastón, que consiste en xi vs fi.
Ejemplo 3: Hoja Excel en laboratorio.

Estadística II
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTÍNUOS: (por intervalos)
Construcción de la distribución de frecuencias:
1) Rango R = Xmáx – Xmín
2) Número de clases o intervalos 𝑘 = √𝑛 para 25 ≤ n ≤ 400

También existe la Regla de Sturgesk = 1 + 3.3log (n) para n ≥ 10
3) Determinar la amplitud del intervalo A = R/k(sometida a la condición kA ≥ R)
4) Definir los intervalos o clases: I1 = [Xmin , Xmin + A]

I2 = [Xmin + A, Xmin + 2A]
……….
Ik= [Xmin + (k-1)A ,Xmin + kA]
Los salarios quincenales, en dólares, recopilados en una muestra de 45 empleados son:
63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
Describa la variable, y desarrolle la distribución de frecuencias de los datos.
MARCA DE CLASE: Dado la clase o intervalo 𝐼 = [𝐿𝑖 , 𝑈𝑖 ]

𝐿𝑖 + 𝑈𝑖
La marca de clase es el número 𝑚𝑖 que se define por: 𝑚𝑖 =
2

Estadística II
GRÁFICA DE LA DISTRIBUCIÓN POR INTERVALOS:
Se representa mediante un histograma o polígono de frecuencias. Del polígono de

frecuencias se obtiene la curva de frecuencias.
HISTOGRAMA: Es una gráfica básica que consiste de barras rectangulares, dibujada con
una orientación vertical u horizontal. Viene dada por (Ci o Ii) vs fi
Histograma
9
8
7
6
5
4 frecuencias
3
2
1
0
A B C D E F G
POLÍGONO DE FRECUENCIAS: Es una gráfica secundaria, que se obtiene uniendo los

puntos medios (marca de clase) en cada intervalo del histograma.
Polígono de Frecuencias
8
7
6
5
4
frecuencias
3
2
1
0
A B C D E F G

Estadística II
CURVA DE FRECUENCIAS: Es una gráfica “avanzada” de una distribución de frecuencias

por intervalos que se obtiene del polígono de frecuencias “suavizando” sus puntos
angulosos. Es importante porque describe una aproximación del modelo de distribución
de la variable.
Frecuencias
Clases
DISTRIBUCIONES SIMÉTRICAS:
Las curvas simétricas son de 3 tipos: Leptocúrtica, normal o mesocúrtica y platicúrtica.
Curvas Simétricas

Estadística II
DISTRIBUCIONES ASIMÉTRICAS:
Asimetría Positiva Asimetría Negativa

Simétricas Simétricas
DISTRIBUCIÓN MULTIMODAL:
Curva Bimodal Curva Trimodal

Simétricas Simétricas
Una curva de frecuencias es bimodal si se tiene dos frecuencias máximas. Es trimodal si se

tienen tres frecuencias máximas. En general puede existir una curva multimodal con
múltiples frecuencias máximas.
Recomendación: Realizar los ejercicios propuestos de las páginas 32 - 36 del libro

“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

Estadística II
MEDIDAS DE TENDENCIA CENTRAL:
Las medidas de tendencia central, denominadas también promedios, ubican el centro de

los datos, como la media aritmética, la mediana y la moda.
LA MEDIANA: (Me) Es el número que separa a la serie de datos ordenados en dos partes
de igual número de datos. La mediana es la medida promedio que depende del número de
orden de los datos y no de los valores de éstos datos.
Para calcular la mediana, tenemos:
Para datos no agrupados:
Ordenar los datos de forma creciente y luego se ubica el valor central Me. Si n es impar, la
mediana es el dato ordenado del centro. Si n es par, la mediana es la semisuma de los dos
valores ordenados centrales.
Para datos agrupados: Mediante la fórmula:

𝑛
𝐴( 2 − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
𝑓𝑖
𝐴(0.50 − 𝐻𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
ℎ𝑖
Donde fi corresponde a la frecuencia de la clase que contiene a la mediana. Se identifica

mediante la mitad de datos o en el acumulado.
LA MODA: (Mo) Es el valor que se define como el dato que ocurre con mayor frecuencia.
En la distribución de frecuencias por intervalos la moda se ubica en el intervalo que tiene
la mayor frecuencia.
𝑑1
𝑀𝑜 = 𝐿𝑖 + 𝐴. ( )
𝑑1 + 𝑑2
Donde 𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 y 𝑑2 = 𝑓𝑖 − 𝑓𝑖+1
fi=Valor de la mayor frecuencia

Estadística II
LA MEDIA ARITMÉTICA (𝑿 ̅ ) Denominada simplemente media, es el valor numérico que se

obtiene dividiendo la suma total de los valores observados de una variable entre el
número de observaciones. Se calcula como:
Para datos no agrupados:
∑𝑛𝑖=1 𝑥𝑖
𝑋̅ =
𝑛
Para datos agrupados:
∑𝑛
𝑖=1 𝑓𝑖 .𝑋𝑖
Para variable cuantitativa discreta: 𝑋̅ =
𝑛
∑𝑛
𝑖=1 𝑓𝑖 .𝑚𝑖
Para variable cuantitativa contínua: 𝑋̅ =
𝑛
∑𝑛
𝑖=1 ℎ𝑖 .𝑚𝑖
Usando la frecuencia relativa y marca de clase: 𝑋̅ =
𝑛
NOTA: La media aritmética de la población se calcula mediante:
∑𝑁
𝑖=1 𝑥𝑖
𝜇 =
𝑁

Estadística II
RELACIÓN ENTRE MEDIA, MEDIANA Y MODA:
1.- Si la distribución de frecuencias de los datos es simétrica, entonces la media, la

mediana y la moda tienen el mismo valor.
𝑋̅ = 𝑀𝑒 = 𝑀𝑜
2.- Si la distribución es asimétrica de cola a la derecha (asimetría positiva), entonces:
𝑀𝑜 < 𝑀𝑒 < 𝑋̅
3.-Si la distribución es asimétrica de cola a la izquierda (asimetría negativa), entonces:
𝑋̅ < 𝑀𝑒 < 𝑀𝑜
𝑀𝑜 < 𝑀𝑒 < 𝑋̅ 𝑋̅ < 𝑀𝑒 < 𝑀𝑜
a Simétricas Simétricas
𝑋̅ = 𝑀𝑒 = 𝑀𝑜
Lic. José Luis Eche Calderón a Simétricas 13

Estadística II
LA MEDIA GEOMÉTRICA ( ̅
𝑿𝑮 ) Se aplica para promediar: razones, índices, proporciones,
tasas de cambio, etc.
𝑋̅𝐺 = 𝑛√𝑥1 . 𝑥2 . 𝑥3 … 𝑥𝑛
LA MEDIA ARMÓNICA ( ̅ 𝑿𝑯 ) Se aplica para obtener promedios de un conjunto de valores

expresados en forma de tasas de unidades de un tipo por unidades de otro tipo. (Por
ejemplo las unidades en Km/h)
NOTA: ̅
𝑿𝑯 ≤ ̅ ̅
𝑿𝑮 ≤ 𝑿
Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de tendencia central. Esto es media (promedio
aritmético), mediana y moda.
Recomendación: Realizar los ejercicios propuestos de las páginas 54 -61 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora. Pontificia
Universidad Católica del Perú. (5° Edición).

Estadística II
MEDIDAS DE DISPERSIÓN:
Son números reales que miden el grado o nivel de separación de los datos con respecto a
un valor central, que generalmente es la media aritmética.
1.- Rango o recorrido de una variable:
Rango = R = Xmáx – Xmín
2.- El rango intercuartil RI = Q3 – Q1
Q1 Q3
75% de los datos.
3.- Varianza: Es la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.
La varianza calculada de una muestra es 𝒔𝟐𝒏 y si es calculada de una población es 𝜎 2 .
Cálculo de la varianza de datos no agrupados:
∑𝑛𝑖=1 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
Cálculo de la varianza de datos agrupados: (variable discreta)
∑𝑛𝑖=1 𝑓𝑖 . 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
Cálculo de la varianza de datos agrupados: (variable contínua)
∑𝑛𝑖=1 𝑓𝑖 . 𝑚𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛
4.- Desviación Estándar: ( 𝑆𝑛 ) Es la raíz cuadrada positiva de la varianza.

Estadística II
5.- Coeficiente de variación: (Dispersión relativa)
𝑆𝑛
𝑐𝑣 =
𝑋̅
También se puede expresar como porcentaje. Es una medida de dispersión relativa, libre
de unidades de medición. Se utiliza para comparar la variabilidad de dos o más series de
datos que tengan medias iguales o diferentes, o que tengan unidades de medidas iguales
o diferentes.
NOTA:
Varianza de la población:
∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁
Además:
2
∑𝑁
𝑖=1 𝑥𝑖
2
𝜎 = − 𝜇2
𝑁
Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de dispersión. Esto es rango de la variable, el
rango intercuartil, varianza y desviación estándar.

Estadística II
VALORES ESTANDARIZADOS:
Cuando se necesiten comparar valores observados que pertenecen a diferentes

distribuciones de datos, las que difieren de su media aritmética o en su varianza, o
difieren en el tipo de unidad de medida (variables diferentes), entonces se estandarizan
los valores observados de la variable aplicando la variable “estandarizadora” o variable
estándar Z.
Para una distribución de datos de variable X, la variable estándar Z se define por:
𝑋 − 𝑋̅
𝑍=
𝑆𝑛
La variable Z estandariza en cero cualquier media 𝑋̅ y estandariza en uno a cualquier

varianza 𝑆𝑛2 .
Ejemplo 7: Las calificaciones en un examen final de Matemáticas e Historia generaron

medias 13 y 17, con desviaciones estándar 3 y 4 respectivamente. Si un alumno obtuvo 14
en matemáticas y 16 en historia. ¿En cuál de los dos cursos tiene mejor rendimiento
relativo?
Solución: El hecho que tenga 16 en historia y 14 en matemáticas no significa que tenga

mayor rendimiento en historia.
En matemáticas:
14−13
𝑍= = 0.3333
3
En historia:
16−17
𝑍= = -0.25
4
En consecuencia, el alumno tiene mejor rendimiento en matemáticas.

Estadística II
DESIGUALDAD DE CHEBYSHEV:
Cualquiera sea la forma de la distribución (simétrica o asimétrica) de los datos observados

de una variable X, el intervalo:
[𝑋̅ − 𝑘. 𝑆𝑛 , 𝑋̅ + 𝑘. 𝑆𝑛 ]
1
Contiene por lo menos (1 − 𝑘 2) por ciento de los datos.
1
El porcentaje de datos que se ubican fuera del intervalo es menor que ( 𝑘 .100%)
El intervalo [𝑋̅ − 2. 𝑆𝑛 , 𝑋̅ + 2. 𝑆𝑛 ] contiene 75% del total de datos.
El intervalo [𝑋̅ − 3. 𝑆𝑛 , 𝑋̅ + 3. 𝑆𝑛 ] contiene 88.89% del total de datos.
El intervalo [𝑋̅ − 4. 𝑆𝑛 , 𝑋̅ + 4. 𝑆𝑛 ] contiene 93.75% del total de datos.
Ejemplo 8: Si los salarios no agrupados de 120 obreros, tienen una media de $300 y una
desviación estándar de $30.
a) ¿Cuántos obreros por lo menos tienen salarios comprendidos en el intervalo

[$240,$360]?
b) Determine el intervalo que contiene al menos el 88.89% de los salarios.
c) Si el salario mínimo es $210, ¿en qué porcentaje se puede afirmar que los salarios
son superiores a $390?

Estadística II
INDICES DE ASIMETRÍA:
Se dice que una distribución de frecuencias de variable discreta es simétrica si son iguales
las frecuencias de sus valores equidistantes del valor central.
Se dice que una distribución de frecuencias por intervalos es simétrica, si son iguales las
frecuencias de los intervalos equidistantes del intervalo central.
En una distribución de frecuencias simétrica, coinciden en su centro la media, mediana y

moda.
𝑀𝑜 < 𝑀𝑒 < 𝑋̅ 𝑋̅ = 𝑀𝑒 = 𝑀𝑜 𝑋̅ < 𝑀𝑒 < 𝑀𝑜
a Simétricas Simétricas
a Simétricas
COEFICIENTE O ÍNDICE DE ASIMETRÍA DE PEARSON:

𝑋̅ −𝑀𝑜
Usando la moda 𝐴𝑠 = 𝑆
3(𝑋̅ −𝑀𝑒 )
Usando la mediana 𝐴𝑠 = 𝑆
Cuando:𝐴𝑠 = 0, la distribución de frecuencia de los datos es simétrica.
Cuando: 𝐴𝑠 > 0, la distribución de frecuencia de los datos tiene asimetría positiva.
Cuando: 𝐴𝑠 < 0, la distribución de frecuencia de los datos tiene asimetría negativa.

Estadística II
REGRESIÓN LINEAL SIMPLE:
Dada una muestra de “n” datos (x1,y1), (x2,y2),…,(xn,yn) observados de la variable

bidimensional (X,Y). La regresión lineal simple de la variable dependiente Y con respecto a
la variable independiente X, consiste en obtener la ecuación de la recta Y = a + bX, que
mejor se ajuste a los valores de la muestra, con el fín de poder predecir o pronosticar los
valores de Y dado X.
y Valores dispersos y recta ajustada.

4.5 y =a + bx
4
3.5
3
2.5
2 1
1.5
1
0.5
0 x
0 2 4 6 8 10
EL MÉTODO DE LOS MÍNIMOS CUADRADOS:
Consiste en encontrar la curva ajustada y = a + bx, para el cual los valores asociados se
calculan mediante:
𝑛. ∑𝑛𝑖=1 𝑥𝑖 . 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 . ∑𝑛𝑖=1 𝑦𝑖

𝑏=
𝑛. ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
Además: 𝑎 = 𝑦̅ − 𝑏. 𝑥̅
∑𝑛
𝑖=1 𝑦𝑖 ∑𝑛
𝑖=1 𝑥𝑖
Donde: 𝑦̅ = 𝑥̅ =
𝑛 𝑛
NOTA: Si b>0, entonces la tendencia lineal es creciente.
Si b<0, entonces la tendencia lineal es decreciente.

Estadística II
Ejemplo 9:La empresa textil “Puno Moda” SRL, le envía los siguientes datos de confección de chompas en el
año 2013. La confección detallada en meses fue de la planta 01 ubicada a 20 km de la Ciudad de Puno. Así
mismo, las cantidades están dadas por docenas de chompas fabricadas por mes. Encuentre la ecuación lineal
que mejor se ajuste a la distribución de los datos, interprete resultados y enuncie conclusiones.
Mes Cantidad (docenas)

Enero 111
Febrero 112
Marzo 110
Abril 111
Mayo 113
Junio 115
Julio 111
Agosto 110
Septiembre 114
Octubre 112
Noviembre 114
Diciembre 115
∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖
LA COVARIANZA: 𝐶𝑜𝑣 𝑥𝑦 = − 𝑋̅. 𝑌̅
𝑛
Mide el nivel de variabilidad (dispersión) conjunta de los datos de las variables en pareja (X,Y) con
respecto a sus medias respectivas (𝑋̅, 𝑌̅).
COEFICIENTE O ÍNDICE DE CORRELACIÓN:
𝐶𝑜𝑣 𝑥𝑦
𝑟=
𝑆𝑥 . 𝑆𝑦
Si r=1, se dice que hay una correlación lineal perfecta positiva.
Si r= -1, se dice que hay una correlación lineal perfecta negativa.
Si r=0, se dice que no hay una correlación entre las dos variables.
𝐶𝑜𝑣 𝑥𝑦
NOTA: En el método de los mínimos cuadrados: 𝑏= 𝑆𝑥 ²
En la variable bidimensional (X, Y): Cuando una de las variables es el tiempo (en días, meses, años)
la regresión se denomina serie de tiempo.
Recomendación: Realizar los ejercicios propuestos de las páginas 103, 108 - 113 del libro

Estadística II
PROBABILIDAD:
Es una ciencia exacta que se desarrolla en forma axiomática.
Experimento aleatorio: Es todo proceso que consiste de la ejecución de un acto (o prueba) una o
más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede
predecir con certeza. (Ejemplo, lanzar un dado).
Experimento: Proceso que genera un conjunto de datos cualitativos o cuantitativos.
Espacio muestral (Ω): Conjunto de todos los resultados posibles de un experimento aleatorio. A
cada elemento de un espacio muestral se le denomina punto muestral.
Ω = { w/w es un punto muestral }
Ejemplo 10: El experimento aleatorio de lanzar un dado y observar el resultado en la cara superior.
Solución: Ω = { 1, 2, 3, 4, 5, 6 }
Ejemplo 11: Lanzar una moneda 3 veces y observar el resultado global.
Solución: Diagrama de árbol.
C
C
S
C
C
S
S
Lanzamiento 1
C
C
S
S
C
S
S
De donde se tiene el espacio muestral: Ω = { CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS }

Estadística II
EVENTO: Se denomina evento a cualquier subconjunto de un espacio muestral.
En el espacio muestral finito Ω = { w1,w2,… ,wn } de n elementos, se puede definir 2n eventos

diferentes.
Evento imposible (φ): No tiene puntos muestrales. (Nunca ocurre).
Eventos unitarios o elementales {wi}: Contiene un solo punto muestral.
Eventos compuestos: Consiste de dos o más eventos elementales.
Evento seguro o cierto Ω: Contiene a todos los eventos elementales posibles.
Recomendación: Complementar con lecturas de las páginas135 - 140 del libro

VARIACIONES SIMPLES: Son las variaciones de K objetos tomados de n objetos distintos,

se refiere a los arreglos u órdenes que se hagan con los K objetos, de manera que éstos
arreglos difieran en algún elemento o en el orden de colocación.
𝑛!
𝑉𝑘𝑛 =
(𝑛 − 𝑘)!
Variaciones con repetición: 𝑉𝑅𝑘𝑛 = 𝑛𝑘
Permutaciones simples: 𝑃𝑛 = 𝑛!
Se denomina permutaciones de n objetos a cada una de las variaciones de los n objetos

distintos.
Permutaciones circulares: Se denomina permutaciones circulares a las diferentes

permutaciones que pueden formarse con n objetos distintos, donde no hay ni primero ni
último objeto.
𝑃𝐶 𝑛 = (𝑛 − 1)!

Estadística II
Combinaciones simples: Se refiere a la selección que podemos hacer de K objetos de los n

dados, sin tener en cuenta el orden de los mismos. (No puede haber combinaciones con
los mismos elementos).
𝑛!
𝐶𝑘𝑛 =
𝑘! (𝑛 − 𝑘)!
PROBABILIDAD DE UN EVENTO:
Definición: Sea Ω el espacio muestral asociado a un experimento aleatorio. La
probabilidad de cualquier evento A de Ω es el número real P(A) que satisface:
a) P(A) ≥ 0 para todo A.

b) P(Ω) = 1
c) Si A y B son dos eventos mutuamente excluyentes, entonces P(AUB) = P(A) + P(B)
TEOREMA: Si φ es el evento que no ocurre, entonces P(φ) = 0
TEOREMA: Si Ac es el evento complementario del evento A, entonces: P(Ac) = 1 – P(A)
TEOREMA: Si A y B son dos eventos tales que A⊂B entonces P(A) ≤ P(B)
NOTAS:
Para todo evento A, se verifica la relación 𝛷 ⊂ 𝐴 ⊂ 𝛺, entonces P(φ) ≤ P(A) ≤ P(Ω)
Consecuentemente: 0 ≤ P(A) ≤ 1
“La probabilidad de un evento es una medida de la fiabilidad de que ocurra un evento”
La probabilidad P es una función definida en eventos que son partes de Ω.

Estadística II
CÁLCULO DE PROBABILIDADES:
#(𝐴) 𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴

𝑃(𝐴) = =
#(𝛺) 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Ésta ecuación es llamada “La Regla de Laplace“. Ejemplos en la pág. 157, 166 – 171 del libro
PROBABILIDAD CONDICIONAL: Sean A y B dos eventos en un espacio muestral Ω. La probabilidad

condicional de B dado A, es el número P(B/A) que se define por:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵/𝐴) =
𝑃(𝐴)
Estoes para P(A) > 0.
NOTAS:
1) Si P(A) = 0 entonces P(B/A) = 0
2) Observe que (𝐴 ∩ 𝐵) ⊂A, entonces cada vez que se calcula P(B/A) estamos realmente
calculando P(B) cuando el evento A ha ocurrido.
3) Si A∩B = Φ entonces P(B/A) = 0
4) Si A⊂B entonces P(B/A) = P(A/A) = 1
𝑃(𝐵)
5) Si B⊂A entonces 𝑃(𝐵/𝐴) = 𝑃(𝐴)
Ejemplos en la pág. 172 - 173, además ejercicios resueltos 188 – 190, y ejercicios propuestos 191 -
198 del libro “Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.

Estadística II
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD:

Una variable estadística X, es una característica (cualitativa o cuantitativa) que se mide u
observa en una población. Si la población es aleatoria y la característica es cuantitativa,
entonces X se denomina variable aleatoria.
Definición: Se denomina v.a. a una variable estadística cuantitativa definida en un espacio

muestral Ω.
w X (función)
x = X(w)
Una v.a. X es una función definida en Ω, talque para w ∈ Ω se le asocia un número real
x=X(w).
El dominio de la v.a. X es el espacio muestral Ω y su rango es el conjunto de todos sus

valores posibles (Rx).
Rx = { x∈R / x=X(w); w ∈ Ω }
Ejemplo 12: Sea Ω el espacio muestral que resulta del experimento aleatorio de lanzar al aire una
moneda tres veces consecutivas y observar la cara superior.
Solución: Tenemos Ω = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}
Si se define en Ω, la variable X = “Número de caras obtenidas”, entonces X es una v.a. cuyo

rango es Rx = {0, 1, 2, 3}
En efecto: X = 0, corresponde al evento elemental {SSS}
X = 1, corresponde a los eventos elementales {SSC}, {SCS} y {CSS}
X = 2, corresponde a los eventos elementales {SCC}, {CSC} y {CCS}
X = 3, corresponde al evento elemental {CCC}

Estadística II
PROBABILIDAD EN EL RANGO Rx DE LA VARIABLE ALEATORIA:

Una v.a. discreta X asume cada uno de sus valores con cierta probabilidad que
denotaremos Px (Probabilidad inducida por X) y está definida en Rx.
Por lo tanto, si Rx = {x1, x2, … , xn} y si B = {xi} es un evento unitario en Rx, entonces:
Px ({xi}) = P ({w ∈ Ω / X(w)=xi}) = P(A)
Con frecuencia se utiliza:
P[X=xi] = P({w ∈ Ω / X(w)=xi})
Ejemplo 13: Si la v.a. X es el número de caras que resultan al lanzar una moneda tres veces.
Entonces Rx = {0, 1, 2, 3}. Por lo tanto en Rx se tiene:
P[X=0]= P({SSS})= 1/8
P[X=1]= P({SSC ó SCS ó CSS})= 3/8
P[X=2]= P({SCC ó CSC ó CCS})= 3/8
P[X=3]= P({CCC})= 1/8
NOTA MUY IMPORTANTE:
Siendo P una probabilidad definida en un espacio muestral Ω. X una v.a. definida en Ω

cuyo rango es Rx. La probabilidad Px de un evento B en Rx es:
𝑃𝑥 (𝐵) = 𝑃(𝐴)
Además:
1.-El conjunto de pares (xi, P[X=xi]) constituye la distribución de probabilidades de la v.a. X.

Esta distribución es similar a la distribución de frecuencias relativas.
2.-Las probabilidades pi = P[X=xi] donde xi∈ Rx, cumple:
a) pi ≥ 0 para cada xi∈ Rx.
b) ∑ 𝑝𝑖 = 1
xi∈ Rx
3.-Para todo número real x≠xi donde xi∈ Rxse define: P[X=x] = P(φ) = 0

Estadística II
FUNCIÓN DE PROBABILIDAD:
Sea X una variable aleatoria (v.a. discreta). Se denomina función (ley, modelo o
distribución) de probabilidad de X a la función f(x) definida por f(x) = P[X=x] en todo x∈R,
que satisface:
i) f(x) ≥ 0, ∀ x∈ 𝑅
ii)∑ 𝑓(𝑥𝑖 ) = 1
𝑥𝑖 ∈ 𝑅𝑥
La condición (ii) se desarrolla como:

𝑛
∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … , xn} es finito.
∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … } es infinito.
NOTA: Si A⊂Rx, entonces la probabilidad de A es el número:
P(A) = ∑𝑥𝑖∈𝐴 𝑃[𝑋 = 𝑥𝑖 ] = ∑𝑥𝑖∈𝐴 𝑓(𝑥𝑖 )
Además:
La función f(x) = P[X=x] = (Expresión en X) ó puede ser expresado por:
{(xi, pi)/ pi = f(xi) donde xi∈RX}ó por la tabla:

Distribución de probabilidad de v.a. discreta.
Valores xi de X x1 x2 x3 … xn
Probabilidad pi=P[X=xi] p1 p2 p3 … pn
La gráfica de una distribución de probabilidades de v.a. discreta es la gráfica de

bastones:xi vs pi.

Estadística II
Ejemplo 14: Sea X la v.a. definida como el número de caras que ocurre al lanzar una moneda 4
veces.
a) Obtenga la distribución de probabilidades de X. Grafique la distribución.

b) Calcule la probabilidad P [0 < X ≤ 2]
En efecto:
Rx = {0, 1, 2, 3, 4}
.f(0) = P[X=0]= P({SSSS})= 1/16
.f(1) = P[X=1]= P({SSSC ó SSCS ó SCSS ó CSSS})= 4/16
.f(2) = P[X=2]= P({SSCC ó SCSC ó SCCS ó CSSC ó CSCS ó CCSS })= 6/16
.f(3) = P[X=3]= P({SCCC ó CCSC ó CSCC ó CCCS})= 4/16
.f(4) = P[X=4]= P({CCCC})= 1/16
De manera que:
xi .pi=f(xi)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16
NOTA: La media de la distribución de probabilidades de X se calcula por: 𝜇 = ∑ 𝑝𝑖 . 𝑥𝑖
y la varianza 𝜎 2 = ∑ 𝑝𝑖 . 𝑥𝑖2 − 𝜇 2 donde pi = f(xi)
Ejemplo 15: Un inversionista puede participar en un negocio 4 veces y de manera independiente.

Cada vez que participa gana o pierde $ 5000 con la misma probabilidad. El comienza con $ 10000 y
dejará de participar en el negocio si pierde todo su dinero o si gana $15000 (o sea si termina con $
25000). Halle la distribución de probabilidad de la utilidad del inversionista y calcule la media de la
distribución.

Estadística II
FUNCIÓN DE DENSIDAD DE PROBABILIDAD:
Se dice que la función f(x) es una función de densidad de probabilidad de la v.a. contínua
X si satisface:
i) 𝑓(𝑥) ≥ 0 para todo x ∈ ℝ

+∞
ii) ∫−∞ 𝑓(𝑥). 𝑑𝑥 = 1
iii) P(A) = P [x ∈ 𝐴] = ∫𝐴 𝑓(𝑥)𝑑𝑥 para cualquier intervalo A⊂ ℝ
NOTAS:
La condición (i) indica que la gráfica de f(x) no tiene puntos por debajo del eje de las
abscisas.
La condición (ii) indica que el área total bajo la curva es igual a 1.
La condición (iii) indica que probabilidad es igual a área.
.f(x)
P[a≤x≤b]
0 X
a b

Estadística II
ALGUNAS DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES:
El comportamiento de una variable aleatoria queda descrito por su distribución de

probabilidad. Esta especifica su forma y sus parámetros.
En muchas tareas o análisis de aplicación estadística, se busca determinar una distribución

de probabilidad o modelo de probabilidad que satisfaga un conjunto de supuestos, para
estudiar los resultados observados de un experimento aleatorio.
Se pueden definir muchas distribuciones de probabilidad tanto de variable aleatoria

discreta como de variable aleatoria contínua. A continuación mencionamos algunas de
ellas.
PARA VARIABLES ALEATORIAS DISCRETAS:
Distribución de probabilidad de Bernoullí.
Distribución de probabilidad Binomial.
Distribución de probabilidad Geométrica.
Distribución de probabilidad de Pascal.
Distribución de probabilidad Hipergeométrica.
Distribución de probabilidad de Poisson.
PARA VARIABLES ALEATORIAS CONTÍNUAS:
Distribución de probabilidad Uniforme.
Distribución de probabilidad Normal.
Distribución de probabilidad Gamma.
Distribución de probabilidad Exponencial.
Distribución de probabilidad Chi – Cuadrado.
Distribución de probabilidad t de Student.
Distribución de probabilidad F.

Estadística II CURSO

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estadística II CURSO

Transféré par

Droits d'auteur :

Formats disponibles

2019

JOSÉ LUIS ECHE CALDERÓN

NOCIONES DE ESTADÍSTICA DESCRIPTIVA:

Recopilar Organizar Presentar Analizar

¡Para una mejor toma de decisiones!!!

Estadística Descriptiva: Conjunto de métodos estadísticos que se relacionan con el

Inferencia Estadística: Conjunto de métodos con el que se hacen la generalización o la

A cada elemento de la población se le denomina unidad elemental ó unidad estadística.

Lic. José Luis Eche Calderón 2

Parámetro: Se denomina parámetro a una medida descriptiva que resume una

La población se clasifica en finita o infinita. La población es finita si tiene un número finito

La muestra debe ser seleccionada de manera que sea representativa de la población.

DEFINICIÓN: Se denomina estadística, estadígrafo o estadístico a una medida descriptiva

Lic. José Luis Eche Calderón 3

Identificación de una variable estadística:

Lic. José Luis Eche Calderón 4

Para el análisis estadístico de los valores de una variable, es necesario organizarlos y

Todo cuadro numérico, básicamente debe contener:

- Un título adecuado, para evitar confusiones y para expresar brevemente su

El cuadro numérico de una sola variable estadística se denomina distribución de

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA:

Categoría de la Frecuencia Absoluta Frecuencia Relativa Frecuencia

Frecuencia absoluta: fi(resulta del conteo)

Frecuencia Relativa: hi y se calcula como hi = fi /n

Frecuencia Porcentual: pi = hi * 100%

Lic. José Luis Eche Calderón 5

GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA: ci vs fi

Gráfica de la distribución de frecuencia para var. Cualitativa Xi

Ejemplo 2: Hojas Excel en laboratorio.

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUANTITATIVA DISCRETA:

Si n valores de una variable discreta X, observados en una muestra de una población,

Valores de la Frecuencias Frecuencias Frecuencias

La gráfica de la distribución de variable cuantitativa discreta, tiene como representación

Ejemplo 3: Hoja Excel en laboratorio.

Lic. José Luis Eche Calderón 6

DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTÍNUOS: (por intervalos)

Construcción de la distribución de frecuencias:

1) Rango R = Xmáx – Xmín

2) Número de clases o intervalos 𝑘 = √𝑛 para 25 ≤ n ≤ 400

3) Determinar la amplitud del intervalo A = R/k(sometida a la condición kA ≥ R)

4) Definir los intervalos o clases: I1 = [Xmin , Xmin + A]

Ejemplo 4: Hoja Excel en laboratorio.

Los salarios quincenales, en dólares, recopilados en una muestra de 45 empleados son:

Describa la variable, y desarrolle la distribución de frecuencias de los datos.

MARCA DE CLASE: Dado la clase o intervalo 𝐼 = [𝐿𝑖 , 𝑈𝑖 ]

Lic. José Luis Eche Calderón 7

GRÁFICA DE LA DISTRIBUCIÓN POR INTERVALOS:

Se representa mediante un histograma o polígono de frecuencias. Del polígono de

POLÍGONO DE FRECUENCIAS: Es una gráfica secundaria, que se obtiene uniendo los

Lic. José Luis Eche Calderón 8

CURVA DE FRECUENCIAS: Es una gráfica “avanzada” de una distribución de frecuencias

Las curvas simétricas son de 3 tipos: Leptocúrtica, normal o mesocúrtica y platicúrtica.

Lic. José Luis Eche Calderón 9

Asimetría Positiva Asimetría Negativa

Curva Bimodal Curva Trimodal

Una curva de frecuencias es bimodal si se tiene dos frecuencias máximas. Es trimodal si se

Recomendación: Realizar los ejercicios propuestos de las páginas 32 - 36 del libro

Lic. José Luis Eche Calderón 10

MEDIDAS DE TENDENCIA CENTRAL:

Las medidas de tendencia central, denominadas también promedios, ubican el centro de

Para calcular la mediana, tenemos:

Para datos no agrupados: