Vous êtes sur la page 1sur 31

2019

Estadística II

JOSÉ LUIS ECHE CALDERÓN


Universidad Alas Peruanas.
Estadística II

NOCIONES DE ESTADÍSTICA DESCRIPTIVA:


Estadística: Ciencia aplicada que nos proporciona un conjunto de métodos, técnicas o
procedimientos para: Recopilar, Organizar (Clasificar, Agrupar), Presentar y Analizar datos;
con el fin de describirlos o de realizar generalizaciones válidas.

Recopilar Organizar Presentar Analizar

¡Para una mejor toma de decisiones!!!

Estadística Descriptiva: Conjunto de métodos estadísticos que se relacionan con el


resumen y descripción de los datos, como tablas, gráficas y el análisis mediante algunos
cálculos.

Inferencia Estadística: Conjunto de métodos con el que se hacen la generalización o la


inferencia sobre una población utilizando una muestra.

“La inferencia puede tener conclusiones que pueden NO ser ciertas en forma absoluta;
por lo que es necesario que éstas sean dadas con una medida de confiabilidad. Ésta
medida de confiabilidad es la probabilidad “.

POBLACIÓN Y MUESTRA:
Población: Conjunto de elementos (personas, objetos, etc.) en los que se pueden observar
o medir, una o más características de naturaleza cualitativa o cuantitativa.

A cada elemento de la población se le denomina unidad elemental ó unidad estadística.

Por ejemplo, los empleados en una empresa ABC, constituyen una población en la que
cada empleado (unidad estadística) tiene muchas características a ser observadas, como:
género, estado civil, procedencia, grado de instrucción, religión, etc. (variables
cualitativas) o números de hijos, ingreso mensual, etc. (variables cuantitativas). El
resultado de observar o medir una característica en una unidad estadística, se denomina
dato estadístico, valor observado o simplemente observación.

Lic. José Luis Eche Calderón 2


Estadística II

Parámetro: Se denomina parámetro a una medida descriptiva que resume una


característica definida en la población, tal como la media (μ) o la varianza (σ2), etc.,
calculada a partir de los datos observados de toda la población.

La población se clasifica en finita o infinita. La población es finita si tiene un número finito


N de elementos.

Muestra: Es una parte de la población seleccionada de acuerdo con un plan o una regla
con el fín de obtener información acerca de la población de la cual proviene.

La muestra debe ser seleccionada de manera que sea representativa de la población.

DEFINICIÓN: Se denomina estadística, estadígrafo o estadístico a una medida descriptiva


que resuma una característica definida en una muestra aleatoria, tal como la media (𝑋̅) o
la varianza (𝑆𝑛2 ) etc., calculada a partir de los datos observados en la muestra.

En la Población:
Parámetros (letras
griegas)
Análisis
Estadístico

Muestra: Estadígrafos

Lic. José Luis Eche Calderón 3


Estadística II

VARIABLE ESTADÍSTICA: Es una característica definida en una población y que asume por
lo menos dos valores: cualidad o cantidad.

Identificación de una variable estadística:

Población.

Unidad Característica.
Estadística. Valor.

Cualidad.
Valor. Discreta.
Cantidad.
Contínua.

Una variable estadística es denotada por X y sus valores observados en una muestra de
“n” unidades estadísticas escogidas en una población se denotarán por x1, x2, x3, ….. xn.

Ejemplo 1: Los alumnos del curso de Estadística para los Negocios II en la Universidad Alas
Peruanas Filial Piura - 2018. En ellos se pueden identificar las variables cualitativas tales
como género, estado civil, religión, color favorito, música preferida, etc. y variables
cuantitativas tales como edad, estatura, número de hermanos, créditos por cursos
matriculados, etc. (Hoja Excel en laboratorio)

Todo análisis estadístico se realiza para una población o muestra, y los métodos para
encontrar parámetros o estadígrafos se realizan para las variables estadísticas observadas.
Es decir el trabajo estadístico se realiza en cada variable estadística.

Lic. José Luis Eche Calderón 4


Estadística II

DISTRIBUCIÓN DE FRECUENCIAS:

Después de la recopilación de los datos de una tarea o investigación estadística, éstos son
pasados a una hoja de datos. Cada columna de una hoja de datos es una variable
estadística.

Para el análisis estadístico de los valores de una variable, es necesario organizarlos y


presentarlos en forma tal, que facilite su comprensión y su posterior utilización. Los datos
son organizados o agrupados en un cuadro numérico y presentados en gráficas
estadísticas.

Todo cuadro numérico, básicamente debe contener:

- Un título adecuado, para evitar confusiones y para expresar brevemente su


contenido.
- El cuerpo o agrupación de datos.
- La fuente de los datos, si no son datos propios.

El cuadro numérico de una sola variable estadística se denomina distribución de


frecuencias. (Para los datos de una muestra)

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA:

Categoría de la Frecuencia Absoluta Frecuencia Relativa Frecuencia


Variable X fi hi Porcentual pi
c1 f1 h1 p1
c2 f2 h2 p2
… … … …
ck fk hk pk
TOTAL n 1.00 100.00

Donde:

Frecuencia absoluta: fi(resulta del conteo)

Frecuencia Relativa: hi y se calcula como hi = fi /n

Frecuencia Porcentual: pi = hi * 100%

Lic. José Luis Eche Calderón 5


Estadística II

GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUALITATIVA: ci vs fi

ci vs fi
8

0
c1 c2 c3 c4 c5

Gráfica de la distribución de frecuencia para var. Cualitativa Xi

Ejemplo 2: Hojas Excel en laboratorio.

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUANTITATIVA DISCRETA:

Si n valores de una variable discreta X, observados en una muestra de una población,


tienen k (k ≤ n) valores distintos x1, x2, …, xk que se repiten respectivamente f1, f2, … , fk
veces. Entonces, la organización o agrupación de estos “n” datos, origina el siguiente
cuadro:

Valores de la Frecuencias Frecuencias Frecuencias


Variable X Absolutas fi Relativas hi Porcentuales pi
x1 f1 h1 p1
x2 f2 h2 p2
… … … …
xk fk hk pk
TOTAL n 1.00 100.00

La gráfica de la distribución de variable cuantitativa discreta, tiene como representación


más común a la llamada gráfica de bastón, que consiste en xi vs fi.

Ejemplo 3: Hoja Excel en laboratorio.

Lic. José Luis Eche Calderón 6


Estadística II

DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTÍNUOS: (por intervalos)

Construcción de la distribución de frecuencias:

1) Rango R = Xmáx – Xmín

2) Número de clases o intervalos 𝑘 = √𝑛 para 25 ≤ n ≤ 400


También existe la Regla de Sturgesk = 1 + 3.3log (n) para n ≥ 10

3) Determinar la amplitud del intervalo A = R/k(sometida a la condición kA ≥ R)

4) Definir los intervalos o clases: I1 = [Xmin , Xmin + A]


I2 = [Xmin + A, Xmin + 2A]
……….
Ik= [Xmin + (k-1)A ,Xmin + kA]

Ejemplo 4: Hoja Excel en laboratorio.

Los salarios quincenales, en dólares, recopilados en una muestra de 45 empleados son:

63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60

Describa la variable, y desarrolle la distribución de frecuencias de los datos.

MARCA DE CLASE: Dado la clase o intervalo 𝐼 = [𝐿𝑖 , 𝑈𝑖 ]


𝐿𝑖 + 𝑈𝑖
La marca de clase es el número 𝑚𝑖 que se define por: 𝑚𝑖 =
2

Lic. José Luis Eche Calderón 7


Estadística II

GRÁFICA DE LA DISTRIBUCIÓN POR INTERVALOS:

Se representa mediante un histograma o polígono de frecuencias. Del polígono de


frecuencias se obtiene la curva de frecuencias.

HISTOGRAMA: Es una gráfica básica que consiste de barras rectangulares, dibujada con
una orientación vertical u horizontal. Viene dada por (Ci o Ii) vs fi

Histograma
9
8
7
6
5
4 frecuencias
3
2
1
0
A B C D E F G

POLÍGONO DE FRECUENCIAS: Es una gráfica secundaria, que se obtiene uniendo los


puntos medios (marca de clase) en cada intervalo del histograma.

Polígono de Frecuencias
8
7
6
5
4
frecuencias
3
2
1
0
A B C D E F G

Lic. José Luis Eche Calderón 8


Estadística II

CURVA DE FRECUENCIAS: Es una gráfica “avanzada” de una distribución de frecuencias


por intervalos que se obtiene del polígono de frecuencias “suavizando” sus puntos
angulosos. Es importante porque describe una aproximación del modelo de distribución
de la variable.

Frecuencias

Clases

DISTRIBUCIONES SIMÉTRICAS:

Las curvas simétricas son de 3 tipos: Leptocúrtica, normal o mesocúrtica y platicúrtica.

Curvas Simétricas

Lic. José Luis Eche Calderón 9


Estadística II

DISTRIBUCIONES ASIMÉTRICAS:

Asimetría Positiva Asimetría Negativa


Simétricas Simétricas

DISTRIBUCIÓN MULTIMODAL:

Curva Bimodal Curva Trimodal


Simétricas Simétricas

Una curva de frecuencias es bimodal si se tiene dos frecuencias máximas. Es trimodal si se


tienen tres frecuencias máximas. En general puede existir una curva multimodal con
múltiples frecuencias máximas.

Recomendación: Realizar los ejercicios propuestos de las páginas 32 - 36 del libro


“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

Lic. José Luis Eche Calderón 10


Estadística II

MEDIDAS DE TENDENCIA CENTRAL:

Las medidas de tendencia central, denominadas también promedios, ubican el centro de


los datos, como la media aritmética, la mediana y la moda.

LA MEDIANA: (Me) Es el número que separa a la serie de datos ordenados en dos partes
de igual número de datos. La mediana es la medida promedio que depende del número de
orden de los datos y no de los valores de éstos datos.

Para calcular la mediana, tenemos:

Para datos no agrupados:

Ordenar los datos de forma creciente y luego se ubica el valor central Me. Si n es impar, la
mediana es el dato ordenado del centro. Si n es par, la mediana es la semisuma de los dos
valores ordenados centrales.

Para datos agrupados: Mediante la fórmula:


𝑛
𝐴( 2 − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
𝑓𝑖

𝐴(0.50 − 𝐻𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
ℎ𝑖

Donde fi corresponde a la frecuencia de la clase que contiene a la mediana. Se identifica


mediante la mitad de datos o en el acumulado.

LA MODA: (Mo) Es el valor que se define como el dato que ocurre con mayor frecuencia.
En la distribución de frecuencias por intervalos la moda se ubica en el intervalo que tiene
la mayor frecuencia.

𝑑1
𝑀𝑜 = 𝐿𝑖 + 𝐴. ( )
𝑑1 + 𝑑2

Donde 𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 y 𝑑2 = 𝑓𝑖 − 𝑓𝑖+1

fi=Valor de la mayor frecuencia

Lic. José Luis Eche Calderón 11


Estadística II

LA MEDIA ARITMÉTICA (𝑿 ̅ ) Denominada simplemente media, es el valor numérico que se


obtiene dividiendo la suma total de los valores observados de una variable entre el
número de observaciones. Se calcula como:

Para datos no agrupados:

∑𝑛𝑖=1 𝑥𝑖
𝑋̅ =
𝑛

Para datos agrupados:

∑𝑛
𝑖=1 𝑓𝑖 .𝑋𝑖
Para variable cuantitativa discreta: 𝑋̅ =
𝑛

∑𝑛
𝑖=1 𝑓𝑖 .𝑚𝑖
Para variable cuantitativa contínua: 𝑋̅ =
𝑛

∑𝑛
𝑖=1 ℎ𝑖 .𝑚𝑖
Usando la frecuencia relativa y marca de clase: 𝑋̅ =
𝑛

NOTA: La media aritmética de la población se calcula mediante:

∑𝑁
𝑖=1 𝑥𝑖
𝜇 =
𝑁

Lic. José Luis Eche Calderón 12


Estadística II

RELACIÓN ENTRE MEDIA, MEDIANA Y MODA:

1.- Si la distribución de frecuencias de los datos es simétrica, entonces la media, la


mediana y la moda tienen el mismo valor.

𝑋̅ = 𝑀𝑒 = 𝑀𝑜

2.- Si la distribución es asimétrica de cola a la derecha (asimetría positiva), entonces:

𝑀𝑜 < 𝑀𝑒 < 𝑋̅

3.-Si la distribución es asimétrica de cola a la izquierda (asimetría negativa), entonces:

𝑋̅ < 𝑀𝑒 < 𝑀𝑜

𝑀𝑜 < 𝑀𝑒 < 𝑋̅ 𝑋̅ < 𝑀𝑒 < 𝑀𝑜

a Simétricas Simétricas

𝑋̅ = 𝑀𝑒 = 𝑀𝑜

Lic. José Luis Eche Calderón a Simétricas 13


Estadística II

LA MEDIA GEOMÉTRICA ( ̅
𝑿𝑮 ) Se aplica para promediar: razones, índices, proporciones,
tasas de cambio, etc.

𝑋̅𝐺 = 𝑛√𝑥1 . 𝑥2 . 𝑥3 … 𝑥𝑛

LA MEDIA ARMÓNICA ( ̅ 𝑿𝑯 ) Se aplica para obtener promedios de un conjunto de valores


expresados en forma de tasas de unidades de un tipo por unidades de otro tipo. (Por
ejemplo las unidades en Km/h)

NOTA: ̅
𝑿𝑯 ≤ ̅ ̅
𝑿𝑮 ≤ 𝑿

Ejemplo 5: Hoja Excel en laboratorio.

Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de tendencia central. Esto es media (promedio
aritmético), mediana y moda.

Recomendación: Realizar los ejercicios propuestos de las páginas 54 -61 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora. Pontificia
Universidad Católica del Perú. (5° Edición).

Lic. José Luis Eche Calderón 14


Estadística II

MEDIDAS DE DISPERSIÓN:

Son números reales que miden el grado o nivel de separación de los datos con respecto a
un valor central, que generalmente es la media aritmética.

1.- Rango o recorrido de una variable:

Rango = R = Xmáx – Xmín

2.- El rango intercuartil RI = Q3 – Q1

Q1 Q3

75% de los datos.

3.- Varianza: Es la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.

La varianza calculada de una muestra es 𝒔𝟐𝒏 y si es calculada de una población es 𝜎 2 .

Cálculo de la varianza de datos no agrupados:

∑𝑛𝑖=1 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛

Cálculo de la varianza de datos agrupados: (variable discreta)

∑𝑛𝑖=1 𝑓𝑖 . 𝑥𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛

Cálculo de la varianza de datos agrupados: (variable contínua)

∑𝑛𝑖=1 𝑓𝑖 . 𝑚𝑖2
𝑠𝑛2 = − 𝑋̅ 2
𝑛

4.- Desviación Estándar: ( 𝑆𝑛 ) Es la raíz cuadrada positiva de la varianza.

Lic. José Luis Eche Calderón 15


Estadística II

5.- Coeficiente de variación: (Dispersión relativa)

𝑆𝑛
𝑐𝑣 =
𝑋̅
También se puede expresar como porcentaje. Es una medida de dispersión relativa, libre
de unidades de medición. Se utiliza para comparar la variabilidad de dos o más series de
datos que tengan medias iguales o diferentes, o que tengan unidades de medidas iguales
o diferentes.

NOTA:

Varianza de la población:
∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁
Además:
2
∑𝑁
𝑖=1 𝑥𝑖
2
𝜎 = − 𝜇2
𝑁

Ejemplo 6: Hoja Excel en laboratorio.

Utilizando los datos agrupados del ejemplo 4, realice el cálculo y análisis de los
estadígrafos que representan las medidas de dispersión. Esto es rango de la variable, el
rango intercuartil, varianza y desviación estándar.

Lic. José Luis Eche Calderón 16


Estadística II

VALORES ESTANDARIZADOS:

Cuando se necesiten comparar valores observados que pertenecen a diferentes


distribuciones de datos, las que difieren de su media aritmética o en su varianza, o
difieren en el tipo de unidad de medida (variables diferentes), entonces se estandarizan
los valores observados de la variable aplicando la variable “estandarizadora” o variable
estándar Z.

Para una distribución de datos de variable X, la variable estándar Z se define por:

𝑋 − 𝑋̅
𝑍=
𝑆𝑛

La variable Z estandariza en cero cualquier media 𝑋̅ y estandariza en uno a cualquier


varianza 𝑆𝑛2 .

Ejemplo 7: Las calificaciones en un examen final de Matemáticas e Historia generaron


medias 13 y 17, con desviaciones estándar 3 y 4 respectivamente. Si un alumno obtuvo 14
en matemáticas y 16 en historia. ¿En cuál de los dos cursos tiene mejor rendimiento
relativo?

Solución: El hecho que tenga 16 en historia y 14 en matemáticas no significa que tenga


mayor rendimiento en historia.

En matemáticas:
14−13
𝑍= = 0.3333
3

En historia:
16−17
𝑍= = -0.25
4

En consecuencia, el alumno tiene mejor rendimiento en matemáticas.

Lic. José Luis Eche Calderón 17


Estadística II

DESIGUALDAD DE CHEBYSHEV:

Cualquiera sea la forma de la distribución (simétrica o asimétrica) de los datos observados


de una variable X, el intervalo:

[𝑋̅ − 𝑘. 𝑆𝑛 , 𝑋̅ + 𝑘. 𝑆𝑛 ]
1
Contiene por lo menos (1 − 𝑘 2) por ciento de los datos.

1
El porcentaje de datos que se ubican fuera del intervalo es menor que ( 𝑘 .100%)

El intervalo [𝑋̅ − 2. 𝑆𝑛 , 𝑋̅ + 2. 𝑆𝑛 ] contiene 75% del total de datos.

El intervalo [𝑋̅ − 3. 𝑆𝑛 , 𝑋̅ + 3. 𝑆𝑛 ] contiene 88.89% del total de datos.

El intervalo [𝑋̅ − 4. 𝑆𝑛 , 𝑋̅ + 4. 𝑆𝑛 ] contiene 93.75% del total de datos.

Ejemplo 8: Si los salarios no agrupados de 120 obreros, tienen una media de $300 y una
desviación estándar de $30.

a) ¿Cuántos obreros por lo menos tienen salarios comprendidos en el intervalo


[$240,$360]?
b) Determine el intervalo que contiene al menos el 88.89% de los salarios.
c) Si el salario mínimo es $210, ¿en qué porcentaje se puede afirmar que los salarios
son superiores a $390?

Lic. José Luis Eche Calderón 18


Estadística II

INDICES DE ASIMETRÍA:

Se dice que una distribución de frecuencias de variable discreta es simétrica si son iguales
las frecuencias de sus valores equidistantes del valor central.

Se dice que una distribución de frecuencias por intervalos es simétrica, si son iguales las
frecuencias de los intervalos equidistantes del intervalo central.

En una distribución de frecuencias simétrica, coinciden en su centro la media, mediana y


moda.

𝑀𝑜 < 𝑀𝑒 < 𝑋̅ 𝑋̅ = 𝑀𝑒 = 𝑀𝑜 𝑋̅ < 𝑀𝑒 < 𝑀𝑜

a Simétricas Simétricas

a Simétricas

COEFICIENTE O ÍNDICE DE ASIMETRÍA DE PEARSON:


𝑋̅ −𝑀𝑜
Usando la moda 𝐴𝑠 = 𝑆

3(𝑋̅ −𝑀𝑒 )
Usando la mediana 𝐴𝑠 = 𝑆

Cuando:𝐴𝑠 = 0, la distribución de frecuencia de los datos es simétrica.

Cuando: 𝐴𝑠 > 0, la distribución de frecuencia de los datos tiene asimetría positiva.

Cuando: 𝐴𝑠 < 0, la distribución de frecuencia de los datos tiene asimetría negativa.

Lic. José Luis Eche Calderón 19


Estadística II

REGRESIÓN LINEAL SIMPLE:

Dada una muestra de “n” datos (x1,y1), (x2,y2),…,(xn,yn) observados de la variable


bidimensional (X,Y). La regresión lineal simple de la variable dependiente Y con respecto a
la variable independiente X, consiste en obtener la ecuación de la recta Y = a + bX, que
mejor se ajuste a los valores de la muestra, con el fín de poder predecir o pronosticar los
valores de Y dado X.

y Valores dispersos y recta ajustada.


4.5 y =a + bx
4
3.5
3
2.5
2 1
1.5
1
0.5
0 x
0 2 4 6 8 10

EL MÉTODO DE LOS MÍNIMOS CUADRADOS:

Consiste en encontrar la curva ajustada y = a + bx, para el cual los valores asociados se
calculan mediante:

𝑛. ∑𝑛𝑖=1 𝑥𝑖 . 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 . ∑𝑛𝑖=1 𝑦𝑖


𝑏=
𝑛. ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2

Además: 𝑎 = 𝑦̅ − 𝑏. 𝑥̅

∑𝑛
𝑖=1 𝑦𝑖 ∑𝑛
𝑖=1 𝑥𝑖
Donde: 𝑦̅ = 𝑥̅ =
𝑛 𝑛

NOTA: Si b>0, entonces la tendencia lineal es creciente.

Si b<0, entonces la tendencia lineal es decreciente.

Lic. José Luis Eche Calderón 20


Estadística II

Ejemplo 9:La empresa textil “Puno Moda” SRL, le envía los siguientes datos de confección de chompas en el
año 2013. La confección detallada en meses fue de la planta 01 ubicada a 20 km de la Ciudad de Puno. Así
mismo, las cantidades están dadas por docenas de chompas fabricadas por mes. Encuentre la ecuación lineal
que mejor se ajuste a la distribución de los datos, interprete resultados y enuncie conclusiones.

Mes Cantidad (docenas)


Enero 111
Febrero 112
Marzo 110
Abril 111
Mayo 113
Junio 115
Julio 111
Agosto 110
Septiembre 114
Octubre 112
Noviembre 114
Diciembre 115

∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖
LA COVARIANZA: 𝐶𝑜𝑣 𝑥𝑦 = − 𝑋̅. 𝑌̅
𝑛

Mide el nivel de variabilidad (dispersión) conjunta de los datos de las variables en pareja (X,Y) con
respecto a sus medias respectivas (𝑋̅, 𝑌̅).

COEFICIENTE O ÍNDICE DE CORRELACIÓN:

𝐶𝑜𝑣 𝑥𝑦
𝑟=
𝑆𝑥 . 𝑆𝑦

Si r=1, se dice que hay una correlación lineal perfecta positiva.

Si r= -1, se dice que hay una correlación lineal perfecta negativa.

Si r=0, se dice que no hay una correlación entre las dos variables.

𝐶𝑜𝑣 𝑥𝑦
NOTA: En el método de los mínimos cuadrados: 𝑏= 𝑆𝑥 ²

En la variable bidimensional (X, Y): Cuando una de las variables es el tiempo (en días, meses, años)
la regresión se denomina serie de tiempo.

Recomendación: Realizar los ejercicios propuestos de las páginas 103, 108 - 113 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

Lic. José Luis Eche Calderón 21


Estadística II

PROBABILIDAD:
Es una ciencia exacta que se desarrolla en forma axiomática.

Experimento aleatorio: Es todo proceso que consiste de la ejecución de un acto (o prueba) una o
más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede
predecir con certeza. (Ejemplo, lanzar un dado).

Experimento: Proceso que genera un conjunto de datos cualitativos o cuantitativos.

Espacio muestral (Ω): Conjunto de todos los resultados posibles de un experimento aleatorio. A
cada elemento de un espacio muestral se le denomina punto muestral.

Ω = { w/w es un punto muestral }

Ejemplo 10: El experimento aleatorio de lanzar un dado y observar el resultado en la cara superior.

Solución: Ω = { 1, 2, 3, 4, 5, 6 }

Ejemplo 11: Lanzar una moneda 3 veces y observar el resultado global.

Solución: Diagrama de árbol.

C
C
S
C
C
S
S
Lanzamiento 1
C
C
S
S
C
S
S

De donde se tiene el espacio muestral: Ω = { CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS }

Lic. José Luis Eche Calderón 22


Estadística II

EVENTO: Se denomina evento a cualquier subconjunto de un espacio muestral.

En el espacio muestral finito Ω = { w1,w2,… ,wn } de n elementos, se puede definir 2n eventos


diferentes.

Evento imposible (φ): No tiene puntos muestrales. (Nunca ocurre).

Eventos unitarios o elementales {wi}: Contiene un solo punto muestral.

Eventos compuestos: Consiste de dos o más eventos elementales.

Evento seguro o cierto Ω: Contiene a todos los eventos elementales posibles.

Recomendación: Complementar con lecturas de las páginas135 - 140 del libro


“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

VARIACIONES SIMPLES: Son las variaciones de K objetos tomados de n objetos distintos,


se refiere a los arreglos u órdenes que se hagan con los K objetos, de manera que éstos
arreglos difieran en algún elemento o en el orden de colocación.

𝑛!
𝑉𝑘𝑛 =
(𝑛 − 𝑘)!

Variaciones con repetición: 𝑉𝑅𝑘𝑛 = 𝑛𝑘

Permutaciones simples: 𝑃𝑛 = 𝑛!

Se denomina permutaciones de n objetos a cada una de las variaciones de los n objetos


distintos.

Permutaciones circulares: Se denomina permutaciones circulares a las diferentes


permutaciones que pueden formarse con n objetos distintos, donde no hay ni primero ni
último objeto.

𝑃𝐶 𝑛 = (𝑛 − 1)!

Lic. José Luis Eche Calderón 23


Estadística II

Combinaciones simples: Se refiere a la selección que podemos hacer de K objetos de los n


dados, sin tener en cuenta el orden de los mismos. (No puede haber combinaciones con
los mismos elementos).

𝑛!
𝐶𝑘𝑛 =
𝑘! (𝑛 − 𝑘)!

PROBABILIDAD DE UN EVENTO:
Definición: Sea Ω el espacio muestral asociado a un experimento aleatorio. La
probabilidad de cualquier evento A de Ω es el número real P(A) que satisface:

a) P(A) ≥ 0 para todo A.


b) P(Ω) = 1
c) Si A y B son dos eventos mutuamente excluyentes, entonces P(AUB) = P(A) + P(B)

TEOREMA: Si φ es el evento que no ocurre, entonces P(φ) = 0

TEOREMA: Si Ac es el evento complementario del evento A, entonces: P(Ac) = 1 – P(A)

TEOREMA: Si A y B son dos eventos tales que A⊂B entonces P(A) ≤ P(B)

NOTAS:

Para todo evento A, se verifica la relación 𝛷 ⊂ 𝐴 ⊂ 𝛺, entonces P(φ) ≤ P(A) ≤ P(Ω)

Consecuentemente: 0 ≤ P(A) ≤ 1

“La probabilidad de un evento es una medida de la fiabilidad de que ocurra un evento”

La probabilidad P es una función definida en eventos que son partes de Ω.

Lic. José Luis Eche Calderón 24


Estadística II

CÁLCULO DE PROBABILIDADES:

#(𝐴) 𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴


𝑃(𝐴) = =
#(𝛺) 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Ésta ecuación es llamada “La Regla de Laplace“. Ejemplos en la pág. 157, 166 – 171 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

PROBABILIDAD CONDICIONAL: Sean A y B dos eventos en un espacio muestral Ω. La probabilidad


condicional de B dado A, es el número P(B/A) que se define por:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵/𝐴) =
𝑃(𝐴)

Estoes para P(A) > 0.

NOTAS:

1) Si P(A) = 0 entonces P(B/A) = 0

2) Observe que (𝐴 ∩ 𝐵) ⊂A, entonces cada vez que se calcula P(B/A) estamos realmente
calculando P(B) cuando el evento A ha ocurrido.

3) Si A∩B = Φ entonces P(B/A) = 0

4) Si A⊂B entonces P(B/A) = P(A/A) = 1

𝑃(𝐵)
5) Si B⊂A entonces 𝑃(𝐵/𝐴) = 𝑃(𝐴)

Ejemplos en la pág. 172 - 173, además ejercicios resueltos 188 – 190, y ejercicios propuestos 191 -
198 del libro “Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

Lic. José Luis Eche Calderón 25


Estadística II

VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD:


Una variable estadística X, es una característica (cualitativa o cuantitativa) que se mide u
observa en una población. Si la población es aleatoria y la característica es cuantitativa,
entonces X se denomina variable aleatoria.

Definición: Se denomina v.a. a una variable estadística cuantitativa definida en un espacio


muestral Ω.

w X (función)
x = X(w)

Una v.a. X es una función definida en Ω, talque para w ∈ Ω se le asocia un número real
x=X(w).

El dominio de la v.a. X es el espacio muestral Ω y su rango es el conjunto de todos sus


valores posibles (Rx).

Rx = { x∈R / x=X(w); w ∈ Ω }

Ejemplo 12: Sea Ω el espacio muestral que resulta del experimento aleatorio de lanzar al aire una
moneda tres veces consecutivas y observar la cara superior.

Solución: Tenemos Ω = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

Si se define en Ω, la variable X = “Número de caras obtenidas”, entonces X es una v.a. cuyo


rango es Rx = {0, 1, 2, 3}

En efecto: X = 0, corresponde al evento elemental {SSS}

X = 1, corresponde a los eventos elementales {SSC}, {SCS} y {CSS}

X = 2, corresponde a los eventos elementales {SCC}, {CSC} y {CCS}

X = 3, corresponde al evento elemental {CCC}

Lic. José Luis Eche Calderón 26


Estadística II

PROBABILIDAD EN EL RANGO Rx DE LA VARIABLE ALEATORIA:


Una v.a. discreta X asume cada uno de sus valores con cierta probabilidad que
denotaremos Px (Probabilidad inducida por X) y está definida en Rx.

Por lo tanto, si Rx = {x1, x2, … , xn} y si B = {xi} es un evento unitario en Rx, entonces:

Px ({xi}) = P ({w ∈ Ω / X(w)=xi}) = P(A)

Con frecuencia se utiliza:

P[X=xi] = P({w ∈ Ω / X(w)=xi})

Ejemplo 13: Si la v.a. X es el número de caras que resultan al lanzar una moneda tres veces.
Entonces Rx = {0, 1, 2, 3}. Por lo tanto en Rx se tiene:

P[X=0]= P({SSS})= 1/8

P[X=1]= P({SSC ó SCS ó CSS})= 3/8

P[X=2]= P({SCC ó CSC ó CCS})= 3/8

P[X=3]= P({CCC})= 1/8

NOTA MUY IMPORTANTE:

Siendo P una probabilidad definida en un espacio muestral Ω. X una v.a. definida en Ω


cuyo rango es Rx. La probabilidad Px de un evento B en Rx es:

𝑃𝑥 (𝐵) = 𝑃(𝐴)

Además:

1.-El conjunto de pares (xi, P[X=xi]) constituye la distribución de probabilidades de la v.a. X.


Esta distribución es similar a la distribución de frecuencias relativas.

2.-Las probabilidades pi = P[X=xi] donde xi∈ Rx, cumple:

a) pi ≥ 0 para cada xi∈ Rx.

b) ∑ 𝑝𝑖 = 1
xi∈ Rx

3.-Para todo número real x≠xi donde xi∈ Rxse define: P[X=x] = P(φ) = 0

Lic. José Luis Eche Calderón 27


Estadística II

FUNCIÓN DE PROBABILIDAD:
Sea X una variable aleatoria (v.a. discreta). Se denomina función (ley, modelo o
distribución) de probabilidad de X a la función f(x) definida por f(x) = P[X=x] en todo x∈R,
que satisface:

i) f(x) ≥ 0, ∀ x∈ 𝑅

ii)∑ 𝑓(𝑥𝑖 ) = 1
𝑥𝑖 ∈ 𝑅𝑥

La condición (ii) se desarrolla como:


𝑛

∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … , xn} es finito.

∑ 𝑓(𝑥𝑖 ) = 1
cuando Rx = {x1, x2, … } es infinito.

NOTA: Si A⊂Rx, entonces la probabilidad de A es el número:

P(A) = ∑𝑥𝑖∈𝐴 𝑃[𝑋 = 𝑥𝑖 ] = ∑𝑥𝑖∈𝐴 𝑓(𝑥𝑖 )

Además:

La función f(x) = P[X=x] = (Expresión en X) ó puede ser expresado por:

{(xi, pi)/ pi = f(xi) donde xi∈RX}ó por la tabla:


Distribución de probabilidad de v.a. discreta.

Valores xi de X x1 x2 x3 … xn
Probabilidad pi=P[X=xi] p1 p2 p3 … pn

La gráfica de una distribución de probabilidades de v.a. discreta es la gráfica de


bastones:xi vs pi.

Lic. José Luis Eche Calderón 28


Estadística II

Ejemplo 14: Sea X la v.a. definida como el número de caras que ocurre al lanzar una moneda 4
veces.

a) Obtenga la distribución de probabilidades de X. Grafique la distribución.


b) Calcule la probabilidad P [0 < X ≤ 2]

En efecto:

Rx = {0, 1, 2, 3, 4}

.f(0) = P[X=0]= P({SSSS})= 1/16

.f(1) = P[X=1]= P({SSSC ó SSCS ó SCSS ó CSSS})= 4/16

.f(2) = P[X=2]= P({SSCC ó SCSC ó SCCS ó CSSC ó CSCS ó CCSS })= 6/16

.f(3) = P[X=3]= P({SCCC ó CCSC ó CSCC ó CCCS})= 4/16

.f(4) = P[X=4]= P({CCCC})= 1/16

De manera que:

xi .pi=f(xi)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16

NOTA: La media de la distribución de probabilidades de X se calcula por: 𝜇 = ∑ 𝑝𝑖 . 𝑥𝑖

y la varianza 𝜎 2 = ∑ 𝑝𝑖 . 𝑥𝑖2 − 𝜇 2 donde pi = f(xi)

Ejemplo 15: Un inversionista puede participar en un negocio 4 veces y de manera independiente.


Cada vez que participa gana o pierde $ 5000 con la misma probabilidad. El comienza con $ 10000 y
dejará de participar en el negocio si pierde todo su dinero o si gana $15000 (o sea si termina con $
25000). Halle la distribución de probabilidad de la utilidad del inversionista y calcule la media de la
distribución.

Lic. José Luis Eche Calderón 29


Estadística II

FUNCIÓN DE DENSIDAD DE PROBABILIDAD:

Se dice que la función f(x) es una función de densidad de probabilidad de la v.a. contínua
X si satisface:

i) 𝑓(𝑥) ≥ 0 para todo x ∈ ℝ


+∞
ii) ∫−∞ 𝑓(𝑥). 𝑑𝑥 = 1

iii) P(A) = P [x ∈ 𝐴] = ∫𝐴 𝑓(𝑥)𝑑𝑥 para cualquier intervalo A⊂ ℝ

NOTAS:

La condición (i) indica que la gráfica de f(x) no tiene puntos por debajo del eje de las
abscisas.

La condición (ii) indica que el área total bajo la curva es igual a 1.

La condición (iii) indica que probabilidad es igual a área.

.f(x)
P[a≤x≤b]

0 X
a b

Lic. José Luis Eche Calderón 30


Estadística II

ALGUNAS DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES:

El comportamiento de una variable aleatoria queda descrito por su distribución de


probabilidad. Esta especifica su forma y sus parámetros.

En muchas tareas o análisis de aplicación estadística, se busca determinar una distribución


de probabilidad o modelo de probabilidad que satisfaga un conjunto de supuestos, para
estudiar los resultados observados de un experimento aleatorio.

Se pueden definir muchas distribuciones de probabilidad tanto de variable aleatoria


discreta como de variable aleatoria contínua. A continuación mencionamos algunas de
ellas.

PARA VARIABLES ALEATORIAS DISCRETAS:

Distribución de probabilidad de Bernoullí.

Distribución de probabilidad Binomial.

Distribución de probabilidad Geométrica.

Distribución de probabilidad de Pascal.

Distribución de probabilidad Hipergeométrica.

Distribución de probabilidad de Poisson.

PARA VARIABLES ALEATORIAS CONTÍNUAS:

Distribución de probabilidad Uniforme.

Distribución de probabilidad Normal.

Distribución de probabilidad Gamma.

Distribución de probabilidad Exponencial.

Distribución de probabilidad Chi – Cuadrado.

Distribución de probabilidad t de Student.

Distribución de probabilidad F.

Lic. José Luis Eche Calderón 31

Vous aimerez peut-être aussi