Vous êtes sur la page 1sur 48

MANUAL DE ESTADÍSTICA

Para facilitar el curso de Estadística 1


INTRODUCCIÓN

El Manual de Estadística, es una guía fácil


y resumida acerca de todos los temas que
son parte del curso de Estadística 1.
Los temas cuentan con ejemplos, para
hacer mucho más fácil la comprensión.
Esta herramienta hará accesible a
cualquier lector el conocimiento de
estadística.
¿QUÉ ES LA ESTADÍSTICA?
 Ciencia que utiliza conjuntos de datos numéricos
para obtener, a partir de ellos, inferencias
basadas en el cálculo de probabilidades. Es decir,
es la ciencia que sirve para demostrar que dos
personas han comido ½ pollo cada una, cuando en
realidad una se ha comido todo y la otra ninguno.
 En una definición más simple, es la ciencia que
ayuda a tomar decisiones por medio de estudios
realizados con anterioridad utilizando el cálculo y
datos de situaciones iguales o similares.
ÍNDICE

➢ Estadística Descriptiva
➢ Introducción a la probabilidad
➢ Variables Aleatorias unidimensionales
➢ Variables Aleatoria continuas
unidimensionales
➢ Variables aleatorias bidimensionales
ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva es la rama de la


estadística que recolecta, analiza y caracteriza un
conjunto de datos (peso de la población, beneficios
diarios de una empresa, temperatura mensual,…)
con el objetivo de describir las características y
comportamientos de este conjunto mediante
medidas de resumen, tablas o gráficos.
GRÁFICAS PARA DATOS CATEGÓRICOS
 Una variable categórica es una variable que puede
tomar un número limitado de variables y por lo
general fijo.
 Las variables categóricas pueden describirse
utilizando tablas de distribución de frecuencias y
gráficos como gráficos de barra, gráficos de tarta y
diagramas de Pareto.
 Estos gráficos son utilizados habitualmente para
describir los datos procedentes de encuestas y
cuestionarios.
GRÁFICOS DE BARRA
Son usados para compara dos o más valores.

3.5 4.5
4
3 3.5
2.5 3
2 2.5
Naranja 2 Gato
1.5 1.5 Perro
Azul
1 1
Rojo 0.5 Iguanas
0.5 0
0 ¿Cuál es su
¿Cúal es su animal
color favorito? favorito?

Se encuestó a 8 personas, y estos son los datos obtenidos


GRÁFICA DE PIE
un gráfico circular, el cual está dividido de tal manera que se
asemeja a las tajadas de un pie.

Color Favorito

Gato
Naranja
Perro
Azul
Iguana
Rojo

Utilizamos los mismos ejemplos, pero con una gráfica distinta.


BARRAS POR COMPONENTES
Se utilizan existe categorías.

Color Favorito Animal Favorito


10 10

8 8

6 6

4 4

2 2

0 0
Hombres Mujeres Hombres Mujeres
Naranja Azul Rojo Perro Gato Iguana

En estos ejemplos, las categorías fueron «Hombres y Mujeres»


TABLAS DE FRECUENCIAS
 La distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla
de los datos estadísticos, asignando a cada dato
su frecuencia correspondiente.
 Es una descripción de variables numéricas

 La tabla de frecuencias es una herramienta que


permite ordenar los datos de manera que se
presentan numéricamente las características de
la distribución de un conjunto de datos o
muestra.
I f f.a. % %a m L.R.I. L.R.S. f. m.

# 𝑀𝑎𝑦𝑜𝑟 − #𝑀𝑒𝑛𝑜𝑟
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 =
# 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Muestra # Intervalo

Donde:
I = Intervalo o clase <50 5-7
f = Frecuencia
50 - 100 7-8
f. a. = Frecuencia acumulada
% = Porcentaje 101 - 500 8 - 10
% a = Porcentaje acumulado
501 - 1000 10 - 11
m = Punto medio
L.R.I. = Límite real inferior 1001 - 5000 11 - 14
L.R.S. = Límite real superior
f. m. = Frecuencia por punto medio >5000 14 - 20
❖ Ejemplo:
Datos
12 – 13 – 15 – 15 – 17 – 21 – 24 – 28 – 32 – 35 – 36 – 37 – 37 – 39 – 39
– 40 – 41 – 44 – 44 – 51 – 54 – 56 – 59 – 59 – 62 – 64 – 65 – 65

I F f. a. % %a m LRI LRS fm
12-20 5 5 17.85 17.85 16 11.5 20.5 80
21-29 3 8 10.71 28.56 25 20.5 29.5 75
30-38 5 13 17.85 46.41 34 29.5 38.5 170
39-47 6 19 21.42 67.83 43 38.5 47.5 258
48-56 3 22 10.71 78.54 52 47.5 56.5 156
57-65 6 28 21.42 99.96 61 56.5 65.5 366

8
12 -20
6
21 -29 65 − 12
4 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = =9
30-38 6
2
39-47
0 48-56
Histograma de frecuencias
DESCRIPCIÓN NUMÉRICA DE LOS DATOS
→Media
N → Poblacional
→ Muestral
𝑥1 + 𝑥2 + ⋯ 𝑥𝑛

𝑛
𝑖=1
→Mediana
Datos que marcan el 50%
Po𝑠𝑖𝑐𝑖ó𝑛 𝑞𝑢𝑒 𝑜𝑐𝑢𝑝𝑎 = 0.5(𝑛 + 1)
→Moda
Es el dato que más se repite
❖Ejemplo:

Hallar la media, mediana y moda de los


siguientes datos:
18 – 19 – 21 – 22 – 22 – 23 – 27 – 28 – 33 –
36 – 36

= 25.58

Mediana
0.5(11 + 1) = 22.

Moda = 22
MEDIDAS DE VARIABILIDAD
 Los de variabilidad o dispersión nos indican si
esas puntuaciones o valores están próximas entre
sí o si por el contrario están o muy dispersas.
 Una medida razonable de la variabilidad podría
ser la amplitud o rango, que se obtiene restando
el valor más bajo de un conjunto de observaciones
del valor más alto.
 Rango = Dato mayor – Dato menor

 Rango Intercuantitativo: Q3 – Q1

Q1 = 0.25(n+1)
Q3 = 0.75(n+1)
 Varianza:
 Poblacional:
𝑛
2
(𝑥𝑖 −𝜇)
𝜗2 = ෍
𝑛
𝑖=1
Dónde μ = media poblacional
 Muestral:
𝑛
2
(𝑥𝑖 − 𝓍)
𝑠2 = ෍
𝑛−1
𝑖=1
Donde x = media
 Desviación Típica:
 Poblacional:
𝜗2
 Muestral:
𝑠2
❖ Ejemplo:
Un profesor enseña a un gran grupo un curso de marketing y
selecciona aleatoriamente una muestra de calificaciones de los
exámenes realizados por el grupo . Encuentre las medidas de
variabilidad del grupo.

Grupo No. 1 → 50 – 60 – 70 – 80 – 90

Rango: 90 – 50 = 40
Rango Intercuantitativo:
Q1 = 0.25(5+1) = 1.5 → 55
Q3 = 0.75(5+1) = 4.5 → 85
RIC = Q3 – Q1 → 85 - 55 = 30
Media = 70
(50−70)2 +(60−70)2 +(70−70)2 +(80−70)2 +(90−70)2
Varianza Muestral = = 250
4
Desviación = 250 = 15.81
PROBABILIDAD
 La probabilidad es una medida de la certidumbre
asociada a un suceso o evento futuro y suele
expresarse como un número entre 0 y 1 (o entre
0 % y 100 %).
 No puede haber probabilidades mayores a 1 o a
100%.
 Las probabilidades no pueden ser negativas.

 La probabilidad constituye un importante


parámetro en la determinación de las diversas
casualidades obtenidas tras una serie de eventos
esperados dentro de un rango estadístico.
𝑛 𝐶𝑢𝑎𝑛𝑡𝑎𝑠 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜
𝑃=
𝑁 𝐸𝑠𝑝𝑎𝑐𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙

❖ Ejemplo:
Una caja contiene 500 sobre de los cuales 75 contienen 100 dólares,
150 contienen 25 dólares y 275 contienen 10 dólares. ¿Cuál es la
probabilidad que un sobre tomado aleatoriamente contenga menos
de 100 dólares?

150
Probabilidad $25 = 500 = 0.30

275
Probabilidad $10 = 500 = 0.55

La probabilidad que sala un sobre con menos de 100 dólares es la


suma de las dos probabilidades:
0.30 + 0.55 = 0.85 ó 85%
REGLA MULTIPLICATIVA GENERAL
 Si 1 evento se puede hacer de n1 formas, el evento
2, 3…n, entonces la forma de combinarlos en n1,
n2, … hasta n veces.

❖ Ejemplo:
Cuantos número pares de 3 dígitos se pueden formar a partir de los
números 1, 2, 3, 6, y 9 si cada dígito se puede usar una vez.
→ Pares =2
→ 3 dígitos = 3
→ Solo 1 vez = 2
2*3*2 = 12
R. Se pueden formar 12 números pares.
PERMUTACIONES
 Son eventos de tipo multiplicativo, donde el
número de posibilidades va disminuyendo y si
importa el orden una permutación es un arreglo
de un conjunto de objetos en un orden definido.
 El número de permutaciones posibles al tomar
objetos del conjunto de elementos será, siguiendo
el mismo razonamiento.
𝑛!
𝑛𝑃𝑟 =
𝑛−𝑟 !
Donde: n es el número de cosas que puedes elegir, y
eliges r de ellas
(No se puede repetir, el orden importa)
❖ Ejemplo:
En un concurso de ortografía los ocho finalistas son
3 niños y 5 niñas, encuentre el número de puntos
muestrales para el número de ordenamientos
posibles para:
a) Los 8 finalistas

b) Las 3 primeras posiciones

a) 8! = 40, 320

8!
b) 𝑃 = = 336
8−3 !
REGLA GENERAL
 Sea un conjunto de n elementos, de entre los
cuales tenemos a elementos indistinguibles entre
sí, b elementos indistinguibles entre sí, c
elementos indistinguibles entre sí, etc. Cada
ordenación de estos elementos se denominará
permutación con repetición. El número de
permutaciones con repetición es:
𝑛!
𝑛1 ! 𝑛2 ! 𝑛3 !
❖Ejemplo:
9 personas se dirigen en 4 autos que pueden
llevar 2, 3, 2 y 2 personas respectivamente. ¿De
cuántas maneras es posible transportarlo?

9!
= 7560
2! ∗ 2! ∗ 3! ∗ 2!
COMBINACIÓN
 Una combinación es una selección de objetos sin
importar el orden en que se escojan.
 Son eventos similares a las permutaciones. Pero
el orden ya no importa y es necesario eliminar de
las permutaciones aquellas donde los elementos
se repiten aunque con distinto orden.
 Se llama «Coeficiente binomial»
𝑛!
𝐶=
𝑟! 𝑛 − 𝑟 !
Donde n es el número de cosas que puedes elegir, y
eliges r de ellas
(No se puede repetir, el orden no importa)
❖ Ejemplo:
De 4 ingenieros y 3 arquitectos, encuentre el
número de comités que se puede formar para una
comisión que debe conformar se por 2 ingenieros
y 1 arquitecto.

Ingenieros:

4!
=6
2! 4 − 2 !
Arquitectos:

3!
=3
1! 3 − 1 !
Se multiplican las dos combinaciones:
6 * 3 = 18

R = 18 comités
PROBABILIDAD CONDICIONAL
 La probabilidad de que ocurra el suceso A si ha
ocurrido el suceso B se denomina probabilidad
condicionada.
 Cuando ocurre un suceso cambia el espacio
muestral, por eso cambia la probabilidad. A veces
es más fácil calcular la probabilidad condicionada
teniendo en cuenta este cambio de espacio
muestral.
𝑃(𝐵∩𝐴)
𝑃( )=
𝐵
𝐴 𝑃(𝐴)
❖ Ejemplo:
La probabilidad de que un avión llegue a tiempo es 0.83
La probabilidad de que un avión salga a tiempo es de 0.82
La probabilidad de que un avión salga a tiempo y llegue a tiempo es 0.78

Encuentre la probabilidad de que el avión:


a) Llegue a tiempo dado que salió a tiempo
b) Salió a tiempo debido a que llegó a tiempo

P(S)=0.82 P(L)=0.83 P(L∩S)=0.78

a) P(L/S) =
𝑃(𝐿 ∩ 𝑆) 0.78
= = 0.95
𝑃(𝐿) 0.82

b) P(S/L) =
𝑃(𝐿 ∩ 𝑆) 0.78
= = 0.94
𝑃(𝐿) 0.83
REGLAS MULTIPLICATIVAS

 Si un experimento pueden ocurrir los eventos A y


B, entonces P( A Ç B)= P( A) P(B/A). así la
probabilidad de que ocurran A y B es igual a la
probabilidad de que ocurra A multiplicada por la
probabilidad de que ocurra B, dado que ocurre A.

𝐵
𝑃 𝐴 ∩ 𝐵 = 𝑃𝐴
𝐴
❖ Ejemplo:
Una bolsa contiene 4 bolas blancas y 5 negras. Una segunda
contiene 3 negras y 5 blancas. Se saca una bola de la primera
bolsa y se coloca sin verla en la segunda bolsa. ¿Cuál es la
probabilidad de sacar ahora una bola negra de la segunda bolsa?
Blancas
Blancas 6/9
4/9 Negras
Diagrama 3/9
de Árbol
Blancas
Negras 5/9
5/9 Negras
4/9

4 3 5 4 32
∗ + ∗ = ≅ 0.382
9 9 9 9 81
EVENTOS INDEPENDIENTES
 La principal característica de una situación con
eventos independientes es que el estado original
de la situación no cambia cuando ocurre un
evento. Existen dos maneras de que esto suceda:
 El proceso que genera el elemento aleatorio no
elimina ningún posible resultado
 El proceso que sí elimina un posible resultado, pero el
resultado es sustituido antes de que suceda una
segunda acción.

𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃(𝐵)
❖ Ejemplo:
Una ciudad tiene 2 carros de bomberos, 1 independiente
del otro. La probabilidad de que un carro específico esté
disponible es 0.96
a) ¿Cuál es la probabilidad de que ningún carro ese
disponible?
b) ¿Cuál es la probabilidad de que un carro esté
disponible cuando se le necesite?

P(A)=0.96 P(B)=0.96
P(A’)=0.04 P(B’)=0.04

a) P(A’)*P(B’) = 0.04 * 0.04

b) 1 – 0.0016 = 0.9984
REGLA DE ELIMINACIÓN
 Eventos B1, B2… Bk son parte del espacio
muestral s tal que P(B≠0) para i = 1, 2… K →
para cualquier evento A de s entonces:

𝑃 𝐴 = ෍ 𝑃(𝐵𝑖 ∩ 𝐴)
𝑖=1
𝑘

𝑃 𝐴 = ෍ 𝑃(𝐵𝑖)(𝐴/𝐵𝑖)
𝑖=1
❖ Ejemplo:

Operando % Producción % Errores


A 50% 2%
B 30% 3%
C 20% 2%

(0.5) * (0.02) = 0.01


(0.3) * (0.03) = 0.009
(0.2) * (0.02) = 0.004

෍ 0.01 + 0.009 + 0.004 = 0.023 ≅ 2.3%


BINOMIAL
 En estadística, la distribución binomial es una
distribución de probabilidad discreta que mide el
número de éxitos en una secuencia de n
independientes entre sí, con una probabilidad fija
p de ocurrencia del éxito entre los ensayos.
 Exactamente
 𝑏 𝑥; 𝑛; 𝑝 = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥
 Al menos «y»
𝑦−1
 1 − σ𝑥=0 (𝑥; 𝑛; 𝑝)
 Rango entre y-z
𝑦−1
 σ𝑥−1
𝑥=0 𝑏 𝑥; 𝑛: 𝑝 − σ𝑥=0 𝑏(𝑥; 𝑛; 𝑝)
❖ Ejemplo:
Un examen consta de 10 preguntas a las que hay que contestar Si o
No. Suponiendo que a las personas que se les aplica no saben
contestar a ninguna de las pregunta y,, en consecuencia, contestan al
azar, hallar:
a) Probabilidad de obtener cinco aciertos
b) Probabilidad de obtener algún acierto
c) Probabilidad de obtener al menos cinco aciertos

10
a) 𝑃 5; 10; 0.5 = 5
∗ 0.5 5 ∗ 0.5 10−5 = 0.2461 ≅ 25%

10
b) 𝑃 0; 10; 0.5 = 0
∗ 0.5 0
∗ 0.5 10−5
= 0.001

P(x ≥ 1) = 1-0.001 = 0.999 ≈ 99.9%

c) P(x ≥ 5) = P(x=5)+P(x=6)+P(x=7)+P(x=8)+P(x=9)+P(x=10)
P(x ≥ 5) = 0.6231 ≈ 62.3%
DISTRIBUCIÓN HIPERGEOMÉTRICA
 Es una distribución discreta relacionada con
muestreos aleatorios y sin reemplazo.
 La distribución hipergeométrica mide la
probabilidad de obtener x (0 ≤ x ≤ k) elementos de
la categoría A en una muestra den elementos de
la población original.
𝑘 𝑁 𝑘

ℎ 𝑥; 𝑛; 𝑁; 𝑘 = 𝑥 𝑛𝑁 𝑥
𝑛
Donde:
x= Variable aleatoria n= Muestra
N= Artículos disponibles k= Éxito
❖ Ejemplo:
Para evitar la detección en la aduana, un viajero coloca 6
tabletas de narcóticos en una botella que contiene 9 píldoras de
vitamina similares en apariencia. Si el oficial de la aduana
selecciona 3 de las tabletas para realizar su análisis ¿Cuál es la
probabilidad de que el viajero sea arrestado por posesión de
drogas?

n=3
N=15
k=6
x=1

6 15 6
1 3
− 1
1; 3; 15; 6 = 15 = 0.4747
3

R 47.47%
DISTRIBUCIÓN BINOMIAL
 Tiene el mismo principio binomial, pide que
ocurra un número determinado de éxitos.

𝑥 − 1 𝑘 𝑥−𝑘
𝑏 𝑥; 𝑘; 𝑝 = 𝑝 𝑞
𝑘−1
Donde:
x = total de experimentos
k = número de éxitos
p = probabilidad
q=1–p
❖ Ejemplo:
Encuentre la probabilidad de que la doceava persona que llega a
inscribirse al CUNOC. Sea el tercer estudiante que ingrese a ingeniería si
se estima que el 5% de los estudiantes van a esa carrera

x = 12
k=3
p = 0.05

12 − 1
(0.05)3 ∗ 0.95 9 = 0.0043
3−1
R≈0.43%
DISTRIBUCIÓN GEOMÉTRICA
 Busca o se relaciona con el número de pruebas en
el que ocurre el primer éxito.
 Cada prueba puede dar dos resultados
mutuamente excluyentes : A y no A
 El proceso consta de un número no definido de
pruebas o experimentos separados o separables.
El proceso concluirá cuando se obtenga por
primera vez el resultado deseado (éxito)
𝑔 𝑥; 𝑝 = 𝑝𝑞 𝑥−1
Donde:
x = cantidad de pruebas
p = probabilidad de éxitos
❖ Ejemplo:
La probabilidad de que un estudiante apruebe el examen de
piloto aviador es de 0.7. Encuentre la probabilidad de que el
estudiante apruebe en el tercer intento.

𝑔 3; 0.7 = 0.7 0.3 2 = 0.063 ≅ 6.3%

❖ Ejemplo:
La probabilidad de ganar estadística 1 es de 0.65 ¿Cuál es la
probabilidad que el estudiante gane el curso en la primero
recuperación?

𝑔 2; 0.65 = 0.65 0.35 1 = 0.2275 ≅ 22.73%


PROCESO DE POISON
 Es una distribución de probabilidad discreta que
expresa, a partir de una frecuencia de ocurrencia
media, la probabilidad que ocurra un
determinado número de eventos durante cierto
periodo de tiempo.
𝑒 −𝜆𝑡 (𝜆𝑡)𝑥
𝑝 𝑥; 𝜆𝑡 =
𝑥!
Donde:
t = Intervalo o región específica
λ = Número promedio de resultados por intervalos
❖ Ejemplo:
El número promedio de camiones que llega cada día
a cierta aduana es de 10. Las instalaciones tienen
una capacidad máxima de 16 camiones por día.
¿Cuál es la probabilidad de que en un día dado
hallan camiones que deban regresar?

16

1 − ෍ 𝑃(𝑥; 10)
𝑥=10
1 – 0.9730 = 0.027
R≈ 2.7%
DISTRIBUCIÓN NORMAL
 La gráfica de su función de densidad tiene una
forma acampanada y es simétrica respecto de un
determinado parámetro estadístico. Esta curva se
conoce como campana de Gauss y es el gráfico de
una función gaussiana.
 La importancia de esta distribución radica en que
permite modelar numerosos fenómenos
naturales, sociales y psicológicos.
 La distribución normal también es importante
por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más
simples y antiguos.
𝒙−𝝁
𝒛=
𝝑
x = variable aleatoria
μ = media
σ = Desviación estándar
❖ Ejemplo:
Una compañía paga a sus empleados Q15.90 / hora, con
una desviación de Q1.75. Sí los salarios se distribuyen
normalmente qué porcentaje de los trabajadores reciben
entre Q14.05 a Q16.22.

16.22 − 15.90
𝑍1 = = 0.18
1.75
14.05 − 15.90
𝑍2 = = −1.05
1.75

Para saber el porcentaje hacemos uso de las tablas


necesarias
0.18 → 0.5714 ≈ 57.14%
-1.05 → 0.1469 ≈ 14.69%
HECHO POR:
ANA LUCÍA HERNÁNDEZ TZORÍN
Carné: 201630653
Curso: Estadística 1
Ing. Ana Alicia Armas
10 de Noviembre de 2017

Vous aimerez peut-être aussi