Académique Documents
Professionnel Documents
Culture Documents
“Para actuar acertadamente en el mundo de hoy se requiere, entre otras cosas, estar
educado en cierto “pensar estadístico” que permita no solo tener presente o saber buscar
resultados anteriores (recopilados en registros tabulados o en gráficos); sino también
saberlos interpretar y aplicar adecuadamente en la toma de decisiones” Dr. Luis Santaló
“Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para
la convivencia eficiente como la capacidad de leer y escribir” Herbert George Wells
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad.
Estadística inferencial: Obtener conclusiones sobre una población a partir de una muestra.
Conceptos fundamentales:
-Tecnicas de muestreo:
Probabilisticas:
-Muestreo aleatorio simple: Cada elemento de la población tiene las mismas posibilidades
de ser seleccionadas. Se realiza sin reposición y consiste en seleccionar n elementos de
entre N (n<N), de tal forma que todas las muetras de tamaño n que se puedan formar
tengan la misma posibilidad de ser elegidas.
Clase 2)
Muestras no probabilísticas:
Ejemplos de variables:
-Libros leídos por los alumnos del 3er año del prof. En matemática del isfd CB
A partir de esto, vemos que las variables pueden ser de dos tipos.
-Cuantitativa: Son las que se pueden representar por un valor numérico. Estas, además
pueden ser Discretas o continuas, dependiendo de los valores que pueden tomar.
A partir de esto, escriban 3 ejemplos de cada tipo de variable siguiendo lo que entienden
de cada una.
-Nivel nominal: Las variables están representadas por palabras o números que no reflejan
una cantidad sino un nombre.
-Nivel ordinal: Los valores de la variable sirven para establecer un orden o categoría, se las
puede ordenar de mayor a menor, se puede dar la posición relativa de un dato con
respecto a otro, pero sin cuantificar. Por ejemplo: Grado de acuerdo, categoría dentro de
un escalafón.
Independiente y dependiente.
Una vez seleccionada la variable y haber hecho la medición, tenemos los datos obtenidos.
Ahora necesitamos estudiarlos.
1;5;2;8;4;3;2;6;2;4.
Tabla de frecuencias:
Es una tabla usada para variables cualitativas, o para variables discretas con poca
variabilidad en sus datos.
Color Fi Fi Fi%
Blanco 5 Xi/n Xi/n*100
Verde 8
Azul 6
Rojo 1
Totales 20
Fi: Frecuencia acumulada: Número de veces que se repite un valor de la variable
Fi: Razón entre las frecuencias y el total. Indica la proporción que representa cada valor de
la variable en el total.
Esta tabla, no será útil en el caso de variables discretas con grandes cantidades de valores,
o para variables continuas.
Por ejemplo:
1_ Calcular el Rango.
RANGO=VALmax-VALmin
NºI=1+3,322*log80=1+6,32=7,32= NI=7
A=R/NI=44/7=6,28=> a=7
a.Ni=NR=> 7.7=49
Esos 5 valores que sobran es necesario distribuirlos. Podriamos dar iniciar 3 valores antes
del Valinicial y 2 Valores posteriores al inicial. Quedando los siguientes intervalos de la
siguiente forma.
Por ejemplo.
0,0,4,3,1,4,2,1,2
1,88
LA MEDIANA
Es el punto central de los datos, deja la misma cantidad de datos a un lado como al otro
de la misma. El 50% de los datos es menor a la mediana, y el 50% de los datos es superior
a la mediana.
En el caso, que la cantidad de datos sea impar, la mediana es el valor que se encuentra en
la posición obtenida. Si la cantidad de datos es par, entonces la mediana es la media
aritmética de los dos valores centrales.
Pir ejemplo:
2,6,9,3,5,8,7.
Me=Li+((n/2-fa(i-1)/fi).a
Donde
N: tamaño de la muestra.
LA MODA:
La distribución puede no tener moda, puede ser unimodal, bimodal o multimodal (Esto
puede respresenta grupos diversos en la población)
Mo=Li+(D1/D1+D2)*a
D1: Exceso en la frecuencia modal con respecto al intervalo anterior al intervalo modal: fi-
fi-1
D2: Exceso en la frecuencia modal con respecto al intervalo superior al intervalo modal: fi-
fi+1
A=amplitud
Ejemplo:
MEDIA GEOMETRICA G
La media geométrica de un conjunto de datos es la raíz n-esima de los productos de todos los
valores.
MEDIA armónica h
2,5, 6, 7, 9
Relación entre media aritmética, armonica y geométrica
H<=G<=X
MEDIDAS DE POSICIÓN
Cuartiles:
Son 3 valores que dividen al conjunto de datos, una vez ordenado de manera creciente o
decreciente, en 4 partes iguales, donde cada una concentra el 25% de los datos.
Qk=Li+(nk/4+fai-1)/fixa
Se tomaron las longitudes de dos conjuntos diferentes de bloques A y B. Las longitudes de los
bloques en el conjunto A fueron 10, 20, 30, 40, 50 y 60 cm. y las longitudes de los bloques en el
conjunto B fueron 10, 10, 10, 60, 60 y 60 cm.
Rango= Vmax-Vmin
(𝑋𝑖 − 𝜇)2
𝜎2 = ∑
𝑁
En el caso que estemos trabajando con una muestra, se utiliza S en vez de sigma, y se multiplica a
la expresión por el estimador insesgado (Corrección de Bessel)
O=raíz o^2
Calcular o de las distribuciones de bloques
La distribución con mayor desvío estándar es la que tiene valores más dispersos, más para
memorizar una lista de seis pares de palabras. Los resultados fueron: 5 8 3 9 6 7 10 6 7 4 6 9 5 6 7
94687
Coeficiente de variación
𝑆
𝐶𝑉 = 100
𝑋̅
CV=o.100/u
puede comparar una distribución de alturas de los alumnos con la distribución de sus pesos y
hablar, entonces, de cual de las dos tiene mayor variabilidad.
Gráficos estadísticos
Una gráfica es un dibujo complementario a una tabla o cuadro, que permite observar las
tendencias de un fenómeno en estudio.
Constituido por columnas verticales u horizontales rectangulares de igual ancho y del mismo color
o trazado, que:
Se usa para representar variables en porcentajes, o cifras absolutas cuando el número de variables
no es demasiado grande. Para realizar el gráfico “a mano” es necesario sacar el ángulo que
corresponde a cada variable.
Continuemos con el ejemplo de la variable “color de buzo de preferencia “A los buzos blancos les
corresponde el 25%. Entonces decimos: como a 100% corresponde un ángulo de 360 grados,
entonces a 25% corresponde un ángulo de (25 % x 360)/100%
Generalmente se utiliza para representar la evolución de la variable a través del tiempo (años,
meses, horas, etc.).
Se divide 360 por la cantidad de valores que toma la variable, determinando sectores circulares
iguales. Luego se trazan circunferencias concéntricas con valores de la variable.
60
julio febrero
Meses Fi
40
Enero 50
20 Febrero 60
Marzo 50
0 Abril 55
junio marzo mayo 70
Junio 75
julio 80
mayo abril
Histograma
En el caso de variable Continua se utilizan intervalos cuya amplitud debe ser igual en todos los
casos, siempre que esto sea posible. Se construye dibujando barras contiguas que tienen: como
base la amplitud del intervalo y como alturas las frecuencias respectivas
Es similar a un gráfico de líneas, pero en este caso se consideran los puntos medios de las bases
superiores de los rectángulos del histograma correspondiente a la distribución. El área encerrada
bajo el polígono de frecuencias es igual o proporcional al tamaño de la muestra o población.
Curva de densidad.
También llamado
Si hacemos tender a infinito la cantidad de intervalos, es decir que a tienda a cero, el polígono de
frecuencias determinado tiene a convertirse en una curva, en la cual podemos analizar ciertas
cuestiones.
El área encerrada bajo la curva es proporcional a la frecuencia de la distribución. Esta curva suele
llamarse polígono de frecuencias suavizado, curva de frecuencias o curva de densidad.
Los momentos de una variable X son los valores esperados de ciertas distribuciones de X.
éstos forman una colección de medidas descriptivas que pueden emplearse para caracterizar
la distirbución y especificarlas si todos los momentos de X son conocidos.
Sesgo estándar:
Indica el grado de asimetría de la curva, es decir cuanto se aparta de la simetría. Permite analizar
en que rama de del recorrido de la variable hay mayor acumulación de datos sin necesidad de
realizar el grafico.
∑(𝑥𝑖 − 𝑋)3 . 𝑓𝑖
𝑎3 =
𝑛. 𝑆 3
X<Me<Mo
El cuarto momento de la distribución es el que determina que tan alta es la curva de densidad.
Medidas de apuntalamiento:
Curtosis: Indica cuan puntiaguda es la curva de frecuencias de una distribución con respecto a la
normal.
∑(𝑥𝑖−𝑋)4 .𝑓𝑖
𝑎4 = 𝑛.𝑆 4
-3
Covariación:
Tratamos ahora de dos variables obtenidas en una misma prueba. Por ejemplo: En un equipo de
futbol, interesan tomar las alturas y los pesos de cada jugador. Se obtienen asi dos datos de un
mismo sujeto.
Dependencia causal unilateral: Se da cuando una variable influye a la otra. Por ejemplo, si
relacionamos cantidad de lluvia caída y la asistencia a clases. La cantidad de lluvia influe
sobre la asistencia. Pero la asistencia no influye en la cantidad de lluvia.
Interdependencia: La influencia de las os variables es recíproca. Un ejemplo clásico es el
que vincula los precios con las cantidades demandadas/ ofrecidas de un bien.
Dependencia indirecta: Cuando dos variables pueden registrar una covariación que no es
real y que se da porque ambas dependen de una tercera que ejerce su influencia entre
ellas. Por ejemplo: En este decenio se registra una mayor afluencia al comedor escolar que
en el decenio pasado, y en ese mismo período ha aumentado la repitencia escolar. Esto no
quiere decir que la afluencia al comedor escolar haga que mas alumnos repitan el año.
Concordancia: Existen casos en los que sabemos que dos variables son independientes,
pero queremos saber si hay cierta concordancia entre sus valores. Por ejemplo las notas
de concepto de los profesores de un curso.
Covariación casual: Existen situaciones en las que se observa una variación sincronizada
entre dos variables, cuya observación llevaría a concluir que existe una asociación o
dependencia entre las mismas. No obstante, tal covariación puede ser totalmente casual o
accidental.
Gráfico de dispersión:
Podemos, a partir del grafico sacar algunas conclusiones sobre la relación entre las variables.
En el grafico podemos observar una clara relación entre las dos variables.
covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias
respecto a sus medias. Es el dato básico para determinar si existe una dependencia entre ambas
variables y además es el dato necesario para estimar otros parámetros básicos, como el
coeficiente de correlación lineal o la recta de regresión. Sxy
Tener en cuenta como sería para el caso de las poblaciones (es el que vamos a usar)
A través del coeficiente de correlación. obtenemos un valor numérico adimensionado que expresa
el grado de correlación entre las variables.
Medida de Pearson:
𝑆𝑥𝑦
r=
𝑆𝑥.𝑆𝑦
Demostrar
En en el análisis de correlación encontramos un valor que nos indica que tan fuerte es la relación
entre las variables. Con el análisis de regresión, se busca una line que explique de la mejor manera
posible a esa relación
Zy=n.b+a.Zx
Zxy=bZx+aZx2
^y=a+bx
b:coeficiente de regresión.
UNIDAD Nº 3 PROBABILIDAD
Tipos de experimentos:
-Experimento determinista: aquel que realizado en las mismas condiciones siempre nos da el
mismo resultado. De estos experimentos se ocupa la física clásica.
-Experimento aleatorio: es aquel susceptible a dar varios resultados. Sin poder predecir de
antemano cuál de ellos va a producirse en una experiencia concreta. Por ejemplo.
Sucesos elementales:
*Espacio probabilístico o espacio muestral: el conjunto de todos los sucesos elementales, es decir
todos los posibles resultados de un experimento.
Se simboliza con E
E= {C;X}
A=Obtener un Nº par
A={2,4,6}
Suceso simple Cumple solo una condicion por ejemplo: sacar un 7 de una
baraja española
suceso compuesto cumple mas de una condición sacar un 7 de copas de una
baraja española
suceso imposible ningún suceso del espacio Sacar un 7 de corazones de
A=O muestral cumple con las una baraja española
condiciones
Suceso cierto Todos los sucesos del espacio Sacar una carta de una baraja
A=E muestral cumple las española
condiciones
Tenga en cuenta que los sucesos son conjuntos, por lo tanto valen las operaciones entre ellos.
A=numero par
B=mayor a 3
AinterB={4,6}
Diferencia:
A-B={2}
Complemento:
𝐴̅=S-A
LA probabilidad de que ocurra un evento o suceso se la suele indicar con p que es la probabilidad
de éxito de que ocurra dicho evento.
q=P(p’)=n-k/n=1-k/n=1-p
Esta definición de probabilidad es aplicable únicamente cando los sucesos elementales son
equiprobables.
i) 0≤fra≤1
iiii) si A y B son dos sucesos que se excluyen mutuamente y sea fAUB la frecuencia asociada al
suceso AUB entonces fAUB=fA+fB
En estadística, dada una tabla de frecuencias, la frecuencia relativa es el cociente entre las
apariciones de un suceso A, es decir la frecuencia absoluta y el tamaño muestral n
𝑎𝑝𝑎𝑟𝑖𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑠𝑢𝑐𝑒𝑠𝑜 𝐴
FrA=
𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Si se repiten el experimento infinitas veces, es decir que hacemos ninfinito, entonces FrA=P(A).
* Mutuamente excluyente: es decir que son sucesos que no pueden ocurrir al mismo tiempo.
Por ejemplo si tomamos dos eventos: casado y soltero. No se puede ser ambos.
Sucesos simultaneeos: son aquellos que pueden ocurrir al mismo tiempo. Por ejemplo si
tomamos los sucesos: mujeres, casadas.
Se llama probabilidad de ocurrencia de un suceso aleatorio A a un número real que cumple los
siguientes axiomas.
0≤P(A)≤1
A=SP(A)=P(S)=1
iii) Sean A1, A2,…An sucesos mutuamente excluyentes de a pares y pertenecientes al mismo
espacio muestral S. La probabilidad de que ocurra alguno de ellos es igual a la suma de las
probabilidades de los Ai. Es decir
P(A1oA2oA3o…oAk)=P(A1UA2U…UAk)=P(A1)+P(A2)+P(A3)+…+P(Ak)
Veamos en un ejemplo.
Sea E el espacio muestral formado por 15 bolitas de colores, de las cuales son: 6 negras, 5 rayadas
y 4 blancas.
E: es el espacio muestral
#𝐵 0
𝑃(𝐵) = = =0
#𝐸 15
#𝑠 15
𝑃(𝑆) = = =1
#𝐸 15
Por lo tanto.
0≤P(X)≤1
en el libo de estadística para ingenieros. hacer los ejercicios de la pag 47 y 48.: 1; 5; 10; 15
Probabilidad condicional
En el primer intento:
P(A)=10/100
P(B)=90/100
Que ocurre si en la primera extracción saco una bolita negra y quiero volver a sacar.
P(A)=9/99
P(B)=90/99
Y que ocurre si en la primer extracción se obtiene una bolita blanca. ¿Cuál es la probabilidad de
que en una segunda extracción la bolita sea negra?
P(A/B)=10/89
Tomemos un ejemplo
Supongamos que el espacio muestral S es la población de adultos en una pequeña ciudad que
cumplen con los requisitos para obtener un grado en la facultad. Debemos clasificarlos según se
sexo y situación laboral.
P(H/E)=460/600
𝑛(𝐻 ∩ 𝐸)
𝑛(𝐻 ∩ 𝐸) 𝑛(𝑆) 𝑃(𝐻 ∩ 𝐸)
P(H│E) = = =
𝑛(𝐸) 𝑛(𝐸) 𝑃(𝐸)
𝑛(𝑆)
𝑃(𝐻 ∩ 𝐸)
P(H│E) =
𝑃(𝐸)
Particiones:
Dado un espacio muestral S, se pueden realizar particiones Bi en el mismo. Estas deben cumplir
que:
i) B1UB2U…UBk=S
iii) P(Bi)>0
Consideremos una partición del espacio muestra en k partes. Entonces, para cualquier suceso A
incluido en S. 𝑃(𝐴) = ∑ 𝑃(𝐵𝑖 ∩ 𝐴) = ∑ 𝑃(𝐴|𝐵𝑖 ). 𝑃(𝐵𝑖 ). tenga en cuenta que los eventos son
mutuamente exluyentes.
Demostración
y si queremos calcular
Veamoslo en un ejemplo:
En cierta planta de montaje, tres maquinas B1, B2 y B3 montan respectivamente 30%, $45 y 25%
de los productos. A su vez, se sabe que respectivamente que el 2% el 3% y el 2% de los productos
ensamblados por las maquinas son defencuosos. Ahora, suponga que se selecciona al azar un
producto ¿Cuál es la probabilidad de que sea defectuoso?
Tenemos:
A: el producto es defectuoso.
P(A)=P(A│B1).P(B1)+P(A│B2).P(B2)+P(A│B3).P(B3)=(0,02.0.3)+0,03.0,45+0.02.0.25=0,006+0,0135+
0,005=0,0245
Si los eventos B1, B2, …,Bk constituyen una partición del espacio muestral S, donde P(Bk)≠0 para
2i=1,2,3,…,k Entonces.
𝑷(𝑨|𝐁𝐢). 𝐏(𝐁𝐢)
𝑷(𝑩𝒊|𝐀) =
∑𝒌𝒊=𝟏 ∑ 𝑷(𝐀│𝑩𝒊). 𝑷(𝑩𝒊)
En nuestro ejemplo, por ejemplo para saber la probabilidad de que el producto haya sido
producido por la maquina 3, siendo que es defectuoso.
𝑃(𝐴│𝐵3). P(B3) 0,02.0,25
𝑃(𝐵3|A) = =
𝑃(A|𝐵1). P(B1) + 𝑃(A|𝐵2). P(B2) + 𝑃(A|𝐵3). P(B3) 0,006 + 0,0135 + 0,005
0,005
= =
0,0245
𝑃(𝐵𝑟∩𝐴)
𝑃(𝐵𝑟|𝐴) = Por definición de probabilidad condicional.
𝑃(𝐴)
𝑃(𝐴|Br). P(Br)
𝑃(𝐵𝑟|𝐴) =
∑ 𝑃(𝐵𝑖 |𝐴). 𝑃(𝐵𝑖 )
1) La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%.
Si la prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la prevalencia del
infarto en esa población?
2) El 20 % d e l o s em pl ead o s d e u n a e mp r e sa s on i n g en i e r os y ot r o 20 %
s on e c on omi s ta s. El 75 % d e l o s i n g en i e r o s o cu p an u n pu e st o di r e cti v o y
el 50 % d e l o s e c on o mi sta s t am bi én , mi e n tr as qu e d e l o s n o i n gen i e r os y
l os n o e c on omi st as s ol am en t e el 20 % o cu pa u n pu e st o di r e cti v o. ¿Cu ál
e s l a p r oba bi l i dad d e qu e u n e mpl e ad o di re cti v o el egi do al az a r s e a
i n gen i e r o?
b. Si el i n fan t e r esu l ta s e r m en o r d e 24 m e s es . D et e r mi n e l a
pr ob abi l i dad qu e s e a u n a n i ñ a .
Distribuciones de probabilidad
Introducción.
Variable aleatoria:
E3: Se fabrican artículos en una línea de producción y se cuentan aquellos que resultan
defectuosos.
E4: Se prueba la duración de una lamparita, anotando el tiempo hasta que se quema.
“Es posible repetir cada experimento indefinidamente sin cambiar esencialmente las condiciones.
Aunque no podemos indicar cuál será un resultado particular, podemos describir el conjunto de
todos los resultados posibles del experimento. A medida que el experimento se repite, los
resultados individuales parecen ocurrir de forma “caprichosa”. Sin embargo, cuando se repite un
gran número de veces, aparece un modelo definido de regularidad. Esta regularidad hace posible
la construcción de un modelo matemático preciso con el cual analizar el experimento.” (Meyer, P.:
1986, p. 8)
Los experimentos que cumplen con las características enunciadas, se llaman experimentos
aleatorios.
Dado un lote de artículos electrónicos se prueban 3 artículos, donde surge el siguiente espacio
muestral
De esta forma se le asiganaran valores a cada uno de los elementos del espacio muestral 0, 1, 2 o 3
Estos valores, son cantidades aleatorias determinadas por el resultado del experimento aleatorio.
Se pueden ver como valores que toma la variable aleatoria X, el número de artículos defectuosos
cuando se prueban 3 artículos electrónicos.
Está definición es válida, pero necesitamos exponerla de una manera más refinada. Para ello
utilizaremos los diagramas de ven correspondientes al ejemplo para lograr una definición más
adecuada. Trabajamos desde el concepto de función
X f(x)=P(X=xi)
NNN
0
NND
1/8
NDN
1
DNN
3/8
NDD 2
DND
DDN 3
DDD
Definimos entonces a la variable aleatoria x, como la función que asigna un valor a cada uno de los
elementos del espacio muestral. X:S R
Cuando R es un conjunto numerable (infinito o no) se dice que X es una variable aleatoria discreta.
La segunda función f(x)=P(X=xi) es la que asocia cada valor de la variable aleatoria X, su respectiva
probabilidad. f:imX R
Distribuciones de probabilidad discreta
i) f(x)≥0
ii)∑ 𝑓(𝑥) = 1
ii) P(X=xi)=f(x)
Siguiendo el ejemplo enunciado, pero pensando en que son 4 los artículos seleccionados
tendríamos.
1 2 3 4 5
Una VAC tiene una probabilidad 0 de tomar exactamente uno de sus valores, en consecuencia, su
distribución no puede ser dada de forma tabular. No podemos trabajar con un valor, sino con un
intervalo de valores de nuestra variable aleatoria.
A pesar de que la probabilidad no podrá ser expresada de manera tabular, es posible darla a través
de una formula, y dicha fórmula necesariamente será función de la variable aleatoria X. La función
f(x) para las variables continuas suele llamarse función de densidad de probabilidad, o
simplemente función de densidad de X. Como X, se define sobre un espacio muestral continuo, es
posible que f(x) presente un numero finito de discontinuidades aunque no suele ser el caso de las
funciones con aplicaciones estadísticas.
La función de densidad, siempre será positiva, es decir que se desarrolla siempre sobre el eje x.
La función de densidad de probabilidad se construye de tal forma, que el área bajo la curva
limitada por el eje x sea 1 cuando se calcula en el rango de X para el cual está definida f(x). Si este
rango es limitado, siempre es posible extenderlo para comprender a todos los números reales,
haciendo que f(x)=0 en el intervalo extendido.
El el siguiente gráfico, la probabilidad de que a<x<b es el área bajo la curva, entre a y b, limitada
por el eje x.
Tengamos en cuenta que f(x) no es una probabilidad, y puede tomar valores mayores a 1, es
simplemente el valor de una función en un punto.
Ejemplo:
En el ejemplo:
Ejercicio:
Esperanza matemática o valor medio de la variable aleatoria.
En un juego de azar, una persona ganará $5 si, cuando lance tres monedas, ocurren tres caras o
tres cruces, o perderá $3 si ocurren una o dos caras. ¿Cuál es el promedio de ganancia que el
jugador espera obtener por tirada?
Def: Sea X una variable aleatoria con distribución de probabilidad f(x). La media o valor esperado
esta dada por:
Sea X una variable aleatoria con distribución de probabilidad f(x) y media u. La varianza de la
variable aleatoria x o la varianza de la distribución de probabilidad de X es:
+∞
si escontinua: 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = ∫−∞ (𝑥 − 𝜇)2 . 𝑓(𝑥)𝑑𝑥
Ejercicio
Algunas distribuciones de probabilidad discreta:
Si la variable aleatoria X, toma los valores x1, x2,…,xk con idéntica probabilidad entonces la
distribución uniforme discreta está dada por:
f(x;k)=1/6
Teorema:
1) Un jugador lanza un dado corriente. Si sale 1 o número primo, gana tantos cientos de
euros como marca el dado, pero si no sale número primo, pierde tantos cientos de euros
como marca el dado. Determinar la función de probabilidad y la esperanza matemática del
juego
2) Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 € ó un
segundo premio de 2000 € con probabilidades de: 0.001 y 0.003. ¿Cuál sería el precio justo
a pagar por la papeleta?
3) Se lanza un par de dados. Se define la variable aleatoria X como la suma de las
puntuaciones obtenidas. Hallar la función de probabilidad, la esperanza matemática y la
varianza
4) Representar gráficamente cada una de las situaciones.
Distribución binomial
Procesos de Bernoulli:
Si se realiza un experimento, el cual consiste en pruebas repetidas con dos resultados posibles,
catalogados como éxitos o fracaso este proceso se llama proceso de Bernoulli y cada ensayo un
experimento de Bernoulli.
-Se selecciona una carta de una baraja española y se espera obtener una espada.
2) Cada prueba produce un resultado que se puede clasificar como éxito o fracaso.
Def:
Un experimento de Bernoulli puede tener como resultado un éxito con probabilidad p o un fracaso
con probabilidad q=1-p. Entonces la distribución de probabilidad de la variable aleatoria binomial
X, el número de éxitos en n pruebas independientes es:
Como p+q=1
ver los ejemplos del libro de estadística para ingenieros. pag 132 del pdf.
Teorema:
𝜇 = 𝑛. 𝑝 𝜎 2 = 𝑛. 𝑝. 𝑞
En relación a los ensayos de Bernoulli, algunas veces nos interesa el número de ensayos en el que
ocurre el k-esimo acierto. Por ejemplo, podemos estar interesados en la probabilidad de que el
cuarto niño expuesto a una enfermedad sea el segundo en contraerla, o bien que el quinto
examen que presente un alumno sea el segundo que repruebe, etc. Existe una distribución de
probabilidad relacionada con la binomial que se aplica en este tipo de situaciones y que recibe el
nombre de Distribución Binomial negativa o distribución de Pascal.
Una variable aleatoria X, tiene una distribución binomial negativa o de Pascal, si y solo si su
distribución de probabilidad está dada por.
𝑘−1 𝑘 𝑥−𝑘
𝑏 ∗ (𝑥; 𝑘; 𝑝) = 𝐶𝑥−1 .𝑝 𝑞 𝑃𝑎𝑟𝑎 𝑥 = 𝑘, 𝑘 + 1, 𝑘 + 2, …
Por ejemplo:
Tenemos. x=10…k=3….p=0,4
Teorema:
𝑘 𝑘𝑞
𝜇= 𝜎2 =
𝑝 𝑝2
𝑏 ∗ (𝑥; 1; 𝑝) = 𝑝𝑞 𝑥−1
A esta distribución especial, se la llama distribución geométrico porque los términos sucesivos
forman una progresión geométrica de razón q
.definición:
Una variable aleatoria X, obtenida a partir de un proceso de Bernoulli, tiene una distribución
geométrica en la que aparece el primer éxito y su forma es:
𝑔(𝑥; 𝑝) = 𝑝𝑞 𝑥−1
Ejemplo:
Se sabe que en cierto proceso de fabricación, 1 de cada 100 artículos es defectuoso. ¿Cuál es la
probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se
encuentra?
p=0,01 x=5
Teorema:
1 𝑞
𝜇= 𝜎2 =
𝑝 𝑝2
Distribución Hipergeométrica
Definición:
𝑁−𝑘
𝐶𝑥𝑘 𝐶𝑁−𝑥
ℎ(𝑥; 𝑁; 𝑛; 𝑘) = Con x=0,1,2,….,n
𝐶𝑛𝑁
Teorema:
1) En un estante de un supermercado un cliente observa que sólo quedan diez focos de una oferta,
selecciona cuatro para llevarlo a su casa, pero del lote de diez tres no funcionan. ¿Cuál es la
probabilidad de que, a) todos los seleccionados funcionen, b) por lo menos dos no funcionen?
2) Un lote contiene 100 piezas de un proveedor de tubería local y 200 unidades de un proveedor
de tubería del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo,
(b) ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local?
(c) ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?
Para el caso en que n sea pequeño comparado con N, la naturaleza de los N articulas varia muy
poco. Por lo que el cociente K/N=p
𝑛𝑘 𝑁−𝑛 𝑘 𝑘
𝜇= = 𝑛. 𝑝 𝜎 2 = 𝑛. 𝑝. 𝑞 → . 𝑛. . (1 − )
𝑁 𝑁−1 𝑁 𝑁
La media es la misma, mientras que la varianza difiere en el factor N-n/N-1 que para valores altos
de N y pequeños de n tiende a 1.
No es necesario que N sea muy grande para cumplirse esta relación, algunos autores se refieren a
que se puede aproximar la distribución hipergeométrica por la binomial cuando N>50 y n es
menor al 5% del tamaño de N
Ejemplo:
Se estima que 4000 de 10000 votantes de una ciudad están en contra de un nuevo impuesto a las
ventas. Si se selecciona al azar 15 votantes y se les pide la opinión. ¿Cuál es la probabilidad de que
7 de ellos estén en contra del impuesto?
Por ejemplo, la variable aleatoria X podría ser: número de llamadas telefónicas que recibe una
oficina durante una semana, el número de juegos suspendidos durante una temporada en un
deporte, la cantidad de ratas por hectárea en un campo, el número de bacterias en un cultivo, etc.
-el numero de resultados que ocurren en un intervalo o región especifica son independientes del
numero que ocurren en cualquier otro intervalo o región del espacio disjunto. De esta forma
vemos que el proceso de Poisson no tiene memoria
-La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo o región muy
pequeñas es proporcional al intervalo o región y no depende del número de resultados que
ocurren fuera de este intervalo.
-La probabilidad de que ocurra más de un resultado en tal intervalo o región muy pequeña es
insignificante.
Definición:
𝑒 −ƛ𝑡 (ƛ𝑡)𝑥
𝑝(𝑥; ƛ𝑡) = 𝑥
𝑥!
= 1,2,3 … . ƛ 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑜 𝑟𝑒𝑔𝑖𝑜𝑛
Ejemplo:
x=6. lamdat: 4
Demostración: hacemos ƛ𝑡 = 𝑢
La función de densidad de la variable aleatoria uniforme continua X en el intervalo [A;B] esta dada
por:
1
𝑓(𝑥; 𝐴; 𝐵) = 𝐴≤𝑥≤𝐵 0 𝑒𝑛 𝑡𝑜𝑑𝑜 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝐵−𝐴
Distribución Normal.
1 1 𝑥−𝜇 2
𝑛(𝑥; 𝜇; 𝜎) = . 𝑒 −2(𝜎
)
, 𝑐𝑜𝑛 𝑥𝜖𝑅
√2𝜋𝜎
3) La curva normal se acerca de manera asintótica respecto al eje x conforme los valores d x se
alejan de la media en ambas direcciones.
4) La curva tiene sus puntos de inflexión en x=u+-o. Es cóncava hacia abajo u-o<x<u+o. Y convaca
hacia arriba en todo otro punto.
Basandonos en la función de densidad de una variable aleatoria normal, nos encontramos con que
existen infinitas distribuciones, dependiendo de los valores de la media y la varianza. Para
simplificar el trabajo, es útil unificar estas distribuciones, de manera que podamos trabjar a todas
las distribuciones normales de una sola manera.
Surge así la idea de la Distribución Normal Estandar, con media 0 y desvio estándar 1.
𝑥−𝜇
𝑍=
𝜎
A la distribución normal con media igual a 0 y desvío igual a 1, se la llama distribución normal
estándar.
Es necesario el uso de tablas para calcular el área bajo la curva. tabla pag 36.
Ejemplo:
Aproximación normal de la binomial.
Decimos entonces:
Si X es una variable aleatoria binomial nos u=n.p y o^2=n.p.q entonces la forma limitante de
𝑋 − 𝑛𝑝
𝑍=
√𝑛𝑝𝑞
Para la aproximación tendremos que tener el cuenta el área del rectángulo con centro en x. es
decir que tiene un área que va de 3,5 a 4,5. y estos valores son los que vamos a estandarizar. La
suma y resta de 0,5 comunmente se le llama factor de corrección de continuidad.
otro ejemplo
Distribuciones muestrales.
Supóngase que de una población finita de tamaño N > n se extraen, todas las muestras posibles de
tamaño n. Si se denota con 𝜇𝑥̅ 𝑦 𝜎𝑥̅ respectivamente, a la media y a la desviación estándar de una
distribución muestral de las medias, y con μ y σ, respectivamente, a la media y la desviación
estándar poblacionales, entonces
𝜎
𝜇𝑥̅ = 𝜇 𝜎𝑥 2 =
𝑛2
Distribución muestral de la diferencia entre 2 medias.
Suponga que tenemos 2 poblaciones, la primera con media u1 y varianza sigma sub 2 cuadra, y la
segunda con media u2 y varianza sigma sub 2 cuadrado, representamos con el estadístico X1 raya
𝜎12 𝜎12
𝜇̅̅̅̅̅̅
𝑋1 −̅̅̅̅
𝑋2 =𝜇1 −𝜇2 𝜎̅𝑥2̅̅̅−𝑋
1 ̅̅̅̅
= + 𝐷𝑒 𝑎𝑞𝑢𝑖 𝑞𝑢𝑒
2 𝑛1 𝑛2
̅̅̅1 − ̅̅̅
(𝑋 𝑋2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝜎2 𝜎2
√ 1 + 1
𝑛1 𝑛2
En la plicación del teorema del limite central del comportamiento de la distribución de medias en
forma normal, se supone que se conoce a varianza poblacional. Ahora, en el caso en que este valor
se desconosca, se utiliza la distribución T, que se define como
Las medidas que se calculan con los datos extraidos de una muestra se llaman “Estimadores o
estadisticos”y los correspondientes a la población se llaman parámetros.
proporción es: el número de individuos que cumple con una determinada condición sobre el total
de la población.
Estimación puntual.
Realizar una estimación puntual es dar un único valor como posible parámetro poblacional.
Es decir, se toma una muestra de la población y aplicando cierta fórmula, se obtiene una
estimación puntual del parámetro. Podemos decir, entonces, que el estimador es una función de
las observaciones de la muestra.
Esta estimación, a diferencia de la anterior, consiste en obtener un intervalo, que tiene una cierta
probabilidad de contener al verdadero valor del parámetro. Este intervalo puede construirse para
diferentes parámetros: la media poblacional u, el desvío estándar poblacional sigma, la proporción
poblacional P.
Siendo un intervalo, la estimación no se limita a un solo valor numérico, sino que se estima
mediante un rango de valores con cierta confianza
La estimación por intervalo de confianza se realiza mediante un intervalo aleatorio, determinado
por un límite inferior y un límite superior. Estos límites son variables que dependen de elementos
tales como, el tamaño de la muestra (n) y el nivel de confianza que se simboliza con 1- alfa.
Partimos de 𝑃 (−𝑧𝛼 ≤ 𝑍 ≤ 𝑧𝛼 ) = 1 − 𝛼
2 2
De aquí que si deseamos buscar cual es el tamaño de una muestra para tener un error menor que
𝑧𝛼/2 2
un valor e tenemos que 𝑛 = ( )
𝑒
Sabemos que la variable aleatoria T tiene una distribución t con v=n-1 grado de libertad.
𝑃 (−𝑡𝛼 ≤ 𝑇 ≤ 𝑡𝛼 ) = 1 − 𝛼
2 2
de donde
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼 ) = 1 − 𝛼
√𝑛 2 √𝑛 2
Tengamos en cuenta, que la distribución t se supone extraída de una población normal, en el caso
en que la población no fuera normal, la muestra debería ser mayor a 30, para lograr una buena
aproximación.
Para encontras t sub alfa sobre 2 se hace 1 menos alfa sobre dos. y se busca en la tabla el valor
correspondiente.
Dos muestras: estimación de la diferencia de medias.
Si se conoce, se estima el intervalo utilizando una distribución normal para encontrar el intervalo
de confianza.