Académique Documents
Professionnel Documents
Culture Documents
La probabilidad es, en realidad, un valor numérico que debe cumplir con ciertas
condiciones o propiedades matemáticas y que se asocia a un evento o suceso
determinado para expresar el grado de confianza en la verificación futura de dicho
evento.
Evento o Suceso
Tipos de Eventos:
Nota: P(E), se lee probabilidad del evento E
ii) Probabilidad teórica.- Si todos los resultados en un espacio muestral S finito son
igualmente probables, y E es un evento en ese espacio muestral, entonces la
probabilidad teórica del evento E está dada por la siguiente fórmula, que a veces
se le denomina la definición clásica de la probabilidad, expuesta por Pierre Laplace
en su famosa Teoría analítica de la probabilidad publicada en 1812:
G) POSIBILIDADES.- Las posibilidades comparan el número de resultados
favorables con el número de resultados desfavorables. Si todos los resultados de
un espacio muestral son igualmente probables, y un número n de ellos son
favorables al evento E, y los restantes m son desfavorables a E, entonces las
posibilidades a favor de E sonde de n(E) a m(E), y las posibilidades en contra de E
son de m(E) a n(E)
Ejemplos ilustrativos: Mathías se le prometió comprar 6 libros, tres de los cuales
son de Matemática. Si tiene las mismas oportunidades de obtener cualquiera de
los 6 libros, determinar las posibilidades de que le compren uno de Matemática.
Solución:
Número de resultados favorables = n(E) = 3
Número de resultados desfavorables = m(E) = 3
Posibilidades a favor son n(E) a m(E), entonces,
Posibilidades a favor = 3 a 3, y simplificando 1 a 1.
Nota: A las posibilidades de 1 a 1 se les conoce como "igualdad de posibilidades" o
"posibilidades de 50-50"
Son aquellas en las que la función de distribución es una función continua. Se corresponde
con el primer tipo de gráfica visto.
Diremos que una variable aleatoria X continua tiene una distribución absolutamente
continua si existe una función real f, positiva e integrable en el conjunto de números
reales, tal que la función de distribución F de X se puede expresar como
Hay que hacer notar que no toda variable continua es absolutamente continua, pero los
ejemplos son complicados, algunos utilizan para su construcción el conjunto de Cantor, y
quedan fuera del nivel y del objetivo de este curso.
Tal como se estudiará más adelante, existen algunas familias de funciones de distribución,
tanto dentro del grupo de las discretas como de las continuas, que por su importancia
reciben un nombre propio y se estudiarán en los capítulos siguientes.
Las v.a permiten definir la probabilidad como una función numérica (de variable real) en
lugar de como una función de conjunto como se había definido antes
Ejemplo 3: Tiramos una moneda 3 veces. Representamos cara por c y cruz por z.
Imagínate que quieres estudiar la altura de las personas de una población de una gran
ciudad. La variable numérica es la altura de las personas en cm.
Así que decides encuestar a 100 personas al azar (es decir escoges una muestra aleatoria)
y miras el histograma de densidad. (Recuerda que el de densidad significa que la suma de
las áreas del histograma suma 1)
Pero ves que aún no te queda claro como se distribuyen las alturas de las personas. Crees
que son pocas las personas que has encuestado. Te sientes con energía y encuestas a
1000 personas. Y pintas el histograma de densidad.
Buff… Empiezas a intuir cómo de distribuye tu variable numérica pero eres ambicioso.
Contrastas a 10 personas para hace la encuesta a 1000 personas cada. En total tienes una
muestra de 10.000 personas. Y pintas el histograma de densidad.
Fíjate como cada vez la distribución de tu variable es cada vez más suave y puedes intuir
mejor como es la forma de la distribución. De hecho, de la densidad de la distribución.
Imagínate que res capaz de obtener los valores de la altura de 100.000 personas. Y pintas
el histograma de densidad.
Ahora puedes ver como eres capaz de un contorno mucho más fino. Podrías dibujar el
contorno fácilmente. ¡Mira esta imagen!
“la función de densidad es precisamente este contorno. es una línea continua que
representa la distribución de densidad de toda la población”
Valor esperado
Sea X una Variable Aleatoria que toma valores en un conjunto discreto (en un
conjunto finito de números en uno infinito como: los naturales, los enteros o los
racionales), por ejemplo si la variable aleatoria X toma los siguientes valores:
La probabilidad de que X tome cada uno de sus valores viene dada por la función
de probabilidad:
como:
−∞
µ = E(X) = ∫ xf (x)dx
∞
Varianza
Se podría usar un argumento parecido para justificar las fórmulas para la varianza
de la población 2 σ y la desviación estándar de la población σ . Estas medidas
numéricas describen la dispersión o variabilidad de la variable aleatoria mediante
el “promedio” o “valor esperado” de las desviaciones cuadráticas de los valores de
x a partir de su media µ .
Distribución normal
Cada uno de los eventos de una variable aleatoria discreta representa eventos
mutuamente excluyentes. Si la variable aleatoria es bivariante entonces los eventos
representados por son eventos mutuamente excluyentes también.
Para ilustrar este hecho consideremos el ejemplo del lanzamiento de los dados. Sabemos
que la probabilidad de que al lanzar solo un dado la probabilidad de cada una de las caras
es de 1/6. Si queremos llegar a este resultado desde la función de distribución tendríamos:
Recordemos que las probabilidades condicionales nos daban una forma de medir la
probabilidad de que pasara un evento dado que conocíamos la ocurrencia de otro evento.
¿Qué pasa si los eventos los describimos a través de variables aleatorias?. En este caso:
Siempre que
Ejemplo
De un grupo de 3 guitarristas, 2 bajistas y 4 bateristas se van a seleccionar 2 músicos para
presentar un show. Denotemos con el número de guitarristas y con el número de
bateristas$. Encontrar la probabilidad de que se seleccione un baterista dado que se
seleccionó un bajista.
Nos permite saber cómo se comporta una variable en función de lo que hace otra
variable. Es decir, cuando X sube ¿Cómo se comporta Y? Así pues, la covarianza puede
tomar los siguiente valores:
Covarianza (X,Y) es menor que cero cuando “X” sube e “Y” baja. Hay una relación
negativa.
Covarianza (X,Y) es mayor que cero cuando “X” sube e “Y” sube. Hay una relación
positiva.
Covarianza (X,Y) es igual que cero cuando “X” sube e “Y” baja. No hay relación existente
entre las variables “X” e “Y”.
Cálculo de la covarianza
El coeficiente de correlación es una medida que determina el grado al que se asocian los
movimientos de dos variables.
Así, el coeficiente de correlación es un número que cuantifica algún tipo de relación y/o
dependencia, es decir, relaciones estadísticas entre dos o más variables aleatorias o
valores de datos observados.
El rango de valores del coeficiente de correlación es de -1.0 a 1.0. Si una correlación
calculada es superior a 1,0 o inferior a -1,0, se ha cometido un error. Una correlación de -
1,0 indica una correlación negativa perfecta, mientras que una correlación de 1,0 indica
una correlación positiva perfecta.
En teoría de probabilidades, se dice que dos sucesos aleatorios son independientes entre
sí cuando la probabilidad de cada uno de ellos no está influida porque el otro suceso
ocurra o no, es decir, cuando ambos sucesos no están relacionados.
ellos, es decir, si
Cuando queremos describir conjuntamente dos variables estadísticas, el primer paso será (al igual
que en el caso de la estadística univariada), representar los datos en una tabla de
frecuencias. Ahora, a cada caso le corresponde no un valor sino dos (uno para cada una de las
variables). Así, en el caso de que intentemos relacionar el peso y la altura de las personas, a cada
persona le asociamos un par de valores (peso, altura).
Los pares de valores así formados constituyen la distribución bidimensional. La tabla de frecuencias
consiste en una tabla de doble entrada en la que se recogen tanto las frecuencias de cada una de
las variables por separado como los pares de puntuaciones que cada caso obtiene en ambas
variables (frecuencia conjunta).
Las puntuaciones pueden aparecer sin agrupar o agrupadas en intervalos, no teniendo por qué ser
el número de intervalos de las dos variables iguales entre sí, así como la amplitud de los mismos.
nj n1 n2 nJ N
Ejemplo
Tabaquismo Yj
Xi Varón 30 50 20 100
Mujer 30 10 10 50
nj 60 60 30 150
Donde:
pij= nij/n
Tabaquismo Yj
Tabaquismo Yj
pj 1 1 1
De los fumadores un 50% son hombres y un 50% son mujeres; de los no fumadores el 83% son
varones, y el 17% son mujeres; de los exfumadores el 67% son varones y el 33% son mujeres.
El objetivo del análisis exploratorio es resumir y visualizar datos de manera que se facilite
la identificación de tendencias o patrones que los subyacen y que son relevantes para
responder alguna pregunta de interés.
En la exploración de datos las técnicas a usar dependen del tipo de variable, el cual está
íntimamente asociado a la escala de medición (Escala Nominal, Escala Ordinal, Escala
Intervalar y Escala de Razón). Para variables cuantitativas se usan medidas resumen tales
como medias, desvíos estándar, mínimos y máximos e histogramas y gráficos de barras,
mientras que para variables cualitativas o categorizadas se usan porcentajes y gráficos de
sectores y de barras apiladas.
Referencias bibliográficas
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo2
/B0C2m1t5.htm
http://www.revistanova.org/index.php?option=com_content&view=article&i
d=57&Itemid=64
https://es.khanacademy.org/math/probability/probability-
geometry/probability-basics/a/probability-the-basics
https://tereom.github.io/est-aplicada-15/03-univariados.html
https://conceptosclaros.com/para-que-sirve-la-funcion-densidad-
probabilidad/
https://www.uv.es/ceaces/tex1t/1%20normal/ngeneral.htm
file:///C:/Users/park/Downloads/Documents/handout5.pdf
https://mangosound.wordpress.com/2017/03/31/distribuciones-de-
probabilidad-marginal-y-condicional/
https://economipedia.com/definiciones/covarianza.html
https://www.enciclopediafinanciera.com/definicion-coeficiente-de-
correlacion.html
https://es.wikipedia.org/wiki/Independencia_(probabilidad)
https://portal.uah.es/portal/page/.../APUNTES-DESCRIPTIVA-TEMA3-4_0.doc
http://www.fca.proed.unc.edu.ar/mod/book/view.php?id=3270
http://www.ub.edu/aplica_infor/spss/cap2-3.htm