Vous êtes sur la page 1sur 15

PROBABILIDAD

Experimento aleatorio
Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda
hacia arriba obtendremos uno de seis resultados posibles. Si repetimos esta acción, puede ocurrir que
obtengamos un resultado diferente del primero. En ese caso, no podremos explicar la diferencia como el
efecto de aplicar procedimientos distintos porque en ambas oportunidades habremos hecho lo mismo. El
procedimiento que consiste en agitar el dado dentro de un cubilete, arrojarlo sobre la mesa y registrar qué
cara queda hacia arriba es un experimento aleatorio, un procedimiento que puede producir diferentes
resultados cada vez que se ejecute.
Definiciones:
Un experimento es una acción o procedimiento preestablecido que produce un resultado que se registra.
Un experimento aleatorio es aquel que no necesariamente produce el mismo resultado cada vez que se
lo lleva a cabo.
No todo experimento es aleatorio. Por ejemplo, el experimento que consiste en calentar agua pura
en un ambiente con presión controlada de exactamente 1 atm y registrar su temperatura cuando comienza
a hervir puede producir un sólo resultado (100ºC). Por eso, este procedimiento no es un experimento
aleatorio. Todo experimento aleatorio tiene su base en procesos físicos que ocurren en algún sistema
material o dispositivo experimental. En el experimento del dado, el dispositivo experimental está formado
por un cubilete, un dado y una mesa, y el proceso físico necesario es generado deliberadamente cuando
agitamos el cubilete. En otros experimentos, estos procesos físicos ocurren naturalmente. Por ejemplo, si
dejamos que una planta heterocigota para un gen que controla el color de las flores se autofecunde,
cultivamos las semillas que produce y registramos la distribución de frecuencias de diferentes colores de
flores entre las plantas hijas, obtendremos uno de muchos resultados posibles. Esto se debe a que los
granos de polen se dispersan y alcanzan los estigmas de las flores como resultado de procesos similares
a la agitación de un dado dentro del cubilete.

Azar e incertidumbre
Cuando un experimento es aleatorio, existe la posibilidad de que produzca diferentes resultados sin que
haya diferencias en el procedimiento. Esta característica del comportamiento del dispositivo experimental
se llama azar. Su existencia en los sistemas macroscópicos se explica por los accidentes o casualidades,
esto es, por encuentros entre procesos con causas independientes. Una multitud de accidentes como los
que ocurren cuando se agita un dado o cuando se dispersa el polen provoca la variabilidad azarosa en los
resultados de muchos experimentos aleatorios. El azar es esencial en la inferencia estadística porque es
la base de la generación de datos apropiados.
Como un experimento aleatorio puede dar diferentes resultados, tenemos incertidumbre acerca de
qué resultado producirá la próxima vez que se ejecute. Sin embargo, lo que distingue a un experimento
aleatorio no es el carácter incierto sino el carácter azaroso de sus resultados. Mientras el azar es una
propiedad objetiva del comportamiento de un sistema material, la incertidumbre es el estado de conciencia
que alguien experimenta en relación con algo que ignora total o parcialmente, se trate o no del resultado
que dará un experimento aleatorio. La incertidumbre varía entre personas que tienen diferente información
o diferente capacidad para interpretarla.
El azar provoca incertidumbre pero la incertidumbre no es privativa del azar. Por ejemplo, tenemos
incertidumbre acerca del número que saldrá la próxima vez que tiremos el dado porque se trata de un
experimento aleatorio (con resultados azarosos). En cambio, si tenemos incertidumbre acerca de la edad
que tiene hoy la profesora de estadística es porque nos falta información sobre su fecha de nacimiento.

1
Espacio muestral y eventos
El conjunto de todos los resultados elementales que puede producir un experimento aleatorio se denomina
espacio muestral. Por ejemplo, el espacio muestral del experimento del dado es el conjunto S = {1, 2, 3,
4, 5, 6}. Se denomina evento simple a cualquier subconjunto de S que contenga un solo resultado y evento
compuesto a cualquiera que contenga más de uno. Por ejemplo, en S podemos reconocer los eventos
compuestos A = {1, 3, 5}, “que salga un número impar”, B = {2, 4, 6}, “que salga un número par”, o C = {1,
2, 3}, “que salga número menor que 4” (Figura 2.1).
Figura 2.1. Representación en un diagrama de Venn del espacio
muestral del experimento aleatorio que consiste en agitar un
dado en un cubilete, arrojarlo sobre una mesa y registrar qué
cara queda hacia arriba. Los resultados elementales son 1, 2, 3,
4, 5 y 6. Dentro del espacio muestral S podemos definir, por
ejemplo, los eventos compuestos A, número impar, B, número
par y C, número menor que 4. Los eventos A y B son
mutuamente excluyentes y complementarios. Los eventos A y C
no son mutuamente excluyentes, tampoco lo son los eventos B
y C.

Unión e intersección entre eventos


Todo evento compuesto constituye la unión de otros eventos. Por ejemplo, el evento “que no salga el 5”
es {1, 2, 3, 4, 6} = 𝐵 ∪ 𝐶, la unión del evento B con el evento C (Figura 2.1). El evento 𝐵 ∪ 𝐶 ocurre si
ocurre el evento B o el evento C.
Algunos eventos constituyen la intersección de otros eventos. El evento “que salga el 2” es {2} =
𝐵 ∩ 𝐶, la intersección entre los eventos B y C (Figura 2.1). El evento 𝐵 ∩ 𝐶 ocurre sólo si ocurren
conjuntamente los eventos B y C.

Eventos mutuamente excluyentes, partición, eventos


complementarios
Dos o más eventos son mutuamente excluyentes (o incompatibles) si no pueden ocurrir como resultado
de una misma ejecución del experimento aleatorio. Por ejemplo, los eventos A y B son mutuamente
excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir un número
que sea impar y también par, pero sí puede salir un número que sea par y también menor que cuatro (el
2). En particular, todos los eventos simples son siempre mutuamente excluyentes. Por ejemplo, si se agita
y tira el dado una vez es imposible que salga el 1 y también el 3. La intersección entre eventos mutuamente
excluyentes es siempre el conjunto vacío, por ejemplo A ∩ B= ∅ (Figura 2.1). Una partición del espacio
muestral consiste en dos o más eventos mutuamente excluyentes cuya unión es igual a S.
Dos eventos son complementarios si definen una partición (son mutuamente excluyentes y su
unión es igual al espacio muestral). Por ejemplo, los eventos A y B son complementarios porque A ∩ B= ∅
y A ∪ B= S (Figura 2.1). Dado un evento cualquiera E, denotaremos a su evento complementario como Ec,
por ejemplo B = Ac.

Experimento aleatorio y realización


Como vimos, un experimento aleatorio es un procedimiento que puede producir diferentes resultados. Sin
embargo, esta posibilidad sólo existe mientras el experimento no ha sido ejecutado. Una vez que el
experimento ha sido ejecutado, el resultado que se obtiene queda fijo y no cabe la posibilidad de que sea
otro. Un resultado producido en una ejecución del experimento aleatorio se denomina una realización de
dicho experimento. Un triste ejemplo de la diferencia entre un experimento aleatorio y su realización es el
que me tocó vivir luego de un sorteo del Gordo de Navidad. Poco antes había comprado un billete con el
número 16.354, decididamente uno de los posibles resultados del sorteo. Mi número pertenecía al espacio

2
muestral del experimento aleatorio que se realizaría y yo me ilusionaba con ganar el Gordo. Cuando salió
el 66.190, debí abandonar mi ilusión definitivamente. Podía tirar mi billete a la basura. El 66.190 es la
realización de aquel experimento y como tal es fija e irrevocable.

Muestreo aleatorio
Consideremos el caso de un equipo de ingenieros agrónomos y licenciados en ciencias ambientales que
se propone estimar las frecuencias relativas de establecimientos con modalidades de explotación ganadera,
agrícola-ganadera, agrícola y otra en un área rural que contiene un total de 2719 establecimientos. Para
realizar esta inferencia estadística, elegirán al azar (esto es por sorteo p.ej. con un bolillero) 100
establecimientos y registrarán cuál de las cuatro modalidades de explotación se lleva a cabo en cada uno.
Este procedimiento se denomina muestreo aleatorio. En este caso, con el muestreo los profesionales
generarán datos de las frecuencias relativas de diferentes modalidades entre los 100 establecimientos que
servirán como estimaciones de las correspondientes frecuencias en los 2719 establecimientos del área.
En este muestreo aleatorio, el conjunto de los 2719 establecimientos constituye la población de
referencia, cada uno de los establecimientos es una unidad muestral, el subconjunto de la población
formado por los 100 establecimientos a elegir al azar es una muestra aleatoria, el número n  100 de
establecimientos a elegir es el tamaño de la muestra y la modalidad de explotación es la variable de
interés. Como los establecimientos serán elegidos por sorteo y no todos los establecimientos del distrito
tienen igual modalidad de explotación, será posible registrar diferentes modalidades en cada
establecimiento a elegir. Es decir que la obtención de la información correspondiente a cada unidad
muestral es un experimento aleatorio. En este caso, el espacio muestral del experimento aleatorio es
S = {exclusivamente ganadera, agrícola-ganadera, exclusivamente agrícola, otra}. A su vez, la serie de 100
selecciones aleatorias necesaria para completar la muestra aleatoria constituye un experimento aleatorio
en sí mismo ya que puede dar diferentes resultados que son las diferentes secuencias de modalidades de
explotación que pueden registrarse cuando se ejecute.

Probabilidad
Como vimos, todo experimento aleatorio ocurre en algún dispositivo experimental, un sistema material que,
cada vez que se acciona, produce uno de los resultados pertenecientes al espacio muestral del
experimento. Ese dispositivo tiene cierto potencial o disposición para producir cada uno de los diferentes
eventos que se pueden definir dentro de dicho espacio. Llamaremos probabilidad de un evento particular
al potencial o disposición que el dispositivo experimental tiene para producirlo. Esta es la acepción realista
de la palabra probabilidad; alude a una propiedad física de un sistema material. Por ejemplo, si decimos
que la probabilidad de que salga un número menor que cuatro en el experimento del dado es mayor que la
probabilidad de que salga un número mayor que cuatro, afirmamos que el dispositivo experimental formado
por el cubilete, el dado y la mesa tiene mayor potencial para producir el evento C = {1, 2, 3} que el evento
D = {5, 6}. Esta afirmación podrá ser cierta o falsa según a qué cubilete, dado y mesa se refiera. En el
contexto de la inferencia estadística, cada vez que usemos la palabra probabilidad nos referiremos
estrictamente a su acepción realista.

Probabilidad en el lenguaje vulgar y probabilidad en inferencia estadística


Es importante distinguir el estrecho significado que la palabra probabilidad tiene en inferencia estadística
de su laxo significado en el lenguaje vulgar. En el lenguaje vulgar la palabra probabilidad se asocia con
nuestra incertidumbre, provenga ésta del azar o simplemente de nuestra falta de información o
comprensión. Por ejemplo, si decimos que probablemente llueva, nos referimos al comportamiento azaroso
de la atmósfera, pero si decimos que probablemente haya llovido, manifestamos nuestra falta de
información acerca de si llovió o no. Esta doble acepción de la palabra probabilidad es admisible en el
lenguaje vulgar porque resulta comprensible, pero no lo es en el contexto de la inferencia estadística que
presentamos aquí, en el cual sólo es válida la acepción realista que vincula probabilidad estrictamente con
azar.

3
Probabilidad y frecuencia relativa
Según la acepción realista de la palabra, la probabilidad del evento C designa una propiedad física real del
dispositivo experimental formado por el cubilete, el dado y la mesa; se trata de un potencial que este
dispositivo experimental tiene aun cuando no es accionado. Cuando el dispositivo experimental es
accionado muchas veces ese potencial se manifiesta como la frecuencia relativa con que ocurre en evento
C. Si un evento C es más probable que un evento D, el evento C debe ocurrir más frecuentemente que el
evento D en una serie suficientemente larga de repeticiones del experimento aleatorio. Por eso, la medida
de la probabilidad de un evento debe cumplir reglas consistentes con las propiedades de las frecuencias
relativas. Estas reglas son estipuladas por la definición axiomática de probabilidad.

Definición axiomática de probabilidad


Consideremos espacio muestral S de un experimento aleatorio. Definimos aquí la probabilidad como una
función P que asocia un número real a cada evento incluido en el espacio muestral S y que satisface los
siguientes axiomas o proposiciones que damos por ciertas sin demostración:
Axioma I
Para cualquier evento A incluido en S,
𝑃[𝐴] ≥ 0 (2.1)
Axioma II
La probabilidad de que ocurra el evento S es,
𝑃[𝑆] = 1 (2.2)
Axioma III
Si A, B, C, … son eventos mutuamente excluyentes incluidos en S, entonces la probabilidad de que
ocurra alguno de ellos, esto es la probabilidad de su unión, es,
𝑃[𝐴 ∪ 𝐵 ∪ 𝐶 ∪ … ] = 𝑃[𝐴] + 𝑃[𝐵] + 𝑃[𝐶] + ⋯ (2.3)

Propiedades derivadas
Propiedad I
Si A es un evento incluido en S, la probabilidad de su evento complemento Ac es,
𝑃[𝐴𝑐 ] = 1 − 𝑃[𝐴] (2.4)
Consecuencia de la definición de evento complementario y los Axiomas II y III (ver Figura 2.1).
Propiedad II
La probabilidad del evento conjunto vacío es 0.
𝑃[∅] = 0 (2.5)
Consecuencia de Axioma II y la Propiedad I.
Propiedad III
Si A y C son dos eventos cualesquiera incluidos en S, la probabilidad de que ocurra uno o el otro, es decir
la probabilidad de su unión, es,
𝑃[𝐴 ∪ 𝐶] = 𝑃[𝐴] + 𝑃[𝐶] − 𝑃[𝐴 ∩ 𝐶] (2.6)
Consecuencia del Axioma III (ver Figura 2.1).

Asignación de valores de probabilidad


Dado que la probabilidad de un evento se manifiesta como la frecuencia relativa con que éste ocurre,
cuando el experimento aleatorio que lo produce se repite muchas veces, el valor que asignamos a su
probabilidad es el de dicha frecuencia relativa. Sin embargo, dependiendo de las características del

4
experimento aleatorio, se pueden usar dos criterios para asignar los valores a las probabilidades de
diferentes eventos.
Resultados elementales equiprobables
Existen experimentos aleatorios para los cuales asignar igual probabilidad a todos los resultados
elementales constituye un criterio razonable. Por ejemplo, en el experimento del dado, si se agita bien el
cubilete y el dado está balanceado, es razonable asignar igual probabilidad a los seis resultados
elementales posibles. En ese caso, asignaremos probabilidad de 1/6 a cada evento simple correspondiente
(por Axiomas II y III).
Si el espacio muestral S de un experimento aleatorio abarca un número finito k de resultados elementales de
modo que S = {Q1, Q2, …, Qk} y los k resultados son igualmente probables, entonces el valor que asignamos a la
probabilidad de cada resultado Qi es,
1
𝑃[𝑄𝑖 ] = , para todo 𝑖 = 1, … , 𝑘 (2.7)
𝑘
En consecuencia, cuando es razonable asignar igual probabilidad a todos los resultados elementales, la
probabilidad de un evento A incluido en S se calcula como el cociente entre h, el número de resultados
elementales que pertenecen a dicho evento, y k, el total de resultados elementales en S (por Axioma III).

𝑃[𝐴] = (2.8)
𝑘
Por ejemplo, en el experimento del dado balanceado, es razonable asignar al evento D = {5, 6},
“que salga un número mayor que 4”, la probabilidad,
2
𝑃[𝐷] =
6
Este criterio para asignar probabilidades es muy importante para la inferencia estadística porque
se vincula con el muestreo aleatorio. Por ejemplo, para obtener la muestra aleatoria de 100
establecimientos de la población de referencia formada por los 2719 establecimientos de un área rural, se
utiliza un dispositivo (p.ej. un bolillero bien construido) que razonablemente justifica asignar igual
probabilidad a que cualquiera de los 2719 establecimientos de la población de referencia resulte sorteado.
Por esa razón, si definimos al evento compuesto G como la selección de un establecimiento que realiza
ganadería, se justifica asignar a P[G] el valor de la frecuencia relativa de establecimientos que realizan
ganadería, es decir de aquellos con modalidades exclusivamente ganadera y agrícola-ganadera en la
población de referencia.
Resultados elementales con diferente probabilidad
A diferencia del dado bien balanceado y del bolillero bien construido, existen dispositivos experimentales
que evidentemente tienen diferente potencial para producir los distintos resultados. Por ejemplo, si dejamos
caer una tostada untada con mermelada y registramos qué cara queda hacia el piso realizamos un
experimento aleatorio a cuyo espacio muestral pertenecen dos resultados elementales cuyas
probabilidades son muy diferentes… como muchos hemos lamentado alguna vez.
Dado que la probabilidad de un resultado cualquiera debe manifestarse como su frecuencia
relativa en muchas repeticiones del experimento aleatorio, la aproximación realista a la medida de la
probabilidad de un resultado Q es el valor en el cual se estabiliza la frecuencia relativa de Q cuando el
experimento aleatorio se repite un número suficiente de veces.
Si el resultado Q perteneciente al espacio muestral S de un experimento aleatorio, el valor que asignamos a la
probabilidad de Q es,
𝑚
𝑃[𝑄] = (2.9)
𝑛
donde m es la frecuencia absoluta de Q en n repeticiones del experimento, y n es suficiente como para que el
cociente m / n se estabilice razonablemente.
Este criterio tiene precedencia sobre la ecuación 2.8. Por ejemplo, si la frecuencia relativa con que
sale el 2 en muchas repeticiones del experimento del dado se aparta notablemente de 1/6, concluimos que
el dado no está balanceado y por eso no corresponde usar la fórmula 2.8. El valor que asignamos entonces
a la probabilidad de dicho resultado no es 1/6 sino el de la frecuencia relativa observada, como estipula la

5
fórmula 2.9. Además, como la probabilidad de un evento E es la suma de las probabilidades de los
resultados elementales que contiene (Axioma III), el valor que asignamos a la probabilidad de E es aquel
en el cual se estabiliza su frecuencia relativa en una serie suficientemente larga de ejecuciones del
experimento.
Este criterio es el que da significado a cualquier afirmación particular sobre la probabilidad de un
evento. Por ejemplo, si se dice que la probabilidad de que el Glifosato mate una planta de una maleza es
0,97, es correcto interpretar que se afirma que el Glifosato tiene un potencial para matar las plantas de esa
maleza que se manifestará como una frecuencia relativa de plantas muertas cercana a 0,97 cuando se
aplique a muchas plantas. De modo similar, si se afirma que la probabilidad de que la aplicación de Glifosato
en un lote agrícola de una cuenca contribuya a la contaminación del curso de agua es de 0,66, es correcto
interpretar que se afirma que si se aplica Glifosato en un número suficiente de lotes de la cuenca, la
frecuencia relativa de aplicaciones que contribuirán a la contaminación del curso de agua se aproximará a
0,66. Además, esta interpretación es la que corresponde a los riesgos de error que se controlan en la
inferencia estadística. Por ejemplo, supongamos que para investigar la estructura del paisaje de un área
rural se usará un procedimiento de inferencia estadística que preestablece que la probabilidad de cometer
un error peor que ± 0,1 en la estimación de la proporción de establecimientos ganaderos es de 0,05. En
ese caso, es correcto interpretar que, si ese procedimiento se repitiera un número suficiente de veces, la
frecuencia relativa de estimaciones que se apartaran en más que 0,1 de la verdadera proporción de
establecimientos ganaderos entre los 2719 establecimientos del distrito debería ser 0,05 (5%).

Probabilidad conjunta
Los profesionales que investigan la estructura del paisaje en un área rural elegirán establecimientos al azar
(por sorteo) y registrarán su modalidad de explotación. En cada establecimiento elegido, obtendrán dos
piezas separadas de información: ¿se realiza ganadería? y ¿se realiza agricultura? Con las respuestas a
estas dos preguntas, clasificarán cada establecimiento en una de las cuatro modalidades que constituyen
los resultados elementales pertenecientes al espacio muestral S = {exclusivamente ganadera, agrícola-
ganadera, exclusivamente agrícola, otra}. En este espacio muestral, cada respuesta posible a una de las
preguntas determina un evento compuesto y el evento simple que contiene cada resultado elemental es la
intersección (ocurrencia conjunta) de dos eventos compuestos. Por ejemplo, el evento {agrícola-ganadera}
es la intersección de los eventos A “se realiza agricultura” y G “se realiza ganadería” (Figura 2.2).
Figura 2.2. Espacio muestral del experimento aleatorio
que consiste en elegir al azar un establecimiento dentro
de un área rural y registrar su modalidad de explotación.
S, espacio muestral; G, evento compuesto “se realiza
ganadería”; A, evento compuesto “se realiza agricultura”,
Gc y Ac son los correspondientes complementos.

En este caso, resulta útil escribir el espacio muestral mediante una tabla de doble entrada (Cuadro
2.1). En la celdas de cada margen aparecen los eventos mutuamente excluyentes de dos particiones
diferentes del espacio del espacio muestral y en las celdas interiores aparecen los eventos que constituyen
sus correspondientes intersecciones (que en este ejemplo corresponden a eventos simples).

6
Figura 2.1. Tabla de doble entrada para representar particiones útiles del espacio muestral del experimento
aleatorio que consiste en elegir al azar un establecimiento en un área rural y registrar su modalidad de
explotación en una.
Agricultura
Sí No
exclusivamente G = se realiza
Sí agrícola-ganadera
ganadera ganadería
Ganadería
exclusivamente Gc =no se realiza
No otra
agrícola ganadería
Ac = no se realiza
A = se realiza agricultura S
agricultura
La probabilidad de la intersección entre dos (o más) eventos se llama probabilidad conjunta
porque constituye la probabilidad de que dichos eventos ocurran conjuntamente en una realización del
experimento aleatorio. Por ejemplo, la probabilidad de cada evento simple correspondiente a uno de los
resultados elementales representados en la tabla de la Cuadro 2.1 es una probabilidad conjunta.
Definición:
Sean los eventos A, B, C,… incluidos en el espacio muestral S, llamamos probabilidad conjunta de
A, B, C,… a la probabilidad del evento definido como su intersección.
𝑃[𝐴 ∩ 𝐵 ∩ 𝐶 ∩ … ] (2.10)

La tabla de doble entrada se puede usar para presentar la distribución de frecuencias observadas
o las probabilidades. Por ejemplo, las probabilidades correspondientes al experimento aleatorio de sortear
un establecimiento de un área rural y registrar su modalidad de explotación podrían ser las que se muestran
en la Cuadro 2.2.
Cuadro 2.2. Tabla de doble entrada con la distribución de probabilidad en el espacio muestral del
experimento aleatorio que consiste en elegir al azar un establecimiento en un área rural y registrar su
modalidad de explotación en una.
Agricultura
Sí No
Sí 0,24 0,33 0,57
Ganadería
No 0,42 0,01 0,43
0,66 0,34 1,00
En la tabla leemos que la probabilidad conjunta de los eventos A, “se realiza agricultura” y G,
“se realiza ganadería”, el evento simple “agrícola-ganadera” es 0,24 (Cuadro 2.2). Usando la fórmula 2.10
escribimos,
𝑃[𝐴 ∩ 𝐺] = 0,24
También leemos que la probabilidad del evento compuesto “se realiza ganadería” (se realice o no
agricultura) es 0,57. Esta probabilidad es igual a la suma de las probabilidades de los eventos simples
mutuamente excluyentes que incluye,
𝑃[𝐺] = 𝑃[𝐴 ∩ 𝐺] + 𝑃[𝐴𝑐 ∩ 𝐺]
= 0,24 + 0,33
= 0,57
Notemos además que la suma de todas las probabilidades conjuntas es 𝑃[𝑆] = 1.

Probabilidad condicional
El potencial de un dispositivo experimental para producir un evento B puede variar según el experimento
produzca o no un evento A. Por ejemplo, si el dispositivo experimental está formado por un árbol y su
entorno, la probabilidad de que una semilla de dicho árbol llegue a germinar puede variar según ésta caiga
cerca o lejos del árbol. En ese caso, diríamos que la probabilidad de que una semilla germine (evento B)

7
bajo la condición de que caiga cerca del árbol (evento A) es diferente de la probabilidad de que germine
bajo la condición de que caiga lejos del árbol (evento Ac). Cada una de estas probabilidades es una
probabilidad condicional. Para denotar la probabilidad del evento aleatorio B condicional a la ocurrencia
del evento aleatorio A, escribiremos 𝑃[𝐵|𝐴] y lo leeremos “probabilidad de B si ocurre A” o más
brevemente “probabilidad de B dado A”.
La probabilidad de B dado A es un potencial del dispositivo experimental que se manifiesta como
la frecuencia relativa con que ocurre el evento B entre muchas repeticiones del experimento aleatorio en
las que ocurre el evento A. Esta frecuencia relativa se puede calcular como el cociente entre las frecuencias
relativas del evento A ∩ B y del evento A, es decir como el valor que asignamos a la probabilidad conjunta
de A y B dividido por el valor que asignamos a la probabilidad de A. Por eso,

Si A y B son dos eventos aleatorios incluidos en el espacio muestral S y P[A] > 0, entonces la probabilidad de B
dado A se calcula como,

𝑃[𝐴 ∩ 𝐵]
𝑃[𝐵|𝐴] = (2.11)
𝑃[𝐴]

Es decir que la probabilidad condicional se calcula como el cociente entre la probabilidad conjunta de los dos
eventos y la probabilidad del evento impuesto como condición.
Es importante notar que, si en lugar 𝑃[𝐵|𝐴] nos interesa 𝑃[𝐴|𝐵], debemos calcular,
𝑃[𝐴 ∩ 𝐵]
𝑃[𝐴|𝐵] =
𝑃[𝐵]
Notar que la diferencia entre 𝑃[𝐵|𝐴] y 𝑃[𝐴|𝐵] está en el denominador del cociente que, en cada caso, es la probabilidad
del evento impuesto como condición.
La fórmula 2.11 implica que la probabilidad conjunta de dos eventos aleatorios A y B se puede escribir como,
𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵|𝐴] (2.12)

En la investigación sobre la estructura del paisaje de un área rural, una pregunta importante que
los profesionales se formulan de antemano es cuánto vale la probabilidad condicional de sortear un
establecimiento que realiza ganadería dado que realiza agricultura. A partir de las probabilidades que
figuran en la tabla del Cuadro 2.2, calculamos el valor de esta probabilidad condicional como,
𝑃[𝐴 ∩ 𝐺] 0,24
𝑃[𝐺|𝐴] = = = 0,36
𝑃[𝐴] 0,66
Como el sorteo se realizará con un dispositivo que asegura igual probabilidad de seleccionar
cualquier establecimiento del distrito, los profesionales entienden que el valor de esta probabilidad
condicional coincide con el de la frecuencia relativa de establecimientos que realizan ganadería entre
aquellos que realizan agricultura dentro del área.
Notemos que, en este caso, la probabilidad condicional de sortear un establecimiento que realiza
ganadería dado que realiza agricultura es menor que la probabilidad sortear un establecimiento que realiza
ganadería sin imponer ninguna condición,
P[𝐺] = 0,57.
Es decir que, en este caso, la probabilidad de sortear un establecimiento que realiza ganadería
dado que también realiza agricultura es menor que la probabilidad de sortear un establecimiento que realiza
ganadería, realice o no agricultura. Esta diferencia cobrará especial significado en la próxima sección
referida a la independencia estadística.
Ley de probabilidad total y regla de Bayes
La noción de probabilidad condicional es la base de dos reglas conocidas que tienen cierta utilidad para el cálculo de
probabilidades.
Dados los eventos aleatorios A y B pertenecientes al espacio muestral S de un experimento aleatorio, se cumple que:

𝑃[𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵|𝐴] + 𝑃[𝐴𝑐 ] ∙ 𝑃[𝐵|𝐴𝑐 ] (2.13)

8
Esta igualdad, consecuencia de Axioma III y la ecuación 2.12, se conoce con el nombre de ley de probabilidad total.
Además,

𝑃[𝐴] ∙ 𝑃[𝐵|𝐴]
𝑃[𝐴|𝐵] = (2.14)
𝑃[𝐵]
Esta igualdad, consecuencia de las ecuaciones 2.11 y 2.12, se conoce como regla de Bayes.

Independencia estadística
Si el valor de la probabilidad de que una semilla germine difiere según ésta caiga cerca o lejos del árbol
progenitor, se hace evidente cierta forma de dependencia entre el evento B, “que la semilla germine” y el
evento A, “que caiga cerca del árbol”. En ese caso, diremos que, por alguna razón, la probabilidad de que
una semilla germine depende de dónde ésta caiga. Si en cambio la probabilidad de que una semilla germine
(evento B) tiene igual valor caiga ésta cerca (evento A) o lejos (evento Ac) del árbol progenitor decimos que
los eventos B y A son estadísticamente independientes.
Definición:
Los eventos aleatorios A y B incluidos en el espacio muestral S son estadísticamente independientes
si se cumple que,
𝑃[𝐵|𝐴] = 𝑃[𝐵|𝐴𝑐 ] (2.15)
Es decir que los eventos A y B son estadísticamente independientes si la probabilidad de B dado A es
igual a la probabilidad de B dado el evento complementario de A.
Si los eventos A y B son estadísticamente independientes, también lo son los eventos Ac y B, A y Bc y
Ac y Bc.

Si A y B son eventos estadísticamente independientes: (1) la probabilidad de B dado A es igual a la


probabilidad de B y (2) la probabilidad conjunta de A y B es igual al producto de sus probabilidades.
La independencia estadística entre dos eventos tiene dos consecuencias que permiten reconocerla. La
primera es que si dos eventos A y B son estadísticamente independientes, entonces la probabilidad
condicional del evento B dado A tiene igual valor que la probabilidad de B,

𝑃[𝐵|𝐴] = 𝑃[𝐵] (2.16)

La segunda consecuencia es que, si dos eventos A y B son estadísticamente independientes,


entonces la probabilidad de que ocurran conjuntamente tiene igual valor que el producto de sus
probabilidades,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵] (2.17)

Las probabilidades que aparecen en la tabla del Cuadro 2.2 implican que en en el área rural en
cuestión, el valor de la probabilidad condicional de sortear un establecimiento que realiza ganadería dado
que realiza agricultura es, como ya vimos,
𝑃[𝐴 ∩ 𝐺] 0,24
𝑃[𝐺|𝐴] = = = 0,36
𝑃[𝐴] 0,66
mientras el valor de la probabilidad condicional de sortear un establecimiento que realiza ganadería dado
que no realiza agricultura es mucho mayor.
𝑃[𝐴𝑐 ∩ 𝐺] 0,33
𝑃[𝐺|𝐴𝑐 ] = = = 0,97
𝑃[𝐴𝑐 ] 0,34
Es decir que, según la definición 2.15, los eventos G, “realiza ganadería”, y A, “realiza agricultura” no son
estadísticamente independientes en este caso.
9
La dependencia estadística entre estos eventos se pone también en evidencia cuando se
comprueba que el valor de 𝑃[𝐺|𝐴] no es igual que el de 𝑃[𝐺], la probabilidad de sortear un
establecimiento que realiza ganadería realice o no agricultura (ecuación 2.16). Como ya calculamos,
𝑃[𝐺|𝐴] = 0,36 ≠ 0,57 = 𝑃[𝐺]
La tercera manera de establecer que G y A no son estadísticamente independientes es comparar
su probabilidad conjunta con el producto de sus probabilidades (ecuación 2.17),
𝑃[𝐴 ∩ 𝐺] = 0,24
𝑃[𝐴]. 𝑃[𝐺] = 0,66 ∙ 0.57 = 0,38
y comprobar que 𝑃[𝐴 ∩ 𝐺] ≠ 𝑃[𝐴] ∙ 𝑃[𝐺]. En el capítulo 7 veremos que esta comparación es la que se
usa en inferencia estadística para producir generalizaciones acerca de la posible falta de independencia
entre dos eventos.

Dependencia estadística y causalidad


En el área rural de nuestro ejemplo, la probabilidad de sortear un establecimiento rural donde se realice
ganadería es mucho mayor bajo la condición de que no realice agricultura que bajo la condición de que
realice agricultura. Esto podría deberse a que la introducción de la agricultura en muchos establecimientos
causara la exclusión de la ganadería. Sin embargo, la falta de independencia estadística no alcanza para
demostrar tal conexión causal porque admite otras explicaciones razonables. Por ejemplo, si en área
hubiera establecimientos con tierras aptas para la ganadería pero no para la agricultura, la frecuencia
relativa de establecimientos que realizan ganadería sería mayor entre los que no realizan agricultura que
entre los que realizan agricultura. Esto se reflejaría en una mayor probabilidad de sortear un establecimiento
que realiza ganadería bajo la condición de que no realice agricultura que bajo la condición de que sí realice
agricultura.
En diversos ecosistemas se ha comprobado que, para muchas especies de árboles, la
probabilidad de que una semilla germine es mayor si cae lejos que si cae cerca del árbol progenitor. En
ocasiones, esta falta de independencia estadística puede deberse a que las semillas que caen cerca del
árbol progenitor están más expuestas a hongos patógenos que las que caen lejos. En este caso, existe una
conexión causal entre el evento “que la semilla caiga cerca del árbol” y el evento “que la semilla no germine”.
Sin embargo, la misma diferencia entre probabilidades condicionales podría deberse a que las semillas con
mayor capacidad para germinar (p. ej. más grandes) fueran también las más atractivas para los animales
que las transportan lejos del árbol progenitor. Estos ejemplos demuestran que la sola observación de falta
de independencia estadística entre dos eventos no alcanza para demostrar que exista entre ellos una
conexión causal.

Guía de Lectura
1. ¿Qué es un experimento aleatorio? ¿Cuál es su característica distintiva?
2. ¿A qué nos referimos cuando decimos azar?
3. ¿Qué es la incertidumbre y qué relación guarda con el azar?
4. ¿A qué se llama espacio muestral y a qué se llama evento?
5. ¿Qué es un evento simple y qué es un evento compuesto?
6. ¿Qué son eventos mutuamente excluyentes? ¿Cuál es la intersección entre dos eventos mutuamente
excluyentes?
7. ¿En qué consiste una partición de un espacio muestral S?
8. ¿Qué son eventos complementarios? ¿Cuál es la intersección y cuál es la unión entre dos eventos
complementarios?
9. ¿A qué llamamos realización de un experimento aleatorio? ¿Qué propiedad tiene?
10. ¿Qué experimento aleatorio está involucrado en la obtención de una muestra aleatoria? ¿Qué es
población de referencia? ¿Qué es espacio muestral de ese experimento?
11. ¿Cuál es la acepción realista de la palabra probabilidad que se aplica en la inferencia estadística?

10
12. ¿Qué diferencia existe entre la acepción realista de la palabra probabilidad y su significado en el
lenguaje vulgar?
13. ¿Qué relación guarda la probabilidad con la frecuencia relativa?
14. ¿Cuál es la definición axiomática de la probabilidad? ¿Cuáles son los tres axiomas que incluye?
15. ¿Cuánto vale la probabilidad del evento complementario de cualquier evento A?
16. ¿Cuánto vale la probabilidad del evento conjunto vacío?
17. ¿Cuánto vale la probabilidad de la unión de dos eventos cualesquiera?
18. ¿Qué alternativas existen para asignar valores de probabilidad? ¿Cuál tiene precedencia?
19. ¿Qué aplicación tiene en inferencia estadística la asignación de valores de probabilidad sobre la base
de resultados con igual probabilidad? ¿Cómo se asegura que sea correcto aplicar esta aproximación?
20. ¿Qué papel cumple en inferencia estadística la asignación de valores de probabilidad a partir de
frecuencias relativas en un número suficiente de repeticiones del experimento aleatorio?
21. ¿A qué se denomina probabilidad conjunta?
22. ¿A qué se denomina probabilidad condicional? ¿Cómo se denota? ¿Cómo se calcula?
23. ¿Qué establecen la Ley de Probabilidad Total y la Regla de Bayes?
24. ¿Cómo definimos la independencia estadística entre dos eventos aleatorios?
25. ¿Cómo se puede reconocer la independencia estadística entre dos eventos a partir de sus
probabilidades y de su probabilidad conjunta?
26. ¿Por qué la falta de independencia estadística no es prueba suficiente de conexión causal?

Ejercicios
2.1 Las monedas de 25 centavos tienen de un lado la imagen del cabildo de Buenos Aires (“cara”) y
del otro el número que indica su valor (“ceca”). Todas son de igual tamaño y peso pero algunas son doradas
y otras plateadas. Imaginemos el procedimiento que consiste en arrojar dos monedas de 25 centavos, una
dorada y otra plateada, y registrar qué lado de cada una queda hacia arriba.
a. ¿Por qué el procedimiento descripto es un experimento aleatorio? ¿Cuál es el dispositivo experimental
y cómo se lo acciona?
b. ¿Qué resultados elementales pertenecen al espacio muestral de este experimento aleatorio?
Representar este espacio muestral con un diagrama de Venn.
c. Sobre el diagrama de Venn, señalar un evento compuesto, indicar qué resultados elementales
pertenecen al mismo y cuál es su evento complementario.
d. Señalar el evento “que la moneda dorada quede con “cara” hacia arriba”. ¿Se trata de un evento simple
o compuesto? ¿Por qué?
e. Señalar el evento “no quedan las dos monedas con “cara” hacia arriba”. ¿Se trata de un evento simple
o compuesto? ¿Por qué?
f. Señalar el evento “una de las monedas queda con “cara” hacia arriba y la otra no”. ¿Se trata de un
evento simple o compuesto? ¿Por qué?
g. Señalar dos eventos que no sean mutuamente excluyentes y el evento que constituye su intersección.

2.2 Consideremos nuevamente el experimento aleatorio que consiste en arrojar hacia arriba dos
monedas de 25 centavos, una dorada y otra plateada, y registrar qué lado de cada una queda hacia arriba.
Aceptemos que este experimento se realiza bajo condiciones que permiten asignar igual valor de
probabilidad a todos los resultados elementales que puede producir.
a. Construir una tabla de doble entrada a partir de los valores de las probabilidades de los resultados
elementales.
b. ¿Cuánto vale la probabilidad de que la moneda dorada quede con “cara” hacia arriba?
c. ¿Cuánto vale la probabilidad conjunta de que las dos monedas queden con “cara” hacia arriba?
d. ¿Cuánto vale la probabilidad condicional de que la moneda dorada quede con “cara” hacia arriba si la
moneda plateada también queda con “cara” hacia arriba?

11
e. Comparar los valores de las probabilidades calculadas en los puntos b y d. ¿Qué indica la
comparación?
f. ¿Cuánto vale la probabilidad de que una de las monedas quede con “cara” y la otra con “ceca” hacia
arriba?

2.3 En una investigación sobre la diversificación de la producción agrícola en el distrito de Tiacalín,


un estudiante graduado de la Facultad de Agronomía decide obtener una muestra aleatoria de 50
establecimientos rurales con superficies entre 25 y 500 ha y registrar qué cultivos realizaron en el último
verano. Para ello, numerará los 2198 establecimientos del distrito cuya superficie está en el rango estipulado
y elegirá por sorteo 50 para incluir en la muestra. Luego, pedirá a cada productor que complete una encuesta
en la que deberá consignar cuáles de las siguientes especies fueron cultivadas en su establecimiento en el
último verano: soja, girasol, maíz, sorgo, otro.
a. ¿Cuál es la población de referencia, cuáles son las unidades muestrales y cuál es la muestra?
b. ¿Por qué es correcto decir que el procedimiento que consiste en elegir al azar un establecimiento de la
población de referencia y registrar cuáles cultivos de la lista fueron realizados allí en el último verano
es un experimento aleatorio?
c. Detallar las 32 listas de cultivos estivales que se pueden consignar en cada establecimiento. Se trata
de los resultados que contiene el espacio muestral del experimento aleatorio.
d. ¿Qué resultados pertenecen a los siguientes eventos compuestos?
“en el establecimiento se cultivó soja”
“en el establecimiento se cultivó maíz y girasol”
“en el establecimiento se realizaron exactamente dos cultivos estivales diferentes”
“en el establecimiento se realizaron al menos dos cultivos estivales diferentes”
“en el establecimiento se realizaron más de dos cultivos estivales diferentes”
“en el establecimiento se realizaron menos de cuatro cultivos estivales diferentes”
e. ¿Cuál es el evento complementario del evento “en el establecimiento se realizó más de un cultivo
estival”? ¿Qué eventos simples lo integran?
f. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un
establecimiento a elegir al azar haya cultivado soja en el último verano?
g. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un
establecimiento elegir al azar haya cultivado al menos dos cultivos estivales diferentes en el último
verano?

2.4 Una vez obtenida una muestra aleatoria de 50 establecimientos agropecuarios con superficies entre
25 y 500 ha en un área rural, el estudiante graduado encontró que en todos ellos se había realizado al menos
un cultivo estival, que en 38 de ellos se había cultivado soja y que en 16 la soja era el único cultivo estival.
Además, en 8 de los 12 establecimientos donde no se había cultivado soja se habían cultivado dos o más
especies estivales diferentes.
a. Construir una tabla de doble entrada (llamada tabla de contingencia) con las frecuencias absolutas de
establecimientos de la muestra que habían y que no habían cultivado soja y que habían cultivado una
y más de una especie estival.
b. A partir de la tabla construida en a, confeccionar otra que muestre las correspondientes frecuencias
relativas en la muestra.
Suponiendo que la información de la muestra reflejara fielmente las frecuencias relativas de
establecimientos que han cultivado o no cultivado soja y que han realizado uno o más cultivos estivales en
la población de referencia:
c. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia
haya cultivado soja en el último verano? ¿Qué posición ocupa el valor de esta probabilidad en la tabla
construida en b?
d. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia
haya cultivado solamente soja en el último verano? ¿Se trata de una probabilidad conjunta o
condicional?
e. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia
haya realizado un sólo cultivo estival si ha cultivado soja? ¿Se trata de una probabilidad conjunta o
condicional?

12
f. ¿Los eventos “se ha cultivado soja” y “se ha realizado un único cultivo” serían estadísticamente
independientes? ¿Qué interpretaciones admite la respuesta a esa pregunta?

2.5 En una investigación sobre la regeneración de la palmera yatay (Butia yatay) en el Parque Nacional
El Palmar se marcaron 200 plántulas de palmera elegidas al azar en un área de 4 ha de sabana de palmeras.
Entre las plántulas marcadas, 120 estaban ubicadas bajo la copa de una palmera adulta (a menos de 4 metros
de su base) y 80 estaban ubicadas a más de 4 m de la palmera adulta más cercana. Al cabo de un año, se
comprobó que habían muerto 40 de las plántulas ubicadas bajo la copa de una palmera adulta y 20 de las
restantes. Definamos ahora el experimento aleatorio que consiste en elegir por sorteo una de las 200
plántulas y registrar si estaba o no bajo la copa de una palmera adulta y si sobrevivió o no.
a. ¿Qué resultados perteneces al espacio muestral de este experimento aleatorio?
b. Señalar dos eventos mutuamente excluyentes en dicho espacio muestral. ¿Cuál es la probabilidad de
cada uno? ¿Cuál es la probabilidad de que ocurra uno o el otro?
c. Señalar dos eventos que no sean mutuamente excluyentes. ¿Cuál es la probabilidad de cada uno? ¿Cuál
es su probabilidad conjunta?
d. ¿Cuál es la probabilidad de que la plántula a elegir al azar resulte ser una que estaba bajo la copa de
una palmera adulta?
e. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido?
f. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido, si estaba a más de 4 m de
distancia de la palmera adulta más cercana?
Suponiendo que las probabilidades calculadas a partir de estas 200 plántulas constituyen buenas
aproximaciones a las probabilidades que tienen las plántulas de Butia yatay del Parque Nacional El Palmar
de establecerse y de sobrevivir a diferentes distancias de las palmeras adultas
g. ¿La supervivencia de las plántulas de Butia yatay es estadísticamente independiente de su ubicación
respecto de las palmeras adultas? Justificar la respuesta usando probabilidades condicionales y discutir
su interpretación.

2.6 Se prepara un dispositivo experimental con dos bolilleros bien construidos y una cantidad de
bolillas blancas o rojas, todas esféricas, de igual diámetro, peso y rugosidad. En el primer bolillero se
colocan 96 bolillas blancas y 32 rojas y en el segundo 8 blancas y 56 rojas. Ambos bolilleros girarán
cerrados durante 1 minuto para mezclar bien las bolillas y luego girarán una vez más para sacar una bolilla
de cada uno. Llamaremos A al evento que ocurre cuando “del primer bolillero sale una bolilla roja” y B al
que ocurre cuando “del segundo bolillero sale una bolilla roja”. El dispositivo y el procedimiento descriptos
permiten razonablemente aceptar que los eventos A y B son estadísticamente independientes.
a. ¿Cuál es el evento 𝐴𝑐 ? ¿Cuál es el valor de su probabilidad?
b. ¿Cuál es el evento 𝐴 ∩ 𝐴𝑐 ? ¿Cuál es su probabilidad?
c. ¿Cuál es el evento 𝐴 ∪ 𝐴𝑐 ? ¿Cuál es su probabilidad?
d. ¿A qué intersección corresponde el evento “de ambos bolilleros sale una bolilla roja”? ¿Cuál es su
probabilidad?
e. ¿Cuál es el evento 𝐴𝑐 ∩ 𝐵? ¿Cuál es su probabilidad?
f. ¿A qué intersección corresponde el evento “del primer bolillero sale una bolilla roja y del segundo sale
una bolilla blanca”? ¿Cuál es su probabilidad?
g. ¿A qué unión de eventos corresponde el evento “de un bolillero sale una bolilla blanca y del otro una
bolilla roja? ¿Cuál es su probabilidad?
h. ¿Cuál es el evento (𝐴 ∪ 𝐵)𝑐 ? ¿Cuál es su probabilidad?

2.7 En un bosque subtropical, la probabilidad de que un árbol cualquiera sea derribado por una
tormenta muy fuerte (velocidad del viento >150km /h) es de 0,75 si está colonizado por lianas que agregan
peso y volumen a su copa y de 0,30 si está libre de lianas. Además, la probabilidad de que un árbol a tomar
al azar de este bosque esté colonizado por lianas es de 0,40.
a. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque esté colonizado por lianas
y además sea derribado por una tormenta fuerte? ¿Se trata de una probabilidad conjunta o condicional?
b. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque sea derribado por una
tormenta fuerte?

13
c. ¿Cómo se interpretan los valores calculados en los ítems a y b en términos del criterio presentado en
la ecuación 2.9?
d. ¿La caída de un árbol de este bosque por acción una tormenta fuerte es estadísticamente independiente
de la presencia de lianas en su copa? Justificar la respuesta con un cálculo apropiado y discutir su
interpretación.

2.8 Consideremos un árbol cuyas semillas caen todas bajo su copa. Estas semillas tienen una
probabilidad de morir por acción de organismos patógenos o depredadores igual a 0,6, una probabilidad de
ser enterradas y germinar in situ igual a 0,1 y una probabilidad de ser transportadas por animales a sitios
alejados del árbol igual a 0,3. Si llegan a los sitios alejados, las semillas tienen una probabilidad igual a 0,4
de ser enterradas y germinar.
a. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar no sea transportada a un
sitio alejado del mismo?
b. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar germine en un sitio
alejado del mismo? ¿y en un sitio ubicado bajo la copa del árbol?
c. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar llegue a germinar? ¿Cómo
se interpreta este valor en términos del criterio presentado en la ecuación 2.9?
d. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar ambas lleguen a
germinar?
e. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar la primera llegue
a germinar y la segunda no?
f. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar una cualquiera de
las dos llegue a germinar y otra no?
g. ¿Cuánto vale la probabilidad de que entre tres semillas de este árbol a tomar al azar una cualquiera
llegue a germinar y dos no? ¿Cómo se interpreta este valor en términos del criterio presentado en la
ecuación 2.9?

2.9 En un censo rural realizado en 2010 en el distrito de Tiacalín se registró la superficie de tierra y la
forma de gestión de cada establecimiento. Con esta información se clasificaron todos los establecimientos
en tres categorías de superficie (<50 ha, 50 a 500 ha y ≥500 ha) y en tres modelos de gestión (explotación
directa por el propietario, explotación mediante contratos anuales de siembra y arrendamiento por más de
3 años). Las frecuencias relativas encontradas de cada clase de establecimiento son las que se presentan en
la siguiente tabla de doble entrada.

Frecuencias relativas de establecimientos rurales clasificados por superficie y modelo de gestión en el distrito
de Tiacalín (Censo rural 2010).
Superficie
<50 ha 50 -500 ha ≥500 ha
Propietario 0,04 0,29 0,07 0,40
Gestión Contrato anual 0,13 0,27 0,02 0,42
Arrendamiento 0,01 0,14 0,03 0,18
0,18 0,70 0,12 1,00
Con el propósito de evaluar los posibles cambios recientes en la distribución de los establecimientos del
distrito entre estas clases de superficie y modelo de gestión, un ingeniero agrónomo obtendrá una muestra
aleatoria de establecimientos del distrito y registrará la superficie de tierra y la forma de gestión de cada
establecimiento a elegir al azar.
Si cuando el ingeniero obtenga la muestra las frecuencias relativas de establecimientos en diferentes clases
de superficie y modelo de gestión son iguales a las registradas en 2010:
a. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado directamente
por el propietario?
b. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥500 ha
y <50 ha?

14
c. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha si
es <500ha?
d. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha y
sea gestionado directamente por el propietario?
e. ¿El evento “el establecimiento tiene una superficie <50 ha” es estadísticamente independiente del
evento “el establecimiento es gestionado directamente por el propietario? Justificar con un cálculo
apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de establecimiento
en el distrito.
f. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥50 ha y
sea gestionado mediante contratos anuales de siembra?
g. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado mediante
contratos anuales de siembra si tiene una superficie ≥50 ha?
h. ¿El evento “el establecimiento tiene una superficie ≥50 ha” es estadísticamente independiente del
evento “el establecimiento es gestionado mediante contratos anuales de siembra”? Justificar con un
cálculo apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de
establecimiento en el distrito.

2.10 Muchas malezas de los lotes agrícolas provienen de semillas enterradas en el suelo antes de la
siembra del cultivo. En el suelo, las semillas vivas pueden encontrarse en dos estados fisiológicos,
“despiertas”, si germinan cuando la temperatura y la humedad son apropiadas, o “dormidas” si no germinan
a menos que reciban algún estímulo específico como luz o frio. Para analizar la infestación con la maleza
Commelina erecta L. en un lote agrícola del distrito de Tiacalín, una investigadora tomó una muestra
aleatoria de 2000 semillas y las clasificó según su estado fisiológico y la profundidad a la que estaban
enterradas. Llamaremos A al evento “una semilla de Commelina erecta L. tomada al azar de este lote está
despierta” y B al evento “una semilla tomada al azar de Commelina erecta L. de este lote está a una
profundidad < 2cm”.
a. Identificar la población de referencia, las unidades muestrales y las variables de interés.
Entre las 2000 semillas de la muestra, la investigadora encontró 1739 semillas a menos de 2 cm de
profundidad, entre las cuales 1165 estaban despiertas. Además encontró 89 semillas despiertas enterradas
a profundidad ≥ 2 cm. A partir de esta información:
b. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar
al azar de este lote agrícola esté enterrada a menos de 2 cm de profundidad?
c. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar
al azar de este lote agrícola esté despierta?
d. ¿Qué valor corresponde asignar a la probabilidad condicional de que una semilla de Commelina erecta
L. a tomar al azar de este lote agrícola esté despierta si está enterrada a una profundidad ≥ 2cm?
e. A partir de los resultados obtenidos en b, c y d, utilizar la Regla de Bayes para asignar el valor a la
probabilidad condicional de que una semilla de Commelina erecta L. a tomar al azar de este lote
agrícola esté enterrada a una profundidad ≥ 2cm si está despierta. Comprobar que el valor obtenido
coincide con el cociente
𝑃[𝐴 ∩ 𝐵𝑐 ]
𝑃[𝐴]
f. ¿Cuál es el evento 𝐴𝑐 ∪ 𝐵𝑐 ?
g. ¿Qué valor corresponde asignar a 𝑃[𝐴𝑐 ∪ 𝐵𝑐 ]?
h. Si el estado fisiológico y la profundidad en el suelo de una semilla de Commelina erecta L. a tomar al
azar de este lote agrícola fuesen estadísticamente independientes, ¿cuál sería el valor de la probabilidad
de que una semilla de Commelina erecta L. a tomar al azar de este lote estuviera enterrada a menos de
2 cm de profundidad y además esté despierta?
i. Comparar las respuestas a los ítems g y h. ¿Qué indica el resultado de esta comparación?

15

Vous aimerez peut-être aussi