Académique Documents
Professionnel Documents
Culture Documents
e difcil es la aleatoriedad!
(extracciones y azar)
F. Montes & A. Corber
an. Universitat de Val`
encia
Introducci
on
El azar forma parte de nuestra vida cotidiana y se nos manifiesta de forma espontanea a traves
de m
ultiples circunstancias y fenomenos; pero en otras muchas ocasiones somos nosotros quienes
necesitamos convocarlo. La obtencion de una secuencia aleatoria de n
umeros es, sin duda, la
mas corriente de estas necesidades.
Estas notas pretenden ocuparse de la dificultad de generar con exito una secuencia aleatoria
que merezca tal nombre y lo hacen mediante el analisis de una lotera muy popular, la Primitiva,
y sus familiares cercanos, el Bono Loto y el Gordo, y un sorteo relacionado con un llamamiento
al servicio militar en los EUA. El orden de presentacion de los ejemplos no es casual, estan
ordenados de mejor a peor atendiendo al exito en alcanzar el objetivo de aleatoriedad perseguido.
En el primero de ellos, la lotera Primitiva y sus variantes, las combinaciones ganadoras cumplen
con los requisitos de aleatoriedad exigibles a un juego social de azar tan popular (podra haber
sido de otra manera?). En el segundo, el sorteo del servicio militar del a
no 70 en los EUA, las
cosas son peores porque a pesar de las precauciones que se tomaron el resultado no paso con
exito ninguno de los tests de aleatoriedad a que fue sometido. Un ejemplo mas cercano, en el
que un planteamiento erroneo inicial condujo a un mal resultado, fue el sorteo para determinar
los excedentes de cupo del reemplazo del 98 en Espa
na del que ya nos ocupamos en [2].
La Primitiva
Qu
e difcil es la aleatoriedad!
de la combinacion ganadora. Veamos hasta que punto somos benevolentes calificando solo de
difcil la obtencion de un premio de 1a categora.
2.1
aciertos
primera
segunda
5+C
tercera
cuarta
quinta
casos posibles
2.2
favorables
6
6 =1
6 1
5 1 =6
6 42
5 1 = 252
6 43
4 2 = 13.545
6 43
3 3 = 246.820
49
6 = 13.983.816
probabilidad
7, 15 108
4, 29 107
1, 80 105
9, 69 104
1, 76 102
Qu
e difcil es la aleatoriedad!
N
umero extrado.- Se trata de una variable aleatoria cuyo valor coincide con el n
umero
extrado.
Figura.- Un criterio de clasificacion de la combinacion ganadora es el que atiende a la cantidad de n
umeros consecutivos que contiene. Cada figura1 define un suceso aleatorio y el
conjunto de todos ellos forman una particion del espacio muestral que estudiaremos.
Suma.- Es una variable aleatoria que para cada combinacion ganadora toma el valor de la
suma de los n
umeros que la constituyen.
Si el mecanismo de extraccion funciona aleatoriamente, el comportamiento probabilstico teorico
de las variables y sucesos anteriores sera conocido y podremos compararlo con su comportamiento experimental observado a partir de la muestra de 4.024 sorteos. La medida de la discrepancia
entre ambos nos informara acerca de la bondad del mecanismo. Antes de comenzar con los
analisis especficos debemos se
nalar que las posibilidades de estudio y analisis que las loteras
del tipo 6/49 ofrecen no se agotan, ni con mucho, en los tres elementos anteriores. La propia
web del ONLAE y la base de datos que [9] mantiene son buen ejemplo de ello. Para el objetivo
que nos hemos marcado, a medio camino entre el rigor y la diversion, estos tres aspectos son
suficientes.
2.3
N
umeros
1
,
49
k = 1, . . . , 49.
(1)
El lector estara seguramente de acuerdo con (1) si piensa en la primera de las extracciones
de cada sorteo, pero quizas le surjan dudas al pensar en alguna de las 5 restantes. Intentaremos disiparselas. Para ello consideremos el espacio muestral resultante de llevar a cabo las
extracciones teniendo en cuenta el orden en que se han producido. El n
umero de posibles
resultados2 sera V49,6 , las variaciones de 49 elementos tomados de 6 en 6. Para obtener la probabilidad de que N tome el valor k en la extraccion i-esima, {Ni = k}, consideramos el suceso
A ={conjuntos de 6 extracciones en las que el n
umero k ocupa la posici
on i}. Evidentemente
P (Ni = k) = P (A). Los casos favorables a A se obtienen facilmente excluyendo k de los 49
n
umeros, extrayendo 5 de los 48 restantes e insertando a continuacion k en la posicion deseada,
lo que dara lugar a un total de V48,5 casos. Por lo tanto, como decamos antes, tenemos
P (Ni = k) = p =
1
V48,5
=
.
V49,6
49
Los 4.024 sorteos suponen 24.144 extracciones. Estamos ante una muestra aleatoria de tama
no
n = 24.144 de la variable N . Si las extracciones han sido realizadas al azar, la frecuencia
1 El nombre de figura, tomado directamente de la ONLAE, quiz
as no sea el adecuado porque como puede
observarse poco o nada tiene que ver con la disposici
on geom
etrica de los n
umeros en el boleto.
2 Este espacio muestral es diferente del manejado en 2.1 porque ahora tenemos en cuenta el orden de las
extracciones
Qu
e difcil es la aleatoriedad!
24.144
= 492, 7 k = 1, 2, . . . , 49.
49
f obs (o)
503
470
501
488
454
493
491
489
486
484
490
485
485
496
458
483
501
472
491
463
503
509
507
445
f esp (e)
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
(oe)2
e
N
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
0,2139
1,0490
0,1386
0,0455
3,0450
0,0001
0,0061
0,0283
0,0920
0,1548
0,0152
0,1214
0,1214
0,0216
2,4486
0,1923
0,1386
0,8725
0,0061
1,7944
0,2139
0,5369
0,4130
4,6244
f obs (o)
491
520
508
471
481
512
516
500
517
512
494
501
468
512
541
465
506
500
480
497
533
469
529
489
485
f esp (e)
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
492,7
(oe)2
e
0,0061
1,5087
0,4729
0,9587
0,2795
0,7532
1,0985
0,1071
1,1950
0,7532
0,0032
0,1386
1,2417
0,7532
4,7278
1,5611
0,3571
0,1071
0,3291
0,0369
3,2904
1,1433
2,6691
0,0283
0,1214
Qu
e difcil es la aleatoriedad!
49
X
(oi ei )2
ei
i=1
2.4
Figuras
Figura
111111
21111
2211
222
3111
Formas
111111
21111
12111
11211
11121
11112
2211
2121
2112
1221
1212
1122
222
3111
1311
1131
1113
Ejemplo
1:3:5:7:9:11
1:2:4:6:8:10
1:3:4:6:8:10
1:3:5:6:8:10
1:3:5:7:8:10
1:3:5:7:9:10
1:2:4:5:7:9
1:2:4:6:7:9
1:2:4:6:8:9
1:3:4:6:7:9
1:3:4:6:8:9
1:3:5:6:8:9
1:2:4:5:7:8
1:2:3:5:7:9
1:3:4:5:7:9
1:3:5:6:7:9
1:3:5:7:8:9
Favorables
7.059.052
1.086.008
1.086.008
1.086.008
1.086.008
1.086.008
135.751
135.751
135.751
135.751
135.751
135.751
13.244
135.751
135.751
135.751
135.751
Totales
7.059.052
5.430.040
814.506
13.244
543.004
Figura
321
33
411
42
51
6
Qu
e difcil es la aleatoriedad!
Formas
321
312
231
213
132
123
33
411
141
114
42
24
51
15
6
Ejemplo
1:2:3:5:6:8
1:2:3:5:7:8
1:2:4:5:6:8
1:2:4:6:7:8
1:3:4:5:7:8
1:3:4:6:7:8
1:2:3:5:6:7
1:2:3:4:6:8
1:3:4:5:6:8
1:3:5:6:7:8
1:2:3:4:6:7
1:2:4:5:6:7
1:2:3:4:5:7
1:3:4:5:6:7
1:2:3:4:5:6
Favorables
13.244
13.244
13.244
13.244
13.244
13.244
946
13.244
13.244
13.244
946
946
946
946
44
Totales
79.464
946
39.732
1.892
1.892
44
La obtencion del n
umero de combinaciones o casos favorables a cada uno de los sucesos
que las formas representan es sencilla pero puede llegar a ser farragosa, particularmente para
las figuras/formas con pocos o ning
un n
umero consecutivo3 . Como ilustracion obtendremos a
continuacion los casos favorables a la forma 321.
Casos favorables a la forma 321.- Elegiremos en primer lugar el menor de los n
umeros que
forman la terna consecutiva, que para esta forma sera tambien el menor elemento de
la combinacion ordenada. Este n
umero puede ser cualquiera de los 42 primeros, puesto
que un n
umero posterior impedira que una forma como la propuesta pudiera aparecer.
Designemoslo por i. Los dos n
umeros que le siguen deben ser i + 1 e i + 2. Por tanto,
el primero de los dos n
umeros consecutivos siguientes, j, podra ser uno cualquiera de los
comprendidos entre i + 4 i 46 (i + 4 j 46). El u
ltimo n
umero de la combinacion, k,
habra de verificar j + 3 k 49, lo que supone 49 (j + 3) + 1 = 47 j posibilidades.
Si sumamos ahora para todos los valores de i y j tendremos
42 X
46
X
(47 j)
i=1 j=i+4
=
=
42
X
1
{47(46 (i + 4) + 1) (46 + i + 4)(46 (i + 4) + 1)}
2
i=1
42
X
1
{47 43 47i (50 + i)(43 i)}
2
i=1
42
X
47 43
i=1
42
X
i=1
42
47i
1X
(50 43 7i i2 )
2 i=1
= 13.244
En las 4.024 combinaciones estudiadas, la distribucion de las frecuencias de cada una de las
figuras es la que mostramos en la tabla. La tabla contiene tambien las probabilidades para cada
figura y las frecuencias esperadas que de ellas se derivan. Con toda esta informacion podremos
3 La
dificultad puede obviarse recurriendo a un PC, puesto que un sencillo programa en cualquiera de los
lenguajes habituales contar
a r
apidamente el n
umero de combinaciones asociadas a cada forma y figura. Los
autores deben confesar que han hecho uso de este recurso. No habamos quedado que la tecnologa inform
atica
era tambi
en para esto?
Qu
e difcil es la aleatoriedad!
obtener el valor del correspondiente estadstico 2e y efectuar el pertinente test de bondad del
ajuste4 .
figura
111111
21111
2211
3111
321
411
resto
222
42
51
33
6
totales
f obs
1994
1610
232
138
33
15
2
2
0
0
0
0
4.024
prob
0,504802
0,388309
0,058246
0,038831
0,005683
0,002841
0,001288
0,000947
0,000135
0,000135
0,000068
0,000003
f esp
2031,32
1562,55
234,38
156,26
22,87
11,43
5,18
3,81
0,54
0,54
0,27
0,01
4.024
(oe)2
e
0,6857
1,4406
0,0242
2,1328
4,4906
1,1126
1,9564
11,8429
Al valor 2e = 11, 8429 le corresponden en esta situacion 6=7-1 grados de libertad y el valor
umbral correspondiente al 5% se establece en 12,5916, que al no ser superado por nuestro valor
nos conduce, como antes, a aceptar la hipotesis de que las extracciones han sido realizadas al
azar.
2.5
Sumas
La suma de los n
umeros que componen la combinacion ganadora es una variable aleatoria
cuya distribucion de probabilidad, bajo el supuesto de extracciones al azar, puede conocerse.
Podemos comprobar si la distribucion emprica que se deriva de los 4.024 sorteos concuerda con
aquella.
La variable suma, S, es una variable discreta cuyo soporte es el conjunto {21,22,. . . ,279} y
puede definirse de dos formas equivalentes:
Def 1.- Si Ni denota el n
umero obtenido en la extraccion i-esima,
S=
6
X
Ni ,
Ni {1, 2, . . . , 49},
Ni 6= Nj , i 6= j.
i=1
6
X
N(i) ,
i=1
Qu
e difcil es la aleatoriedad!
1 + 49
= 25,
2
var(Ni ) =
492 1
, i = 1, . . . , 6
12
6
X
E(Ni ) = 6 25 = 150,
i=1
6
X
var(Ni ) +
i=1
(2)
1i6=j6
k l P (N1 = k, N2 = l) =
k6=l
49
49
X
X
1
25 1192
kl =
.
49 48
48
k=l
La covarianza valdra
cov(N1 , N2 ) =
l=1
l 6= k
25 1192
25
252 = .
48
6
Sustituyendo en (2),
var(S) = 6 200 + 30
25
30 25
= 1.200
= 1.075.
6
6
||As ||
V49,6 ,
21 s 279,
fuera,
6
X
ni = s, 1 ni 49, ni 6= nj }.
i=1
La obtencion de los distintos valores de f (s) es larga y tediosa, por lo que convendra recordar
cuanto se deca en una anterior nota a pie de pagina. El recurso a un PC nos permite obtener
sin gran esfuerzo los valores de ||As || y f (s). Corresponde ahora contrastar la distribucion
emprica obtenida a partir de los 4.024 sorteos con la teorica.
La tabla siguiente y la figura 1 resumen la informacion de ambas distribuciones. La tabla
muestra los valores de ||As || y la figura permite comparar visualmente las graficas de f (s) =
P (S = s) y de f rel(s), la frecuencia relativa observada para S = s. La impresion visual de
concordancia que muestran ambas graficas hemos de corroborarla con el test de bondad del
ajuste. Esta concordancia se manifiesta tambien a traves de la media y de la varianza de las
sumas observadas:
x = 151, 00,
s2 = 1072, 26.
s
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
||As ||
1
1
2
3
5
7
11
14
20
26
35
44
58
71
90
110
136
163
199
235
282
331
391
454
532
612
709
811
931
1057
1206
1360
1540
1729
1945
2172
2432
2702
3009
3331
3692
4070
4494
s
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
Qu
e difcil es la aleatoriedad!
||As ||
4935
5426
5940
6506
7097
7748
8423
9163
9933
10769
11637
12579
13552
14603
15690
16856
18059
19349
20673
22087
23540
25082
26663
28340
30051
31860
33706
35648
37625
39703
41809
44016
46253
48586
50944
53402
55875
58446
61031
63706
66388
69161
71928
s
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
||As ||
74781
77624
80542
83440
86412
89348
92350
95311
98324
101285
104295
107235
110215
113119
116048
118889
121751
124507
127274
129930
132581
135109
137629
140008
142370
144587
146771
148800
150794
152617
154397
156004
157554
158923
160236
161354
162410
163273
164062
164654
165176
165490
165732
s
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
||As ||
165772
165732
165490
165176
164654
164062
163273
162410
161354
160236
158923
157554
156004
154397
152617
150794
148800
146771
144587
142370
140008
137629
135109
132581
129930
127274
124507
121751
118889
116048
113119
110215
107235
104295
101285
98324
95311
92350
89348
86412
83440
80542
77624
s
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
||As ||
74781
71928
69161
66388
63706
61031
58446
55875
53402
50944
48586
46253
44016
41809
39703
37625
35648
33706
31860
30051
28340
26663
25082
23540
22087
20673
19349
18059
16856
15690
14603
13552
12579
11637
10769
9933
9163
8423
7748
7097
6506
5940
5426
s
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
||As ||
4935
4494
4070
3692
3331
3009
2702
2432
2172
1945
1729
1540
1360
1206
1057
931
811
709
612
532
454
391
331
282
235
199
163
136
110
90
71
58
44
35
26
20
14
11
7
5
3
2
1
1
El gran n
umero de valores que toma la variable S y la necesidad de efectuar agrupaciones
para que los valores esperados de las categoras resultantes sean mayores o iguales que 5, como
una correcta aplicacion del test de la 2 exige, hacen aconsejable recurrir a otro test de la bondad
del ajuste concocido como test de Kolmogorov-Smirnov (test K-S), que utiliza como medida de
discrepancia la diferencia en valor absoluto entre las funciones de distribucion teorica,
X
F (x) =
f (s),
sx
y emprica,
Fn (x) =
Qu
e difcil es la aleatoriedad!
f rel(s) =
sx
10
||{si , si x, i = 1, . . . , n}||
,
n
donde n es el n
umero de observaciones y si la i-esima observacion de la variable S (en nuestro caso n sera el n
umero de sorteos). El correspondiente estadstico se obtiene mediante la
expresion
Dn = sup |Fn (x) F (x)|,
xR
cuya distribucion permite establecer el umbral del 5% a partir del cual aceptaremos o rechazaremos nuestra
hipotesis. Para n suficientemente grande, como es nuestro caso, dicho umbral
0,018
0,016
0,014
0,012
0,010
0,008
0,006
0,004
0,002
0,000
21 30 39 48 57 66 75 84 93 102 111 120 129 138 147 156 165 174 183 192 201 210 219 228 237 246 255 264 273
Figura 1.- Gr
aficas de f (s) (linea de puntos) y de la f rel(s) (barras verticales).
2.6
C
omo juegan los apostantes?
Es difcil concluir esta seccion sin caer en la tentacion de mirar el juego desde la perspectiva
del comportamiento de los apostantes. Y esto a
un a pesar del doble inconveniente que supone,
de una parte, situarnos fuera del guion que nos hemos marcado y, de otra, la carencia de informacion directa sobre las apuestas. El empe
no se justificara porque lo que en un principio nos
parecieron solo llamativas anecdotas, son en realidad las manifestaciones de un comportamiento por parte de los apostantes alejado del puro azar. En efecto, se trata de corroborar algo
ya sabido: que la gente traslada al boleto sus preferencias, manas, supersticiones y quimeras;
actitudes que tienen como resultado una apuesta casi siempre alejada de lo que entendemos por
una eleccion al azar de los seis n
umeros.
Una comprobacion indirecta de este hecho, puesto que las apuestas son inaccesibles directamente, la proporciona el analisis conjunto de la combinacion ganadora y del n
umero de
acertantes de cada categora para los 4.024 sorteos. Conocemos la probabilidad de acierto para
10
Qu
e difcil es la aleatoriedad!
11
cada categora, pi , y el n
umero na de apuestas jugadas en cada sorteo, podemos pues conocer
ei = pi na , n
umero esperado de acertantes la categora i bajo el supuesto de que las apuestas
han sido hechas al azar. El contraste mediante el test de la 2 de la hipotesis de que las apuestas
se han realizado al azar en cada uno de los 4.024 sorteos, se resume en la tabla.
Hip
otesis de apuestas al azar
aceptada
rechazada
66
3958
1,64%
98,36%
Dos comentarios alusivos a la obtencion de la tabla:
las dos primeras categoras de premios han sido agrupadas en una sola porque el n
umero
de apuestas no siempre daba lugar al mnimo esperado de 5 acertantes en la 1a categora,
los 66 sorteos en los que la eleccion al azar de las apuestas es aceptada son una cota
maxima que debe ser en realidad menor. En efecto, el contraste de la bondad del ajuste
debe realizarse sobre todas las categoras de acertantes, lo que incluye a los que aciertan
2, 1 y 0 n
umeros de la combinacion ganadora, pero sobre estos no se tiene informacion
alguna. Por esta razon, la apuesta al azar en cada sorteo la hemos rechazado cuando el
valor de 2e obtenida a partir de las categoras cuyos acertantes conocemos superaba el
umero de grados de libertad
umbral del 5% obtenido a partir de una 26 , puesto que el n
cuando se incluyen las categoras desconocidas es 6 = 7 1.
Este analisis depara una u
ltima sorpresa. Los 66 sorteos en los que hemos aceptado la
hip
otesis de que las apuestas han sido elegidas al azar, se distribuyen entre los tres tipos de
loteras de forma aparentemente distinta a como lo hace el total de sorteos (4.024). La tabla
recoge ambas distribuciones y el test de la bondad del ajuste, que en este contexto se denomina
test de homogeneidad, corrobora la diferencia con un valor 2e = 20, 5996 frente a un umbral
22 = 5, 9915. Todo parece indicar que la presencia de 58 Bonolotos excede, por encima de lo que
la aleatoriedad explicara, los 42 esperados, y ello en detrimento de la presencia de Primitivas.
Son mas amantes del azar los jugadores de Bonoloto que los de la Primitiva? Vaya Ud. a
saber.
4.024 sorteos
66 al azar
esperados
2.6.1
Bonoloto
2.576
58
42,25
Gordo
192
5
3,15
Primitiva
1.256
3
20,60
Y los de 6 aciertos?
11
ai
0
1
2
3
4
5
6
7
8
9
10
ni
2379
974
374
146
63
31
18
8
7
4
5
Qu
e difcil es la aleatoriedad!
%
59,12
24,20
9,29
3,63
1,57
0,77
0,45
0,20
0,17
0,10
0,12
ai ni
0
974
748
438
252
155
108
56
56
36
50
ai
ni
11
12
15
17
18
19
20
23
24
56
114
totales
1
4
2
1
1
1
1
1
1
1
1
4024
%
0,02
0,10
0,05
0,02
0,02
0,02
0,02
0,02
0,02
0,02
0,02
100
12
ai ni
11
48
30
17
18
19
20
23
24
56
114
3253
15
25
26
36
46
Los acertantes de 6 aciertos parecen tener todava mas agudizada la azarofobia del apostante.
La figura 3 apoya esta opinion. En ella hemos representado la frecuencia esperada para cada uno
de los 49 n
umeros en las 19.518 = 3.253 6 elecciones de n
umeros llevadas a cabo en las 3.253
apuestas que aquellos jugaron (ver tabla anterior). Como este valor esperado es el mismo para
todos ellos, 398,33, aparece como una linea continua paralela al eje de abcisas. Las frecuencias
observadas para cada n
umero se han representado mediante puntos, que hemos unido a la recta
anterior para que se aprecien mejor las diferencias entre lo esperado y lo observado. El valor
del estadstico 2e = 623, 25 supera con creces el umbral del 5% de la 248 = 65, 17.
12
Qu
e difcil es la aleatoriedad!
13
700
600
500
400
300
200
0
2
1
4
3
6
5
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
2.7
Conclusi
on acerca de las extracciones
El buen funcionamiento del mecanismo de extraccion de los n
umeros en todos los sorteos
de las loteras 6/49 ha de aceptarse en base a las caractersticas aleatorias analizadas.
No arriesgaramos gran cosa si afirmaramos que con el estudio de otras caractersticas
el resultado hubiera sido el mismo. No esperabamos otra cosa y habra que se
nalar
dos razones para ello. La primera, y mas importante, es la sencillez del mecanismo
utilizado, un bombo y 49 bolas homogeneas numeradas, que nos recuerda el comienzo de
cualquier enunciado clasico de un problema de probabilidad: De una urna que contiene
bolas numeradas del .... La segunda razon, de ndole etico, se basara en la creencia de que
un organismo estatal de loteras esta obligado a hacer las cosas bien aunque solamente sea
13
Qu
e difcil es la aleatoriedad!
14
por el dinero que hay en juego, no tanto el de los premios como el que ingresa la hacienda
p
ublica.
Conclusi
on acerca de las apuestas
Nada que a
nadir al comentario que hacamos al comienzo del parrafo 2.6. Los distintos
analisis y anecdotas all descritos confirman la ausencia de azar en las apuestas de los
jugadores. Pero, que ocurrira a medida que transcurra el tiempo y pueda generalizarse
el uso por parte de los jugadores de las maquinas automaticas de apuestas? Quizas
entonces sea el generador pseudoaleatorio de apuestas el que merezca una revision crtica.
Y un comentario bibliogr
afico
Para cerrar esta seccion dedicada a la Primitiva hemos de insistir en que la miscelanea
anterior no agota, ni lo pretende, las posibilidades que este juego ofrece. Los juegos de
azar son fuente inagotable de inspiracion para aquellos que tienen el azar como profesion
o pasion, una o no necesariamente exclusiva, y han dado lugar por ello a abundante
literatura. En la cientfica, la que aqu nos ata
ne, son muchos los textos con ttulos
inequvocamente alusivos al tema, especialmente abundantes entre los precursores de la
Teora de la Probabilidad, lo que da fe de un origen ligado a los juegos de azar. Entre
ellos: Huygens [8], Montmort [11], De Moivre [4], ... Pero tambien existen textos muy
recientes que se ocupan del tema con amenidad y rigor, es el caso de los libros de Rao [12]
y Haigh [7]. Cerrar esta incursion biliografica sin citar a dos autores clasicos como Feller
[5] y Renyi [13] nos parecera una desconsideracion hacia el lector por no haberle hecho
partcipe de nuestra pasion por estos dos textos, referencias obligadas cuando se habla de
probabilidad discreta (Feller) o de teora de la probabilidad (Renyi).
A finales del a
no 69 un decreto del Presidente de los EUA, en aquella epoca Richard Nixon, estableca que los llamamientos para el servicio militar del a
no 70 deban llevarse a cabo mediante
una seleccion aleatoria basada en la fecha de nacimiento de los implicados5 . La promulgacion
del decreto tiene su peque
na historia por las dificultades y prejuicios que hubo de vencer.
En ocasiones anteriores se haban utilizado sorteos para determinar la incorporacion a filas,
adquiriendo algunos de ellos, especialmente el del a
no 40, una merecida notoriedad debido a la
falta de rigor con la que se llevaron a cabo, lo que supuso que las condiciones de equiprobabilidad
e independencia necesarias no se satisfacieran.
Se tomaron toda clase de precauciones para que el sorteo del 70 garantizara la igualdad
de oportunidades. En un ameno artculo publicado al a
no siguiente en Science, Fienberg [6]
describe con detalle, desde la forma y tama
no de las capsulas que contenan las 366 fechas
de nacimiento (el 29 de febrero estaba tambien contemplado), hasta la manera en la que las
c
apsulas eran introducidas en una caja de madera, donde se mezclaban previamente antes de
ser alojadas definitivamente en el recipiente del que seran extradas. El proceso de mezcla
merece un comentario mas extenso, por ser probablemente el origen de lo insatisfactorio del
resultado. Se comenzo alojando las 31 fechas correspondientes a enero en el fondo de la caja,
a continuacion se hizo otro tanto con las 29 de febrero y se procedio a mezclar ambas. El
proceso se repitio con cada uno de los restantes meses, mezclando las bolas despues de cada
introduccion. Este proceso supone que mientras las bolas de enero fueron mezcladas en 11
ocasiones, las de noviembre y diciembre solo lo fueron dos y una vez, respectivamente. Digamos
5 De este sorteo ya nos ocupamos en [2], pero analizaremos aqu
un nuevo aspecto que consideramos interesante
y que proporciona una perspectiva diferente.
14
Qu
e difcil es la aleatoriedad!
15
por u
ltimo que una vez las capsulas fueron arrojadas en el recipiente de la extraccion, una gran
copa de cristal, ya no fueron agitadas.
da
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
ene.
305
159
251
215
101
224
306
199
194
325
329
221
318
238
17
121
235
140
58
280
186
337
118
59
52
92
355
77
349
164
211
feb.
86
144
297
210
214
347
91
181
338
216
150
68
152
4
89
212
189
292
25
302
363
290
57
236
179
365
205
299
285
mar.
108
29
267
275
293
139
122
213
317
323
136
300
259
354
169
166
33
332
200
239
334
265
256
258
343
170
268
223
362
217
30
abr.
32
271
83
81
269
253
147
312
219
218
14
346
124
231
273
148
260
90
336
345
62
316
252
2
351
340
74
262
191
208
may.
330
298
40
276
364
155
35
321
197
65
37
133
295
178
130
55
112
278
75
183
250
326
319
31
361
357
296
308
226
103
313
jun.
249
228
301
20
28
110
85
366
335
206
134
272
69
356
180
274
73
341
104
360
60
247
109
358
137
22
64
222
353
209
jul.
93
350
115
279
188
327
50
13
277
284
248
15
42
331
322
120
98
190
227
187
27
153
172
23
67
303
289
88
270
287
193
agos.
111
45
261
145
54
114
168
48
106
21
324
142
307
198
102
44
154
141
311
344
291
339
116
36
286
245
352
167
61
333
11
sept.
225
161
49
232
82
6
8
184
263
71
158
242
175
1
113
207
255
246
177
63
204
160
119
195
149
18
233
257
151
315
oct.
359
125
244
202
24
87
234
283
342
220
237
72
138
294
171
254
288
5
241
192
243
117
201
196
176
7
264
94
229
38
79
nov.
19
34
348
266
310
76
51
97
80
282
46
66
126
127
131
107
143
146
203
185
156
9
182
230
132
309
47
281
99
174
dic.
129
328
157
165
56
10
12
105
43
41
39
314
163
26
320
96
304
128
240
135
70
53
162
95
84
173
78
123
16
3
100
El resultado del sorteo se muestra en la tabla anterior, apareciendo al lado de cada fecha el
orden en que fue extrada, orden en el que seran llamados a filas los que nacieron ese da. Este
detalle es relevante porque los llamamientos se haran en funcion de las necesidades, pudiendo
suceder que despues de determinado llamamiento no se efectuara ninguno mas. De hecho,
fuentes del Ministerio de Defensa y de la propia Casa Blanca reconocieron por aquellas fechas
que, agrupando los 366 llamamientos en tres tercios de 122 fechas cada uno, las necesidades
del servicio hacan prever que muy probablemente los del tercer tercio no seran llamados y
tampoco parte del segundo.
En el artculo citado de Fienberg y en el de Corberan & Montes [2] se describen con detalle
varios metodos para contrastar si el resultado del sorteo era compatible con la extraccion al azar
de las fechas de nacimiento. Recordaremos aqu uno de ellos y completaremos una sugerencia
de Fienberg.
3.1
El analisis consiste en obtener los valores medios del orden de extraccion o llamamiento que han
correspondido a las fechas de nacimiento de cada mes y representar graficamente las parejas
15
Qu
e difcil es la aleatoriedad!
16
(mes, valor medio). Si las extracciones fueron hechas verdaderamente al azar, los puntos en
dicha grafica no deberan presentar ning
un tipo de patron, pero tal como se observa en la figura
5, la tendencia lineal decreciente es clara, especialmente para los meses de mayo a diciembre.
La ecuacion de la recta de regresion es
y = 229, 37 7, 05x,
y el coeficiente de correlacion vale rxy = 0, 8660. Semejante valor del coeficiente de correlacion
nos lleva a aceptar la hipotesis de que las medias se sit
uan a lo largo de una recta, lo que resulta
incompatible con la supuesta aleatoriedad de las extracciones.
240
220
200
180
160
140
120
100
0
10
12
mes de nacimiento
Figura 5.- Regresi
on de la media del n
umero de extracci
on sobre el mes correspondiente
Los valores de las medias mensuales se muestran en la tabla siguiente y confirman las
primitivas sospechas que el metodo empleado para mezclar las capsulas haca temer. Los
primeros 5 valores son aproximadamente iguales, la razon puede estar en que la mezcla entre
ellos fue mas homogenea, pero a medida que aumentaban los meses las capsulas iban siendo
sometidas a menos mezclas. El bajo valor de la media del mes de diciembre refuerza este
argumento.
16
Qu
e difcil es la aleatoriedad!
media orden
extracci
on
201,1
203,0
225,8
203,7
208,0
195,7
181,5
173,5
157,3
182,5
148,7
121,5
mes
enero
febrero
marzo
abril
mayo
junio
julio
agosto
septiembre
octubre
noviembre
diciembre
3.2
17
Un patr
on espacial de puntos
Los resultados del sorteo admiten otro tipo de representacion grafica, la que hemos llevado a
cabo en la figura 6. Se trata de un grafico de dispersion en la que hemos representado el orden
de extraccion (eje Y) frente a la fecha de nacimiento (eje X).
Figura 6.- Gr
afica del orden de extracci
on respecto de la fecha de nacimiento
En su artculo, Fienberg analiza visualmente el grafico y sugiere una cierta escasez de puntos
en los extremos de la bisectriz del primer cuadrante. Observa tambien una tendencia a la
agregacion de puntos, que tiene como consecuencia la aparicion de areas en blanco relativamente
extensas. Pero su analisis no va mas alla de apreciaciones subjetivas que en ning
un caso tienen
el valor de un contraste de hipotesis.
Estamos en presencia de un patron espacial de puntos sobre un retculo. Si las extracciones
han sido realizadas al azar, el patron debe ser completamente aleatorio. Como contrastar la
hip
otesis de aleatoriedad completa? La obtencion y exposicion rigurosa de semejante test de
hip
otesis va mas alla del objetivo de estas lneas. Hay que a
nadir, ademas, que el problema no
es trivial debido a las dificultades que conlleva la obtencion de la distribucion de probabilidad de
17
Qu
e difcil es la aleatoriedad!
18
los estadsticos asociados con la aleatoriedad espacial completa. Lo que en su lugar haremos es
desarrollar un metodo intuitivo y practico basado en uno de ellos, la distancia entre los puntos
(sucesos) del patron.
3.2.1
Una caracterstica numerica que resume bien los rasgos del patron espacial de n sucesos observados en un recinto acotado, es la distancia entre dos cualesquiera de ellos. Mas concretamente,
la funci
on de distribuci
on emprica (fded) de las 12 n(n 1) distancias que generan. Esta es,
en realidad, una herramienta propia de los procesos puntuales espaciales definidos sobre R2 ,
pero nada impide su utilizacion en el campo discreto. En uno u otro soporte, a un patron
espacial completamente aleatorio podemos oponerle alternativas en dos direcciones: un patron
agregado, en el que los sucesos se nos muestran formando clusters de mayor o menor tama
no, o
un patron regular o de rechazo, cuyos sucesos muestran una disposicion mas regular originada
por el rechazo entre ellos. La figura 7 nos muestra patrones que representan las tres situaciones
descritas. El de la izquierda corresponde a las localizaciones de 62 plantones de secuoias en un
cuadrado de 23 ms. de lado, y la agregacion que nos muestra podra explicarse por el hecho
de que cada grupo de plantones ha crecido alrededor de una sequoia madre que no aparece
reresentada en la imagen. En la grafica central los sucesos son las localizaciones de 63 brotes
de pinos negros japoneses. El patron regular que nos muestra la grafica de la derecha responde
a la localizacion de los centros de un grupo de celulas humanas. Las imagenes estan tomadas
de [3].
Figura 7.- Patrones espaciales de sucesos: agregado (izqda.), aleatorio (centro) y regular (dcha.).
18
Qu
e difcil es la aleatoriedad!
100
100%
90
90%
80
80%
70
70%
60
60%
50
50%
40
40%
30
19
100
100%
90%
90
90%
80
80%
80
80%
70
70%
70
70%
60
60%
60
60%
50
50%
50
50%
40
40%
40
40%
30%
30
30%
30
30%
20
20%
20
20%
20
20%
10
10%
10
10%
10
10%
0%
0%
0%
2
1,84
1,68
1,52
1,36
1,2
1,04
0,88
0,72
0,56
0,4
0,24
0,08
2
1,84
1,68
1,52
1,36
1,2
1,04
0,88
0,72
0,56
0,4
0,24
0,08
100%
90
2
1,84
1,68
1,52
1,36
1,2
1,04
0,88
0,72
0,56
0,4
0,24
0,08
100
Figura 8.- Histogramas y fded para patrones agregado (izqda.), aleatorio (centro) y regular (dcha.).
19
Qu
e difcil es la aleatoriedad!
20
M
etodo de las envolturas superior e inferior de la fded
Decir que el resultado del sorteo es compatible con la extraccion al azar de las fechas de
nacimiento, equivale a decir que el orden de extraccion es una permutacion aleatoria de los
366 primeros naturales. Lo que haremos sera generar n 1 de estas permutaciones y obtener
para cada una de ellas su fded, Fi (x), i = 2, . . . , n y compararlas con la F1 (x) derivada del
sorteo.
Una forma sencilla de llevar a cabo la comparacion es construir las envolturas superior y
inferior de las simuladas mediante
S(x) = max Fi (x),
i=2,...,n
i=2,...,n
Si los datos del sorteo son completamente aleatorios, F1 (x) no debera distinguirse de las
Fi (x), i = 2, . . . , n y se verificara
P (F1 (x) > S(x)) = P (F1 (x) < I(x)) =
1
, x.
n
(3)
Si sistematicamente la F1 (x) esta por encima de S(x) o debajo de I(x), tendremos entonces un
claro indicio en contra de la hipotesis establecida.
Para analizar los datos del sorteo hemos generado 99 permutaciones aleatorias del 1 al
366, lo que significa que las probabilidades en (3) valen 0.01, y es por tanto muy improbable
que F1 (x) supere a S(x) o sea inferior a I(x). La grafica conjunta de las tres funciones no
es muy informativa debido a que sus diferencias son muy peque
nas, pero si representamos
conjuntamente las graficas (x, F1 (x) I(x)) y (x, F1 (x) S(x)), como hemos hecho en la figura
9, veremos que mientras la primera es siempre positiva, como era de esperar, la segunda es
positiva entre x = 50 y x = 128, en contra de lo esperado. Habra que concluir que existen
claros indicios de que la extraccion no fue al azar.
,010
,008
,006
,004
,002
0,000
-,002
-,004
-,006
-,008
1,41
53,15
104,89
156,62
208,36
260,09
311,83
363,57
415,30
20
467,04
3.2.3
Qu
e difcil es la aleatoriedad!
21
IIQ
min
p25
p50
mediana
p75
max
3.3
Conclusi
on
Todo parece indicar que las precauciones que se tomaron no fueron suficientes. El resultado del
sorteo no parece compatible con las condiciones requeridas por las extracciones al azar, como
se deduce de las pruebas anteriores y de otras complementarias que pueden consultarse en los
artculos de Fienberg [6] y Corberan & Montes [2].
El resultado de los tests de aleatoriedad completa nos conducen al rechazo de esta, pero
nos informan tambien del sentido de la desviacion respecto de aquella. En efecto, los patrones
6 Seg
un
que el contraste sea unilateral o bilateral tendremos en cuenta uno o los dos extremos
21
Qu
e difcil es la aleatoriedad!
22
agregados tienen mayor dispersion que los regulares (una nueva ojeada a la figura 8 puede
merecer la pena) y el elevado valor del IIQ observado estara indicandonos la presencia de un
patron agregado. El resultado de la regresion va tambien en este sentido.
Agradecimientos
Los autores quieren manifestar su agradecimiento por la ayuda recibida en el apartado de la
Primitiva a D. Pedro R. Lopez Torres, informatico vehemente, para quien este juego solo guarda
un secreto: acertar la combinacion ganadora.
Referencias
[1] G.A. Barnard. Contribution to the discussion of Professor Bartletts paper. J.R.Statist.Soc.
B , 25:294, 1963.
[2] A. Corberan & F. Montes. Perversiones y trampas de la probabilidad. La Gaceta de la
RSME, 3:198:229, 2000.
[3] P.J. Diggle. Statistics Analysis for Spatial Point Patterns. Academic Press, London, 1983.
[4] A De Moivre. The Doctrine of Chances. 3rd. Edition. A. Millar, London, 1756. (Reeditado
por Chelsea Pub. Comp., New York, 1967)
[5] W. Feller. An Introduction to Probability Theory ans Its Applications. Vol I. 3rd. Edition.
John Wiley, New York, 1968.
[6] S.E. Fienberg, Randomization and Social Affairs: The 1970 Draft Lottery. Science,
171:255261, 1971.
[7] J. Haigh. Taking Chances. Oxford University Press, Oxford, 1999.
[8] C. Huygens. Tractatus de Rationiis in Aleae Ludo. In Exercitationes Mathematicae. Ed.
F. van Shooten, Amsterdam, 1657.
[9] P.R. Lopez Torres. Comunicacion personal. Albacete, 2000.
[10] R.J. Larsen and M.L. Marx. An Introduction to Mathematical Statistics ans Its Applications. 3rd. Edition. Prentice Hall College Div., New Jersey, 2000.
[11] P.R. Montmort. Essai dAnalyse sur les Jeux dHazard. Ed. Jacques Quillau, Paris, 1713.
(Reeditado por Chelsea Pub. Comp., New York, 1980)
[12] C.R. Rao. Estadstica y Verdad: Aprovechando el Azar. PPU, Barcelona, 1994.
[13] A. Renyi. Probability Theory. North-Holland, Amsterdam, 1970.
22