Académique Documents
Professionnel Documents
Culture Documents
SIMULACIÓN Y
MODELACIÓN. GUIA II
Objetivo
Contenido
• Experimento
• Resultado
• Evento
Las propiedades de FDP (a veces visto como PDF del inglés) son: 0 para toda x.
Uno de los Pitágoras Eurito fue el que se dedicó a representar los números con
piedrecillas y, por este procedimiento, obtenemos los números “cuadrados” y los
números “rectangulares”. En efecto, si partiendo de la unidad vamos añadiendo
sucesivamente los números impares conforme al gnomon, obtenemos los números
cuadrados; mientras que si partimos de dos y le vamos añadiendo los números pares,
obtenemos los números rectángulos.
4. Pruebas
a. Prueba de promedios
E(x) = 1″0 x dx = ½
U = N.A.
Ejercicio:
Ho : M “ 1/2
X=
Z0 = /2= 0 1 - /2=
/2 /2
MEYER
n <= 30
N > 30
U U(x)
1
b. Prueba de frecuencias
N = tamaño de la muestra
n = número de subintervalos
Este estadístico se compara con la cual representa una variable aleatoria Chi-
cuadrada con n-1 grados de libertad y un nivel de significancia. Si, entonces se acepta
la hipótesis. Usar pruebas de bondad de ajuste x2.
c. Prueba de distancia
Como teóricamente el valor del tamaño del hueco puede ser infinito, es conveniente
agrupar probabilidades para valores de i mayores o iguales a un determinado valor de n.
Tal sumatoria se obtiene de acuerdo con la siguiente expresión:
Entonces los números pasan la prueba. i ni Pi FOi Acum FEi FOi 0 81917 0.1 3 3
13(0.1)=1.3 3 1 78981 0.9 8 11 12(0.9)=1.17 8 2 97982 0.081 1 13 13(0.081)=1.053 1 3
7753 0.729 1 13 13(0.729)=9.477 1 4 72771 5 08160 6 64041 7 72141 8 25223 9 60814
NOTA = Entre los huecos no debe de haber frecuencia de 1 por lo tanto se sube al
anterior
X2
i Pi FOi FEi 0 0.4 12 40(0.4) = 6.00 1 0.24 12 40(0.4)(0.6) = 9.6 2 0.144 10 40(0.4)(0.6)
= 5.76 >=3 0.216 6 40(0.6) = 8.64 total 1.00 “70=40 “FE = 40
d. Prueba de series
Prueba de series. Para probar el grado de aleatoriedad entre Núm. sucesivos se forman
parejas de N donde N= números pseudoaleatorios. (U1, U2), (U2, U3), (U3, U4),. . .
(U8, U9), (U9, U10) En seguida, se determina la celda a que pertenece cada pareja. 1
n/n 4/n 3/n 2/n 1/n 0 1/n 2/n 3/n 1 n/n Con lo cual se determina la frecuencia esperada
de cada celda se obtiene: N= Números 100 FE = N/n n= Particiones 5 si n = 5 se tiene
una matriz de 5×5 = 25 =n si N = 100 se obtendrán 99 parejas. FE = 99/25=
NOTA: Cuando la pareja de puntos cae en un vértice se coloca a la izq. es por la línea y
abajo. Prueba de series: 0.72484 0.48999 0.50502 0.39528 0.36782 0.90234 0.71890
0.61234 0.86322 0.94134 0.99872 0.27657 0.34565 0.02387 0.67347 0.10987 0.25678
0.25593 0.82345 0.12387 0.05389 0.82474 0.59289 0.36782 0.03991 0.10461 0.93716
0.16894 0.98953 0.73231 1- = 0.95 = 1–0.95 = 0.05 /2= 0.05/2 = 0.025 n=4 elige el
valor de n. Núm. de parejas a formar N = 30–1 = 29 parejas FE = (N-1)/ n2 = (30–1)/ 42
= 1.8125
Paso 2: Calcular la frecuencia esperada en cada casilla FEi de acuerdo con FEi= num/m
de núm. es el número total de parejas ordenadas.
Paso 3. Calcular el error C, con la ecuación siguiente:
e. Prueba de Kolmogorov-Smirnov
Paso 1: se formula la hipótesis nula, Ho. De que los números provienen de una
distribución uniforme en el intervalo cerrado [0,1].
De una tabla de número aleatorios se eligen los siguientes 50 (divididos entre 100 Para
que su valor oscile entre 0 y 1. 0.10 0.37 0.08 0.99 0.12 0.66 0.31 0.85 0.63 0.73 0.32
0.04 0.68 0.02 0.99 0.74 0.10 0.77 0.32 0.42 0.76 0.64 0.19 0.09 0.80 0.34 0.45 0.02
0.05 0.03 0.13 0.74 0.09 0.70 0.36 0.76 0.82 0.65 0.74 0.64 0.34 0.24 0.23 0.38 0.64
0.36 0.35 0.68 0.90 0.35
Paso 2. Se arregla la tabla anterior para que se cumpla la condición para toda i. 1 0.02 2
0.02 3 0.03 4 0.04 5 0.05 6 0.08 7 0.09 8 0.10 9 0.10 10 0.10 11 0.12 12 0.13 13 0.19 14
0.23 15 0.24 16 0.26 17 0.32 18 0.34 19 0.34 20 0.35 21 0.35 22 0.36 23 0.36 24 0.37
25 0.38 26 0.42 27 0.45 28 0.63 29 0.64 30 0.64 31 0.64 32 0.65 33 0.66 34 0.68 35
0.68 36 0.70 37 0.70 38 0.73 39 0.74 40 0.74 41 0.74 42 0.76 43 0.80 44 0.82 45 0.85
46 0.90 47 0.94 48 0.97 49 0.99 50 0.99
Fn(0.00) = 0.00 Fn(0.02) = 0.04 Fn(0.0.3) = 0.03 Fn(0.04) = 0.08 Fn(0.05) = 0.10
Fn(0.08) = 0.12 Fn(0.09) = 0.16 Fn(0.10) = 0.20 Fn(0.12) = 0.22 Fn(0.13) = 0.24
Fn(0.19) = 0.26 Fn(0.23) = 0.28 Fn(0.24) = 0.30 Fn(0.31) = 0.32 Fn(0.32) = 0.34
Fn(0.34) = 0.38 Fn(0.35) = 0.42 Fn(0.36) = 0.43 Fn(0.37) = 0.48 Fn(0.38) = 0.50
Fn(0.42) = 0.52 Fn(0.45) = 0.54 Fn(0.63) = 0.56 Fn(0.64) = 0.62 Fn(0.65) = 0.64
Fn(0.66) = 0.66 Fn(0.68) = 0.70 Fn(0.70) = 0.74 Fn(0.73) = 0.76 Fn(0.74) = 0.82
Fn(0.77) = 0.84 Fn(0.80) = 0.86 Fn(0.82) = 0.88 Fn(0.85) = 0.90 Fn(0.90) = 0.92
Fn(0.94) = 0.96 Fn(0.97) = 0.98 Fn(0.99) = 0.100 Paso 4: D = MAX [Fn(xi)-xi] D =
[0.00 - 0.00] = 0 [0.04 - 0.02] = 0.02 [0.06 - 0.03] = 0.03 [0.08 - 0.04] = 0.04 D = 0.12;
Paso 5: Para un nivel de significancia del 90% y una muestra de 50 números se tiene de
la tabla, un valor de 0.170 como D < 0.170 se acepta Ho: Los 50 números si provienen
de una distribución uniforme en el intervalo [0,1].
f. Prueba de Poker
Esta prueba examina en forma individual los dígitos del número pseudoaleatorio
generado. La forma como esta prueba se realiza es tomando 5 dígitos a la vez y
clasificándolos como: Par, dos pares, tercia, póker quintilla full y todos diferentes. Las
probabilidades para cada una de las manos del póker diferentes se muestran enseguida:
Todos diferentes = 0.3024 Un par = 0.504 Dos pares = 0.108 Tercia = 0.072 Full =
0.009 Quintilla = 0.0001
55787 dos pares 33333 Quintilla 16543 Todos diferentes 17145 Un par 51575 Tercia
44343 Full 11171 Póker Ho: Los N. A. son independientes con Si se acepta Ho.
g. Prueba de corrida
Una corrida se define como un conjunto de números que aparecen ordenados en forma
monotonicamente creciente o decreciente: por ejemplo 03, 23, 57, 92, 99 contienen una
sola corrida, mientras que 03, 99, 23, 92, 27 contiene (03,99), (223,92), (57) si se utiliza
el signo + para identificar que el número que aparece a la derecha de otro es mayor, o -
si es menor, se tiene que: 30, 23, 57, 92, 99 +, +, +, +, +, mientras que 03, 99, 23, 92, 57
+, -, +, -
Esta prueba se basa en el supuesto que el número de corridas es una variable aleatoria.
Si una secuencia tiene más de 20 números, el número de corridas que es una variable
aleatoria distribuida normalmente con media y varianza conocida. La prueba se realiza
de la siguiente manera:
Paso 6.- Se acepta ho, a un nivel de riesgo, si donde z (*) esta tabulada en la distribución
normal.
De tablas: Z (0.68) = 0.7517 Por lo que para el nivel de significancia por ejemplo 10%
Prueba de las corridas arriba y abajo del promedio En esta versión de la prueba de las
corridas, una secuencia de números pseudoaleatorios es generada. En seguida, una
secuencia binaria es obtenida, en la cual es 0 si Ui es menor a 0.5 y 1 si es mayor. Una
vez obtenida la secuencia binaria, el siguiente paso de la cantidad de veces que una
misma longitud de corridas se repite (frecuencia observada de la corrida de la longitud
i). Una sucesión de i ceros (unos) enmarcada por unos (ceros) en los extremos,
representa una corrida de longitud i. El Número total esperado de corridas y el número
esperado para cada tamaño de corrida se obtienen con las siguientes expresiones:
0.65 1 0.55 1 0.91 1 0.25 0 i F0i 0.65 1 0.02 0 0 0.41 0 1 0.31 0 0.40 0 0.08 0 0.69 1
0.46 0
Ho: La secuencia de N. A. es aleatoria con M = 0.5 0.80 1 y 0.83 1 0.27 0 i FOi FEi 0 8
9 ( 9–8)2/9= 0.1111 1 7 4.25 (4.25–7)2 = 1.7794 15
La secuencia de No. es aleatoria con M= 0.5 y alfa =5%. Se acepta Ho. 5.8.2 Prueba
de corridas arriba y abajo. Se genera una secuencia de números igual que en el inciso
anterior y luego se obtienen una secuencia binaria, en la cual el i-ésimo término es cero
si Uii< Ui+1 y 1 al contrario. Una vez obtenida la secuencia binaria, se sigue el mismo
procedimiento descrito anteriormente y se obtienen la frecuencia observada para cada
tamaño de corrida. El número total esperado para cada tamaño de corrida se obtiene con
las siguientes expresiones:
i 1 0.84 1 2 0.53 1 3 0.43 0 4 0.45 1 5 0.74 0 Ho: La sec. De No, es aleatoria con 6 0.66
0 7 0.33 1 8 0.85 0 9 0.37 1 FE 20−1= 2/20! 10 0.69 0 11 0.10 1 12 0.76 0 13 0.68 0 14
0.60 1 15 0.97 0 16 0.03 1 17 0.72 0 18 0.17 1 19 0.29 0 20 0.16 1
, , ,...,
Donde por X(modN) indica el resto de la división entera de X entre N. Por ejemplo,
12(mod7) = 5
Si se conoce cómo generar valores en {1, 2, 3,..., (N-1)}es posible generar valores en el
intervalo [0,1), como sigue: Se toma N, muy grande, entero, se toma una semilla
, y se construye la secuencia obtenida
aplicando la expresión Yk = Xk / N
a. Distribuidos uniformemente
ii) Observar un proceso físico tal como la desintegración radiactiva, el ruido eléctrico,...;
iii) Los lenguajes de programación y las hojas electrónicas incluyen una función para
generarlos
- Rapidez
- Comodidad
- Reproducibilidad
- Portabilidad
La desventaja fundamental: Las secuencias obtenidas no son realmente aleatorias, ya
que se obtienen con operaciones deterministas. Solo podemos obtener secuencias
pseudo-aleatorias, que a su vez satisfacen algunos criterios de aleatoriedad adecuados.
Los números generados deben cumplir ciertas características para que sean válidos.
Dichas características son:
1. Uniformemente distribuidos.
2. Estadísticamente independientes.
Para el caso de una recurrencia de orden k. Se necesitará dar un valor inicial para
comenzar el algoritmo (k valores para recurrencias de orden k ).
Estos generadores son los más utilizados y los más conocidos. Se basan en la relación
de recurrencia
Recordemos que lo que nos interesa para trabajar con un buen generador de números
aleatorios es que la distribución de los números obtenidos tiene que ser uniforme, no
deben de haber correlaciones entre los términos de la secuencia, el periodo debe ser lo
más largo posible, y el algoritmo debe ser de ejecución rápida.
En estos generadores cada nuevo número entero aleatorio Ni, se obtiene manipulando
los bits del número anterior, Ni-1. En lenguaje C, esto se puede hacer utilizando
operadores sobre bits, >>,<<, , , & .
Generadores de Fibonacci
Las grandes ventajas de estos generadores es que son generadores muy rápidos que
tienen un periodo muy largo. La fomentación teórica en la que se basan es diferente a la
de los GCL. Los generadores de Fibonacci se basan en una recurrencia del tipo:
Donde r<s son enteros dados y denota alguna de las operaciones +, -, x, . Este
tipo de generador precisa iniciar (con otro generador) y mantener una lista de los
últimos números generados.
Antes de aceptar un nuevo generador hace falta verificar que satisface una serie de
pruebas, lo que llamaremos pruebas de aleatoriedad.
De modo que xo = 4. A partir de acá, se pueden generar todos los demás números.
Valor Número generado xn
0 4
1 3
2 0
3 5
4 6
5 2
6 4
7 3
8 0
Una de las principales limitaciones de este método es qué, al ser un módulo, los
valores se repiten. Si observamos la tabla anterior vemos que el valor x6 es el mismo x0,
de hecho, a partir de allí se repiten todos los números. Es decir, sin importar los valores
que tomemos, eventualmente se empezarán a repetir los números que se generan.
Otra desventaja de este método, es que la semilla siempre genera los mismos
números aleatorios. Dicho de otra forma,
Dada la semilla x, este método genera siempre los mismos números aleatorios.
Este hecho quita la sensación de algo aleatorio, en qué sentido: ¿Cómo se le puede
llamar aleatorio a un método que genera siempre los mismos números? Existen
programas que sub-sanan este detalle cambiando la semilla constantemente.
Si nos adentramos un poco más, vemos que puede ocurrir otro problema, y es que
dicho periodo se repita lo más pronto posible. Por ejemplo, si tomamos como semilla
x = 2, a = 3, b = 5 y m = 12, obtenemos la siguiente sucesión de números aleatorios.
El cual, sin lugar a dudas, no es una sucesión que nos convenga como para obtener
números aleatorios. Esto da buenos argumentos para deducir que la selección de los
valores x, a, b y m no pueden hacerse sin cuidado alguno.
Generalmente, los números que se utilizan para estos generadores son a = 75, b = 0 y
m = 2r -1, donde r es cierta cantidad según la capacidad de procesamiento que se
disponga. Este fue propuesto por Park y Miller en 1988, la única condición es que la
semilla sea distinto de cero.
Generador. Dados los enteros positivos a0, a1,…,ak , b y m, dadas la semillas x0, x1,
…,xk , se define el valor xk+1 como:
.
Pruebas de aleatoriedad
- Test de uniformidad: hace falta que los valores estén uniformemente distribuidos en
[0, 1]. Se puede realizar un test X2. Alternativamente, podemos estimar los momentos
b. Distribuidos no uniformemente
Para resolver este problema utilizaremos el método del cambio de variable. Que
concretamente consistirá en buscar una transformación y=f(x) para obtener la
distribución deseada. Si la densidad de probabilidad de es p(x), tenemos:
Si sabemos calcular la integral, obtenemos una relación del tipo X = g(Y), que se tiene
que invertir para poder obtener Y=f(X).
Ejemplos:
Sea p(x) definida en un intervalo finito, (a, b), y M una cota superior de p(x). Se
Bibliografía