Vous êtes sur la page 1sur 7

Instituto Tecnolgico de Morelia

Fecha: 20 de marzo de 2012 Nombre del curso: (6L3A, SIM) Simulacin Nombre del profesor: Hctor Emilio Guzmn Pulido Integrantes del equipo # 5:

Arias Mndez Gustavo Ulises Garca Ferrer Alejandro Morales Marn Carlos Snchez Sandoval Miguel ngel Zalapa Zalapa Guadalupe Alethia Unidad: 2. Nmeros Pseudoaleatorios
Actividad: Ensayo sobre los nmeros pseudoaleatorios, sus generadores as como

1. 2. 3. 4. 5.

las pruebas estadsticas para tener un buen generador. Ttulo del ensayo: Nmeros Pseudoaleatorios y Pruebas de Aleatoriedad Resumen. Un anlisis de aleatoriedad del mtodo AS183 y el mtodo de productos medios as como una comparacin entre ellos,
Lista de referencias:

Coss Bu, Ral (2002). Simulacin un Enfoque Prctico. LIMUSA Garca Eduardo, Garca Heriberto, Crdenas Leopoldo E. (2006). Simulacin y anlisis de sistemas con ProModel. Pearson. Knuth Donald E. (1998). The art of computer programming, volume 2: Seminumerical Algorithms, 3rd Edition. Addison Wesley Longman. Microsoft (2007). Descripcin de la funcin ALEATORIO en Excel 2007 y en Excel 2003. Recuperado 15 de marzo, 2012, de http://support.microsoft.com/kb/828795/es 03/19/2012 Stallings William (2011). Cryptography and Network Security: Principles and Practice, 5th Edition. Prentice Hall. Wichmann B. A. (1982). Applied Statistics. Royal Statistical Society

Nmeros Pseudoaleatorios y Pruebas de Aleatoriedad


Resumen. El presente ensayo presenta una revisita a las siete pruebas de aleatoriedad de una secuencia de nmeros pseudoaleatorios y los resultados de un anlisis de aleatoriedad sobre dos algoritmos de generacin de nmeros pseudoaleatorios, el algoritmo del mtodo productos medios y el algoritmo del mtodo AS183 as como una comparacin de los resultados obtenidos. Las aplicaciones de los nmeros elegidos al azar son variadas, en la simulacin sirven para simular desde fenmenos naturales hasta el arribo aleatorio de personas a un sistema, en el muestreo resulta imprctico examinar todos los casos posibles, pero una muestra aleatoria provee una revelacin de lo que constituye el comportamiento tpico, en el anlisis numrico se usan nmeros aleatorios de una manera ingeniosa para resolver complicados problemas numricos, y en la esttica y la recreacin los nmeros aleatorios proveen de una aspecto ms natural al arte visual y la msica [Knuth, 1998]. Es posible generar nmeros aparentemente sin relacin mediante un algoritmo a partir de semillas, estos algoritmos son determinsticos y por lo tanto no generaran nmeros aleatorios, sin embargo si el algoritmo es bueno, la secuencia resultante de nmeros pasar las pruebas aleatoriedad. [Stallings, 2011], a estos nmeros se les llaman nmeros pseudoaleatorios, y a los algoritmos, generadores de nmeros pseudoaleatorios. Dos ejemplos de algoritmos para la generacin de nmeros pseudoaleatorios son el mtodo de productos medios, una generalizacin del mtodo de cuadrados medios sugerido por John Von Neumann [Garca, 2006] y el mtodo AS183, mtodo usado en el programa Excel, del paquete de software Microsoft Office [Microsoft, 2007]. Ambos mtodos satisfacen la tarea de generar nmeros pseudoaleatorios a partir de semillas, a primera vista parecen igualmente exitosos como generadores de nmeros pseudoaleatorios. Existen numerosas pruebas estadsticas que podran proveer informacin sobre la aleatoriedad de los nmeros, sin embargo siete de ellas han probado ser las ms tiles para validan la aleatoriedad de las secuencias de nmeros generadas por un mtodo generador de nmeros pseudoaleatorios [Knuth, 1998], al mismo tiempo, los resultados arrojados por estas pruebas estadsticas indican la calidad del generador de nmeros pseudoaleatorios. Al someter a ambos algoritmos a las siete pruebas de aleatoriedad ser posible hablar de la superioridad de un algoritmo sobre el otro. La primer prueba de aleatoriedad se conoce como prueba de frecuencias, consiste en dividir el intervalo (0, 1) en n subintervalos, con esto se puede comparar que para cada subintervalo la frecuencia esperada contra la frecuencia observada [Coss, 2002]. Se considera que una distribucin es uniforme cuando las frecuencias esperadas y observadas son lo ms parecidas posible. La prueba de la distancia se usa para examinar la longitud entre las brechas entre las ocurrencias dentro de cierto rango. Considerando y como dos nmeros reales con , se quiere considerar la longitud de subsecuencias consecutivas , donde yace dentro del segmento entre y , pero el resto no (las subsecuencias de nmeros , representa la brecha de longitud . [Knuth, 1998]

La prueba de promedios trata de probar que los nmeros pseudoaleatorios provienen de un universo uniforme con media de 0.5 [Coss, 2002]. La prueba de Komogrov-Smirnov es una no paramtrica usada para probar la uniformidad de distribucin de los nmeros pseudoaleatorios [Knuth, 1998]. Consiste en obtener n observaciones independientes, ordenarlas de manera ascendente y obtener los resultados de la prueba mediante las formulas: ( ( ( ) ( )) )

La prueba de series consiste en comparar los nmeros con el propsito de corroborar la independencia entre nmeros consecutivos. Se inicia creando una grfica de dispersin entre los nmeros consecutivos, posteriormente se divide la grfica en m casillas, siendo m el valor ms cercano a la raz de n que permita formar (aunque no necesariamente) una matriz cuadrada. Se determina la frecuencia observada contabilizando el nmero de puntos en cada casilla y su correspondiente frecuencia esperada. Se calcula el error estadstico de prueba y si este error es menor o igual al estadstico de las tablas no se puede rechazar la hiptesis de independencia entre nmeros consecutivos. [Garca, 2006] La prueba de correlacin determina en qu medida una ocurrencia se relaciona con la siguiente ocurrencia. Consiste en calcular un coeficiente: ( ( ) ( ) ( ) )

Este coeficiente de correlacin serial es una medida de la hasta donde depende de . El valor de este coeficiente esta entre 1.0 y -1.0; cuando se encuentra en cero o muy cerca de cero, indica que las cantidades son, relativamente hablando, independientes unas de otras. [Knuth, 1998] La ltima prueba de aleatoriedad se denomina prueba de pker, esta prueba consiste en visualizar un nmero con cinco decimales y clasificarlo como: todos diferentes, un par, dos pares, una tercia, un par, pker o quintilla. La prueba puede funcionar para nmeros con tres y cuatro decimales pero pierde por supuesto categoras con cada digito. La prueba consiste [Garca, 2006] en determinar la categora de cada nmero del conjunto r, contabilizar los nmeros r de la misma categora o clase para obtener la frecuencia observada, y calcular el estadstico de la prueba de la Chi-cuadrada con la ecuacin:
( )

Antes de someter un algoritmo a una prueba de aleatoriedad se debe considerar cuales son las mejores semillas para el ptimo funcionamiento del algoritmo. El algoritmo AS183 requiere de tres semillas ix, iy, iz, estos tres enteros deben estar en el rango de 1 a 30000, el mtodo emplea tres simples generadores congruenciales multiplicativos, cada uno utiliza un numero primo para su mdulo y una raz primitiva para su multiplicador, lo que garantiza un ciclo completo, los tres resultados son agregados y se toma la parte fraccional. [Wichmann, 1982], la nica condicin para que funcionen estas semillas es su condicin de nmero impar. La semilla elegida para el mtodo AS183 es la tulpa (667, 123, 9999).

El algoritmo de productos medios, al ser una generalizacin del mtodo de cuadrados medios hereda algunas de sus fallas, como por ejemplo la gran velocidad en la que el algoritmo se degenera, a falta de documentacin formal respecto al comportamiento del algoritmo de generacin de nmeros pseudoaleatorios por productos medios, para la eleccin de la semilla para el mtodo se hicieron algunas pruebas preliminares, se hicieron 81000000 de pruebas de promedios, de estos 81000000 aquellos juegos de semillas cuyo resultado en esta prueba no superara los 0.01 puntos de distancia del ideal 0.5 se sometieron a la prueba de frecuencias, de esta poblacin de pares de semillas aquellos que no se alejaban a ms de una unidad de la frecuencia esperada se les aplicaba una prueba para ver si alcanzaban los 50000 nmeros generado antes de degenerarse. La semilla elegida para el mtodo de productos medios mediante la eleccin de semilla por fuerza bruta fue el par de nmeros (5518, 1799). 1) Prueba de Promedios: Aqu el generador de aleatorio de Excel entra dentro del rango de la prueba, asimismo tambin el algoritmo de productos medios, cada uno en su grfica se puede observar que cumplen esta prueba, se observa que proporcionan una muestra continua en el intervalo probado. 2) Prueba de Frecuencias: Esta prueba buscar validar que los datos estn uniformemente distribuidos, se debe rechazar un generador si proporciona una muestra de nmeros aleatorios cargados hacia la derecha, el centro o la izquierda, en este caso particular, la funcin de productos medios nos muestra una muestra bastante uniforme, se observa que tres de las clases se salen por dos unidades de nuestra frecuencia esperada, tambin nos damos cuenta que es una muestra uniforme, el estadstico X se mantiene en 2.2, en contraparte con el valor de tabla, que asciende a 16.92. En el caso del generador de Excel, se observ que hay un menor grado de uniformidad, puesto que en varias clases la frecuencia observada estaba por debajo de la esperada por hasta cinco unidades, aunque respecto de la prueba, es un muestreo uniforme, puesto que el estadstico X termina con un valor de 12.4, comparado con el valor aparecido en tablas, que es de 16.92 3) Prueba de la Distancia: En esta prueba, lo que se debe observar es un decremento geomtrico, en este caso particular se encontr que la funcin aleatorio de Excel es muy parecida a la tendencia de las frecuencias esperadas, puesto que se acerca en buena medida a las esperadas, la diferencia es muy poca, y slo en una clase es en la que hay una diferencia de hasta 2 unidades con respecto de las frecuencias observadas y las esperadas. En cuanto a la prueba con productos medios, se observa en la grfica que esta prueba es ms notorio que no cumple de cerca las frecuencias observadas, en varias clases, se puede notar la diferencia entre la FO y la FE, puesto que necesita aproximadamente el perder hasta diez unidades para acercarse a la frecuencia esperada. 4) Prueba de Pocker: Para la prueba de pcker, existe una diferencia entre las pruebas para la funcin aleatorio de Excel y las pruebas con productos medios, porque en el caso de Excel, se utilizaron las siete clases. Al momento de analizar la prueba, el aleatorio de Excel pasa la prueba satisfactoriamente, pues la diferencia de las frecuencias observadas por clase y las

frecuencias esperadas tienen una diferencia de 160 unidades, una diferencia bastante pequea al compararla con los resultados del generador de productos medios, en donde nuestro estadstico se sale por mucho del esperado, es un X con valor de 208.24 contra 9.49, que es el valor sealado en tablas. 5) Prueba de Series: En la prueba de series se comprueba si el muestreo observado es independiente. En nuestra prueba, al hacer el muestreo de aleatorio, generador de Excel, aun cuando cumple con el requisito plasmado en tablas, que es un X de 26.42, la muestra arroj un valor de 23.6, lo que indica que el motor generador, en una prueba de confianza del 95%, no se puede rechazar la hiptesis de independencia. 6) Prueba de Correlacin Lineal: Con esta prueba se mide el nivel de dependencia de sus valores. Se calcul en base a coeficientes de correlacin entre las series originales y las mismas desplazadas en i posiciones, haciendo posteriormente la grfica de dispersin de los datos. Si la prueba muestra un valor de t diferente de cero, como fue en este caso particular usando una muestra de 100 datos para cada generador en un nivel de confianza de 95%, se puede asegurar que existe alguna dependencia y se tiene que descartar el generador, sin embargo, en las pruebas de Excel se da un valor de t de 2.004 unidades, lo que no nos obliga a pensar en una dependencia lo suficientemente grande para rechazar el generador, por otro lado, el generador en base a productos medios nos da un valor ms aceptable; de 1.47316025, lo que asegura que tiene muy poca dependencia cada nmero aleatorio de otro. 7) Prueba de Kolmogorov-Smirnov: En esta prueba, es notorio que el generador de Excel puede proporcionar la uniformidad que es necesaria para pasar satisfactoriamente la prueba, al hacer la prueba con una muestra de 20 datos en un nivel de confianza del 95%, se obtuvo el valor crtico D igual a 0.1971, y es menor que el valor de tablas D =0.301. En el caso del generador en base a productos medios, igualmente con una muestra de datos de 20 elementos a un nivel de confianza del 95%, el resultado del valor crtico es de 0.1171, el cual, comparndolo con el valor de tabla de 0.301, presenta un mejor desempeo con relacin al generador de Excel, lo que significa un mayor nivel de distribucin uniforme.

En base a esta prueba, se concluye que el motor generador de nmeros aleatorios en Excel, arroja resultados aceptables en comparacin su homnimo en base a productos medios, tomando en cuenta que pasa todas las pruebas, y se desempea de mejor manera que el de productos medios.

Anexo 1. Pruebas /Mtodos Promedio Frecuencia Pocker Series Correlacin Serial Distancia Kolmogorov Smirnov Biparticin Productos Medios paso Pas no pas no pas paso Pas Pas Estadstico 0.499945 2.2 208.246362 45.56 1.47316 16.61 0.1171 Condicin = < < < < < <

Pruebas /Mtodos Promedio Frecuencia Pocker Series Correlacin Serial Distancia Kolmogorov Smirnov

Congruencial Excel paso la prueba paso la prueba paso la prueba paso la prueba paso la prueba paso la prueba paso la prueba

Estadstico 0.46644293 12.4 5.34347884 23.6 2.00437364 10.9916444 0.19715659

Condicin = < < < < < <

Vous aimerez peut-être aussi