Vous êtes sur la page 1sur 16

Hallazgos - Revista de Investigaciones 119

TRÁFICO AUTOSEMEJANTE*
Juan Andrés Pérez Mejía**
Jorge Mauricio Romero Parra***

Resumen

Durante décadas, la ingeniería de redes ha basado el análisis de tráfico en un mismo concepto. Pero,
en los últimos años se han venido desarrollando teorías que rompen con estos enunciados y nos dan
un nuevo enfoque para dicho análisis.

La mayoría del tráfico existente en las redes actuales se comporta de forma diferente a lo que se
pensaba, es de tipo autosimilar o fractal; por lo tanto, se han empezado ha desarrollar nuevos métodos
para llevar a cabo su estudio y modelamiento. Esta autosemejanza implica un análisis estadístico o
probabilístico de los sucesos recurriendo a diferentes herramientas; en este caso, los modelos no
correlacionados, sin memoria, de dependencia a corto plazo, de dependencia a largo plazo, Wavelet
Multifractales, entre otros.

En este caso se muestra, de forma general, cómo se puede lograr el análisis del tráfico por medio de
tales modelos, con el fin de generar inquietudes en el lector.

* El presente artículo fue presentado en la Universidad de Los Andes en el Día de las Comunicaciones, obteniendo el segundo lugar en el
concurso de Posters de dicho evento. Sus autores son estudiantes de octavo y décimo semestre, respectivamente, de la Facultad de Ingeniería
de Telecomunicaciones de la Universidad Santo Tomás y miembros del Grupo de Investigación INVTEL de dicha Facultad.
** 1991779@correo.usta.edu.co
*** 2012379@correo.usta.edu.co
120 Universidad Santo Tomás

Palabras clave

Fractales, modelos de Tráfico, autosemejanza, dependencia a corto plazo, dependencia a largo plazo.

Abstract

During decades, traffic analysis has been based in a same notion. However, in the last years, new
theories which break with those statements and gave us a new approach for this analysis are getting
expounded.

Most of the traffic that now days exists in modern networks has a different performance than expected,
now days traffic has a self-similar or Fractal behavior, thus, new methods to study and modeling traffic are
getting expounded. Statistics and probability analysis of those events, helped by some tools, such as
not correlate, no memory, SRD, LRD and Wavelet Models is needed due to this self-similarity.

This paper shows how traffic analysis can be done through these models in order to generate concerns
in the reader.

Index terms

Fractals, traffic modeling, self-similarity, long range dependence, short range dependence.

Introducción

La necesidad de conocer el comportamiento del • En segundo lugar, se ha constatado la nece-


tráfico telemático subyace a toda discusión rela- sidad de una progresiva integración de los
cionada con el dimensionamiento y diseño de servicios que rompe de plano la separación
controles en redes de telecomunicaciones. tradicional de las redes físicas exclusiva-
mente pensadas para un tipo de servicio
Se puede afirmar que la evolución del mundo de (básicamente redes de distribución de TV,
los servicios de telecomunicación desde hace redes telefónicas y redes de datos). Esta
una década ha venido determinada por dos he- integración obliga a compaginar sobre una
chos fundamentales: misma red exigencias de calidad de servi-
cio muy diversas, que van desde el bajo
• En primer lugar, por una mayor globalización
retardo y cierta tolerancia a pérdidas de
de los servicios, que hasta ahora ha podido
los servicios de voz, a la tolerancia a retar-
ser posible especialmente por el desarrollo
dos y las pérdidas nulas exigidas por mu-
de una mayor conectividad, pero sobre todo
chos servicios de datos.
por la fulgurante expansión de un protoco-
lo distribuido como Internet.
Hallazgos - Revista de Investigaciones 121

Cualquiera que sea el escenario definitivo con- de colas. A la vista de este hecho, han ido apare-
creto sobre el que se asiente este universo do- ciendo nuevos modelos de tráfico de entrada
minado por la integración y la exigencia de cali- que exhiben estructuras de correlación más o
dad, el hecho indiscutible es que existe la nece- menos complejas, aplicados a casos en que el
sidad de definir diversos controles y mecanis- modelo del sistema de comunicaciones en es-
mos de gestión de tráfico que garanticen, de tudio permite mantener la tratabilidad analítica.
manera individualizada, la calidad exigida por En cualquier caso, estos modelos (fundamental-
cada servicio. Actualmente muchos de estos mente markovianos) desprecian la correlación a
controles se encuentran en estado embrionario partir de determinada separación en el tiempo,
o, cuando menos, por optimizar de una manera aunque ésta puede ser aumentada a costa de com-
eficiente. plicar el modelo con parámetros adicionales.

Por su parte, la correcta definición de estos con- Sin embargo, un trabajo presentado por Leland,
troles, así como el dimensionamiento de com- Willinger, Taqqu y Wilson en ACM SIGCOMM ’93
ponentes de la transmisión (buffers, enlaces …), mostraba, tras la observación de exhaustivas me-
exige un amplio conocimiento de los flujos de diciones realizadas sobre una red Ethernet en
tráfico que van a ser transmitidos. Este conoci- Bellcore (NJ, USA), que el tráfico (número de tra-
miento implica caracterizar, modelar e incluso mas en la red por unidad de tiempo) era de natu-
predecir con precisión el comportamiento de raleza fractal, “autosimilar” o “autosemejante”
dichos flujos. Por todas estas razones, el mode- (self-similar), que implica la existencia de una acu-
lado de tráfico telemático se encuentra en el sada correlación a largo plazo (Long-Range
núcleo de la problemática actual de las redes Dependence –LRD–).
integradas.
Posteriormente, el mismo carácter fractal ha sido
observado en redes WAN, en los datos de SS7, en
Modelamiento del tráfico
el tráfico debido a la World Wide Web (WWW), o
Se entiende por modelado de tráfico una abs- incluso en el tráfico de video de tasa variable
tracción matemática más o menos compleja que (Variable Bit Rate –VBR–). Todos estos hallazgos
trata de imitar alguna o varias características es- han contribuido enormemente a un replantea-
tadísticas de un tipo de tráfico real o de un flujo miento muy significativo de la modelación
concreto en particular. Dado que los modelos estocástica del tráfico de entrada y del análisis
poissonianos tradicionalmente usados con el trá- de prestaciones, ya que muchos estudios han
fico telefónico se han demostrado insuficientes puesto de relieve el enorme impacto que la de-
para caracterizar las nuevas fuentes de tráfico, pendencia temporal a largo plazo puede llegar
buena parte del esfuerzo investigador en estos a tener sobre las prestaciones de las redes de
últimos años se ha centrado en el modelado de comunicaciones, frente a otros modelos que se
muestras obtenidas en redes reales (Casilari et al.). han venido usando hasta hace poco y que, o
bien no presentan correlación temporal alguna
Desde el trabajo de Kleinrock a mediados de los por simplicidad analítica, o exhiben una estruc-
60, se encuentra la existencia de dependencia tura de correlación más complicada analíticamen-
temporal que ha sido objeto de estudio por par- te (como los modelos markovianos o autorre-
te de numerosos autores, destacando el descu- gresivos habitualmente utilizados), pero que po-
brimiento del enorme impacto que puede lle- dríamos denominar a corto plazo (Short-Range
gar a tener sobre las prestaciones de un sistema Dependence-SRD) (López, José).
122 Universidad Santo Tomás

En este sentido, al investigador le caben dos op- Otro aspecto clave a la hora de definir un mode-
ciones: muestrear el tráfico en una red a la que lo es decidir la escala de tiempos a la que el
tenga acceso y autorización para “espiar” (esto modelo debe representar convenientemente la
habitualmente sólo es posible para una red de realidad. A menudo resulta completamente in-
área local LAN) o recurrir a las múltiples bases útil y costoso tratar de modelar las fluctuaciones
de datos con muestras de tráfico que ofrece que se producen a todas las escalas en cierto
Internet. Los ejemplos de este último tipo son tráfico. La aplicación final del modelo establece
numerosos, tanto para tráfico Ethernet, tráfico en una escala de interés sobre la que debe centrar-
redes de área metropolitana, tráfico TCP/IP co- se el esfuerzo modelador y que determina los
rrespondiente a servicios HTTP (Web) o tráfico factores claves a imitar y los que pueden ser
de video VBR correspondiente a estándares MPEG obviados. Así, si el problema reside, por ejem-
y M-JPEG. plo, en dimensionar una red WAN para períodos
de meses o años, el modelo debe ser capaz de
La principal ventaja de trabajar con bases de da- predecir la evolución del mercado. Si, por el con-
tos conocidas es la posibilidad de tener un mar- trario, el dimensionado ha de hacerse a más corto
co común de experimentación en el que se pue- plazo, tratando de analizar la hora cargada al cabo
den cotejar los modelos obtenidos con los co- de un día, el elemento central es el usuario,
rrespondientes a otras propuestas. Por su parte, mientras que para controles destinados a gestio-
el muestreo puede ser directo, analizando el trá- nar la calidad de la aplicación, ésta se puede
fico que directamente fluye por el enlace, o in- convertir en el factor clave. Así mismo, si el con-
directo, estudiando de una manera off-line, so- trol a diseñar trabaja a escalas de tiempo puede
bre un servidor, el volumen de información (fi- resultar fundamental modelar con cuidado los
cheros en servidores FTP, tamaño de correos elec- efectos que imponen los niveles inferiores de la
trónicos, páginas Web, películas MPEG,…) a la torre de protocolos.
que los clientes tendrán acceso. En el primer
caso (medida directa), la muestra se ve fuerte- El objetivo básico de un modelo de tráfico es ser
mente determinada por la torre de protocolos capaz de imitar el “comportamiento” del tráfico
de la red concreta que se muestrea. En el se- real. Sin embargo, esta cualidad (la correspon-
gundo caso, el muestreo se produce a nivel de dencia con la realidad) no es el único concepto
aplicación, por lo que el modelo resultante sería que debe considerarse a la hora de elegir una
independiente de los niveles inferiores. estrategia de modelado. Así, resultan de espe-
cial interés otros aspectos como:

868$5,2
1,9(/(6'((1/$&(5('

75$163257(
(92/8&,Ð1'(/

0(5&$'2</$
1,9(/)Ì6,&2 1,9(/'($3/,&$&,Ð1 7(&12/2*Ì$

µ VHJ PVHJ VHJ VHJXQGRV PLQXWRV KRUDV GtDV PHVH V DxRV

(VFDODGHWLHPSR

Márgenes de actuación a grandes rasgos de los factores genéricos


de influencia en el tráfico telemático
Hallazgos - Revista de Investigaciones 123

• La tratabilidad analítica del modelo; esto es, ñal X[n] es un indicador del grado de dependen-
la capacidad intrínseca del modelo de arrojar cia lineal que existe entre una muestra X[i+k] y
resultados analíticos, sin necesidad de simu- la k-ésima muestra anterior:
lación.

5[ N = ( [ ; [L + N ]− µ [ ; [L ]− µ [ ]
• La facilidad de implementación, ya sea vía σ [
software para proceder a simulaciones o vía
hardware con el objetivo de disponer de un Donde E[•] es el operador esperanza matemáti-
generador de tráfico sintético en tiempo real. ca, mientras que σX2 y µx indican, respectivamen-
Esta característica exige simplicidad no sólo te, la varianza y la media de la señal X[n], la cual,
a la propia estructura del modelo, sino tam- en el caso de modelado de tráfico, lleva apareja-
bién a la algoritmia y los costes computa- do la evolución en el tiempo de una variable
cionales que exige su implementación. física (por ejemplo: número de usuarios conec-
tados, duración de una llamada, número de bits
• La “parsimonia” del modelo. Con este con- transmitidos durante cierto intervalo, tiempo
cepto, que recurre al significado original de entre paquetes, tamaño del paquete...).
la palabra parsimonia, se describe la capaci-
dad del modelo para ser descrito mediante De acuerdo con la forma en que el modelo im-
un conjunto reducido de parámetros. De pone a esta función, se puede distinguir entre:
igual importancia, resulta la posible signifi-
cación física de los parámetros. Se debe ser • Modelos no correlacionados
consciente de que al usuario final hay que o ruidos blancos
ofrecerle una representación de la realidad
comprensible, flexible, pero con una variabili- Se trata de señales en donde no existe relación
dad acotada y controlable mediante unos de ningún tipo entre las muestras de la secuen-
parámetros que posean una conexión eviden- cia (RX(k)=0 para todo k≠0), de tal modo que
te con la realidad (por ejemplo: velocidad máxi- cada muestra es generada a partir de la misma
ma, velocidad de pico, tamaño de ráfaga…). función de distribución estadística, pero con to-
tal independencia de las anteriores. Estos mode-
• Capacidad de modelar otros tipos de tráfico, los estadísticamente independientes se han pro-
en especial tráfico agregado. En numerosas bado válidos para modelar ciertos aspectos de la
ocasiones se puede exigir de un modelo, generación del tráfico, entre los que podemos
en especial de los generalistas, la maniobra- mencionar el tiempo entre llamadas, la duración
bilidad suficiente para que, mediante cier- de la llamada o el tamaño de los ficheros trans-
tos cambios de sus parámetros, sea capaz mitidos. Dentro de este grupo, habría que in-
de imitar otros tipos de tráficos o incluso el cluir a modelos clásicos muy extendidos en todos
propio tráfico agregado que resulta de los ámbitos, como el de Poisson (en donde el tiem-
multiplexar sobre un canal varias fuentes po entre eventos se distribuye exponencialmente),
individuales. o los ruidos normales o gaussianos (Casilari et al.).

Una manera razonable de clasificar los modelos


de tráfico es mediante el análisis de la
• Modelos sin memoria
autocorrelación que presentan. La función de co-
Los tiempos entre llegadas, T, son independien-
eficientes de autocorrelación RX(k) de cierta se-
tes y exponencialmente distribuidos, de manera
124 Universidad Santo Tomás

que el tiempo que toca esperar hasta ver la próxi- tráfico, ya que la llegada de paquetes se encuentra
ma llegada es independiente del instante en que fuertemente correlacionada. Las primeras solu-
se empiece a observar, esto se conoce como la ciones de este tipo pasaron por sencillas cade-
«falta de memoria» de la distribución exponencial. nas markovianas de pocos estados. En un proce-
so markoviano, la correlación viene dada por el
Esta propiedad también aparece en modelos de hecho de que el estado actual del sistema de-
tiempo discreto en los que, en cada ranura de pende exclusivamente del estado anterior. En
tiempo, la llegada de un paquete se da con pro- este grupo de procesos markovianos habría que
babilidad p, independientemente de otras ranu- incluir un modelo tan extendido como los pro-
ras. El número de llegadas en intervalos de n ra- cesos On-Off, aproximación simple y razonable
nuras es una variable binomial (n, p), mientras de las fuentes de datos y voz. Una fuente On-
que el número de ranuras N que toca esperar Off consta de dos estados. Durante el estado
hasta ver la llegada del próximo paquete es una On se emite tráfico a tasa constante mientras
variable geométrica que también carece de me- que durante el estado Off (período de silencio
moria (Alzate, Marco y Peña, Néstor). en el caso de la voz) la fuente permanece ocio-
sa. Los tiempos de permanencia en cada estado
• Modelos de renovación en principio son exponenciales, aunque otras
distribuciones son posibles (procesos semimar-
Los procesos de renovación son una extensión kovianos).
de los modelos de tráfico sin memoria, en los
que los intervalos de tiempo entre llegadas de Otros modelos muy conocidos los constituyen
paquetes son independientes e idénticamente los procesos modulados por Markov, en especial
distribuidos, aunque no necesariamente el MMPP (Markov Modulated Poisson Process)
exponenciales o geométricos. de dos estados. De acuerdo con este modelo,
apropiado para modelar el agregado de fuentes
El tiempo que falta esperar hasta ver la llegada On-Off, la generación de tráfico evoluciona en-
del próximo paquete depende de hace cuánto tre dos estados con generación poissoniana, pero
tiempo llegó el último paquete. Aunque esta de tasa media distinta. Por el contrario, la nece-
memoria incrementa la complejidad analítica de sidad de definir una matriz con las probabilida-
los procesos generales de renovación con respec- des de conmutación entre estados hace que el
to a los procesos sin memoria, sigue siendo nula número de parámetros crezca geométricamente
la correlación entre los tiempos entre llegadas con el número de estados considerado. En ese
de paquetes consecutivos, lo cual hace que es- caso, y a costa de perder la mencionada
tos modelos sigan siendo analíticamente trata- tratabilidad, se puede recurrir a los filtros ARMA
bles para estudiar el desempeño de los elemen- (Auto Regresive Moving Average), en los que el
tos de la red (Alzate, Marco y Peña, Néstor). valor de la muestra actual X[n] se obtiene a par-
tir de Na valores anteriores de X[n] y Nb valores
• Modelos de dependencia de un ruido blanco aleatorio w[n] denominado
a corto plazo proceso de innovación, del modo

El carácter intermitente (o por ráfagas) del flujo 1 1E


de datos impuso desde un principio la necesi- ; $50$[Q] = DR + ∑ DW ‡ ; $50$[Q − L]+ ∑ EW ‡ Z[Q − L]
dad de introducir correlación en los modelos de W = W =
Hallazgos - Revista de Investigaciones 125

Donde Na y Nb se corresponden con los órdenes autocorrelación para valores altos del retraso k.
de la parte AR y MA, respectivamente, y los co- Efectivamente, estos procesos se diseñan para
eficientes ai y bi son diseñados para imitar los ajustar las dependencias a corto plazo o SRD
primeros coeficientes de autocorrelación (Casilari (Short Range Dependence) y presentan indefec-
et al.). tiblemente una caída exponencial de la función
de autocorrelación (Casilari, A. et al.):
Los filtros ARMA (Procesos Autorregresivos de
Medias Móviles) son la unión del Proceso AR
5 ; N α H[S − N FXDQGR N → ∞
(Autorregresivo), el cual es un filtro todo polos y
cuya ecuación en diferencias que relaciona la
entrada y la salida es:
• Modelos de dependencias
1D a largo plazo
[ Q + ∑ D L ⋅ [ Q − L = Z Q
L = Las LRD, que se reflejan estadísticamente en co-
eficientes de autocorrelación con un decaimien-
Proceso de MA (Medias Móviles), el cual es un to lento o hiperbólico, se asocian a la existencia
filtro todo ceros y cuya ecuación en diferencias
de una variabilidad del tráfico en una amplia gama
para la relación entrada-salida es: de escalas temporales que los modelos tradicio-
nalmente empleados no son capaces de recoger
1E
y que pueden tener consecuencias graves para
[ Q ¦
L 
EL ˜ Z Q  L
muchos esquemas de control, donde se supone
una escala "natural" y acotada, en donde se ma-
Los procesos ARMA son entonces un filtro lineal nifiesta el carácter rafagueante del tráfico.
que tiene polos y ceros finitos en el plano Z
Por su parte, esta variabilidad de la señal se liga
(Proakis, Jhon G. y Manolakis, D.).
a cierto grado de autosemejanza o fractalidad
Otro modelo autorregresivo es el modelo TES que ha permitido aplicar en este campo las con-
(Transform Expand Sample). Este modelo, además clusiones y la analítica desarrollada por
de invertir la función de distribución acumulativa Mandelbrot y otros autores que han estudiado
de los tiempos entre llegadas, consiste en gene- procesos fractales en otras ramas de la ciencia.
rar probabilidades de éstas mediante números Las LRD han venido a revolucionar, al menos par-
pseudoaleatorios correlacionados, opera con arit- cialmente, el ámbito del modelado de tráfico
mética módulo 1 y no es lineal. Por lo tanto, con telemático, ya que también se han detectado
este modelo se pueden ajustar la autocorrelación en otros tipos de tráfico: servicios Web, tráfico
de muestras reales de tráfico y la distribución IP, tráfico de video, tráfico de enlaces metropoli-
marginal de los tiempos entre llegadas (Alzate, tanos y de red de área extensa. El argumento
Marco y Peña, Néstor). habitualmente esgrimido para explicar las LRD
en series temporales es la existencia de una es-
En cualquier caso, los procesos markovianos y tructura multinivel de generación. Así, para justi-
los filtros ARMA, así como alguna otra solución ficar la LRD del tráfico Web se apela a la
más compleja que se podría englobar en este interacción del comportamiento del usuario (pre-
grupo, como los procesos TES, tienen en común ferencias por ciertos ficheros, tiempo de análisis
su incapacidad para aproximar la función de de páginas Web,...) con las políticas de caché de
126 Universidad Santo Tomás

los buscadores, el tamaño subexponencial de los tructura autorregresiva de media móvil


objetos en las páginas Web y el agregado de (ARMA). La principal ventaja de estos mode-
tráfico que resulta en la LAN. En el caso de las los, frente a la aproximación desarrollada por
secuencias de video, las LRD se suelen funda- los del grupo anterior, es que son capaces
mentar por la existencia de una escala de tiem- de representar la LRD mediante un único
po superior cuya duración se ha probado valor, el parámetro H o de Hurst, que deno-
subexponencial. Efectivamente se puede probar ta el grado de autosemejanza de la muestra
que un proceso cuyos niveles de actividad (tasa a modelar.
media de generación) oscilan de acuerdo con
una temporización de colas pesadas presentará 5 /5' N α N − β FXDQGR N → ∞
características LRD. Hasta la fecha existen dos
FRQ< β < 
técnicas genéricas en las que se podrían agru-
par los modelos planteados para aproximar la
De esta manera, estos modelos presentan
naturaleza LRD de una señal de tráfico:
un alto grado de parsimonia. Por el contra-
• Modelos multinivel. En estos modelos se imi- rio, su principal desventaja radica precisa-
ta directamente la variabilidad existente a mente en la dificultad de una estimación
una serie de niveles o escalas de tiempo. ajustada de H, el cual es un valor acotado
Cada nivel suele modelarse mediante un pro- entre 0.5 y 1. Esta dificultad se explica por
ceso "clásico" (habitualmente cadenas de la propia naturaleza de los estimadores pro-
Markov) que modula la generación a nive- puestos, los cuales se basan en la medición
les inferiores. Su variabilidad en ese caso se de comportamientos asintóticos o en la
limita a las escalas contempladas (modelos minimización de funciones que suponen
"quasi-fractales") presentando el inconvenien- previamente una forma al espectro y que
te de que ofrecen estructuras complicadas, introducen siempre cierto sesgo en la me-
de escasa tratabilidad, cuya definición requie- dida, ya de por sí limitada a un estrecho
re un número amplio de parámetros, lo que intervalo. Esta problemática se agrava cuan-
perjudica la parsimonia del modelo. do estos diversos estimadores se aplican
sobre series de tráfico real finitas y con posi-
• Modelos autosemejantes. Estos modelos ya bles problemas de no estacionariedad. A esta
responden a estructuras estrictamente dificultad hay que añadir la complejidad
fractales, es decir, de variabilidad a todas las computacional de la propia estimación, así
escalas de tiempo. Se corresponden con como la complejidad de generación que la
modelos generalistas bien conocidos, como ejecución rigurosa de estos métodos reque-
los ruidos gaussianos fraccionarios o FGN riría, aunque se debe apuntar que existen
(Fractional Gaussian Noise), o los procesos soluciones aproximadas (que, por ejemplo,
ARMA integrados fraccionarios, o FARIMA. acotan el número de coeficientes a consi-
Mientras que los primeros generan señales derar) que pueden solventar parcialmente
fractales puras (con la misma forma de dis- este problema a efectos prácticos (Casilari
tribución estadística con independencia de et al.).
la escala temporal desde la que son con-
templados), los segundos son capaces de De esta manera, la aproximación a la naturaleza
añadir el ajuste de las dependencias a corto LRD exige decidir en un compromiso a favor de
plazo, o SRD, incorporando una típica es- la parsimonia o de la complejidad de medida y
Hallazgos - Revista de Investigaciones 127

generación. En cualquier caso, hay que reseñar


que el éxito de los modelos fractales vendrá de-
terminado por las consecuencias prácticas que
en la realidad posee la existencia de la LRD en
el tráfico telemático.

Así, uno de los principales efectos de cargar un


multiplexor con tráfico autosemejante o fractal
es el hecho de que las pérdidas decaen muy
lentamente conforme aumenta el buffer de con-
tención; en oposición, los modelos clásicos
(incorrelados o SRD) aumentar el buffer provoca
caídas exponenciales de las pérdidas. Esto pue-
de implicar la inutilidad de las técnicas de
buffering al tratar con tráfico fractal, ya que au-
mentar el buffer provoca incrementos en el re-
traso sin obtener ganancias significativas en cuan-
to a pérdidas. Sin embargo, son muchos los au- consecuencia de ello, se ha abierto un amplio
tores que opinan que este fenómeno puede ser espectro de líneas de investigación que condu-
omitido, pues sólo comienza a ponerse de ma- cen, por un lado, a resolver nuevos problemas
nifiesto con tamaños de buffer muy grandes, in- planteados en la aplicación de los modelos
tolerables de por sí para muchos tipos de servi- fractales en el análisis de prestaciones; y, por otro
cios, especialmente todos los que conllevan trans- lado, a disponer de resultados y argumentos que
misiones en tiempo real, como muchos servi- revelen el impacto de la estructura de correlación
cios de video. (a largo y a corto plazo) sobre las prestaciones de
las redes (López, José).
Otra problemática asociada a la fractalidad es su
escasa tratabilidad analítica, así como la conver- La autosimilitud estocástica, al igual que la
gencia más lenta de las medidas de simulación determinística, se puede ilustrar gráficamente,
que imponen estos procesos de variabilidad a como se ve en la figura anterior con la señal de
largo plazo (las simulaciones con procesos video MPEG y con el ruido autosemejante. Con-
fractales pueden llegar a ver su duración siderando que el tráfico es una traza muestral
incrementada en varios órdenes para obtener de un proceso estocástico y restringiendo la si-
resultados con la misma fiabilidad que los que militud a ciertas estadísticas de las series de tiem-
se pueden conseguir con procesos SRD o no po reescalizadas, se puede apreciar fácilmente
correlacionados similares) (Casilari et al.). autosimilitud exacta en los objetos matemáticos
abstractos y autosimilitud aproximada en las rea-
A modo de resumen, podría decirse que la apa-
lizaciones específicas (Alzate Monroy, Marco
rición de los modelos fractales en el campo de
Aurelio).
la modelación estocástica del tráfico ha resulta-
do fundamental, debido a su capacidad de exhi- Para medir la autosimilitud estocástica, se pue-
bir dependencia a largo plazo sobre todas las den utilizar las estadísticas de segundo orden
escalas temporales mediante el uso de pocos que capturan la variabilidad de los procesos. De
parámetros (modelación "parsimoniosa"). Como hecho, la invarianza a la escala se puede definir
128 Universidad Santo Tomás

en términos de la función de autocorrelación, El parámetro H, conocido como el parámetro de


pues el decrecimiento polinómico (en vez de Hurst, es la llave para medir la autosimilitud. Más
exponencial) de esta función es la manifesta- precisamente, H es una medida de la persisten-
ción de la "dependencia de largo rango" que, en cia de un fenómeno estadístico y es una medi-
una importante clase de procesos, es equivalen- da de la longitud de la dependencia de rango
te a la autosimilitud. largo en un proceso estocástico (Stallings, W.,
1998) Un valor de H=0.5 indica la ausencia de
Aunque los fenómenos de autosimilitud en el autosimilitud. El valor más alto de H es 1, el
tráfico de las actuales redes de comunicaciones mayor grado de persistencia de una dependen-
se descubrieron hace una década aproximada- cia de rango largo y la aleatoriedad desaparece.
mente, en nuestro medio no se ha abordado La condición H<0.5 es artificiosamente irreal, y
formalmente el tema, pues todavía se le consi- con H>1 se pierde la estacionariedad del proce-
dera como un aspecto muy avanzado de la so (Alzate M., Marco Aurelio, 2001).
teleinformática. Sin embargo, los efectos que
este fenómeno produce en el desempeño de Como un ejemplo basado en esta definición, se
las redes exigen un estudio inminente del tema. pasa a considerar el proceso de Movimiento
Si se quiere hacer un estudio serio del tema, se Browniano Fraccional (FBM), que es una genera-
debe ubicar al nivel de abstracción matemático lización del proceso de movimiento browniano.
que se necesita; por eso, la presentación de los El proceso FBM es frecuentemente usado en el
conceptos no puede dejar de ser formal (Alzate análisis del tráfico de datos autosimilar.
M., Marco Aurelio).
%+ W = ;W +  W > ≤+ < 
Definición en tiempo continuo
Donde X es una variable aleatoria normalmente
Una definición común de procesos estocásticos distribuida con media cero y varianza 1, y H es
el parámetro del proceso. Así, el valor del proce-
en tiempo continuo está basada en un escala-
so en el tiempo t es igual al valor de la variable
miento directo de la variable de tiempo conti-
aleatoria multiplicada por el intervalo de tiempo
nuo. Un proceso estocástico x(t) es elevado por la potencia H.
estadísticamente autosimilar con parámetro H
 ≤ + ≤  si por cualquier real a>0, el proce- Tenemos que E[BH(t)]=0 porque E[X]=0. Igual-
so a-H(at) tiene las mismas propiedades que x(t). mente, para cualquier variable aleatoria X y una
Esta relación puede ser expresada por las siguien- constante a, Var(aX)=a2Var(X). Por consiguien-
te, Var[BH(t)]=Var[tH X]=t2H. Para H=0.5, el pro-
tes tres condiciones:
ceso FMB se reduce a un proceso de movimien-
to browniano ordinario.
(> [ DW @
• (> [ W @ = media
D+ La densidad de probabilidad de un movimiento
browniano tiene la forma:

9DU > [ DW @
• 9DU > [ W @ = varianza 
D + H−[ W+

I %+ [ W =  

+
π W 

5 [ DW  DV
• 5 [ W  V = autocorrelación
D +
Hallazgos - Revista de Investigaciones 129

Se puede ver que este proceso tiene incrementos estacionarios y que:

 
9DU> % + W − % + V @ = (> % + W − % + V @ = W−V

La autocorrelación de BH(t) es expresada como RB(t,s)=E[BH(t)BH(s)], y puede ser deducida de la


siguiente manera:

  
( > % K W − % + V @ = ( > % + W + % + V −  % + W % + V @

( > % + W % + V @ =

(( % + W
>

@ +

( > % + V @ − ( > % + W − % + V

@ )



( > % + W % + V @ = (9DU > % + W @ + 9DU > % + V @ − 9DU > % + W − % + V @ )


( > % + W % + V @ =
 +

W (+ V + − W − V
+
)
Nuevamente, con H=0.5 se reduce la autocorrelación a la de un proceso de movimiento browniano.

Para ver que el proceso FMB es autosimilar, se debe satisfacer las tres condiciones anteriores. Conside-
rando el proceso BH(at)=X(at)H, es fácil ver que E[BH(at)]=aH E[BH(at)]=0, lo que satisface la primera
condición [Stallings, W., 1998].

Var[B H (at)]=Var[X(at)H]=(at) 2H Var[X]= (at)2H, lo que satisface la segunda condición. La tercera


condición se cumple de la siguiente forma:

5 % + DW  DV =


(
DW  + + DV  + − DW − DV
+
)

5 % + DW  DV =
D + +

(
W + V + − W − V
+
)
5 % + DW  DV = D  + 5 % + W  V

Considerando la correlación entre los incrementos desde -t hasta 0 y los incrementos desde 0 hasta t:

( [(% +  − % + − W )(% + W − % +  )] = ( [− % + − W % + W ]
130 Universidad Santo Tomás

( [(% +  − % + − W )(% + W − % +  )] = −



(W

 +
+ W
 +
− − W−W
 +
)

( [(% + % + − W )(% + W − % + )] =
  +  +
 −  W
 − W


Para H=0.5, la correlación de los incrementos pasados y futuros desaparece, como se requiere para un
movimiento browniano que tiene incrementos independientes. Pero, para H>0.5, se tiene una carac-
terística apreciable de persistencia (Stallings, W., 1998).

Definición en tiempo discreto

Para una serie de tiempo estacionaria x, se considera el "proceso agregado" con nivel de agregación
m, X(m) obtenido del proceso original X mediante la siguiente suma normalizada:

 NP

; N
P
=
P L
∑[
= NP − P −
L

Una forma de ver el proceso de agregación es como una técnica para compresión de la escala de
tiempo. Esto es, se hace una partición de X(t) en bloques no sobrelapados de tamaño m y se promedian
los valores de cada bloque. Se puede considerar X(t), ser la más alta manifestación o la mayor resolu-
ción posible para estas series de tiempo. Por ejemplo, el proceso X(3) es el proceso reducido en
magnificación por un factor de 3. Si las estadísticas del proceso (media, varianza, correlación, etc.) se
preservan con la compresión, entonces estamos tratando con un proceso autosimilar.

Para un proceso ergódico, el tiempo promedio puede ser igual al promedio total, y la varianza del
tiempo promedio puede ir a cero relativamente rápido a medida que m se vuelve más grande. Esto no
pasa para un proceso autosimilar; la varianza también va a cero, pero lo hace mucho más lentamente
que un proceso ergódico estacionario.

Un proceso X se dice que es exactamente autosimilar con parámetro ß (0<ß<1), si para todo m =1,2,...
se tiene:

9DU [
9DU [ P

varianza
PE

5[ P N 5[ N autocorrelación

El parámetro ß está relacionado con el parámetro de Hurst, definido como H=1-(ß/2). Para un proceso
estacionario ergódico, ß=1 y la varianza del tiempo promedio decaen a cero en una rata de 1/m. Para
un proceso autosimilar, la varianza del tiempo promedio decae más suavemente.
Hallazgos - Revista de Investigaciones 131

Se dice que un proceso X es asintóticamente autosimilar si para todo valor de k:

9DU [
9DU [ P =

varianza

5 [ P N → 5[ N P→∞ autocorrelación

Con estas definiciones de autosemejanza, la autocorrelación del proceso agregado tiene la misma
forma que el proceso original. Esto sugiere que el grado de variabilidad o de ráfaga puede ser el
mismo a diferentes escalas.

Una interesante característica de la definición anterior es que la autocorrelación del proceso agregado
autosimilar no va a cero cuando m-> ∞ . Esto en contraste con los procesos estocásticos típicamente
usados para el modelo de paquetes de datos, que tiene la siguiente relación:

5 P τ → 

P→∞

Una autocorrelación de la función R(τ), que es igual a cero, es consistente con el ruido blanco. En la
figura anterior se puede ver que a medida que el nivel de agregación incrementa (incrementa m) no
se tiene una estructura similar. Otra interesante característica es que la varianza x (m) decrece más
suavemente que 1/m cuando m-> ∞ ; esto es, que decrece proporcionalmente a 1/mß (Stallings, W.,
1998).

Dependencia de rango largo

Una de las propiedades más significativas de los procesos autosimilares es referida a la dependencia
de rango largo. Esta propiedad es definida en términos de la conducta de la autocovarianza C( τ)
cuando τ incrementa.

Para muchos procesos, la autocovarianza decae rápidamente con τ. Por ejemplo, para un proceso de
Poisson con incremento L y media λ, la autocovarianza para valores de τ >L es:

& τ = 5 τ − λ = λ − λ = 

En general, un proceso de dependencia de rango corto satisface la condición de que su autocovarianza


decae exponencialmente:

N
& N aD N → ∞ < D <

Donde a denota que la expresión a ambos lados es asintóticamente proporcional a la otra.


132 Universidad Santo Tomás

Los tipos de modelos de tráfico típicamente utilizados en la literatura emplean sólo modelos de
dependencia de corto rango, usando la ecuación:



∑ [
N=
N
=
− [
[ <

Se puede ver que la sumatoria ∑ N


& N es finita.

En contraste, un proceso de dependencia de rango largo tiene una autocovarianza que decae
hiperbólicamente:
−β
& N a N N → ∞ < β <

Donde β es el mismo parámetro definido anteriormente y que está relacionado con el parámetro de
Hurst (Stallings, W., 1998).

La dependencia de rango largo refleja la persistencia del fenómeno en procesos autosimilares (Stallings,
W., 1998). Hay diferencia conceptual entre autosimilitud y dependencia de rango largo. Hay procesos
autosimilares que no poseen dependencia de rango largo y viceversa. Sin embargo, bajo la restricción
0.5<H<1, existe una doble implicación entre autosimilitud y dependencia de rango largo; por eso,
muchas veces se usan como conceptos idénticos (Alzate, M., Marco Aurelio).

Densidad espectral

Una formulación equivalente de la dependencia de rango largo se puede dar en el dominio de la


frecuencia. Específicamente la densidad espectral de potencia obedece a la ley de potencia cerca del
origen:


6 ω a γ
ω →  <γ <
ω

Donde γ =1-β=2H-1. Esta divergencia de la densidad espectral de potencia cerca al origen indica una
importante contribución de los componentes de baja frecuencia.

La densidad espectral para un proceso estocástico en tiempo discreto es:

∞ ∞
6 ω = ∑ 5 N H −
N = −∞
M  Nω
6  = ∑ 5 N
N = −∞

En contraste, los procesos de dependencia de rango corto son caracterizados por una densidad espec-
tral finita cuando ω->0. Esto ocurre cuando γ = 0 ó, H=0.5 (Stallings, W., 1998).
Hallazgos - Revista de Investigaciones 133

Distribuciones de colas pesadas

Las distribuciones de cola pesada pueden ser usadas para caracterizar densidades de probabilidad que
describen el proceso de tráfico como paquetes a intervalos de tiempo y longitud de ráfagas.

La distribución de una variable aleatoria X se dice que es de cola pesada, si:


 − ) [ = 3U> ; > [@ a [ → ∞ <α

En general, una variable aleatoria con distribución de cola pesada exhibe una alta varianza o incluso
infinita varianza.

La distribución de cola pesada más simple es la distribución de Pareto con parámetros k y a (k,a>0),
con una densidad y una función de distribución:

I [ = ) [ =  [ ≤ N

α + α
α N N
I [ =   ) [ =  −   [ > N  α > 
N  [  [

Y el valor de la media es:

α
(> [ @ = N α > 
α −

El parámetro k especifica el mínimo valor que la ceso autorregresivo integrado de promedio mó-
variable aleatoria puede tener. El parámetro α viles (FARIMA).
determina la media y la varianza de la variable
aleatoria: si α ≤  , entonces la distribución tiene En particular, si d se encuentra en el intervalo
abierto (0,1/2), los procesos FARIMA poseen pro-
varianza infinita; y si α ≤  , tiene media y varianza
piedades LRD. Además de eso, poseen simultá-
infinitas.
neamente propiedades SRD debido a que se
La distribución de Pareto ha sido observada en pueden descomponer en un proceso ARMA y
una amplia variedad de fenómenos de las cien- otro FARIMA . El correspondiente proceso
cias sociales, físicas y de comunicaciones acumulativo es autosemejante con H=d+0.5
(Stallings, W., 1998). (Alzate, M. y Peña, N.).

• Modelos FARIMA • Modelos wavelet multifractales

Si la salida de un filtro ARMA se integra multi- El análisis Wavelet es un método eficaz para el
plicando su transformada Z con un integrador estudio de procesos autosemejantes, esto se
(1-z-1)d, donde d ∈ (-0.5, 0.5), se obtiene un pro- debe a que está orientado al estudio multirreso-
134 Universidad Santo Tomás

lución de señales, como la lectura de encefalo- Se pretende con este trabajo generar interés
gramas, con lo cual se puede analizar el com- en este tema, que es un área de estudio nue-
portamiento de la señal a diferentes escalas de va y que los ingenieros que se desempeñan
tiempo simultáneamente. en el área de las comunicaciones no pueden
dejar pasar.
Por medio de la transformada Wavelet se puede
transformar un proceso autosimilar con una es- Referencias
tructura de correlación compleja en una secuen-
cia de procesos gaussianos, independientes en- ALZATE, Marco y PEÑA, Néstor. Modelos de tráfi-
tre sí y no autocorrelacionados. co en análisis y control de redes de comunica-
ciones. Universidad Distrital-Universidad de Los
La ventaja que presenta la Transformada Wavelet Andes.
es que es posible hacer que la varianza de los
coeficientes Wavelet en cada escala conserven ALZATE MONROY, Marco Aurelio. «Introduccion
la información del grado de autosemejanza del al tráfico autosimilar redes de comunicaciones».
proceso, analizado todo esto por medio del pro- En: Revista Ingeniería. Universidad Distrital Fran-
cesamiento digital de señales multitasa. cisco José de Caldas, v.6, n.2, 2001.

Gracias a los procesos Wavelet, específicamente ARACIL, J. "Características del tráfico en la Internet
el Modelo Wavelet Multifractal (MWM), es posi- e implicaciones para el análisis y dimen-
ble hacer una sinterización de los procesos sionamiento de redes de ordenadores". En:
multifractales en el dominio de la escala (Alzate, Novática, n. 124, Noviembre/diciembre, 1996, pp.
M. y Peña, N.). 18-26.

CASILARI, A.; REYES LECUONA, A.; DÍAZ, Estrella y


Conclusiones SANDOVAL, F. Modelado de tráfico telemático.
Universidad de Málaga, Departamento de Tec-
Se presenta en este trabajo una introducción a
nología Electrónica, E.T.S.I. Telecomunicación.
los modelos de tráfico, describiendo las caracte-
rísticas que éstos deben tener para que sean LÓPEZ ARDAO, José Carlos. Contribución al aná-
modelos tratables desde todo punto de vista, y lisis del impacto de la correlación en las presta-
haciendo una caracterización de estos dependien- ciones de las redes de alta velocidad. Universi-
do de sus cualidades. Inherentemente a estas dad de Vigo: Departamento de Tecnologías de
cualidades se ve la evolución de estos modelos las Comunicaciones.
de tráfico, y precisamente por esto se hace ma-
yor hincapié en los modelos de dependencia de PROAKIS, John G. y MANOLAKIS, Dimitris G. Tra-
rango largo, ya que los modelos tradicionales tamiento digital de señales.
son insuficientes para caracterizar el tráfico en
las actuales redes de datos. Se introduce a los STALLINGS, W. Hight speed networks TCP/IP and
principales conceptos y modelos que son una ATM design principles. Prentice may, Inc., 1998.
manifestación de la complejidad de las redes de
telecomunicaciones que actualmente el hom-
bre ha desarrollado gracias a su ingenio investi-
gador.

Vous aimerez peut-être aussi