Académique Documents
Professionnel Documents
Culture Documents
Entendiendo y
caracterizando la
carga de trabajo
(Workload)
Introduccin
El funcionamiento de un sistema distribuido con muchos
clientes, servidores y redes dependen fuertemente en las
caractersticas de su carga. As, el primer paso en algn
estudio de evaluacin de funcionamiento debe entender y
caracterizar la carga de trabajo.
La carga de trabajo de un sistema puede ser definido como un
conjunto de todas las entradas que el sistema recibe de su
ambiente durante algn periodo de tiempo
Uno debe construir un modelo de Workload que capture las
caractersticas ms relevantes (tiempo de llegada y
terminacin, tiempo de cpu, N de operaciones I/O, etc.).
Introduccin
Los modelos de carga de trabajo (Workload) exponen
varias ventajas sobre cargas de trabajo actual o
rastros. Es posible cambiar parmetros del modelo
para reflejar cambios del sistema o en el actual
Workload.
Las caractersticas y parmetros que describirn la
carga de trabajo depende del objetivo del estudio.
Por ejemplo; si uno quiere estudiar el costo-beneficio
para crear un servidor Proxy para un sitio Web,
entonces las caractersticas de carga de trabajo
necesarias para el estudio son las frecuencias de
referencia de documentos, concentracin de
referencias, tamao de documentos y tiempos de
interreferencia.
Caracterizacin
Los pasos comunes para seguir cualquier proyecto de
caracterizacin de carga de trabajo incluyen:
1.
2.
3.
4.
5.
6.
Caracterizacin de
procesos de Workload
Actual
Workload
a
b
s
t
r
a
c
c
i
Caracterizacin
de procesos
Modelo
workload
Planificacin
de la capacidad
Vista
Tecnolgica
descriptores
Modelo
de
negocio
Caractersticas
del negocio
Modelo
funcional
Programas,
aplicaciones
y funciones
Modelo
de
recursos
Arquitectura
Del sitio
y demanda
de servicios
Mtrica
Externa
Mtrica
Interna
Modelo de
Workload
Una Metodologa de
caracterizacin de
Workload
6.
Utilizacin de recursos
Aplicaciones
Objetos
Orientacin geogrfica
Funcional
Unidades de organizacin
Promedio
Clustering
Anlisis de datos
Medidas de distancia
Ampliacin de tcnicas
Algoritmos de clustering
Web Workloads
Hay un cuerpo significativo de trabajo sobre la caracterizacin
del workload del trfico web. Unas de las caractersticas
consideradas tratan con distribuciones de tamao de archivo,
distribucin de popularidad de archivo, autosemejanza en
trafico Web, lugar de referencia, y solicitud de usuarios y
patrones.
Adems del estudio de la metodologa de caracterizacin del
workload, es importante revisar algunas propiedades
encontradas en el anlisis del actual trafico Web. Es decir, la
presencia del poder ley y la naturaleza de las rfagas del
trfico.
Power-Laws
Son expresiones de la forma y*x^ donde es una constante
y x e y son las medidas de inters. Se ha demostrado que
estas power-laws pueden ser usadas para describir
propiedades de la topologa de Internet.
Otra power-law es Zipfs Law que es la relacin entre la
frecuencia de ocurrencia de un evento y su rango, cuando los
eventos se clasifican con respecto a la frecuencia de
ocurrencia.
Las distribuciones Power-Law se han observado en diversos
aspectos de la web y puede ser utilizado para caracterizar el
comportamiento de los usuarios.
Rfagas de
Workloads
Benchmarck y
pruebas de
Desempeo
Introduccin
La naturaleza de
los benchmarcks
Arquitectura de los
benchmarks
Operaciones Bsicas.
Benchmarks de juegos.
Kernels.
Programas Reales.
Mediciones de Desempeo
Sistema
Arquitectura de los
benchmarks
Evitando fallas
Benchmarks mas
comunes
Benchmarks mas
comunes
Ejemplo CINT2000
Consta de 12 programas:
164.gzip
compresin
175.Vrp
176.gcc
Compilador C
181.mcf
186.crafty
Programa de ajedrez
197.parser
252.eon
visualizacin
253.perlbmk
Perl
254.gap
10
255.vortex
11
256.bzip2
Compresin
12
300.twolf
CFP2000
Consta de 14 programas:
168.Wupwise
Cromodinmica de cuantos
171.swim
172.mgrid
173.applu
177.mesa
Librera de grficos 3D
178.galgel
179.art
183.equake
187.facerec
10
188.ammp
Qumica computacional
11
189.lucas
12
191.fma3d
13
200.sixtrack
14
301.apsi
http://www.spec.org/cpu2000/results/
Benchmark a
servidores Web
Specweb
http://www.spec.org/web99/results/
WebStone
WebStone
Benchmarck de
Sistemas
Estos benchmark miden el sistema completo
(procesador, red, I/O, etc.)
Existen 4 benchmark tpc
1.
2.
3.
4.
Tcp-c
Tcp-h
Tcp-r
Tcp-w
TCP-C
Nueva orden
Pago
43%
Entrega
Estado de la orden
Nivel de stock
45%
4%
4%
4%
TPC-C
Para el TPC-C el desempeo es el mximo
numero de nueva orden por minuto que puede
ejecutar el sistema mientras ejecuta las otras
cuatro transacciones.
TPC-C Resultados
Compaa
Sistema
Procesos
BDMS
Sistema Operativo
Monitor de transacciones
Costo total del sistema
Desempeo TPC-C
Precio / Desempeo
X
Z
4
Microsoft SQL
Windows XP
Microsoft COM+
$US 445747
34600
$US 12,89
TPC-H y TCP-R
TCP-W
TCP-W
TCP-W
95% navegacin
80% navegacin 20%
50% navegacin 50%
TPC-W
TPC-W Resultados
Compaa
Sistema
Escala
Procesos
BDMS
Sistema Operativo
Servidor HTTP
Balanceador de carga
Ingeniera de Bsqueda
Costo total del sistema
Desempeo TPC-W
Precio / Desempeo
X
Z
10000
4
Microsoft Sql
Windows XP
Windows IIS
Microsoft Dns server
Microsoft Sql server FT
search
$US 211214
3130
$US 67,50
Pruebas de
Desempeo
Tipos de Pruebas de
desempeo
Entender el ambiente
Especificar el plan
Configurar el ambiente
Ejecutar la prueba
Modelos de
desempeo a nivel de
sistemas
Introduccin
Modelo de
poblacin infinita
Modelo de
poblacin finita
Z = tiempo de pensamiento.
La tasa promedio de peticiones generadas en el
sistema es representada por 1 / Z Pet/sec.
Modelo de rendimiento a
nivel de componentes ,
REPASO APLICADO
Introduccin
Red de gestin de
colas
Peticin espera en la cola el uso de un recurso.
S(n) tiempo promedio de servicio por peticin.
Modelos cerrados
Existe un nmero limitado de peticiones en el
sistema.
Mtodo para resolverlos es a travs de MVA
(mean value analisis).
Modelo cerrado de
clase simple
MVA esta basado sobre recursividad usando 3
ecuaciones:
La ecuacin de tiempo de residencia
La ecuacin de rendimiento
La ecuacin de largo de cola.
Modelo cerrado
clase mltiple.
Similar al anterior
Existe un nmero fijo de peticiones, Nr, por cada
clase en el sistema.
Es representado por un vector intensidad de carga.
Modelamiento
Intranet
Modelamiento
Intranet
Modelos de desempeo
Web
Caso especial de modelamiento:
Traffic burstiness.
Heavy-tails.
Servidor nico
Servidores redundantes.
Modelos de desempeo
Web
Traffic burstiness
Se entiende burst como un flujo masivo de peticiones.
Traffic burstiness
Calculo del factor de burstiness:
Utilizando un registro de peticiones HTTP con las
peticiones en un tiempo T, se calcula el promedio de
peticiones .
El tiempo T es dividido en n intervalos iguales y cada
intervalo es llamado epoch (poca).
Luego se contabiliza el nmero de peticiones de epoca
por sobre y bajo el promedio .
Finalmente, se divide el nmero de epocas que exceden
el promedio dividido por el nmero de epocas en total n.
Traffic bursting
Heavy-tails
La necesidad de este modelo radica en que se espera que
en un servicio Web exista un gran porcentaje de
peticiones HTTP para documentos de pequeo tamao y
un menor porcentaje para documentos de gran tamao,
volvindose estadsticamente poco significativo.
Modelo de colas Qn en
(a) servidor nico (b) servidores espejo.
Modelo de servidor
nico
El modelo de colas cerrado Qn usado para un servidor
nico se puede describir como:
Cola 1 y 6: representa los links de entrada y salida del
router a la conexin del ISP (se asume que la conexin es
full duplex).
Delay 2: representa el router por su pequea latencia
comparada con los otros elementos.
Cola 3: representa la LAN y es independiente de la carga.
Cola 4: representa la CPU del servidor.
Cola 5: representa el disco del servidor.