Vous êtes sur la page 1sur 14

Citacin: Ramrez, O.L., y Torres, J.A. (2010).

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana. En: Ingeniera, Vol. 15, No. 2, Pg. 82 - 95

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana
A capacity planning model for web hosting providers serving small- and medium-scale businesses in Colombia
Olga Luca Ramrez Calero
Universidad Distrital Francisco Jos de Caldas Facultad de Ingeniera olga.lucia.ramirez@gmail.com

Resumen
La administracin y dimensionamiento de recursos de infraestructura de un servicio web hosting, que consiste en proveer alojamiento para que una pgina web funcione correctamente [21], se realiza con un alto costo en servidores de elevado tamao y disponibilidad, mediante el monitoreo de indicadores del nivel de ocupacin de la capacidad que establecen reactivamente necesidades de modificacin de la misma, o de otra forma, mediante una infraestructura redundante que significa incrementar el nmero de componentes para garantizar la disponibilidad del servicio. En un servicio dirigido a pequeas y medianas empresas, se requiere cumplir ciertos niveles de disponibilidad a bajo costo. El presente artculo contiene los resultados de una investigacin acerca del diseo, desarrollo y validacin de un modelo de optimizacin de capacidades para el dimensionamiento y seleccin de la mejor combinacin de recursos de infraestructura (servidor, disco duro, memoria RAM y procesador) en el servicio web hosting dirigido a PYMES colombianas. Palabras clave: Capacidades, dimensionamiento, investigacin de operaciones, minera de datos, optimizacin, PYME, web hosting.

Jairo Humberto Torres Acosta


Universidad Distrital Francisco Jos de Caldas Facultad de Ingeniera jatorres@udistrital.edu.co

Abstract
Infrastructure resource management and capacity planning of a web hosting service, which consists on assigning shared resources of a computer server to run multiple websites [21], are achieved at a high cost in terms of large-scale high-availability servers. This is carried out by monitoring capacity indicators that reactively establish the capacity needs, or else, by using redundant IT infrastructure, which implies increasing the number of hardware components to ensure service availability. When providing services intended for small- and mediumscale businesses, it is necessary to meet certain availability requirements at low cost. This paper presents research results on the design, development and validation of a capacity optimization model that allows sizing and selecting the best combination of server infrastructure resources (hard disk, RAM and processor) in a web hosting service, intended for small- and medium-scale businesses in Colombia. Key words: Capacity, data mining, operations, research, SBM, sizing, web hosting.
82
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

1 Introduccin
La pequea y mediana empresa (PYME) colombiana genera un impacto significativo en el dinamismo de su economa [11], lo cual unido al actual auge de los mercados electrnicos, hacen patente la necesidad de ofrecer sus servicios a travs de Internet. No obstante, las PYMES colombianas presentan acceso limitado a las Tecnologas de Informacin y Comunicacin (TIC), como lo indican algunos estudios [6][12], dificultando as su participacin en el mercado virtual de forma competitiva. La publicacin de tales servicios requiere del diseo y puesta en marcha de una pgina Web y de la adquisicin de un servicio de web hosting, el cual ha experimentado crecimientos del 10% en el ao 2009 y del 9,1% en el 2010 situndose en 420 millones de euros, con una tendencia a la alza que permite estimar un incremento del mercado del 13% para el ao 2011 [13]. Pese al crecimiento del servicio web hosting, se presentan en Colombia debilidades en su oferta debido principalmente a la inestabilidad de los proveedores y el sobredimensionamiento de la capacidad de recursos necesarios, lo que implica incurrir en altos costos de infraestructura tecnolgica, o el sub-dimensionamiento que, en un sentido ms amplio, implica baja cobertura, baja disponibilidad e insatisfaccin del cliente [8][17][21]. La revisin sobre el estado del arte de trabajos relacionados con modelos de capacidad de recursos tecnolgicos [1] [3] [5] [10] [15] [16] [17] [18][22] [23] [26][27], no evidenci un tratamiento especfico de modelos matemticos para optimizacin de la combinacin de recursos e infraestructura tecnolgica para garantizar la disponibilidad del servicio web hosting en los niveles acordados con el cliente. Actualmente, el dimensionamiento de la infraestructura tecnolgica, se realiza mediante el monitoreo y seguimiento a indicadores sobre disponibilidad del servicio, que sealan el nivel de utilizacin de la capacidad y sus necesidades de su ampliacin. En nuestra opinin se requiere trascender de la administracin basada en el seguimiento de indicadores reactivos, hacia una gestin con base en planeacin preventiva [9]. El principal objetivo de esta investigacin consiste en el diseo, desarrollo y validacin de un modelo matemtico basado en anlisis de capacidades, para optimizar o por lo menos definir eficazmente y de manera anticipada el dimensionamiento y seleccin de la mejor combinacin de recursos de infraestructura tecnolgica, de manera que se pueda satisfacer la demanda de alojamiento y procesamiento de solicitudes de visitas a las pginas Web, en el servicio web hosting dirigido a las PYMES colombianas. Los parmetros para el dimensionamiento se delimitaron en torno a recursos de infraestructura de servidor, disco duro, memoria RAM y procesador. El articulo presenta una breve descripcin del servicio web hosting y de las herramientas utilizadas para la administracin de la capacidad. Contina con un resumen del anlisis de capacidades. Luego expone la metodologa de desarrollo y validacin del modelo matemtico, los resultados y las conclusiones.

2 Marco terico
2.1 Servicio web hosting
El servicio web hosting, debe proporcionar disponibilidad durante las 24 horas del da, capacidad para abastecer la demanda de solicitudes de visita a las pginas Web alojadas, una conexin rpida a internet y un espacio para almacenamiento de informacin que sea flexible a las necesidades de crecimiento.
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

83

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

En el caso de las PYMES colombianas se utiliza principalmente el servicio sharedhosting, hosting de tipo compartido, que consiste en alojar clientes de varios sitios en un mismo servidor, de forma econmica y con adecuado rendimiento [3] [9]. Entre los principales recursos de infraestructura que componen el hardware de un servicio sharedwebhosting se encuentran el servidor, el disco duro, la memoria RAM, el procesador y la red con sus componentes como repetidores, switches, bridges, routers y fierwalls [5] [15] [16] [27]. En la actualidad, stos recursos de infraestructura, son administrados mediante los mecanismos explicados a continuacin, los cuales no se consideran dentro del desarrollo del modelo de dimensionamiento objeto del presente artculo, debido a que su instalacin implica elevados costos para aumentar el nmero de componentes o una gestin reactiva ante necesidades de ampliacin o reduccin de capacidad [1] [16] [17] [18] [22] [27]: Redundancia: Aumentar o duplicar el nmero de componentes de hardware de la infraestructura. Incrementa de manera significativa los costos y gastos de la operacin [6][10]. Monitoreo de los niveles de servicio: Medicin de los niveles a travs de indicadores y seales de alerta que establecen reactivamente necesidades de ampliacin o reduccin de capacidad [6][16] [17] [18][22] [27]: Arquitectura de mltiples capas: Infraestructura en la que los requerimientos hechos por estaciones de trabajo, son transmitidos a servidores que se ocupan del desarrollo de una actividad especfica correspondiente a cada una de las capas del modelo [6] [9] [19] [21] [22] [27]. Esquema de failover y clster: Instalacin de servidores duplicados funcionando como pares redundantes, que actan automticamente en caso de falla de los principales [1] [6] [9][16] [17] [18] [19] [21][22][27].

2.2 Anlisis de capacidades


El desarrollo del modelo matemtico se aborda desde la perspectiva de la teora de anlisis y programacin de capacidades de los medios de trabajo, que permite el diseo de modelos de optimizacin para la planeacin de la capacidad en sistemas productivos. El modelo presentado aqu es una transferencia del dominio de capacidades en sistemas productivos al de capacidades de infraestructura en las Tecnologas de la Informacin y de la Comunicacin (TIC), lo cual es el principal aporte del estudio. La capacidad se define como la cantidad de producto o servicio que puede ser obtenido por una determinada unidad productiva, durante un cierto periodo de tiempo [7] [20]. Se destacan los siguientes tipos de capacidad: Capacidad instalada (Ci): Capacidad mxima de produccin prevista con la construccin de mquinas, instalaciones y equipos, disminuida por las necesidades de mantenimiento y funcionamiento normal del medio de trabajo. Capacidad disponible (Cd): Capacidad instalada disminuida por los das no laborales del ao, horas perdidas por ausentismos, organizacionales y por factores de fuerza mayor. Capacidad necesaria (Cn): Nivel de capacidad requerida en un periodo de tiempo.
84
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

Para el desarrollo del modelo, se tuvo en consideracin el concepto de capacidad disponible (Cd) para calcular el nmero mximo de kilobytes que puede procesar un tipo de recurso de infraestructura, enmarcado en el contexto de programacin lineal, la cual permite describir y optimizar una funcin objetivo sujeta a unas restricciones, asignando de la mejor manera posible recursos limitados entre actividades competitivas [7] [14].

3. Metodologa
La metodologa de la investigacin presentada en este artculo, parte de la elaboracin de una propuesta del modelo matemtico, contina con la validacin del mismo mediante el anlisis de datos de entrada y la estimacin de parmetros, la solucin y el anlisis de datos salida, y finaliza con ajustes y calibraciones al modelo. Como parte de la metodologa y aporte a la comprensin del problema, la Figura 1 presenta el contexto del servicio web hosting, restricciones, variables de decisin, parmetros y proceso necesarios para la elaboracin del modelo.

4. Desarrollo del modelo matemtico


4.1 Planteamiento
La solucin del problema busca determinar el nmero mnimo de recursos de infraestructura tipo servidor, disco duro, memoria RAM y procesador, necesario para abastecer la demanda de alojamiento y solicitudes de visita a pginas Web de los proveedores de servicios web hosting dirigido a PYMES colombianas. Se definieron un mximo de 32 unidades de procesamiento o ncleos de procesador por servidor, 4 GB de memoria y 8 discos duros de 500 GB. El tamao de red o ancho de banda se considera un parmetro constante y se asume que el recurso de infraestructura no podr procesar una mayor cantidad de kilobytes de los que puede procesar la red. Para el clculo de la demanda, se da como supuesto que el conjunto de proveedores utilizados en la muestra para validacin del modelo, desea alcanzar un porcentaje del 0,05% de participacin en el mercado colombiano de alojamiento de pginas Web para PYMES. La capacidad disponible de los recursos se reduce como resultado del almacenamiento y operacin normal del sistema operativo y de la ejecucin de tareas y aplicaciones bsicas del servidor. La capacidad disponible del procesador se reduce en un 2%, la de la memoria RAM en 500 MB y la del disco duro en 20 GB. El modelo considera mximo cinco (5) tipos diferentes de combinaciones de recursos de infraestructura, es decir, mximo cinco (5) tipos diferentes de servidores, con su(s) respectivo(s) disco(s) duro(s), memoria RAM y procesador(es). Cada combinacin se realiza basada en el siguiente supuesto: el servidor tipo 1 (j=1) est conformado por los recursos de infraestructura j con estndar k tipo 1, el servidor tipo 2 (j=2) est conformado por los recursos de infraestructura j con estndar k tipo 2, y as sucesivamente hasta el servidor tipo 5 (j=5).

INGENIERA

Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

85

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

4.2 Desarrollo del modelo


Se dise un modelo de optimizacin que utiliza como tcnica base la programacin lineal entera y binaria, con una funcin objetivo que minimiza el nmero de recursos de infraestructura necesarios para abastecer la demanda de alojamiento y solicitudes de visita a las pginas Web, entendindose que al minimizar el nmero de recursos de infraestructura necesarios, se reducen sustancialmente los costos de procesamiento, debido que es menor la inversin en mquinas, mantenimiento, instalaciones y energa. Segn lo observado en el contexto del modelo presentado en la Figura 1, el servicio web hosting contiene elementos cuya magnitud se busca conocer para hallar la solucin ptima del problema (variables de decisin), elementos que caracterizan el costo, el beneficio o el ritmo al cual se consume un recurso (parmetros), limitaciones que restringen el cumplimiento del objetivo (restricciones) y un objetivo claramente definido que corresponde al inters principal del decisor (funcin objetivo).

Figura 1. Contexto del servicio web hosting para el desarrollo del modelo matemtico.

Un aporte complementario de este estudio y el punto de partida para el planteamiento del modelo, es la definicin de una regla para el clculo de capacidad disponible de los recursos de infraestructura tecnolgica, como se describe en la siguiente seccin.
4.2.1 Capacidad disponible

Considerando que el servicio web hosting opera de manera automatizada a travs de mquinas o recursos de infraestructura, para el clculo de la capacidad se tuvo en cuenta el nmero de kilobytes que puede procesar y/o almacenar el recurso tipo j, reducidos por el porcentaje de tiempo requerido para el mantenimiento preventivo de las mquinas y el porcentaje de tiempo que el servicio no se encuentra disponible por otros factores diferentes a mantenimiento preventivo (protocol status), es decir,
Cdisjk = [ KBjk * P * 1 ( 1-uj ) - gjk ] (1)

Donde:
86
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

KBjk = Nmero mximo de kilobytes que puede procesar el recurso de infraestructura tipo j, con el estndar de tamao tipo k. P = Porcentaje de solicitudes que no han sido rechazadas por el servidor. En consecuencia, el parmetro protocol status corresponde al nmero de solicitudes que han sido rechazadas por el servidor. gjk = Consumo normal del recurso tipo j con el estndar tipo k (en kilobytes), que reduce la capacidad disponible como resultado de la operacin normal del sistema operativo y de la ejecucin de tareas bsicas del procesador. uj: Porcentaje de tiempo necesario para mantenimiento preventivo del recurso de infraestructura tipo j. Obsrvese que para todo el modelo: j = 1,2,3,4 (Tipo de recurso de infraestructura: 1. Disco duro, 2. Memoria RAM, 3. Procesador, 4. Servidor). k = 1,2,,s (Tamao del recurso en unidades de kilobytes).
4.2.2 Forma general del modelo Optimizar f (Xj,k; j = 1,2,...,n;k = 1,2...,s) = Min

X
j=1 k=1

jk

(2)

Sujeto a:

k=1

Cdisp 1k * X1k -

a *Y
1

(3)

i=1

k=1 m

Cdisp jk * Xjk -

b *D *Y
ij 1

(4) (5)

i=1

W1 Y1

b * D * Y h *X
s i=1 j=1
ij 1 1 k

4k

* Zk

(6) (7) (8) (9) (10) (11) (12)


87

k=1

Z =1
k

k=1 s

X 1
jk

k=1

Cdisp 1k * X1k 8 * 500 Mb * X4k Cdisp 2k * X2k 500 Mb * X4k Cdisp 3k * X3k 32 * Cdisp 3k * X4k Xjk X4k
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

u *X
j

jk

Tmanj

j=1

(13) (14) (15) (16)

Xjk , Yi 0 Xjk , Yi Enteras Zk = 0 1

Cada una de las restricciones corresponde a: (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16) Capacidad de almacenamiento en el disco duro. Capacidad de procesamiento y almacenamiento en la memoria RAM. Demanda del nmero de pginas web. El nmero de kilobytes procesados por solicitud de acceso, debe ser menor al ancho de banda. Solamente se puede seleccionar un tipo de ancho de banda. Se debe seleccionar al menos un recurso de infraestructura tipo j con el estndar de tamao k. Solamente se permiten ocho (8) discos duros de 500 Mb por servidor. Solamente se permiten 500 Mb de memoria RAM por servidor. Solamente se permiten 32 unidades o ncleos de procesamiento por servidor. Debe seleccionarse al menos un recurso de infraestructura j tipo k, por cada servidor tipo k que sea seleccionado. Tiempo mximo permitido para mantenimiento del recurso tipo j. No negatividad de las variables. Variables enteras. Variable binaria.

Se asumieron los siguientes subndices para los parmetros y variables: j = 1,2,3,4 (Tipo de recurso de infraestructura: 1. Disco duro, 2. Memoria RAM, 3. Procesador, 4. Servidor).
A A
88

k = 1,2,,s (Tamao del recurso en unidades de kilobytes).

i = 1,2,,m (Tipo de conjuntos de pginas Web alojadas en el servicio web hosting, obtenido a partir de la segmentacin del comportamiento de visitas a las mismas. Para mayor detalle, ver la seccin 5).
4.2.3 Parmetros
A

h: Ancho de banda. Di: Nmero de solicitudes de acceso a la pgina Web tipo i. Wi: Demanda mnima de pginas Web alojadas en el hosting por unidad de tiempo.
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

ai: Nmero de kilobytes usados del disco duro por pgina Web tipo i por unidad de tiempo. bij: Nmero de kilobytes procesados por solicitud de acceso a la pgina Web tipo i en el recurso de infraestructura tipo j por unidad de tiempo. Cdisj: Capacidad disponible del recurso de infraestructura tipo j en unidades de kilobytes. ej: Mximo nmero de unidades de almacenamiento o procesamiento permitidas por recurso de infraestructura tipo j. Tmanj: Tiempo mximo de mantenimiento permitido para el recurso de infraestructura tipo j. P: Porcentaje de solicitudes no defectuosas segn el protocol status.
4.2.4 Variables de decisin

Xjk: Nmero de mquinas o recursos de infraestructura tipo j, con tamao estndar tipo k. Yi: Nmero de pginas web tipo i a alojar en el hosting. Zk: Variable binaria que indica si se selecciona o no el ancho de banda con el estndar tipo k.

5. Validacin del modelo


Para la validacin del modelo y estimacin de parmetros, se tom una poblacin de setecientas treinta y cinco (735) pginas Web con aproximadamente cincuenta (50) millones de registros de solicitudes de acceso o visitas a las pginas, las cuales se encuentran alojadas en un servicio web hosting dirigido a PYMES colombianas. De dicha poblacin, se seleccion una muestra probabilstica de cuarenta y dos (42) pginas web que contenan 3.199.600 registros de solicitudes de acceso. Debido al alto volumen de informacin, dentro del anlisis de datos de entrada para la estimacin de parmetros se utilizaron tcnicas de minera de datos. Se realizaron los siguientes anlisis utilizando los datos de entrada: 1. Determinacin del tamao de la muestra probabilstica, de pginas Web a seleccionar como unidades experimentales, a partir la poblacin de 735 pginas web. 2. Estadstica descriptiva y anlisis exploratorio de datos de los parmetros ai, Di y bij definidos anteriormente, comparado por tipo de pgina web, con el fin de establecer si las medias diferan para cada pgina o conjuntos de pginas Web, y determinar si se deban establecer segmentos de pginas sobre los cuales realizar de manera independiente la estimacin de parmetros y el anlisis de comportamiento de los datos. 3. Segmentacin de las unidades experimentales, es decir, definicin de conjuntos homogneos de pginas Web, de acuerdo con el resultado obtenido en el inciso anterior. 4. Estadstica descriptiva y anlisis exploratorio para conocer el comportamiento de los datos, por segmentos o conjuntos de pginas Web. 5. Estimacin de parmetros a partir de las estadsticas descriptivas y clculo de los
INGENIERA Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

89

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

intervalos de confianza de los mismos, con el fin de realizar un anlisis de sensibilidad del modelo, utilizando como datos de entrada la media, el lmite mximo y mnimo del intervalo de cada parmetro. 6. Aplicacin del modelo matemtico, generacin de resultados y anlisis de sensibilidad de los mismos bajo los escenarios del comportamiento medio, mximo y mnimo de los parmetros. 7. Anlisis de resultados.

5.1 Anlisis de datos de entrada


Para determinar el tamao de la muestra, se utiliz una ecuacin de muestra probabilstica tomada de Hernndez Sampieri [22]. n n= (17) n
1+ N
2

n = s2 =
2

s V2 p (1 - p )
2

(18) (19) (20)

V = se

Donde: p: Probabilidad de que la media de la muestra X estime el valor real de la media de la poblacin . s2: Varianza de la muestra expresada como la probabilidad de ocurrencia de X. se2:Error estndar del tamao de la muestra determinado por el investigador. V2: Varianza de la poblacin. Corresponde al cuadrado del error estndar. N: Tamao de la poblacin. n: Tamao de la muestra sin ajustar. n: Tamao de la muestra ajustada. Se seleccion como p, el valor de 0,99, es decir un 99% de probabilidad de que la media de la muestra estime el valor real de la media de la poblacin. Por lo tanto, el error de estimacin de la media de la poblacin corresponde a 1%. Como error de estimacin del tamao de la muestra se seleccion un 1,5% de error. El tamao de muestra obtenido fue de cuarenta y dos (42) pginas Web; para la seleccin de la misma se defini como unidad de anlisis la variable Di, multiplicado por la variable bij. La muestra seleccionada correspondi a las cuarenta y dos (42) pginas web con el mayor producto Di*bij, teniendo en cuenta que lo que se buscaba era determinar el dimensionamiento del servicio web hosting y por lo tanto, era importante conocer las caractersticas de las PYMES que generan un mayor consumo de capacidad cuando se realizan visitas a sus pginas, es decir, tanto las pginas con el mayor nmero de kilobytes procesados por minuto, como las pginas con el mayor nmero de solicitudes de acceso por minuto.
90
INGENIERA Vol. 15 No. 1 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

A partir de la muestra de las 42 pginas Web se realiz un anlisis exploratorio de los parmetros Di y bij, encontrndose la necesidad de realizar una segmentacin de los datos por tipo de pgina Web, dado que los resultados tanto de las medias de Di y bi son inferiores a los resultados de sus respectivas desviaciones estndar, lo cual permite presumir que existen diferencias significativas en la muestra. En la Tabla I se presentan los resultados del anlisis exploratorio preliminar.
Tabla I. Estadsticos descriptivos parmetros Di y bij Di: Sol bi: Kb N 3199600 3199600 Mn 1 1 Mx 3965 497081 Media 91,022 1108,02 Desv. 147,419 5404,84

Con el fin de confirmar o descartar la sospecha que puede existir una diferencia significativa entre las medias de las diferentes pginas Web, se realiz un anlisis de varianza ANOVA para los parmetros Di y bij. Como resultado se encontr que a un nivel de significancia del 5% existe suficiente evidencia estadstica para rechazarla hiptesis nula que la media de los parmetros Di y bij son iguales. Se concluye que existe una diferencia significativa entre las medias de los parmetros y es necesario segmentar el anlisis de datos de entrada y la corrida del modelo matemtico por tipo de pgina i. De la misma forma los resultados del anlisis exploratorio para el parmetro ai indicaron que se deba realizar una segmentacin de los datos por tipo de pgina Web. La segmentacin de los datos se realiz a travs del algoritmo de k-medias para definicin de clster de informacin, utilizando el software R para minera de datos. A partir de la segmentacin se obtuvieron cinco (5) tipos diferentes de pginas Web, representados con el subndice i. A partir de los segmentos o conjuntos de pginas Web, se realizaron estimaciones por intervalos de los parmetros ai, Di y bij.; dado que la desviacin estndar xera desconocida y n era mayor que 30, se utiliz el intervalo de confianza para estimar la media x con muestras grandes [2] [24]. En la Ecuacin (21) se presenta la frmula para el clculo de este intervalo de confianza: Donde:
Sx Sx X - z ____ < x < X + z ____ n n X: Media de los datos.

(19)

Sx: Desviacin estndar de los datos. z: Estandarizacin de la distribucin normal para un nivel de significancia del 5%. n: Tamao de la muestra. En la Tabla II se presentan los resultados del clculo de los intervalos de confianza utilizando la Ecuacin (21) para los diferentes parmetros del modelo, obteniendo como
INGENIERA Vol. 15 No. 1 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

91

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

resultado los escenarios mnimo, medio y mximo de dichos parmetros, que son utilizados para la aplicacin y validacin del modelo.
Tabla II. Datos de entrada para la corrida del modelo en kilobytes Parmetro 1,0
Di (medio) Di (mnimo) Di (mximo) bi (medio) bi (mnimo) bi (mximo) ai (medio) ai (mnimo) ai (mximo) Wi Di * bi (medio) Di * bi (mn.) Di * bi (mx.) Di * bi * Wi (medio) Di * bi * Wi (mn.) Di * bi * Wi (mx.) P Cdis Disco Duro Cdis Memoria RAM Cdis Procesador (Cdis Procesador)*32 Cdis Servidor j=4 Ancho de banda h 11,0 11,0 11,0 691,0 690,0 692,0 1829059,0 1808702,0 1849417,0 181,0 7599,0 7577,0 7621,0 1375403,0 1371368,0 1379444,0 0,997 135803671,0 2623503,0 762373478,0 24395951296,0 N/A 3145728000,0 222552611,0 3668671,0 700559386,0 22417900352,0 N/A 4194304000,0 466076743,0 1578335,0 608982995,0 19487455840,0 N/A 6291456000,0 709600874,0 533167,0 549458342,0 17582666944,0 N/A 8388608000,0 976118700,0 N/A 425830215,0 13626566880,0 N/A 10485760000,0

2,0
292,0 292,0 292,0 12769,0 12724,0 12815,0 4225825,0 4193094,0 4258557,0 4,0 3730365,0 3714345,0 3746405,0 675196042,0 672296360,0 678099277,0

Tipo pgina 3,0


634,0 633,0 636,0 386860,0 362091,0 411629,0 886201,0 872468,0 899935,0 23,0 245350436,0 229066710,0 261712858,0 44408428953,0 41461074527,0 47370027281,0

4,0
59,0 59,0 59,0 206484,0 204339,0 208629,0 5547400,0 5547400,0 5547400,0 1,0 12267217,0 12131887,0 12402712,0 2220366244,0 2195871625,0 2244890934,0

5,0
140,0 139,0 140,0 44676,0 44351,0 45001,0 107965,0 105443,0 110488,0 925,0 6235862,0 6186537,0 6285245,0 1128691044,0 1119763258,0 1137629413,0

Tabla III. Resultados de la aplicacin del modelo para los escenarios mnimo, medio y mximo de los parmetros Tipo de Recurso Xj,k
Escenario Mnimo
Servidor 1

Demanda
j=2 4 2 GB 2 j=2 4 2GB 2 j=2 4 2 GB 2 j=2 4 2GB 2 j=2 4 2 GB 2 j=2 4 2GB 2 j=3 4 2,4 GH 14N = 4P j=3 5 1,86 GH 19N = 5P j=3 4 2,4 GH 16N = 4P j=3 5 1,86 GH 18N = 5P j=3 4 2,4 GH 15N = 6P j=3 5 1,86 GH 19N = 5P

Tipo j Estndar k-Tamao Cantidad Tipo j Estndar k-Tamao Cantidad Tipo j Estndar k-Tamao Cantidad Tipo j Estndar k-Tamao Cantidad Tipo j Estndar k-Tamao Cantidad Tipo j Estndar k-Tamao Cantidad

j=4 4 1 j=4 5 1 j=4 4 1 j=4 5 1 j=4 4 1 j=4 5 1

j=1 4 750 GB 3 j=1 5 1 TB 3 j=1 4 750 GB 3 j=1 5 1 TB 3 j=1 4 750 GB 3 j=1 5 1 TB 3

Yi Cant. Di * bij

Y2 4 3.714.345

Y3 23 229.066.710

Y4 1 12.131.887

Servidor 1 Servidor 2

Ancho de banda

10000 GB

Escenario Medio

Yi Cant. Di * bij

Y2 4 3.714.345

Y3 23 229.066.710

Y4 1 12.131.887

Servidor 1 Servidor 2

Ancho de banda

10000 GB

Escenario Mximo

Yi Cant. Di * bij

Y2 4 3.714.345

Y3 23 229.066.710

Y4 1 12.131.887

Servidor 2

Ancho de banda

10000 GB

Donde, N = Ncleos P = Procesadores Di * bij Se encuentra en unidades de kilobytes

92

INGENIERA

Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

5.2 Aplicacin del modelo


Despus de estimar todos los parmetros del modelo utilizando la muestra de 42 pginas Web, se calcul la capacidad disponible para los recursos de infraestructura: Disco duro, memoria RAM y procesador, utilizando la Ecuacin (1). La aplicacin del modelo se realiz utilizando el software de optimizacin GAMSIDE. Los resultados bajo el escenario mnimo, medio y mximo de los parmetros ai, Di y bij se presentan en la Tabla III.

5.3 Anlisis de resultados


Despus de aplicar el modelo para los escenarios mnimo, medio y mximo de los parmetros ai, bij y Di, se encontr que las variables X1k: Nmero de servidores requeridos con el estndar tipo k, X2k: Nmero de memorias RAM requeridas con el estndar tipo k y X4k: Nmero de servidores requeridos con el estndar tipo k, presentaron el mismo resultado, lo cual indic que no existe diferencia significativa entre el nmero de recursos de infraestructura tipo disco duro, memoria RAM y servidor, independiente de la desviacin estndar y el comportamiento extremo de los parmetros. En el caso de la variable X3k: Nmero de procesadores requeridos con el estndar tipo k, los resultados obtenidos fueron diferentes en las soluciones del modelo bajo los escenarios mnimo, medio y mximo de los parmetros. Con el fin de establecer si diferan significativamente, se realiz una prueba de ANOVA, con las siguientes hiptesis: H0: 1= 2 = 3. No existe diferencia significativa entre el nmero de recursos de infraestructura tipo X3k para los escenarios mnimo, medio y mximo de los parmetros ai, bij y Di. H1: 1 2 3. Al menos un par de medias del nmero de recursos de infraestructura tipo X3k para los escenarios mnimo, medio y mximo de los parmetros ai, bij y Di, difiere entre s. Como resultado de la prueba ANOVA, se encontrque a un nivel de significancia del 5% existe suficiente evidencia estadstica para no rechazar la hiptesis nula de que la medias de la variable X3kson iguales para los tres escenarios de los parmetros ai, bij y Di. Por lo tanto, independiente de la desviacin estndar y el comportamiento extremo de los parmetros ai, bij y Di, el nmero de procesadores requeridos para satisfacer la demanda de alojamiento y solicitudes de visitas a las pginas Web, no presenta una diferencia significativa desde el punto de vista estadstico. Lo anterior confirma la viabilidad de utilizar un modelo matemtico basado en programacin lineal y anlisis de capacidades, ya que la solucin del modelo para los escenarios mnimo, medio y mximo de los parmetros arroja resultados del nmero de recursos de infraestructura tipo servidor, disco duro, memoria RAM y procesador que no difieren significativamente entre s.

INGENIERA

Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

93

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequea y mediana empresa colombiana

6. Conclusiones
El modelo matemtico es viable en la medida que permite cumplir el objetivo general de la investigacin, ya que es til para el dimensionamiento eficaz de recursos y seleccin de la mejor combinacin de infraestructura tecnolgica del servicio web hosting dirigido a PYMES colombianas, en condiciones promedio y extremas de demanda del servicio, es decir, escenarios mnimo, medio y mximo de los parmetros, pues los resultados del nmero de recursos de infraestructura tipo servidor, disco duro, memoria RAM y procesador arrojados por el modelo, no difieren significativamente entre s, desde el punto de vista estadstico. Se present una propuesta inicial para un mtodo ingenieril que pueda contribuir en el futuro a sustituir la gestin reactiva de infraestructura mediante la estimacin de recursos, compra e instalacin de mquinas, monitoreo de su utilizacin, identificacin de necesidades de reduccin o ampliacin de capacidad de inversin, por un nuevo mtodo basado en un modelo matemtico para realizar un anlisis prospectivo de la demanda y estimar la capacidad y cantidad de recursos de infraestructura tipo disco duro, procesador y memoria RAM, necesarios para satisfacerla.

7. Referencias
[1] [2] [3] [4] [5] [6] [7] [8] [9] Anandasivam, A. (2009). A Heuristic Approach for Capacity Control in Clouds. IEEE Conf. onCommerce+Enterprise Computing. Garca Sipolis, A. y Simn de Blas, C. (2000). Manual de Estadstica. Universidad Rey Juan Carlos. Ed. Dykinson, Madrid. Daccach, C. (2000). Arquitectura para comercio electrnico. Revista Sistemas, Asociacin Colombiana de Ingenieros de Sistemas (ACIS), Colombia, Vol. 78. 37-49. Figallo, C. (1998). Internet world: Hosting web communities. Editorial Wiley, USA. Huang, C-Y. (2007). Concentration of Web users online information behavior, Information Research. Consultado: http://InformationR.net/ir/ 12-4/paper324.html. (02 de noviembre, 2010). Jabba, D. y Mrquez , J. (2003). Herramientas para Consulta y Modelado en la Web: una forma diferente del manejo de grandes volmenes de informacin de los Web Sites en Internet. Revista de Ingeniera & Desarrollo, Universidad del Norte, Colombia, Vol. 13. 41-57. Kalenatic, D. (2001). Modelo Integral y Dinmico para el Anlisis, Planeacin, Programacin y Control de las Capacidades Productivas en Empresas Manufactureras, Universidad Distrital Francisco Jos de Caldas, Bogot. Kaye, D. (2001). Strategies for web hosting and management services. Editorial Wiley John & Sons, USA. Martinez, D. y Sanchez, J. (2006). Los niveles de servicio en la ingeniera del software. El Cid Editor, Universidad Nacional del Nordeste, Departamento de Informtica. Universidad de Mlaga, Departamento de Lenguajes y Ciencias de la Computacin, Argentina.

[10] Menasc, D. y Almeida, A. (2000). Scaling for E-Business: Tecnologies, Models, Performance and Capacity Planning. Prentice Hall, New Jersey. [11] Puyana, D. (2002). Universidad Sergio Arboleda. La problemtica de las PYMES en Colombia: internacionalizarse o morir. Consultado: http:/ /www.usergioarboleda.edu.co/PYMES/noticia1.htm. (02 de noviembre, 2010). [12] Departamento Nacional de Estadstica Colombia, DANE. (2003). Modelo de la medicin de las tecnologas de la informacin y las comunicaciones (TIC). [13] DBK, S.A. (2011). Informe Especial Hosting y Housing. (Anlisis de sectores). Madrid, 5 Ed. [14] Hillier, F. y Lieberman, G. (2001). Investigacin de Operaciones, 7 Ed., McGraw Hill, Mxico. [15] IBM. (2009). Seeding the Clouds: Key Infrastructure Elements for Cloud Computing. [16] Garbani, J., Washburn, D. y Chi, E. (2011). The New Capacity Planning Process Requires Three New Steps. Reboot Your Capacity Planning Process With Cost-Value Analysis, Governance, And Global Planning. Forrester Research, Inc., Technology Square, Cambridge, USA. [17] Garbani, J., Cecere, M., Washburn, D., ODonnell, G., Dines, R., Staten, J. y Chi, E. (2011). IT Infrastructure And Operations: The Next Five Years The Cloud On ITs Horizon. Forrester Research, Inc., Technology Square, Cambridge, USA.

94

INGENIERA

Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

Olga Luca Ramrez Calero Jairo Humberto Torres Acosta

[18] Garbani, J., Whiteley, R. y Nelson, L. (2010). I&Os New Capacity Planning Organization. Virtualization And Cloud Computing Force A New Organizational Model That. Decentralizes Capacity Management And Centralizes Capacity Planning. Forrester Research, Inc., Technology Square, Cambridge, USA. [19] Applegate, L., Austin, R., y Warren, F. (2003). Estrategia y Gestin de la Informtica Corporativa: Los retos de gestin de una economa en red, Ed. McGraw Hill, Madrid, 6 Ed. [20] Dominguez, M. (1995). Direccin de Operaciones: Aspectos tcticos y operativos en la produccin y los servicios. Ed. McGraw Hill, Madrid. [21] Drowin, M. (2001). Web hosting and web site development a guide to opportunities. The Library of E-Commerce and Internet Careers, Ed. The Rosen Publishing Group. [22] Johnston, M y Mahowald, R. (2010). HP Cloud Infrastructure Services Jump-Start Enterprise Decisions and Deployments. IDC, Analyze The Future. Marzo de 2010. [23] Laoutaris, N. (2003). On the Optimization of Storage Capacity Allocation for Content Distribution, University of Athens. [24] Delgado de la Torre, R. (2008). Probabilidad y estadstica para ciencias e ingenieras. Delta, Publicaciones Universitarias. Madrid, 1 Ed. [25] Hernndez Sampieri, R., Fernndez, C. y Baptista, L. (2003). Metodologa de la Investigacin. Ed. McGraw Hill, Mxico. [26] Agarwal, V. (2001). An Architecture for Virtual Server Farms, Research Report, IBM India Research Lab. [27] Wenying, Z., Yuelong, Z., Kairi, O. y Wei, S. (2009). Research on cloud storage architecture and key technologies. ICIS 09 Proceedings of the 2nd International Conference on Interaction Sciences: Information Technology, Culture and Human.

Olga Luca Ramrez Calero


Ingeniera Industrial de la Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia. Especialista en Gestin de Riesgos Financieros, Universidad Sergio Arboleda, Bogot, Colombia. Magster en Ingeniera Industrial, Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia. Est certificada como CobitFoundationCertificate. Es Miembro de ISACA (InformationSystemsAudit and Control Association) Captulo Colombia. Actualmente se desempea como Profesional Especializado en Riesgos y Procesos del Banco de la Repblica de Colombia.

Jairo Humberto T orres Acosta Torres


Ingeniero Industrial, Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia. Especialista en Ingeniera de Produccin, Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia. Magster en Investigacin de Operaciones, Universidad Nacional Autnoma de Mxico. Doctor en la Universidad Central Martha Abreu de las Villas, Cuba. Desarrollo su Investigacin Post-doctoral en la Universidad de la Florida. Profesor de las reas de investigacin de operaciones, manufactura, ingeniera de calidad e ingeniera de costos a nivel de pregrado y postgrado. Ha publicado cuatro libros en el rea de Ingeniera de Manufactura y Costos. Profesor invitado de la Universidad de Oviedo y de la Universidad Pontificia de Salamanca campus de Madrid. Presidente de la empresa JHTA Inversiones, empresa del sector de transformacin de la madera y director Snior de la empresa SEIP LTDA. (Servicio de Ingeniera y Productividad). Integrante del Grupo de Investigacin Modelos Matemticos Aplicados a la Industria (MMAI) de la Universidad Distrital Francisco Jos de Caldas.

INGENIERA

Vol. 15 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS

95

Vous aimerez peut-être aussi