Académique Documents
Professionnel Documents
Culture Documents
DE SESGO LOCAL
PARA LA
CALIBRACIN DE LOS
MODELOS DE
ESTIMACIN DE
COSTOS
PARAMTRICOS.
Introduccin:
Los modelos de estimacin de costos paramtricos deben ser
calibrados y mejorados para asegurar las estimaciones de
software ms precisas y reflejar la evolucin de los contextos de
desarrollo de software de forma continua. La calibracin local
sintonizando con un subconjunto de los parmetros del modelo
es una prctica frecuente cuando las organizaciones de software
adoptan modelos de estimacin paramtricos para aumentar el
modelo de usabilidad y precisin. Sin embargo, hay una falta de
comprensin acerca de los efectos acumulativos de estas
prcticas de calibracin local sobre la evolucin de los modelos
paramtricos generales con el tiempo.
En la prctica, los modelos paramtricos tpicos para la
valoracin de esfuerzo son calibrados sobre una amplia gama de
datos de industria, y muchos modelos conocidos como COCOMO
II (CII), SEER-SEM, y PRICE-S tambin abogan por la calibracin
local para mejorar la exactitud de estimaciones modeladas.
Objetivo:
Este estudio tiene como objetivo analizar cuantitativa y
eficazmente el manejo de sesgo local asociada con los datos
histricos entre empresas, por tanto, mejora la usabilidad de los
conjuntos de datos entre empresas para la calibracin y
mantenimiento de modelos de estimacin paramtricos.
Mtodo:
Diseamos y realizamos tres estudios empricos para medir,
analizar y abordar la tendencia local en el conjunto de datos entre
empresas, incluyendo:
a) La definicin de un mtodo para medir el sesgo local asociada a
cada organizacin del subconjunto de datos en el conjunto de
datos en general.
b) El anlisis de los impactos de la parcialidad local en el
desempeo de un modelo de estimacin.
c) Proponer un enfoque de muestreo ponderado para manejar
sesgo local. Los estudios se llevan a cabo en el ltimo conjunto
de datos de calibracin COCOMO II.
El Modelo COCOMO II
Lleva en nombre de COCOMO por COnstructive
COst MOdel: modelo constructivo de costos.
El modelo COCOMO original se convirti en uno de los
modelos de estimacin de costo mas ampliamente
utilizados y estudiados en la industria. Evoluciono
hacia un modelo de estimacin mas exhaustivo,
llamado COCOMO II, que aborda las siguientes reas:
Modelo de composicin de aplicacin.
Modelo de etapa temprana de diseo.
Modelo de etapa postarquitectnica.
Metodologa
Como se muestra en la Figura, un modelo paramtrico
usualmente evoluciona siguiendo un ciclo de cuatro etapas:
Donde :
Effort es el esfuerzo estimado del proyecto medido en Persona-Mes
(PM)
A es la constante multiplicativa
B es la constante exponencial
SF es un acrnimo de "factor de escala ("Scale Factor")
EM es un acrnimo de "Esfuerzo multiplicador ("Effort Multiplier")
Tamao (Size) se mide en Miles de Lneas de Cdigo Fuente (KSLOC)
(Thousands of Source Lines of Code)
Mtodo de investigacin
Se llevan a cabo estudios empricos sobre un conjunto de datos para
analizar y manejar la parcialidad local. Consisten principalmente de tres
partes:
Estudio 1: Medir la parcialidad local de una manera cuantitativa. Se
introduce una medida de parcialidad y la conducta anlisis local de la
parcialidad local utilizando la medida propuesta.
Estudio 2: Medicin y anlisis de impactos de parcialidad local en el
desempeo del modelo. Se introduce un mtodo para evaluar los
impactos de la parcialidad local en el rendimiento de la estimacin del
modelo CII, y realizamos un anlisis de correlacin para verificar que la
parcialidad local puede ser perjudicial para el rendimiento de un modelo
de estimacin paramtrica.
Estudio 3: Manejo de los impactos de la parcialidad local cuando la
realizacin de la calibracin del modelo utilizando datos de corte de la
compaa. Empleamos un mtodo de muestreo ponderado para reducir
los impactos negativos de locales.
Para cada uno de estos estudios, vamos a introducir los correspondientes
mtodos, procesos y resultados en las siguientes secciones.
Conjuntos de datos
El ltimo conjunto de datos CII2010 se utiliza en
nuestro estudio, que viene desde el Centro de
Sistemas e Ingeniera de Software de la Universidad
del Sur de California. El conjunto de datos contiene el
esfuerzo real, tamao real, y las calificaciones de los
multiplicadores de esfuerzo y los factores necesarios
para calibrar el modelo CII a escala.
El conjunto de datos contiene dos subgrupos:
El subconjunto CII2000 que incluye 161 puntos de datos
de calibracin del 16 organizacin.
El subconjunto After2000 que incluye 92 puntos de datos
adicionales recin recogidos desde el ao 2000.
La
figura
describe
el
procedimiento general de
calibrar una nueva versin
del modelo COCOMO II
utilizando nuestro enfoque.
En primer lugar, cada grupo
de datos en el subconjunto
After2000 y el subconjunto
CII2000
se
le
asignan
diferentes pesos de acuerdo
con
su
correspondiente
sesgo
local.
Luego
realizamos un muestreo de
peso para producir un nuevo
conjunto de datos para el
uso de la calibracin del
modelo. Los siguientes tres
subsecciones
dan
ms
detalles
sobre
el
procedimiento de calibracin
del modelo.
Muestreo de datos
Despus de asignar pesos a cada grupo de datos,
realizamos un muestreo ponderado para producir un
nuevo conjunto de datos para la calibracin del
modelo. La unidad de muestreo es un grupo de
datos en el subconjunto.
En este estudio, utilizamos una tcnica de re
muestreo simplificado para producir el nuevo
conjunto de datos para la calibracin del modelo
que sigue aproximadamente la misma distribucin
proporcional como los pesos de cada grupo
subconjunto/datos.
Evaluacin y discusin
Para examinar la eficacia de nuestro enfoque
propuesto para el manejo de sesgos locales, se
dise un estudio de comparacin con las siguientes
dos lneas de base:
Lnea de base 1: Esta lnea de base se refiere a la
situacin en la que se lleva a cabo ninguna
calibracin como se recogen nuevos datos
histricos, ic, los usuarios adopten el modelo CII en
general por defecto para todos los proyectos.
Lnea de Base 2: el modelo calibrado con pesos
iguales. Esta lnea de base se refiere a la situacin
en la que no se emplea la estrategia de manejo de
parcialidad local cuando la calibracin del modelo
CII con datos comparativos de la empresa recin
recolectados.
Medidas
A partir del estudio, hemos proporcionado
una medida simplificada, prctica para
cuantificar y visualizar el sesgo local
introducidos por la calibracin local en las
organizaciones que adoptan modelos de
costos paramtricos, la validez de los datos
est garantizada y el modelo es totalmente
garantizado por cada organizacin, el
representante local de A y B se pueden
utilizar aproximadamente para que reflejen
los supuestos parmetros constantes locales
y los supuestos modelos de estructura
locales.
Manipulacin
Los resultados del estudio muestran que los
nuevos datos de la empresa son valiosos para
la calibracin del modelo y las estrategias de
muestreo basados en la tendencia local
ponderados que propusimos. Tenemos que
destacar que nuestro mtodo propuesto no
puede abordar plenamente el problema de
modelo en nuevos datos. Aadiendo nuevos
datos en el conjunto de datos de calibracin
mejora el rendimiento del modelo de datos de
proyectos temporales.
Resultados:
Los resultados muestran que el sesgo locales existe en gran parte en
el conjunto de datos de la empresa, y el sesgo local, afecta
negativamente el rendimiento del modelo paramtrico. La tcnica de
muestreo ponderado basado en el sesgo local ayuda a reducir los
impactos negativos de la parcialidad local en el desempeo del
modelo.
Conclusin:
La tendencia local en datos de la empresa realmente daa la
calibracin del modelo y aade factores ruidosos para modelar el
mantenimiento. La medida propuesta del sesgo local ofrece un medio
para cuantificar el grado de sesgo local asociado con un conjunto de
datos entre empresas, y evaluar su influencia en el rendimiento del
modelo paramtrico. La tcnica de muestreo ponderado basado en el
sesgo local puede ser aplicada a la compensacin y mitigar el riesgo
potencial de sesgo local significativo, lo que limita la capacidad de
uso de datos de corte de la compaa para la calibracin del modelo
paramtrico general y mantenimiento.