CSF Datawarehouse-G7 (Espanol)

Una investigación exploratoria de los factores de éxito del sistema de
almacenamiento de datos
RESUMEN
A pesar del papel cada vez mayor del almacén de datos como fuente de
información estratégica para los tomadores de decisiones, la investigación
académica ha faltado, sobre todo desde el punto de vista de la
organización. Un estudio exploratorio se llevó a cabo para mejorar la
comprensión general de los problemas de almacenamiento de datos desde
la perspectiva de es el éxito. Para esto, el efecto de las variables
relacionadas con la calidad del sistema, calidad de la información y la
calidad del servicio en la satisfacción del usuario para el almacenamiento de
datos se ha estudiado.
caracterización adicional se hizo en los usuarios de almacenamiento de

datos, sus tareas de organización, el uso y almacenamiento de datos:
empíricos. Los datos se obtuvieron en general una empresa de información
de tres fuentes diferentes de una encuesta, entrevistas no estructuradas
grupo con los usuarios finales, y entrevistas informales con un gerente de TI
que estaba a cargo del almacén de datos. Análisis de los datos mostró que
la satisfacción del usuario con el almacén de datos se vio afectada
significativamente por factores como la calidad del sistema de calidad de
datos, locatability de datos y el rendimiento del sistema. Las entrevistas
también apoya la existencia de diseño del sistema y problemas de gestión
que tienen que ser dirigidas a optimizar la utilidad del almacén de datos
como un entorno de apoyo de decisiones eficaz. Mientras tanto, el análisis
de los datos indicó que la primera línea (o inferior) y los mandos medios
fueron los principales usuarios del sistema. Los gerentes y los trabajadores
del conocimiento se aprovechan del sistema para realizar tareas complejas,
para apoyar la toma de decisiones, y buscar la información crítica para
mejorar la productividad. Las entrevistas en grupo, reveló beneficios
adicionales del almacén de datos y bloqueos de carreteras principales en su
uso con éxito.
INTRODUCCIÓN
El almacén de datos se ha convertido en una plataforma clave para la

gestión integrada de los datos de apoyo a las decisiones en las
organizaciones. Su potencial para apoyar la inteligencia empresarial ha sido
ampliamente señalado.
Esta tecnología se ha vuelto crucial en un entorno donde la competencia

cada vez mayor, e informó a los consumidores sofisticados, el mercado de
las fluctuaciones impredecibles y cambiantes entornos normativos están
poniendo mucha presión en las organizaciones empresariales. Las
organizaciones utilizan el almacén de datos para una variedad de tareas
como la planificación, el marketing de destino, toma de decisiones, análisis
de datos y servicios al cliente, y los profesionales coinciden en que está
cambiando la forma de hacer negocios.
El almacén de datos puede mejorar el rendimiento del negocio de varias

maneras, incluyendo los productos mejor orientados, relaciones con los
clientes una mejor gestión y una mayor eficiencia operativa [Cooper et al.
2000, Moore y Wells 2000]. También puede resultar en la reingeniería de
procesos de negocio [Srivastava y Chen 1999]. Por ejemplo, e integrado de
información automatizado entrega desde el almacén de datos
sustancialmente puede liberar "el tiempo y los esfuerzos de los
administradores, lo que aumenta su disponibilidad para otras tareas. Su
integrada, orientada hacia las asignaturas, el tiempo de la variante, volátil y
el medio ambiente no ofrece una fuente de información confiable y estable
para la computación avanzada de organización. Las aplicaciones como
procesamiento analítico en línea en (OLAP) y minería de datos se han
adoptado para aprovechar la rica fuente de datos.
A pesar del potencial, el éxito no está necesariamente garantizada. De

hecho, una encuesta reveló que más del 60 por ciento de las sociedades
propietarias de un almacén de datos nominales del sistema sólo tienen un
éxito limitado en las expectativas del usuario reunión [Stedman 1998]. La
encuesta realizada por Watson y Wixom [1997] mostraron que la capacidad
de muchos almacenes de datos existentes para proporcionar a los usuarios
y oportuno acceso fácil a datos de calidad es limitada. Los estudios también
indican comerciales de los clientes de resistencia o de gestión de
almacenamiento de datos por varias razones incluyendo el temor de perder
el control, la falta de conocimientos técnicos, los costos y la incertidumbre
sobre su utilidad [Ang y Teo 2000; Cooper et al. 2000]. Desde la
implementación del almacén de datos requiere una inversión de varios
millones de dólares y la movilización de otros recursos, la evaluación a
fondo de sus valores, los riesgos y el retorno a la inversión en que se llevó a
cabo un a priori [Moore y Wells, 2000].
A pesar de la creciente importancia del almacén de datos, la falta de
investigación académica límites de nuestra comprensión de sus
consecuencias individuales y organizacionales [Watson y Wixom 1998;
Wixom y Watson, 2001]. La mayoría de la literatura existente consiste en
informes anecdóticos sobre los programas o presupuestos basados en
rumores [Sakaguchi y Frolick 1996]. Un estudio más sistemático es
necesario para obtener una comprensión en profundidad de las
implicaciones de negocios y para justificar la inversión en el sistema futuro.
Dado este contexto, un estudio exploratorio se llevó a cabo para mejorar la

comprensión general de los factores de éxito en el almacenamiento de
datos. El objetivo del estudio fue explorar el efecto de variables
relacionadas con la calidad del sistema, calidad de la información y la
calidad del servicio en la satisfacción del usuario para el almacenamiento de
datos. Caracterización adicional se hizo de los usuarios de almacenamiento
de datos, sus tareas de organización, y su uso de los datos almacén. El éxito
del modelo de sistemas de información [DeLone y McLean 1992, 2002],
siempre que el marco conceptual para la identificación de las dimensiones
estudiadas y las correspondientes variables.
Los datos fueron obtenidos a partir de tres diferentes fuentes de

información. Se diseñó una encuesta para recopilar la información
pertinente de los usuarios de almacenamiento de datos en una gran
empresa. Los datos del estudio se analizaron mediante estadística
descriptiva y regresión múltiple. Grupo de entrevistas no estructuradas con
los usuarios finales se llevaron a cabo para complementar la encuesta. Por
último, frecuentes entrevistas informales durante un período de dos meses
con el gerente de tecnología de la información responsable de la operación
de almacenamiento de datos proporcionan información de antecedentes,
entre ellos la arquitectura del almacén de datos, el consumo, los diversos
beneficios y planes de expansión futura.
RETOS DE ALMACENAMIENTO DE DATOS
Las organizaciones empresariales se enfrentan a la dura competencia y una

mayor incertidumbre. Para responder a un ambiente de negocios
turbulento, una organización debe ser el conocimiento (o información) y
basado en una unidad de aprendizaje eficaz [Marquardt 1996]. El
conocimiento facilita los esfuerzos de una organización a sí misma una
reingeniería a través de una mayor competitividad, eficiencia y eficacia.
Toda organización cuenta con procedimientos sistemáticos que utilizan los
conocimientos disponibles es, sin duda en una posición para eclipsar a sus
competidores.
Para ser basada en el conocimiento, una empresa debe estar preparada

para detectar, recoger, procesar y utilizar la información eficazmente. El
crecimiento exponencial del volumen de base de datos ofrece
oportunidades de las organizaciones así como los retos. Mientras tanto, el
rápido desarrollo de tecnología de la información ha dado lugar a diversas
herramientas que las empresas pueden adoptar para aumentar su
inteligencia empresarial y capacidades de procesamiento de conocimiento.
El almacén de datos ha surgido como una fuente clave de información para
los trabajadores del conocimiento y los gerentes. Su valor bien publicitada
en la oferta de consulta-respuesta de alto rendimiento y mayor acceso a la
información, como Además de ser una fuente integrada de datos, es la
creación de un ambiente extremadamente popular para apoyar las
decisiones en las organizaciones [Watson y Wixom 1997].
El almacén de datos es significativamente diferente de una operación o

transacción de base de datos convencionales en varios aspectos. En primer
lugar, una estructura de datos compleja se debe mantener con el fin de
ofrecer y dinámica de recuperación flexible de apoyo a las decisiones rico
conocimiento. Para ello, mantiene una base de datos arquitectura que es
más integrada, orientada hacia las asignaturas, la variante de tiempo, y no
volátiles de bases de datos transaccionales u operacionales [Inmon 1992].
Las estructuras de datos también debe ser más multifuncional de
"compartimentos estancos" [Gardner, 1998]. Al darse cuenta de los
resultados y otras necesidades funcionales exige el diseño de sistemas y
métodos de aplicación diferentes de las de bases de datos tradicionales.
Estas incluyen el diseño del esquema estrella, desnormalización, tablas de
hechos y dimensiones, y diferentes estructuras de datos físicos (por
ejemplo, la indexación). Almacenamiento de datos también tiene que lidiar
con otros temas de gestión de datos para facilitar el apoyo a la decisión
efectiva, que incluye datos de aseguramiento de la calidad, el
mantenimiento de los datos históricos, y la producción de los datos
obtenidos y los atributos.
El almacén de datos implica un alto grado de complejidad en el sistema de

la arquitectura, porque sus fuentes de datos incluyen bases de datos
transaccionales, almacena los datos operacionales (ODS), los datos
adquiridos, y datos externos [Srivastava y Chen 1999; Wixom y Watson,
2001] la arquitectura. Almacén de datos de la es una especificación formal
de la estructura de datos, comunicación, procesamiento y presentación de
un entorno de datos de almacenamiento. Su complejidad arquitectónica se
debe en parte a las diversas fuentes de datos y el enorme volumen de datos
procesados a proporcionar adecuadamente la información necesaria para
los trabajadores del conocimiento, el poder ad hoc usuarios, y normalizado
de informe generadores [Sen y Jacob de 1998]. El sistema se espera que
produzca resultados solicitados en un plazo razonable de tiempo a pesar de
retrasar el proceso causado por las demandas de la computación de alto.
Mejorar el rendimiento y la respuesta del sistema es uno de los principales
desafíos que los desarrolladores de sistemas deben abordar.
desarrollo y gestión de metadatos añade más complejidad al almacén de

datos. La heterogeneidad semántica de los datos de múltiples fuentes es
una de las razones para mantener los metadatos [Srivastava y Chen 1999].
Esto incluye, pero no se limita a, el sistema de metadatos de fuente (es
decir, la fuente descripción de los esquemas del sistema), puesta en escena
de metadatos de datos (es decir, blanco de la fuente de información
cartográfica), los metadatos DBMS (es decir, definición de la vista y los
índices), y la lógica de negocio y de soporte de metadatos de la aplicación
(es decir, la orientación a los elementos de datos, tablas y vistas).
Metadatos debe ser tejidas en el almacenamiento de datos para conducir
los procesos de negocio de la informática [Kimball et al. 1998]. La
complejidad y alcance de negocios consecuencias, lejos del almacén de
datos justificar una mirada más centrada en los problemas del sistema
separado de las de bases de datos transaccionales u operativas.
PREGUNTAS DE INVESTIGACIÓN y variables estudiadas
CONCEPTUAL DE LA FUNDACIÓN
El concepto teórico de la información del éxito de los sistemas se convirtió

en la base de este trabajo exploratorio.
De hecho, numerosos estudios han investigado el concepto desde ángulos

diferentes, incluyendo su medición y la representación [et al Pitt. 1995;
Raghunathan y Raghunathan 1994; Segarra y Grover 1998], y la, del
usuario final tecnológica, organizacional y las variables asociadas con ella
[Bruwer 1984; Li 1997; Yap et al. Yoon y cols 1995. 1992].; Grover et al
[1996] caracteriza las actividades de investigación en términos de cuatro
corrientes de investigación: los criterios de demostración, la medición, la
relación de criterios y antecedentes de la eficacia ES multidimensional.
Estos estudios coinciden en los sistemas de información que el éxito es un
concepto que implica factores del sistema (es decir, la facilidad de uso y
rendimiento), los factores de datos (es decir, calidad de los datos), los
factores de organización (es decir, la política, la formación y apoyo), y los
factores del usuario (es decir, la satisfacción del usuario, el impacto
individual y utilidad) [Jain, 1997; Li 1997; Williams y Ramaprasad 1996].
Para explorar factores de éxito potencial del almacén de datos, de [2002]

DeLone y McLean es modelo de éxito se utilizó es la versión revisada de la
versión de su original propuesta de modelo en 1992. Esto a pesar de cierta
controversia sobre la integridad del modelo [Seddon 1997], que sigue
siendo el modelo más influyente en la realización de la investigación sobre
sistemas de información de factores de éxito y por lo tanto se convirtió en
un marco conceptual para identificar los factores que influyen en el éxito de
almacenamiento de datos. El modelo sugiere que existen seis dimensiones
principales de los sistemas de información del éxito del sistema de calidad,
calidad de la información (es decir, utilidad de la información), la calidad del
servicio, uso, satisfacción del usuario, y los beneficios netos (individual y
organizacional es decir, los impactos). Representan técnicas (producción de
información relacionada), semántico (información en sí misma), y los niveles
de efectividad (uso de la información y su impacto) de un sistema de
información [Delone y McLean 1992]. calidad del sistema, la calidad del
servicio, y calidad de la información se espera que afecten tanto el uso y
satisfacción de los usuarios. Mientras tanto, el uso y satisfacción de los
usuarios a ser los antecedentes de los beneficios netos. Las dimensiones,
por lo tanto, cubren todo el espectro de los flujos de información de la
producción original, a través del consumo, y todo el camino hasta su
influencia en y de organización del desempeño individual. Wixom y empírica
de trabajo de Watson [] 2001 mostró la importancia especial de la calidad
del sistema (es decir, la fiabilidad del sistema y la calidad de los datos ) en
la obtención de beneficios desde el almacén de datos.
LAS VARIABLES
Entre otras muchas posibles variables de calidad del sistema, esta encuesta
incluye el rendimiento del sistema, facilidad de uso, la capacidad de
localizar los datos, la autorización de acceso y calidad de los datos, que
eran considerados como cruciales para el éxito del almacén de datos.
Rendimiento del sistema del almacén de datos representa la respuesta (o
cambio) el tiempo en la recuperación de la información solicitada por los
usuarios finales y por tanto, estrechamente asociada a su velocidad de
procesamiento [Sen y Jacob, 1998]. En comparación con las de bases de
datos transaccionales, las consultas presentadas en el almacén de datos, en
general, requieren una amplia computación debido a su carácter de soporte
de decisiones. procesamiento demora demasiado, sin embargo, puede
obligar a los usuarios a abandonar el almacén de datos porque no puede ser
la única fuente de información y su uso puede no ser tan obligatoria como la
de los sistemas operativos que sirve transacciones diarias. De Desde esta
perspectiva, el grado de uso del sistema puede constituir un buen indicador
para el éxito de almacenamiento de datos [DeLone y McLean 2002]. En
consecuencia, el rendimiento del sistema se espera que sea un factor clave
de éxito que impulsa centrada en el usuario el almacenamiento [Glassey
1998]. Con su fundamental la naturaleza, sugerencias técnicas, como el
almacenamiento en caché de adaptación consulta [Saharia y Babad 2000]
se han hecho para aliviar posibles cuellos de botella de rendimiento y
mejorar el rendimiento del sistema.
Percepción de facilidad de uso también se ha visitado con frecuencia como

un indicador importante para la aceptación de los sistemas de información
por los usuarios finales [Adams et al. 1992]. Dado Davis, la complejidad del
tratamiento de datos para la toma, el apoyo a la percepción de la facilidad
de uso del sistema puede afectar significativamente el nivel de su
aprobación por anticipado. Usuarios 1989 Este estudio, por lo tanto,
extendió el trabajo existente mediante la investigación de la implicación de
esta variable en el contexto de almacenamiento de datos.
En cuanto a la capacidad de localizar los datos, la estructura de datos

masiva del almacén de datos con frecuencia hace que la ubicación de los
datos correctos difícil para los usuarios finales. Naturalmente, se ha
subrayado con frecuencia que la gestión sistemática de los metadatos y su
estrecha integración con los procesos de computación son cruciales para la
adopción exitosa y el uso del almacén de datos por los usuarios finales
[prospectivo Gardner, 1998; Gray y Watson, 1997; Kimball et al. 1998].
Además, el nivel de detalle de datos (o granularidad) puede afectar a la
ubicación de los datos adecuados para los usuarios. Dificultad en la
búsqueda de datos no sólo puede impedir la adopción de almacén de datos
por los usuarios potenciales, sino que también afectan negativamente a la
satisfacción del usuario con el sistema generados por el sistema de
información.-y medición de esta variable, por lo tanto, a partir de tres
ángulos diferentes: la percepción general de Abillity para localizar los datos,
la capacidad para localizar metadatos (campo de definición de datos), y el
nivel de detalles en la definición de datos.
La autorización de acceso evaluó la conveniencia de acceder a los datos

percibidos por los usuarios de almacenamiento de datos.
El almacén de datos contiene, entre departamentos, cruz, cruz-funcional y
jerárquica de la información general que pueden ser más sensibles que los
datos transaccionales. En consecuencia, la autorización de acceso de datos,
propiedad de los datos, y la sensibilidad de los datos a ser difíciles y graves
problemas, especialmente cuando una organización tiene que lidiar con
ellos en el nivel mundial [Sammon y Finnegan 2000]. Gestión de la
información sensible en el nivel del sistema de la empresa requiere de una
adecuada política de autorización de acceso. Por otro lado, o inadecuada
innecesaria restricción de acceso a datos puede dificultar el uso efectivo de
la base de datos como una fuente de valiosos conocimientos.
Como otro componente de la calidad del sistema, la importancia

fundamental de calidad de los datos en el almacén de datos está bien
documentado por el trabajo existente [Sakaguchi y Frolick 1996; Wixom y
Watson, 2001] detalle. Calidad de los datos de cuatro variables (actualidad,
precisión, consistencia y nivel de ) están incluidos en la encuesta. moneda
de datos (o lo reciente), la precisión y la coherencia son considerados
algunos de los atributos más importantes de la calidad de los datos [Fox et
al. 1994; Huh et al. 1990, Wang y Strong 1996].
Nivel de detalle (o granularidad) refleja otra de las características de calidad

de la representación de datos [Fox et al. 1994].
Apoyo a la granularidad de datos adecuada puede ser especialmente

importante en el almacén de datos debido a su papel en la facilitación de
extracción de conocimiento a través de ricos flexibles de búsqueda de datos
gris [y Watson, 1997; Kimball et al. 1998].
La utilidad de la información adquirida en el almacén de datos representa

una variable para la dimensión de calidad de la información. Utilidad de la
información de un sistema es su capacidad para apoyar a los usuarios
finales para satisfacer sus requisitos de información [DeLone y McLean
1992]. Esta variable es, por tanto, estrechamente asociadas a la utilidad
percibida de la información obtenida [Rivard y Huff 1985] y con el grado en
que utiliza un sistema particular, podrían mejorar el rendimiento en el
trabajo del usuario [Davis, 1989].
Muchos estudios destacó la importancia de la calidad del servicio para el

éxito ES [Barquín y Edelstein 1997; Bruwer 1984; Goodhue y Thompson
1995; Magal et al. 1988]. Formación de usuarios, como una variable de un
servicio de calidad representativa, ha sido reiteradamente investigada como
una forma efectiva de atraer a los usuarios potenciales, mejorar su
comprensión sobre el sistema de sujeción, y aumentar la satisfacción del
usuario [Chen et al. 2000, 1987]. Rivard Dada la complejidad de un sistema
de almacenamiento de datos y su estructura de datos, formación del
usuario final podría ser especialmente crucial para el éxito de su adopción y
difusión de toda la compañía [Quaddus y Intrapairot 2001, Sakaguchi y
Frolick 1996].
La satisfacción del usuario ha sido ampliamente adoptado como variable

dependiente salientes para determinar un sistema de información de éxito
[es decir, Delone y McLean, 1992; McKeen et 1994.; Al. Thong y Yap, 1996].
De hecho, la satisfacción del usuario es un requisito importante, ya que
constituye una de las principales consideraciones sobre las cuales los
gerentes pueden tomar medidas correctivas para aumentar la aceptación
del sistema por los usuarios finales. Chen et al. [2000] sugiere que la
importancia de la satisfacción de los usuarios también se aplica al almacén
de datos. Esta variable fue utilizada para examinar el impacto relativo de las
variables independientes seleccionadas en el éxito de almacenamiento de
datos. La tabla 1 resume las variables estudiadas en cada dimensión
teórica.
[Tabla 1]
LA EMPRESA Y EL ALMACENAMIENTO DE DATOS
La empresa estudiada es una de las principales de Fortune 500 empresas

con 65.000 empleados y es uno de los líderes de transporte de América del
Norte, la tecnología informática, y empresas de logística. Su
almacenamiento de datos esfuerzo se inició en 1992 para aumentar la
eficiencia operativa, reducir gastos y mejorar el servicio al cliente. En el
tiempo, la empresa estaba manteniendo una enorme cantidad de datos
sobre los sistemas mainframe, todas las diferentes funciones del
espectáculo y almacenar la información en varios formatos. Se espera que
mediante la consolidación de cientos de bases de datos departamentales,
gran parte de la ineficiencia operativa resultante de redundancia y, a
menudo en conflicto- información podría ser evitado. Además, el sistema
integrado se espera que proporcione respuestas a las preguntas críticas de
negocio mucho más rápido y fiable.
Con el apoyo completo de la gestión, un equipo de evaluación de los
profesionales de negocios y representantes de la investigación y el
desarrollo de la empresa inició un proyecto piloto de almacenamiento de
datos. La aplicación de las cuentas por pagar fue elegido para el piloto
porque era muy pequeño y fácil de manejar, los datos eran claramente de
valor a las áreas de negocio múltiples, y el esperado retorno de la inversión
(retorno sobre la inversión) fue sustancial y podría medirse. El sistema piloto
se estimó para salvar a $ 500.000 el primer año, con una proyección de
2.000.000 dólares de ahorro de más de cuatro años. Este retorno de la
inversión fue un razón suficiente para iniciar un almacén de datos de
proyectos de escala más tarde.
Teradata RDBMS en NCR 3600 se introdujo inicialmente para la plataforma,

que fue actualizado posteriormente a la NCR 5100 sistema paralelo masivo
(MPP) que ofrece una mayor escalabilidad y disponibilidad. 5100Ms tres se
instalaron, uno para las pruebas, una para el desarrollo, y uno para la
producción .
En el momento de la encuesta, este último ubicado a más de un terabyte de

datos en las áreas objeto de las cuentas por pagar, mantenimiento de
equipos, comercialización, información y circulación de vehículos de
transporte. Los datos almacenados en tablas relacionales 1500 se han
actualizado periódicamente desde diversos en línea bases de datos
transaccionales y operativas. Había sido visitada por más de 2.400 usuarios
y el uso estaba creciendo en alrededor de 100 personas por mes. En el
momento de la encuesta, la mayoría de los usuarios finales se basaban en
el acceso DBMS de Microsoft como la gama de datos de acceso frontal
herramienta y un porcentaje relativamente pequeño de personas con Focus,
basado en SQL interfaz mainframe.
METODOLOGÍA DE LA INVESTIGACIÓN
ENTREVISTAS Y DISEÑO DE LA ENCUESTA
Se utilizaron entrevistas y una encuesta para reunir los datos

pertinentes. Dos entrevistas formales, cada una de
aproximadamente dos horas de duración, se llevaron a cabo como
una forma de discusión en grupo. Los gerentes y los clientes de
negocio de diferentes departamentos funcionales aportaron las
entradas. Además, se celebró una reunión informal una vez por
semana con un alto directivo quien estuvo a cargo del sistema de
data warehouse. Las discusiones informales fueron muy
informativas y se llevaron a cabo durante dos meses mientras el
autor se desempeñaba como interno de facultad de la empresa
durante un período de verano. Por medio de las entrevistas se
obtuvo información tal como la arquitectura de data warehouse, las
especificaciones del sistema, los efectos financieros, el uso del
sistema y los planes futuros. Las entrevistas también revelaron
valores detallados de data warehouse así como los obstáculos para
su uso efectivo.
La encuesta fue diseñada para reunir la información pertinente de

los usuarios actuales del data warehouse (Apéndice A). Se
utilizaron escalas siete-puntos de Likert para muchas de las
preguntas de la encuesta. La primera parte de la encuesta obtuvo
información demográfica sobre los usuarios de data warehouse
como título de trabajo, la posición y características de la tarea. En
la siguiente sección se reunió información general sobre el uso
actual del data warehouse, que contiene artículos sobre la
frecuencia de acceso, las razones para el acceso al data warehouse
y los tipos de análisis realizados. En la sección final se incluyeron
preguntas sobre la calidad del sistema, calidad de la información, la
calidad del servicio y la satisfacción del usuario con el sistema y
con la información producida.
Mayoría de las preguntas de la encuesta fueron desarrolladas para

reflejar el entorno de data warehouse.
Cuatro profesores MIS apoyaron en la validación de las preguntas

del cuestionario en términos de su propiedad y claridad. El
administrador de base de datos a cargo del sistema de
almacenamiento de datos también revisó las preguntas de la
encuesta desde una perspectiva práctica para asegurarse de que
tenía sentido para los usuarios finales. La encuesta pasó a través
de procesos iterativos de validación antes de que fuera distribuido
a los usuarios finales de data warehouse.
RECOLECCIÓN DE DATOS DE LA ENCUESTA
Los datos se obtuvieron de los usuarios de data warehouse

seleccionados al azar de 14 departamentos funcionales incluyendo
el de finanzas, marketing, operaciones y tecnología de información
(TI). Había cinco capas de situación laboral en la empresa: los
trabajadores sindicalizados, gerencia de primera línea (o inferior),
gerencia de nivel medio, alta gerencia y consultores contratados. El
gerente de TI confirmó que los trabajadores sindicalizados y la alta
gerencia no podía acceder al data warehouse. Esto estaba de
acuerdo con el resultado de la encuesta de Watson y Wixom [1997],
el cual mostró que los altos funcionarios ejecutivos no explotaban
directamente el data warehouse como los usuarios finales. Los
altos directivos, aunque no siendo usuarios del sistema por sí
mismos, eran los principales consumidores de los reportes
elaborados por el data warehouse. Los trabajadores sindicalizados
no eran responsables de generar información para soporte de
decisiones y reportes desde el data warehouse y por lo tanto
fueron excluidos de la muestra representativa. La mayoría de los
encuestados representaron a la gerencia de primera línea y de nivel
medio. Además, un número importante de consultores contratados
fueron incluidos en la muestra seleccionada. Ellos estuvieron
utilizando el data warehouse para llevar a cabo servicios necesarios
para la empresa. La intensa utilización del sistema por parte de los
gerentes de primera línea y los de nivel medio se convirtió en la
primera indicación de la importancia del data warehouse en el
apoyo a las tareas de gestión.
La red de la compañía Lotus Notes se utilizó para distribuir la

encuesta electrónica a 185 personas escogidas al azar y para
recoger sus respuestas. Un asesor técnico de la compañía apoyó en
el proceso de administración. Se envió una solicitud adicional a los
no encuestados con el fin de incrementar el tamaño de la muestra y
evitar el potencial sesgo de la falta de respuesta. La tasa de
respuesta fue de 35 por ciento con 65 participantes. El director de
TI atribuyó la relativa baja tasa de respuesta al proyecto en curso
de un sistema de integración como resultado de la reciente
adquisición de una empresa de transporte elevado. La reciente
adquisición de la empresa depende en gran medida a la
subcontratación para el mantenimiento y actualización de su
infraestructura de TI/SI. Naturalmente, la falta de qué-como interno
se convirtió en un problema importante en la realización de la
integración y migración a gran escala. La Tabla 2 resume la
distribución de los encuestados en términos de su estado de
organización.
[Tabla 2]
Distribución de encuestados según su estado
Estado en la organización Tamaño de muestra
Gerencia de primera línea 20

Gerencia de nivel medio 27
Consultores contratados 17
Total 64
ANÁLISIS DE DATOS DE LA ENCUESTA
Los datos de la encuesta fueron analizados por medio de dos

métodos estadísticos diferentes: estadística descriptiva y análisis
de regresión. El primero fue utilizado para la caracterización
general de las variables estudiadas. Este último se aplicó para
estudiar los efectos de la calidad del sistema, la calidad de la
información y las variables de la calidad del servicio en la
satisfacción del usuario, explorando la relación propuesta de
factores de éxito de SI [DeLone y McLean 2002] en el contexto de
data warehouse.
El análisis y la interpretación de datos que utilizan la escala siete-

puntos de Likert puede ser muy subjetiva en su naturaleza y el
sesgo potencial puede aumentar aún más cuando la escala es
codificada numéricamente (es decir, del 1 al 7) como en este caso.
Para mantener la coherencia en la interpretación y discusión de los
resultados estadísticos se utilizaron las siguientes heurísticas: muy
bajo a bajo (1 - 3), medio a medio-alto (3.1 - 5), y alto a muy alto
(5.1 - 7).
ESTADÍSTICA DESCRIPTIVA
Caracterización de tareas
Las Implicaciones de las características de tareas sobre el uso de SI

han sido investigadas con frecuencia. Por ejemplo, estudios
empíricos demostraron que la complejidad de tareas es un factor de
contingencia que podría afectar de manera significativa el uso de SI
[Shin et al. Zigurs 1999 y Buckland 1998] por la prospectiva del
usuario. Los usuarios de data warehouse fueron caracterizados por
la naturaleza de sus tareas en la organización. El promedio de
valores indicaron que los usuarios de data warehouse, en general,
se enfrentan a tareas complejas (5.57 / 7) que requieren frecuentes
tomas de decisiones (5.51 / 7). Muchos de los encuestados
coincidieron en que sus tareas fueron cruzadas entre
departamentos por naturaleza (5.54 / 7) y que necesitaban un
amplio acceso a información de la compañía (6.09 / 7) para llevar a
cabo las tareas asignadas. En general, los encuestados eran
neutrales sobre el problema de la sobrecarga de información (3.51 /
7). Sin embargo, algunos usuarios parece que sufren de falta de
información (4,68 / 7) y baja confiabilidad de la información
disponible (4,68 / 7) desde el data warehouse.
A continuación, el análisis de datos se limita a una comparación de

las respuestas entre la gerencia de primera línea y la de nivel
medio (Tabla 3). Dos muestras de prueba T indican que los
gerentes de nivel medios se enfrentan con tareas más complejo
(Q2) y cruzadas funcionalmente (Q4) que los gerentes de primera
línea. En general, la posibilidad de que las tareas de los gerentes se
veían obstaculizados por la sobrecarga de información parece ser
bajo, especialmente para los gerentes de primera línea. El
promedio de respuesta, por otra parte, indicó que demasiada
información podría suponer un problema para la toma eficaz de
decisiones de los gerentes de nivel medio (Q7).
[Tabla 3]
Comparación entre gerentes de primera línea y de nivel medio
Gerencia de Gerencia de
primera línea nivel medio
Preguntas de la T- P-
encuesta Mean SD Mean SD Ratio Value
Naturaleza de la
tarea
Q1. Repetitividad 3.50 1.70 4.18 1.52 -1.45 .153
Q2. Complejidad 5.20 .95 5.85 .81 -2.52 .015
Q3. Frecuencia en 5.45 1.09 5.85 .94 -1.34 .186

la toma de
decisiones
Q4. Tareas 5.10 1.29 6.03 1.01 -2.77 .008

cruzadas
funcionalmente
Información y toma
de decisiones
Q5. Uso extensivo 5.95 .88 6.29 .86 -1.33 .187
de información
Q6. Falta de 4.55 1.50 4.74 1.76 -.38 .699

información
Q7. Demasiada 2.95 1.63 4.22 1.71 -2.56 .014

información
Q8. Falta de 4.25 1.97 4.92 1.79 -1.22 .227

fiabilidad de
información
* Se supone igualdad de diferencias
El uso de Data Warehouse
Frecuencia media de acceso de almacenamiento de datos era unas 15

veces por día (ver Tabla 4 para la distribución de frecuencias). La mayoría
de los usuarios (69 por ciento) de acceso al sistema a menos de 10 veces
por día.
Diez accesos por día fue el modo (12 cargos) de la distribución de

frecuencias. Dos usuarios utilizan el almacén de datos constantemente
durante el día, según lo indicado por 100 accesos por día. Frecuencias
promedio fueron de 10.3 y 15.1 para la primera línea de gestión y
administración de medios, , respectivamente. gerentes Medio apareció
utilizar el almacén de datos con más frecuencia, pero la muestra t de dos
pruebas no apoyan la significación estadística.
[Tabla 4]
Tipos de tareas para las que fue utilizado como almacén de los datos fueron
investigados. Para ello, ocho tareas principales de organización se
incluyeron en la encuesta (Tabla 5). Los primeros cuatro (apoyo a la toma
de decisiones, supervisión del estado, la planificación y previsión) se
considera más no estructurados que los otros.
Los datos recogidos se resumen a continuación, en términos de acceso

relación de usuario para cada tarea y la frecuencia de acceso diario.
En general, más usuarios estaban utilizando el almacén de datos no
estructurados de derechos en lugar de a favor o en las responsabilidades
administrativas de rutina. Por ejemplo, más del 70 por ciento de los
encuestados estaban aprovechando el almacén de datos para apoyar las
decisiones. La frecuencia promedio de uso diario más alto fue para la toma
de decisiones (3.45) y el análisis del estado (2.82) seguido de la
administración (2.18) y contabilidad (1,47). Uso de los recursos humanos y
gestión de las relaciones laborales fue reportado como mínimo.
[Tabla 5]
Percepción de Usuario Final
Mientras que los encuestados estaban en el entero positivo sobre la calidad

de los datos, las diferencias percibidas parecía existir entre las dimensiones
de la calidad (Tabla 6). Moneda de datos y el nivel de información recibida
de alta aceptación relativa de los usuarios. Coherencia de los datos recibió
la menor aceptación. Esto indica que, en este caso particular, el aspecto
más desafiante de almacenamiento de datos fue en la obtención de un
adecuado nivel de consistencia de los datos en el sistema.
Cuando la primera línea y la gestión de las respuestas se compararon

medio, sólo el nivel de detalles mostró una diferencia significativa. Gestión
de Medio era más positiva que la gerencia de primera línea (4.5 / 7) que los
datos en el almacén de datos que mantiene el nivel de detalle necesario
para sus tareas (5,66 / 7) (p = 0,004). Este resultado parece confirmar que
los gerentes de línea primero que se necesita información más detallada se
los mandos medios para llevar a cabo sus funciones. Se convirtió en una
indicación de que las necesidades de información de los usuarios del
sistema difieren en el nivel de abstracción y la estructura, y que el éxito del
almacén de datos en parte depende de su flexibilidad para satisfacer las
demandas heterogéneas de los solicitantes de información a diferentes
niveles.
resumen de datos reveló que la capacidad de localizar problema de los

datos podría ser un obstáculo importante al uso eficaz del almacenamiento
de datos. Los usuarios respondió que los datos de ubicación no era muy fácil
(3.7 / 7) y la definición de los atributos de datos disponible no era lo
suficientemente detallada para apoyo a sus tareas (3.4 / 7). El almacén de
datos, en general, reconocido como fundamental para mejorar la
productividad de los trabajadores del conocimiento (5,9 / 7). Durante las
entrevistas se supo que, a pesar del sistema de la importancia, el
rendimiento reducido y lenta respuesta del sistema podría obstaculizar de
manera significativa la productividad del usuario.
Al parecer, la lenta respuesta fue causado en parte por fuertes golpes en el

almacén de datos (por lo menos 10 mil consultas por día), por la estructura
de datos que no reflejan puntos de vista del usuario, y por el mal uso (por
ejemplo, las consultas ineficaces) del sistema de determinados usuarios .
Los usuarios comerciales sugirió que la estructura de datos de las tareas
orientadas y estructuradas para reducir al mínimo el número de consultas
necesarias para recuperar un pedazo de información.
[Tabla 6]
ANÁLISIS DE REGRESIÓN
Las variables independientes
Un análisis de regresión se realizó para evaluar la fuerza de asociación entre

las variables del sistema de calidad, calidad de la información y la calidad
del servicio y la satisfacción del usuario para el almacenamiento de datos.
Para ello, la encuesta recabó información sobre la satisfacción del usuario
en cuanto a la calidad global de la información generados (P22) y el
rendimiento general del sistema de almacenamiento de datos (P23).
Dos elementos mostraron factor de carga de alta y el tema fiabilidad entre

(alfa de Cronbach = 0,751) y los mayores de todos los niveles de
satisfacción se calcula promediando los puntajes estandarizados (ver
Apéndice B).
Las variables independientes fueron compuestos de calidad de los datos

(P14-P17), la capacidad de localizar los datos (P18-P20), la autorización de
acceso (P21), la facilidad de uso (P24), formación de usuarios (Q25), el
rendimiento del sistema (P26-P27), y la utilidad de la información (P28-P29).
Se espera que la alta calidad de los datos, la facilidad de localización de los
datos pertinentes, la facilidad de uso para el sistema, el aumento de
rendimiento del sistema, los datos de acceso restrictivo-menos, formación
de usuarios adecuada y una mayor utilidad de la recuperación información
se asocia positivamente con la satisfacción del usuario con el almacén de
datos [Delone y McLean, 1992; Goodhue y Thompson, 1995].
Preprocesamiento de datos
Preprocesamiento de datos de la encuesta se realizó antes del análisis. En

primer lugar, las pruebas de convergencia de las variables con los
elementos de indicadores múltiples se llevaron a cabo a través del análisis
factorial confirmatorio (ver Apéndice B). Indicadores pertenecientes a una
construcción, en general, mostraron una significación estadística en su
validez convergente . Un indicador (P17) de la calidad de los datos de
construcción tuvo un factor de carga baja y se bajó de un nuevo examen. En
segundo lugar, las agregaciones de los indicadores múltiples elementos se
llevaron a cabo. Para garantizar la contribución de la igualdad de los pesos
de cada indicador, los datos brutos se primero estandarizados con Z-scores.
Entonces, los valores normalizados se promedian para obtener el peso de
las puntuaciones de unidades de un multi-indicador de la construcción.
Cuando había sólo un indicador, los datos brutos se estandarizaron con Z-
scores. Un análisis de regresión múltiple fue entonces llevan a cabo
utilizando los puntajes estandarizados.
Análisis de Resultados
calidad de los datos, la capacidad de localizar los datos y el rendimiento del

sistema se explica variaciones significativas en la satisfacción de los
usuarios (Tabla 7). De hecho, estas variables fueron acusados con
frecuencia por los entrevistados como las principales limitaciones de los
datos de uso de almacén eficaz. Los coeficientes confirmó que los datos de
mayor calidad, fácil localización de los datos, y el rendimiento mejorado del
sistema se asociaron significativamente con la satisfacción del usuario
mayor para el almacén de datos. Se debe tener cuidado al interpretar el
resultado, sin embargo. Esto no significa que las demás variables
(accesibilidad, facilidad de uso, formación de usuarios, y la información de
servicios públicos) no son importantes para el sistema de almacenamiento
de datos. Simplemente muestra que las variables tenían una asociación más
fuerte con la satisfacción de los usuarios finales.
[Cuadro 7]
A continuación, la estimación de parámetros basados en un modelo más
parsimonioso se realizó para comparar el poder explicativo de las variables
significativas (Cuadro 8). La tabla de ANOVA confirmó la significación
estadística del modelo parsimonioso (p = 0,000). R2 (0,700) indica que el 70
por ciento de las variaciones en la satisfacción del usuario se explica por las
tres variables. Dado que las observaciones fueron estandarizados, la
comparación de los coeficientes Beta indican influencias relativas de las
variables de satisfacción de los usuarios.
La capacidad de localizar los datos mostraron la mayor asociación con la

variable dependiente, seguido por la calidad y el rendimiento del sistema,
aunque la diferencia fue pequeña.
Las variables independientes fueron revisados por la multicolinealidad, lo

que puede sesgo de estimación de parámetros.
De acuerdo a la regla general, si un coeficiente de correlación | rxy | es

mayor que 0.7, multicolinealidad se convierte en una amenaza sustancial
[Anderson et al. 1996]. La matriz de correlación de Spearman indica un
cierto grado de correlación entre las variables independientes (ver Apéndice
C), pero no fue lo suficientemente alta como para causar multicolinealidad y
el sesgo de los resultados de la prueba.
[Cuadro 8]
DISCUSIÓN
SÍNTESIS
El análisis basado en los datos de la encuesta revelaron como los factores

que llevaron al almacén de datos para convertirse en un entorno más
productivo. Línea y mandos medios Primera y otros contratados los
trabajadores del conocimiento se aprovechó de que el sistema de apoyo no
estructurados, así como la toma de decisiones y de rutina para buscar
información necesarios para su trabajo. diaria, frecuencia de acceso medio
(15 veces), hace un fuerte indicio de que la información recuperada del
almacén de datos es vital para el aumento de la productividad del trabajo
de muchos trabajadores del conocimiento. A pesar de que fue adoptado por
una variedad de tareas de administración de rutina a las señales externas
servicios al cliente, más usuarios se aprovecharon de ella para el análisis
avanzado de datos y apoyo a las decisiones. Esto confirma Cooper et al. 's
[2000] de estudio, donde el almacenamiento de datos mejor se dio cuenta
de la utilidad en la solución de problemas no estructurados, como estrategia
de desarrollo del cliente de en su utilización para tareas de rutina. El análisis
reveló que la demanda de información de los usuarios del sistema variaron
en el nivel de las captaciones y las estructuras de información, y que el
éxito del almacén de datos en parte podría depender de su flexibilidad en la
satisfacción de las necesidades heterogéneas de los solicitantes de
información.
El estudio de la percepción de los usuarios del almacén de datos no cubierto

las zonas que requieren mayor atención si se quiere ser eficaz adoptada por
una organización. A pesar del hecho de que el sistema se ha convertido en
un clásico de almacenamiento de datos historia de éxito del proyecto, el
estudio indicó que los datos de baja la calidad podría ser problemático para
los usuarios finales como se ha señalado por varios] estudios [Ballou y Tayi
1999; Watson y Wixom 1997. análisis de regresión indica que los datos
puedan afectar a la calidad del sistema de satisfacción "de manera
significativa los usuarios. Entre las dimensiones de la calidad de los datos
considerados, el falta de consistencia de los datos (es decir, nombres de
campo, la duplicación de datos, y la fragmentación de datos) parece ser
especialmente molesto para los usuarios del sistema. inconsistencia de
datos es, en general, un problema difícil de abordar debido a que el
almacén de datos de las importaciones de datos de varias fuentes que han
evolucionado de forma independiente sin tener en cuenta tanto a los datos
de la calidad [Sammon y Finnegan 2000]. Por lo tanto, mucha atención debe
ser colocado en la corrección de inconsistencias en los datos antes y
durante el proceso de puesta en escena de datos [Sammon y Finnegan
2000]. Si los datos en el almacén de datos se importan de transacciones
sistemas como una forma de volcado de datos sin mucha transformación y
validación de la calidad, la mayoría de los problemas de calidad en la base
de datos transaccionales, simplemente se puede heredar. El tema de la
calidad de datos es importante porque los datos se convierten en no-
volátiles una vez que se alojan en el [almacén de datos Inmon 1992].
Las entrevistas también revelaron que podría haber diferencias entre las
partes interesadas de almacenamiento de datos con respecto a la
importancia de las dimensiones de calidad de datos. Por ejemplo, los
responsables de la operación y gestión del almacén de datos dio los datos
de la más alta prioridad. Mientras tanto, obtener información oportuna en
manos de la decisión los responsables es más esencial para los usuarios
finales. Aunque no es de extrañar que los interesados habían variado puntos
de vista sobre la importancia de la calidad de las dimensiones de datos,
esto puede ser un indicio de que tales diferencias en la prioridad de las
características de los datos deben estar debidamente constituidas y
equilibrada en el datos de diseño etapa almacén.
El análisis de regresión indicó que la respuesta lenta del sistema afectado

sustancialmente a los "trabajadores del conocimiento con satisfacción el
almacén de datos. Este fue el caso a pesar de que el almacén de datos se
encuentra en el equipo paralelo escalable diseñada para atender la
demanda de computación pesados. Mientras tanto, las entrevistas revelaron
que cuestiones de gestión, tales como el mal uso del almacén de datos, la
falta de capacitación de los usuarios y el uso indebido del sistema posterior,
y modelado de datos ineficiente que no refleja las perspectivas de usuario-
final contribuido significativamente a la degradación del rendimiento del
sistema. Las personas entrevistadas hicieron hincapié en la especial
importancia de-formación de los usuarios finales no sólo para acelerar el
sistema de adopción [Quaddus y Intrapairot 2001], sino también para
reducir los errores de cálculo o ineficiencia que podría provocar una
sobrecarga significativa en la respuesta del sistema. La escasez de
inteligencia deliberada en las consultas de base de datos presentados por
fin a veces los usuarios pierden horas de tiempo de procesamiento costoso
equipo, reafirmando la importancia fundamental de la competencia del
usuario en el almacén de datos informática. Además, el examen y el diseño
de estructuras de datos desde la perspectiva del uso actual y necesidades
de los usuarios se dijo que era importante mejorar el rendimiento del
sistema .
El análisis de regresión mostró también un impacto significativo de la

capacidad de localizar los datos en la satisfacción del usuario para el
almacenamiento de datos. Análisis de encuestas y entrevistas
constantemente expuesto que la dificultad de localización de los datos era
un gran obstáculo para el uso efectivo del almacén de datos. Las entrevistas
en grupo, reveló que contribuyen factores de la dificultad en la localización
de datos. En primer lugar, la falta de conocimiento del usuario sobre la
estructura de datos del almacén de datos ha contribuido a la dificultad de
localizar la información correcta de los usuarios finales. Ofreciendo una
mayor educación sobre la estructura de la información del almacén de datos
se cree que aliviar el problema. En segundo lugar, hubo una falta de
completa multi-nivel meta-datos de fácil acceso para los usuarios finales.
Por ejemplo, los usuarios señaló que, aunque el sistema permite la
grabación de un breve comentario descriptivo de cada tabla, vista y
columna , muchos comentarios no proporcionó suficiente información
contextual para que sean capaces de entender la semántica de los datos.
En consecuencia, los esfuerzos por mejorar la documentación de usuario
final para proporcionar ricos meta-datos y adoptar una metodología de
avanzada, tales como activos de metadatos [Kimball y otros al. 1998] para
que se integren perfectamente con el procesamiento de base de datos se
consideraban cruciales para hacer frente a este problema. En tercer lugar,
se supo que, en función del tipo de dificultad en el uso del sistema, los
usuarios finales se debe dar un punto de contacto para solicitar asistencia
específica. La ausencia del personal encargado de dar asesoramiento
pertinente parece haber agravado el problema de capacidad de localizar los
datos.
Por último, cabe destacar que la disponibilidad de herramientas de acceso a

datos puede afectar la percepción del usuario de diferentes maneras. Un
ambiente de consulta gestionados podría hacer más fácil que escribir
consultas SQL para localizar los datos, haciendo que el modelo de datos
subyacente en gran parte transparente para los usuarios. Disponibilidad de
fácil de usar los datos de herramientas de acceso se puede, por tanto,
afectan de manera significativa la satisfacción de los usuarios con el
almacén de datos.
Por ejemplo, en el caso estudiado, la gente se confía sobre todo en acceso y

mainframe Focus-a veces como la herramienta de consulta. Parecían estar
más satisfechos con fácil acceso de usuario de enfoque. Por ejemplo, un
usuario dijo: "Excelente [que indica el acceso , mucho mejor que el Focus.]
"Mientras tanto, otro usuario señaló una debilidad potencial de acceso de la
siguiente manera:" Es muy bueno para la creación de pequeñas
aplicaciones, pero al probar estas aplicaciones antes de su marcha y
funcionando en la producción, no es exactamente el mejor herramienta de
prueba de la consulta. Encierra toda la estación de trabajo con cada
consulta, incluso mientras se ejecuta. "
Los problemas causados durante las entrevistas en gran parte coincide con
los resultados de los análisis de la encuesta. Eran principalmente
relacionados con la calidad del sistema y problemas de calidad de servicio,
y las principales preocupaciones de la calidad del sistema se asociaron con
el diseño del sistema, la accesibilidad y la calidad de los datos importados
de sistemas de origen. Estos se resumen en la Tabla 9.
[Cuadro 9]
OTRAS PERSPECTIVAS
entrevistas de usuario que ofrece nuevas perspectivas sobre los beneficios
del almacenamiento de datos en la empresa, a pesar de que están
estrechamente relacionados con la posición única de la empresa. Los
participantes convinieron en que el retorno de la inversión para el almacén
de datos se justifica bien a través de un considerable aumento de la
productividad y una mayor calidad de servicio al cliente. Indicaron que el
sistema ayudó a la compañía en una variedad de maneras. La toma de
decisiones y otras operaciones de la organización se hizo más basada en
hechos, lo que mejora la calidad y la eficacia de los procesos de decisión y
los resultados. basado en el funcionamiento de Datos facilitados distribuidos
la toma de decisiones por más personas. La distribución de la toma de
decisiones, a su vez, la mejora de la eficiencia organizacional mediante la
reducción de gastos generales de procedimiento y con capacidad
rápidamente las fluctuaciones en el mercado. La información del almacén
de datos creado en lugar de proactiva y dinámica y no estática procesos
reactivos, y se deja flexibles respuestas funcionales a las operaciones
cruzadas que eran propensos al cambio. Conocimiento del almacén de datos
también permitió la integración del mercado orientada a las actividades en
áreas como la delantera del bastidor, la planificación de la operación,
análisis de clientes, y la utilización de activos.
Se supo que la gestión del almacén de datos tardó más de 20 en tiempo

equivalente de personal a jornada completa. Sin embargo, no había duda de
que el retorno superado con creces el coste. Algunos de los beneficios se
pueden cuantificar. Se estima que un ahorro anual 3,5 millones de dólares
se logró mediante la gestión de vehículos mejor y cortando el ciclo de
cuentas por cobrar. De hecho, desde 1992, la compañía ha gastado un
estimado de $ 20 millones para proyectos de almacenamiento de datos, que
incluye hardware, integración de sistemas de trabajo, los honorarios de
consultores y personal y -formación de los usuarios finales. A pesar de los
desafíos técnicos y financieros, no ha sido suficiente pagos. Alentados por el
éxito de almacenamiento de datos, la compañía estaba buscando una forma
más avanzada de la informática, especialmente la minería de datos, que
intenta recuperar ocultos pero valioso conocimiento de la fuente de base de
datos. La empresa se enteró de que está equipado con medidas
sistemáticas para recuperar y utilizar la información del almacén de datos
podría colocarlo en una posición competitiva mejor.
LIMITACIONES DE INVESTIGACIÓN
Esta investigación tiene limitaciones en la metodología de investigación. En
primer lugar, este estudio tiene los atributos fuertes de un caso de estudio
porque los datos fueron obtenidos de los empleados de una sola empresa.
En consecuencia, cierto sistema o del sistema de las cuestiones no

discutidas aquí pueden ser fenómenos locales de la organización estudiada.
En este sentido, se trata de una intensiva en lugar de un extenso estudio en
el que la generalización de los resultados del análisis pueden faltar.
Mientras tanto, el almacén de datos en particular sistema fue reconocido
entre los observadores de la industria como un escaparate para el
almacenamiento de datos éxito. Su diseño e implementación del sistema y
su adopción con éxito por los usuarios prospectivos, por lo tanto, espera que
ofrecen un entorno confiable de que las preguntas de investigación podría
ser aplicado con rigor. Por otra parte, que la encuesta almacén de datos
representados los usuarios de datos de 14 departamentos funcionales
diferentes pueden tener un efecto positivo sobre la generalización del
estudio.
Un reducido número de elementos indicadores en ciertas construcciones

podría haber afectado su confiabilidad de la medición y, en consecuencia el
poder del análisis de regresión. Por ejemplo, dos indicadores se utilizaron
para la satisfacción de los usuarios, el rendimiento del sistema y la utilidad
de la información, aunque el alfa de Cronbach para todas las construcciones
(osciló .639 a .897) indica su estabilidad razonable. Tres construcciones
(accesibilidad, facilidad de uso, y la capacitación del usuario) también
estuvieron representados por un solo elemento.
tamaño de la muestra limitada (64) podría haber afectado la integridad de

la inferencia estadística. Por ejemplo, un tamaño muestral de 64, no cumple
la regla de oro ratio de 1 punto a 10 puntos de datos para cargas de factor
de estabilidad [Nunnally 1978] . Las pruebas t en el Cuadro 3 se basaron
también en el expediente establece relativamente pequeño de 20 para la
línea de gestión de primero y 27 para mandos intermedios. Dado que la
encuesta se distribuyó dentro de una organización, una respuesta por ciento
de tasa del 35 puede considerarse más bien baja .
Además, aunque el instrumento de estudio fue revisado y validado por cinco

personas de la academia y la industria, más la validación del contenido se
podría haber hecho a través de la prueba piloto de los ítems del
cuestionario.
Por último, las entrevistas grupales, como fuente de información adicional,
puede plantear un problema de fiabilidad que los entrevistados no podría
haber estado disponible con sus opiniones sobre cuestiones delicadas. Esto
podría limitar la utilidad del estudio de caso en el suministro de información
rica para los lectores. Ese riesgo de los participantes volver opiniones
celebración se espera que sea relativamente bajo por dos razones. En
primer lugar, los participantes eran de diferentes departamentos
funcionales y poco conflicto de interés que se esperaba en la discusión de
los problemas y beneficios asociados con el sistema de almacenamiento de
datos. En segundo lugar, la mayoría de los participantes, como usuarios del
sistema, se del mismo grado, como se muestra en la encuesta, lo que
podría haber dado lugar a más debates abiertos. Mientras tanto, me
gustaría destacar el mérito de la adopción de múltiples métodos de
recopilación de datos cuando el sistema de destino es tan complicado como
este caso, porque las fuentes de datos adicionales tales como entrevistas
repetitivas hacen perspectivas valiosas que no se conciben en la fase de
diseño de la encuesta.
CONCLUSIONES
El almacén de datos está tomando el sector empresarial por la tormenta

[Sen y Jacob, 1998]. Se trata de una base de datos que es varios órdenes de
magnitud mayor que una base de datos convencionales. Está sujeto a
especial, así como regular las consultas ad complejo sobre todo para ayudar
a la toma de los procesos de apoyo. Almacenamiento de datos plantea
diversos retos como la migración de datos desde sistemas heredados, el
mantenimiento de la calidad de los datos, gestión del sistema, y formación
de usuarios y la formación. El objetivo principal de este estudio fue
investigar empíricamente y no los factores tecnológicos tecnológicos que
afectaron a la satisfacción de los usuarios de almacenamiento de datos a
través de una encuesta y entrevistas. investigación adicional fue conducido
en almacén de los usuarios finales de datos y su uso de almacenamiento de
datos, el valor del almacén de datos en el apoyo a los conocimientos de los
trabajadores y las tareas de gestión. Este estudio confirma que el sistema
era fundamental en el servicio a una variedad de tareas de rutina de trabajo
de complejos de planificación y toma de decisiones.
Los usuarios tenían un gran respeto por el papel del almacén de datos para
mejorar su productividad en el trabajo. Por otro lado, la preocupación de
que podría afectar negativamente a la satisfacción del usuario consistente
surgido a partir del análisis de la encuesta y las entrevistas. Muchas de las
preocupaciones estaban relacionadas con el sistema y el servicio calidad,
algunos de los cuales podrían resolverse con relativa facilidad a través de
los esfuerzos de correccionales. En general, el estudio indica que el modelo
IS éxito presentado por DeLone y McLean [2002] puede llegar a ser un buen
marco para entender el éxito de almacenamiento de datos. Mientras tanto,
con su apoyo a las decisiones de enfoque y sistema de características
únicas (es decir, estructura de datos y el volumen), factores críticos de éxito
en las categorías de información, sistema y la calidad del servicio podrían
ser diferentes de los de más sistemas de información tradicionales. Por
ejemplo, la capacidad de localizar los datos y la falta de meta-datos no se
puede plantear como un obstáculo significativo para los usuarios finales en
los sistemas de información transaccionales. Más investigación es necesaria
para mejorar el entendimiento sobre esta cuestión. En general, la encuesta
y las entrevistas mostraron que el almacenamiento de datos como una
columna vertebral de apoyo a la decisión podría convertido en una
herramienta estratégica para aumentar la competencia de la organización.

CSF Datawarehouse-G7 (Espanol)

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CSF Datawarehouse-G7 (Espanol)

Transféré par

Droits d'auteur :

Formats disponibles

Una investigación exploratoria de los factores de éxito del sistema de

caracterización adicional se hizo en los usuarios de almacenamiento de

El almacén de datos se ha convertido en una plataforma clave para la

Esta tecnología se ha vuelto crucial en un entorno donde la competencia

El almacén de datos puede mejorar el rendimiento del negocio de varias

A pesar del potencial, el éxito no está necesariamente garantizada. De

Dado este contexto, un estudio exploratorio se llevó a cabo para mejorar la

Los datos fueron obtenidos a partir de tres diferentes fuentes de

RETOS DE ALMACENAMIENTO DE DATOS

Las organizaciones empresariales se enfrentan a la dura competencia y una

Para ser basada en el conocimiento, una empresa debe estar preparada

El almacén de datos es significativamente diferente de una operación o

El almacén de datos implica un alto grado de complejidad en el sistema de

desarrollo y gestión de metadatos añade más complejidad al almacén de

PREGUNTAS DE INVESTIGACIÓN y variables estudiadas

El concepto teórico de la información del éxito de los sistemas se convirtió

De hecho, numerosos estudios han investigado el concepto desde ángulos

Para explorar factores de éxito potencial del almacén de datos, de [2002]

Percepción de facilidad de uso también se ha visitado con frecuencia como

En cuanto a la capacidad de localizar los datos, la estructura de datos

La autorización de acceso evaluó la conveniencia de acceder a los datos

Como otro componente de la calidad del sistema, la importancia

Nivel de detalle (o granularidad) refleja otra de las características de calidad

Apoyo a la granularidad de datos adecuada puede ser especialmente

La utilidad de la información adquirida en el almacén de datos representa

Muchos estudios destacó la importancia de la calidad del servicio para el

La satisfacción del usuario ha sido ampliamente adoptado como variable

LA EMPRESA Y EL ALMACENAMIENTO DE DATOS

La empresa estudiada es una de las principales de Fortune 500 empresas

Teradata RDBMS en NCR 3600 se introdujo inicialmente para la plataforma,

En el momento de la encuesta, este último ubicado a más de un terabyte de

ENTREVISTAS Y DISEÑO DE LA ENCUESTA

Se utilizaron entrevistas y una encuesta para reunir los datos

La encuesta fue diseñada para reunir la información pertinente de

Mayoría de las preguntas de la encuesta fueron desarrolladas para

Cuatro profesores MIS apoyaron en la validación de las preguntas

RECOLECCIÓN DE DATOS DE LA ENCUESTA

Los datos se obtuvieron de los usuarios de data warehouse

La red de la compañía Lotus Notes se utilizó para distribuir la

Distribución de encuestados según su estado

Estado en la organización Tamaño de muestra

Gerencia de primera línea 20

ANÁLISIS DE DATOS DE LA ENCUESTA

Los datos de la encuesta fueron analizados por medio de dos

El análisis y la interpretación de datos que utilizan la escala siete-

Las Implicaciones de las características de tareas sobre el uso de SI

A continuación, el análisis de datos se limita a una comparación de

Comparación entre gerentes de primera línea y de nivel medio

Q1. Repetitividad 3.50 1.70 4.18 1.52 -1.45 .153

Q2. Complejidad 5.20 .95 5.85 .81 -2.52 .015

Q3. Frecuencia en 5.45 1.09 5.85 .94 -1.34 .186

Q4. Tareas 5.10 1.29 6.03 1.01 -2.77 .008

Q6. Falta de 4.55 1.50 4.74 1.76 -.38 .699

Q7. Demasiada 2.95 1.63 4.22 1.71 -2.56 .014

Q8. Falta de 4.25 1.97 4.92 1.79 -1.22 .227

* Se supone igualdad de diferencias

El uso de Data Warehouse

Frecuencia media de acceso de almacenamiento de datos era unas 15

Diez accesos por día fue el modo (12 cargos) de la distribución de

Los datos recogidos se resumen a continuación, en términos de acceso

Percepción de Usuario Final

Mientras que los encuestados estaban en el entero positivo sobre la calidad

Cuando la primera línea y la gestión de las respuestas se compararon