Vous êtes sur la page 1sur 16
REVISTA DE INGENIERIA DE SISTEMAS E INFORMATICA VOL. §_N°2, 2008 Estado del Arte de Gestion de Problemas de TI Pedro Carlos Bautista’ - David Mauricio® Universidad Nacional Mayor de San Marcos, Facultad de Ingenieria de Sistemas e Informatica ‘Av. German Amézaga sin, Ciudad Universitaria, Lima 01, Lima, Pert ‘pmearlos@rocketmail.com, “dms_research@yahoo.com RESUMEN La gestion de las tecnologias de informacién (TI) es esencial en toda organizacién en donde las TI son de suma importancia, pues su finalidad es la continuidad de los servicios de TI que puedan ser intecrumpido por algin incidente complejo. En este articulo se hace una revision del estado dol arte de la gestion de problemas, haciendo énfasis en los modelos de gestion de problemas de TI. También se hace una evaluacion comparativa de los modelos de gestion de TI, considerando los. criterios, ‘obligatorios, de integracién u opcionales, y la evaluacion de qué modelo ITIL es o ms adecuado para la gestion de problemas de TI Palabras claves: Modelos de gestion de problemas, ITIL, COBIT, MOF, HP IT Service Management. ABSTRACT ‘The management of information technology (IT) is essential in any organization where IT is of utmost importance, since its purpose is the continuity of IT services that can be interrupted by a complex incident. This article reviews the state of the art of problem management, emphasizing a model of IT management issues. It also makes a comparative evaluation of IT management models, considering the mandatory, optional or integration, the assessment that the ITIL is the most suitable for the management of IT problems. Keywords: Models of problem management, ITIL, COBIT, MOF, HP IT Service Management. a LUNMSM - UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS 4. INTRODUCCION ‘Alo largo de todo el ciclo de los productos de tecnologia de informacion (TI), la fase de ‘operaciones alcanza cerca del 70-80% del total del tiempo y del coste, y el resto se invierte en el desarrollo del producto. De esta manera, los procesos eficaces y eficientes de la gestion de ‘servicios TI se convierten en esenciales para el 6xito de los departamentos de TI. Esto se aplica ‘a cualquier tipo de organizacién, grande o Pequefia, publica 0 privada, con servicios TI centralizados o descentralizados, con servicios de TI internos 0 suministrados por terceros. En todos los casos, el servicio debe ser fiable, consistente, de\ alta calidad, y de coste ceptable [Kemmerling+ 2004} La gestién de servicios de TI descrito en [OCG 2008] se divide en cinco procesos: estrategia, isefio, transicién, operacion, y — mejora continua. Dentro del proceso de operacién del servicio se encuentra la gestién de problemas de Tl, cuya finalidad es satistacer los requisitos del negocio ya los usuarios finales con ofrecimiento de hiveles de servicio, reducir el re-trabajo, enfocéndose en registrar, rastrear y resolver problemas operativos, investigacion de la causa raiz de problemas relevantes y obtener soluciones para estos problemas operatives. Gestionar problemas de TI es importante porque busca eliminar Ia causa raiz de los problemas recurrentes que —_generan. Iincrementos en tiempo y costos. El presente articulo hace una revision do modelos de gestién de problemas de Tl, ‘considera los modelos de: ITIL, COBIT/Delivery ‘and Support Management, HP IT Service Management ~ Proactive Problem Prevention, Microsoft Operation Framework/Support Problem Management, y IBM Service Management — Problem Management. Asi mismo se hace una evaluacién comparativa de ‘estos modelos. El trabajo esté organizado como sigue. En la seccién 2, son presentados los diversos modelos de gestién de problemas. Las herramientas para la gestin de problemas son presentados en la seccién 3. En la seccion 4, ‘son descritos algunos casos de estudios sobre la gestion de problemas. La evaluacién 68 comparativa de los modelos estudiados es resentada en la seccién 5. Finalmente, las Conclusiones siguen en la seccién 6. 2. MODELOS 2.4 Cobit E1 COBIT (Control de objetivos de TI) es un marco. de referencia para establecer un Conjunto de procesos, que una vez establecidos, permitian tener el area de TI Perfectamente organizada, con _procesos medibles, ficientes, y con un modelo de madurez que facta el mejoramiento continuo y la ejecucién de las auditorias (Solano 2006]. La figura 1 muestra las actividades de entrada y ssalida del proceso de entregar y dar soporte a la gestion de problemas de TI (DS10: Delivery ‘and Support Problem Management). Ademas. nos muestra la grifica RACI (responsable, apoderado, consultado, informado) la cual utliza una matriz de actividades de gestién de problemas versus funciones asignadas al Personal que de alguna manera interactlan en la gestién de problemas y a los cuales se les establecer4 responsabilidades ((ISACA 2006], {Solis 2006), 2.4.4 Identificacién y clasificacion de problemas Implomentar procesos para reportar y clasificar problemas que han sido identificados como parte de la administracién de incidente. Los pasos involucrados en la clasificacion de problemas son similares a los pasos para lasificar incidentes, estos son: determinar la categoria, impacto, urgencia y_prioridad. Los problemas se deben categorizar de manera apropiada en grupos o dominios relacionados (Por ejemplo, hardware, software, software de soporte). Estos grupos pueden coincidr con las. responsabilidades organizacionales 0 con la base de usuarios y clientes, y son la base para ‘asignar los problemas al personal de soporte. 2.1.2 Rastreo, seguimiento y resolucién de problemas El sistema de administracién de problemas debe mantener pistas de auditoria adecuadas ‘que permitan rastrear, analizar y determinar la causa raiz de todos los problemas reportados considerando: todos los elementos de REVISTADE INGENIERIA DE SISTEMAS E INFORMATICA VOL § N22, 2008 DS10 Administracién de problemas ‘Autorizacion de camblo Solicitud de cambio Reportes de incidontes DS®__ Detalles de activos / configuracién de T! Registros de problemas Reportes de desemperio del proceso D513 Bitgooras de errores roblemas conocides, errores conocidot y soluciones alternas Grafica RACI es gies RA quire epensbi qa ae eh ema ube conta yo made Figura 1, Actividades y Funciones segin COBIT [Sols 2006] configuracién asociados, problemas incidentes sobresalientes, errores conocidos y sospechados. La administracion de problemas debe monitorear el continuo impacto de los problemas y errores conocidos en los servicios a los usuarios. En caso de que el impacto se vuelva severo, la administracion de problemas debe escalar 6! problema, tal vez refiréndolo a tun comité determinado ‘para incrementar la prioridad de la solicitud del cambio (RFC) 0 para implementar un cambio urgente, lo que resulte mas pertinent. El avance de la resolucién de un problema debe ser ‘monitoreado contra los Acuerdos de Nivel de Servicio (SLAS). 2.4.3 Clerre de problemas Disponer de un procedimiento para corrar registros de problemas, ya sea después de confirmar la eliminacién oxitosa del error conocido © después de acordar con el negocic como manejar el problema de manera alternativa, 2.1.4 Integracién de las administraciones de ‘cambios, configuracién y problemas Para garantizar una adecuada administracion de problemas e incidentes, se debe integrar los procesos relacionados de administracién de ‘cambios, configuracién y problemas. Monitorear ‘cuanto esfuerzo se aplica en apagar fuegos, er 6 LUNMSM ~ UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS lugar de permitir mejoras al negocio y, en los casos que sean necesarios, mejorar estos procesos para minimizar los problemas. 22 ITIL E1 marco de referencia ITIL y la gestion de problemas se encargan de la deteccién de las, causas fundamentales de un incidente y su resolucion y prevencién posterior. En muchas situaciones, este objetivo puede estar directamente en conficto con los objetivos de gestion de incidentes cuyo propésito os Testaurar el servicio a los clientes tan rapido ‘como sea posible, con frecuencia, vie una solucién temporal ‘més que a través de la definicin © implementacion de una solucién permanente ({Kemmerling+ 2004), [Mitiot 2007], (McLaughlin 2007). A continuacién la figura 2 nos muestra el modelo de la gestion de problemas segin ITIL, i s co ASS, aENEETig ttanens > soteie 9 RFE > eaatin ~ eed’ cs) [=e ———— ve * Sd Figura 2. ITIL y la Gostion de Problemas [OSIATIS 2008] Entre las actividades de la gestion de problemas 0 su alcance esté el control de problemas, control de erores y la administracién proactiva de problemas. 2.2.4 Control de Problemas Con esta actividad se espera identificar los problemas e investigar sus causas, se intenta ‘convertir el problema en un error conocido al diagnosticar la causa del mismo. Las actividades segin [Kemmeriing+ 2004], (ITGI 2006}, y [Maidana+ 2007}) son: Identificacién y registro del problema, Clasificacién del problema (incluye: categoria que identifica el 70 dominio de! problema, impacto sobre los procesos de negocio, urgencia para la solucién, prioridad, estado del problema), ¢ investigacion y diagnéstico del problema. 2.2.2 Control de Errores Con esta actividad se monitorizard y se rectificardn errores conocidos hasta que sean resueltos con éxito. Este objetivo se logra elevando peticiones de cambio a la gestién de cambios y evaluando ios cambios en una revision post implementacién. El control de ferrores puede abarcar varios departamentos y comprende los entornas de produccin y REVISTA DE INGENIERIA DE SISTEMAS E INFORMATICA VOL. § N°2, 2008 desarolio. Las actividades _—_segiin ((Kemmering+ 2004], {ITGI 2006}, (Matdana+ 20071) son: identificacion y registro de error Conocido, investigando una solucién, definicion de la solucién seleccionada, revision post implementacién, seguimiento y monitorizacién. 2.2.3 Gestién de problemas proactiva La gestion de problemas proactiva tiene a su cargo la calidad de la infraestructura. La gestion de problemas proactiva (es decir la prevencién de problemas) se concentra en el andlisis de tendencia y la identificacién potencial de incidentes antes de que ocurran. Esto se realiza ‘Operations + Service Monitoring ‘and Controt Conta eres ‘rrblenttanagerant Gl mirando los componentes que son débiles 0 que estén sobrecargados. Si hay muchos dominios, se haran intentos para prevenir que los errores que se producen en un dominio se repitan en otros. Se pueden descubrir investigar las debiidades de los componente: de infraestructura [Kemmerling+ 2004] 2.3 MOF Segin el Modelo Microsoft Operation. Framewotk [MOF 2005], los procesos de gestion de problemas estan dentro de la Fase de Soporte, como lo muestra la figura 3, Figura 3. Gestién de Problemas de TI segin el MOF [MOF 2005] MOF y ta gestién de problemas ayuda a identifcar problemas subyacentes para la Prevencién de incidentes antes de que se Produzcan, especialmente problemas. compiejos que estan fuera del alcance de una solicitud de resolucién de incidentes. Los procesos de gestién de problemas segin [Microsoft 2005} son: 2.3.1 Documentar el problema El primer proceso de la gestién de problemas es el documentar a fondo el problema. Esto incuye ta clasificacion y dar prioridad a este problema. Un problema es cualquier situacién que ponga en peligro la flabilidad o la disponibiidad de un servicio o sistema. Los problemas pueden surgir de muchas fuentes y puede ser —_activado por muchos acontecimientos. Debe haber valor al registrar documentar el problema para _ hacer Investigacion en él y tratar de localizar y resolver su causa ralz. Ademés, el valor de eliminar el problema del medio debe ser mayor que el esfuerzo y el costo de hacerto, EI mantenimiento de registros es fundamental para gestionar problemas. Si los datos sobre el problema se han perdido, duplicado, o Fegistrado incorrectamente, la gestion de problemas no podra funcionar correctamente, El éxito del proceso depende de tener buenos datos para el andlisis y la investigacion. 2.3.2 Filtrar el problema El siguiente proceso consiste en firar el problema para determinar si la solucién debe ‘ser perseguida. Preguntas claves para fitrar el problema: {Cual es la justifcacion del negocio para la investigacion de este problema?, zCuantas, horas se tarda en reproducir ei problema?, n LUNMSM ~ UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS {Cual es la recompensa si se encuentra una solucién? El filtrado de actividad exige una revision objetiva del problema. Si el beneficio de fitrado ‘no supera significativamente el costo de la Investigacion y del filtado, entonces una solucién probablemente no se debe intentar. Si ms tarde se descubre un mayor nimero de datos que ofrecen mas detalles, el problema puede ser renovado. 2.3.3 Investigar el problema Después de tomar la decision de resolver el problema, el proceso siguiente es hacer a investigacion necesaria para encontrar un arragio o solucién. Para una efectiva y significativa gestion de problemas, la investigacién de un problema debe seguir disciplinas similares a las del método cientifico. Esto incluye: ¥- Reproducir e! problema en un entomo de prueba. Y Observacién de Ios sintomas del problema y tomando nota de sus observaciones. ¥- Realizacion de andlisis de causa raiz. Y El desarrollo de una hipétesis y las pruebas. ¥- Repetir este proceso hasta que la causa fundamental ha sido determinado, 2.3.4 Investigar la solucién En este proceso se revisan los resultados de la Investigacion y se determina si existe una solucién temporal, o si ha sido descublerta una solucién para arreglar el problema, La figura 4 muestra las actividades det modelo de gestion de problemas propuesto por Microsoft. Figura 4. Modelo MOF Gestion de Problemas (Microsoft 2005] n REVISTA DE INGENIERIA DE SISTEMAS E INFORMATICA VOL. 5 N°2, 2008 2.4 18M La gestion de problemas segun ([IBM 2008a], {IBM 2006)) 5. el proceso de deteccién, notifeacion y correccion de problemas que afecian servicios de TI, lo que a su vez impacta @n ol negocio. Los problemas pueden ocurir en sistemas de negocio, hardware de red, software y telecomunicaciones. La figura § nos muestra un mapa mental de la gestion de problemas de TI segin IBM, el {grafico nos indica que deben considerarse ineracciones humanas e interfaces no humanas. Muestra, ademas, las relaciones con la gestién de cambios y la utiizacién de herramientas de diagnéstico. os Joes tnt TEC Pe: oe Nontiaan eos Huan a ap Desk Oprater(GN) = ef oie OT (Cong eephoneegean) Figura 5. Modelo de Gestion de Problem: Flujo de procesos de gestién de problemas: Las siguientes actividades seran_utilizadas ‘como genéricas de acuerdo a la necesidad del negocio segin (IBM 20080) son: ‘+ Asegirese de que todos los problemas son reportados y registrados. ‘+ Garantizar Ia gravedad de los problemas que se establecen. ‘+ Garantizar que todos los problemas pendiontes se gestionan de la resolucion. Minimizar el impacto de los problemas. Reducir al minimo la duracién de cualquier resolucion de problemas. = Asegurar la ejecucién de andlisis de causa ralz. = Asegdrese de que permite el andlisis de las tendencias para la prevencién de la + Reducir Ia falta de un riesgo aceptable y el costo. ‘sega [18M 20080) ‘+ Maximizar la productividad de los recursos, ‘+ Supervisar y evaluar el servicio. + Asegirese que los Acuerdos de Niveles ‘Servicio (SLA) son alcanzados. © Automatizar tareas siempre que sea posible. ‘= Escalada a la gestion cuando los problemas no se resuelven en un conjunto. Con el fin de resolver los problemas, el proceso debe incluir las siguientes actividades: ‘© Asignacién / Revision Presentacién de informes Analizar Evitar Seguimionto Resolver La plataforma de Gestién de Servicios de TI de 1BM permite compartir informacion normalizada. Cambios y base de datos de gestion de B LUNMSM ~ UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS cambios (CMDB), inclye CMDB para automatizar el proceso de ejecucién, ayuda a comprender la compleja arquitectura y reducir la gestion de problemas {IBM 2008a], 25 HP La gestion de servicios de TI segiin [HPSM-PM- 2008} como lo muestra la figura 6 abarca cinco fases: alineamiento de TI con el negocio, entrega de servicios, disefio de servicios, desarrollo de servicios y operaciones puente, esta cima fase incluye la prevencion de problemas. La Gestién de problemas se controla con una serie de actividades, las cuales se clasifican en procesos de entrega de actividades (process delivery activities) y de control de calidad (quality control activities), los cuales se mencionan a continuacién: The HP IT Service Management Reference Model Peery eee eee aed Sr ‘Service Development & Deployment Figura 6, Modelo de Gestion de Servicios segin [HP-ITSM] El proceso de entrega de actividades: ‘= Analizar tendencia de los incidentes Registrar y seguimiento al problema Identficar la causa raiz del problema, Dejar pistas o rastros del problema, Verificar errores conocides. Control de errores conocids. Resolver los problemas. Cerrar problemas o volverios errores. conocidos Actividades de Control de Calidad: % + Establecer el sistema de control de problemasierrores conocids. © Configurar y mantener los contactos de soporte. ‘© Establecer procedimientos de ‘mantenimiento preventivo, + Establecer faciidades de verificacion de errores conocidos. + Establecer interfaces de apoyo a proveedores, ‘+ Elaborar informes de gestion. ‘* Realizar proceso de mejora continua. REVISTA DE INGENIERIA DE SISTEMAS E INFORMATICA VOL. 5 N°2, 2008 3. HERRAMIENTAS 3.4 Aranda service desk ‘ASDK y Problem Management, el objetivo de ‘esta funclonalidad es resolver los problemas de ralz, de modo tal que queden definitvamente superados. Algunos incidentes pueden ser relacionados con problemas después de analizat sus causas fundamentales; otros problemas se constituyen como tal, por si solos desde su nacimiento. Una vez que el problema ha sido registrado, sus causas identificadas, su respectiva solucion encontrada y aplicada, éste puede ser cerrado. En muchos casos la ‘solucién de un problema requiere hacer una solicitud de cambio, por lo que es fundamental la integracién con el_médulo de Change Management (Aranda-2008] La administracion de este médulo le permite resolver los problemas de raiz, de modo tal que queden definiivamente superados. * Crear y asignar diferentes tipos de registros, estados, prioridades, categorias, especialistas, terceros. + Enrutar el caso, enviarlo por correo, generar reporte, atenderlo deforma manual y automatica. Tener el historial de enrutamiento, Adjuntar archivos, solucionesy comentarios. Definir las tiempos de atencién y solucisn, Registrar el autor del caso. Relacionar incidentes a los problemas. Aplicar los guiones comespondientes al caso. ‘+ Registro automatico de informacion en determinados campos. + Relacionar usuarios, compafias elementos de configuracién al problema, 3.2 BMC Remedy Service Desk BMC Remedy Service Desk (BMC-Remedy factiia como un Unico punto de contacto para todos los usuarios. Se acelera la restauracién de los niveles normales de servicio y ayuda a prevenir futuros eventos que repercuten ‘negativamente en los servicios a las empresas, ‘mientras que también va ayudando a mejorar la eficacia del personal de TI Gestién de Incidentes y Problemas, BMC- Remedy aborda tanto gestion de incidente ‘como problema. Es flexible, construido de las mejores practicas de trabajo, ayudaré a acelerar la respuesta al usuario final y la identificacion de defectos en la infraestructura de Tl La aplicacién dispone 10 siguiente [Remedy 2008) + Un nico punto de contacto que consolida usuario con las peticiones de miltiples fuentes. * Una solucién centralizada a nivel mundial, regional, y locales de apoyo a las organizaciones de TI + Clasifcacion, enrutamiento, rastreo, con la validacién del cliente, y el cierre de todos los eventos ‘+ Mayor problema de gestion, incluida Ia de flujos de trabajo incorporadas para control de errores y problema de control + Construido en automatico, encuesta sobre satisfaccion del cliente En el afio 2006, Forrester Research [Garbani+ 2008] y Gartner (ITM 2008] reconocen a BMC. Software como el lider en Herramientas de Gestion de Servicios de TI 3.3 HP Service Manager Help Desk Proporciona las siguientes _capacidades: gestion de incidentes, gestion de problemas, gestion de interaccion con el usuario final (entre ellos, servicio de tickets. y agendas, programadas). Ademés permite que la organizacién se convierta en un servicio de clase mundial en la entrega de apoyo [HPSM- PM 2008]. EI médulo HP Service Management Problem Management (HPSM-PM) implementa las mejores practicas de ITIL para encontrar soluciones. permanentes para los incidentes recurrentes. La gestién de problema se ocupa del ciclo de vida completo para integrar incidentes y los procesos de gestion de cambio para aplicar un enfoque completo de circulto cerrado, En ultima instancia, como los errores serdn resueltos a través de la solicitud de proceso de cambio, se abren los incidentes, se actualizan y las soluciones se verifican con ot cliente, La gestion de problema es eficaz, se basa en el concepts de aprovechamiento de las 15 UNMSM ~ UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS fexperiencias pasadas en la solucién de problemas al proporcionar un medio para

Vous aimerez peut-être aussi