Gestión de Servicios de TI
2
GESTIÓN DE SERVICIOS DE TI
3
ÍNDICE Presentación
5
Red de contenidos
6
Unidad de aprendizaje 1: Fundamentos de la Gestión de Servicios de TI TEMA 1
: Introducción a la Gestión de Servicios de TI
7
TEMA 2
: Gestión de Procesos
21
TEMA 3
: Introducción a ITIL
27
Unidad de aprendizaje 2: Gestión de la Configuración, Incidentes, Problemas y Cambios. TEMA 4
: Centro de Servicios
39
TEMA 5
: Gestión de la Configuración
47
TEMA 6
: Gestión de Incidentes
57
TEMA 7
: Gestión de Problemas
67
TEMA 8
: Gestión de Cambios
77
TEMA 9
: Gestión de Versiones
87
Unidad de aprendizaje 3: La Transición y Operación de Servicios de TI. TEMA 10
: Gestión de la Capacidad
95
TEMA 11
: Gestión de la Disponibilidad
105
TEMA 12
: Gestión de la Continuidad
113
Unidad de aprendizaje 4: Racionalización y Mejora Continua de los Servicios de TI. TEMA 13
: Gestión de Nivel de Servicio
122
TEMA 14
: Gestión de la Demanda
131
TEMA 15
: Gestión del Conocimiento
137
TEMA 16
: Gestión de Mejora Continua de Servicios de TI
144
CIBERTEC CARRERAS PROFESIONALES
4
GESTIÓN DE SERVICIOS DE TI
5
PRESENTACIÓN
Gestión de Servicios de TI es un curso que pertenece a la línea de Gestión de Sistemas y se dicta en la carrera de Administración de Sistemas. Brinda los fundamentos de gestión que hacen eficiente la entrega y soporte de servicios de TI, basándose en el enfoque de procesos de ITIL (Information Technology Infraestructure Library). El manual para el curso ha sido diseñado bajo la modalidad de unidades de aprendizaje, las que se desarrollan durante semanas determinadas. En cada una de ellas, hallará los logros, que deben alcanzarse al final de la unidad; el tema tratado, el cual será ampliamente desarrollado; y los contenidos, que deben desarrollarse, es decir, los subtemas. Por último, encontrará las actividades que deberán desarrollarse en cada sesión, que le permitirán reforzar lo aprendido en la clase. El curso presenta en primer lugar los conceptos básicos referidos a la gestión de TI, tales como servicios, calidad, organización, políticas y procesos, así como la estructura y los objetivos de ITIL. Luego se describen el centro de servicios y los procesos que conforman el soporte del servicio. Finalmente se desarrollan los procesos referidos a la entrega o provisión del servicio.
CIBERTEC CARRERAS PROFESIONALES 6
RED DE CONTENIDOS
CARRERAS PROFESIONALES CIBERTEC
GESTIÓN DE SERVICIOS DE TI
57
UNIDAD DE APRENDIZAJE
2 TEMA
6 GESTIÓN DE INCIDENTES LOGRO DE LA UNIDAD DE APRENDIZAJE Al término de la unidad, el alumno explicará las funciones del centro de servicios o service desk y los procesos que conforman el soporte del servicio de TI, identificando con precisión sus características, componentes, ventajas, recomendaciones de implementación y medición, así como la interrelación de dichos procesos.
TEMARIO
Objetivos Actividades Descripción del Proceso Roles y Responsabilidades
ACTIVIDADES PROPUESTAS Los alumnos seleccionarán una empresa y la describirán en base a los conceptos tratados en el capítulo.
Analizar el caso propuesto por el profesor en clase.
CIBERTEC
CARRERAS PROFESIONALES
58
1. OBJETIVOS
Restablecer la operación normal del servicio tan pronto como sea posible. Minimizar el impacto adverso en las operaciones del negocio. Asegurar que los niveles de calidad y disponibilidad de los servicios se mantengan en lo establecido.
2. ACTIVIDADES
Detección y registro del incidente. Clasificación y soporte inicial. Investigación y diagnóstico. Resolución y recuperación. Cierre del incidente. Propiedad, monitoreo, seguimiento y comunicación.
3. DESCRIPCIÓN DEL PROCESO 3.1 Terminología 3.1.1 Incidente Un Incidente es cualquier evento que no es parte de la operación estándar de un servicio y que causa, o puede causar, una interrupción o una reducción de la calidad del servicio. 3.1.2 Workaround Un Workaround es un método de evitar un Incidente o un Problema, orientado a restablecer el servicio. Es una solución temporal que habitualmente reducirá el servicio. Redirigir trabajos de impresión a otra impresora en el mismo edificio es un Workaround, el usuario puede obtener los impresos pero tendrá que caminar una distancia para obtenerlos. 3.1.3 Solicitud de Servicio Una Solicitud de Servicio (RFC) es cada evento que no es un fallo en la infraestructura TI, podría ser una solicitud de información o una solicitud de cambio relacionado con uno de los servicios que entrega la organización.
3.2 Entradas y Salidas 3.2.1 Entradas
Detalles de Incidentes provenientes del Service Desk, redes u operaciones de computadores. Detalles de configuración de la Base de Datos de Gestión de la Configuración (CMDB). Respuesta de emparejar Incidentes con Problemas y Errores Conocidos (KE). Detalles de resolución. Respuesta de RFC para resolución de Incidentes.
CARRERAS PROFESIONALES
CIBERTEC
GESTIÓN DE SERVICIOS DE TI
59
3.2.2 Salidas
RFC para resolución de Incidentes; registro de Incidentes actualizado (incluyendo resolución o Workaround).
Incidentes resueltos y cerrados. Comunicación a los Clientes.
Información de gestión (reportes).
3.3 El Ciclo de Vida de un Incidente La Figura 5.1 ilustra las actividades durante el ciclo de vida de un Incidente.
Figura 6.1 Ciclo de Vida de un Incidente 3.3.1 Detección y Registro del Incidente El registro de datos de acuerdo a la interrupción o reducción del servicio es muy importante para:
Localizar el Incidente a lo largo de la totalidad de su ciclo de vida. Añadir información útil que puedan ayudar, informar y asistir a los grupos de soporte para que puedan encontrar una solución o un Workaround. Recoger información histórica para uso futuro. Coleccionar información (p.ej. para reportes) sobre número de Incidentes, eficiencia, disponibilidad y análisis de tendencias y otros procesos de gestión.
CIBERTEC
CARRERAS PROFESIONALES
60
3.3.2 Clasificación y Soporte Inicial El Service Desk determina la prioridad de los Incidentes a medida que los recibe. Consultando con el Cliente y de acuerdo a las disposiciones del SLA, el Service Desk determinará la prioridad a partir del impacto y la urgencia de los Incidentes. Consultar la CMDB es necesario para obtener información sobre el servicio que se interrumpe, los datos de los Acuerdos de Niveles de Servicio (SLA), los Elementos de Configuración (CI) relacionados a este servicio y los relacionados con Incidentes pasados y Errores Conocidos (KE). 3.3.3 Investigación y Diagnóstico Otros grupos de soporte empezarán a analizar el Incidente con el propósito de encontrar una solución permanente o un Workaround. 3.3.4 Resolución y Recuperación Después de haber completado el análisis y de haber resuelto el Incidente satisfactoriamente, se registra la solución en el sistema. Para algunas soluciones, se tendrá que emitir una Solicitud de Cambio (RFC) a la Gestión de Cambios. En el peor de los casos, si no se encuentra la solución, el Incidente permanece abierto. 3.3.5 Cierre del Incidente Una vez que se implementó una solución satisfactoria para el Usuario, el grupo de soporte direcciona el Incidente otra vez al Service Desk. Se contacta a la persona que informó sobre el Incidente para verificar que todo está resuelto. Si se confirma que el Incidente fue resuelto de manera correcta, se da por cerrado; pero si no es así se vuelve a comenzar desde el lugar adecuado. 3.3.6 Propiedad, Monitoreo, Seguimiento y Comunicación En muchos casos, el Service Desk, como dueño de todos los Incidentes, es responsable del monitoreo del progreso y debe informar al Usuario sobre el estado del Incidente. Durante el seguimiento y monitoreo pueden haber escalamientos.
3.4 Impacto, urgencia y prioridad 3.4.1 Impacto del Incidente Grado de desviación sobre las operaciones normales, en términos de números de Usuarios o de procesos del negocio afectados. 3.4.2 Urgencia La demora aceptable para el Usuario o el proceso del negocio. La prioridad se determina sobre la base de la urgencia y el impacto. Para Incidentes con la misma prioridad, el esfuerzo (personas, recursos, tiempo) que se deba poner en cada uno determinará el orden. El impacto y la urgencia se pueden combinar en una matriz como la de la Figura 5.2.
CARRERAS PROFESIONALES
CIBERTEC
GESTIÓN DE SERVICIOS DE TI
61
Figura 6.2 Ejemplo de un sistema de codificación de una prioridad
3.5 Primera, segunda y subsiguientes líneas de soporte Con frecuencia, los departamentos y grupos de soporte (especialistas), que no sea el Service Desk, son referidos como grupos de soporte de segunda o tercera línea, que tienen más habilidades especialistas, tiempo u otros recursos para resolver Incidentes. En este sentido, el Service Desk sería el soporte de primera línea. Se tiene el siguiente procedimiento tradicional para el escalamiento del Incidente en las diferentes líneas de soporte (ver Figura 5.3):
Paso 1. Intento de resolución del Incidente por parte del Service Desk. Llevar a cabo la evaluación inicial y buscar una solución o Workaround. Si se encuentra una solución, cerrar el Incidente. Si no, referirlo al siguiente nivel. Paso 2. Asignar el Incidente al soporte de segunda línea. Si no se puede encontrar ninguna solución en el Service Desk, referirlo al soporte de segunda línea. Si el soporte de segunda línea puede encontrar una solución, referir de nuevo al Service Desk que cerrará el Incidente. Si no, referirlo al siguiente nivel. Paso 3. Asignar el Incidente al soporte de tercera línea. Si no se puede encontrar ninguna solución en el soporte de segunda línea, referirlo al soporte de tercera línea. Si el soporte de tercera línea puede encontrar una solución, referir de nuevo al Service Desk que cerrará el Incidente. Si no, referirlo al siguiente nivel. Paso 4. Asignar el Incidente al especialista. Si no se puede encontrar ninguna solución en el soporte de tercera línea, referir a un especialista. Si el especialista puede encontrar una solución, referir de nuevo al Service Desk que cerrará el Incidente.
Si no está claro qué grupo de soporte debería investigar o resolver un Incidente relacionado con un Usuario, el Service Desk, como dueño de todos los Incidentes, debería coordinar el proceso de Gestión de Incidentes o referirlo al equipo de Gestión de Problemas.
CIBERTEC
CARRERAS PROFESIONALES
62
Notar que el soporte de tercera o n-línea puede eventualmente incluir proveedores externos que pueden tener acceso directo a la herramienta de registro del Incidente (dependiendo de las normas de seguridad y aspectos técnicos).
Figura 6.3 Escalamiento del Incidente en líneas de soporte
3.6 Escalamiento 3.6.1 Escalamiento funcional (horizontal) Significa involucrar más personal especializado o privilegios de acceso (autoridad técnica) para solucionar el Incidente, pudiéndose exceder los límites del departamento.
3.6.2 Escalamiento jerárquico (vertical) Significa que se realiza un movimiento vertical (a niveles más altos) en la organización porque la autoridad (autoridad de la organización, poderes) o recursos necesarios para resolver el Incidente son insuficientes.
3.7 Informes de gestión El control del proceso se basa en los informes de los diferentes grupos designados. El Gestor de Incidentes es responsable de estos informes, de la elaboración de la lista de distribución y del calendario de informes. Los informes deben ser muy detallados y adaptados a las necesidades de los siguientes gestores:
CARRERAS PROFESIONALES
CIBERTEC
GESTIÓN DE SERVICIOS DE TI
63
3.7.1 Gestor de Incidentes
Partes faltantes en el proceso Conflictos con los acuerdos Desarrollo de los procesos
Tendencias
3.7.2 Gestor del grupo de soporte
Control dentro de cada departamento Progreso de resolución del proceso Ciclo horario del Incidente en los distintos grupos de
soporte 3.7.3 Gestor de los Niveles de Servicio
Calidad de los servicios brindados Todos los informes necesarios para que Nivel de Servicios los informe a los Clientes Innformación para los Clientes que especifique si se han cumplido los acuerdos con respecto a Niveles de servicio dentro del proceso de Gestión de Incidentes
3.7.4 Gestores de otros procesos de Gestión de Servicios
Número de Incidentes informados y registrados
Número de Incidentes resueltos, subdivididos por la resolución de tiempo Estado de Incidentes sin resolver y el número de Incidentes sin solución
Incidentes por periodo, grupo de Cliente, grupo de soporte y resolución de acuerdo con el SLA Incidentes por categoría y prioridad, por grupo de soporte.
3.8 Factores críticos de éxito
Una CMDB actualizada que ayude a estimar el impacto y la urgencia de los Incidentes. De manera alternativa, esta información se puede obtener de los Usuarios, pero la información no será tan completa, puede ser muy subjetiva y llevará más tiempo. Una Base de Conocimiento, por ejemplo una base de datos actual de Problemas y Errores Conocidos que describa cómo reconocer los Incidentes, y soluciones y Workarounds disponibles. Aquí también deben incluirse la base de datos de los proveedores. Un sistema bien automatizado para registrar, seguir y monitorear los Incidentes. Fuertes vínculos con la Gestión de Niveles de Servicio para garantizar adecuadas prioridades y apropiados tiempos de resolución.
3.9 Indicadores de rendimiento La evaluación de procesos de rendimiento necesita de parámetros claramente definidos y objetivos mensurables, a menudo llamados Indicadores de Rendimiento (PKI). Estos se informan con regularidad, por ejemplo todas las semanas, para elaborar datos para el historial que puedan utilizarse para identificar las tendencias. Ejemplos de tales parámetros incluyen:
CIBERTEC
CARRERAS PROFESIONALES
64
Número total de Incidentes Tiempo de resolución promedio Tiempo de resolución promedio por prioridad Promedios resueltos dentro de los parámetros del SLA Porcentaje de Incidentes resueltos por la primera línea de soporte (sin direccionar) Coste de soporte promedio por Incidente Incidentes resueltos por estación de trabajo o por agente de Service Desk Incidentes resueltos sin visitar al Usuario Número de Incidentes (o porcentaje) con clasificación inicial incorrecta Número de Incidentes (o porcentaje) mal direccionados
4. ROLES Y RESPONSABILIDADES Los procesos abarcan la jerarquía de la organización. Por consiguiente es importante definir las responsabilidades asociadas con las actividades que tienen que realizarse en el proceso. Para ser flexibles, es aconsejable usar el concepto de roles; en muchas organizaciones los roles pueden ser combinados debido al tamaño pequeño de la organización o por razones de costos. Por ejemplo, muchas organizaciones combinan los roles de Gestión del Cambio y de Gestión de la Configuración. Una rol abarca un conjunto de responsabilidades, tareas y niveles de autorización.
4.1 Gestor de Incidentes En muchas organizaciones, el rol de Gestor de Incidentes es asignado al Supervisor del Service Desk.
Conducir la eficiencia y la efectividad del proceso de la Gestión de Incidentes Producir información de gestión Gestionar el trabajo del personal de soporte de Incidentes (primera y segunda línea) Monitorear la efectividad de la Gestión de Incidentes y recomendar mejoras Desarrollar y mantener los sistemas de Gestión de Incidentes.
4.2 Personal de soporte para el manejo de Incidentes 4.2.1 Soporte de primera línea (Service Desk)
Registro de Incidentes Encaminamiento de los requerimientos de servicio a grupos de soporte cuando los Incidentes no están cerrados Soporte inicial y clasificación Propiedad, monitoreo, seguimiento y comunicación Resolución y restablecimiento de los Incidentes no asignados al soporte de segunda línea Cierre de los Incidentes
4.2.2 Soporte de segunda línea Grupos de especialistas que pueden ser parte del Service Desk.
Manejo de los requerimientos de servicio
CARRERAS PROFESIONALES
CIBERTEC
GESTIÓN DE SERVICIOS DE TI
CIBERTEC
65
Monitoreo de los detalles de los Incidentes, incluyendo los Elementos de Configuración (CI) Investigación de Incidentes y diagnóstico (incluyendo la resolución si es posible) Detección de posibles Problemas y el encargo a ellos de la gestión del problema, con tal de aumentar los registros de problemas La resolución y restablecimiento de los incidentes asignados
CARRERAS PROFESIONALES
66
Resumen
La Gestión de Incidentes busca restablecer la operación normal del servicio tan pronto como sea posible. Un Incidente es cualquier evento que no es parte de la operación estándar de un servicio y que causa, o puede causar, una interrupción o una reducción de la calidad del servicio. Un Workaround es un método de evitar un Incidente o un Problema, orientado a restablecer el servicio. Es una solución temporal que habitualmente reducirá el servicio. Si desea saber más acerca de estos temas, puede consultar la siguiente página: http://itil.osiatis.es/Curso_ITIL/ Aquí hallará más información sobre el presente capítulo.
CARRERAS PROFESIONALES
CIBERTEC