Plan de Contingencia y Recuperación de Servicios de TI del ...
-
Upload
khangminh22 -
Category
Documents
-
view
4 -
download
0
Transcript of Plan de Contingencia y Recuperación de Servicios de TI del ...
PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TECNOLOGÍAS DE LA INFORMACIÓN
DEL CENTRO DE DATOS
OFICINA DE SISTEMAS DE INFORMACIÓN
2021
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
2
CONTENIDO
1. INTRODUCCIÓN ........................................................................................................................ 4
2. GENERALIDADES ....................................................................................................................... 4
2.1. DEFINICIONES ................................................................................................................ 5
3. OBJETIVOS ................................................................................................................................ 5
3.1. OBJETIVO GENERAL ....................................................................................................... 5
3.2. OBJETIVOS ESPECÍFICOS ................................................................................................ 5
4. ALCANCE ................................................................................................................................... 6
5. BASE LEGAL .............................................................................................................................. 6
6. MARCO TEORICO ...................................................................................................................... 6
6.1. PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI .................................. 6
6.2. INCIDENTE ...................................................................................................................... 7
6.3. MÉTODO DE ANÁLISIS DE RIESGOS ............................................................................... 7
6.4. MEDIDAS PREVENTIVAS ................................................................................................. 7
6.5. PLAN DE EJECUCIÓN ...................................................................................................... 7
6.6. PLAN DE RECUPERACIÓN ............................................................................................... 7
6.7. PLAN DE PRUEBAS .......................................................................................................... 8
7. METODOLOGIA......................................................................................................................... 8
7.1. FASE 1: PLANIFICACIÓN ................................................................................................. 8
7.1.1. ORGANIZACIÓN .............................................................................................................. 8
7.1.2. ROLES Y RESPONSABILIDADES ..................................................................................... 10
7.2. FASE 2: DETERMINACIÓN DE VULNERABILIDADES Y ESCENARIOS DE CONTINGENCIA Y
RECUPERACIÓN DE SERVICIOS DE TI DEL CENTRO DE DATOS. .............................................. 13
7.2.1. RECURSOS CRÍTICOS .................................................................................................... 13
7.2.2. IDENTIFICACIÓN DE ESCENARIOS. ............................................................................... 21
7.2.3. IDENTIFICACIÓN DE CONTROLES EXISTENTES ............................................................. 22
7.2.4. EVALUACIÓN DE RIESGOS ............................................................................................ 23
7.2.5. MATRIZ DE EVALUACIÓN Y CLASIFICACIÓN DE RIESGOS ............................................. 24
7.3. FASE 3: ESTRATEGIAS DE PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI.
25
7.3.1. ESTRATEGIAS DE PREVENCIÓN DE LA OFICINA DE SISTEMAS DE INFORMACIÓN. ...... 25
7.3.2. ACCIONES DESPUES DE LA CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS............. 34
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
3
7.3.3. ESTRATEGIA DE COMUNICACIÓN ANTE LA CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS
DE TI 37
7.4. FASE 4: ELABORACIÓN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI .... 38
Se deberá seguir lo señalado en el numeral 7.3.1. ........................ ¡Error! Marcador no definido.
Estrategias de prevención de la Oficina de Sistemas de Información – numeral f)¡Error! Marcador no
definido.
7.5. FASE 5: DEFINICIÓN Y EJECUCIÓN DE PLAN DE PRUEBAS ........................................... 39
7.6. FASE 6: IMPLEMENTACIÓN DEL PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE
TI 39
7.7. FASE 7: MONITOREO .................................................................................................... 40
ANEXOS 41
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
4
1. INTRODUCCIÓN
La Continuidad Operativa es un proceso continuo que permite identificar los elementos críticos de la Institución y asegurar que se tomen las medidas necesarias para identificar el impacto de pérdidas potenciales y mantener estrategias de recuperación ante una situación de desastre que impida su operatividad normal, como por ejemplo incendios, terremotos, pandemias, inundaciones, entre otros. En el marco de la Resolución Ministerial N° 028-2015-PCM, que aprueba los Lineamientos para la Gestión de la Continuidad Operativa de entidades públicas en los tres niveles de gobierno, se señala que el Plan de Continuidad Operativa comprende, entre otros planes específicos, el Plan de Contingencia y el Plan Recuperación de Servicios de Tecnología de la Información. El Instituto Geológico Minero y Metalúrgico (en adelante, INGEMMET) define el Plan de Contingencia y Recuperación de servicios de Tecnologías de la Información (en adelante, TI) del Centro de Datos como un proceso continuo de planeación, desarrollo, prueba e implementación de procesos y procedimientos de recuperación en caso de una posible contingencia que pueda presentarse en la institución, así como también a fin de mitigar o reducir el impacto ante una situación que afecte los servicios de TI del Centro de Datos. Estas acciones permitirán la recuperación eficiente y efectiva de los servicios de TI de la Institución en el menor tiempo posible. Para identificar los sistemas de información de los procesos críticos se ha tomado en cuenta lo señalado en el Plan de Continuidad Operativa de INGEMMET aprobado con Resolución de Presidencia N° 060-2019-INGEMMET/PE.
2. GENERALIDADES
El Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos del INGEMMET,
es el conjunto de acciones y mecanismos que servirán para revertir, reducir o eliminar los
efectos de situaciones imprevistas dañinas para los componentes informáticos del INGEMMET
y que interrumpan la continuidad de las actividades en el ámbito institucional.
Para llevarlo a la práctica se requiere documentar procedimientos que facilitarán una
recuperación oportuna ante eventos imprevistos que afecten el funcionamiento de los sistemas
de información de la institución. Estos procedimientos tienen como finalidad mantener la
continuidad de las actividades, identificar las acciones específicas a ejecutarse durante o
posterior a la contingencia y la adquisición de recursos que se necesitan para volver a las
condiciones normales de operación. En consecuencia, los riesgos identificados en el Plan de
Continuidad Operativa del INGEMMET, se encuentran contemplados en el presente plan.
Los recursos para las acciones de control se encuentran cubiertos con el presupuesto
institucional para el presente ejercicio fiscal, sin embargo, en relación al presupuesto del Centro
de Datos, se estimará una vez que se tome la decisión de la ubicación. Los responsables
designados para el cumplimiento del proceso de recuperación ante eventos de TI, se detalla en
el Anexo 6.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
5
2.1. DEFINICIONES
En la tabla que se muestra a continuación, se listan los términos considerando las mejores
prácticas y estándares internacionales.
Término Definición Fuente
Crisis
Situación con un alto nivel de incertidumbre
que interrumpe las actividades críticas y/o la
credibilidad de una organización, por lo que
requiere urgente acción.
ISO 22301
Incidente
Situación que podría ser, o podría dar lugar
a, una interrupción, pérdida, emergencia o
crisis.
ISO 22301
RTO (Recovery Time
Objective)
Tiempo de Recuperación
Objetivo
Periodo de tiempo posterior a un incidente,
en el cual un producto o una actividad se
debe reanudar o en el cual los recursos se
deben recuperar.
ISO 22301
Servicio TI
Está basado en el uso de tecnologías de la
información y apoya a los procesos de
negocio del cliente. Es realizado por una
combinación de personas, procesos y
tecnología que deberían estar definidos en
un acuerdo de nivel de servicios.
ITIL
(Information
Technology
Infrastructure
Library)
3. OBJETIVOS
3.1. OBJETIVO GENERAL
Identificar las actividades que deberán ser realizadas ante determinados eventos que podrían
alterar su normal funcionamiento, a fin de poder garantizar la continuidad operativa y
disponibilidad de los servicios tecnológicos de la institución; para lo cual se establecen medidas
técnicas y organizativas con el propósito de asegurar y restaurar los servicios en forma rápida,
eficiente y oportuna, minimizando el impacto negativo sobre los mismos.
3.2. OBJETIVOS ESPECÍFICOS
• Contar con una estrategia documentada y actualizada que garantice la continuidad de las
operaciones de los servicios tecnológicos.
• Indicar los lineamientos a seguir para la mitigación del impacto y la recuperación de los
servicios informáticos ante un desastre, incidencia o evento.
• Disponer de personal capacitado y organizado para afrontar los eventos de contingencias
que puedan presentarse en las actividades del INGEMMET.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
6
• Dar sostenibilidad al Plan de Contingencia y Recuperación de Servicios de TI del Centro de
Datos mediante la constitución formal de una organización y operación.
• Continuar con la operatividad de los diferentes órganos y unidades orgánicas del
INGEMMET que hayan sido afectadas por una situación adversa relacionada a los servicios
de TI.
• Prevenir y minimizar la pérdida o la corrupción de información digital; así como el daño
permanente a los recursos informáticos que dan continuidad a las operaciones del
INGEMMET.
4. ALCANCE
El presente Plan de Contingencia y Recuperación de Servicios de TI del centro de Datos, tiene
por alcance el identificar las estrategias a seguir para la mitigación del impacto y recuperación
de los servicios de TI del Centro de Datos frente una crisis y/o emergencia que afecte a la
infraestructura tecnológica que administra la Oficina de Sistemas de Información.
5. BASE LEGAL
• Ley N° 27658 – Ley Marco de Modernización de la Gestión del Estado.
• Ley N° 23716 – Ley de Control Interno de las Entidades del Estado.
• Resolución Ministerial N° 028-2015-PCM, que aprueba los Lineamientos para la Gestión de
la Continuidad Operativa de las entidades públicas en los tres niveles de Gobierno.
• Resolución Administrativa N° 019-2017-MTC/33.6, que aprueba la Metodología de Gestión
de Riesgos de Seguridad de la Información.
• Guía Práctica para el Desarrollo de Planes de Contingencia de Sistemas de Información del
Instituto Nacional de Estadística e Informática – INEI.
• Norma ISO 22301:2012. Seguridad de la Sociedad – Sistemas de Gestión de la Continuidad
del Negocio – Requisitos.
• Resolución Ministerial N° 004-2016-PCM - - Aprueban el uso obligatorio de la Norma
Técnica Peruana NTP-ISO/IEC 27001:2014. Tecnología de la Información. Técnicas de
Seguridad. Sistemas de Gestión de Seguridad de la Información. Requisitos.
• Resolución de Presidencia N° 0156-2013-INGEMMET/PE, se aprueba el Manual de
Organización y Funciones (MOF) del Instituto Geológico, Minero y Metalúrgico.
• Resolución de Presidencia N° 060-2019-INGEMMET/PE, se aprueba el Plan de Continuidad
Operativa – PCO del Instituto Geológico, Minero y Metalúrgico.
• Las referidas normas incluyen sus respectivas disposiciones ampliatorias, modificatorias y
conexas, de ser el caso.
6. MARCO TEORICO
6.1. PLAN DE CONTINGENCIA
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
7
Es un documento que reúne un conjunto de procedimientos alternativos para facilitar el normal
funcionamiento de los servicios de TI, cuando alguno de sus servicios sea afectado
negativamente por causa de algún incidente interno o externo a la institución.
Este plan permite minimizar las consecuencias en caso de incidente con el fin de reanudar las
operaciones en el menor tiempo posible en forma eficiente y oportuna. Asimismo, establece las
acciones a realizarse en las siguientes etapas:
• Antes, como actividades de prevención para mitigar los incidentes.
• Durante, como un plan de emergencia y/o ejecución en el momento de presentarse el
incidente.
• Después, como un plan de recuperación una vez superado el incidente para regresar al
estado previo a la contingencia.
6.2. INCIDENTE
Circunstancia o suceso que sucede de manera inesperada y que puede afectar al desarrollo de
una actividad. En nuestro contexto, es una interrupción de las condiciones normales de
operación en cualquier proceso informático en INGEMMET.
6.3. MÉTODO DE ANÁLISIS DE RIESGOS
Los métodos de análisis de riesgos son técnicas que se emplean para evaluar los riesgos de un
proyecto o un proceso. Estos métodos ayudan a tomar decisiones que permiten implementar
medidas de prevención para evitar peligros potenciales o reducir su impacto.
6.4. MEDIDAS PREVENTIVAS
Es el conjunto de acciones, decisiones y comprobaciones orientadas a prevenir la presencia de
un evento no deseado, con el propósito de disminuir y mitigar la probabilidad de ocurrencia del
mismo en las categorías identificadas en el presente plan. Las medidas de prevención es la parte
principal del Plan de Contingencia y Recuperación de Servicios de TI porque permite aminorar y
atenuar la probabilidad de ocurrencia.
6.5. PLAN DE EJECUCIÓN
Es el conjunto detallado de acciones a realizar en el momento que se presenta el incidente y
activa la contingencia como un mecanismo alterno que permitirá reemplazar a la actividad
normal cuando este no se encuentra disponible. Las acciones descritas dentro del plan de
ejecución deben ser completamente claras y definidas de forma tal que sean de conocimiento y
entendimiento inequívoco del personal involucrado en atender la contingencia y recuperación
de servicios de TI.
6.6. PLAN DE RECUPERACIÓN
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
8
Es el conjunto de acciones que tienen por objetivo restablecer oportunamente la capacidad de
las operaciones, procesos y recursos del servicio que fueron afectados por un evento de
contingencia.
6.7. PLAN DE PRUEBAS
Está constituido por un conjunto de pruebas. Cada prueba debe dejar claro qué tipo de
propiedades se quieren probar, cómo se mide el resultado, especificar en qué consiste la prueba
y definir cuál es el resultado que se espera.[CCA1]
7. METODOLOGIA
El desarrollo del presente Plan seguirá la siguiente metodología basada en siete (7) fases:
• Fase 1: Planificación
• Fase 2: Determinación de vulnerabilidades y escenarios de contingencia
• Fase 3: Determinación de las Estrategias
• Fase 4: Elaboración del Plan de Contingencia
• Fase 5: Definición y Ejecución del Plan de Pruebas
• Fase 6: Implementación del Plan de Contingencia y recuperación de Servicios de TI.
• Fase 7: Monitoreo
A continuación, se detalla cada fase:
7.1. FASE 1: PLANIFICACIÓN
7.1.1. ORGANIZACIÓN
Según el Reglamento de Organización y Funciones – ROF del INGEMMET, aprobado con Decreto
Supremo N° 035-2007-EM, la Oficina de Sistemas de Información (OSI), es el órgano de apoyo
encargado de conducir, desarrollar y actualizar la base de datos geocientífica y jurisdiccional
administrativa minera, así como, brindar apoyo y asesoría en materia de software, hardware y
sistemas de información en general al personal de la institución. Depende jerárquicamente del
Secretario General (actualmente Gerencia General).
La Oficina de Sistemas de Información, tiene las siguientes funciones generales:
• Elaborar el Plan Estratégico de Tecnología de Información Institucional, alineados a la
estrategia institucional y en coordinación con las direcciones y oficinas del Instituto
Geológico Minero y Metalúrgico;
• Desarrollar, mantener y actualizar la base de datos geocientífica y jurisdiccional
administrativa minera institucional;
• Desarrollar y/o administrar el hardware, software, redes y comunicaciones como base para
mantener la operatividad de los sistemas de información institucionales;
• Planear, organizar, dirigir y ejecutar las actividades de digitalización, diagramación y edición
de la carta geológica y temática;
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
9
• Coordinar con las instituciones gubernamentales la implementación de las políticas y
estándares para la integración tecnológica del Estado;
• Brindar asistencia técnica a la Alta Dirección, y otros órganos del Instituto Geológico Minero
y Metalúrgico en aspectos de su competencia, cuando le sean consultados;
• Proporcionar soporte, asegurando el mantenimiento de los equipos;
• Asesorar, capacitar y orientar a los miembros de la institución para la correcta utilización
de los programas informáticos;
• Cautelar la instalación de programas con licencia y realizar revisiones periódicas;
• Otras funciones que le sean asignadas.
Para el funcionamiento del Plan de Contingencia y Recuperación de Servicios de TI del Centro
de Datos, se ha establecido la siguiente organización operativa, conformado exclusivamente por
personal de la Oficina de Sistemas de Información.
Figura 1. Organización operativa del Plan de Contingencia y Recuperación de Servicios de TI del
Centro de Datos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
10
RESPONSABLE DESCRIPCIÓN
Líder de Contingencia y
Recuperación de Servicios
de TI
• Representado por el Director/a de la Oficina de Sistemas de Información del INGEMMET
• Se encarga de analizar, definir y tomar decisiones ante incidentes disruptivos de los servicios informáticos considerados como críticos por los procesos de negocio.
• Dirige las acciones mientras dura el incidente e informa a instancias superiores el desarrollo y resultado final de la recuperación.
Coordinador de Contingencia y Recuperación de Servicios de TI
• Responsable de brindar soporte a la continuidad operativa y de contingencia de TI.
• Coordina con los miembros de los equipos de recuperación las actividades de recuperación y la gestión documentaria.
Equipos de Contingencia y
Recuperación de Servicios
de TI
• Representado por los especialistas de las áreas de la OSI.
• Los equipos de recuperación de TI, se encargan de la respuesta al incidente y la recuperación de los servicios de TI críticos que se han visto afectados por la interrupción del servicio.
• Estos equipos se conforman y operan de acuerdo a las indicaciones del Líder de Contingencia y Recuperación de Servicios de TI (Asumido por el Coordinador de cada área).
• Los miembros de los equipos de recuperación coordinan directamente con sus Proveedores de servicios.
7.1.2. ROLES Y RESPONSABILIDADES
a) El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Establece las actividades de la gestión del incidente, enfocado a los aspectos estratégicos
de la recuperación de las tecnologías de información.
• Informa al Gerente General y a quien corresponda los avances, resultados y estrategias
adoptadas durante la gestión del incidente de TI.
• Decide activar el Plan de Contingencia y Recuperación de Servicios de TI del Centro de
Datos.
• Provee liderazgo general de los equipos de personas involucrados en el proceso de
recuperación.
• Guía al personal necesario durante la situación de contingencia y supervisa los avances de
la recuperación de los servicios de TI.
• Asegura la provisión de esquemas de recuperación de los servicios y equipos de
Tecnologías de la Información, tales como:
o Infraestructura
o Aplicaciones
o Comunicaciones
o Servicios
o Centro de Datos
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
11
• Respaldos:
o Asegura la ejecución de los respaldos de información según procedimiento y
frecuencia.
o Asegura que los respaldos sean enviados fuera de la Institución luego de ejecutar
los respaldos.
• Comunicaciones
o Vocero oficial de la OSI
o Se encarga de comunicar a la Gerencia General y a las instancias que corresponda
los incidentes, soluciones e impacto que afectan severamente a la Institución, así
como los resultados de la gestión de la recuperación de los servicios de TI del
Centro de Datos.
o Dirige las pruebas de validación de la lista de contactos de los miembros de los
equipos de recuperación.
• Aprueba la documentación referida a los planes de ejecución, recuperación y de las
Pruebas del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
b) El Coordinador de Contingencia y Recuperación de Servicios de TI.
• Propiciar la aplicación metodológica de los planes de ejecución, recuperación y de las
pruebas que conforman el Plan de Contingencia y Recuperación de los Servicios de TI del
Centro de Datos.
• Coordinar, supervisar y controlar las labores de modificación, actualización y
mantenimiento de los planes y procedimientos de contingencia, en coordinación con cada
equipo responsable de sus procedimientos y estrategias de recuperación.
• Coordinar con los equipos responsables las pruebas de contingencia y recuperación de
Servicios de TI del centro de datos acorde a la programación aprobada.
• Durante las pruebas tiene el rol de veedor y/o auditor de las pruebas de recuperación
tecnológica, emitir observaciones y revisar los informes de cada prueba realizada.
• Propiciar las capacitaciones y entrenamientos internos a los distintos equipos de
contingencia y recuperación de servicios de TI del centro de datos con respecto a temas
de continuidad y recuperación tecnológica.
• Disponibilidad del personal:
o Asegurar la actualización del plan respecto a los miembros de los equipos de
recuperación.
o Asegurar que la información y datos proporcionado por el personal se encuentre
actualizada.
• Informar y entregar al Líder de contingencia y recuperación de servicios de TI del Centro
de Datos los resultados de las pruebas.
• Coordinar con los equipos de recuperación de servicios de TI del Centro de Datos las
estrategias técnicas a implementar.
c) El Equipo de Redes y Comunicaciones de Contingencia y Recuperación de Servicios de TI del
Centro de Datos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
12
• Verificar que se mantiene actualizado el inventario de las plataformas de los servidores
físicos y virtuales, telecomunicaciones y seguridad perimetral de la Institución.
• Dirige y coordina la respuesta y recuperación de las plataformas y servicios que soportan
los sistemas críticos de la Institución
• Revisar periódicamente los esquemas de contingencia y disponibilidad de las plataformas
de servidores y comunicaciones
• Recuperación de las Bases de Datos.
• Coordinar con proveedores el mantenimiento y soporte en casos de contingencia.
• Monitorear la red y definir medidas preventivas para minimizar o evitar las contingencias
de los Servidores.
• Informa al Líder periódicamente el estatus, impacto, actividades y tiempos de
recuperación durante un incidente.
• Coordinar y supervisar que se cumplan en forma apropiada y completa los procedimientos
de respaldo de los sistemas y plataformas tecnológicas.
• Participar activamente en las pruebas del Plan de Contingencia y Recuperación de Servicios
de TI del Centro de Datos.
• Apoyar en las pruebas integrales de los equipos de Desarrollo hasta descartar la presencia
de fallas y/o errores.
• Participar en la actualización del Plan de Contingencia y Recuperación de Servicios de TI
del Centro de Datos y aprobar los procedimientos de recuperación.
d) El Equipo de Desarrollo y Mantenimiento de Sistemas de Contingencia y Recuperación de
Servicios de TI del Centro de Datos.
• Mantener actualizado el inventario de los sistemas de información y sus versiones.
• Coordinar la recuperación de las aplicaciones con el Equipo de Redes y Comunicaciones.
• Implementar con el Equipo de Redes y Comunicaciones los esquemas y/o procedimientos
que faciliten la resolución de incidentes.
• Participar en las pruebas del Plan de Contingencia y Recuperación de Servicios de TI del
Centro de Datos validando la operatividad de los servicios críticos de los procesos del
INGEMMET.
• Participar en la actualización del Plan de Contingencia y Recuperación de Servicios de TI
del Centro de Datos.
e) El Equipo de Soporte Técnico de Contingencia y Recuperación de Servicios de TI del Centro
de Datos.
• Brinda mantenimiento y configura el Hardware y Software de los equipos de los usuarios
finales.
• Implementa los equipos y aplicaciones de los usuarios finales en caso de contingencia.
• Coordina con los otros equipos el soporte y apoyo durante la respuesta y recuperación de
los servicios de TI.
• Participa en las pruebas del Plan de Contingencia y Recuperación de Servicios de TI del
Centro de Datos validando la operatividad de los servicios críticos de los procesos de la
Institución con los usuarios finales.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
13
7.2. FASE 2: DETERMINACIÓN DE VULNERABILIDADES Y ESCENARIOS DE CONTINGENCIA
7.2.1. RECURSOS CRÍTICOS El Centro de Datos del INGEMMET está conformado por los siguientes componentes:
• Sistema eléctrico. ✓ Sistema de distribución para los distintos equipos Instalados ✓ Sistema de respaldo (Sistema ininterrumpido UPS) ✓ Sistema de iluminación ✓ Sistema de puesta a tierra ✓ Grupos electrógenos ✓ Sistema de climatización
• Sistema de seguridad. ✓ Sistema de control de accesos ✓ Sistema de circuito cerrado de Televisión (características de equipos activos) ✓ Sistema de detección de incendios ✓ Sistema de supresión de incendios ✓ Sistema de monitoreo ✓ Sistema de detección de aniegos, humo intrusión, etc.
• Sistema de telecomunicaciones. ✓ Características y distribución de los gabinetes ✓ Rutas y canalizaciones de telecomunicaciones ✓ Características del cableado horizontal y vertical
• Servicios de TI administrados en el Centro de Datos. ✓ Servicios de Microsoft (AD, DHP, DNS, Servidor de archivos, WSUS, servidor de
aplicaciones) ✓ Servicio de base de datos (Oracle) ✓ Servicio de comunicaciones (firewall, manejador de ancho de banda, filtro de
contenido, filtro de aplicaciones y anti-denegación) ✓ Servicio de impresión
• La infraestructura de hardware de la institución está generalmente conformada por: ✓ Servidores. ✓ Impresoras, Plotters, Escáneres. ✓ Equipos Networking. ✓ Central Telefónica Digital ✓ Pozos de Tierra. ✓ UPS. ✓ Computadoras y Laptops ✓ Aire Acondicionado para equipamiento crítico.
• El Software Está constituido por los sistemas operativos, motores de base de datos, software de desarrollo de sistemas, software de comunicaciones, antivirus, software de ofimática (hoja de cálculo, procesador de textos, etc.) y utilitarios para la gestión de oficina.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
14
• De la revisión del Plan de Continuidad Operativa del INGEMMET se han identificado los Servicios de TI asociados que usan las unidades orgánicas.
Ítem Unidades Orgánicas Actividades Críticas Servicios de TI
1
Dirección de Geología
Ambiental y Riesgo
Geológico
Formular el esquema de trabajo de
campo para realizar las evaluaciones.
Office Microsoft
(Word, Excel, PPT)
Solicitar los medios económicos para
la ejecución del esquema de trabajo
de campo
Realizar el trabajo de campo para la
elaboración y obtención de
información para la posterior
elaboración de los mapas de peligros
geológicos
Elaborar los informes de evaluación y
los mapas de peligro geológicos
2 Oficina de Sistemas
de Información
Brindar el requerimiento tecnológico.
Office Microsoft
(Word, Excel, PPT)
Verificar necesidad del soporte
técnico
Brindar atención de soporte técnico.
Verificar las aplicaciones
Ejecutar el plan de contingencia.
3 Oficina de
Administración
Gestionar la adquisición de bienes y
servicios a contratar
Office Microsoft
(Word, Excel, PPT)
SIAF, INGEADMIN
Recepcionar y distribuir los bienes
Gestionar la habilitación de servicios
básicos.
Gestionar la ejecución del pago de
haberes y salarios de acuerdo a la
planilla
Proporcionar orientación al personal
para la atención médica y sicológica y
realizar su seguimiento
Gestionar los beneficios sociales a
trabajadores y sus familias
Realizar los pagos a proveedores
internos y externos
Recaudación y registro de ingresos
Administrar los fondos de caja chica
4 Unidad de
Administración
Recepción de documentos de acuerdo
a los documentos de calidad y registro
oportuno en el STD y SIDEMCAT
Office Microsoft
(Word, Excel, PPT),
SIDEMCAT
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
15
Ítem Unidades Orgánicas Actividades Críticas Servicios de TI
Documentaria y
Archivo
Distribución, adecuada, precisa y
oportuna de los documentos
ingresados en la mesa de partes
Ingresar adecuadamente la
información contenida en las
solicitudes de petitorios mineros en el
SIDEMCAT
5
Oficina de
Planeamiento y
Presupuesto
Ejecutar la aprobación presupuestal
en base a los procedimientos
establecidos para casos de
emergencias
Office Microsoft
(Word, Excel, PPT),
SIAF, INGEADMIN
6
Oficina de
Administración (A
cargo de la GCO)
Dirigir y liderar las actividades del
PCO.
Office Microsoft
(Word, Excel, PPT)
Recibir la información de daños
ocasionados por el evento crítico, las
mismas que servirán para la toma de
decisiones.
Dirigir las actividades del EME-
INGEMMET
Fuente: Plan de Continuidad Operativa de INGEMMET
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
16
• De los sistemas de información más importantes que soportan los procesos de los órganos y unidades orgánicas del INGEMMET se tienen:
Ítem Función Dirección/Unidades Sistemas de
Información
1
Realizar y fomentar la investigación de
los recursos minerales, energéticos e
hidrogeológicos del país; generar y
actualizar el inventario de los mismos y
promover su conocimiento y
desarrollo;
Dirección de Geología
Regional
Dirección de Geología
Ambiental y Riesgo
Geológico
Dirección de Recursos
Minerales y Energéticos
Dirección de Laboratorios
BD GEOCIENTIFICA
GEOCATMIN
SIL (SISTEMA
INTEGRADO DE
LABORATORIO)
2
Investigar y efectuar estudios en
geomorfología, glaciología y geología
ambiental en el ámbito de su
competencia, así como estudios de
evaluación y monitoreo de los peligros
geológicos en el territorio nacional a
efecto de determinar sus efectos en la
comunidad y el medio ambiente;
Dirección de Geología
Ambiental y Riesgo
Geológico
GEOCATMIN
BD GEOCIENTIFICA
RIESGO VOLCÁNICOS
RIESGOS GEOLÓGICOS
3
Desarrollar, mantener y actualizar la
Carta Geológica Nacional y sus
derivaciones temáticas, en
coordinación con los organismos
competentes.
Dirección de Geología
Regional
GEOCATMIN
BD GEOCIENTIFICA
LÉXICO
ESTATIGRÁFICO
CATÁLOGO DE
FÓSILES
4
Identificar, estudiar y monitorear los
peligros asociados a movimientos en
masa, actividad volcánica, aluviones,
tsunamis y otros;
Dirección de Geología
Ambiental y Riesgo
Geológico
OVI (OBSERVATORIO
VULCANOLOGICO)
BD GEOCIENTIFICA
5
Acopiar, integrar, salvaguardar,
administrar, interpretar y difundir la
información geocientífica nacional;
siendo el depositario oficial de toda la
información geológica minera del país;
Dirección de Geología
Regional
Dirección de Geología
Ambiental y Riesgo
Geológico
Dirección de Recursos
Minerales y Energéticos
Dirección de Laboratorios
REPOSITORIO
INSTITUCIONAL,
BD GEOCIENTIFICA
GEOCATMIN
SIL
6
Conformar, administrar y mantener la
base de datos geocientífica del Perú,
como una herramienta básica para el
fomento de la inversión y del desarrollo
nacional, así como, proveer la
información geocientífica necesaria
Dirección de Geología
Regional
Dirección de Geología
Ambiental y Riesgo
Geológico
Dirección de Recursos
BD GEOCIENTIFICA
GEOCATMIN
SIL
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
17
Ítem Función Dirección/Unidades Sistemas de
Información
para el cuidado del medio ambiente y el
ordenamiento territorial;
Minerales y Energéticos
Dirección de Laboratorios
7
Administrar el inventario nacional de
los recursos no renovables del
subsuelo;
Dirección de Geología
Regional
Dirección de Geología
Ambiental y Riesgo
Geológico
Dirección de Recursos
Minerales y Energéticos
Dirección de Laboratorios
BD GEOCIENTIFICA
GEOCATMIN
SIL
8
Recibir, admitir a trámite y tramitar
petitorios de concesión minera a nivel
nacional;
Dirección de Concesiones
Mineras
Dirección de Catastro
Minero
Unidad de Adm. Doc. y
Archivo
SIDEMCAT
SIGCATMIN
SISTEMA DE
DIGITALIZACION (WEB
/ DESKTOP)
9 Otorgar títulos de concesión minera; Dirección de Concesiones
Mineras
SIDEMCAT
FORMATOS
AUTOMATICOS
10
Conducir el proceso de remate de
petitorios mineros a nivel nacional en
los casos de simultaneidad;
Dirección de Concesiones
Mineras SIDEMCAT
11
Tramitar y resolver solicitudes de
acumulación, división o
fraccionamiento de derechos mineros.
Dirección de Concesiones
Mineras
Dirección de Catastro
Minero
SIDEMCAT
SIGCATMIN
12
Constituir las sociedades legales de
oficio o a solicitud de parte, cuando
corresponda;
Dirección de Concesiones
Mineras SIDEMCAT
13
Extinguir petitorios y concesiones
mineras, por causales de abandono,
caducidad, nulidad, inadmisibilidad,
rechazo, renuncia, cancelación y otras
que determine la ley y publicar su libre
denunciabilidad cuando corresponda;
Dirección de Concesiones
Mineras
Dirección de Derecho de
Vigencia
SIDEMCAT
14 Resolver sobre la renuncia parcial o
total de las concesiones mineras;
Dirección de Concesiones
Mineras
Dirección de Catastro
Minero
SIDEMCAT
SIGCATMIN
15
Administrar el Catastro Minero, el Pre-
catastro y el Catastro de Áreas
Restringidas a la Actividad Minera;
Dirección de Catastro
Minero
SIDEMCAT
SIGCATMIN
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
18
Ítem Función Dirección/Unidades Sistemas de
Información
16
Administrar y distribuir el Derecho de
Vigencia y Penalidad, controlando los
abonos efectuados, las deudas y
expidiendo las resoluciones de no pago
de derecho de vigencia y penalidad y
resoluciones de exclusión de dicha
condición;
Dirección de Derecho de
Vigencia SIDEMCAT
17 Elaborar el Padrón Minero Nacional; Dirección de Derecho de
Vigencia SIDEMCAT
18
Proporcionar a las Regiones
competentes en materia de
procedimiento ordinario minero,
información catastral integrada a nivel
nacional;
Dirección de Concesiones
Mineras
Dirección de Catastro
Minero
SIDEMCAT
SIGCATMIN
GEOCATMIN
19
Incorporar y mantener en el Catastro
Minero Nacional la información
proveniente de los Gobiernos
Regionales en materia de
procedimientos mineros, según
competencias;
Dirección de Catastro
Minero
SIDEMCAT
SIGCATMIN
20
Administrar un sistema interconectado
de información y proceso entre el
órgano jurisdiccional administrativo
minero del Gobierno Nacional y los
órganos jurisdiccionales
administrativos mineros de los
Gobiernos Regionales según las
competencias asignadas por ley;
Dirección de Catastro
Minero
SIDEMCAT (CITRIX)
SIGCATMIN (CITRIX)
GEOCATMIN (WEB)
FORMATOS
AUTOMÁTICOS
(CITRIX)
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
19
Al respecto se identifican los siguientes sistemas de información:
ÍTEM SISTEMAS DE INFORMACIÓN
1 GEOCATMIN
2 SIDEMCAT
3 FORMATOS AUTOMÁTICOS
4 BD GEOCIENTÍFICA
5 SIAF
6 INGEADMIN
7
SISTEMA DE DIGITALIZACIÓN
DESKTOP
8 R. VOLCÁNICOS,
9 LÉXICO ESTATIGRÁFICO
10 CATÁLOGO DE FÓSILES
11 R. GEOLÓGICOS
12 OVI
13 SIGCATMIN
14 SISTEMA DE DIGITALIZACIÓN WEB
15
SIL (SISTEMA INTEGRADO DE
LABORATORIO)
De este listado se identificó la priorización, en función a los niveles de impacto en la
Institución por la interrupción prolongada y severa de los sistemas de información.
NIVELES DESCRIPCIÓN DE LOS NIVELES DE IMPACTO
Alto (3)
Puede afectar seriamente a la Institución, en términos de
paralización de las operaciones/actividades y servicios de los
procesos de la institución, incumpliendo metas y objetivos trazados
más allá de los tiempos tolerables, pérdidas considerables de
información, demandas legales y daño considerable a la imagen de
la Institución.
Medio (2)
Afecta a ciertas operaciones/actividades cuyo impacto es limitado a
áreas y/o procesos específicos de la Institución por lo que puede ser
solucionado sin afectación de la Institución.
Bajo (1)
No causa efecto considerable en la Institución.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
20
Se muestran los sistemas de información priorizados y con los órganos y unidades orgánicas que
están asociadas por prioridad.
ÍTEM SISTEMAS DE
INFORMACIÓN
DIRECCIONES / OFICINAS/ UNIDADES ORGÁNICAS
PR
IOR
IZA
CIÓ
N
Dire
cció
n de
Geo
logí
a R
egio
nal
Dire
cció
n de
Geo
logí
a A
mbi
enta
l y R
iesg
o G
eoló
gico
Dire
cció
n de
Rec
urso
s M
iner
ales
y E
nerg
étic
os
Dire
cció
n de
Lab
orat
orio
s
Dire
cció
n de
Con
cesi
ones
Min
eras
Dire
cció
n de
Cat
astr
o M
iner
o
Uni
dad
de A
dm. D
oc. y
Arc
hivo
Dire
cció
n de
Der
echo
de
Vig
enci
a
Ofic
ina
de A
dmin
istr
ació
n
Ofic
ina
de P
lane
amie
nto
y P
resu
pues
to
1 GEOCATMIN x x x x x
2 SIDEMCAT x x x x
3 FORMATOS AUTOMÁTICOS x x
4 BD GEOCIENTÍFICA x x x x
5 SIAF x x
6 INGEADMIN x x
7 SISTEMA DE DIGITALIZACIÓN DESKTOP x x x
8 R. VOLCÁNICOS, x
9 LÉXICO ESTATIGRÁFICO x
10 CATÁLOGO DE FÓSILES x
11 R. GEOLÓGICOS x
12 OVI x
13 SIGCATMIN x x x
14 SISTEMA DE DIGITALIZACIÓN WEB x x x
15 SIL (SISTEMA INTEGRADO DE
LABORATORIO) x
En el protocolo para la reactivación de los procesos y servicios del INGEMMET del Plan de
Continuidad Operativa sección (7.6.4.1) se define que la recuperación del funcionamiento
de los procesos y actividades críticas de la Institución se realiza entre las 24 y 48 horas de
ocurrido el evento, siendo este dato el Tiempo Objetivo de Recuperación (RTO).
Bajo la premisa de los RTO (tiempos objetivos de recuperación) definimos la siguiente
priorización para la recuperación de los sistemas de información:
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
21
PRIORIZACIÓN TIEMPO OBJETIVO DE RECUPERACIÓN
1 De 24 a 32 horas
2 De 32 a 40 horas
3 De 40 a 48 horas
Los sistemas de información que soportan los procesos críticos de INGEMMET en función a los
tiempos objetivos de recuperación son:
ÍTEM SISTEMAS DE INFORMACIÓN PRIORIZACIÓN
1 GEOCATMIN 1
2 SIDEMCAT 1
3 FORMATOS AUTOMÁTICOS 1
4 BD GEOCIENTÍFICA 1
5 SIAF 1
6 INGEADMIN 1
7 SISTEMA DE DIGITALIZACIÓN DESKTOP 1
8 R. VOLCÁNICOS, 1
9 LÉXICO ESTATIGRÁFICO 1
10 CATÁLOGO DE FÓSILES 1
11 R. GEOLÓGICOS 1
12 OVI 2
13 SIGCATMIN 2
14 SISTEMA DE DIGITALIZACIÓN WEB 2
15 SIL (SISTEMA INTEGRADO DE LABORATORIO) 2
7.2.2. IDENTIFICACIÓN DE ESCENARIOS.
Los Servicios de TI que operan en el Centro de Datos del INGEMMET están preparados con
estrategias de recuperación local para responder y recuperarse ante eventos de afectación
individual y/o grupal pero no total debido a que la recuperación únicamente se podría realizar
en el mismo Centro de Datos.
Ante eventos que afecten severamente a todos los servicios del Centro de Datos de la
Institución, estos se verían seriamente interrumpidos y por tiempo indeterminado. Las
estrategias de recuperación para eventos totales como contar con un Centro de Datos Alterno
deberán ser evaluadas, definidas e implementadas sin depender de la ubicación geográfica.
A continuación, se listan los escenarios de contingencia para los siguientes riesgos, así como
el tipo de recuperación:
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
22
ÍTEM ESCENARIOS RECUPERACIÓN
LOCAL RECUPERACIÓN
EXTERNA
1 Atentado terrorista ✓
2 Sismo de gran magnitud y
tsunami en Lima y Callao.
✓
3 Ataque informático ✓
4 Fallas en el HW, SW y
Comunicaciones ✓
5 Equivocaciones / Errores ✓
6 Falla en el suministro eléctrico ✓
7 Incendio en Sede Central del
INGEMMET ✓ ✓
8 Falla de Aire Acondicionado ✓
9 Grave alteración del orden
público
✓
10 Falla o caída de servicio de
comunicaciones (proveedor). ✓
Adicionalmente, para los escenarios de Sismo de gran magnitud y tsunami en Lima y Callao y/o
Incendio en Sede Central del INGEMMET, en la fase de contingencia se tiene en cuenta lo
señalado en los planes:
• Plan de contingencia ante sismo de gran magnitud seguido de tsunami frente a la
costa central del Perú del INGEMMET.
https://portal.ingemmet.gob.pe/documents/73138/1110261/PLAN_CONTINGENCIA
_SISMO_GRAN_MAGNITUD.pdf/b15790fc-d5dd-4ecd-b1ab-fd1427d8097c
• Plan de seguridad y evacuación del INGEMMET.
https://laboratorio.ingemmet.gob.pe/documents/73138/1110261/PLAN_SEGURIDA
D_EVACUACION_INGEMMET.pdf/4d648472-5dcc-4118-b6a7-0f6de28bfa3f
7.2.3. IDENTIFICACIÓN DE CONTROLES EXISTENTES
La identificación de controles existentes, permiten conocer que tan protegidos están los
recursos de TI del INGEMMET frente a cada amenaza.
• Acuerdos de niveles de servicio con proveedor de enlace de comunicación donde se
encuentra ubicado el Centro de Datos.
• Cámaras de vigilancia en el interior del Centro de Datos.
• Mantenimiento de los pozos a tierra, mantenimiento de tableros eléctricos de la energía
estabilizada y UPS está a cargo de la Oficina de Sistemas de Información.
• El mantenimiento de tableros eléctricos de la energía comercial está a cargo de Servicios
Generales de la Unidad de Logística.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
23
• Mantenimiento para equipos de aire acondicionado del Centro de Datos está a cargo de
la Oficina de Sistemas de Información
• Redundancia en los enlaces de comunicaciones (fibra óptica) y de internet, pero con el
mismo proveedor.
• Mantenimiento del Sistema contra incendios en el Centro de Datos a cargo de la Oficina
de Sistemas de Información.
• Respaldo de información y custodia externa de medios de respaldo.
• Solución antivirus instalada en los servidores de red y computadoras.
7.2.4. EVALUACIÓN DE RIESGOS
Se tiene como base el procedimiento del Sistema de Gestión de la Calidad del INGEMMET,
SGC-P-005 “Gestión de Riesgos” el cual clasifica los riesgos y las escalas cuantitativas para los
niveles de ocurrencia e impacto de acuerdo con el tipo de riesgo relacionado a los Servicios de
TI del Centro de Datos.
Se define la escala cuantitativa de Probabilidad, detallada en el siguiente cuadro:
NIVEL PROBABILIDAD DE OCURRENCIA
Alto (3) Evento que ocurre de 9 a 12 veces al año
Medio (2) Evento que ocurre de 2 a 8 veces al año
Bajo (1) Evento que ocurre 1 vez al año
Se define la escala cuantitativa de Impacto, detallada en el siguiente cuadro:
NIVEL IMPACTO EN LA INSTITUCIÓN
Alto (3)
Puede afectar los niveles de operación y servicio de los Procesos de la Institución, incumplimiento metas y objetivos trazados, pérdidas considerables, demandas legales y daño considerable a la imagen de la Institución.
Medio (2) Afecta a ciertos Procesos cuyo impacto es limitado a áreas específicas de la Empresa por lo que puede ser solucionado por la Institución.
Bajo (1) No causa un efecto considerable en la Institución.
Se define la escala cuantitativa de Probabilidad e Impacto, detallada en el siguiente cuadro:
IMPACTO
PROBABILIDAD 1
Bajo 2
Medio 3
Alto
3 Alto
3 Riesgo
Moderado
6 Riesgo
Importante
9 Riesgo
Importante
2 Medio
2 4 6
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
24
Se definen los niveles de Riesgo, detallados en el siguiente cuadro:
NIVEL DE RIESGO
¿RIESGO TOLERABLE?
TRATAMIENTO
INACEPTABLE No tolerable
Requiere atención inmediata.
IMPORTANTE Necesita atención de la Jefatura de la OSI
MODERADO
Tolerable
Debe definirse el monitoreo.
TOLERABLE Administrar mediante procedimiento de rutina
ACEPTABLE No se requiere ninguna acción.
7.2.5. MATRIZ DE EVALUACIÓN Y CLASIFICACIÓN DE RIESGOS
N° Amenaza Controles Actuales
Pro
bab
ilid
ad
Imp
acto
Niv
el d
e R
iesg
o
Controles Propuestos
1 Terrorismo
Seguridad Física (vigilancia) Acceso a las Instalaciones Cámaras de vigilancia
1 3 3
- Incrementar Seguridad Física (vigilancia)
- Asegurar Acceso a las Instalaciones - Incrementar Cámaras de vigilancia
2 Terremoto No hay 1 3 3
- Centro de Datos Primario - Paredes de concreto - Gabinetes anclados - Centro de Datos Alterno
3 Inundaciones Sensores de Aniego 1 3 3 - Incrementar Sensores de Aniego
4 Manipulación y Sabotaje
Respaldos de Información
1 3 3 - Incrementar Respaldos de Información - Implementar Plan de Respaldo
Institucional
5 Falla de HW
Equipos de Alta Disponibilidad Respaldos de Información Garantía de Equipos Soporte y mantenimiento de equipos
2 2 4
- Mantener Equipos de Alta Disponibilidad
- Incrementar Respaldos de Información - Asegurar Garantía de Equipos - Asegurar Soporte y mantenimiento de
equipos
6 Falla de SW
Licencias, Soporte de Licencias Soporte de Proveedores Gestión de parches y versiones
1 2 2
- Asegurar el Soporte de Licencias. - Asegurar el Soporte de Proveedores. - Aplicación de parches de seguridad y
versiones.
7
Falla de Equipos de Comunicaciones
Alta Disponibilidad (Switch / Firewall)
2 3 6 - Herramienta para el Monitoreo de
equipos y conectividad
Riesgo Tolerable
Riesgo Moderado
Riesgo Importante
1 Bajo
1 Riesgo
Tolerable
2 Riesgo
Tolerable
3 Riesgo
Moderado
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
25
N° Amenaza Controles Actuales
Pro
bab
ilid
ad
Imp
acto
Niv
el d
e R
iesg
o
Controles Propuestos
Soporte y Mantenimiento de equipos
8 Errores / Equivocaciones
Respaldos de Información
3 2 6 - Procedimiento de Rollback - Elaboración de manuales o instructivos
de operación
9 Falla de Energía Eléctrica
UPS 2 3 6 - Grupo electrógeno,
10 Incendio
Sistema contra incendio Capacitación al personal de infraestructura y vigilancia
1 3 3
- Implementar sistema de detección y supresión de incendios.
- Capacitación Constante al personal de infraestructura y Vigilancia.
11 Falla de Aire de Precisión
Equipo de Aire de Precisión en alta disponibilidad Equipo de Aire de Precisión Split
2 2 4 - Implementar Sistema de Climatización
(mínimo 3 equipos de Aire de Precisión en Alta Disponibilidad)
12 Imposibilidad de acceso al INGEMMET
Acceso remoto vía VPN 1 2 2 - Implementar Herramienta informática
para Teletrabajo.
13 Caída de Servicio de Comunicaciones
Comunicar al proveedor ISP
1 3 3 - Contar con enlace de contingencia
7.3. FASE 3: DETERMINACIÓN DE LAS ESTRATEGIAS
A continuación, se presenta las estrategias para la contingencia.
7.3.1. ESTRATEGIAS DE PREVENCIÓN DE LA OFICINA DE SISTEMAS DE INFORMACIÓN.
a) Almacenamiento y respaldo de la información (BACKUPS)
Gestión de copias de respaldo (Backup) de la información almacenada y procesada en el
Centro de Datos, de acuerdo al procedimiento OSI-P007 Generación de copias de respaldo
y recuperación de la información, en donde se define las etapas del procedimiento para
generar el respaldo de la información, recuperación de archivos y el almacenamiento y
permanencia.
b) Sitios alternos para el Centro de Datos.
El Plan incluye una estrategia para recuperar y ejecutar operaciones de sistemas en
instalaciones alternativas por un periodo extendido; los sitios alternativos podrán ser:
- Propios de la entidad.
- Instalaciones alquiladas.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
26
Para tal efecto, de acuerdo a lo definido en Plan de Continuidad Operativa del INGEMMET
se debe considerar los lugares alternos definidos para la recuperación de equipos y
servicios de tecnologías de la información del Centro de Datos, de ser el caso.
Por otro lado, de acuerdo al marco normativo para realizar trabajo en modalidad de
trabajo remoto durante la emergencia suscitada, dicha modalidad será implementada
para los funcionarios y servidores civiles cuyas funciones y naturaleza de sus labores
puedan ser ejecutadas desde su domicilio o lugar de aislamiento domiciliario, utilizando
cualquier medio o mecanismo que posibilite realizar las labores fuera del centro de
trabajo.
c) Evaluación y Gestión de Proveedores.
o Listado de proveedores claves de servicios y recursos de TI, con sus datos de contacto
actualizados.
o Mantener listas detalladas de necesidades de equipos y sus especificaciones técnicas.
o Si es necesario, adquirir o habilitar hardware y software, así como transportarlos al
sitio alterno de ser el caso; las estrategias básicas para disponer de equipo de
reemplazo serán:
▪ Acuerdos con proveedores: Establecer acuerdos de nivel de servicios con los
proveedores de software, hardware y medios de soporte; se debe especificar el
tiempo de respuesta requerido.
▪ Equipos de respaldo: Los equipos requeridos se compran por adelantado y se
almacenan en una instalación segura externa. (*)
▪ Equipo compatible existente: Equipo existente en sitios alternativos.
(*) Adquirir los equipos cuando se necesitan puede ser financieramente más eficiente,
pero puede ser más largo el tiempo de recuperación incluyendo el tiempo de
adquisición. Asimismo, almacenar un equipo sin ser usado es costoso, pero permite
que la recuperación comience más rápidamente.
d) Capacitación y personal de reemplazo.
o Todo el personal de la Oficina de Sistemas de Información, debe entrenarse en el
proceso de recuperación de los servicios de TI. La capacitación debe ser planificada,
estructurada y acorde con las exigencias de recuperación.
o Se debe planificar las vacaciones de manera que garantice la presencia del personal
clave para la contingencia y recuperación de servicios, tales como soporte técnico,
redes y comunicaciones y desarrollo de mantenimiento de sistemas.
e) Trabajo remoto.
o Activación de accesos VPN de manera segura.
o Verificación y validación de acceso seguro a los sistemas de información.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
27
f) Renovación tecnológica
o Revisión anual de obsolescencia tecnológica de los equipos que alberga el centro de
datos, para realizar la planificación de adquisición y/o renovación en caso se
requiera.
o Revisar las estadísticas de las incidencias el cual es una señal de deterioro de los
equipos que se encuentran en el Centro de Datos.
g) Estrategia frente a emergencias de servicios de tecnologías de la información
El alcance involucra las acciones que deben realizarse ante una emergencia o desastre a
fin de salvaguardar los activos de información del INGEMMET y garantizar la continuidad
de los servicios de TI del Centro de Datos.
A continuación, se muestra el flujo de la gestión de crisis y de emergencia, en esta sección
se desarrolla:
La detección del incidente, análisis, activación de la contingencia, la comunicación y acción
de los Equipos de Contingencia y Recuperación de Servicios de TI, activación de
procedimientos, retorno y cierre de la contingencia. Este flujo es aplicable para todos los
escenarios de contingencia. Para los escenarios de Sismo de gran magnitud y tsunami en
Lima y Callao y/o Incendio en Sede Central del INGEMMET, durante la ocurrencia del
evento, se seguirán los planes de continuidad operativa definidos a nivel institucional, para
luego continuar con el flujo descrito en el presente acápite.
ALERTA
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
28
Identifica y comunica al personal de Tecnología el incidente que interrumpe o reduce la calidad del
servicio tecnológico.
No. Equipo/Rol Actividad
1. Alertas Dependiendo del tipo de evento, el Administrador, Profesional o Especialistas de TI atenderá inmediatamente la alerta. Estas alertas provienen de: - De los equipos/plataformas tecnológicas (servidores, respaldos, antivirus, telecomunicaciones, otros). - Sensores de alerta del Centro de Datos - Llamadas/Avisos de usuarios finales de los procesos (Llamadas, Help Desk, Correo). - De proveedores de telecomunicaciones.
Obs: El administrador, profesional o Especialistas de Tecnología de Información son miembros de los Equipos de Contingencia y Recuperación de Servicios de TI del Centro de Datos. Para efectos del procedimiento mencionaremos al Especialista de TI como rol ejecutor de los procedimientos.
2. Especialista de TI Atiende de inmediato la alerta y valida que no es un falso positivo, inicia la indagación y evaluación del evento para determinar el nivel de severidad.
EVALUACIÓN DEL EVENTO
El objetivo de este procedimiento es evaluar el nivel de afectación de las tecnologías de información
de acuerdo con los resultados y definir si es necesario comunicar al Líder de Contingencia y
Recuperación de Servicios de TI del Centro de Datos.
No. Rol Actividad
1. Especialista de TI (A cargo de la solución del evento)
Establecer el posible nivel de afectación que ocasiona el equipo/servicio a la Institución:
• Afectación de los sistemas informáticos críticos
• Afectación de los enlaces de comunicaciones.
• Paralización de los servicios críticos de TI
• Afectación parcial o total de las instalaciones del Centro de Datos. Dependiendo del grado de afectación, evaluará si es un incidente y su severidad, para luego comunicar al Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos
2. Especialista de TI (A cargo de la solución del Incidente)
Se define como Incidente Severo a la:
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
29
No. Rol Actividad
- Afectación irreversible del Hardware, Software de un equipo o equipos de los sistemas informáticos críticos que soportan los Procesos de la Institución.
- Afectación severa de indisponibilidad de la red de datos. - Indisponibilidad prolongada del servicio de Internet. - Afectación del Centro de Datos por la materialización de alguna
amenaza tales como terremoto, incendio, inundación, explosión, falta de fluido eléctrico, apagado de los aires acondicionados u otros cuyo efecto es irreversible.
- El tiempo de recuperación del incidente sobrepasa los tiempos de indisponibilidad del servicio.
Los servicios de TI a considerar como críticos ante una indisponibilidad y están priorizados para recuperar en entre las 24 y 30 horas ocurrido el incidente son:
- GEOCATMIN - SIDEMCAT - FORMATOS AUTOMÁTICOS - BD GEOCIENTIFICA - SIAF - INGEADMIN - SISTEMAS DE DIGITALIZACIÓN DESKTOP - R. VOLCANICOS - LÉXICO ESTATIGRÁFICO - CATÁLOGO DE FÓSILES - R. GEOLÓGICOS
Dependiendo de la evaluación y la afectación comunicará al Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos. El tiempo de evaluación no deberá sobrepasar los 20 minutos desde que se atendió la alerta.
3. Especialista de TI (A cargo de la solución del Incidente)
En caso de que determine que el incidente es severo luego de la evaluación comunica e informa al Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos utilizando el medio de comunicación que se disponga en el momento (mensaje, presencial, celular) lo siguiente: - Detalle del incidente ocurrido - Afectación a la Institución por indisponibilidad del servicio de TI. - Tiempo aproximado de inoperancia
En caso el Especialista de TI determine que no es un incidente severo
este se resolverá con los procedimientos internos propios del día a día.
4. Líder de Contingencia y Recuperación de
En base a la información recibida, decidirá activar a los equipos de recuperación de TI para que en conjunto se defina la solución a seguir.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
30
No. Rol Actividad
Servicios de TI del Centro de Datos.
Activa el Árbol de Llamadas para convocar a los equipos de contingencia.
ACTIVACIÓN DE LOS EQUIPOS DE CONTINGENCIA PARA LA RECUPERACIÓN DE SERVICIOS DE TI
Este procedimiento se utilizará cuando sea necesario convocar a los Equipos de Contingencia para
responder al incidente y gestionar la crisis/emergencia.
No. Rol Actividad
1. Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos
Convoca a reunión a los miembros de los equipos de contingencia y recuperación de servicios de TI en la Oficina de la OSI o de forma virtual. Activa el Árbol de llamadas.
2. Miembros de los Equipos de Contingencia y Recuperación de Servicios de Ti
Se reúnen de inmediato de manera presencial o virtual (teléfono) para definir los siguientes pasos de la recuperación de los servicios de TI afectados en el Centro de Datos. Según el incidente se convoca a los Equipos de Contingencia y recuperación de servicios de TI involucrados en la respuesta y recuperación. Árbol de Llamadas de Equipos de Contingencia y recuperación de Servicios de TI
ANÁLISIS Y ACTIVACIÓN DE CONTINGENCIA Y RECUPERACIÓN
Este procedimiento se utilizará tantas veces como se reúnan los equipos de contingencia y
recuperación de Servicios de TI (Redes y Comunicaciones, Desarrollo y Mantenimiento, Soporte
Técnico) para el análisis, coordinación y toma de decisiones de acuerdo a las soluciones o estrategias
de respuesta.
No. Rol Actividad
1. Especialista de TI (A
cargo de la solución del
Incidente)
Informa a todos los miembros de los equipos de contingencia y
recuperación de servicios de TI la afectación, las actividades
ejecutadas, los tiempos de inoperancia e indicando las opciones de
respuesta y recuperación de los servicios de TI.
2. Miembros de los
Equipos de contingencia
y Recuperación de
Servicios de TI del
Centro de Datos
Analizarán la información recibida y definirán las acciones o
actividades a ejecutar.
Este análisis puede involucrar la presencia de proveedores de TI para
el soporte respectivo.
Activa Árbol de llamadas para proveedores
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
31
No. Rol Actividad
Las acciones o actividades analizadas deberán tener la aprobación del
Líder de contingencia y recuperación de servicios de TI del Centro de
Datos.
3. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos
En base a la información recabada, el líder tomará la decisión de
activar y/o ejecutar los procedimientos de recuperación de los
servicios de TI afectados.
4. Miembros de los
Equipos de contingencia
Recuperación de
Servicios de TI del
Centro de Datos.
Dependiendo del procedimiento de recuperación, se inicia la
ejecución de las actividades plasmadas en cada documento tomando
en cuenta los requerimientos previos y los tiempos asignados para la
realización de la actividad.
5. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos
Informará a la Gerencia General las acciones y decisiones tomadas,
así como la expectativa de tiempo de recuperación de los servicios.
EVALUACIÓN Y MONITOREO DEL INCIDENTE
Este procedimiento se utilizará tantas veces como sea necesario para monitorear y coordinar las
estrategias y acciones propuestas para resolver el incidente.
No. Rol Actividad
1. Especialista de TI
(A cargo de la solución
del Incidente)
Ejecuta el o los procedimientos de recuperación identificados. De ser
necesario estarán presentes los proveedores que considere
necesario para la ejecución de actividades.
Monitorear permanentemente el avance de la ejecución de las
estrategias y acciones.
Informa el alcance y las acciones ejecutadas en respuesta al Líder de
contingencia y recuperación de servicios de TI del Centro de Datos y
a los responsables de los otros equipos vía comunicación elegida
(mensaje, celular, presencial).
2. Especialista de TI
(A cargo de la solución
del Incidente)
Evalúa las acciones ejecutadas y determina el tiempo aproximado de
recuperación e informa al Líder de contingencia y recuperación de
servicios de TI del Centro de Datos.
COMUNICACIÓN E INFORME
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
32
Este procedimiento se utilizará tantas veces como sea necesario comunicar e informar el estado del
incidente.
No. Rol Actividad
1. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos
Con el resultado de la evaluación del procedimiento anterior recaba
toda la información necesaria para comunicar e informar a la
Gerencia General la situación de incidente.
En caso de que las acciones tomadas no son efectivas y va a
demandar más tiempo de lo definido, entonces los Equipos volverán
a reunirse y analizar las nuevas acciones de recuperación de los
servicios de TI afectados.
En caso determina que la ejecución de las actividades de
recuperación resulta efectiva y se culmina en los tiempos definidos
se da por terminado la recuperación.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
33
DESACTIVACIÓN Y RETORNO A LA NORMALIDAD
Este procedimiento se utilizará cuando se culminen las actividades de recuperación.
No. Rol Actividad
1. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos.
Declara el fin del incidente, retornando a la normalidad y desactiva
los equipos de contingencia que atendieron el incidente.
2. Especialista de TI
(A cargo de la solución
del Incidente)
Con el Coordinador de Contingencia y Recuperación de Servicios de
TI del Centro de datos elaboran el informe de la respuesta y
recuperación del Incidente.
3. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos y
miembros de los
equipos de
recuperación.
Se reúnen en sesión de trabajo para:
- Coordinar próximas actividades producto del incidente.
- Evaluar la efectividad del Plan y los procedimientos de
recuperación.
- Actualizar los procedimientos de recuperación.
- Actualizar el Plan de Contingencia y Recuperación de Servicios de
TI del Centro de Datos.
- Lecciones aprendidas.
- Coordinar los trabajos a ejecutar con los proveedores que se
requieran post incidente.
4. Líder de contingencia y
recuperación de
servicios de TI del
Centro de Datos.
Informa a la Gerencia General y a las instancias que correspondan las
acciones, resultados y próximos pasos.
5. Coordinador de
Contingencia y
Recuperación de
Servicios de TI del
Centro de datos.
Trabaja sobre las medidas preventivas como revisión post incidente.
Coordina y supervisa la actualización de toda la documentación que
requiere oportunidades de mejora producto del incidente y actualiza
el cronograma de pruebas.
RESOLUCIÓN DE INCIDENTES CON PROCEDIMIENTOS INTERNOS.
El personal de la Oficina de Sistemas de Información debe elaborar y/o actualizar los siguientes
Procedimientos Técnicos que se utilizarán cuando se culminen las actividades de recuperación de
servicios de TI.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
34
ÍTEM PROCEDIMIENTO TÉCNICOS DE RECUPERACIÓN DE SERVICIOS DE TI
1 Procedimiento de Recuperación del Switch Core
2 Procedimiento de Recuperación del Filtros de Seguridad (Aplicaciones /
AntiDDoS)
3 Procedimiento de Recuperación de Servidores Físicos
4 Procedimiento de Recuperación de Base de Datos (Oracle)
5 Procedimiento de Recuperación de Servidores Virtuales de Producción /
Soporte
El listado de Procedimientos Generales de Recuperación, para los casos de atención de las
contingencias, se encuentra en el Anexo 8. Lineamientos para la contingencia y recuperación de
servicios de TI del Centro de Datos.
7.3.2. ACCIONES DESPUES DE LA CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS. A continuación, se muestra el flujo de la estrategia de ejecución de Prevención de las Tecnologías
de Información en caso de eventos que ameriten la actualización del Plan de Contingencia y
Recuperación de Servicios de TI del Centro de Datos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
35
REVISIÓN DE EVALUACIONES DE RIESGO
Este procedimiento se realizará cuando el Coordinador de Contingencia y Recuperación de Servicios
de TI del Centro de Datos ha culminado con la evaluación de los riesgos de TI y necesita coordinar con
los responsables/especialistas de TI la actualización del Plan de Contingencia y Recuperación de
Servicios de TI del Centro de Datos - Corrección, producto de los resultados obtenidos en la evaluación
de riesgos y los cambios en las tecnologías.
No. Rol Actividad
1. Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos
De acuerdo a la frecuencia definida para la revisión programada del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Se revisarán los resultados de las evaluaciones de riesgos de TI realizadas.
• En caso de que los resultados cuyos riesgos no son aceptables y necesita un tratamiento de los riesgos, el Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos definirá y coordinará con el Especialista de Tecnologías de Información a cargo el tratamiento a los riesgos.
2. Especialista de Tecnologías de Información
Se encarga de definir la estrategia para el tratamiento de los riesgos no aceptables. Luego de la definición de la estrategia del tratamiento, definirá el plan de acción o de trabajo para dicha implementación (técnica o procedimental). Luego de la implementación de controles y/o medidas que minimicen el riesgo, se evaluará nuevamente los riesgos para asegurar que estos se encuentran dentro de la zona de riesgos aceptables por la Institución.
3. Especialista de Tecnologías de Información
Luego de la evaluación de riesgos se revisa el Plan Contingencia y
Recuperación de Servicios de TI del Centro de Datos.
Producto del tratamiento de los riesgos, los activos que fueron afectados
con la mejora han sufrido cambios que han afectado al Plan o algún
procedimiento asociado a su recuperación.
El Especialista de TI procederá a actualizar la documentación
correspondiente al activo de TI y solicitará al Coordinador de
Contingencia y Recuperación de TI la inclusión de este activo en la
programación de las pruebas a fin de asegurar que los cambios
realizados en el Plan funciones con los cambios realizados producto del
tratamiento a los riesgos.
4. Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos
Revisa y consolida todos los cambios que han sufrido el Plan.
Programa las pruebas de los activos afectados por el cambio.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
36
No. Rol Actividad
Informa al Líder de Contingencia y Recuperación de Servicios de TI del
Centro de datos la actualización de los documentos de recuperación y
la programación de las pruebas a ejecutar según cronograma.
Se cierran las actividades de la Revisión Programada.
RESULTADOS DE LAS PRUEBAS
Este procedimiento se realizará toda vez que se han ejecutado pruebas del plan y/o sus procedimientos
de recuperación y se necesita actualizar la documentación respectiva, producto de los cambios.
No. Rol Actividad
1. Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos
De acuerdo al cronograma de pruebas del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Revisará los resultados de las pruebas, incidiendo en las observaciones que se obtuvieron producto de la ejecución de las pruebas.
• Definirá y coordinará con el Especialista de Tecnologías de Información a cargo la resolución de las observaciones emitidas en el informe de la prueba.
2. Especialista de Tecnologías de Información
Resolverá las observaciones emitidas en el informe de las pruebas. Los cuales pueden involucrar la atención de equipos multidisciplinarios y/o proveedores.
3. Especialista de Tecnologías de Información
Luego de la resolución de las observaciones revisa y actualiza el Plan de
Contingencia y Recuperación de Servicios de TI del Centro de Datos.
4. Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos
• Revisa y valida con el Especialista la actualización de los documentos de recuperación del Plan.
• Informa al Líder de Contingencia y Recuperación de Servicios de TI del Centro de datos la actualización de los documentos de recuperación.
• Se cierra las actividades de los resultados de las pruebas.
REVISIÓN POST INCIDENTE
Este procedimiento se ejecuta luego que ha culminado y resuelto un incidente en tecnologías de
información y que ha afectado los componentes y/o servicios de TI.
No. Rol Actividad
1. Líder y Coordinador de Contingencia y Recuperación de
Revisaran el impacto en los procesos de la Institución por la indisponibilidad en los servicios de TI. Revisarán los resultados de las actividades que recuperaron los servicios de TI y las oportunidades de mejora a implementar.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
37
No. Rol Actividad
Servicios de TI del Centro de datos
2. Líder de Contingencia y Recuperación de Servicios de TI del Centro de datos
Definirá y coordinará con el Especialista de Tecnologías de Información a cargo de la resolución del incidente en los componentes y/o Servicios de TI afectados.
3. Especialista de Tecnologías de Información
Revisará los componentes e implementará las mejoras que se identificaron como oportunidades. Puede involucrar la atención de equipos multidisciplinarios y proveedores. Revisar y actualizar el Plan de Contingencia y Recuperación de Servicios del Centro de Datos y los Procedimientos de Recuperación asociados.
4. Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de datos
• Revisa y valida con el Especialista la actualización de los documentos de recuperación del Plan.
• Informa al Líder de Contingencia y Recuperación de Servicios de TI del Centro de datos la actualización de los documentos de recuperación.
• Se cierra las actividades de Revisión Post incidente.
7.3.3. ESTRATEGIA DE COMUNICACIÓN ANTE LA CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI Se han definido los siguientes esquemas de comunicación entre los integrantes de los equipos
de contingencia y recuperación de servicios de TI:
PRIORIDAD ESQUEMA DE COMUNICACIÓN
1 Por WhatsApp grupal
2 Por llamadas a celular directamente
3 Por correos electrónicos grupales
4 Por llamadas a teléfonos fijos
5 De manera presencial
El coordinador de recuperación de TI deberá revisar con una frecuencia anual el esquema de
comunicación a fin de mantener la vigencia y actualización de los números celulares, fijos,
datos, otros. Asimismo, programar con el Líder de Recuperación de TI las pruebas el árbol de
llamadas.
ÁRBOL DE LLAMADAS
El árbol de llamadas se utilizará para convocar a los Equipos de Contingencia y Recuperación
de Servicios de TI, los líderes de equipos, a sus respectivos equipos de recuperación y a los
proveedores de TI en casos sean necesarios utilizando el esquema de comunicación definido
por la Dirección de la Oficina de Sistemas de Información.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
38
Esquema de comunicación – Árbol de llamadas.
En los Anexos se encuentran la lista de contactos de emergencia – Oficina de Sistemas de
Información (Anexo 6) y de los proveedores críticos (Anexo 7).
7.4. FASE 4: ELABORACIÓN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI
El Plan de Contingencia y Recuperación de Servicios de TI facilita procedimientos detallados a
seguir, paso a paso, para recuperar los sistemas y las comunicaciones que han tenido
interrupciones y ayudar a simplificar la normalidad en las operaciones, reduciendo así
cualquier impacto negativo en las operaciones de la institución. El proceso de recuperación de
servicios de TI del centro de datos; fija las prioridades para su recuperación e indica los pasos
necesarios para reiniciar, reconfigurar y recuperar los sistemas de información y las
comunicaciones. El Plan de recuperación de servicios de TI incluye a todos los proveedores
más relevantes.
Al ser identificados los eventos de contingencia y los escenarios de riesgos, se desarrollan los
Planes de Contingencia agrupados por las categorías indicadas previamente. El Plan de
Contingencia y Recuperación de los Servicios de TI del Centro de Datos, el cual comprender los
eventos de mayor impacto, identificados en la Matriz de Riesgo de Contingencia, los cuales
serán abordados tal como se indica en el siguiente cuadro:
N° Evento Exposición al Riesgo De Contingencia
1 Terremoto Alto FPCRSTI-01
2 Manipulación y Sabotaje Alto FPCRSTI-02
3 Falla de Hardware y Software
Medio FPCRSTI-03
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
39
4 Falla de Energía Eléctrica y falla de equipos de comunicaciones
Alto FPCRSTI-04
7.5. FASE 5: DEFINICIÓN Y EJECUCIÓN DE PLAN DE PRUEBAS El plan de pruebas está enfocado principalmente a simular situaciones de contingencia y
recuperación de servicios de TI del Centro de Datos en caso de incidencias producidas sobre
equipos, información y procesos, manejados en situaciones reales y cuyos respaldos si pueden
ser empleados y replicados en una hipotética situación de contingencia.
Con el fin de garantizar la ejecución integral de la prueba, se diseñará un conjunto de casos de
pruebas funcionales, que serán ejecutados por los equipos de contingencia y recuperación de
servicios de TI del Centro de Datos, los cuales probarán, verificarán y observarán cualquier
incidencia que se origine durante dicha prueba, a fin de retroalimentar cualquier acción que
pueda corregir el plan.
La información que se desarrollará como parte del Plan de Pruebas, tiene el siguiente
esquema:
o Metodología (descripción de la prueba a efectuarse)
o Alcances (áreas afectadas / personal involucrado)
o Resultados
Las pruebas relacionadas a este plan, se deberán ejecutar semestralmente, en los meses de
mayo y noviembre, con el fin de evaluar la preparación de la entidad, ante la ocurrencia de un
siniestro y realizar los ajustes necesarios.
N° FECHA ALCANCE DE PRUEBA
1 4ta Semana de Mayo Prueba de escritorio
2 4ta Semana de Noviembre Prueba de escritorio
7.6. FASE 6: IMPLEMENTACIÓN DEL PLAN DE CONTINGENCIA[CCA2] Y RECUPERACIÓN DE SERVICIOS DE TI
La implementación del presente plan se realizará en a partir del primer mes de su aprobación.
Para tal efecto, el/la Oficial de Seguridad de la Información, realiza las siguientes funciones:
• Supervisar las actividades de copias de respaldo y restauración.
• Establecer procedimientos de seguridad en los sitios de recuperación.
• Preparar las pruebas de restauración de hardware, software y servicios de TI del Centro de
Datos.
• Participar en las pruebas y simulacros de desastres.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
40
7.7. FASE 7: MONITOREO
La fase de Monitoreo permite tener la seguridad de que se podrá reaccionar en el tiempo
preciso y con la acción correcta. Esta fase es primordialmente de mantenimiento. Cada vez que
se da o realiza un cambio en la infraestructura, debemos de realizar la adaptación respectiva.
A continuación, se enumeran las actividades principales a realizar:
• Realizar mantenimiento de la documentación técnica de operación de los servicios de TI.
• Revisión continua de las aplicaciones, sistemas de información y portales web.
• Revisión continua del sistema de copias de respaldo (Backup).
• Revisión y mantenimiento de los sistemas de soporte eléctrico del Centro de Datos.
8. FINANCIAMIENTO Y PRESUPUESTO
Los financiamientos de las actividades del presente plan provienen de la fuente de
financiamiento del pliego 221 del INGEMMET, de acuerdo al Plan de Continuidad Operativa
del INGEMMET – Sección VIII. Financiamiento y Presupuesto para los casos:
• Recuperación en las sedes alternas definidas en el Plan de Continuidad Operativa del
INGEMMET.
• Los bienes y servicios mínimos para la recuperación de servicios de TI
En otro caso se podrá atender las acciones de contingencia y recuperación de servicios de TI
serán abordados con el personal de la entidad, servicios de proveedores con contratos
vigentes.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
41
ANEXOS ANEXO 1: INVENTARIO DE SERVIDORES FÍSICOS (BLADE) QUE SE ALOJAN EN EL CENTRO DE DATOS.
ANEXO 2: INVENTARIO DE SERVIDORES VIRTUALES QUE ALOJAN LOS SISTEMAS DE INFORMACIÓN.
ANEXO 3: INVENTARIO DE SERVIDORES VIRTUALES QUE ALOJAN LOS SERVICIOS DE TI.
ANEXO 4: INVENTARIO DE SERVIDORES DE BASE DE DATOS (ORACLE).
ANEXO 5: INVENTARIO DE SERVIDORES Y/O EQUIPOS DE COMUNICACIÓN Y DE SEGURIDAD
INFORMÁTICA.
ANEXO 6: LISTA DE CONTACTOS DE EMERGENCIA – OFICINA DE SISTEMAS DE INFORMACIÓN.
ANEXO 7: RELACIÓN DE PROVEEDORES DE TECNOLOGÍAS DE INFORMACIÓN.
ANEXO 8: PREGUNTAS FORMULADAS POR CADA SITUACIÓN DE LA PRUEBA DE ESCRITORIO.
ANEXO 9. FORMATOS DEL PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI DEL CENTRO
DE DATOS.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
43
ANEXO 1: INVENTARIO DE SERVIDORES FÍSICOS (BLADE) QUE SE ALOJAN EN EL CENTRO DE DATOS.
N° Modelo Nombre Marca Servicio Disco (cap.) Memoria
1 CH121 v5 srvhua04 HUAWEI VMware ESXI 6.7 271 GB 512 GB
2 CH121 v5 srvhua05 HUAWEI VMware ESXI 6.7 271 GB 512 GB
3 CH121 v3 srvhua01 HUAWEI VMware ESXI 6.7 271 GB 320 GB
4 CH121 v3 srvhua02 HUAWEI VMware ESXI 6.7 271 GB 320 GB
5 CH121 v3 srvhua03 HUAWEI VMware ESXI 6.7 271 GB 320 GB
6 CH121 v3 IGMBD01 HUAWEI Linux Red Hat 300 GB 128 GB
7 CH121 v3 IGMDP01 HUAWEI Windows Server 2016 Standard 300 GB 32 GB
8 Proliant BL460c Gen9 srvblesx09 HP VMware ESXI 6.7 No tiene 256 GB
9 Proliant BL460c Gen9 srvblesx10 HP VMware ESXI 6.7 No tiene 256 GB
10 Proliant BL460c Gen9 srvblesx11 HP VMware ESXI 6.7 No tiene 256 GB
11 Proliant BL460c Gen9 srvblesx12 HP VMware ESXI 6.7 No tiene 256 GB
ANEXO 2: INVENTARIO DE SERVIDORES VIRTUALES QUE ALOJAN LOS SISTEMAS DE INFORMACIÓN.
N° VM Servicio Power State DNS Ñame OS Disco
(GB/TB)
Memoria
(Gb, Mb)
1
Linux Vulcanología Servicio de OVI (monitoreo volcánico de AQP, ser web) poweredOn
Microsoft Windows Server 2003 Standard (32-bit) 40 GB 4 GB
2 Metadatos_2
Servicio de Metadatos (Ficha bibliográfica que se publica información, metada de las capas de información de GEOCATMIN) poweredOn srvmetadatos02
Microsoft Windows Server 2008 R2 (64-bit) 170 GB 10 GB
3 SrvGeoApp01 Servicio de Geocatmin poweredOn
srvgeocatapp.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 280 GB 16 GB
4 SrvGeocat Servicio de Geocatmin poweredOn
SRVGEOCAT.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 580 GB 64 GB
5 SrvGeocatApp Servicio de Geocatmin poweredOn
SRVGEOAPP01.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 600 GB 32 GB
6 SrvGeocatmin Servicio de Geocatmin poweredOn
Srvgeocatmin.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 1120 GB 64 GB
7 SrvIntranet2Aplicaciones Servicio de Aplicaciones poweredOn
Microsoft Windows Server 2008 (64-bit) 162 GB 8 GB
8 SrvPortal_Prd Servicio de Página Web Producción poweredOn
srvportal.ingemmet.gob.pe
CentOS 6 (64-bit) 100 GB 14 GB
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
44
N° VM Servicio Power State DNS Ñame OS Disco
(GB/TB)
Memoria
(Gb, Mb)
9 SRVFS01 Servicio de File Server poweredOn
SRVFS01.ingemmet.int
Microsoft Windows Server 2012 (64-bit) 20 TB 16 GB
10 SRVFS04 Servicio de File Server poweredOn
SRVFS04.ingemmet.int
Microsoft Windows Server 2012 (64-bit) 19 TB 16 GB
11 SrvMail01 Servicio de Correo poweredOn
srvmail01.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 421 GB 20 GB
12 SrvMail02 Servicio de Correo poweredOn
srvmail02.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 1562 GB 24 GB
13 SrvApp Servicio de Aplicaciones poweredOn
srvapp.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 180 GB 16 GB
14 SrvDspace_Prd
Servicio de Repositorio Institucional (servicio de biblioteca) poweredOn srvdspace
Ubuntu Linux (64-bit) 500 GB 8 GB
15
SrvEcatastro Servicio de Catastro Minero poweredOn
srvweb02.ingemmet.int
Microsoft Windows Server 2003 (32-bit) 90 GB 2 GB
16 SrvIntranetApp Servicio de Aplicaciones poweredOn
SrvIntranetApp.ingemmet.int
Microsoft Windows Server 2012 (64-bit) 400 GB 4 GB
17 SrvJerupaja Servicio de Aplicaciones poweredOn
srvjerupaja.ingemmet.int
Microsoft Windows Server 2008 (32-bit) 81 GB 8 GB
18 SrvKohaPrd
Servicio de Sistema Integrado de Gestión de Biblioteca Producción poweredOn srvkohaprd
Ubuntu Linux (64-bit) 400 GB 8 GB
19 SrvKohaQas
Servicio de Sistema Integrado de Gestión de Biblioteca Calidad poweredOn srvkohaqas
Ubuntu Linux (64-bit) 300 GB 8 GB
20 SrvNuevaIntranetApp Servicio de Aplicaciones poweredOn
srvintranet2.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 131 GB 4 GB
21 SrvNuevaWebService Servicio de Aplicaciones poweredOn
srvwebservices.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 41 GB 2 GB
22 SrvPadron Servicio de Padrón Minero poweredOn tabs.
Microsoft Windows NT 75 GB 1 GB
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
45
N° VM Servicio Power State DNS Ñame OS Disco
(GB/TB)
Memoria
(Gb, Mb)
23 SrvPide
Servicio de Plataforma de Interoperabilidad poweredOn srvpide
Red Hat Enterprise Linux 6 (64-bit) 50 GB 16 GB
24 SrvPideDesa
Servicio de Plataforma de Interoperabilidad Desarrollo poweredOn
SRVPIDEDESA.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 180 GB 4 GB
25 SrvPidePrd
Servicio de Plataforma de Interoperabilidad Producción poweredOn srvpideprd
Red Hat Enterprise Linux 6 (64-bit) 50 GB 16 GB
26 Srvsesuite01
Servicio de Sistema de Gestión de Calidad Producción poweredOn
SRVCALIDADP.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 100 GB 13 GB
27 srvsesuite02
Servicio de Sistema de Gestión de Calidad Desarrollo poweredOn
SRVSESUITE02.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 140 GB 4 GB
28 SrvSigaPatrimonio Servicio de Siga Patrimonio poweredOn
Microsoft Windows Server 2008 R2 (64-bit) 210 GB 4 GB
29 SrvSTD
Servicio de Trámite Documentario poweredOn
SRVSTD.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 150 GB 4 GB
30 SrvTradDoc
Servicio de Trámite Documentario poweredOn
Microsoft Windows Server 2008 (64-bit) 252 4GB
31 SrvWeb_01 Servicio de Aplicaciones poweredOn srvweb01
Microsoft Windows Server 2003 Standard (32-bit) 217 GB 2 GB
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
46
ANEXO 3: INVENTARIO DE SERVIDORES VIRTUALES QUE ALOJAN LOS SERVICIOS DE TI.
N° VM Servicio Powerstate DNS Name OS Disco
(GB/TB)
Memoria (Gb, Mb)
32 SrvWSUS
Servicio de Windows Update poweredOn
SRVWSUS.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 200 GB 12 GB
33 Tarificador_2018 Servicio de Tarificador poweredOn
SRVPCSISTEL.ingemmet.int
Microsoft Windows Server 2012 (64-bit) 130 GB 6 GB
34 VCENTER_INGEMMET Servicio de VCENTER poweredOn vcenter-ingemmet
Other 3.x Linux (64-bit) 300 GB 16 GB
35 SrvFtp-SUNARP2 Servicio de FTP poweredOn srvftp.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 150 GB 4GB
36 Proxy Reverso Web Institucional
Servicio de Balanceador del Portal Web poweredOn
CentOS 4/5 or later (64-bit) 40 GB 4GB
37 SrvAntivirus Servicio de Antivirus poweredOn
SRVANTIVIRUS.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 150 GB 8GB
38 SrvSubversion
Servicio de Versionamiento de Aplicaciones poweredOn
Microsoft Windows Server 2008 R2 (64-bit) 220 GB 6 GB
39 SrvSpamTitan Servicio de Antispam poweredOn
mail.ingemmet.gob.pe
FreeBSD Pre-11 versions (64-bit) 80 GB 8 GB
40 SrvPrinter01 Servicio de Impresoras poweredOn
srvprinter01.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 140 GB 10 GB
41 SrvRepositoryVeeam
Servicio de Repositorio (Backup de entornos virtuales) poweredOn
SrvRepositoryVeeam.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 2.8 TB 8 GB
42 SrvLaserfiche01
Servicio de Laserfiche (SW de digitalización) poweredOn
SrvLaserfiche01.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 280 GB 8 GB
43 SrvLicAutocad Servicio Licencia AutoCAD poweredOn
srvautocad.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 80 GB 2 GB
44 SrvLicCalCitrix Servicio Licencia Citrix poweredOn
SrvLicCalCitrix.ingemmet.int
Microsoft Windows Server 2012 (64-bit) 111 GB 8 GB
45 SrvLicGis Servicio Licencia GIS poweredOn
SRVLICGIS.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 50 GB 4 GB
46 SrvNTP Servicio de Hora poweredOn CentOS 6 (64-bit) 60 GB 6 GB
47 SrvBackupServer Servicio de Backup poweredOn
SrvBackupServer.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 60 GB 8 GB
48 SrvBluecoat02 Servicio de Bluecoat poweredOn
Microsoft Windows Server 2008 R2 (64-bit) 71 GB 20 GB
49 SrvCitrix01 Servicio Citrix poweredOn srvxenapp01.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 100 GB 8 GB
50 SrvCitrix02 Servicio Citrix poweredOn srvxenapp02.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 70 GB 8 GB
51 SrvCitrix03 Servicio Citrix poweredOn srvxenapp03.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 70 GB 8 GB
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
47
52 SRVDC01 Servicio de Directorio Activo poweredOn
SRVDC01.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 60 GB 4 GB
53 SRVDC02 Servicio de Directorio Activo poweredOn
SRVDC02.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 70 GB 4 GB
54 SRVDC03 Servicio de Directorio Activo poweredOn
SRVDC03.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 140 GB 4 GB
55 SrvH&S
Servicio de Lansweeper (SW de inventario de HW y SW) poweredOn
srvhys.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 1.60 TB 8 GB
56 SrvIdentity
Servicio de Autenticación para firmas digitales poweredOn
SRVIDENTITY.ingemmet.int
Microsoft Windows Server 2016 (64-bit) 50 GB 4 GB
57 SrvFederacion02
Servicio de Federación (Integración de cuentas de usuarios con ArcGIS) poweredOn
srvfederacion02.ingemmet.int
Microsoft Windows Server 2008 R2 (64-bit) 100 GB 4 GB
ANEXO 4: INVENTARIO DE SERVIDORES DE BASE DE DATOS (ORACLE).
N° Modelo Nombre Marca Servicio Disco (cap.) Memoria
1 CH121 v5 IGMOVM01 HUAWEI Oracle VM 300 GB 256 GB
2 CH121 v5 IGMOVM02 HUAWEI Oracle VM 300 GB 256 GB
3 PowerEdge M710 HD BDGAMMA DELL Red Hat Enterprise Linux 5 126 GB 24 GB
4 PowerEdge M710 HD BDINGE DELL Windows Server 2008 r2 126 GB 12 GB
5 PowerEdge M710 HD BDGEOCAT DELL Red Hat Enterprise Linux 6 126 GB 24 GB
ANEXO 5: INVENTARIO DE SERVIDORES Y/O EQUIPOS DE COMUNICACIÓN Y DE SEGURIDAD INFORMÁTICA.
N° Equipo Marca Modelo Cantidad Características técnicas
1 Switch Central / Core Juniper EX4550-32T 1 Switch de Fibra Óptica
2 Switch de Distribución (sólo los del Data Center)
Juniper EX4200-24PX
1 Switch de cobre PoE+
3 Manejador de BW Exinda Series3062 1 Optimización del ancho de banda
4 Filtro de Contenido Bluecoat ProxySG S200-30 1 Proxy
5 Filtro de Aplicaciones Imperva X2010 / M110 2
6 Filtro antiDDoS Arbor APS 2600 1 Anti-denegación de servicios
7 Firewall Fortinet 600D 1 seguridad perimetral
8 Punto de acceso Inalámbrico
Ruckus r710
10 Red Inalámbrica
9 Switches de Borde (Backbone)
Juniper EX4200-PX
20 Switch de cobre PoE+
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
48
ANEXO 6: LISTA DE CONTACTOS DE EMERGENCIA – OFICINA DE SISTEMAS DE INFORMACIÓN.
Para los casos de atención de las contingencias en horas fuera de oficina, se ha establecido un directorio de las personas directamente involucradas en atender el problema presentado:
LIDER DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI
DIRECCIÓN PERSONAL CELULAR
DIRECTORA (e) DE LA OSI ARAYA CARRASCO, MIRIAM 998 807 021
EQUIPO DE RECUPERACIÓN DE DESARROLLO Y MANTENIMINETO DE SISTEMAS
EQUIPO PERSONAL CELULAR
Desarrollo y Mantenimiento de Sistemas
Salas Guía, Manuel 990 073 207
Chang Espinoza, Álvaro 977 826 401
Cancho Valdivia, Walter 943 515 715
Ruiz Rojas, José Anderson 983 466 072
Urbina Salas ,Willy 985 015 881
Castro Pomatana, Hugo 995 034 522
Salcedo Carbajal, William 997 356 419
Egocheaga Díaz, César 990 228 562
EQUIPO DE RECUPERACIÓN DE REDES Y COMUNICACIONES
EQUIPO PERSONAL CELULAR
Redes y Comunicaciones
Gil Miranda, Manuel 945 618 207
Julca Velasco, Luis 966 130 443
Condori Gonzales, Frank 964 108 898
Mechan Valiente, Li Rony 941 457 614
Luna Burgos, Ricardo 997 585 283
Gonzales Pinedo, Porfirio 950 924 969
EQUIPO DE RECUPERACIÓN DE SOPORTE TÉCNICO
EQUIPO PERSONAL CELULAR
Soporte Técnico
Zavala Reyes, José Manuel 989 186 893
Torres Sosa, Juan 993 958 171
Córdova Chunga, Eduardo 947 493 236
Ríos Inga, Celso 982 364 194
Luque Castillo, Jhonatan 999 700 565
Espinal Torres, Jhon 960 617 233
COORDINADOR DE RECUPERACIÓN DE TI
EQUIPO PERSONAL CELULAR
Oficial de Seguridad de la Información
Julca Velasco, Luis
966 130 443
Este listado está sujeto a variación y actualización.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
49
ANEXO 7: RELACIÓN DE PROVEEDORES DE TECNOLOGÍAS DE INFORMACIÓN.
N° NOMBRE O
RAZÓN SOCIAL PRODUCTO SERVICIO Central CONTACTO MAIL TELÉFONO CELULAR
1 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
SOPORTE DE PRIMER
NIVEL 0800 00 911
Wendy
Pachas [email protected]
6131000
anexo 2730
2 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
SOPORTE DE PRIMER
NIVEL 801 00 911
Carlos
Cabrejos
(Supervisor)
[email protected] 6131000
anexo 2722 997-104-206
3 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
OPERADOR CNOC CLARO 802 00 911 [email protected] 997-992-500
4 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
SUPERVISORES CNOC 803 00 911
Paul Vásquez
Caicedo
Canicela
[email protected] 6131000
anexo 8369 991-697-127
5 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
SUPERVISORES CNOC 804 00 911 Henry Ochoa
Pachas [email protected]
6131000
anexo 2870 993-584-633
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
50
N° NOMBRE O
RAZÓN SOCIAL PRODUCTO SERVICIO Central CONTACTO MAIL TELÉFONO CELULAR
6 CLARO Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y Telf.)
JEFE CNOC Gino Vidal
Demartini [email protected] 6131000
anexo 2873 993-506-658
7 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
GERENTE DE
MANTENIMIENTO
CORPORATIVO
0800 00 911
Carlos
Fernández
Podestá
[email protected] 6131000
anexo 8470 993-506-711
8 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
SUB DIRECTOR DE
SERVICIOS FIJOS
CORPORATIVO
0800 00 911
Miguel
Caballero
Farro
[email protected] 6131000
anexo 2068 997-510-056
9 CLARO
Gestión (firewall,
Imperva, Exinda,
Arbor, Internet y
telefonía)
DIRECTOR MERCADO
CORPORATIVO FIJO 0800 00 911
Ricardo Odría
Ferrari [email protected]
6131000
anexo 2001 997-102-200
10 IMPERIA FIREWALL DE
APLIACIONES WEB EXTENSION DE GARANTIA
Fernando
Sairitupa [email protected] 3837134 987586039
11 IMPERIA FILTRO DE CONTENIDO EXTENSION DE GARANTIA Luis Sanchez [email protected] 3837134 941683514
12 COLINANET
INTERCONEXION CON
LOS ORGANOS
DESCONCENTRADOS
SOPORTE 0-800-71771
Servicio de
Soporte
Técnico (SST) [email protected]
01-711-3222
13
COLINANET
INTERCONEXION CON
LOS ORGANOS
DESCONCENTRADOS
SOPORTE 0-800-71771 Operador de
Turno [email protected]
01-711-3222 995900059
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
51
N° NOMBRE O
RAZÓN SOCIAL PRODUCTO SERVICIO Central CONTACTO MAIL TELÉFONO CELULAR
14 COLINANET INTERCONEXION CON
LOS ORGANOS
DESCONCENTRADOS
SOPORTE 0-800-71771 Daniel
Huaman [email protected] 01-711-3200
Anexo: 1021 988198488
15 COLINANET
INTERCONEXION CON
LOS ORGANOS
DESCONCENTRADOS
SOPORTE 0-800-71771 Wilfredo
Ramirez [email protected]
01-711-3222
Anexo: 1002 984971637
16 COLINANET
INTERCONEXION CON
LOS ORGANOS
DESCONCENTRADOS
SOPORTE 0-800-71771 Dora
Guerrero [email protected]
2009700
Anexo: 1008 988217591
17 BAFING FIREWALL
EMPRESARIAL SOPORTE
Karina
Valderrama [email protected]
2259900
Anexo: 121
18 BTECH SA SERVIDORES BLADE,
SOLUCION DE
ALMACENAMIENTO
SOPORTE 6160505 Alejandro
Monzon [email protected] 987399976
19 VECODATA SAC
SERVIDORES BLADE
SOPORTE Jashmin
Paredes [email protected] 4340546 994186026
20 D2D
SOLUTIONS
SOLUCION DE
ALMACENAMIENTO
EXTENSION DE GARANTIA
Y SOPORTE 4305126 Daniel Leiva
[email protected] 970824612
21
BTECH SA
SOLUCION DE COPIA
DE SEGURIDAD Y
RESTAURACIÓN
EXTENSION DE GARANTIA
Y SOPORTE 6160505 Renzo
Huapaya [email protected]
951202365
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
52
N° NOMBRE O
RAZÓN SOCIAL PRODUCTO SERVICIO Central CONTACTO MAIL TELÉFONO CELULAR
22 BMPCONSULTI
NG CENTRAL TELEFONICA
EXTENSION DE GARANTIA
Y SOPORTE 01-7013000 Marco Perez
959246884 -
953569998
23 TESITEL SAC SWITCHES CORE SOPORTE Roiman
Calderón [email protected] 978498391
24 CONVEXUS SAC SWITCHES DE BORDE EXTENSION DE GARANTIA
Y SOPORTE 01-7013500 Harry Flores
[email protected] 996293144
25 COLD FREEZZER
PERU SAC
AIRE ACONDICIONADO
DE PRECISION
SOPORTE
Roberto
Villafuerte [email protected] 7324637 936858372
26 PRESTIGE
SATELLITE
ANTENA DE
RADIOENLACE
SOPORTE Henry Zarate
[email protected] 3267203 975148844
27 PRESTIGE
SATELLITE
RED INALAMBRICA
SEDE CANADÁ
SOPORTE Henry Zarate
[email protected] 3267203 975148844
27
VALTOM
INGENIEROS
SAC
EQUIPO DE
PROTECCION
ELECTRICA - UPS
SOPORTE Pahola
Sanchez [email protected]
957982239
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
53
ANEXO 8: PREGUNTAS FORMULADAS POR CADA SITUACIÓN DE LA PRUEBA DE ESCRITORIO
Situación 1:
1. ¿Cuáles son las actividades para atender la lentitud de los sistemas? 2. ¿Cuál es el protocolo o procedimiento para averiguar lo que está sucediendo con las aplicaciones afectadas? 3. ¿Cuál es el tiempo promedio de indisponibilidad para declarar el evento como una crisis? ¿Transcurrido el
tiempo a quien(es) se informa? ¿Cómo se informa a los Usuarios?
Situación 2:
1. ¿Existe un protocolo de evaluación y activación de alertas y crisis bajo escenarios de ciberataque? 2. ¿Cuál es el protocolo de comunicaciones de TI en el escenario de interrupción por ciberataque hacia el
interno de la Institución? En todo caso, como comunicarían 3. ¿Cuál es el mecanismo para informar a la Alta Dirección? 4. ¿Se informa a alguna parte interesada externa de la Institución? 5. ¿De requerir nueva infraestructura (equipos) cual sería el trámite por seguir? ¿Qué proveedores tienen como
contactos para solicitar apoyo? 6. ¿Cuáles son las acciones para atender las computadoras de los usuarios afectados? 7. ¿Los respaldos están protegidos, dónde y cómo? ¿Con que frecuencia se prueba la integridad del respaldo?
Situación 3:
1. Sabiendo que la red está comprometida ¿La recuperación será en otro local? 2. ¿Ante la falta de energía eléctrica, cuáles son las primeras actividades por realizar, con los equipos del Centro
de Datos? 3. Los usuarios reclaman por la indisponibilidad de sus computadoras ¿Cuáles son las actividades/protocolos
de atención? 4. Ha retornado la energía eléctrica ¿cuáles son las actividades para asegurar la infección de la red de datos por
el ransomware? 5. ¿Cómo atienden y aseguran la disponibilidad de los equipos de cómputo si el apagón se da en horario fuera
de oficina? 6. La Alta Dirección solicita reporte del estatus y las consecuencias ¿Ante esta situación bosqueje la respuesta
a presentar?
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
54
ANEXO 9. FORMATOS DEL PLAN DE CONTINGENCIA Y RECUPERACIÓN DE SERVICIOS DE TI DEL CENTRO
DE DATOS.
INGEMMET Evento: Terremoto FPCRSTI-01
1. PLAN DE PREVENCIÓN
a) Descripción del evento Los terremotos también llamados sismos son movimientos en el interior de la tierra, que generan una liberación repentina de energía, que se propaga en forma de ondas provocando temblor de tierra o movimiento telúrico. Este evento incluye los siguientes elementos mínimos identificados por INGEMMET, los mismos que por su naturaleza pueden ser considerados como parte afectada o causa de la contingencia: Infraestructura: - Centro de Datos Recursos Humanos - Personal de la entidad.
b) Objetivo Establecer las acciones que se ejecutarán ante un terremoto a fin de minimizar el tiempo de interrupción de las operaciones del INGEMMET, sin exponer la seguridad de las personas.
c) Entorno Este evento puede afectar las instalaciones de la Sede Central y el Centro de Datos, al ubicarse en el mismo lugar.
d) Personal Encargado El Grupo de Comando del Instituto Geológico, Minero y Metalúrgico es quien debe dar los lineamientos y dar cumplimiento a las Condiciones de Prevención de Riesgo del presente Plan. Por su parte, el Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos debe realizar las acciones descritas en el punto f).
e) Condiciones de Prevención de Riesgo -Inspecciones de seguridad realizadas periódicamente. -Contar con un plan de evacuación de las instalaciones del INGEMMET, el mismo que debe ser de conocimiento de todo el personal que labora en todas las sedes. - Realización de simulacros de evacuación con la participación de todo el personal de las distintas sedes. -Conformación de las brigadas de emergencia, y capacitarlas semestralmente. -Mantenimiento de las salidas libres de obstáculos. -Señalización de las zonas seguras y las salidas de emergencia. -Funcionamiento de las luces de emergencia. -Definición de los puntos de reunión en caso de evacuación.
f) Acciones del Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos. -Evaluar en coordinación con el Grupo de Comando de INGEMMET el ambiente para el Centro de Datos, en el sitio alterno. -Establecer, organizar, ejecutar y supervisar procedimientos de respaldo y restauración de información base de datos, código fuentes y ejecutables.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
55
-Programar, supervisar el mantenimiento preventivo a los equipos componentes del Centro de Datos -Mantener actualizado el inventario hardware y software utilizado en el Centro de Datos de la institución. -Llevar un control de versiones de las fuentes de los sistemas de información y portales de la institución.
2. PLAN DE EJECUCIÓN
a) Eventos que activan la contingencia La contingencia se activará al ocurrir un terremoto. El proceso de contingencia se activará inmediatamente después de ocurrir el evento.
b) Procesos Relacionados antes del evento
-Tener la lista actualizada de los servidores por órganos y unidades orgánicas - Mantenimiento y limpieza de los ambientes del Centro de Datos. - Inspecciones trimestrales de seguridad externa. - Realización de simulacros internos en horarios que no afecten las actividades.
c) Personal que autoriza la contingencia y recuperación de los servicios de TI del Centro de Datos. -El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
d) Personal encargado -El Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
e) Actividades después de la activación de la contingencia y recuperación de los servicios de TI del Centro de Datos.
• Desconectar el fluido eléctrico y cerrar las llaves de gas u otros líquidos inflamables si corresponde.
• Evacuar las oficinas de acuerdo a las disposiciones de los Brigadistas de Evacuación, utilizando las rutas establecidas durante los simulacros. Considerar las escaleras de emergencia, señalización de rutas, zonas de agrupamiento del personal.
• Verificar que todo el personal del INGEMMET que labora en el área se encuentren bien.
• Brindar los primeros auxilios al personal afectado si fuese necesario.
• Alejarse de las lunas (ventanas) para evitar sufrir cortes por roturas y/o desprendimiento de trozos de vidrio.
• Evaluación de los daños ocasionados por el terremoto sobre las instalaciones físicas, ambientes de trabajo, estanterías, instalaciones eléctricas, documentos.
• Inventario general de documentación, personal, equipos y/o recursos afectados, indicando el estado de operatividad de los mismos.
• Limpieza de las áreas afectadas por el terremoto. En todo momento se coordinará con personal de servicios general del INGEMMET, para las acciones que deban ser efectuadas por ellos.
En caso se requiera la habilitación del ambiente provisional alterno para restablecer la función de los ambientes afectados, el/la Director/a de la OSI deberá coordinar con el/la Director/a de la OA
3. PLAN DE RECUPERACIÓN
a) Personal Encargado El personal encargado es el Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos y el Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos,
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
56
cuyo rol principal es asegurar el normal desarrollo de los servicios y operaciones de TI del Centro de Datos.
b) Descripción de actividades El plan de recuperación está orientado a recuperar en el menor tiempo posible las actividades afectadas durante la interrupción del servicio. En caso, el evento haya sido de considerable magnitud. - Verificar la disponibilidad de recursos para la contingencia como: manuales técnicos de
instalación del sistema de información, almacenamiento de datos, sistemas comunicación, hardware, y copias de respaldo.
- Movilizar los equipos de respaldo al sitio alterno de recuperación. - Establecer contacto con los proveedores clave y terceros para proporcionar instrucciones
inmediatas y/o notificarles cualquier requisito de ayuda sobre la recuperación de negocio. - Supervisar el progreso de las operaciones de recuperación y de servicios de TI y mantener
informado al Grupo de Comando de INGEMMET. - Restauración de los servicios y operaciones de TI en el sitio alterno. El Equipo de
Contingencia y Recuperación de Servicios de TI restaurarán el espacio de trabajo para permitir que el personal crítico de la oficina pueda operar, para lo cual deberán:
• Ejecutar los procedimientos de recuperación de la plataforma tecnológica.
• Verificar que las aplicaciones críticas se hayan recuperado y estén funcionando correctamente.
• Confirmar los puntos de recuperación de datos de las aplicaciones.
• Verificar que las funcionalidades de comunicación están funcionando correctamente.
• Verificar que equipos básicos como escáner, impresora estén disponibles y operacionales para dar soporte a los requisitos de la entidad.
• Asegurar que el ambiente del área de trabajo, las aplicaciones y las telecomunicaciones están funcionando según lo estimado tanto en el sitio alterno, como al retornar al sitio original, una vez concluida la emergencia o siniestro
c) Mecanismos de Comprobación
El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos, presentará un informe al Grupo de Comando de INGEMMET, explicando qué parte de las actividades u operaciones de tecnologías de la información han sido afectadas y cuáles son las acciones tomadas.
d) Desactivación del Plan de Contingencia El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos desactivará el Plan de Contingencia y recuperación de servicios de TI del Centro de Datos una vez que se haya tomado las acciones descritas en el presente Plan de Recuperación, mediante una comunicación electrónica al Grupo de Comando de INGEMMET.
e) Proceso de actualización El proceso de actualización será en base al informe presentado por el Coordinador de Contingencia y Recuperación de Servicios de TI, luego del cual se determinará las acciones a tomar.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
57
INGEMMET Evento: Manipulación y sabotaje FPCRSTI-02
1. PLAN DE PREVENCIÓN
a) Descripción del evento Alteración de datos de los portales y sistemas de información a través de ataque cibernético (hacking) y/o malware. El malware es un software malicioso o software malintencionado, que tiene como objetivo infiltrarse o dañar una computadora o sistema de información sin el consentimiento de su propietario, eliminando datos del equipo. Incluye virus, gusanos, troyanos, keyloggers, botnets, ransomwares o secuestradores, spyware, adware, hijackers, keyloggers, rootkits, bootkits y rogues. Este evento incluye los siguientes elementos mínimos identificados por INGEMMET, los mismos que por su naturaleza pueden ser considerados como parte afectada o causa de la contingencia, los cuales se muestran a continuación: Hardware
• Servidores
• Estaciones de trabajo Software
• Software base
• Sistemas de Información, aplicativos y portales del INGEMMET.
b) Objetivo Restaurar la operatividad de los equipos y servicios después de eliminar los malware o reinstalar las aplicaciones dañadas.
c) Entorno Este evento se puede dar en cualquiera de los servidores y estaciones ubicadas en el Centro de Datos del INGEMMET.
d) Personal Encargado El Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos es el responsable del correcto funcionamiento de los servidores, estaciones de trabajo, sistemas de información y servicios de TI de acuerdo a sus perfiles.
e) Condiciones de Prevención de Riesgo
• Instalación de parches de seguridad en los equipos.
• Establecimiento de políticas de seguridad para prevenir el uso de aplicaciones no autorizadas en las estaciones de trabajo.
• Aplicación de filtros para restricción de correo entrante, y revisión de archivos adjuntos en los correos y así prevenir la infección de los terminales de trabajo por virus.
• Contar con antivirus instalados en cada estación de trabajo, el mismo que debe estar actualizado permanentemente.
• Contar con equipos de respaldo ante posibles fallas de las estaciones y servidores, para su reemplazo provisional hasta su desinfección y habilitación.
• Restricción del acceso a Internet a las estaciones de trabajo que por su uso no lo requieran.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
58
• Eliminación o restricción de lectoras y/o quemadores de CD en estaciones de trabajo que no lo requieran.
• Deshabilitación de los puertos de comunicación USB en las estaciones de trabajo que no los requieran habilitados, para prevenir la conexión de unidades de almacenamiento externo.
• Capacitación al personal de la OSI, sobre Ethical Hacking a las Bases de Datos, Sistemas Operativos, Servidores y Sistemas Informáticos.
• Ejecución de ataques de Hacking Ético por terceros especializados
f) Acciones del Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Establecer, organizar, ejecutar y supervisar procedimientos de respaldo de información procesada y almacenada en el Centro de Datos.
• Llevar un control de versiones de las fuentes de los sistemas de información y portales de la entidad.
• Realizar pruebas de restauración de la información almacenada en los repositorios y bases de datos.
• Documentar y validar los manuales de restauración de los sistemas de información en producción.
2. PLAN DE EJECUCIÓN
a) Eventos que activan la Contingencia
• Mensajes de error durante la ejecución de programas.
• Lentitud en el acceso a las aplicaciones.
• Falla general en el equipo (sistema operativo, aplicaciones)
b) Procesos relacionados antes del evento Cualquier proceso relacionado con el uso de las aplicaciones en los servidores y en las estaciones de trabajo.
c) Personal que autoriza la contingencia y recuperación de servicios de TI El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos y/o el Oficial de Seguridad de la Información pueden activar la contingencia para la recuperación de los servicios de TI del Centro de Datos.
d) Personal encargado Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos
e) Descripción de las actividades después de activar la contingencia y recuperación de servicios de TI
• Desconectar o retirar de la red de datos del INGEMMET, el servidor o la estación infectada o vulnerada.
• Verificar si el equipo se encuentra infectado, utilizando un detector de malware/virus actualizado. En el caso de aplicaciones, verificar si el código o la información de las bases de datos ha sido alterada.
• Rastrear de ser necesario el origen de la infección u ataque (archivo infectado, correo electrónico y hacking).
• Guardar la muestra del virus detectado y remitirlo al proveedor del antivirus utilizado. En el caso de hacking a aplicaciones, se debe guardar el archivo modificado, a nivel de software y base de datos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
59
• Eliminar el agente causante de la infección, es decir, remover el malware/virus del sistema. - Probar el sistema. - En caso no solucionarse el problema, formatear el equipo y restaurar copia de respaldo.
f) Duración La duración del evento no deberá ser mayor DOS HORAS en caso se confirme la presencia de un virus en estaciones de trabajo y de CUATRO HORAS en servidores de red. Esperar la indicación del personal de soporte técnico para reanudar el trabajo.
3. PLAN DE RECUPERACIÓN
a) Personal Encargado
El equipo de contingencia y recuperación de servicios de TI del Centro de Datos, luego de restaurar el correcto funcionamiento del servidor, estación de trabajo (PC, laptop), sistemas de información y portales web, coordinará con el usuario responsable del mismo y/o Director del órgano u unidad orgánica para reanudar las labores de trabajo con el equipo o sistema que fue afectado.
b) Descripción de actividades Se informará al Director/a de la OSI del INGEMMET el tipo de malware/virus, o tipo de ataque encontrado y el procedimiento usado para removerlo. Estas actividades deben contemplar como mínimo:
• Instalación y puesta a punto de un equipo de cómputo compatible y hardware necesarios para la instalación del sistema de información con las características mínimas exigidas.
• Instalación y configuración del sistema operativo, drivers y servicios necesarios para el funcionamiento del sistema de información a recuperar.
• Instalación y configuración del sistema de información y el motor de la base de datos, con sus respectivas librerías y niveles de seguridad.
• Instalación de aplicaciones adicionales necesarias para el funcionamiento del sistema de información.
• Realización de la restauración de la base de datos con la última copia de seguridad disponible (Restore).
• Reinicio del servicio, prueba y afinamiento del sistema de información.
• Conectar el servidor o la estación a la red del INGEMMET.
• Efectuar las pruebas necesarias con el usuario final de los equipos y/o sistemas de información afectados.
• Solicitar la conformidad de la restauración realizada del equipo y o sistema de información afectado.
• Comunicar el restablecimiento del servicio El oficial de seguridad de la información, tomará las medidas preventivas del caso enviando una alerta vía correo electrónico al personal del INGEMMET.
c) Mecanismos de comprobación Se llenará el formato de incidentes de seguridad de la información y se informará al Comité de Gobierno Digital quien es el encargado de Gestionar, mantener y documentar el Sistema de Gestión de la Seguridad de la Información (SGSI) de la institución. El personal de Técnico de Soporte y/o Especialista en Redes y Comunicaciones, según sea el caso, presentará un informe
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
60
a el/la Director/a de la OSI, explicando que parte del servicio u operaciones se han visto afectadas, y cuáles son las acciones tomadas.
d) Desactivación del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos Con el aviso del Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos, se desactivará el presente Plan.
e) Proceso de Actualización El problema de infección o alteración presentado en la estación de trabajo y/o servidor de red, en base al informe que describe los problemas presentados, se determinarán las acciones de prevención a tomar.
INGEMMET Evento: Falla de Hardware y Software FPCRSTI-03
1. PLAN DE PREVENCIÓN
a) Descripción del evento El hardware de servidores es el recurso principal para almacenar, procesar y proteger los datos, permitiendo acceso controlado y procesamiento de transacciones rápido para cumplir con los requisitos de los sistemas de información de la institución. El software En ausencia del mismo, los sistemas de información que dependen del mismo no pueden funcionar, siendo la parte afectada o causa de la contingencia, los cuales se muestran a continuación: Hardware
• Servidores de Base de Datos, Aplicaciones, Archivos
• Storage Software
• Sistemas de Información usados por INGEMMET y de servicio al ciudadano
Información
• Información contenida en base de datos
• Información contenida en repositorios de información
b) Objetivo Asegurar la continuidad de las operaciones, con los medios de respaldo adecuados de las imágenes de los servidores o máquinas virtuales en producción.
c) Entorno Se puede producir durante el servicio, afectando a las aplicaciones usadas para dar soporte a las operaciones del INGEMMET.
d) Personal Encargado El Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
61
e) Condiciones de Prevención de Riesgo
• Revisión periódica de los registros (logs) de los servidores, para prevenir mal funcionamiento de los mismos.
• Contar con los backups diarios de datos de las aplicaciones en desarrollo/producción de la institución, así como de las imágenes de los servidores.
• Contar con servicios de soporte y mantenimiento que contemple actividades de prevención, revisión del sistema y mantenimiento general.
• Disponer de servidores de bases de datos de contingencia, con la instalación del motor de base de datos.
• Disponer de servidores de Aplicaciones de contingencia, con software de instalación tomcat, IIS, Liferay.
f) Acciones del Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Establecer, organizar, ejecutar y supervisar procedimientos de respaldo y restauración de información.
• Programar, supervisar el mantenimiento preventivo a los equipos componentes del Centro de Datos.
• Mantener actualizado el inventario hardware y software utilizado en el Centro de Datos de la institución.
• Realizar monitoreo del funcionamiento de los servidores instalados en el Centro de Datos para su correcto funcionamiento.
• Realizar revisiones de obsolescencia tecnológica de los servidores y componentes internos de forma anual.
2. PLAN DE EJECUCIÓN
a) Eventos que activan la Contingencia
• Fallas en la conexión. Indisponibilidad del sistema de información y/o aplicaciones informáticas.
• Identificación de falla en la pantalla de las estaciones de trabajo y/o servidores de aplicaciones.
b) Procesos relacionados antes del evento
• Disponibilidad de las copias de respaldo
• Disponibilidad de instaladores de sistemas operativos y motor de base de datos
c) Personal que autoriza la contingencia y recuperación de servicios de TI El Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos debe activar la contingencia para la recuperación de los servicios de TI del Centro de Datos.
d) Personal encargado Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos
e) Duración El tiempo máximo de la contingencia no debe sobrepasar las cuatro (4) horas.
3. PLAN DE RECUPERACIÓN
a) Personal Encargado
El equipo de contingencia y recuperación de servicios de TI del Centro de Datos, luego de validar la corrección del problema del acceso a servidores y el coordinar de contingencia y recuperación
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
62
de servicios de TI del Centro de Datos informará al órgano(s) o unidad (es) orgánica(s) de los servicios afectados en el servidor averiado.
b) Descripción de actividades El plan de recuperación estará orientado a recuperar en el menor tiempo posible las actividades afectadas durante la interrupción del servicio afectado por falla de los servidores. Estas actividades deben contemplar como mínimo:
• Instalación y puesta a punto de un cómputo compatible y hardware necesarios para la instalación del sistema de información con las características mínimas exigidas.
• Instalación y configuración del sistema operativo, drivers y servicios necesarios para el funcionamiento del sistema de información a recuperar.
• Instalación y configuración del sistema de información y el motor de la base de datos, con sus respectivas librerías y niveles de seguridad.
• Proceder a la restauración de las copias de respaldo, de la información de los servidores.
• Verificar que la data y los aplicativos se hayan restaurado correctamente.
• Ejecutar pruebas de acceso a los sistemas y aplicaciones.
• Brindar los permisos de acceso a los usuarios finales.
• Remitir un mensaje electrónico a los usuarios del INGEMMET informando la reanudación de los servicios.
En función a esto, se tomarán las medidas preventivas del caso y se revisará el plan de contingencia y recuperación de servicios de TI del Centro de Datos para actualizarlo en caso sea necesario.
c) Mecanismos de comprobación Se registrará el incidente en el Sistema de Gestión de Tickets utilizado por el equipo de soporte técnico de la OSI, precisando las acciones realizadas. El Equipo de Contingencia y recuperación de servicios de TI en Redes y Comunicaciones, presentará un informe al Líder de Contingencia y Recuperación de servicios de TI del Centro de Datos, explicando que parte del servicio u operaciones se han visto afectadas, y cuáles son las acciones tomadas.
d) Desactivación del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos Con el aviso del Líder de Contingencia y Recuperación de Servicios de TI del Centro de Datos, se desactivará el presente Plan.
e) Proceso de Actualización En base al informe presentado por Equipo de Contingencia y recuperación de servicios de TI en Redes y Comunicaciones, quien identifica las causas de la pérdida o fallas de la base de datos institucional, se determinará las acciones preventivas necesarias que deberían incluirse en el presente plan. En caso existiese información pendiente de actualización, Equipo de Contingencia y recuperación de servicios de TI en Redes y Comunicaciones deberá iniciar las labores de actualización de los procedimientos o guías de recuperación de servidores.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
63
INGEMMET Evento: Falla de Energía Eléctrica y falla de equipos de comunicaciones.
FPCRSTI-03
1. PLAN DE PREVENCIÓN
a) Descripción del evento Falla general del suministro de energía eléctrica en el Centro de Datos o sede principal de la institución. Este evento incluye los siguientes elementos mínimos identificados por el INGEMMET, los mismos que por su naturaleza pueden ser considerados como parte afectada o causa de la contingencia: Servicios Públicos
• Suministro de Energía Eléctrica Hardware
• Servidores y sistema de almacenamiento de información (storage)
• Estaciones de Trabajo
• Equipos de Comunicaciones Equipos diversos
• UPS y generador eléctrico
• Aire acondicionado
b) Objetivo Restaurar las funciones consideradas como críticas para el servicio.
c) Entorno Este evento puede darse en cualquiera de las instalaciones del INGEMMET, para este caso la Sede Central donde se ubica el Centro de Datos, por tener cada una de ellas los gabinetes de comunicación y equipos que brinda servicios informáticos a los usuarios a nivel interno y externo.
d) Personal Encargado El Jefe de la Unidad de Logística de la OGA y el Coordinador de Contingencia y recuperación de servicios de TI del Centro de Datos son los responsables de realizar las coordinaciones para restablecer el suministro de energía eléctrica. El Equipo de contingencia y recuperación de servicios de TI del Centro de datos debe realizar las acciones descritas en el punto f).
e) Condiciones de Prevención de Riesgo
• Durante las operaciones diarias del servicio u operaciones del INGEMMET se contará con los UPS necesarios para asegurar el suministro eléctrico en los equipos consideradas como críticos.
• Equipos UPS cuentan con mantenimiento preventivo y con suficiente energía para soportar una operación continua de 30 minutos como mínimo. El tiempo variará de acuerdo a la función que cumplan los equipos UPS.
• Realización de pruebas periódicas de los equipos UPS para asegurar su correcto funcionamiento.
• Capacidad de los UPS para proteger los servidores de archivos, base de datos y aplicaciones, previniendo la pérdida de datos durante las labores. La autonomía del equipo UPS no deberá ser menor a 30 minutos.
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
64
• Disponibilidad de UPS para proteger los equipos de vigilancia (cámaras, sistemas de grabación) y de control de acceso a las instalaciones del INGEMMET (puertas, contactos magnéticos, etc.)
• Verificación del cableado eléctrico de la sede central del INGEMMET, una vez por año.
• Instalación de luces de emergencia con tolerancia de 15 minutos, accionados automáticamente al producirse el corte de fluido eléctrico, los cuales deben estar instalados en los ambientes críticos.
f) Acciones del Equipo de Contingencia y Recuperación de Servicios de TI del Centro de Datos.
• Revisar periódicamente y de forma conjunta con el área de Servicios Generales las instalaciones eléctricas del Centro de Datos y Sede principal de la institución.
• Coordinar y supervisar el mantenimiento preventivo de pozos a tierra, aire acondicionado de precisión del Centro de Datos, UPS, transformador y del gabinete de baterías trimestralmente.
• Verificar que la red eléctrica utilizada en el Centro de Datos y la red de cómputo de la sede principal sea estabilizada. En caso no existan se debe gestionar la implementación de lo requerido con el área respectiva.
• Revisar la presencia de exceso de humedad en la sala de energía del centro de datos del INGEMMET.
2. PLAN DE EJECUCIÓN
a) Eventos que activan la Contingencia
• Corte de suministro de energía eléctrica en los ambientes del INGEMMET.
b) Procesos relacionados antes del evento
• Cualquier actividad de servicio dentro de las instalaciones
c) Personal que autoriza la contingencia y recuperación de servicios de TI El Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de Datos puede activar la contingencia para la recuperación de los servicios de TI del Centro de Datos.
d) Descripción de las actividades después de activar la contingencia y recuperación de servicios de TI
• Informar al Jefe de la Unidad de Logística de la OA del problema presentado.
• Comunicar a la empresa prestadora de servicios de energía eléctrica la falta de energía.
• Dar aviso del corte de energía eléctrica en forma oportuna a todas los órganos y unidades orgánicas del INGEMMET y coordinar las acciones necesarias.
• Las actividades afectadas por la falta de uso de aplicaciones, deberán iniciar sus procesos de contingencia a fin de no afectar las operaciones en curso.
• En el caso de los equipos que entren en funcionamiento automático con UPS´s, se deberá monitorear el tiempo de autonomía del equipo y no exceder el indicado anteriormente.
• En caso la interrupción de energía en el Centro de Datos sea mayor a dos (02) horas, se deberán apagar los equipos en forma ordenada mientras funcione el UPS y hasta que regrese el fluido eléctrico.
e) Duración El tiempo máximo de duración de la contingencia dependerá del proveedor externo de energía eléctrica.
3. PLAN DE RECUPERACIÓN
Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos
65
a) Personal Encargado
El equipo de contingencia y recuperación de servicios de TI del Centro de Datos, quienes se encargarán de realizar las acciones de recuperación necesarias.
b) Descripción de actividades El evento será evaluado y registrado de ser necesario en el formato de incidentes de seguridad de la información. Estas actividades deben contemplar como mínimo:
• Al retorno de la energía comercial se verificará por el lapso de media hora que no haya interrupciones o fluctuaciones de energía.
• Proceder a encender la plataforma tecnológica ordenadamente de acuerdo al siguiente detalle:
✓ Equipos de Comunicaciones (router, switches core, switches de acceso) ✓ Equipos de almacenamiento (storage) ✓ Servidores físicos por orden de prioridad ✓ Servidores virtuales por orden de prioridad
La contingencia finaliza cuando retorna la energía eléctrica y todos los equipos se encuentran operativos brindando servicio.
c) Mecanismos de comprobación El Equipo de Contingencia y recuperación de servicios de TI en Redes y Comunicaciones, presentará un informe al Líder de Contingencia y Recuperación de servicios de TI del Centro de Datos, explicando que parte del servicio u operaciones se han visto afectadas, y cuáles son las acciones correctivas y/o preventivas a realizar. Este informe deberá ser elevado al Grupo de Comando del INGEMMET.
d) Desactivación del Plan de Contingencia y Recuperación de Servicios de TI del Centro de Datos Con el aviso del Coordinador de Contingencia y Recuperación de Servicios de TI del Centro de Datos, se desactivará el presente Plan una vez que se recupere la funcionalidad del suministro eléctrico y la operatividad de los sistemas y servicios de tecnología de la información
e) Proceso de Actualización En base al informe que describe los problemas presentados, se determinarán las acciones de prevención a tomar.