05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
DISEÑO DE DATA CENTER INTRODUCCIÓN
Febrero de 2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
ESTADO DEL ARTE
DISEÑO DE DATA CENTER
1
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Estándares
Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
El Data Center (Estado actual) • En los últimos años el Data Center como sitio de Misión
Crítica ha tomado mayor relevancia en la Organizaciones Organizaciones de diferente naturaleza públicas o privadas. • El desarrollo de las Tecnología de la Información I nformación y las Comunicaciones y la reducción de sus costos, hace que las organizaciones tiendan a automatizar sus procesos con el fin de lograr mayor efectividad y eficiencia. • La dependencia cada vez mayor de estas tecnologías hace que su operatividad deba estar garantizada por altos niveles de confiabilidad y disponibilidad.
2
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Ley de Moore
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
El Data Center (Estado actual) • El Data Center cumple una función estratégica en una
organización ya que se encarga de garantizar la sostenibilidad de los Servicios de TI provistos a los usuarios.
3
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
El Data Center (Estado actual) • Debido a los cambios tecnológicos que se han
presentado los últimos tiempos tales como la Virtualización y la Consolidación dan lugar a la necesidad de un nuevo enfoque, el cual se puede posicionar como una extensión de la Gestión de los Servicios de TI. Contando con herramientas y procesos propios que permitan un enfoque integrado, que incluya el acceso a la información en tiempo real, una visión integral del Data Center y la información necesaria que apoye la toma de decisiones.
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
El Data Center (Estado actual) Uno de los retos más importantes que atraviesan, en la actualidad, los Data Center es el de ser m ás eficientes en el uso de la Energía Eléctrica, no solo por los programas de mejora del medio ambiente en algunos países como es USA (Iniciativas Green), sino tam bién por el incremento de los costos de Energía Eléctrica. • Según una encuesta de Data Center Dynamics del 2011, el total del consumo de energía de los Data Center supera los 31 GW. • El promedio de potencia por rack fue 4.05 kW . El 58% consumen menos de 5 kW, el 28 % 5 kW-10 kW y el 14% sobre 10 kW. • La tendencia de crecimiento en consumo de energía anual es del 19%. •
4
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
DEFINICIONES
DISEÑO DE DATA CENTER
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Definiciones •
El Data Center es el ambiente especializado que protege los equipos que pueden ser considerados los más valiosos de una organización y su propiedad intelectual. Son los que se emplean para: Procesar transacciones de negocios, alojar un sitio web, procesar y almacenar la propiedad intelectual de la organización, mantener sus registros financieros, manejar sus correos electrónicos, etc.
5
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Definiciones •
El Data Center de acuerdo al Estándar ANSI/TIA-942 y el BICSI002 , “es un edificio o una porción de un edificio cuya principal función es albergar el cuarto de cómputo y sus áreas de soporte”.
De acuerdo a ello los espacios en un Data Center pueden ser: • • • • • • •
Oficinas del Staff de Soporte Cuartos de Entrada Cuartos Mecánicos y Eléctricos Centro de Operaciones Espacios de Telecomunicaciones Espacio de Descarga y desembalaje Cuarto de Cómputo
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Espacios del Data Center
Ing. Yuri Bravo Asencios
6
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
CONFIABILIDAD Y DISPONIBILIDAD
DISEÑO DE DATA CENTER
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Instalaciones de Misión Crítica • La potencia suministrada en un edificio de oficinas típico
es alrededor de 110 W/m 2 . En una instalación de misión crítica es entre 650 W/m 2 y 2200 W/m2 • El ratio entre los espacios requeridos para servicios mecánico/eléctrico con respecto al área útil es un promedio de 1:3 o 1:4 en un edificio típico, en un Data Center es cerca a 1:1 • El costo de instalaciones de misión crítica pueden llegar a ser hasta cuatro veces el costo de un edificio tradicional. Los requerimientos de Potencia y Refrigeración son los drivers del costo y diseño.
7
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Instalaciones de Misión Crítica • Las instalaciones de Misión Crítica que requieren operar
7 x24 necesitan una estrategia integral para sostener sus operaciones. • Las variaciones en el diseño se derivan de los requerimientos de cada facility , empezando con el criterio de selección del lugar y trabajando luego en cada nivel de diseño: arquitectura, ingeniería y operación, la reducción del riesgo de caída y la confiabilidad debe ser el foco principal, ponderando y coordinando a través de los procesos.
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Instalaciones de Misión Crítica
Proceso de planificación para una Infraestructura de Misión Crítica
8
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Análisis de Riesgos • •
• • • •
Que aspectos de la operación pueden afectar la vida de las personas? Cuales son las amenazas a las personas o a la propiedad por eventos naturales, causas humanas, causas tecnológicas, catástrofes, etc.? Cual podría ser la pérdida económica a la em presa debido a pérdidas de funcionamiento o pérdida de registros? Cual podría ser la pérdida económica por daño o destrucción de equipos? Cuál podría ser el impacto regulatorio o contractual? Cuál podría ser el impacto de la interrupción del servicio a la reputación de la organización?
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Análisis de Riesgos Identificar requerimientos de disponibilidad Identificar requerimientos operacionales
Definir impacto de caída
Identificar la Clase de Disponibilidad requerida
Proceso de Análisis de Riesgo
9
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Identificar Requerimientos operacionales Nivel Operacional
Horas anuales permitidas de mantenimiento planeado
Descripción
0
>400
La operación es menos de 24 horas al día y menos de 7 días a la semana. Mantenimiento con parada de servicio se presenta durante horas de trabajo y fuera
1
100-400
La operación es menos de 24 horas al día y menos de 7 días a la semana. Mantenimiento con parada de servicio se presenta durante horas de trabajo y fuera
2
50-99
La operación es hasta 24 horas al día, hasta 7 días a la semana y hasta 50 semanas al año. Mantenimiento con parada de servicio se presenta durante horas de trabajo y fuera
3
0-49
La operación es 24 horas al día, 7 días a la semana por 50 semanas o más. Mantenimiento con parada de servicio no se presenta durante horas de trabajo.
4
0
La operación es 24 horas al día, 7 días a la semana por 52 semanas al año. Mantenimiento con parada de servicio no se presenta.
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Identificar Niveles operacionales Máximo tiempo de caída anual (minutos)
U p t i m e Objetivo
(porcentaje)
> 5,000
< 99.0
500 – 5,000
99 a 99.9
50 - 500
99.9 a 99.99
5 - 50
99.99 a 99.999
0.5 - 50
99.999 a 99.9999
10
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Definir el impacto de la caída Clasificación
Impacto de caída
Corporativa
Afecta la calidad del servicio brindado por toda la organización, o resulta una significativa disrupción o retraso en el logro de los objetivos clave de la organización
Multiregional
Alcance multiregional, afecta a una gran parte de la organización, o resulta una gran disrupción o retraso en el logro de los objetivos clave de la organización
Regional
Alcance regional, afecta a una parte de la organización, o resulta una moderada disrupción o retraso en el logro de los objetivos clave de la organización Alcance local, afecta solo un site, o resulta una disrupción menor o retraso en el logro de los objetivos clave de la organización
Local
Alcance local, afecta solo una función u operación, o resulta una disrupción menor o retraso en el logro de los objetivos no críticos de la organización
Sub local
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Determinar la clase de Disponibilidad
Impacto de caída
Nivel Operacional 0
1
2
3
4
Corporativa
Clase F1
Clase F2
Clase F3
Clase F4
Clase F4
Multiregional
Clase F1
Clase F2
Clase F3
Clase F3
Clase F4
Regional
Clase F1
Clase F2
Clase F2
Clase F3
Clase F3
Local
Clase F0
Clase F1
Clase F2
Clase F3
Clase F3
Sub local
Clase F0
Clase F0
Clase F1
Clase F2
Clase F2
11
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Confiabilidad
R=
e(-λT)
R: Confiabilidad (porcentaje de probabilidad de suceso) e: función exponencial λ: Tasa de falla (Inversa de MTBF) T: periodo de tiempo (misma unidad de tasa de falla)
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Clases de Data center por su Disponibilidad Clase
Componentes Redundantes
Sistema redundante
Control de calidad
Ventana de Mantenimiento anual
Disponibilidad objetivo
Alcance de impacto
Clase 0
No
No
Calidad comercial estándar
> 400 horas
< 99.0%
Data Center Local
Clase 1
No
No
Calidad comercial estándar
100- 400 horas
99.0%
Data Center Local o Regional
Clase 2
Componentes críticos redundantes
No
Calidad Premium para comp. Críticos
50- 99 horas
99.9%
Data Center Local o Regional o multiregional
Clase 3
Componentes críticos y no críticos redundantes
La redundancia puede ser sin redundancia de comp.
Calidad premium en todos los componentes
0-49 horas
99.99%
Todo Data Center con altos req. De disponibilidad y baja ventana de mantenimiento
Clase 4
Todos los comp. Críticos, incremento de mantenibilidad, además para componentes no críticos
Redundancia de sistema con componentes redundantes
Calidad para todos los componentes
0 horas
99.999%
Data Center Multiregional y Corporativo
12
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
NIVELES TIER
DISEÑO DE DATA CENTER
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Niveles o Tier • TIER I: Data Center de Infraestructura Básica • TIER II: Data Center de Infraestructura con
componentes de capacidad redundantes • TIER III: Data Center de Infraestructura con capacidad de mantenimiento concurrente • TIER IV: Data Center de Infraestructura con capacidad tolerante a fallas Ing. Yuri Bravo Asencios
13
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
TIER I: Data Center de Infraestructura Básica • •
• •
• • •
El Objetivo del Tier I es soportar los requerimientos básicos ambientales y de energía en función a los Equipos de TI . La infraestructura Tier I provee un ambiente mejorado en comparación a un ambiente de oficinas e incluye un ambiente dedicado para los Equipos de TI ; un Sistema de Energía Ininterrumpida (UPS) para filtrar los picos de energía eléctrica, cortes momentáneos y bajadas en la tensión eléctrica; equipos de refrigeración dedicados y funcionando aun después de horas de oficina; y un grupo electrógeno para proteger las operaciones de los equipos de TI de cortes de energía prolongados. Hay un alto riesgo de caída debido a eventos planificados y no planificados. La infraestructura del Data Center podría estar fuera de servicio por razones de mantenimiento programadas. Situaciones de urgencia pueden motivar paradas más frecuentes y errores de operación o fallas en los componentes de su infraestructura causarán la detención del Data Center. Se prevén 6 fallas en un periodo de 5 años. En total los cortes del sistema se estiman en 28.8 horas al año. La tasa de disponibilidad máxima del Data Center es 99.67% del tiempo. Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Tiempo de Implementación: 3 meses Año de Primer Desarrollo: 1965 Costo de Construcción: Piso elevado : $2,300/m 2 Salida de UPS útil: $10,000/kW Fuente: Uptime Institute (Tier Classifications Define site Infraestructure Performance)
14
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
TIER II: Data Center de Infraestructura con componentes de capacidad redundantes • •
• •
• • •
El Objetivo del Tier II es proveer un nivel de confiabilidad mayor a Tier I, para reducir el riesgo de caída debido a la falla de componentes . Incluye capacidades de energía y refrigeración redundantes para proveer un amplio margen de seguridad contra interrupción de los procesos de TI debido a fallas en la infraestructura del sitio. Los componentes redundantes son normalmente módulos UPS, unidades de enfriamiento, equipos de disipación térmica, bombas, chillers y plantas de emergencia. En el Tier II hay un riesgo moderado de caídas debido a los eventos planificados y no planificados. El mantenimiento en la línea de distribución eléctrica o en otros componentes de la infraestructura pueden causar una interrupción del procesamiento. Se podrían presentar 3 cortes de servicio de 12 horas cada uno en un periodo de 2 años, por mantenimientos programados. Se prevé 1 falla en un periodo de 1 año. En total las caídas del sistema se estiman en 22 horas al año. La tasa de disponibilidad máxima del Data Center es 99.75% del tiempo.
Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Tiempo de Implementación: 3- 6 meses Año de Primer Desarrollo: 1970 Costo de Construcción: Piso elevado : $2,300/m 2 Salida de UPS útil: $11,000/kW Fuente: Uptime Institute (Tier Classifications Define site Infraestructure Performance)
15
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
TIER III: Data Center de Infraestructura con capacidad de mantenimiento concurrente • •
• • • • •
El Objetivo del Tier III es prov eer confiabilidad adicional y capacidad de mantenimiento para reducir los riesgos de caída debido a desastres naturales, desastres por causas humanas, mantenimiento preventivos (planeados) y correctivo. Mantenimiento Concurrente significa que todos y cada uno de los componentes de capacidad y distribución necesarios para apoyar el ambiente donde se encuentran los Equipos de TI pueden ser objeto de mantenimiento en forma planificada sin que esto afecte la operación de los Equipos de TI. El efecto en la topología de la infraestructura del sitio es que una vía de distribución redundante de energía y enfriamiento es adicionada a los componentes críticos redundantes del Tier II. En este tier, actividades no planeadas como errores de operación o fallas espontáneas en la infraestructura pueden todavía causar una interrupción del Data Center. Se prevé 1 falla en un periodo de 2.5 años. En total las caídas del sistema se estiman en 1.6 horas al año. La tasa de disponibilidad máxima del Data Center es 99.98% del tiempo.
Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Típico tiempo de Implementación: 15- 20 meses Año de Primer Desarrollo: 1985 Costo de Construcción: Piso elevado : $2,300/m 2 Salida de UPS útil: $20,000/kW Fuente: Uptime Institute (Tier Classifications Define site Infraestructure Performance)
16
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
TIER IV: Data Center de Infraestructura con capacidad tolerante a fallas •
•
•
• • •
El Objetivo del Tier IV es eliminar la interrupción del servicio ya que provee capacidad para realizar cualquier actividad planeada sin interrupciones en las cargas críticas, pero además la funcionalidad tolerante a fallas le permite a la infraestructura continuar operando aun ante un evento crítico no planeado. La infraestructura de un Data Center Tier IV se construye sobre un Tier III, adicionando el concepto de Tolerante a Fallas a la Topología de infraestructura del sitio. Similar a la aplicación de conceptos sobre Mantenimiento Concurrente, Tolerante a Fallas se extiende a todos y cada uno de los sistemas o componentes que apoyan las operaciones de los Equipos de TI. Los sistemas suelen ser automatizados para reducir las posibilidades de error humano y cuentan con personal 24x7. Se requiere de personal con entrenamiento riguroso para atender cualquier contingencia. Se prevé 1 falla en un periodo de 5 año. En total las caídas del sistema se estiman en 0.8 horas al año. La tasa de disponibilidad máxima del data center es 99.99% del tiempo. Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Tiempo de Implementación: 15- 20 meses Año de Primer Desarrollo: 1995 Costo de Construcción: Piso elevado : $2,300/m 2 Salida de UPS útil: $22,000/kW Fuente: Uptime Institute (Tier Classifications Define site Infraestructure Performance)
17
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Resumen
Ing. Yuri Bravo Asencios
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
CONSIDERACIONES EN UN PROYECTO
DISEÑO DE DATA CENTER
18
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Áreas de Conocimiento de la Gestión del Proyecto • Gestión de la Integración • Gestión del Alcance • Gestión del Tiempo • Gestión del Costo • Gestión de los Recursos Humanos • Gestión de las Comunicaciones • Gestión de la Calidad • Gestión de los Riesgos • Gestión de las Adquisiciones
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Desarrollo del Plan del Proyecto • • • • • • • • •
Lecciones aprendidas Enunciado del Alcance del Trabajo Plan de Seguridad Desarrollar una Estructura de Desglose de la Organización (OBS) Desarrollar una Estructura de Desglose del Trabajo (WBS) Desarrollar un cronograma Desarrollar un presupuesto Desarrollar un Plan de Calidad Desarrollar un Plan de Comunicación
19
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Diseño y Construcción • Miembros del Equipo de Diseño: – Propietario – Arquitecto – Ingeniero – Consultor • Miembros del Equipo de Construcción: – Contratista General y/o Gerente de Construcción – Contratista y subcontratas
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Diseño y Construcción • Fases: – Programación – Diseño Esquemático – Desarrollo del Diseño – Documentos de Construcción – Licitación y Negociación – Administración de la Construcción – Presentaciones – Post-construcción
20
05/02/2014
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Diseño y Construcción • El Diseño debería incluir tres elementos: – Especificaciones – Planos y Diagramas – Estimados de Costos
Instituto Nacional de Investigación y Capacitación de Telecomunicaciones
Buenas Prácticas • Peer Review • Supervisión • Commissioning
21