Por que Data Centers com baixa escalabilidade e rendimento, eficiência energética reduzida e altos riscos de interrupção continuam a operar e muitas vezes projetados com falhas?

Desde a última década os Data Centers passaram a fazer parte das atividades de todas as organizações, seja de forma direta ou indireta. Os segmentos que mais utilizam estes ambientes são bancos, e-commerce, provedores, telefonia, agência de governo, commodities, educação e saúde (inclusive hospitais).

Veja também:

A maioria das organizações associadas a lista acima possui plena capacidade financeira e tecnológica para estruturar ambientes tecnológicos seguros, confiáveis com níveis de disponibilidade compatíveis com a sua estratégia de negócio.

Para auxiliá-las, há uma vasta documentação e normas técnicas sobre as considerações necessárias durante a fase de projeto/implementação e operação de Data Centers. A Europa, por exemplo, possui um código de conduta de adesão voluntária sobre a operação de Data Centers – European Code of Conduct on Data Center . As principais recomendações técnicas estão disponíveis para aquisição (ANSI/TIA 942 e BICSI 002). Existem auditorias e unidades certificadoras de Data Centers disponíveis no mercado para as empresas que desejam um acompanhamento externo e a certificação do seu ambiente e operação.

Mesmo com todas estas facilidades, Data Centers com baixa escalabilidade e rendimento, eficiência energética reduzida e altos riscos de interrupção continuam a operar e muitas vezes projetados com falhas. Estas situações são vistas em ambientes legados e novos.

Com isso surge a pergunta: por quê?

Para apresentar os principais problemas encontrados em Data Centers, serão apresentadas questões essenciais que expõem de forma significativa estas infraestruturas críticas sobre projeto e operação.

Projeto

Localização : A localização do Data Center é o primeiro ponto avaliado durante a especificação e visa permitir sua implementação e posterior operação dentro das necessidades da organização. O entendimento dos riscos de interrupção por agentes externos como acidentes, fenômenos naturais e manifestações populares devem ser considerados nesta etapa. Apesar disso, muitas organizações olham apenas o custo de implementação sem considerar os possíveis impactos futuros de suas escolhas, inclusive visão de crescimento de longo prazo. É recomendável que um Data Center suporte ampliações, sem a necessidade de retrofits por um período próximo de 10 anos. Caso contrário, obras de larga escala tendem a ser frequentes e regulares. Normalmente a cada 2 ou 3 anos com o ambiente operacional.

Instalação: A instalação do Data Center em área de risco ou a falta do seu mapeamento tende a expor a organização a interrupções de serviço caso a área ou os recursos necessários não sejam compatíveis com a necessidade operacional desejada do Data Center. O repositório de informações sobre interrupções disponíveis no Datacenter Knownledge possui vasta quantidade de casos envolvendo corporações de todos os portes que tiveram suas atividades interrompidas por incidentes, alguns relativamente simples que teriam a possibilidade de serem evitados caso o mapeamento dos riscos fosse feito e acompanhado.

Limitações: Por ser uma estrutura multidisciplinar com demandas distintas para suprir as necessidades do Data Center, é importante conhecer todas as limitações e restrições existentes na fase de projeto para minimizar, ou se possível eliminar, os problemas durante a implementação e operação.

Os projetos de elétrica, climatização, SDAI (Sistema de Detecção e Alarme de Incêndio), esteiras de cabeamento de dados/elétrica e disposição dos bastidores deveriam ser elaborados em um único projeto para a identificação de pontos conflitantes entre os sistemas.

Essa abordagem facilita a identificar os pontos de obstrução de insuflamento, melhorar a localização da MDA (Main Distribution Area), tratar obstruções dos difusores de agente limpo, eliminar restrições ao acesso de equipamentos, assegurar iluminação adequada além de outros pontos particulares a cada instalação.
Após a implementação do projeto, a atenção é voltada para a operação e suas rotinas. Existem situações onde a deficiência de manutenções preventivas e de acompanhamento, expõem o Data Center a riscos de interrupções pelo desconhecimento das condições operacionais dos equipamentos.

Operação

Uma vez instalado e ativado, o Data Center demanda diversas atividades de manutenção e processos para minimizar os riscos de interrupção. Todos os sistemas e equipamentos deveriam estar cobertos por manutenções preventivas regulares que permitam a identificação precoce de fadiga em equipamentos mecânicos de climatização, alta temperatura nos barramentos elétricos e nas baterias, dentre várias outras variáveis operacionais de um Data Center. Algumas empresas terceirizam estas atividades, mas não acompanham o seu resultado.

Além disso, processos para acompanhar e comunicar a evolução da capacidade “planejada versus utilizada” da infraestrutura devem ser estruturados e monitorados com intervalos regulares. Uma forma simples de obter algumas destas informações é avaliar a demanda de pico cobrada pela concessionária. Empresas industriais e tecnológicas necessitam especificar para a concessionária o seu planejamento de consumo. Caso este seja ultrapassado, multas serão cobradas. Mesmo com este recurso, algumas organizações não observam a demanda energética gerada pelo seu ambiente.

Um problema recorrente causado pelas situações expostas até agora, é a insuficiência energética. Todas as medidas de prevenção expostas anteriormente têm o objetivo principal de identificar riscos operacionais que estejam encobertos com a operação diária do Data Center. Alguns gestores de TI só identificam que a demanda do Data Center (elétrica, climatização, storage, sobrecarga de peso, etc.) está próxima da saturação quando ocorre um incidente de interrupção ou da necessidade de aumentar a capacidade de processamento.

Outro ponto de vital importância que necessita ser mantido e revisto regularmente é o SDAI e seu sistema de combate a incêndio. Ele é como um seguro para as instalações. Todos deveriam possuir, mas ninguém quer usá-lo. Na ocasião de sua necessidade, é imprescindível que todos os equipamentos e tubulações estejam corretamente instalados e fixados. Caso contrário, podem ocorrer acidentes graves, inclusive com risco de vida a funcionários, e a possível indisponibilidade total do Data Center. Um dos casos mais graves ocorreu no Data Center de um grande banco no Reino Unido onde cilindros de gás de Argonite foram avariados e destruíram o ambiente causando a morte de uma pessoa e ferindo diversas outras. Existem várias ocorrências de acidentes associados ao SDAI em diversos Data Centers.

Para manter o SDAI e seu sistema de combate a incêndio em correta operação, é essencial a manutenção preventiva regular de todos os seus dispositivos e a sua revisão sempre que os ambientes protegidos sejam alterados.

Um sistema de combate a incêndio que utilize gás pressurizado sem manutenção, pode causar incidentes de proporções insustentáveis à operação da organização com possibilidade de perda de vidas. A NFPA 2001 exige uma revisão dos cilindros a cada 5 anos.

data center frase

 Para evitar erros operacionais que podem causar interrupções de larga escala, documentações com suas respectivas revisões e versões devem ser elaboradas e mantidas disponíveis a todos os técnicos e engenheiros responsáveis por executar manobras.

Backup de dados é um ponto crítico que costuma ser bem concebido no início das operações do Data Center, mas mal mantido com alegações de custos operacionais. Porém, atualizar o parque tecnológico das soluções que suportam o negócio sem realizar o acompanhamento na infraestrutura de Backup expõe o negócio à perda de informações e ações judiciais em caso de interrupção dos serviços e perda de dados em ambiente operacional. Muitas organizações só percebem isso quando necessitam restaurar informações. O primeiro sinal de problema é o elevado tempo para criar o Backup.

Um dos maiores riscos a Data Centers é o uso de baterias (UPS) em ambientes não climatizados. As baterias podem ser extremamente voláteis se operadas em altas temperaturas e sua explosão normalmente é de grandes proporções. Além disso, sua operação fora dos limites de temperatura reduz seu tempo de vida. Essa situação gera maiores custos e possibilidade de interrupção total dos serviços em médio prazo durante um evento de interrupção da concessionária. A monitoração da climatização destes ambientes assim como a elaboração de relatório de termografia deve ser regular.

Para concluir esta visão macro de ações que possuem impacto significativo na qualidade e disponibilidade de um Data Center, existe a questão da atualização/migração do parque tecnológico. Um exemplo comum é a alteração da tecnologia de Call Centers. Ambientes legados costumam operar com tecnologias analógicas com grande volume de bastidores distribuídos que não dependem de TI para realizar sua atividade principal que é o contato com o cliente. Com a migração para soluções VoIP, o Call Center passa a ser totalmente dependente do Data Center. Algumas soluções de VoIP possuem alta densidade. Com isso podem surgir dois novos problemas caso o acompanhamento da capacidade do Data Center não seja adequado, comprometimento da climatização e do fornecimento de energia.

Este mesmo cenário se aplica a virtualização. Alguns gestores partem do princípio que tudo deve ser virtualizado. A virtualização para ambientes legados tende a ter sucesso, exceto em casos de restrições específicas de aplicações. Para novos sistemas de alto desempenho, a virtualização deve ser avaliada por questões de custo e alocação de recursos; além da possibilidade de degradar outras aplicações que operam no mesmo servidor. Existem aplicações no mercado que exigem tantos recursos computacionais que podem comprometer serviços se forem virtualizadas.

Por não considerarem esta situação, a gestão de TI simplesmente demanda mais bastidores de virtualização, considerando ser um problema de capacidade dos hosts. Por consequência, impactam na demanda energética e climatização.

Conclusão

Data Centers que não se preocupam com sua eficiência, possuem uma média de 30% de todo o seu consumo para os equipamentos de TI. Os outros 70% são destinados à infraestrutura que mantém o Data Center como UPSs, Climatização, Iluminação e Segurança Eletrônica.

Assegurar a correta implementação e operação de um Data Center é uma atividade multidisciplinar que não depende exclusivamente de TI. Quanto maior o seu porte, maior é a necessidade da engenharia elétrica e mecânica nas atividades de manutenção corretiva e preventiva. Focar exclusivamente em TI sem monitorar a infraestrutura é um erro que tende a causar severos impactos as organizações.

 André Dutra

andre dutraAndré Dutra é Consultor de Projetos IV. Possui 14 anos de experiência profissional e trabalha na Módulo Security desde 2008. É certificado MCSO, ITIL, Convergence+ e Security+. Pós Graduado em Segurança da Informação pela UFRJ/NCE e especializado em Data Centers pela BICSI/Datacenter Dynamics (Data Center Design Awerness). Executou projetos relacionados a Gestão de Riscos com foco em Continuidade de Negócios nos segmentos de Telecomunicações, Transporte Público, Indústrias e Órgãos Públicos.

Compartilhe conhecimentoShare on LinkedInShare on FacebookTweet about this on TwitterShare on Google+
http://segurancadainformacao.modulo.com.br/wp-content/uploads/2014/06/21.pnghttp://segurancadainformacao.modulo.com.br/wp-content/uploads/2014/06/21.pngAndré DutraSegurança da Informaçãodata center,data centers,infraestrutura crítica
Por que Data Centers com baixa escalabilidade e rendimento, eficiência energética reduzida e altos riscos de interrupção continuam a operar e muitas vezes projetados com falhas? Desde a última década os Data Centers passaram a fazer parte das atividades de todas as organizações, seja de forma direta ou indireta. Os...