Porque monitorar um ambiente de TI?

Nos dias atuais o ambiente de Tecnologia da Informação das empresas vem diariamente se destacando, pois está cada vez mais relacionado diretamente com o negócio da empresa.
Os profissionais de Tecnologia da Informação estão cada vez mais cobrados para garantir essa alta disponibilidade sem qualquer tipo de “downtime” nos serviços críticos da empresa, um ambiente com centenas de servidores e o profissional de TI se conectar servidor por servidor afim de garantir que tudo está funcionando corretamente. Qual seria o tempo para realizar todo essa operação? Com certeza, o profissional de TI perdera um tempo realizando o mesmo trabalho diariamente, poderia estar pensando em novos projetos e melhoria no ambiente de TI da empresa.
Quando de repente algum serviço de TI da empresa parou, quando temos um ambiente grande de servidores, a primeira dúvida do profissional de TI será em qual servidor está essa aplicação para restabelecer o serviço. Porém, Porque parou? Vai acontecer novamente?

Sem uma monitoração adequada o profissional de TI certamente não saberá responder estas questões e ficara sempre nesse processo, o serviço para alguns minutos e depois é restabelecido.
Não limitamos apenas a incidentes que afetam diretamente a empresa, algumas situações em que muitas vezes o próprio profissional de TI não sabe o que está ocorrendo, a cada dia a utilização de redundância de link de internet ou seja duas internet trabalhando junto vem sendo normal, visando que a empresa quer se garantir 100 % de internet.
Caso o diretor pergunte para o profissional de TI, qual internet está melhor? Qual tempo de downtime do link x ou y? Está sendo interessante utilizar os dois links? Qual horário de pico de utilização? O SLA contratado com o provedor está igual o estipulado em contrato? Com certeza, o Diretor vai querer ficar por dentro dessa informação para avaliar se os gastos estão realmente valendo a pena ou se é realmente necessário.
Vamos pensar agora em um grande crescimento de dados na empresa e o responsável pelo gerenciamento de TI não visualiza que os recursos estão crescendo rapidamente e que de uma hora pra outra, pode simplesmente parar o ambiente, quando isso acontece avisa o que Diretor da empresa em que o espaço em disco do Storage acabou e precisa de um novo, avisar isso para o Diretor responsável com todo ambiente parado e pedindo um valor altíssimo se não a empresa não voltara a funcionar, não será muito legal.

Em ambientes que não possuímos um especialista responsável pelos servidores e sim uma empresa de outsourcing com contrato mensal para suporte no ambiente de TI, onde a empresa de consultoria garante x disponibilidade no SLA contratado, como podemos garantir que a empresa está realmente obedecendo o SLA contratado?
Com certeza, se existisse um Network Management System (NMS) ou Sistema de gerenciamento de rede no ambiente, toda situação citada a cima seria diferente, os profissionais de TI, teria relatório diário, mensal, anual, relatórios de consumo de link, servidores, serviços. Quando algum serviço estiver off-line enviar um e-mail, SMS e até executar comandos automaticamente para reestabelecer o serviço caso o profissional responsável não esteja disponível.

Criado por: http://www.jorgepretel.com.br/