São 03 horas da manhã… Você estava dormindo tranqüilamente… O telefone toca do outro lado uma voz lhe diz que o servidor principal no qual você é o responsável esta fora e agora?

É ai começa a “Arte do troubleshoot”, ou seja, identificar onde esta o problema e resolvê-lo da melhor e mais rápida forma possível.

Abaixo alguns passos que irão lhe ajudar neste processo:

· Muita Calma nessa hora…

Não adianta ficar nervoso, achando que o mundo esta conspirando contra você que sua a vida esta muito difícil, problemas com certeza irão ocorrer e você precisa estar preparado para este tipo de situação.

Procure manter a calma, tranquilizar o pensamento, respire fundo e comece a enumerar quais os serviços o servidor é responsável e quais as possíveis falhas estão causando o problema.

· Logs e Eventos…

Os logs e os eventos são seus amigos, eles foram criados para serem utilizados, um ótimo local para começar a identificar a origem do problema é buscando dos logs e eventos do servidor inicie uma busca detalhada para identificar o que realmente ocorreu.

· Search…

Como sabemos a internet é uma ótima ferramenta de pesquisa, depois de identificado o problema efetue uma busca para encontrar pessoas/empresas que já passaram por este “problema” e como eles solucionaram.

· Documentação…

Deixe a preguiça de lado e busque no site do fabricante a documentação do produto, a maioria dos fabricantes conta com uma base de conhecimento (knowledge base) ou simplesmente KB na qual são postadas informações de problemas bem como a solução para os mesmos.

· Compartilhe…

Caso faça parte de uma equipe e não esteja seguro de qual ação tomar é hora de compartilhar o problema. Não tenha medo ou vergonha de pedir ajuda aos outros integrantes da sua equipe compartilhar informações e experiência se faz necessário e o ajuda a enxergar o problema ou solução de outro ponto de vista, limpe sua mente e simplesmente escute.

· Backup…

Eu espero sinceramente que você tenha se lembrado de conferir os logs da sua rotina de backup porque este pode ser o ultimo recurso caso não haja nenhuma alternativa você precisará voltar o backup para corrigir o problema.

Há outras milhões de possibilidades, mas creio que estes são os passos principais para efetuar um bom troubleshoot.

Espero que você possa aprender com tudo isso e lembre-se pode ser eu ligando as 03 da manhã para avisar que o seu servidor esta fora e bom estar preparado.