São 03 horas da manhã… Você estava dormindo tranqüilamente… O telefone toca do outro lado uma voz lhe diz que o servidor principal no qual você é o responsável esta fora e agora?
É ai começa a “Arte do troubleshoot”, ou seja, identificar onde esta o problema e resolvê-lo da melhor e mais rápida forma possível.
Abaixo alguns passos que irão lhe ajudar neste processo:
· Muita Calma nessa hora…
Não adianta ficar nervoso, achando que o mundo esta conspirando contra você que sua a vida esta muito difícil, problemas com certeza irão ocorrer e você precisa estar preparado para este tipo de situação.
Procure manter a calma, tranquilizar o pensamento, respire fundo e comece a enumerar quais os serviços o servidor é responsável e quais as possíveis falhas estão causando o problema.
· Logs e Eventos…
Os logs e os eventos são seus amigos, eles foram criados para serem utilizados, um ótimo local para começar a identificar a origem do problema é buscando dos logs e eventos do servidor inicie uma busca detalhada para identificar o que realmente ocorreu.
· Search…
Como sabemos a internet é uma ótima ferramenta de pesquisa, depois de identificado o problema efetue uma busca para encontrar pessoas/empresas que já passaram por este “problema” e como eles solucionaram.
· Documentação…
Deixe a preguiça de lado e busque no site do fabricante a documentação do produto, a maioria dos fabricantes conta com uma base de conhecimento (knowledge base) ou simplesmente KB na qual são postadas informações de problemas bem como a solução para os mesmos.
· Compartilhe…
Caso faça parte de uma equipe e não esteja seguro de qual ação tomar é hora de compartilhar o problema. Não tenha medo ou vergonha de pedir ajuda aos outros integrantes da sua equipe compartilhar informações e experiência se faz necessário e o ajuda a enxergar o problema ou solução de outro ponto de vista, limpe sua mente e simplesmente escute.
· Backup…
Eu espero sinceramente que você tenha se lembrado de conferir os logs da sua rotina de backup porque este pode ser o ultimo recurso caso não haja nenhuma alternativa você precisará voltar o backup para corrigir o problema.
Há outras milhões de possibilidades, mas creio que estes são os passos principais para efetuar um bom troubleshoot.
Espero que você possa aprender com tudo isso e lembre-se pode ser eu ligando as 03 da manhã para avisar que o seu servidor esta fora e bom estar preparado.