Em nosso último post referente os processos do ITIL, nós falamos sobre a Gestão de Incidentes, que resumindo, tem a responsabilidade de restaurar um serviço o mais rápido possível com o mínimo de impacto para o negócio. Porém, a Gestão de Incidentes não se preocupa em tomar medidas que evitem que a falha ocorra novamente, e esta é a principal responsabilidade da Gestão de Problemas.
A GP também auxilia a Gestão de Incidentes no caso de incidentes graves. Na prática, uma mesma equipe pode ser responsável por estes dois processos, pois elas se complementam. Porém, é interessante que as pessoas sejam designadas para atender Incidentes ou Problemas. Talvez realizar um rodízio entre a equipe por mês ou semana seja interessante para que todos não fiquem sempre “fazendo a mesma coisa”.
A GP tem também a missão de registrar todos os erros conhecidos e suas soluções de contorno. Veja abaixo algumas definições importantes de serem observadas:
- Problema: É a causa desconhecida de um ou mais incidentes
- Causa: É um Erro em um Item de Configuração
- Erro Conhecido (Known Error): É um problema cuja causa foi diagnosticada e para qual existe uma Solução de Contorno
- Soluções de Contorno (Workaround): solução não definitiva
- Solução: Solução definitiva
Outro papel importante da GP é vasculhar os incidentes/chamados que foram abertos e já encerrados e verificar se um algum ativo (item de configuração) pode estar com problemas ou pode ser melhorado.
Um exemplo prático: O pessoal da GP verificou que no último mês houve 3 paradas na rede do departamento Y, e que para resolver o incidente, o pessoal de Gestão de Incidentes está sempre reiniciando o switch XYZ. O pessoal da GP solicitou a substituição deste equipamento depois de realizar uma análise do hardware do mesmo, descobrindo a causa do problema. É de extrema importância que tudo seja corretamente registrado. Todas estas informações geradas pela GP podem ser utilizadas pela Gestão de Incidentes, por exemplo, para saber que para o incidente do Software A existe um workaround para ser aplicado e corrigi-lo temporariamente.
Na análise de um problema (incidente com causa desconhecida) é fundamental que se encontre a “causa raiz” do problema pois, o mesmo é que desencadeia todos os incidentes posteriores. Ao se achar uma solução para o problema, este problema se transforma em um “erro conhecido”. Para resolver este “erro conhecido” deve-se adotar uma solução ou solução de contorno através do gerenciamento de mudanças, que é quem irá avaliar a viabilidade e o impacto sobre o negócio desta solução pois, a mudança num hardware ou software podem afetar outros itens de configuração.
É isso aí pessoal, um abraço a todos.
6 Comentários
Muito bom Emerson.
Uma boa explicação sobre esse processo, crucial para gerencialmento de capacidade saber a qtas anda a Infra.
Gustavo
Exato Gustato. O Gerenciamento de Problemas permite que os problemas recorrentes sejam descobertos, registrados, analisados e corrigidos através de uma solicitação de mudança…