Gestão de Problemas

Gestão de Problemas!Em nosso último post referente os processos do ITIL, nós falamos sobre a Gestão de Incidentes, que resumindo, tem a responsabilidade de restaurar um serviço o mais rápido possível com o mínimo de impacto para o negócio. Porém, a Gestão de Incidentes não se preocupa em tomar medidas que evitem que a falha ocorra novamente, e esta é a principal responsabilidade da Gestão de Problemas.

A GP também auxilia a Gestão de Incidentes no caso de incidentes graves. Na prática, uma mesma equipe pode ser responsável por estes dois processos, pois elas se complementam. Porém, é interessante que as pessoas sejam designadas para atender Incidentes ou Problemas. Talvez realizar um rodízio entre a equipe por mês ou semana seja interessante para que todos não fiquem sempre “fazendo a mesma coisa”.

A GP tem também a missão de registrar todos os erros conhecidos e suas soluções de contorno. Veja abaixo algumas definições importantes de serem observadas:

  • Problema: É a causa desconhecida de um ou mais incidentes
  • Causa: É um Erro em um Item de Configuração
  • Erro Conhecido (Known Error): É um problema cuja causa foi diagnosticada e para qual existe uma Solução de Contorno
  • Soluções de Contorno (Workaround): solução não definitiva
  • Solução: Solução definitiva

Outro papel importante da GP é vasculhar os incidentes/chamados que foram abertos e já encerrados e verificar se um algum ativo (item de configuração) pode estar com problemas ou pode ser melhorado.

Um exemplo prático: O pessoal da GP verificou que no último mês houve 3 paradas na rede do departamento Y, e que para resolver o incidente, o pessoal de Gestão de Incidentes está sempre reiniciando o switch XYZ. O pessoal da GP solicitou a substituição deste equipamento depois de realizar uma análise do hardware do mesmo, descobrindo a causa do problema. É de extrema importância que tudo seja corretamente registrado. Todas estas informações geradas pela GP podem ser utilizadas pela Gestão de Incidentes, por exemplo, para saber que para o incidente do Software A existe um workaround para ser aplicado e corrigi-lo temporariamente.

Na análise de um problema (incidente com causa desconhecida) é fundamental que se encontre a “causa raiz” do problema pois, o mesmo é que desencadeia todos os incidentes posteriores. Ao se achar uma solução para o problema, este problema se transforma em um “erro conhecido”. Para resolver este “erro conhecido” deve-se adotar uma solução ou solução de contorno através do gerenciamento de mudanças, que é quem irá avaliar a viabilidade e o impacto sobre o negócio desta solução pois, a mudança num hardware ou software podem afetar outros itens de configuração.

É isso aí pessoal, um abraço a todos.

Emerson Dorow

Mais artigos deste autor »

Experiência de 10 anos na área de TI. Coordenador de suporte de serviços de infraestrutura e cloud computing. Mantenedor do site http://www.governancadeti.com.

Certificado em ITILv3 Intermediate, Cobit v4.1 Foundation, HDI-SCM, Linux Professional Institute (LPI) Nível 1 e IBM Tivoli Monitoring Deployment V6.2 Professional. É graduado em Sistemas de Informação pela Uniasselvi Blumenau e pós-graduando em Governança de TI pelo Senac Florianópolis e MBA em gestão de TI pelo INPG.

Entusiasta de assuntos relacionados a gestão de serviços em TI, governança de TI, Gestão de Projetos, liderança, gestão de equipes e negócios.


6 Comentários

Gustavo
1

Muito bom Emerson.
Uma boa explicação sobre esse processo, crucial para gerencialmento de capacidade saber a qtas anda a Infra.
Gustavo

Emerson
2

Exato Gustato. O Gerenciamento de Problemas permite que os problemas recorrentes sejam descobertos, registrados, analisados e corrigidos através de uma solicitação de mudança…

Deixe seu comentário

Seu endereço de e-mail não será publicado. Campos com * são obrigatórios!