Próximos passos

Aprendizados e ações após o último incidente

Incidente

Um acidente é um evento inesperado e indesejável que causa algum tipo de dano e ocorre de modo não intencional. Este conceito explica o tipo de evento que ocorreu com o nosso produto duas semanas atrás e que atinge empresas de software ao redor do mundo. Mesmo com a dedicação integral do nosso time, são necessárias maneiras de minimizar os riscos e nos preparar para eventualidades.

O que aprendemos?

Para cada incidente, por menor que seja, nós realizamos o post-mortem para avaliar os aprendizados e definir ações de melhoria. Porém, diante da gravidade do último acontecimento e dadas as consequências na experiência do nosso cliente, decidimos aprofundar ainda mais em estudar maneiras de evitar novas ocorrências e criar formas de nos prepararmos melhor.

Entendemos que não conseguimos controlar todas as variáveis que podem, em algum momento, causar algum tipo de instabilidade, principalmente fatores externos. No entanto, existem mecanismos de proteção e contingência que nos permitem ter alternativas para sobreviver a momentos como este e/ou garantir que a solução ocorra de forma mais rápida.

E que ações estamos executando?

Considerando os diversos feedbacks que recebemos de clientes, parceiros e do próprio time Hiper, construímos um plano de ação para reconstrução da confiança no produto e melhorar nossa capacidade de enfrentamento deste tipo de incidente. São elas:

  1. Calendário de comunicações: planejamento e publicações periódicas relacionadas ao nosso produto, processos internos e projetos de evolução para manter a transparência com as nossas ações.
  2. Alta disponibilidade do Hiper Caixa e Hiper Loja: revisão dos produtos Hiper Caixa e Hiper Loja para garantir seu funcionamento mesmo que houver instabilidades na estrutura do Hiper Gestão além de rever nossos processos internos de desenvolvimento para garantir essa premissa em implementações futuras.
  3. Framework Hiper de incidentes: conjunto de processos e modelo de trabalho que visam direcionar a postura de todos os times da Hiper em momentos de incidente para garantirmos a efetividade das ações internas, comunicação e ações pós-incidente.
  4. Gestão de riscos: mapeamento de todas as vulnerabilidades e riscos (externos e internos) que podem afetar a experiência de uso da aplicação para que possamos ter pelo menos um mecanismo de defesa e contingência para cada tipo de eventualidade.

Cada um dos tópicos acima está sendo executado com muito carinho e temos o compromisso de trazer novidades ao longo das próximas publicações.

Próximos passos

Diante dos últimos acontecimentos e da necessidade de mantermos uma boa experiência de uso da aplicação, aceleramos algumas decisões internas para garantir a resiliência do nosso time e também do produto. Confiamos nos resultados que serão colhidos no curto prazo através da evolução do nosso time, de consultorias contratadas e do amadurecimento da nossa infraestrutura.

Em breve novas comunicações serão publicadas com os avanços, novidades e informações relacionadas à evolução do produto.