Ontem, você deve ter notado que diversos serviços da Google estiveram com instabilidades e ficaram inacessíveis por algum tempo. Não demorou muito até que tudo fosse restaurado, mas a dúvida dos motivos para aquilo ainda ficavam no ar. Até que a empresa de Mountain View se manifestou para mostrar quais foram os motivos para as falhas, revelando que a culpa foi dos sistemas internos, não tendo qualquer influência externa.
“Às 17:00 (horário de Brasília), um sistema interno que gera configurações — essencialmente, informações que dizem aos outros sistemas como eles devem se comportar — encontrou uma falha de software e gerou uma configuração incorreta. A configuração incorreta foi enviada para os serviços pelos 15 minutos seguintes, fazendo com que as requisições de dados dos usuários fossem ignoradas.”, revela a empresa em um comunicado oficial.
A empresa prossegue: “Usuários começaram a ver esses erros alguns minutos depois, no momento em que o monitoramento interno alertou a equipe responsável. Engenheiros de software trabalharam por 12 minutos para acabar com todos os bugs, até que o sistema teve as configurações corretas gerada às 17:14. Por volta das 17:30, as configurações corretas já estavam disponíveis globalmente e quase todos os serviços estavam restaurados.”.
Na postagem realizada no blog oficial, a Google revela que vai seguir alguns passos nos próximos dias para evitar que novos erros desse tipo aconteçam. Os principais deles são “corrigir o bug no gerador de configurações para prevenir recorrentes falhas e verificar as configurações atuais dos sistemas geradores”, “criar validadores adicionais para as configurações” e “criar monitoramento adicional para detectar erros com mais rapidez”.