sábado, 17 de setembro de 2011

Fazendo Facebook Self Healing

Notícias interessantes sobre o url:http://rss.slashdot.org/~r/Slashdot/slashdot/~3/9shqwZZ2ypM/Making-Facebook-Self-Healing:

Djeps apresentador nova escreve: "Eu costumava atingir algum grau de resolução de problemas automatizado com scripts de eventos Nagios Handler e RabbitMQ, mas o Facebook tem feito isso em uma escala muito maior do que os meus dias de idade de sysadmin cotação:." Quando sua infra-estrutura é do tamanho de , do Facebook, há sempre servidores quebrados e pedaços de software que têm ido para baixo ou são geralmente mal-comportados. Na maioria dos casos, os nossos sistemas são projetados de tal forma que esses problemas causam pouco ou nenhum impacto para as pessoas usando o site. Mas às vezes falhas de pequeno porte pode se tornar maior falhas, erros ou causar um desempenho ruim no site. Se um pedaço de software ou hardware quebrado tem impacto sobre o site, então é importante que corrigi-lo ou substituí-lo o mais rápido possível. ... Nós tivemos que encontrar uma forma automatizada de lidar com esses tipos de questões para que os engenheiros humanos poderia incidir sobre a resolução e prevenção quanto maior, mais complexo interrupções. Então, eu comecei a escrever scripts, quando eu tinha tempo para automatizar as correções para vários tipos de servidores quebrados e pedaços de software. "


Leia mais desta história em Slashdot.






Nenhum comentário:

Postar um comentário