Skip to content

Engenharia de confiabilidade de sites (SRE)

Faça da confiabilidade um resultado mensurável e projetado em vez de um combate constante a incêndios.

Testes manuais por especialistasRelatórios executivosOrientação de remediaçãoReteste & atestaçãoAnálise de FirmwareTestes de Hardware
Engenharia de confiabilidade de sites (SRE)

Visão geral

A engenharia de confiabilidade de sites aplica a engenharia de software à operação para tornar os serviços confiáveis, escaláveis e eficientes. Definimos objetivos de nível de serviço e error budgets que atribuem um número à confiabilidade aceitável, e depois os usamos para equilibrar a entrega de funcionalidades com a estabilidade. Automatizamos o trabalho repetitivo, melhoramos a resposta a incidentes e reduzimos as falhas recorrentes que acordam as equipes às 3 da manhã.

Metodologia & Padrões

Práticas de SRE do Google incluindo SLOs e SLIs, error budgets e redução do trabalho repetitivo, post-mortems sem culpa, e práticas de gestão de incidentes alinhadas ao NIST SP 800-61 para incidentes relevantes para a segurança.

O que está incluído

Definição de SLIs e SLOs com error budgets
Identificação e automação do trabalho repetitivo
Processo de resposta a incidentes, plantão e post-mortem sem culpa
Melhorias de confiabilidade e capacidade guiadas por dados

O que você recebe

SLOs, SLIs e política de error budget definidos
Processo aprimorado de resposta a incidentes e de plantão
Automação que elimina o trabalho repetitivo recorrente
Padrões do SetorRelatórios ExecutivosOrientação de RemediaçãoReteste IncluídoCarta de AtestaçãoSem Despejos de Scanner

Perguntas Frequentes

Um objetivo de nível de serviço é uma meta de confiabilidade, por exemplo, 99,9 por cento das requisições bem-sucedidas. A diferença entre essa meta e 100 por cento constitui seu error budget. Quando o orçamento está saudável, você pode entregar mais rápido; quando está esgotado, você se concentra na estabilidade. Isso transforma a confiabilidade em uma decisão compartilhada e baseada em dados.

Eles se sobrepõem, mas diferem no foco. O DevOps é uma cultura ampla para uma entrega rápida e confiável. O SRE é uma implementação específica, conduzida pela engenharia, da confiabilidade usando SLOs, error budgets e a redução do trabalho repetitivo. Muitas organizações aplicam práticas de SRE dentro de uma abordagem DevOps mais ampla.

Fale hoje mesmo com um especialista em segurança

Um teste de invasão, uma auditoria ou monitoramento 24/7: nossa equipe está pronta no Reino Unido, EUA, UE e Índia.