Quando gere a época de pico ou eventos de tráfego elevado na nuvem, existem três fases principais:
- Preparação: conclua atividades e tarefas para se preparar para o seu evento, incluindo uma revisão da arquitetura, o planeamento da capacidade e a criação de reservas.
- Execução: quando o evento começar, monitorize-o atentamente e reaja em conformidade.
- Análise: após a conclusão do evento, analise o que correu bem, o que não correu e como melhorar os eventos futuros.
Deve compreender e seguir determinadas práticas recomendadas durante estas fases para poder fornecer os seus serviços com um tempo de inatividade mínimo ou nulo e sem degradação do desempenho ou da experiência do utilizador durante o seu evento.
Preparação: detalhe o seu processo de planeamento de eventos
Durante a fase de preparação para um evento de capacidade máxima, deve interagir com a sua equipa da conta ou TAM para ajudar a rever a sua arquitetura, criar diagramas, cronogramas e listas de verificação de lançamento, verificar as quotas de serviços com base no seu perfil de tráfego previsto e determinar o impacto geral nos seus projetos.
O planeamento deve começar muito antes da data do evento. Em alguns casos, pode ser necessário começar a planear com meses de antecedência enquanto o serviço ainda está em desenvolvimento. Reúna uma equipa que possa ajudar a rever o fluxo de trabalho de eventos proposto, o público esperado, os requisitos e os critérios de sucesso, bem como a cadeia de fornecimento de meios de ponta a ponta. A fase de preparação deve incluir avaliações de risco, planeamento de mitigação e uma revisão da prontidão operacional para garantir que o seu fluxo de trabalho está bem concebido.
Para mais informações, reveja a Google Cloud Estrutura de arquitetura, que fornece recomendações para ajudar arquitetos, programadores, administradores e outros profissionais da nuvem a conceber e operar uma topologia de nuvem segura, eficiente, resiliente, de elevado desempenho e rentável.
Execução: monitorize e reaja durante a execução
Quando a época de pico ou o evento de lançamento começar, tem de monitorizar atentamente a atividade e reagir conforme necessário. Depois de configurar a monitorização, os alertas e o registo na fase de preparação, pode monitorizar o tráfego, os registos e os níveis de quota essenciais para a empresa, e usar estas informações para determinar as causas principais e resolver rapidamente os problemas. Para mais informações, consulte o artigo Reveja alertas e painéis de controlo.
Se ocorrerem problemas, um processo de gestão de incidentes e encaminhamento bem definido é fundamental para reduzir o esforço e o tempo necessários para abordar e resolver o problema. Se ainda não o fez, estabeleça um processo de gestão de incidentes. Para mais informações, consulte o artigo Prepare-se para resolver problemas durante o evento.
Análise: reveja e documente a sua análise
Quando a época de pico ou o evento de lançamento terminar, reveja e analise o evento e documente as lições aprendidas para as poder aplicar ao seu próximo evento importante.
Foque-se nas seguintes áreas:
Resumo da cronologia: capture o momento em que o tráfego começou a aumentar e os eventos principais (picos) durante o período do evento. Identificar quando surgiram problemas, se existirem.
Análise da causa principal: investigue os problemas que ocorreram. Há algo que Google Cloud ou que podia ter feito de forma diferente? É algo a considerar para a próxima vez? Documente as lições aprendidas e os passos necessários para melhorar no futuro.
Compare as previsões com os dados reais: analise a previsão de tráfego em comparação com o tráfego real registado. Onde foram necessários recursos adicionais? Onde os recursos foram subutilizados ou desnecessários?
Retrospectiva: partilhe e reveja as informações anteriores com as principais partes interessadas. Promova uma cultura sem culpa, em que assume que todos os envolvidos tinham boas intenções e se concentra na identificação das causas contribuintes sem indicar nenhum indivíduo ou equipa.