Framework Well-Architected: pilar de otimização de custos

Last reviewed 2025-02-14 UTC

O pilar de otimização de custos no Google Cloud Well-Architected Framework descreve os princípios e as recomendações para otimizar o custo das suas cargas de trabalho no Google Cloud.

O público-alvo pretendido inclui o seguinte:

  • CTOs, CIOs, CFOs e outros executivos responsáveis pela gestão estratégica de custos.
  • Arquitetos, programadores, administradores e operadores que tomam decisões que afetam os custos em todas as fases do percurso na nuvem de uma organização.

Os modelos de custos para cargas de trabalho no local e na nuvem diferem significativamente. Os custos de TI no local incluem despesas de capital (CapEx) e despesas operacionais (OpEx). Os ativos de hardware e software no local são adquiridos e os custos de aquisição são amortizados durante a vida útil dos ativos. Na nuvem, os custos da maioria dos recursos da nuvem são tratados como OpEx, em que os custos são incorridos quando os recursos da nuvem são consumidos. Esta diferença fundamental realça a importância dos seguintes princípios básicos da otimização de custos.

Para ver princípios e recomendações de otimização de custos específicos das cargas de trabalho de IA e ML, consulte o artigo Perspetiva de IA e ML: otimização de custos no Well-Architected Framework.

Princípios fundamentais

As recomendações no pilar de otimização de custos da Well-Architected Framework estão mapeadas para os seguintes princípios essenciais:

  • Alinhe os gastos na nuvem com o valor empresarial: certifique-se de que os seus recursos na nuvem oferecem um valor empresarial mensurável alinhando os gastos de TI com os objetivos empresariais.
  • Promova uma cultura de consciencialização dos custos: certifique-se de que as pessoas em toda a sua organização consideram o impacto dos custos das suas decisões e atividades, e certifique-se de que têm acesso às informações de custos necessárias para tomar decisões informadas.
  • Otimize a utilização de recursos: Aprovisione apenas os recursos de que precisa e pague apenas os recursos que consome.
  • Otimize continuamente: monitorize continuamente a utilização e os custos dos recursos da nuvem e faça proativamente ajustes conforme necessário para otimizar os seus gastos. Esta abordagem envolve a identificação e a resolução de potenciais ineficiências de custos antes de se tornarem problemas significativos.

Estes princípios estão estreitamente alinhados com os princípios fundamentais da FinOps na nuvem. O FinOps é relevante para qualquer organização, independentemente da respetiva dimensão ou maturidade na nuvem. Ao adotar estes princípios e seguir as recomendações relacionadas, pode controlar e otimizar os custos ao longo do seu percurso na nuvem.

Colaboradores

Autor: Nicolas Pintaux | Customer Engineer, Application Modernization Specialist

Outros colaboradores:

Alinhe os gastos na nuvem com o valor empresarial

Este princípio no pilar de otimização de custos da Google Cloud estrutura bem arquitetada fornece recomendações para alinhar a sua utilização de Google Cloud recursos com os objetivos de negócio da sua organização.

Vista geral do princípio

Para gerir eficazmente os custos da nuvem, tem de maximizar o valor de negócio que os recursos da nuvem oferecem e minimizar o custo total de propriedade (TCO). Quando avalia as opções de recursos para as suas cargas de trabalho na nuvem, considere não só o custo do aprovisionamento e da utilização dos recursos, mas também o custo da respetiva gestão. Por exemplo, as máquinas virtuais (VMs) no Compute Engine podem ser uma opção rentável para alojar aplicações. No entanto, quando considera os custos gerais de manutenção, aplicação de patches e escalabilidade das VMs, o CCT pode aumentar. Por outro lado, os serviços sem servidor, como o Cloud Run, podem oferecer um maior valor empresarial. Os custos operacionais mais baixos permitem que a sua equipa se concentre nas atividades principais e ajudam a aumentar a agilidade.

Para garantir que os seus recursos na nuvem oferecem o valor ideal, avalie os seguintes fatores:

  • Custos de aprovisionamento e utilização: as despesas incorridas quando compra, aprovisiona ou consome recursos.
  • Custos de gestão: as despesas recorrentes para operar e manter os recursos, incluindo tarefas como aplicação de patches, monitorização e escalabilidade.
  • Custos indiretos: os custos que pode incorrer para gerir problemas como tempo de inatividade, perda de dados ou violações de segurança.
  • Impacto na empresa: as potenciais vantagens dos recursos, como o aumento da receita, a melhoria da satisfação dos clientes e o tempo de lançamento no mercado mais rápido.

Ao alinhar os gastos na nuvem com o valor empresarial, tem as seguintes vantagens:

  • Decisões orientadas por valor: as suas equipas são incentivadas a dar prioridade a soluções que geram o maior valor empresarial e a considerar as implicações de custos a curto e longo prazo.
  • Escolha de recursos informada: as suas equipas têm as informações e os conhecimentos de que precisam para avaliar o valor empresarial e o CTP de várias opções de implementação, pelo que escolhem recursos rentáveis.
  • Alinhamento entre equipas: a colaboração multifuncional entre as equipas de negócios, financeiras e técnicas garante que as decisões relativas à nuvem estão alinhadas com os objetivos gerais da organização.

Recomendações

Para alinhar os gastos na nuvem com os objetivos da empresa, considere as seguintes recomendações.

Dê prioridade aos serviços geridos e aos produtos sem servidor

Sempre que possível, escolha serviços geridos e produtos sem servidor para reduzir a sobrecarga operacional e os custos de manutenção. Esta escolha permite que as suas equipas se concentrem nas atividades empresariais essenciais. Podem acelerar a disponibilização de novas funcionalidades e ajudar a impulsionar a inovação e o valor.

Seguem-se exemplos de como pode implementar esta recomendação:

Equilibre a relação custo-eficácia com a agilidade empresarial

Controlar os custos e otimizar a utilização de recursos são objetivos importantes. No entanto, tem de equilibrar estes objetivos com a necessidade de uma infraestrutura flexível que lhe permita inovar rapidamente, responder rapidamente às alterações e oferecer valor mais rapidamente. Seguem-se exemplos de como pode alcançar este equilíbrio:

  • Adote as métricas DORA para o desempenho de fornecimento de software. As métricas, como a taxa de falhas de alterações (CFR), o tempo de deteção (TTD) e o tempo de restauro (TTR), podem ajudar a identificar e corrigir gargalos nos seus processos de desenvolvimento e implementação. Ao reduzir o tempo de inatividade e acelerar a entrega, pode alcançar a eficiência operacional e a agilidade empresarial.
  • Siga as práticas de engenharia de fiabilidade de sites (EFS) para melhorar a fiabilidade operacional. O foco da SRE na automatização, na observabilidade e na resposta a incidentes pode levar a uma redução do tempo de inatividade, a um tempo de recuperação mais baixo e a uma maior satisfação do cliente. Ao minimizar o tempo de inatividade e melhorar a fiabilidade operacional, pode evitar a perda de receita e a necessidade de aprovisionar recursos em excesso como uma rede de segurança para lidar com interrupções.

Ative a otimização self-service

Incentive uma cultura de experimentação e exploração fornecendo às suas equipas ferramentas de otimização de custos self-service, ferramentas de observabilidade e plataformas de gestão de recursos. Permitir que aprovisionem, geram e otimizem os respetivos recursos na nuvem de forma autónoma. Esta abordagem ajuda a fomentar um sentimento de propriedade, acelerar a inovação e garantir que as equipas podem responder rapidamente às necessidades em constante mudança, ao mesmo tempo que têm em atenção a rentabilidade.

Adoção e implementação de FinOps

Adote o FinOps para estabelecer um ambiente de colaboração onde todos têm poder para tomar decisões informadas que equilibram o custo e o valor. O FinOps promove a responsabilidade financeira e a otimização de custos eficaz na nuvem.

Promova uma mentalidade orientada para o valor e consciente do CTT

Incentive os membros da sua equipa a adotarem uma atitude holística em relação aos gastos na nuvem, com ênfase no CCT e não apenas nos custos iniciais. Use técnicas como o mapeamento do fluxo de valor para visualizar e analisar o fluxo de valor através do seu processo de entrega de software e para identificar áreas de melhoria. Implemente a determinação de custos unitários para as suas aplicações e serviços para compreender detalhadamente os fatores de custo e descobrir oportunidades de otimização de custos. Para mais informações, consulte o artigo Maximize o valor de negócio com as FinOps na nuvem.

Promova uma cultura de consciencialização dos custos

Este princípio no pilar de otimização de custos da Google Cloud estrutura bem arquitetada fornece recomendações para promover a consciencialização dos custos em toda a sua organização e garantir que os membros da equipa têm as informações de custos de que precisam para tomar decisões informadas.

Convencionalmente, a responsabilidade pela gestão de custos pode ser centralizada em alguns intervenientes selecionados e focar-se principalmente nas decisões iniciais de arquitetura do projeto. No entanto, os membros da equipa em todas as funções de utilizador da nuvem (analista, arquiteto, programador ou administrador) podem ajudar a reduzir o custo dos seus recursos no Google Cloud. Ao partilhar os dados de custos de forma adequada, pode permitir que os membros da equipa tomem decisões rentáveis ao longo dos respetivos processos de desenvolvimento e implementação.

Vista geral do princípio

Os intervenientes em várias funções, como proprietários de produtos, programadores, engenheiros de implementação, administradores e analistas financeiros, precisam de visibilidade dos dados de custos relevantes e da respetiva relação com o valor empresarial. Quando aprovisionam e gerem recursos na nuvem, precisam dos seguintes dados:

  • Custos de recursos projetados: estimativas de custos no momento da conceção e da implementação.
  • Custos de utilização de recursos em tempo real: dados de custos atualizados que podem ser usados para a monitorização contínua e a validação do orçamento.
  • Custos mapeados para métricas empresariais: estatísticas sobre como os gastos na nuvem afetam os indicadores essenciais de desempenho (IEDs), para permitir que as equipas identifiquem estratégias rentáveis.

Nem todos os indivíduos podem precisar de aceder a dados de custos não processados. No entanto, a promoção da consciencialização dos custos em todas as funções é crucial porque as decisões individuais podem afetar os custos.

Ao promover a visibilidade dos custos e garantir a propriedade clara das práticas de gestão de custos, garante que todos estão conscientes das implicações financeiras das suas escolhas e que todos contribuem ativamente para os objetivos de otimização de custos da organização. Quer seja através de uma equipa de FinOps centralizada ou de um modelo distribuído, o estabelecimento da responsabilidade é crucial para os esforços de otimização de custos eficazes.

Recomendações

Para promover a consciencialização dos custos e garantir que os membros da sua equipa têm as informações de custos de que precisam para tomar decisões informadas, considere as seguintes recomendações.

Ofereça visibilidade dos custos a nível da organização

Para alcançar a visibilidade dos custos em toda a organização, as equipas responsáveis pela gestão de custos podem realizar as seguintes ações:

  • Padronize o cálculo de custos e o orçamento: use um método consistente para determinar os custos totais dos recursos da nuvem, após ter em conta os descontos e os custos partilhados. Estabelecer processos de orçamentação claros e padronizados que se alinhem com os objetivos da sua organização e permitam uma gestão de custos proativa.
  • Use ferramentas de gestão de custos e visibilidade padronizadas: use ferramentas adequadas que forneçam estatísticas em tempo real sobre os gastos na nuvem e gerem capturas de ecrã regulares (por exemplo, semanais) da progressão dos custos. Estas ferramentas permitem a orçamentação, a previsão e a identificação proativas de oportunidades de otimização. As ferramentas podem ser ferramentas do fornecedor de nuvem (como o painel de controlo de faturação do Google Cloud), soluções de terceiros ou soluções de código aberto, como a solução de atribuição de custos.
  • Implemente um sistema de atribuição de custos: atribua uma parte do orçamento geral da nuvem a cada equipa ou projeto. Esta atribuição dá às equipas um sentido de responsabilidade pelos gastos na nuvem e incentiva-as a tomar decisões rentáveis dentro do respetivo orçamento atribuído.
  • Promova a transparência: incentive as equipas a debaterem as implicações de custos durante os processos de design e tomada de decisões. Crie um ambiente seguro e de apoio para partilhar ideias e preocupações relacionadas com a otimização de custos. Algumas organizações usam mecanismos de reforço positivo, como tabelas de classificação ou programas de reconhecimento. Se a sua organização tiver restrições na partilha de dados de custos brutos devido a preocupações empresariais, explore abordagens alternativas para partilhar informações e estatísticas de custos. Por exemplo, considere partilhar métricas agregadas (como o custo total de um ambiente ou uma funcionalidade) ou métricas relativas (como o custo médio por transação ou utilizador).

Compreenda como os recursos na nuvem são faturados

Os preços dos Google Cloud recursos podem variar consoante as regiões. Alguns recursos são faturados mensalmente a um preço fixo e outros podem ser faturados com base na utilização. Para compreender como os Google Cloud recursos são faturados, use a Google Cloud calculadora de preços e as informações de preços específicas do produto (por exemplo, os preços do Google Kubernetes Engine (GKE)).

Compreenda as opções de otimização de custos baseadas em recursos

Para cada tipo de recurso da nuvem que planeia usar, explore estratégias para otimizar a utilização e a eficiência. As estratégias incluem o ajuste de tamanho, a escalabilidade automática e a adoção de tecnologias sem servidor, quando adequado. Seguem-se exemplos de opções de otimização de custos para alguns produtos: Google Cloud

  • O Cloud Run permite-lhe configurar CPUs sempre alocadas para processar cargas de tráfego previsíveis a uma fração do preço do método de alocação predefinido (ou seja, CPUs alocadas apenas durante o processamento de pedidos).
  • Pode comprar compromissos de slots do BigQuery para poupar dinheiro na análise de dados.
  • O GKE fornece métricas detalhadas para ajudar a compreender as opções de otimização de custos.
  • Compreenda como os preços de rede podem afetar o custo das transferências de dados e como pode otimizar os custos de serviços de rede específicos. Por exemplo, pode reduzir os custos de transferência de dados para balanceadores de carga de aplicações externos através do Cloud CDN ou do Google Cloud Armor. Para mais informações, consulte o artigo Formas de reduzir os custos do balanceador de carga de aplicações externo.

Compreenda as opções de otimização de custos baseadas em descontos

Familiarize-se com os programas de descontos que Google Cloud oferecem, como os seguintes exemplos:

  • Descontos de fidelidade (DFs): Os DFs são adequados para recursos com uma utilização previsível e constante. Os CUDs permitem-lhe obter reduções significativas no preço em troca de se comprometer com a utilização de recursos específicos durante um período (normalmente, de um a três anos). Também pode usar a renovação automática de CUDs para evitar ter de voltar a comprar manualmente compromissos quando expiram.
  • Descontos por utilização sustentada: Para determinados Google Cloud produtos, como o Compute Engine e o GKE, pode receber créditos de desconto automáticos após a utilização contínua de recursos para além de limites de duração específicos.
  • VMs do Spot: Para cargas de trabalho flexíveis e com tolerância a falhas, as VMs do Spot podem ajudar a reduzir os custos do Compute Engine. O custo das VMs Spot é significativamente inferior ao das VMs normais. No entanto, o Compute Engine pode parar ou eliminar antecipadamente VMs Spot para recuperar capacidade. As VMs do Spot são adequadas para tarefas de lotes que podem tolerar a remoção preventiva e não têm requisitos de elevada disponibilidade.
  • Descontos para opções de produtos específicas: alguns serviços geridos, como o BigQuery, oferecem descontos quando compra capacidade de processamento de consultas dedicada ou com escalabilidade automática.

Avalie e escolha as opções de descontos que se alinham com as características da sua carga de trabalho e os padrões de utilização.

Incorpore estimativas de custos em planos de arquitetura

Incentive as equipas a desenvolverem planos de arquitetura que incluam estimativas de custos para diferentes opções de implementação e configurações. Esta prática permite às equipas comparar os custos de forma proativa e tomar decisões informadas que se alinham com os objetivos técnicos e financeiros.

Use um conjunto de etiquetas consistente e padrão para todos os seus recursos

Pode usar etiquetas para acompanhar os custos e identificar e classificar recursos. Em concreto, pode usar etiquetas para atribuir custos a diferentes projetos, departamentos ou centros de custos. Definir uma política de etiquetagem formal que se alinhe com as necessidades dos principais intervenientes na sua organização ajuda a tornar os custos visíveis de forma mais ampla. Também pode usar etiquetas para filtrar os dados de custos e de utilização de recursos com base no público-alvo.

Use ferramentas de automatização, como o Terraform, para aplicar a etiquetagem a todos os recursos criados. Para melhorar ainda mais a visibilidade dos custos e a atribuição, pode usar as ferramentas fornecidas pela solução de atribuição de custos de código aberto.

Partilhe relatórios de custos com os membros da equipa

Ao partilhar relatórios de custos com os membros da equipa, permite-lhes assumir a responsabilidade pelos respetivos gastos na nuvem. Esta prática permite tomar decisões rentáveis, otimizar continuamente os custos e fazer melhorias sistemáticas ao seu modelo de atribuição de custos.

Os relatórios de custos podem ser de vários tipos, incluindo os seguintes:

  • Relatórios de custos periódicos: os relatórios regulares informam as equipas acerca dos respetivos gastos atuais na nuvem. Convencionalmente, estes relatórios podem ser exportações de folhas de cálculo. Os métodos mais eficazes incluem emails automatizados e painéis de controlo especializados. Para garantir que os relatórios de custos fornecem informações relevantes e acionáveis sem sobrecarregar os destinatários com detalhes desnecessários, os relatórios têm de ser personalizados para os públicos-alvo. A configuração de relatórios personalizados é um passo fundamental para uma visibilidade e uma gestão dos custos mais interativas e em tempo real.
  • Notificações automáticas: pode configurar relatórios de custos para notificar proativamente as partes interessadas relevantes (por exemplo, através de email ou chat) acerca de anomalias de custos, limites de orçamento ou oportunidades de otimização de custos. Ao fornecer informações oportunas diretamente a quem pode agir em conformidade, os alertas automatizados incentivam a ação imediata e promovem uma abordagem proativa à otimização de custos.
  • Google Cloud Painéis de controlo: pode usar os painéis de controlo de faturação incorporados no Google Cloud para aceder a estatísticas detalhadas dos custos e identificar oportunidades de otimização de custos. Google Cloud também oferece o hub do FinOps para ajudar a monitorizar as poupanças e receber recomendações para a otimização de custos. Um motor de IA alimenta o hub de FinOps para recomendar oportunidades de otimização de custos para todos os recursos atualmente implementados. Para controlar o acesso a estas recomendações, pode implementar o controlo de acesso baseado em funções (CABF).
  • Painéis de controlo personalizados: pode criar painéis de controlo personalizados exportando dados de custos para uma base de dados de estatísticas, como o BigQuery. Use uma ferramenta de visualização como o Looker Studio para estabelecer ligação à base de dados de estatísticas e criar relatórios interativos, bem como ativar o controlo de acesso detalhado através de autorizações baseadas em funções.
  • Relatórios de custos de várias nuvens: para implementações de várias nuvens, precisa de uma vista unificada dos custos em todos os fornecedores de nuvem para garantir uma análise, um orçamento e uma otimização abrangentes. Use ferramentas como o BigQuery para centralizar e analisar dados de custos de vários fornecedores de nuvem, e use o Looker Studio para criar relatórios interativos específicos da equipa.

Otimize a utilização de recursos

Este princípio no pilar de otimização de custos da Google Cloud estrutura bem arquitetada fornece recomendações para ajudar a planear e aprovisionar recursos de modo a corresponder aos requisitos e aos padrões de consumo das suas cargas de trabalho na nuvem.

Vista geral do princípio

Para otimizar o custo dos seus recursos na nuvem, tem de compreender detalhadamente os requisitos de recursos e os padrões de carga das suas cargas de trabalho. Esta compreensão é a base de um modelo de custos bem definido que lhe permite prever o custo total de propriedade (TCO) e identificar os fatores de custo ao longo do seu percurso de adoção da nuvem. Ao analisar e prever proativamente os gastos na nuvem, pode tomar decisões informadas sobre o aprovisionamento, a utilização e a otimização de custos dos recursos. Esta abordagem permite-lhe controlar os gastos na nuvem, evitar o aprovisionamento excessivo e garantir que os recursos da nuvem estão alinhados com as necessidades dinâmicas das suas cargas de trabalho e ambientes.

Recomendações

Para otimizar eficazmente a utilização de recursos na nuvem, considere as seguintes recomendações.

Escolha recursos específicos do ambiente

Cada ambiente de implementação tem requisitos diferentes de disponibilidade, fiabilidade e escalabilidade. Por exemplo, os programadores podem preferir um ambiente que lhes permita implementar e executar rapidamente aplicações durante períodos curtos, mas podem não precisar de alta disponibilidade. Por outro lado, um ambiente de produção precisa normalmente de alta disponibilidade. Para maximizar a utilização dos seus recursos, defina requisitos específicos do ambiente com base nas necessidades da sua empresa. A tabela seguinte apresenta exemplos de requisitos específicos do ambiente.

Ambiente Requisitos
Produção
  • Alta disponibilidade
  • Desempenho previsível
  • Estabilidade operacional
  • Segurança com recursos robustos
Desenvolvimento e testes
  • Relação custo-eficácia
  • Infraestrutura flexível com capacidade de pico
  • Infraestrutura efémera quando a persistência de dados não é necessária
Outros ambientes (como ambientes de preparação e controlo de qualidade)
  • Atribuição de recursos personalizada com base nos requisitos específicos do ambiente

Escolha recursos específicos da carga de trabalho

Cada uma das suas cargas de trabalho na nuvem pode ter requisitos diferentes de disponibilidade, escalabilidade, segurança e desempenho. Para otimizar os custos, tem de alinhar as escolhas de recursos com os requisitos específicos de cada carga de trabalho. Por exemplo, uma aplicação sem estado pode não exigir o mesmo nível de disponibilidade ou fiabilidade que um back-end com estado. A tabela seguinte apresenta mais exemplos de requisitos específicos da carga de trabalho.

Tipo de carga de trabalho Requisitos de carga de trabalho Opções de recursos
De serviço crítico Disponibilidade contínua, segurança robusta e elevado desempenho Recursos premium e serviços geridos, como o Spanner para alta disponibilidade e consistência global dos dados.
Não crítico Infraestrutura rentável e com escalabilidade automática Recursos com funcionalidades básicas e recursos efémeros, como as VMs do Spot.
Orientada por eventos Dimensionamento dinâmico com base na procura atual de capacidade e desempenho Serviços sem servidor, como o Cloud Run e as funções do Cloud Run.
Cargas de trabalho experimentais Ambiente flexível e de baixo custo para desenvolvimento, iteração, testes e inovação rápidos Recursos com funcionalidades básicas, recursos efémeros, como VMs Spot, e ambientes de sandbox com limites de gastos definidos.

Uma vantagem da nuvem é a oportunidade de tirar partido da capacidade de computação mais adequada para uma determinada carga de trabalho. Algumas cargas de trabalho são desenvolvidas para tirar partido dos conjuntos de instruções do processador, e outras podem não ser concebidas desta forma. Teste o desempenho e crie perfis das suas cargas de trabalho em conformidade. Categorize as suas cargas de trabalho e faça escolhas de recursos específicos da carga de trabalho (por exemplo, escolha famílias de máquinas adequadas para VMs do Compute Engine). Esta prática ajuda a otimizar os custos, permitir a inovação e manter o nível de disponibilidade e desempenho de que as suas cargas de trabalho precisam.

Seguem-se exemplos de como pode implementar esta recomendação:

  • Para cargas de trabalho críticas que atendem utilizadores distribuídos globalmente, considere usar o Spanner. O Spanner elimina a necessidade de implementações de bases de dados complexas, garantindo a fiabilidade e a consistência dos dados em todas as regiões.
  • Para cargas de trabalho com níveis de carga flutuantes, use o dimensionamento automático para garantir que não incorre em custos quando a carga é baixa e, ainda assim, mantém capacidade suficiente para satisfazer a carga atual. Pode configurar a escala automática para muitosGoogle Cloud serviços, incluindo VMs do Compute Engine, clusters do Google Kubernetes Engine (GKE) e Cloud Run. Quando configura o ajuste de escala automático, pode configurar limites de ajuste de escala máximos para garantir que os custos permanecem dentro dos orçamentos especificados.

Selecione as regiões com base nos requisitos de custo

Para as suas cargas de trabalho na nuvem, avalie cuidadosamente as regiões disponíveis e escolha regiões que se alinhem com os seus objetivos de custos. Google CloudA região com o custo mais baixo pode não oferecer uma latência ideal ou pode não cumprir os seus requisitos de sustentabilidade. Tome decisões informadas sobre onde implementar as suas cargas de trabalho para alcançar o equilíbrio desejado. Pode usar o Google Cloud seletor de regiões para compreender as vantagens e as desvantagens entre o custo, a sustentabilidade, a latência e outros fatores.

Use opções de otimização de custos incorporadas

OsGoogle Cloud produtos oferecem funcionalidades incorporadas para ajudar a otimizar a utilização de recursos e controlar os custos. A tabela seguinte apresenta exemplos de funcionalidades de otimização de custos que pode usar em alguns Google Cloud produtos:

Produto Funcionalidade de otimização de custos
Compute Engine
GKE
Cloud Storage
  • Transfira automaticamente os dados para classes de armazenamento de custo inferior com base na antiguidade dos dados ou nos padrões de acesso através da gestão do ciclo de vida de objetos.
  • Mova dinamicamente os dados para a classe de armazenamento mais económica com base nos padrões de utilização através da classe automática.
BigQuery
  • Reduza os custos de processamento de consultas para cargas de trabalho de estado estável usando os preços baseados na capacidade.
  • Otimize o desempenho e os custos das consultas usando técnicas de particionamento e agrupamento.
Google Cloud VMware Engine

Otimize a partilha de recursos

Para maximizar a utilização dos recursos na nuvem, pode implementar várias aplicações ou serviços na mesma infraestrutura, ao mesmo tempo que cumpre os requisitos de segurança e outros requisitos das aplicações. Por exemplo, nos ambientes de desenvolvimento e teste, pode usar a mesma infraestrutura na nuvem para testar todos os componentes de uma aplicação. Para o ambiente de produção, pode implementar cada componente num conjunto separado de recursos para limitar o grau de impacto em caso de incidentes.

Seguem-se exemplos de como pode implementar esta recomendação:

  • Use uma única instância do Cloud SQL para vários ambientes de não produção.
  • Permita que várias equipas de desenvolvimento partilhem um cluster do GKE através da funcionalidade de gestão de equipas da frota no GKE Enterprise com controlos de acesso adequados.
  • Use o GKE Autopilot para tirar partido das técnicas de otimização de custos, como o bin packing e a escala automática, que o GKE implementa por predefinição.
  • Para cargas de trabalho de IA e ML, poupe custos de GPU usando estratégias de partilha de GPU, como GPUs multi-instância, GPUs de partilha de tempo e NVIDIA MPS.

Desenvolva e mantenha arquiteturas de referência

Crie e mantenha um repositório de arquiteturas de referência adaptadas para cumprir os requisitos de diferentes ambientes de implementação e tipos de cargas de trabalho. Para simplificar o processo de conceção e implementação de projetos individuais, os planos podem ser geridos centralmente por uma equipa, como um centro de excelência do Google Cloud (CCoE). As equipas de projeto podem escolher planos adequados com base em critérios claramente definidos para garantir a consistência arquitetónica e a adoção de práticas recomendadas. Para requisitos que sejam exclusivos de um projeto, a equipa do projeto e a equipa de arquitetura central devem colaborar para criar novas arquiteturas de referência. Pode partilhar as arquiteturas de referência na organização para promover a partilha de conhecimentos e expandir o repositório de soluções disponíveis. Esta abordagem garante a consistência, acelera o desenvolvimento, simplifica a tomada de decisões e promove a utilização eficiente dos recursos.

Reveja as arquiteturas de referência fornecidas pela Google para vários exemplos de utilização e tecnologias. Estas arquiteturas de referência incorporam práticas recomendadas para a seleção, o dimensionamento, a configuração e a implementação de recursos. Ao usar estas arquiteturas de referência, pode acelerar o processo de desenvolvimento e alcançar poupanças de custos desde o início.

Aplique disciplina de custos através de políticas da organização

Considere usar políticas da organização para limitar as Google Cloud localizações e os produtos disponíveis que os membros da equipa podem usar. Estas políticas ajudam a garantir que as equipas cumprem soluções económicas e aprovisionam recursos em localizações alinhadas com os seus objetivos de otimização de custos.

Estime orçamentos realistas e defina limites financeiros

Desenvolver orçamentos detalhados para cada projeto, carga de trabalho e ambiente de implementação. Certifique-se de que os orçamentos abrangem todos os aspetos das operações na nuvem, incluindo custos de infraestrutura, licenças de software, pessoal e crescimento previsto. Para evitar gastos excessivos e garantir o alinhamento com os seus objetivos financeiros, estabeleça limites de gastos ou limites mínimos claros para projetos, serviços ou recursos específicos. Monitorize regularmente os gastos na nuvem em relação a estes limites. Pode usar alertas de quota proativos para identificar potenciais ultrapassagens de custos antecipadamente e tomar medidas corretivas atempadas.

Além de definir orçamentos, pode usar quotas e limites para ajudar a aplicar a disciplina de custos e evitar picos inesperados nos gastos. Pode exercer um controlo detalhado sobre o consumo de recursos definindo quotas a vários níveis, incluindo projetos, serviços e até tipos de recursos específicos.

Seguem-se exemplos de como pode implementar esta recomendação:

  • Quotas ao nível do projeto: defina limites de gastos ou quotas de recursos ao nível do projeto para estabelecer limites financeiros gerais e controlar o consumo de recursos em todos os serviços no projeto.
  • Quotas específicas do serviço: configure quotas para serviços específicos, como o Compute Engine ou o BigQuery, para limitar o número de instâncias, CPUs ou capacidade de armazenamento que podem ser aprovisionados. Google Cloud
  • Quotas específicas do tipo de recurso: aplique quotas a tipos de recursos individuais, como VMs do Compute Engine, contentores do Cloud Storage, instâncias do Cloud Run ou nós do GKE, para restringir a respetiva utilização e evitar excedentes de custos inesperados.
  • Alertas de quota: receba notificações quando a sua utilização da quota (ao nível do projeto) atingir uma percentagem do valor máximo.

Ao usar quotas e limites em conjunto com a orçamentação e a monitorização, pode criar uma abordagem proativa e de várias camadas ao controlo de custos. Esta abordagem ajuda a garantir que os seus gastos na nuvem permanecem dentro dos limites definidos e estão alinhados com os objetivos da sua empresa. Lembre-se de que estes controlos de custos não são permanentes nem rígidos. Para garantir que os controlos de custos permanecem alinhados com as normas atuais da indústria e refletem as necessidades da sua empresa em evolução, tem de rever os controlos regularmente e ajustá-los para incluir novas tecnologias e práticas recomendadas.

Otimize continuamente

Este princípio no pilar de otimização de custos da Google Cloud estrutura bem arquitetada fornece recomendações para ajudar a otimizar o custo das suas implementações na nuvem com base nos objetivos de negócio em constante mudança e evolução.

À medida que a sua empresa cresce e evolui, as cargas de trabalho na nuvem têm de se adaptar às alterações nos requisitos de recursos e nos padrões de utilização. Para obter o máximo valor dos seus gastos na nuvem, tem de manter a rentabilidade e continuar a apoiar os objetivos empresariais. Isto requer uma abordagem proativa e adaptável que se foque na melhoria e otimização contínuas.

Vista geral do princípio

Para otimizar continuamente os custos, tem de monitorizar e analisar proativamente o seu ambiente de nuvem e fazer os ajustes adequados para cumprir os requisitos atuais. Concentre os seus esforços de monitorização em indicadores essenciais de desempenho (KPIs) que afetam diretamente a experiência dos utilizadores finais, alinham-se com os objetivos da sua empresa e fornecem estatísticas para melhoria contínua. Esta abordagem permite-lhe identificar e resolver ineficiências, adaptar-se às necessidades em constante mudança e alinhar continuamente os gastos na nuvem com os objetivos estratégicos da empresa. Para equilibrar a observabilidade abrangente com a rentabilidade, compreenda os custos e as vantagens da monitorização da utilização de recursos e use estratégias adequadas de otimização e melhoria de processos.

Recomendações

Para monitorizar eficazmente o seu Google Cloud ambiente e otimizar o custo continuamente, considere as seguintes recomendações.

Foque-se em métricas relevantes para a empresa

A monitorização eficaz começa com a identificação das métricas mais importantes para a sua empresa e clientes. Estas métricas incluem o seguinte:

  • Métricas da experiência do utilizador: a latência, as taxas de erro, o débito e as métricas de satisfação do cliente são úteis para compreender a experiência dos utilizadores finais quando usam as suas aplicações.
  • Métricas de resultados empresariais: a receita, o crescimento de clientes e a interação podem ser correlacionados com a utilização de recursos para identificar oportunidades de otimização de custos.
  • Métricas da DevOps Research & Assessment (DORA): as métricas, como a frequência de implementação, o tempo de processamento de alterações, a taxa de falhas de alterações e o tempo de restauro, fornecem estatísticas sobre a eficiência e a fiabilidade do seu processo de entrega de software. Ao melhorar estas métricas, pode aumentar a produtividade, reduzir o tempo de inatividade e otimizar os custos.
  • Métricas de engenharia de fiabilidade de sites (EFS): os orçamentos de erros ajudam as equipas a quantificar e gerir o nível aceitável de interrupção do serviço. Ao estabelecer expectativas claras de fiabilidade, os orçamentos de erros permitem que as equipas inovam e implementem alterações com maior confiança, conhecendo a sua margem de segurança. Esta abordagem proativa promove um equilíbrio entre a inovação e a estabilidade, ajudando a evitar custos operacionais excessivos associados a grandes falhas de funcionamento ou indisponibilidade prolongada.

Use a observabilidade para a otimização de recursos

Seguem-se recomendações para usar a observabilidade para identificar gargalos de recursos e recursos subutilizados nas suas implementações na nuvem:

  • Monitorize a utilização de recursos: use métricas de utilização de recursos para identificar Google Cloud recursos que estão a ser subutilizados. Por exemplo, use métricas como a utilização da CPU e da memória para identificar recursos de VMs inativos. Para o Google Kubernetes Engine (GKE), pode ver uma discrimininação detalhada dos custos e métricas de otimização relacionadas com custos. Para o Google Cloud VMware Engine, reveja a utilização de recursos para otimizar os CUDs, o consumo de armazenamento e o dimensionamento adequado do ESXi.
  • Use recomendações da nuvem: o Active Assist é um portefólio de ferramentas inteligentes que ajudam a otimizar as suas operações na nuvem. Estas ferramentas oferecem recomendações acionáveis para reduzir os custos, aumentar o desempenho, melhorar a segurança e até tomar decisões focadas na sustentabilidade. Por exemplo, as estatísticas de redimensionamento de VMs podem ajudar a otimizar a atribuição de recursos e evitar gastos desnecessários.
  • Correlacione a utilização de recursos com o desempenho: analise a relação entre a utilização de recursos e o desempenho da aplicação para determinar se pode fazer uma atualização para recursos menos dispendiosos sem afetar a experiência do utilizador.

Resolva problemas de saldo com custos

Os dados de observabilidade detalhados podem ajudar a diagnosticar e resolver problemas. No entanto, o armazenamento de quantidades excessivas de dados de observabilidade ou a exportação de dados desnecessários para ferramentas de monitorização externas podem gerar custos desnecessários. Para uma resolução de problemas eficiente, considere as seguintes recomendações:

  • Recolha dados suficientes para a resolução de problemas: certifique-se de que a sua solução de monitorização captura dados suficientes para diagnosticar e resolver problemas de forma eficiente quando surgirem. Estes dados podem incluir registos, rastreios e métricas a vários níveis de detalhe.
  • Use a amostragem e a agregação: equilibre a necessidade de dados detalhados com as considerações de custos através da utilização de técnicas de amostragem e agregação. Esta abordagem permite-lhe recolher dados representativos sem incorrer em custos de armazenamento excessivos.
  • Compreenda os modelos de preços das suas ferramentas e serviços de monitorização: avalie diferentes soluções de monitorização e escolha opções que se alinhem com as necessidades específicas, o orçamento e os padrões de utilização do seu projeto. Considere fatores como o volume de dados, os requisitos de retenção e as funcionalidades necessárias ao fazer a sua seleção.
  • Reveja regularmente a configuração da monitorização: evite recolher dados excessivos removendo métricas ou registos desnecessários.

Personalize a recolha de dados para funções e defina políticas de retenção específicas das funções

Considere as necessidades de dados específicas das diferentes funções. Por exemplo, os programadores podem precisar principalmente de acesso a rastreios e registos ao nível da aplicação, enquanto os administradores de TI podem concentrar-se nos registos do sistema e nas métricas de infraestrutura. Ao personalizar a recolha de dados, pode reduzir os custos de armazenamento desnecessários e evitar sobrecarregar os utilizadores com informações irrelevantes.

Além disso, pode definir políticas de retenção com base nas necessidades de cada função e em quaisquer requisitos regulamentares. Por exemplo, os programadores podem precisar de acesso a registos detalhados durante um período mais curto, enquanto os analistas financeiros podem precisar de dados a longo prazo.

Considere os requisitos regulamentares e de conformidade

Em determinados setores, os requisitos regulamentares exigem a retenção de dados. Para evitar riscos legais e financeiros, tem de garantir que as suas práticas de monitorização e retenção de dados ajudam a agir em conformidade com os regulamentos relevantes. Ao mesmo tempo, tem de manter a rentabilidade. Considere as seguintes recomendações:

  • Determine os requisitos de retenção de dados específicos para a sua indústria ou região e certifique-se de que a sua estratégia de monitorização cumpre os requisitos em questão.
  • Implemente mecanismos adequados de arquivo e obtenção de dados para satisfazer as necessidades de auditoria e conformidade, ao mesmo tempo que minimiza os custos de armazenamento.

Implemente alertas inteligentes

Os alertas ajudam a detetar e resolver problemas de forma atempada. No entanto, é necessário um equilíbrio entre uma abordagem que lhe mantenha a par e uma que lhe envie demasiadas notificações. Ao criar sistemas de alerta inteligentes, pode dar prioridade a problemas críticos que têm um impacto empresarial mais elevado. Considere as seguintes recomendações:

  • Priorize problemas que afetam os clientes: crie alertas que sejam acionados rapidamente para problemas que afetam diretamente a experiência do cliente, como indisponibilidade do Website, tempos de resposta lentos ou falhas de transação.
  • Ajuste para problemas temporários: use limites adequados e mecanismos de atraso para evitar alertas desnecessários para problemas temporários ou problemas do sistema de autocorreção que não afetam os clientes.
  • Personalize a gravidade dos alertas: certifique-se de que os problemas mais urgentes recebem atenção imediata diferenciando os alertas críticos dos não críticos.
  • Use os canais de notificação com moderação: escolha canais adequados para notificações de alerta (email, SMS ou paginação) com base na gravidade e urgência dos alertas.