Questa pagina è stata tradotta dall'API Cloud Translation.

Deployment regionale su Compute Engine

Last reviewed 2025-08-12 UTC

Questo documento fornisce un'architettura di riferimento per un'applicazione a più livelli che viene eseguita su VM Compute Engine in più zone all'interno di una regione Google Cloud. Puoi utilizzare questa architettura di riferimento per eseguire in modo efficiente il rehosting (lift and shift) delle applicazioni on-premise nel cloud con modifiche minime alle applicazioni. Il documento descrive anche i fattori di progettazione da considerare quando crei un'architettura regionale per le tue applicazioni cloud. Il pubblico di destinazione di questo documento sono i cloud architect.

Architettura

Il seguente diagramma mostra un'architettura per un'applicazione eseguita in modalità active-active in stack isolati di cui è stato eseguito il deployment in tre zoneGoogle Cloud all'interno di una regione. L'architettura è allineata all'archetipo di deployment regionale.

Un'applicazione viene eseguita in modalità attiva-attiva in stack isolati distribuiti in tre zone Google Cloud all'interno di una regione.

L'architettura si basa sul modello cloud Infrastructure as a Service (IaaS). Esegui il provisioning delle risorse di infrastruttura richieste (computing, networking e archiviazione) in Google Cloud. Mantieni il controllo completo dell'infrastruttura e la responsabilità del sistema operativo, del middleware e dei livelli superiori dello stack di applicazioni. Per saperne di più su IaaS e altri modelli di cloud, consulta PaaS, IaaS, SaaS e CaaS: in che cosa differiscono?.

Il diagramma precedente include i seguenti componenti:

Componente	Finalità
Bilanciatore del carico esterno regionale	Il bilanciatore del carico esterno regionale riceve e distribuisce le richieste degli utenti alle VM del livello web. Utilizza un tipo di bilanciatore del carico appropriato a seconda del tipo di traffico e di altri requisiti. Ad esempio, se il backend è costituito da server web (come mostrato nell'architettura precedente), utilizza un bilanciatore del carico delle applicazioni per inoltrare il traffico HTTP(S). Per bilanciare il carico del traffico TCP, utilizza un bilanciatore del carico di rete. Per ulteriori informazioni, vedi Scegliere un bilanciatore del carico.
Gruppo di istanze gestite (MIG) regionale per il livello web	Il livello web dell'applicazione viene eseguito il deployment su VM Compute Engine che fanno parte di un gruppo di istanze gestite a livello di regione. Il gruppo di istanze gestite è il backend del bilanciatore del carico esterno regionale. Il gruppo di istanze gestite contiene VM di Compute Engine in tre zone diverse. Ciascuna di queste VM ospita un'istanza indipendente del livello web dell'applicazione.
Bilanciatore del carico interno regionale	Il bilanciatore del carico interno regionale distribuisce il traffico dalle VM del livello web alle VM del livello applicazione. A seconda dei requisiti, puoi utilizzare un bilanciatore del carico delle applicazioni interno regionale o un bilanciatore del carico di rete. Per ulteriori informazioni, vedi Scegliere un bilanciatore del carico.
MIG regionale per il livello applicazione	Il livello dell'applicazione viene implementato su VM di Compute Engine che fanno parte di un MIG regionale, che è il backend del bilanciatore del carico interno. Il gruppo di istanze gestite contiene VM di Compute Engine in tre zone diverse. Ogni VM ospita un'istanza indipendente del livello dell'applicazione.
Database di terze parti di cui è stato eseguito il deployment su una VM di Compute Engine	L'architettura descritta in questo documento mostra un database di terze parti (come PostgreSQL) di cui è stato eseguito il deployment su una VM Compute Engine. Puoi implementare un database di standby in un'altra zona. Le funzionalità di replica e failover del database dipendono dal database che utilizzi. L'installazione e la gestione di un database di terze parti comportano sforzi e costi operativi aggiuntivi per l'applicazione di aggiornamenti, il monitoraggio e la garanzia di disponibilità. Puoi evitare il sovraccarico di installazione e gestione di un database di terze parti e sfruttare le funzionalità di alta disponibilità (HA) integrate utilizzando un servizio di database completamente gestito come Cloud SQL o AlloyDB per PostgreSQL. Per ulteriori informazioni sulle opzioni di database gestito, vedi Servizi di database più avanti in questa guida.
Rete Virtual Private Cloud e subnet	Tutte le risorse Google Cloud dell'architettura utilizzano una singola rete VPC e subnet. A seconda dei tuoi requisiti, puoi scegliere di creare un'architettura che utilizzi più reti VPC o più subnet. Per ulteriori informazioni, consulta Decidere se creare più reti VPC in "Best practice e architetture di riferimento per la progettazione di VPC".
Bucket Cloud Storage con due regioni	I backup di applicazioni e database vengono archiviati in un bucket Cloud Storage a doppia regione. Se si verifica un'interruzione a livello di zona o regione, l'applicazione e i dati non vengono persi. In alternativa, puoi utilizzare il servizio di Backup e DR per creare, archiviare e gestire i backup del database.

Prodotti utilizzati

Questa architettura di riferimento utilizza i seguenti prodotti Google Cloud :

Compute Engine: un servizio di calcolo sicuro e personalizzabile che ti consente di creare ed eseguire VM sull'infrastruttura di Google.
Cloud Load Balancing: un portafoglio di bilanciatori del carico scalabili, globali e regionali ad alte prestazioni.
Cloud Storage: uno spazio di archiviazione di oggetti a basso costo e senza limiti per diversi tipi di dati. I dati sono accessibili dall'interno e dall'esterno di Google Cloude vengono replicati in più località per la ridondanza.
Virtual Private Cloud (VPC): un sistema virtuale che fornisce funzionalità di rete globali e scalabili per i tuoi Google Cloud carichi di lavoro. VPC include il peering di rete VPC, Private Service Connect, l'accesso privato ai servizi e VPC condiviso.

Casi d'uso

Questa sezione descrive i casi d'uso per i quali un deployment regionale su Compute Engine è una scelta appropriata.

Migrazione efficiente delle applicazioni on-premise

Puoi utilizzare questa architettura di riferimento per creare una topologia Google Cloud per eseguire il rehosting (lift and shift) delle applicazioni on-premise nel cloud con modifiche minime alle applicazioni. Tutti i livelli dell'applicazione in questa architettura di riferimento sono ospitati su VM Compute Engine. Questo approccio ti consente di migrare in modo efficiente le applicazioni on-premise nel cloud e sfruttare i vantaggi in termini di costi, affidabilità, prestazioni e semplicità operativa offerti da Google Cloud .

Applicazione ad alta disponibilità con utenti all'interno di un'area geografica

Consigliamo un'architettura di deployment regionale per le applicazioni che richiedono robustezza contro le interruzioni di zona, ma possono tollerare alcuni tempi di inattività causati da interruzioni regionali. Se una parte dello stack di applicazioni non funziona, l'applicazione continua a essere eseguita se in ogni livello esiste almeno un componente funzionante con capacità adeguata. Se si verifica un'interruzione del servizio a livello di zona, lo stack di applicazioni continua a essere eseguito nelle altre zone.

Bassa latenza per gli utenti delle applicazioni

Se tutti gli utenti di un'applicazione si trovano in un'unica area geografica, ad esempio un singolo paese, un'architettura di deployment regionale può contribuire a migliorare le prestazioni percepite dall'utente dell'applicazione. Puoi ottimizzare la latenza di rete per le richieste degli utenti eseguendo il deployment dell'applicazione nella regione più vicina ai tuoi utenti. Google Cloud

Networking a bassa latenza tra i componenti dell'applicazione

Un'architettura a singola regione potrebbe essere adatta ad applicazioni come il batch computing che richiedono connessioni di rete a bassa latenza e larghezza di banda elevata tra i nodi di computing. Tutte le risorse si trovano in una singola Google Cloud regione, quindi il traffico di rete tra le risorse rimane all'interno della regione. La latenza di rete tra le risorse è bassa e non vengono addebitati costi di trasferimento dei dati tra regioni. I costi di rete all'interno della regione vengono comunque applicati.

Conformità ai requisiti di residenza dei dati

Puoi utilizzare un'architettura a singola regione per creare una topologia che ti aiuti a soddisfare i requisiti di residenza dei dati. Ad esempio, un paese europeo potrebbe richiedere che tutti i dati utente vengano archiviati e a cui si acceda in data center che si trovano fisicamente in Europa. Per soddisfare questo requisito, puoi eseguire l'applicazione in una Google Cloud regione in Europa.

Considerazioni sulla progettazione

Questa sezione fornisce indicazioni per aiutarti a utilizzare questa architettura di riferimento per sviluppare un'architettura che soddisfi i tuoi requisiti specifici per la progettazione del sistema, la sicurezza e la conformità, l'affidabilità, l'efficienza operativa, i costi e le prestazioni.

Progettazione del sistema

Questa sezione fornisce indicazioni per aiutarti a scegliere le Google Cloud regioni per il deployment regionale e a selezionare i servizi Google Cloud appropriati.

Selezione delle regioni

Quando scegli le Google Cloud regioni in cui devono essere implementate le tue applicazioni, considera i seguenti fattori e requisiti:

Disponibilità dei servizi Google Cloud in ogni regione. Per ulteriori informazioni, consulta Prodotti disponibili per località.
Disponibilità dei tipi di macchine Compute Engine in ogni regione. Per maggiori informazioni, consulta Regioni e zone.
Requisiti di latenza per l'utente finale.
Costo delle risorse Google Cloud .
Costi del trasferimento di dati tra regioni.
Requisiti normativi.

Alcuni di questi fattori e requisiti potrebbero comportare compromessi. Ad esempio, la regione più conveniente potrebbe non avere l'impronta di carbonio più bassa. Per saperne di più, consulta Best practice per la scelta delle regioni di Compute Engine.

Infrastruttura di calcolo

L'architettura di riferimento in questo documento utilizza le VM Compute Engine per determinati livelli dell'applicazione. A seconda dei requisiti della tua applicazione, puoi scegliere tra altri servizi di calcolo: Google Cloud

Container: puoi eseguire applicazioni containerizzate in cluster Google Kubernetes Engine (GKE). GKE è un motore di orchestrazione dei container che automatizza il deployment, la scalabilità e la gestione delle applicazioni containerizzate.
Serverless: se preferisci concentrare i tuoi sforzi IT sui dati e sulle applicazioni anziché configurare e gestire le risorse dell'infrastruttura, puoi utilizzare servizi serverless come Cloud Run.

La decisione di utilizzare VM, container o servizi serverless comporta un compromesso tra flessibilità di configurazione e impegno di gestione. Le VM e i container offrono maggiore flessibilità di configurazione, ma sei responsabile della gestione delle risorse. In un'architettura serverless, esegui il deployment dei carichi di lavoro su una piattaforma preconfigurata che richiede uno sforzo di gestione minimo. Per ulteriori informazioni sulla scelta dei servizi di calcolo appropriati per i tuoi workload inGoogle Cloud, consulta Hosting di applicazioni su Google Cloud.

Servizi di archiviazione

L'architettura mostrata in questo documento utilizza volumi Persistent Disk di regione per tutti i livelli. I dischi permanenti forniscono la replica sincrona dei dati tra due zone all'interno di una regione.

Google Cloud Hyperdisk offre prestazioni, flessibilità ed efficienza migliori rispetto a Persistent Disk. Con Hyperdisk Balanced, puoi eseguire il provisioning di IOPS e throughput separatamente e dinamicamente, il che ti consente di ottimizzare il volume per un'ampia gamma di workload.

Per l'archiviazione a basso costo replicata in più località, puoi utilizzare bucket Cloud Storage regionali, a due regioni o multiregionali.

I dati nei bucket regionali vengono replicati in modo sincrono tra le zone della regione.
I dati nei bucket a due o più regioni vengono archiviati in modo ridondante in almeno due località geografiche separate. I metadati vengono scritti in modo sincrono in tutte le regioni e i dati vengono replicati in modo asincrono. Per i bucket a due regioni, puoi utilizzare la replica turbo, che garantisce la replica degli oggetti tra le coppie di regioni, con un RPO (Recovery Point Objective) di 15 minuti. Per ulteriori informazioni, vedi Disponibilità e durabilità dei dati.

Per archiviare i dati condivisi tra più VM in una regione, ad esempio tra tutte le VM nel livello web o nel livello applicazione, puoi utilizzare un'istanza regionale Filestore. I dati archiviati in un'istanza regionale Filestore vengono replicati in modo sincrono in tre zone all'interno della regione. Questa replica garantisce alta disponibilità e robustezza in caso di interruzioni della zona. Puoi archiviare file di configurazione condivisi, strumenti e utilità comuni e log centralizzati nell'istanza Filestore e montare l'istanza su più VM. Per una maggiore robustezza contro le interruzioni della regione, puoi replicare un'istanza Filestore in una regione diversa. Per saperne di più, consulta Replica delle istanze.

Se il tuo database è Microsoft SQL Server, ti consigliamo di utilizzare Cloud SQL per SQL Server. Negli scenari in cui Cloud SQL non supporta i tuoi requisiti di configurazione o se hai bisogno dell'accesso al sistema operativo, puoi eseguire il deployment di un'istanza del cluster di failover (FCI) di Microsoft SQL Server. In questo scenario, puoi utilizzare Google Cloud NetApp Volumes completamente gestito per fornire spazio di archiviazione SMB a disponibilità continua (CA) per il database.

Quando progetti l'archiviazione per i tuoi workload, considera le caratteristiche funzionali, i requisiti di resilienza, le aspettative di prestazioni e gli obiettivi di costo. Per saperne di più, consulta Progetta una strategia di archiviazione ottimale per il tuo carico di lavoro cloud.

Servizi di database

L'architettura di riferimento in questo documento utilizza un database di terze parti di cui è stato eseguito il deployment su VM Compute Engine. L'installazione e la gestione di un database di terze parti comportano impegno e costi per operazioni come l'applicazione di aggiornamenti, il monitoraggio e la garanzia di disponibilità, l'esecuzione di backup e il ripristino da errori.

Puoi evitare l'impegno e i costi di installazione e gestione di un database di terze parti utilizzando un servizio di database completamente gestito come Cloud SQL, AlloyDB per PostgreSQL, Bigtable, Spanner o Firestore. Questi Google Cloud servizi di database forniscono accordi sul livello del servizio (SLA) per il tempo di attività e includono funzionalità predefinite per la scalabilità e l'osservabilità.

Se il tuo carico di lavoro richiede un database Oracle, puoi eseguire il deployment del database su una VM Compute Engine o utilizzare Oracle Database@Google Cloud. Per saperne di più, vedi Workload Oracle in Google Cloud.

Progettazione di rete

Scegli un design di rete che soddisfi i tuoi requisiti aziendali e tecnici. Puoi utilizzare una singola rete VPC o più reti VPC. Per saperne di più, consulta la seguente documentazione:

Sicurezza, privacy e conformità

Questa sezione descrive i fattori da considerare quando utilizzi questa architettura di riferimento per progettare e creare una topologia regionale in Google Cloud che soddisfi i requisiti di sicurezza, privacy e conformità dei tuoi carichi di lavoro.

Protezione contro le minacce esterne

Per proteggere la tua applicazione da minacce come gli attacchi DDoS (Distributed Denial of Service) e cross-site scripting (XSS), puoi utilizzare i criteri di sicurezza di Google Cloud Armor. Ogni criterio è un insieme di regole che specifica determinate condizioni da valutare e azioni da intraprendere quando le condizioni sono soddisfatte. Ad esempio, una regola potrebbe specificare che se l'indirizzo IP di origine del traffico in entrata corrisponde a un indirizzo IP o a un intervallo CIDR specifico, il traffico deve essere negato. Puoi anche applicare regole del web application firewall (WAF) preconfigurate. Per ulteriori informazioni, consulta Panoramica delle norme di sicurezza.

Accesso esterno per le VM

Nell'architettura di riferimento descritta in questo documento, le VM Compute Engine non richiedono l'accesso in entrata da internet. Non assegnare indirizzi IP esterni alle VM. Google Cloud Le risorse che hanno solo un indirizzo IP privato interno possono comunque accedere a determinati servizi e API di Google utilizzando Private Service Connect o l'accesso privato Google. Per maggiori informazioni, consulta Opzioni di accesso privato per i servizi.

Per abilitare connessioni in uscita sicure dalle risorse che hanno solo indirizzi IP privati, come le VM Compute Engine in questa architettura di riferimento, puoi utilizzare Secure Web Proxy o Cloud NAT. Google Cloud

Privilegi del service account

Per le VM Compute Engine nell'architettura, anziché utilizzare i service account predefiniti, ti consigliamo di creare service account dedicati e specificare le risorse a cui il account di servizio può accedere. L'account di servizio predefinito dispone di un'ampia gamma di autorizzazioni, tra cui alcune che potrebbero non essere necessarie. Puoi personalizzare i service account dedicati in modo che abbiano solo le autorizzazioni essenziali. Per ulteriori informazioni, consulta Limitare i account di servizio account.

Sicurezza SSH

Per migliorare la sicurezza delle connessioni SSH alle VM di Compute Engine nella tua architettura, implementa Identity-Aware Proxy (IAP) e l'API Cloud OS Login. IAP ti consente di controllare l'accesso alla rete in base all'identità utente e alle policy IAM (Identity and Access Management). L'API Cloud OS Login ti consente di controllare l'accesso SSH Linux in base all'identità dell'utente e ai criteri IAM. Per maggiori informazioni sulla gestione dell'accesso alla rete, consulta Best practice per il controllo dell'accesso al login SSH.

Sicurezza della rete

Per controllare il traffico di rete tra le risorse nell'architettura, devi configurare criteri Cloud Next Generation Firewall (NGFW) appropriati.

Altre considerazioni sulla sicurezza

Quando crei l'architettura per il tuo workload, tieni conto delle best practice e dei suggerimenti per la sicurezza a livello di piattaforma forniti nel blueprint delle fondamenta aziendali e nel Google Cloud framework Well-Architected: sicurezza, privacy e conformità.

Affidabilità

Questa sezione descrive i fattori di progettazione da considerare quando utilizzi questa architettura di riferimento per creare e gestire un'infrastruttura affidabile per i tuoi deployment regionali in Google Cloud.

Interruzioni dell'infrastruttura

In un'architettura regionale, se un singolo componente dello stack dell'infrastruttura non funziona, l'applicazione può elaborare le richieste se in ogni livello esiste almeno un componente funzionante con capacità adeguata. Ad esempio, se un'istanza del server web non funziona, il bilanciatore del carico inoltra le richieste degli utenti alle altre istanze del server web disponibili. Se una VM che ospita un'istanza di un server web o di un server delle app si arresta in modo anomalo, il MIG ricrea automaticamente la VM.

Se si verifica un'interruzione nella zona, il bilanciatore del carico non viene interessato perché è una risorsa di regione. Un'interruzione di servizio nella zona potrebbe interessare singole VM Compute Engine. Tuttavia, l'applicazione rimane disponibile e reattiva perché le VM si trovano in un MIG a livello di regione. Un MIG a livello di regione garantisce che le nuove VM vengano create automaticamente per mantenere il numero minimo configurato di VM. Dopo che Google avrà risolto l'interruzione della zona, devi verificare che l'applicazione funzioni come previsto in tutte le zone in cui è implementata.

Se tutte le zone di questa architettura hanno un'interruzione o se si verifica un'interruzione a livello di regione, l'applicazione non è disponibile. Devi attendere che Google risolva l'interruzione, quindi verificare che l'applicazione funzioni come previsto.

Puoi ridurre il tempo di inattività causato dalle interruzioni a livello di regione mantenendo una replica passiva (di failover) dello stack dell'infrastruttura in un'altra regione Google Cloud. Se si verifica un'interruzione del servizio nella regione principale, puoi attivare lo stack nella regione di failover e utilizzare i criteri di routing DNS per indirizzare il traffico al bilanciatore del carico nella regione di failover.

Per le applicazioni che richiedono robustezza contro le interruzioni regionali, valuta l'utilizzo di un'architettura multiregionale. Per saperne di più, consulta Deployment multiregionale su Compute Engine.

Scalabilità automatica del gruppo di istanze gestite

Per controllare il comportamento di scalabilità automatica dei tuoi MIG stateless, puoi specificare metriche di utilizzo target, come l'utilizzo medio della CPU. Puoi anche configurare la scalabilità automatica basata sulla pianificazione per i MIG stateless. I MIG stateful non possono essere scalati automaticamente. Per ulteriori informazioni, consulta Scalabilità automatica dei gruppi di istanze.

Limite di dimensioni del MIG

Quando decidi le dimensioni dei tuoi MIG, considera i limiti predefiniti e massimi del numero di VM che possono essere create in un MIG. Per saperne di più, consulta Aggiungi e rimuovi VM da un MIG.

Riparazione automatica delle VM

A volte le VM che ospitano l'applicazione potrebbero essere in esecuzione e disponibili, ma potrebbero esserci problemi con l'applicazione stessa. L'applicazione potrebbe bloccarsi, arrestarsi in modo anomalo o non avere memoria sufficiente. Per verificare se un'applicazione risponde come previsto, puoi configurare controlli di integrità basati sull'applicazione nell'ambito del criterio di riparazione automatica dei tuoi MIG. Se l'applicazione su una determinata VM non risponde, il MIG esegue la riparazione automatica della VM. Per ulteriori informazioni sulla configurazione della riparazione automatica, consulta Informazioni sulla riparazione delle VM per l'alta affidabilità.

Posizionamento della VM

Nell'architettura descritta in questo documento, il livello applicazione e il livello web vengono eseguiti su VM Compute Engine distribuite in più zone. Questa distribuzione garantisce che la tua applicazione sia resiliente alle interruzioni di zona.

Per migliorare la robustezza dell'architettura, puoi creare una policy di posizionamento distribuito e applicarla al modello di gruppo di istanze gestite. Quando il MIG crea le VM, le posiziona all'interno di ogni zona su server fisici diversi (chiamati host), in modo che le VM siano robuste contro i guasti dei singoli host. Per saperne di più, consulta Crea e applica policy di posizionamento distribuito alle VM.

Pianificazione della capacità delle VM

Per assicurarti che la capacità per le VM Compute Engine sia disponibile quando è necessario eseguire il provisioning delle VM, puoi creare prenotazioni. Una prenotazione fornisce capacità garantita in una zona specifica per un numero specificato di VM di un tipo di macchina che scegli. Una prenotazione può essere specifica per un progetto o condivisa tra più progetti. Per saperne di più sulle prenotazioni, consulta Scegliere un tipo di prenotazione.

Archiviazione stateful

Una best practice nella progettazione delle applicazioni è evitare la necessità di dischi locali stateful. Tuttavia, se il requisito esiste, puoi configurare i dischi permanenti in modo che siano stateful per garantire che i dati vengano conservati quando le VM vengono riparate o ricreate. Tuttavia, ti consigliamo di mantenere i dischi di avvio stateless, in modo da poterli aggiornare alle immagini più recenti con nuove versioni e patch di sicurezza. Per saperne di più, consulta Configurazione dei dischi permanenti stateful nei MIG.

Durabilità dei dati

Puoi utilizzare Backup e DR per creare, archiviare e gestire i backup delle VM di Compute Engine. Backup and RE archivia i dati di backup nel formato originale leggibile dall'applicazione. Se necessario, puoi ripristinare i tuoi workload in produzione utilizzando direttamente i dati dell'archiviazione di backup a lungo termine ed evitare la necessità di preparare o spostare i dati.

Compute Engine offre le seguenti opzioni per garantire la durabilità dei dati archiviati nei volumi diPersistent Diski:

Puoi utilizzare gli snapshot per acquisire lo stato point-in-time dei volumi Persistent Disk. Gli snapshot vengono archiviati in modo ridondante in più regioni, con checksum automatici per garantire l'integrità dei dati. Per impostazione predefinita, gli snapshot sono incrementali, quindi utilizzano meno spazio di archiviazione e ti fanno risparmiare. Gli snapshot vengono archiviati in una posizione Cloud Storage che puoi configurare. Per altri consigli sull'utilizzo e la gestione degli snapshot, consulta le best practice per gli snapshot dei dischi Compute Engine.
Per garantire che i dati in Persistent Disk rimangano disponibili in caso di interruzione della zona, puoi utilizzare Persistent Disk a livello regionale o Hyperdisk bilanciato ad alta affidabilità. I dati in questi tipi di dischi vengono replicati in modo sincrono tra due zone della stessa regione. Per saperne di più, consulta Informazioni sulla replica sincrona dei dischi.

Se utilizzi un servizio di database gestito come Cloud SQL, i backup vengono eseguiti automaticamente in base alle norme di conservazione che definisci. Puoi integrare la strategia di backup con backup logici aggiuntivi per soddisfare i requisiti normativi, del flusso di lavoro o aziendali.

Se utilizzi un database di terze parti e devi archiviare i backup del database e i log delle transazioni, puoi utilizzare i bucket Cloud Storage regionali. I bucket Cloud Storage regionali forniscono uno spazio di archiviazione di backup a basso costo ridondante tra le zone.

Disponibilità del database

Se utilizzi un servizio di database gestito come Cloud SQL nella configurazione HA, in caso di errore del database primario, Cloud SQL esegue il failover automaticamente al database di standby. Non è necessario modificare l'indirizzo IP per l'endpoint del database. Se utilizzi un database di terze parti autogestito che viene implementato su una VM Compute Engine, devi utilizzare un bilanciatore del carico interno o un altro meccanismo per garantire che l'applicazione possa connettersi a un altro database se il database principale non è disponibile.

Per implementare il failover tra zone per un database di cui è stato eseguito il deployment su una VM di Compute Engine, devi disporre di un meccanismo per identificare gli errori del database primario e di un processo per eseguire il failover sul database di standby. I dettagli del meccanismo di failover dipendono dal database utilizzato. Puoi configurare un'istanza osservatore per rilevare gli errori del database primario e orchestrare il failover. Devi configurare le regole di failover in modo appropriato per evitare una situazione di split-brain e impedire failover non necessari. Per esempi di architetture che puoi utilizzare per implementare il failover per i database PostgreSQL, consulta Architetture per l'alta affidabilità dei cluster PostgreSQL su Compute Engine.

Altre considerazioni sull'affidabilità

Quando crei l'architettura cloud per il tuo carico di lavoro, esamina le best practice e i suggerimenti relativi all'affidabilità forniti nella documentazione seguente:

Ottimizzazione dei costi

Questa sezione fornisce indicazioni per ottimizzare il costo di configurazione e gestione di una topologia regionale Google Cloud che crei utilizzando questa architettura di riferimento.

Tipi di macchine VM

Per aiutarti a ottimizzare l'utilizzo delle risorse delle tue istanze VM, Compute Engine fornisce suggerimenti sul tipo di macchina. Utilizza i suggerimenti per scegliere i tipi di macchine che corrispondono ai requisiti di calcolo del tuo workload. Per i workload con requisiti di risorse prevedibili, puoi personalizzare il tipo di macchina in base alle tue esigenze e risparmiare denaro utilizzando i tipi di macchine personalizzate.

Modello di provisioning delle VM

Se la tua applicazione è a tolleranza di errore, le VM spot possono aiutarti a ridurre i costi di Compute Engine per le VM nei livelli applicazione e web. Il costo delle VM spot è notevolmente inferiore rispetto alle VM normali. Tuttavia, Compute Engine potrebbe arrestare o eliminare preventivamente le VM spot per recuperare capacità.

Le VM spot sono adatte per i job batch che possono tollerare il prerilascio e non hanno requisiti di alta affidabilità. Le Spot VM offrono gli stessi tipi di macchine, opzioni e prestazioni delle VM normali. Tuttavia, quando la capacità delle risorse in una zona è limitata, i MIG potrebbero non essere in grado di fare lo scale out (ovvero creare VM) automaticamente fino alle dimensioni target specificate finché la capacità richiesta non torna disponibile.

Utilizzo delle risorse della VM

La funzionalità di scalabilità automatica dei gruppi di istanze gestite stateless consente alla tua applicazione di gestire agevolmente gli aumenti del traffico e ti aiuta a ridurre i costi quando il fabbisogno di risorse è basso. I MIG stateful non possono essere scalati automaticamente.

Licenze di terze parti

Quando esegui la migrazione di carichi di lavoro di terze parti a Google Cloud, potresti essere in grado di ridurre i costi utilizzando il modello Bring Your Own License (BYOL). Ad esempio, per eseguire il deployment delle VM Microsoft Windows Server, anziché utilizzare un'immagine premium che comporta costi aggiuntivi per la licenza di terze parti, puoi creare e utilizzare un'immagine BYOL Windows personalizzata. Paghi solo per l'infrastruttura delle VM che utilizzi su Google Cloud. Questa strategia ti aiuta a continuare a trarre valore dagli investimenti esistenti in licenze di terze parti. Se decidi di utilizzare l'approccio BYOL, i seguenti consigli potrebbero aiutarti a ridurre i costi:

Esegui il provisioning del numero richiesto di core CPU di computing indipendentemente dalla memoria utilizzando i tipi di macchine personalizzate. In questo modo, limiti il costo della licenza di terze parti al numero di core CPU di cui hai bisogno.
Riduci il numero di vCPU per core da 2 a 1 disattivando il multi-threading simultaneo (SMT).

Se esegui il deployment di un database di terze parti come Microsoft SQL Server su VM Compute Engine, devi considerare i costi della licenza per il software di terze parti. Quando utilizzi un servizio di database gestito come Cloud SQL, i costi della licenza del database sono inclusi negli addebiti per il servizio.

Altre considerazioni sui costi

Quando crei l'architettura per il tuo workload, considera anche le best practice e i suggerimenti generali forniti in Google Cloud Well-Architected Framework: ottimizzazione dei costi.

Efficienza operativa

Questa sezione descrive i fattori da considerare quando utilizzi questa architettura di riferimento per progettare e creare una topologia regionale Google Cloud che puoi gestire in modo efficiente.

Aggiornamenti della configurazione delle VM

Per aggiornare la configurazione delle VM in un MIG (ad esempio il tipo di macchina o l'immagine del disco di avvio), crea un nuovo template di istanza con la configurazione richiesta e poi applica il nuovo template al MIG. Il MIG aggiorna le VM utilizzando il metodo di aggiornamento che scegli: automatico o selettivo. Scegli un metodo appropriato in base ai tuoi requisiti di disponibilità ed efficienza operativa. Per saperne di più su questi metodi di aggiornamento del MIG, consulta Applica nuove configurazioni delle VM in un MIG.

Immagini VM

Per le tue VM, anziché utilizzare immagini pubbliche fornite da Google, ti consigliamo di creare e utilizzare immagini sistema operativo personalizzate che contengano le configurazioni e il software richiesti dalle tue applicazioni. Puoi raggruppare le tue immagini personalizzate in una famiglia di immagini personalizzate. Una famiglia di immagini punta sempre all'immagine più recente della famiglia, quindi i tuoi template di istanza e script possono utilizzare quell'immagine senza che tu debba aggiornare i riferimenti a una versione specifica dell'immagine. Devi aggiornare regolarmente le tue immagini personalizzate per includere gli aggiornamenti e le patch di sicurezza forniti dal fornitore del sistema operativo.

Template di istanza deterministici

Se i modelli di istanza che utilizzi per i MIG includono script di avvio per installare software di terze parti, assicurati che gli script specifichino esplicitamente i parametri di installazione del software, ad esempio la versione del software. In caso contrario, quando il MIG crea le VM, il software installato sulle VM potrebbe non essere coerente. Ad esempio, se il modello di istanza include uno script di avvio per installare Apache HTTP Server 2.0 (il pacchetto apache2), assicurati che lo script specifichi la versione esatta di apache2 da installare, ad esempio la versione 2.4.53. Per ulteriori informazioni, vedi Template di istanza deterministici.

Ulteriori considerazioni operative

Quando crei l'architettura per il tuo carico di lavoro, prendi in considerazione le best practice e i suggerimenti generali per l'efficienza operativa descritti in Google Cloud Well-Architected Framework: eccellenza operativa.

Ottimizzazione delle prestazioni

Prestazioni di computing

Compute Engine offre un'ampia gamma di tipi di macchine predefinite e personalizzabili per i carichi di lavoro eseguiti sulle VM. Scegli un tipo di macchina appropriato in base ai tuoi requisiti di prestazioni. Per saperne di più, consulta la guida alle risorse e al confronto per le famiglie di macchine.

Multi-threading della VM

Ogni CPU virtuale (vCPU) che allochi a una VM Compute Engine viene implementata come un singolo multithread hardware. Per impostazione predefinita, due vCPU condividono un core della CPU fisica. Per le applicazioni che comportano operazioni altamente parallele o che eseguono calcoli in virgola mobile (come l'analisi della sequenza genetica e la modellazione del rischio finanziario), puoi migliorare le prestazioni riducendo il numero di thread in esecuzione su ogni core della CPU fisica. Per ulteriori informazioni, vedi Imposta il numero di thread per core.

Il multithreading delle VM potrebbe avere implicazioni di licenza per alcuni software di terze parti, come i database. Per ulteriori informazioni, leggi la documentazione sulle licenze per il software di terze parti.

Network Service Tiers

Network Service Tiers ti consente di ottimizzare i costi e le prestazioni di rete dei tuoi carichi di lavoro. Puoi scegliere il livello Premium o Standard. Il livello Premium invia il traffico sul backbone globale di Google per ottenere una perdita di pacchetti minima e una bassa latenza. Il livello Standard distribuisce il traffico utilizzando peering, provider di servizi internet (ISP) o reti di transito in un punto di presenza (PoP) perimetrale più vicino alla regione in cui viene eseguito il tuo workload Google Cloud . Per ottimizzare le prestazioni, ti consigliamo di utilizzare il livello Premium. Per ottimizzare i costi, ti consigliamo di utilizzare il livello Standard.

Prestazioni di rete

Per i carichi di lavoro che richiedono una bassa latenza di rete tra le VM all'interno dei livelli applicazione e web, puoi creare una policy di posizionamento compatto e applicarla al modello di gruppo di istanze gestite utilizzato per questi livelli. Quando il gruppo di istanze gestite crea le VM, le posiziona su server fisici vicini tra loro. Mentre una policy di posizionamento compatto contribuisce a migliorare le prestazioni di rete tra le VM, una policy di posizionamento distribuito può contribuire a migliorare la disponibilità delle VM come descritto in precedenza. Per ottenere un equilibrio ottimale tra prestazioni di rete e disponibilità, quando crei una policy di posizionamento compatto, puoi specificare la distanza che deve separare le VM. Per saperne di più, consulta Panoramica delle policy di posizionamento.

Compute Engine ha un limite per VM per la larghezza di banda di rete in uscita. Questo limite dipende dal tipo di macchina della VM e dal fatto che il traffico venga instradato attraverso la stessa rete VPC della VM di origine. Per le VM con determinati tipi di macchine, per migliorare le prestazioni di rete, puoi ottenere una larghezza di banda in uscita massima più elevata attivando il networking Tier_1.

Altre considerazioni sul rendimento

Quando crei l'architettura per il tuo carico di lavoro, considera le best practice e i suggerimenti generali forniti in Google Cloud Well-Architected Framework: ottimizzazione del rendimento.

Passaggi successivi

Scopri di più sui prodotti Google Cloud utilizzati in questa architettura di riferimento:
- Panoramica di Cloud Load Balancing
- Gruppi di istanze
Inizia a eseguire la migrazione dei carichi di lavoro a Google Cloud.
Esplora e valuta gli archetipi di deployment che puoi scegliere per creare architetture per i tuoi carichi di lavoro cloud.
Esamina le opzioni di architettura per progettare un'infrastruttura affidabile per i tuoi carichi di lavoro in Google Cloud.
Per ulteriori architetture di riferimento, diagrammi e best practice, esplora il Cloud Architecture Center.

Collaboratori

Autori:

Kumar Dhanagopal | Sviluppatore di soluzioni cross-prodotto
Samantha He | Technical Writer

Altri collaboratori:

Ben Good | Solutions Architect
Carl Franklin | Director, PSO Enterprise Architecture
Daniel Lees | Cloud Security Architect
Gleb Otochkin | Cloud Advocate, Databases
Mark Schlagenhauf | Technical Writer, Networking
Pawel Wenda | Group Product Manager
Sean Derrington | Group Product Manager, Storage
Sekou Page | Product Manager in uscita
Simon Bennett | Group Product Manager
Steve McGhee | Reliability Advocate
Victor Moreno | Product Manager, Cloud Networking