Configurazione di rete di Serverless per Apache Spark

Questo documento descrive i requisiti necessari per la configurazione di rete di Serverless per Apache Spark. Google Cloud

Requisiti delle subnet Virtual Private Cloud

Questo documento illustra i requisiti di rete Virtual Private Cloud per i workload batch e le sessioni interattive diGoogle Cloud Serverless per Apache Spark.

Accesso privato Google

I workload batch e le sessioni interattive di Serverless per Apache Spark vengono eseguiti su VM solo con indirizzi IP interni e su una subnet regionale con l'accesso privato Google (PGA) abilitato automaticamente sulla subnet.

Se non specifichi una subnet, Serverless per Apache Spark seleziona la subnet default nella regione del carico di lavoro batch o della sessione come subnet per un carico di lavoro batch o una sessione.

Se il tuo workload richiede l'accesso a una rete esterna o a internet, ad esempio per scaricare risorse come modelli ML da PyTorch Hub o Hugging Face, puoi configurare Cloud NAT per consentire il traffico in uscita utilizzando IP interni sulla tua rete VPC.

Apri la connettività della subnet

La subnet VPC per la regione selezionata per il workload batch o la sessione interattiva di Serverless per Apache Spark deve consentire la comunicazione interna della subnet su tutte le porte tra le istanze VM.

Il seguente comando Google Cloud CLI collega un firewall di rete a una subnet che consente le comunicazioni in entrata interne tra le VM utilizzando tutti i protocolli su tutte le porte:

gcloud compute firewall-rules create allow-internal-ingress \
    --network=NETWORK_NAME \
    --source-ranges=SUBNET_RANGES \
    --destination-ranges=SUBNET_RANGES \
    --direction=ingress \
    --action=allow \
    --rules=all

Note:

  • SUBNET_RANGES: Vedi Consenti connessioni in entrata interne tra le VM. La rete VPC default in un progetto con la regola firewall default-allow-internal, che consente la comunicazione in entrata su tutte le porte (tcp:0-65535, udp:0-65535 e icmp protocols:ports), soddisfa il requisito di connettività della subnet aperta. Tuttavia, questa regola consente anche l'accesso in entrata da qualsiasi istanza VM sulla rete.

Serverless per Apache Spark e reti VPC-SC

Con i Controlli di servizio VPC, gli amministratori di rete possono definire un perimetro di sicurezza intorno alle risorse dei servizi gestiti da Google per controllare le comunicazioni con quei servizi.

Tieni presente le seguenti strategie quando utilizzi reti VPC-SC con Serverless per Apache Spark:

Per maggiori informazioni, vedi Controlli di servizio VPC - Serverless per Apache Spark.