Ativar o operador Ray no Google Kubernetes Engine (GKE)


Nesta página, mostramos como ativar o operador Ray para o Google Kubernetes Engine (GKE), para que seja possível usar as APIs do KubeRay ao escalonar e gerenciar os clusters do Ray. Para mais informações sobre o Ray e o KubeRay, consulte Visão geral do Ray no GKE.

Antes de começar

Antes de começar, veja se você realizou as seguintes tarefas:

  • Ative a API Google Kubernetes Engine.
  • Ativar a API Google Kubernetes Engine
  • Se você quiser usar a CLI do Google Cloud para essa tarefa, instale e, em seguida, inicialize a CLI gcloud. Se você instalou a gcloud CLI anteriormente, instale a versão mais recente executando gcloud components update.

Ativar o operador Ray para um cluster

É possível ativar o operador Ray em clusters novos ou atuais do Autopilot ou do GKE Standard usando a CLI do Google Cloud, o console do Google Cloud ou o Terraform.

Console

  1. Acesse a página Google Kubernetes Engine no console do Google Cloud.

    Acessar o Google Kubernetes Engine

  2. Clique em Criar e, na seção Standard ou Autopilot, clique em Configurar.

  3. Para o padrão, no painel de navegação, em Cluster, clique em Recursos. No Autopilot, clique em Configurações avançadas.

  4. Na seção IA e machine learning, marque a caixa de seleção Ativar o Ray Operator.

  5. Clique em Criar.

gcloud

Crie um cluster usando a opção --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Substitua:

  • CLUSTER_NAME: o nome do novo cluster.
  • VERSION: a versão do GKE, que precisa ser 1.30.0-gke.1747000 ou mais recente. Também é possível usar a opção --release-channel para selecionar um canal de lançamento. O canal de lançamento precisa ter como versão padrão a 1.30.0-gke.1747000 ou uma versão mais recente.

É possível ativar o operador Ray em um cluster atual usando o comando gcloud container clusters update com a opção --update-addons=RayOperator=ENABLED.

Terraform

O exemplo do Terraform a seguir cria e configura um cluster padrão:

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Para saber mais como usar o Terraform, consulte o Suporte do Terraform para GKE.

Controle de versões

O operador do Ray está disponível nas seguintes versões secundárias do GKE com uma versão correspondente do KubeRay:

Versão secundária do GKE Versão do KubeRay
1.31 v1.2
1,30 v1.1
1,29 v1.1

Verificar se o operador Ray está ativado

É possível verificar se o operador Ray está ativado em um cluster do Autopilot ou do GKE Standard usando a gcloud CLI ou o console do Google Cloud.

Console

  1. Acesse a página Google Kubernetes Engine no console do Google Cloud.

    Acessar o Google Kubernetes Engine

  2. Na lista de clusters, clique no nome do cluster que você quer verificar.

  3. Na seção Recursos, confirme se a caixa de seleção Ray Operator está selecionada.

gcloud

Descreva seu cluster:

gcloud container clusters describe CLUSTER_NAME

Substitua CLUSTER_NAME pelo nome do cluster.

A saída será assim:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Essa saída indica que o operador Ray está ativado para o cluster.

A seguir