Criar e executar um job que usa volumes de armazenamento

Neste documento, explicamos como criar e executar um job em lote que usa um ou mais volumes de armazenamento externo. As opções de armazenamento externo incluem novos disco permanente, novos SSDs locais, buckets atuais do Cloud Storage e um sistema de arquivos de rede (NFS, na sigla em inglês) atual, como um compartilhamento de arquivos do Filestore.

Independentemente de você adicionar volumes de armazenamento externo, A VM do Compute Engine para um job tem um disco de inicialização, que fornece armazenamento para a imagem do sistema operacional (SO) e as instruções do job. Para informações sobre como configurar o disco de inicialização para um job, consulte Visão geral do ambiente do SO da VM.

Antes de começar

Criar um job que use volumes de armazenamento

Opcionalmente, um trabalho pode usar um ou mais de cada um dos seguintes tipos de volumes de armazenamento externo. Para mais informações sobre todos os tipos de volumes de armazenamento e as as diferenças e restrições de cada um, consulte a documentação Opções de armazenamento de VMs do Compute Engine.

Para permitir que um job use cada volume de armazenamento, inclua-o na definição do job e especificar caminho de montagem (mountPath) nos arquivos executáveis. Para aprender a criar um job que use volumes de armazenamento, consulte uma ou mais das seguintes seções:

Usar um disco permanente

Um job que usa discos permanentes tem as seguintes restrições:

  • Todos os discos permanentes: revise as restrições para todos os discos permanentes.

  • Discos permanentes novos versus atuais: cada disco permanente em um job pode ser novos (definidos e criados com o trabalho) ou existentes (já criados no projeto e especificados no job). Para usar um disco permanente, ela precisa ser formatado e montado no do seu job, que precisam estar no mesmo local que o disco permanente. monta em lote todos os discos permanentes que você incluir em um job e formata todos os novos discos permanentes, mas é necessário formatar e desconectar os discos permanentes que você quer usar pelo job.

    As opções de local compatíveis, opções de formato, e opções de montagem variam entre discos permanentes novos e atuais, conforme descrito nas tabela:

    Novos discos permanentes Discos permanentes atuais
    Opções de formatação

    O disco permanente é formatado automaticamente com um Sistema de arquivos ext4:

    Você precisa formatar o disco permanente usar uma Sistema de arquivos ext4 antes de usá-lo em um trabalho.

    Opções de ativação

    Todas as opções são aceitas.

    Todas as opções, exceto gravação, são aceitas. Isso se deve à restrições de modo de vários gravadores.

    Você deve desanexar o disco permanente de qualquer VM a que ele está anexado antes de usá-lo para um job.

    Opções de local

    Só é possível criar discos permanentes zonais.

    É possível selecionar qualquer local para o job. A constante são criados na zona em que o projeto é executado.

    É possível selecionar discos permanentes zonais e regionais.


    Você precisa definir o local da tarefa (ou, se especificado, apenas o locais permitidos) a apenas locais que contêm todos os valores-chave persistentes os discos rígidos. Por exemplo, para um disco permanente zonal, O local precisa ser a zona do disco. para um disco permanente regional, o local do job precisa ser a região do disco ou, se especificando zonas, uma ou ambas as zonas o disco permanente regional está localizado.

  • Modelos de instância: se você quiser usar um modelo de instância de VM ao criar este job, você precisa anexar disco permanente para este job na instância modelo. Caso contrário, se não quiser usar um modelo de instância, você precisará anexar os disco permanente diretamente na definição do job.

É possível criar um job que usa um disco permanente com o console do Google Cloud, CLI gcloud, API Batch Go, Java, Node.js, Python ou C++.

Console

Usando o console do Google Cloud, o exemplo a seguir cria um job que executa um script para ler um arquivo de um disco permanente zonal atual que está localizado na zona us-central1-a. O script de exemplo pressupõe que o job tem um disco permanente zonal que contém um arquivo de texto chamado example.txt no diretório raiz.

Opcional: criar um exemplo de disco permanente zonal

Se você quiser criar um disco permanente zonal que possa ser usado executar o script de exemplo, faça o seguinte antes de criar o job:

  1. Anexe um novo permanente em branco chamado example-disk a uma VM do Linux no na zona us-central1-a e executar comandos na VM para formatar e ativar no disco. Para instruções, consulte Adicione um disco permanente à sua VM.

    Ainda não se desconecte da VM.

  2. Para criar example.txt no disco permanente, execute o seguinte na VM:

    1. Para mudar o diretório de trabalho atual para o diretório raiz do disco permanente, digite o seguinte comando:

      cd VM_MOUNT_PATH
      

      Substitua VM_MOUNT_PATH pelo caminho o diretório em que o disco permanente foi ativado na VM na etapa anterior, por exemplo, /mnt/disks/example-disk.

    2. Pressione Enter.

    3. Para criar e definir um arquivo chamado example.txt, Digite o seguinte comando:

      cat > example.txt
      
    4. Pressione Enter.

    5. Digite o conteúdo do arquivo. Por exemplo, digite Hello world!.

    6. Para salvar o arquivo, pressione Ctrl+D (ou Command+D no macOS).

    Quando terminar, desconecte-se da VM.

  3. Remover o disco permanente da VM.

Criar um job que use o disco permanente zonal atual

Para criar um job que use discos permanentes zonais existentes com o Console do Google Cloud, faça o seguinte:

  1. No console do Google Cloud, acesse a página Lista de jobs.

    Acessar a lista de jobs

  2. Clique em Criar. O A página Criar job em lote é aberta. No painel esquerdo, A página Detalhes do job está selecionada.

  3. Configure a página Detalhes do job:

    1. Opcional: no campo Nome do job, personalize o nome do job.

      Por exemplo, insira example-disk-job.

    2. Configure a seção Task details:

      1. Na janela New runnable, adicione pelo menos um script ou contêiner para o job ser executado.

        Por exemplo, para executar um script que imprima o conteúdo de um arquivo chamada example.txt e localizada no diretório raiz. do disco permanente que o job usa, faça o seguinte:

        1. Marque a caixa de seleção Script. Uma caixa de texto será exibida.

        2. Na caixa de texto, insira o seguinte script:

          echo "Here is the content of the example.txt file in the persistent disk."
          cat MOUNT_PATH/example.txt
          

          Substitua MOUNT_PATH pelo caminho em que você planeja montar o disco permanente nas VMs para este job, por exemplo, /mnt/disks/example-disk.

        3. Clique em Concluído.

      2. No campo Contagem de tarefas, digite o número de tarefas de para esse trabalho.

        Por exemplo, digite 1 (padrão).

      3. No campo Paralelismo, insira o número de tarefas a serem em execução simultânea.

        Por exemplo, digite 1 (padrão).

  4. Configure a página Especificações de recursos:

    1. No painel à esquerda, clique em Especificações de recursos. A página Especificações de recursos será aberta.

    2. Selecione o local para o job. Para usar um disco permanente zonal atual, as VMs de um job precisam na mesma zona.

      1. No campo Região, selecione uma região.

        Por exemplo, para usar o exemplo de disco permanente zonal, Selecione us-central1 (Iowa) (padrão).

      2. No campo Zona, selecione uma zona.

        Por exemplo, selecione us-central1-a (Iowa).

  5. Defina a página Configurações adicionais:

    1. No painel esquerdo, clique em Configurações adicionais. A página Configurações adicionais é aberta.

    2. Para cada disco permanente zonal atual que você quer ativar este job, faça o seguinte:

      1. Na seção Volume de armazenamento, clique em Adicionar novo volume. A janela Novo volume será exibida.

      2. Na janela Novo volume, faça o seguinte:

        1. Na seção Tipo de volume, selecione Disco permanente (padrão).

        2. Na lista Disco, selecione um o disco permanente zonal atual que você quer ativar para esse trabalho. O disco precisa estar no mesmo zona desse job.

          Por exemplo, selecione o disco permanente zonal atual que você preparou, localizada na seção us-central1-a e contém o arquivo example.txt.

        3. Opcional: se você quiser renomear o disco permanente zonal, faça o seguinte:

          1. Selecione Personalizar o nome do dispositivo.

          2. No campo Nome do dispositivo, digite o novo nome do seu disco.

        4. No campo Caminho de montagem, insira o valor correspondente. (MOUNT_PATH) para isso disco permanente:

          Por exemplo, digite o seguinte:

          /mnt/disks/EXISTING_PERSISTENT_DISK_NAME
          

          Substituir EXISTING_PERSISTENT_DISK_NAME pelo nome do disco. Se você renomeou o zonal, use o novo nome.

          Por exemplo, substitua EXISTING_PERSISTENT_DISK_NAME com example-disk.

        5. Clique em Concluído.

  6. Opcional: configure o outras áreas para a vaga.

  7. Opcional: para revisar a configuração do job, no painel esquerdo, Clique em Visualizar.

  8. Clique em Criar.

A página Detalhes do job exibe o job que você criou.

gcloud

Usando a CLI gcloud, o exemplo a seguir cria um job que anexa e monta um disco permanente existente e um novo disco permanente. O job tem três tarefas, cada uma executando um script para criar um arquivo no disco permanente chamado output_task_TASK_INDEX.txt em que TASK_INDEX é o índice de cada tarefa: 0, 1, e 2:

Para criar um job que use discos permanentes com o CLI gcloud, use o comando gcloud batch jobs submit. No arquivo de configuração JSON do job, especifique os discos permanentes no instances e ative o disco permanente no campo volumes.

  1. Crie um arquivo JSON.

    • Se você não estiver usando um modelo de instância para este job, crie um arquivo JSON com o seguinte conteúdo:

      {
          "allocationPolicy": {
              "instances": [
                  {
                      "policy": {
                          "disks": [
                              {
                                  "deviceName": "EXISTING_PERSISTENT_DISK_NAME",
                                  "existingDisk": "projects/PROJECT_ID/EXISTING_PERSISTENT_DISK_LOCATION/disks/EXISTING_PERSISTENT_DISK_NAME"
                              },
                              {
                                  "newDisk": {
                                      "sizeGb": NEW_PERSISTENT_DISK_SIZE,
                                      "type": "NEW_PERSISTENT_DISK_TYPE"
                                  },
                                  "deviceName": "NEW_PERSISTENT_DISK_NAME"
                              }
                          ]
                      }
                  }
              ],
              "location": {
                  "allowedLocations": [
                      "EXISTING_PERSISTENT_DISK_LOCATION"
                  ]
              }
          },
          "taskGroups": [
              {
                  "taskSpec": {
                      "runnables": [
                          {
                              "script": {
                                  "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/NEW_PERSISTENT_DISK_NAME/output_task_${BATCH_TASK_INDEX}.txt"
                              }
                          }
                      ],
                      "volumes": [
                          {
                              "deviceName": "NEW_PERSISTENT_DISK_NAME",
                              "mountPath": "/mnt/disks/NEW_PERSISTENT_DISK_NAME",
                              "mountOptions": "rw,async"
                          },
                          {
      
                              "deviceName": "EXISTING_PERSISTENT_DISK_NAME",
                              "mountPath": "/mnt/disks/EXISTING_PERSISTENT_DISK_NAME"
                          }
                      ]
                  },
                  "taskCount":3
              }
          ],
          "logsPolicy": {
              "destination": "CLOUD_LOGGING"
          }
      }
      

      Substitua:

      • PROJECT_ID: o ID do projeto do seu projeto.
      • EXISTING_PERSISTENT_DISK_NAME: o nome. de um disco permanente atual.
      • EXISTING_PERSISTENT_DISK_LOCATION: o local de um disco permanente atual. Para cada zona existente disco permanente, o local do job precisa ser a zona do disco. para cada disco permanente regional atual, o local do job precisa a região do disco ou, se especificar zonas, um ou as duas zonas específicas em que o disco permanente regional está localizado. Se você não especificar nenhuma permissão é possível selecionar qualquer local. Saiba mais sobre o campo allowedLocations.
      • NEW_PERSISTENT_DISK_SIZE: o tamanho do um novo disco permanente em GB. O tamanhos permitidos dependem do tipo de disco permanente, mas o mínimo geralmente 10 GB (10) e o máximo geralmente é 64 TB (64000).
      • NEW_PERSISTENT_DISK_TYPE: o tipo de disco do novo disco permanente: pd-standard, pd-balanced, pd-ssd ou pd-extreme. O tipo de disco padrão para dispositivos que não sejam de inicialização discos permanentes é pd-standard.
      • NEW_PERSISTENT_DISK_NAME: o nome. do novo disco permanente.
    • Se você for usando um modelo de instância de VM para este job, crie um arquivo JSON como mostrado anteriormente, mas substitua o Campo instances pelo seguinte:

      "instances": [
          {
              "instanceTemplate": "INSTANCE_TEMPLATE_NAME"
          }
      ],
      

      em que INSTANCE_TEMPLATE_NAME é o nome do modelo de instância deste job. Para um trabalho que usa os discos permanentes padrão, esse modelo precisa definir e anexar os os discos permanentes que você quer que o job use. Para este exemplo, o modelo precisa definir e anexar um novo disco permanente chamado NEW_PERSISTENT_DISK_NAME e e anexar um disco permanente existente chamado EXISTING_PERSISTENT_DISK_NAME.

  2. Execute este comando:

    gcloud batch jobs submit JOB_NAME \
      --location LOCATION \
      --config JSON_CONFIGURATION_FILE
    

    Substitua:

    • JOB_NAME: o nome do job.

    • LOCATION: o local do trabalho.

    • JSON_CONFIGURATION_FILE: o caminho para um JSON. com os detalhes de configuração do job.

API

Usando a API Batch, o exemplo a seguir cria um job que anexa e monta um disco permanente existente e um novo disco. O job tem três tarefas, cada uma executando um script para criar um arquivo no um disco permanente chamado output_task_TASK_INDEX.txt em que TASK_INDEX é o índice de cada tarefa: 0, 1 e 2.

Para criar um job que use discos permanentes com o Batch API, use o método jobs.create. Na solicitação, especifique os discos permanentes nas instances e ative o disco permanente no campo volumes.

  • Se você não estiver usando um modelo de instância para este job, faça o seguinte: solicitação:

    POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
    
    {
        "allocationPolicy": {
            "instances": [
                {
                    "policy": {
                        "disks": [
                            {
                                "deviceName": "EXISTING_PERSISTENT_DISK_NAME",
                                "existingDisk": "projects/PROJECT_ID/EXISTING_PERSISTENT_DISK_LOCATION/disks/EXISTING_PERSISTENT_DISK_NAME"
                            },
                            {
                                "newDisk": {
                                    "sizeGb": NEW_PERSISTENT_DISK_SIZE,
                                    "type": "NEW_PERSISTENT_DISK_TYPE"
                                },
                                "deviceName": "NEW_PERSISTENT_DISK_NAME"
                            }
                        ]
                    }
                }
            ],
            "location": {
                "allowedLocations": [
                    "EXISTING_PERSISTENT_DISK_LOCATION"
                ]
            }
        },
        "taskGroups": [
            {
                "taskSpec": {
                    "runnables": [
                        {
                            "script": {
                                "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/NEW_PERSISTENT_DISK_NAME/output_task_${BATCH_TASK_INDEX}.txt"
                            }
                        }
                    ],
                    "volumes": [
                        {
                            "deviceName": "NEW_PERSISTENT_DISK_NAME",
                            "mountPath": "/mnt/disks/NEW_PERSISTENT_DISK_NAME",
                            "mountOptions": "rw,async"
                        },
                        {
    
                            "deviceName": "EXISTING_PERSISTENT_DISK_NAME",
                            "mountPath": "/mnt/disks/EXISTING_PERSISTENT_DISK_NAME"
                        }
                    ]
                },
                "taskCount":3
            }
        ],
        "logsPolicy": {
            "destination": "CLOUD_LOGGING"
        }
    }
    

    Substitua:

    • PROJECT_ID: o ID do projeto do seu projeto.
    • LOCATION: o local do trabalho.
    • JOB_NAME: o nome do job.
    • EXISTING_PERSISTENT_DISK_NAME: o nome. de um disco permanente atual.
    • EXISTING_PERSISTENT_DISK_LOCATION: o local de um disco permanente atual. Para cada zona existente disco permanente, o local do job precisa ser a zona do disco. para cada disco permanente regional atual, o local do job precisa a região do disco ou, se especificar zonas, um ou as duas zonas específicas em que o disco permanente regional está localizado. Se você não especificar nenhuma permissão é possível selecionar qualquer local. Saiba mais sobre o campo allowedLocations.
    • NEW_PERSISTENT_DISK_SIZE: o tamanho do um novo disco permanente em GB. O tamanhos permitidos dependem do tipo de disco permanente, mas o mínimo geralmente 10 GB (10) e o máximo geralmente é 64 TB (64000).
    • NEW_PERSISTENT_DISK_TYPE: o tipo de disco do novo disco permanente: pd-standard, pd-balanced, pd-ssd ou pd-extreme. O tipo de disco padrão para dispositivos que não sejam de inicialização discos permanentes é pd-standard.
    • NEW_PERSISTENT_DISK_NAME: o nome. do novo disco permanente.
  • Se você for usando um modelo de instância de VM para este job, crie um arquivo JSON como mostrado anteriormente, mas substitua o Campo instances pelo seguinte:

    "instances": [
        {
            "instanceTemplate": "INSTANCE_TEMPLATE_NAME"
        }
    ],
    ...
    

    Em que INSTANCE_TEMPLATE_NAME é o nome do modelo de instância deste job. Para um trabalho que usa os discos permanentes padrão, esse modelo precisa definir e anexar os os discos permanentes que você quer que o job use. Para este exemplo, o modelo precisa definir e anexar um novo disco permanente chamado NEW_PERSISTENT_DISK_NAME e e anexar um disco permanente existente chamado EXISTING_PERSISTENT_DISK_NAME.

Go

Para criar um job em lote que use um job novo ou atual os discos permanentes usando Bibliotecas de cliente do Cloud para Go, use a Função CreateJob e inclua o seguinte:

Para ver um exemplo de código de um caso de uso semelhante, consulte Usar um bucket do Cloud Storage.

Java

Para criar um job em lote que use um job novo ou atual os discos permanentes usando Bibliotecas de cliente do Cloud para Java, use a CreateJobRequest turma e inclua o seguinte:

Para ver um exemplo de código de um caso de uso semelhante, consulte Usar um bucket do Cloud Storage.

Node.js

Para criar um job em lote que use um job novo ou atual os discos permanentes usando Bibliotecas de cliente do Cloud para Node.js, use a Método createJob e inclua o seguinte:

Para ver um exemplo de código de um caso de uso semelhante, consulte Usar um bucket do Cloud Storage.

Python

Para criar um job em lote que use um job novo ou atual os discos permanentes usando Bibliotecas de cliente do Cloud para Python, use a Função CreateJob e inclua o seguinte:

  • Para anexar discos permanentes às VMs para um job, inclua uma das seguintes opções:
  • Para montar os discos permanentes no job, use o Classe Volume com o atributo device_name e mount_path. Para novos discos permanentes, use também o mount_options para ativar a gravação.

Para ver um exemplo de código de um caso de uso semelhante, consulte Usar um bucket do Cloud Storage.

C++

Para criar um job em lote que use um job novo ou atual os discos permanentes usando Bibliotecas de cliente do Cloud para C++, use a Função CreateJob e inclua o seguinte:

  • Para anexar discos permanentes às VMs para um job, inclua uma das seguintes opções:
    • Se você não estiver usando um modelo de instância de VM para este job, use o método set_remote_path.
    • Se você estiver usando um modelo de instância de VM para este job, use o set_instance_template.
  • Para ativar os discos permanentes no job, use o campo volumes com os campos deviceName e mountPath. Para novos discos permanentes, use o campo mountOptions para ativar a gravação.

Para ver um exemplo de código de um caso de uso semelhante, consulte Usar um bucket do Cloud Storage.

Usar um SSD local

Um job que usa SSDs locais tem as seguintes restrições:

É possível criar um job que use um SSD local com o CLI gcloud ou API Batch. O exemplo a seguir descreve como criar uma tarefa que cria, anexa e que monta um SSD local. O trabalho também tem três tarefas executar um script para criar um arquivo no SSD local chamado output_task_TASK_INDEX.txt em que TASK_INDEX é o índice de cada tarefa: 0, 1 e 2.

gcloud

Para criar um job que usa SSDs locais com o CLI gcloud, use o comando gcloud batch jobs submit. No arquivo de configuração JSON do job, crie e anexe os SSDs locais na instances e ative os SSDs locais no campo volumes.

  1. Crie um arquivo JSON.

    • Se você não estiver usando um modelo de instância para este job, crie um arquivo JSON com o seguinte conteúdo:

      {
          "allocationPolicy": {
              "instances": [
                  {
                      "policy": {
                          "machineType": MACHINE_TYPE,
                          "disks": [
                              {
                                  "newDisk": {
                                      "sizeGb": LOCAL_SSD_SIZE,
                                      "type": "local-ssd"
                                  },
                                  "deviceName": "LOCAL_SSD_NAME"
                              }
                          ]
                      }
                  }
              ]
          },
          "taskGroups": [
              {
                  "taskSpec": {
                      "runnables": [
                          {
                              "script": {
                                  "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/LOCAL_SSD_NAME/output_task_${BATCH_TASK_INDEX}.txt"
                              }
                          }
                      ],
                      "volumes": [
                          {
                              "deviceName": "LOCAL_SSD_NAME",
                              "mountPath": "/mnt/disks/LOCAL_SSD_NAME",
                              "mountOptions": "rw,async"
                          }
                      ]
                  },
                  "taskCount":3
              }
          ],
          "logsPolicy": {
              "destination": "CLOUD_LOGGING"
          }
      }
      

      Substitua:

      • MACHINE_TYPE: o tipo de máquina virtual, que pode ser predefinido ou personalizado, das VMs do job. O número permitido de SSDs locais depende do tipo de máquina das VMs do job.
      • LOCAL_SSD_NAME: o nome. de um SSD local criado para o job.
      • LOCAL_SSD_SIZE: o tamanho do todos os SSDs locais em GB. Cada SSD local tem 375 GB, então esse valor precisa ser um múltiplo de 375 GB. Para Por exemplo, para dois SSDs locais, defina esse valor como 750 GB.
    • Se você for usando um modelo de instância de VM para este job, crie um arquivo JSON como mostrado anteriormente, mas substitua o Campo instances pelo seguinte:

      "instances": [
          {
              "instanceTemplate": "INSTANCE_TEMPLATE_NAME"
          }
      ],
      

      em que INSTANCE_TEMPLATE_NAME é o nome do modelo de instância deste job. Para um trabalho que usa SSDs locais, esse modelo de instância precisa definir e anexar os SSDs locais que você quer que o job use. Para este exemplo, o modelo precisa definir e anexar um SSD local chamado LOCAL_SSD_NAME:

  2. Execute este comando:

    gcloud batch jobs submit JOB_NAME \
      --location LOCATION \
      --config JSON_CONFIGURATION_FILE
    

    Substitua:

    • JOB_NAME: o nome do job.
    • LOCATION: o local do trabalho.
    • JSON_CONFIGURATION_FILE: o caminho para um JSON. com os detalhes de configuração do job.

API

Para criar um job que usa SSDs locais com o Batch API, use o método jobs.create. Na solicitação, crie e anexe os SSDs locais na instances e ative os SSDs locais no campo volumes.

  • Se você não estiver usando um modelo de instância para este job, faça o seguinte: solicitação:

    POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
    
    {
        "allocationPolicy": {
            "instances": [
                {
                    "policy": {
                        "machineType": MACHINE_TYPE,
                        "disks": [
                            {
                                "newDisk": {
                                    "sizeGb": LOCAL_SSD_SIZE,
                                    "type": "local-ssd"
                                },
                                "deviceName": "LOCAL_SSD_NAME"
                            }
                        ]
                    }
                }
            ]
        },
        "taskGroups": [
            {
                "taskSpec": {
                    "runnables": [
                        {
                            "script": {
                                "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/LOCAL_SSD_NAME/output_task_${BATCH_TASK_INDEX}.txt"
                            }
                        }
                    ],
                    "volumes": [
                        {
                            "deviceName": "LOCAL_SSD_NAME",
                            "mountPath": "/mnt/disks/LOCAL_SSD_NAME",
                            "mountOptions": "rw,async"
                        }
                    ]
                },
                "taskCount":3
            }
        ],
        "logsPolicy": {
            "destination": "CLOUD_LOGGING"
        }
    }
    

    Substitua:

    • PROJECT_ID: o ID do projeto do seu projeto.
    • LOCATION: o local do trabalho.
    • JOB_NAME: o nome do job.
    • MACHINE_TYPE: o tipo de máquina virtual, que pode ser predefinido ou personalizado, das VMs do job. O número permitido de SSDs locais depende do tipo de máquina das VMs do job.
    • LOCAL_SSD_NAME: o nome. de um SSD local criado para o job.
    • LOCAL_SSD_SIZE: o tamanho do todos os SSDs locais em GB. Cada SSD local tem 375 GB, então esse valor precisa ser um múltiplo de 375 GB. Para Por exemplo, para dois SSDs locais, defina esse valor como 750 GB.
  • Se você for usando um modelo de instância de VM para este job, crie um arquivo JSON como mostrado anteriormente, mas substitua o Campo instances pelo seguinte:

    "instances": [
        {
            "instanceTemplate": "INSTANCE_TEMPLATE_NAME"
        }
    ],
    ...
    

    Em que INSTANCE_TEMPLATE_NAME é o nome do modelo de instância deste job. Para um trabalho que usa SSDs locais, esse modelo de instância precisa definir e anexar os SSDs locais que você quer que o job use. Para este exemplo, o modelo deve definir e anexar um SSD local chamado LOCAL_SSD_NAME:

Usar um bucket do Cloud Storage

Para criar um job que use um bucket atual do Cloud Storage, Selecione um dos seguintes métodos:

  • Recomendado: ative um bucket diretamente nas VMs do job especificando o na definição do job, conforme mostrado nesta seção. Quando o job é executado, o bucket será montado automaticamente nas VMs para seu job usando Cloud Storage FUSE.
  • Crie um job com tarefas que acessam diretamente um bucket do Cloud Storage usando a ferramenta de linha de comando gsutil ou bibliotecas de cliente para a API Cloud Storage. Para saber como acessar um do bucket do Cloud Storage diretamente de uma VM, consulte documentação do Compute Engine para Como gravar e ler dados dos buckets do Cloud Storage.

Antes de criar um job que use um bucket, crie um bucket ou identifique um em um bucket que já existe. Para mais informações, consulte Crie buckets e Listar buckets.

É possível criar um job que usa um bucket do Cloud Storage com o console do Google Cloud, CLI gcloud, API Batch, Go, Java, Node.js, Python ou C++.

O exemplo a seguir descreve como criar um job que monta uma do bucket do Cloud Storage. O job também tem três tarefas que são executadas um script para criar um arquivo no bucket chamado output_task_TASK_INDEX.txt em que TASK_INDEX é o índice de cada tarefa: 0, 1 e 2.

Console

Para criar um job que usa um bucket do Cloud Storage com o Console do Google Cloud, faça o seguinte:

  1. No console do Google Cloud, acesse a página Lista de jobs.

    Acessar a lista de jobs

  2. Clique em Criar. O A página Criar job em lote é aberta. No painel esquerdo, A página Detalhes do job está selecionada.

  3. Configure a página Detalhes do job:

    1. Opcional: no campo Nome do job, personalize o nome do job.

      Por exemplo, insira example-bucket-job.

    2. Configure a seção Task details:

      1. Na janela New runnable, adicione pelo menos um script ou contêiner para o job ser executado.

        Por exemplo, faça o seguinte:

        1. Marque a caixa de seleção Script. Uma caixa de texto será exibida.

        2. Na caixa de texto, insira o seguinte script:

          echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt
          

          Substitua MOUNT_PATH pelo que os executáveis deste job usam para acessar um em um bucket atual do Cloud Storage. O caminho precisa começar com /mnt/disks/ seguido de um diretório ou caminho que que você escolher. Por exemplo, se você quiser representar esta bucket com um diretório chamado my-bucket, defina o caminho de montagem para /mnt/disks/my-bucket.

        3. Clique em Concluído.

      2. No campo Contagem de tarefas, digite o número de tarefas de para esse trabalho.

        Por exemplo, insira 3.

      3. No campo Paralelismo, insira o número de tarefas a serem em execução simultânea.

        Por exemplo, digite 1 (padrão).

  4. Defina a página Configurações adicionais:

    1. No painel esquerdo, clique em Configurações adicionais. A página Configurações adicionais é aberta.

    2. Para cada bucket do Cloud Storage em que você quer ativar este job, faça o seguinte:

      1. Na seção Volume de armazenamento, clique em Adicionar novo volume. A janela Novo volume será exibida.

      2. Na janela Novo volume, faça o seguinte:

        1. Na seção Tipo de volume, selecione Bucket do Cloud Storage.

        2. No campo Nome do bucket de armazenamento, insira o nome do um bucket atual.

          Por exemplo, insira o bucket que você especificou que o job pode ser executado.

        3. No campo Caminho de montagem, insira o caminho do bucket (MOUNT_PATH), que você especificado no executável.

        4. Clique em Concluído.

  5. Opcional: configure o outras áreas para a vaga.

  6. Opcional: para revisar a configuração do job, no painel esquerdo, Clique em Visualizar.

  7. Clique em Criar.

A página Detalhes do job exibe o job que você criou.

gcloud

Para criar um job que usa um bucket do Cloud Storage com o CLI gcloud, use o comando gcloud batch jobs submit. No arquivo de configuração JSON do job, ative o bucket volumes.

Por exemplo, para criar um job que gere arquivos para um Cloud Storage:

  1. Crie um arquivo JSON com o seguinte conteúdo:

    {
        "taskGroups": [
            {
                "taskSpec": {
                    "runnables": [
                        {
                            "script": {
                                "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
                            }
                        }
                    ],
                    "volumes": [
                        {
                            "gcs": {
                                "remotePath": "BUCKET_PATH"
                            },
                            "mountPath": "MOUNT_PATH"
                        }
                    ]
                },
                "taskCount": 3
            }
        ],
        "logsPolicy": {
            "destination": "CLOUD_LOGGING"
        }
    }
    

    Substitua:

    • BUCKET_PATH: o caminho do diretório do bucket que você quer que o job acesse, que precisa começar com o nome do do bucket. Por exemplo, para um bucket chamado BUCKET_NAME, o caminho BUCKET_NAME representa o diretório raiz. do bucket e o caminho BUCKET_NAME/subdirectory representa o subdiretório subdirectory.
    • MOUNT_PATH: o caminho de ativação em que o executáveis usam para acessar esse bucket. O caminho precisa começar com /mnt/disks/ seguido por um diretório ou caminho que você escolher. Para exemplo, se você quer representar esse bucket com um diretório chamado my-bucket, defina o caminho de montagem como /mnt/disks/my-bucket.
  2. Execute este comando:

    gcloud batch jobs submit JOB_NAME \
      --location LOCATION \
      --config JSON_CONFIGURATION_FILE
    

    Substitua:

    • JOB_NAME: o nome do job.
    • LOCATION: o local do trabalho.
    • JSON_CONFIGURATION_FILE: o caminho para um JSON. com os detalhes de configuração do job.

API

Para criar um job que usa um bucket do Cloud Storage com o Batch API, use o Método jobs.create e ativar o bucket no campo volumes.

POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME

{
    "taskGroups": [
        {
            "taskSpec": {
                "runnables": [
                    {
                        "script": {
                            "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
                        }
                    }
                ],
                "volumes": [
                    {
                        "gcs": {
                            "remotePath": "BUCKET_PATH"
                        },
                        "mountPath": "MOUNT_PATH"
                    }
                ]
            },
            "taskCount": 3
        }
    ],
    "logsPolicy": {
            "destination": "CLOUD_LOGGING"
    }
}

Substitua:

  • PROJECT_ID: o ID do projeto do seu projeto.
  • LOCATION: o local do trabalho.
  • JOB_NAME: o nome do job.
  • BUCKET_PATH: o caminho do diretório do bucket que você quer que o job acesse, que precisa começar com o nome do bucket. Por exemplo, para um bucket chamado BUCKET_NAME, o caminho BUCKET_NAME representa a raiz. do bucket e o caminho BUCKET_NAME/subdirectory representa o subdiretório subdirectory.
  • MOUNT_PATH: o caminho de ativação em que o executáveis usam para acessar esse bucket. O caminho precisa começar com /mnt/disks/ seguido por um diretório ou caminho que você escolher. Por exemplo, se você quer representar esse bucket com uma diretório chamado my-bucket, defina o caminho de montagem como /mnt/disks/my-bucket.

Go

Go

Para mais informações, consulte a API Batch Go documentação de referência.

Para autenticar no Batch, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

import (
	"context"
	"fmt"
	"io"

	batch "cloud.google.com/go/batch/apiv1"
	batchpb "google.golang.org/genproto/googleapis/cloud/batch/v1"
	durationpb "google.golang.org/protobuf/types/known/durationpb"
)

// Creates and runs a job that executes the specified script
func createScriptJobWithBucket(w io.Writer, projectID, region, jobName, bucketName string) error {
	// projectID := "your_project_id"
	// region := "us-central1"
	// jobName := "some-job"
	// jobName := "some-bucket"

	ctx := context.Background()
	batchClient, err := batch.NewClient(ctx)
	if err != nil {
		return fmt.Errorf("NewClient: %w", err)
	}
	defer batchClient.Close()

	// Define what will be done as part of the job.
	command := &batchpb.Runnable_Script_Text{
		Text: "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/share/output_task_${BATCH_TASK_INDEX}.txt",
	}

	// Specify the Google Cloud Storage bucket to mount
	volume := &batchpb.Volume{
		Source: &batchpb.Volume_Gcs{
			Gcs: &batchpb.GCS{
				RemotePath: bucketName,
			},
		},
		MountPath:    "/mnt/share",
		MountOptions: []string{},
	}

	// We can specify what resources are requested by each task.
	resources := &batchpb.ComputeResource{
		// CpuMilli is milliseconds per cpu-second. This means the task requires 50% of a single CPUs.
		CpuMilli:  500,
		MemoryMib: 16,
	}

	taskSpec := &batchpb.TaskSpec{
		Runnables: []*batchpb.Runnable{{
			Executable: &batchpb.Runnable_Script_{
				Script: &batchpb.Runnable_Script{Command: command},
			},
		}},
		ComputeResource: resources,
		MaxRunDuration: &durationpb.Duration{
			Seconds: 3600,
		},
		MaxRetryCount: 2,
		Volumes:       []*batchpb.Volume{volume},
	}

	// Tasks are grouped inside a job using TaskGroups.
	taskGroups := []*batchpb.TaskGroup{
		{
			TaskCount: 4,
			TaskSpec:  taskSpec,
		},
	}

	// Policies are used to define on what kind of virtual machines the tasks will run on.
	// In this case, we tell the system to use "e2-standard-4" machine type.
	// Read more about machine types here: https://cloud.google.com/compute/docs/machine-types
	allocationPolicy := &batchpb.AllocationPolicy{
		Instances: []*batchpb.AllocationPolicy_InstancePolicyOrTemplate{{
			PolicyTemplate: &batchpb.AllocationPolicy_InstancePolicyOrTemplate_Policy{
				Policy: &batchpb.AllocationPolicy_InstancePolicy{
					MachineType: "e2-standard-4",
				},
			},
		}},
	}

	// We use Cloud Logging as it's an out of the box available option
	logsPolicy := &batchpb.LogsPolicy{
		Destination: batchpb.LogsPolicy_CLOUD_LOGGING,
	}

	jobLabels := map[string]string{"env": "testing", "type": "script"}

	// The job's parent is the region in which the job will run
	parent := fmt.Sprintf("projects/%s/locations/%s", projectID, region)

	job := batchpb.Job{
		TaskGroups:       taskGroups,
		AllocationPolicy: allocationPolicy,
		Labels:           jobLabels,
		LogsPolicy:       logsPolicy,
	}

	req := &batchpb.CreateJobRequest{
		Parent: parent,
		JobId:  jobName,
		Job:    &job,
	}

	created_job, err := batchClient.CreateJob(ctx, req)
	if err != nil {
		return fmt.Errorf("unable to create job: %w", err)
	}

	fmt.Fprintf(w, "Job created: %v\n", created_job)

	return nil
}

Java

Java

Para mais informações, consulte a API Batch Java documentação de referência.

Para autenticar no Batch, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

import com.google.cloud.batch.v1.AllocationPolicy;
import com.google.cloud.batch.v1.AllocationPolicy.InstancePolicy;
import com.google.cloud.batch.v1.AllocationPolicy.InstancePolicyOrTemplate;
import com.google.cloud.batch.v1.BatchServiceClient;
import com.google.cloud.batch.v1.ComputeResource;
import com.google.cloud.batch.v1.CreateJobRequest;
import com.google.cloud.batch.v1.GCS;
import com.google.cloud.batch.v1.Job;
import com.google.cloud.batch.v1.LogsPolicy;
import com.google.cloud.batch.v1.LogsPolicy.Destination;
import com.google.cloud.batch.v1.Runnable;
import com.google.cloud.batch.v1.Runnable.Script;
import com.google.cloud.batch.v1.TaskGroup;
import com.google.cloud.batch.v1.TaskSpec;
import com.google.cloud.batch.v1.Volume;
import com.google.protobuf.Duration;
import java.io.IOException;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.TimeoutException;

public class CreateWithMountedBucket {

  public static void main(String[] args)
      throws IOException, ExecutionException, InterruptedException, TimeoutException {
    // TODO(developer): Replace these variables before running the sample.
    // Project ID or project number of the Cloud project you want to use.
    String projectId = "YOUR_PROJECT_ID";

    // Name of the region you want to use to run the job. Regions that are
    // available for Batch are listed on: https://cloud.google.com/batch/docs/get-started#locations
    String region = "europe-central2";

    // The name of the job that will be created.
    // It needs to be unique for each project and region pair.
    String jobName = "JOB_NAME";

    // Name of the bucket to be mounted for your Job.
    String bucketName = "BUCKET_NAME";

    createScriptJobWithBucket(projectId, region, jobName, bucketName);
  }

  // This method shows how to create a sample Batch Job that will run
  // a simple command on Cloud Compute instances.
  public static void createScriptJobWithBucket(String projectId, String region, String jobName,
      String bucketName)
      throws IOException, ExecutionException, InterruptedException, TimeoutException {
    // Initialize client that will be used to send requests. This client only needs to be created
    // once, and can be reused for multiple requests. After completing all of your requests, call
    // the `batchServiceClient.close()` method on the client to safely
    // clean up any remaining background resources.
    try (BatchServiceClient batchServiceClient = BatchServiceClient.create()) {

      // Define what will be done as part of the job.
      Runnable runnable =
          Runnable.newBuilder()
              .setScript(
                  Script.newBuilder()
                      .setText(
                          "echo Hello world from task ${BATCH_TASK_INDEX}. >> "
                              + "/mnt/share/output_task_${BATCH_TASK_INDEX}.txt")
                      // You can also run a script from a file. Just remember, that needs to be a
                      // script that's already on the VM that will be running the job.
                      // Using setText() and setPath() is mutually exclusive.
                      // .setPath("/tmp/test.sh")
                      .build())
              .build();

      Volume volume = Volume.newBuilder()
          .setGcs(GCS.newBuilder()
              .setRemotePath(bucketName)
              .build())
          .setMountPath("/mnt/share")
          .build();

      // We can specify what resources are requested by each task.
      ComputeResource computeResource =
          ComputeResource.newBuilder()
              // In milliseconds per cpu-second. This means the task requires 50% of a single CPUs.
              .setCpuMilli(500)
              // In MiB.
              .setMemoryMib(16)
              .build();

      TaskSpec task =
          TaskSpec.newBuilder()
              // Jobs can be divided into tasks. In this case, we have only one task.
              .addRunnables(runnable)
              .addVolumes(volume)
              .setComputeResource(computeResource)
              .setMaxRetryCount(2)
              .setMaxRunDuration(Duration.newBuilder().setSeconds(3600).build())
              .build();

      // Tasks are grouped inside a job using TaskGroups.
      // Currently, it's possible to have only one task group.
      TaskGroup taskGroup = TaskGroup.newBuilder().setTaskCount(4).setTaskSpec(task).build();

      // Policies are used to define on what kind of virtual machines the tasks will run on.
      // In this case, we tell the system to use "e2-standard-4" machine type.
      // Read more about machine types here: https://cloud.google.com/compute/docs/machine-types
      InstancePolicy instancePolicy =
          InstancePolicy.newBuilder().setMachineType("e2-standard-4").build();

      AllocationPolicy allocationPolicy =
          AllocationPolicy.newBuilder()
              .addInstances(InstancePolicyOrTemplate.newBuilder().setPolicy(instancePolicy).build())
              .build();

      Job job =
          Job.newBuilder()
              .addTaskGroups(taskGroup)
              .setAllocationPolicy(allocationPolicy)
              .putLabels("env", "testing")
              .putLabels("type", "script")
              .putLabels("mount", "bucket")
              // We use Cloud Logging as it's an out of the box available option.
              .setLogsPolicy(
                  LogsPolicy.newBuilder().setDestination(Destination.CLOUD_LOGGING).build())
              .build();

      CreateJobRequest createJobRequest =
          CreateJobRequest.newBuilder()
              // The job's parent is the region in which the job will run.
              .setParent(String.format("projects/%s/locations/%s", projectId, region))
              .setJob(job)
              .setJobId(jobName)
              .build();

      Job result =
          batchServiceClient
              .createJobCallable()
              .futureCall(createJobRequest)
              .get(5, TimeUnit.MINUTES);

      System.out.printf("Successfully created the job: %s", result.getName());
    }
  }
}

Node.js

Node.js

Para mais informações, consulte a API Batch Node.js documentação de referência.

Para autenticar no Batch, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

/**
 * TODO(developer): Uncomment and replace these variables before running the sample.
 */
// const projectId = 'YOUR_PROJECT_ID';
/**
 * The region you want to the job to run in. The regions that support Batch are listed here:
 * https://cloud.google.com/batch/docs/get-started#locations
 */
// const region = 'us-central-1';
/**
 * The name of the job that will be created.
 * It needs to be unique for each project and region pair.
 */
// const jobName = 'YOUR_JOB_NAME';
/**
 * The name of the bucket to be mounted.
 */
// const bucketName = 'YOUR_BUCKET_NAME';

// Imports the Batch library
const batchLib = require('@google-cloud/batch');
const batch = batchLib.protos.google.cloud.batch.v1;

// Instantiates a client
const batchClient = new batchLib.v1.BatchServiceClient();

// Define what will be done as part of the job.
const task = new batch.TaskSpec();
const runnable = new batch.Runnable();
runnable.script = new batch.Runnable.Script();
runnable.script.text =
  'echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/share/output_task_${BATCH_TASK_INDEX}.txt';
// You can also run a script from a file. Just remember, that needs to be a script that's
// already on the VM that will be running the job. Using runnable.script.text and runnable.script.path is mutually
// exclusive.
// runnable.script.path = '/tmp/test.sh'
task.runnables = [runnable];

const gcsBucket = new batch.GCS();
gcsBucket.remotePath = bucketName;
const gcsVolume = new batch.Volume();
gcsVolume.gcs = gcsBucket;
gcsVolume.mountPath = '/mnt/share';
task.volumes = [gcsVolume];

// We can specify what resources are requested by each task.
const resources = new batch.ComputeResource();
resources.cpuMilli = 2000; // in milliseconds per cpu-second. This means the task requires 2 whole CPUs.
resources.memoryMib = 16;
task.computeResource = resources;

task.maxRetryCount = 2;
task.maxRunDuration = {seconds: 3600};

// Tasks are grouped inside a job using TaskGroups.
const group = new batch.TaskGroup();
group.taskCount = 4;
group.taskSpec = task;

// Policies are used to define on what kind of virtual machines the tasks will run on.
// In this case, we tell the system to use "e2-standard-4" machine type.
// Read more about machine types here: https://cloud.google.com/compute/docs/machine-types
const allocationPolicy = new batch.AllocationPolicy();
const policy = new batch.AllocationPolicy.InstancePolicy();
policy.machineType = 'e2-standard-4';
const instances = new batch.AllocationPolicy.InstancePolicyOrTemplate();
instances.policy = policy;
allocationPolicy.instances = [instances];

const job = new batch.Job();
job.name = jobName;
job.taskGroups = [group];
job.allocationPolicy = allocationPolicy;
job.labels = {env: 'testing', type: 'script'};
// We use Cloud Logging as it's an option available out of the box
job.logsPolicy = new batch.LogsPolicy();
job.logsPolicy.destination = batch.LogsPolicy.Destination.CLOUD_LOGGING;

// The job's parent is the project and region in which the job will run
const parent = `projects/${projectId}/locations/${region}`;

async function callCreateJob() {
  // Construct request
  const request = {
    parent,
    jobId: jobName,
    job,
  };

  // Run request
  const response = await batchClient.createJob(request);
  console.log(response);
}

callCreateJob();

Python

Python

Para mais informações, consulte a API Batch Python documentação de referência.

Para autenticar no Batch, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

from google.cloud import batch_v1


def create_script_job_with_bucket(
    project_id: str, region: str, job_name: str, bucket_name: str
) -> batch_v1.Job:
    """
    This method shows how to create a sample Batch Job that will run
    a simple command on Cloud Compute instances.

    Args:
        project_id: project ID or project number of the Cloud project you want to use.
        region: name of the region you want to use to run the job. Regions that are
            available for Batch are listed on: https://cloud.google.com/batch/docs/get-started#locations
        job_name: the name of the job that will be created.
            It needs to be unique for each project and region pair.
        bucket_name: name of the bucket to be mounted for your Job.

    Returns:
        A job object representing the job created.
    """
    client = batch_v1.BatchServiceClient()

    # Define what will be done as part of the job.
    task = batch_v1.TaskSpec()
    runnable = batch_v1.Runnable()
    runnable.script = batch_v1.Runnable.Script()
    runnable.script.text = "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/share/output_task_${BATCH_TASK_INDEX}.txt"
    task.runnables = [runnable]

    gcs_bucket = batch_v1.GCS()
    gcs_bucket.remote_path = bucket_name
    gcs_volume = batch_v1.Volume()
    gcs_volume.gcs = gcs_bucket
    gcs_volume.mount_path = "/mnt/share"
    task.volumes = [gcs_volume]

    # We can specify what resources are requested by each task.
    resources = batch_v1.ComputeResource()
    resources.cpu_milli = 500  # in milliseconds per cpu-second. This means the task requires 50% of a single CPUs.
    resources.memory_mib = 16
    task.compute_resource = resources

    task.max_retry_count = 2
    task.max_run_duration = "3600s"

    # Tasks are grouped inside a job using TaskGroups.
    # Currently, it's possible to have only one task group.
    group = batch_v1.TaskGroup()
    group.task_count = 4
    group.task_spec = task

    # Policies are used to define on what kind of virtual machines the tasks will run on.
    # In this case, we tell the system to use "e2-standard-4" machine type.
    # Read more about machine types here: https://cloud.google.com/compute/docs/machine-types
    allocation_policy = batch_v1.AllocationPolicy()
    policy = batch_v1.AllocationPolicy.InstancePolicy()
    policy.machine_type = "e2-standard-4"
    instances = batch_v1.AllocationPolicy.InstancePolicyOrTemplate()
    instances.policy = policy
    allocation_policy.instances = [instances]

    job = batch_v1.Job()
    job.task_groups = [group]
    job.allocation_policy = allocation_policy
    job.labels = {"env": "testing", "type": "script", "mount": "bucket"}
    # We use Cloud Logging as it's an out of the box available option
    job.logs_policy = batch_v1.LogsPolicy()
    job.logs_policy.destination = batch_v1.LogsPolicy.Destination.CLOUD_LOGGING

    create_request = batch_v1.CreateJobRequest()
    create_request.job = job
    create_request.job_id = job_name
    # The job's parent is the region in which the job will run
    create_request.parent = f"projects/{project_id}/locations/{region}"

    return client.create_job(create_request)

C++

C++

Para mais informações, consulte a API Batch C++ documentação de referência.

Para autenticar no Batch, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

#include "google/cloud/batch/v1/batch_client.h"

  [](std::string const& project_id, std::string const& location_id,
     std::string const& job_id, std::string const& bucket_name) {
    // Initialize the request; start with the fields that depend on the sample
    // input.
    google::cloud::batch::v1::CreateJobRequest request;
    request.set_parent("projects/" + project_id + "/locations/" + location_id);
    request.set_job_id(job_id);
    // Most of the job description is fixed in this example; use a string to
    // initialize it, and then override the GCS remote path.
    auto constexpr kText = R"pb(
      task_groups {
        task_count: 4
        task_spec {
          compute_resource { cpu_milli: 500 memory_mib: 16 }
          max_retry_count: 2
          max_run_duration { seconds: 3600 }
          runnables {
            script {
              text: "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/share/output_task_${BATCH_TASK_INDEX}.txt"
            }
          }
          volumes { mount_path: "/mnt/share" }
        }
      }
      allocation_policy {
        instances {
          policy { machine_type: "e2-standard-4" provisioning_model: STANDARD }
        }
      }
      labels { key: "env" value: "testing" }
      labels { key: "type" value: "script" }
      logs_policy { destination: CLOUD_LOGGING }
    )pb";
    auto* job = request.mutable_job();
    if (!google::protobuf::TextFormat::ParseFromString(kText, job)) {
      throw std::runtime_error("Error parsing Job description");
    }
    job->mutable_task_groups(0)
        ->mutable_task_spec()
        ->mutable_volumes(0)
        ->mutable_gcs()
        ->set_remote_path(bucket_name);
    // Create a client and issue the request.
    auto client = google::cloud::batch_v1::BatchServiceClient(
        google::cloud::batch_v1::MakeBatchServiceConnection());
    auto response = client.CreateJob(request);
    if (!response) throw std::move(response).status();
    std::cout << "Job : " << response->DebugString() << "\n";
  }

Usar um sistema de arquivos de rede

É possível criar um job que use um sistema de arquivos de rede (NFS, na sigla em inglês) existente, como um Compartilhamento de arquivos do Filestore, usando o console do Google Cloud, CLI gcloud ou API Batch.

Antes de criar um job que use NFS, verifique se o o firewall da rede está configurado corretamente para permitir o tráfego entre nas VMs e no NFS do job. Para mais informações, consulte Como configurar regras de firewall para o Filestore.

O exemplo a seguir descreve como criar um job que especifica e que monta um NFS. O job também tem 3 tarefas que executam um script para criar um arquivo no NFS chamado output_task_TASK_INDEX.txt em que TASK_INDEX é o índice de cada tarefa: 0, 1 e 2.

Console

Para criar um job que use um NFS usando o console do Google Cloud, faça o seguinte:

  1. No console do Google Cloud, acesse a página Lista de jobs.

    Acessar a lista de jobs

  2. Clique em Criar. O A página Criar job em lote é aberta. No painel esquerdo, A página Detalhes do job está selecionada.

  3. Configure a página Detalhes do job:

    1. Opcional: no campo Nome do job, personalize o nome do job.

      Por exemplo, insira example-nfs-job.

    2. Configure a seção Task details:

      1. Na janela New runnable, adicione pelo menos um script ou contêiner para o job ser executado.

        Por exemplo, faça o seguinte:

        1. Marque a caixa de seleção Script. Uma caixa de texto será exibida.

        2. Na caixa de texto, insira o seguinte script:

          echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt
          

          Substitua MOUNT_PATH pelo caminho de montagem que o executável do job usa para acessar esse NFS. O caminho precisa começar com /mnt/disks/ seguido de ou caminho escolhido. Por exemplo, se você representar esse NFS com um diretório chamado my-nfs, defina o caminho de montagem como /mnt/disks/my-nfs.

        3. Clique em Concluído.

      2. No campo Contagem de tarefas, digite o número de tarefas de para esse trabalho.

        Por exemplo, insira 3.

      3. No campo Paralelismo, insira o número de tarefas a serem em execução simultânea.

        Por exemplo, digite 1 (padrão).

  4. Defina a página Configurações adicionais:

    1. No painel esquerdo, clique em Configurações adicionais. A página Configurações adicionais é aberta.

    2. Para cada bucket do Cloud Storage em que você quer ativar este job, faça o seguinte:

      1. Na seção Volume de armazenamento, clique em Adicionar novo volume. A janela Novo volume será exibida.

      2. Na janela Novo volume, faça o seguinte:

        1. Na seção Tipo de volume: Selecione Sistema de arquivos de rede.

        2. No campo Servidor de arquivos, digite o endereço IP do em que o NFS especificado no arquivo executável está localizado.

          Por exemplo, se o NFS for do compartilhamento de arquivos do Filestore, Depois especifique o endereço IP do banco de dados que você pode conseguir ao que descreve a instância do Filestore.

        3. No campo Caminho remoto, insira um caminho que possa acessar o NFS que você especificou na etapa anterior.

          O caminho do diretório NFS precisa começar com / seguido pelo diretório raiz do NFS.

        4. No campo Caminho de montagem, insira o caminho de montagem do NFS (MOUNT_PATH), que você especificou em na etapa anterior.

    3. Clique em Concluído.

  5. Opcional: configure o outras áreas para a vaga.

  6. Opcional: para revisar a configuração do job, no painel esquerdo, Clique em Visualizar.

  7. Clique em Criar.

A página Detalhes do job exibe o job que você criou.

gcloud

Para criar um job que usa NFS usando o CLI gcloud, use o comando gcloud batch jobs submit. No arquivo de configuração JSON do job, monte o NFS na volumes.

  1. Crie um arquivo JSON com o seguinte conteúdo:

    {
        "taskGroups": [
            {
                "taskSpec": {
                    "runnables": [
                        {
                            "script": {
                                "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
                            }
                        }
                    ],
                    "volumes": [
                        {
                            "nfs": {
                                "server": "NFS_IP_ADDRESS",
                                "remotePath": "NFS_PATH"
                            },
                            "mountPath": "MOUNT_PATH"
                        }
                    ]
                },
                "taskCount": 3
            }
        ],
        "logsPolicy": {
            "destination": "CLOUD_LOGGING"
        }
    }
    

    Substitua:

    • NFS_IP_ADDRESS: o Endereço IP do NFS. Por exemplo, se sua O NFS é um compartilhamento de arquivos do Filestore, especifique o endereço IP do Filestore, que você pode conseguir ao que descreve a instância do Filestore.
    • NFS_PATH: o caminho do diretório do NFS que você quer que este job acesse, que precisa começar com /. seguido pelo diretório raiz do NFS. Por exemplo, para um O compartilhamento de arquivos do Filestore chamado FILE_SHARE_NAME, o caminho /FILE_SHARE_NAME representa a raiz do compartilhamento de arquivos e o caminho /FILE_SHARE_NAME/subdirectory representa o subdiretório subdirectory.
    • MOUNT_PATH: o caminho de ativação em que o executáveis usam para acessar esse NFS. O caminho precisa começar com /mnt/disks/ seguido por um diretório ou caminho que você escolher. Por exemplo, se você quiser representar esse NFS com um diretório chamado my-nfs, defina o caminho de montagem como /mnt/disks/my-nfs.
  2. Execute este comando:

    gcloud batch jobs submit JOB_NAME \
      --location LOCATION \
      --config JSON_CONFIGURATION_FILE
    

    Substitua:

    • JOB_NAME: o nome do job.
    • LOCATION: o local do trabalho.
    • JSON_CONFIGURATION_FILE: o caminho para um JSON. com os detalhes de configuração do job.

API

Para criar um job que usa NFS usando o Batch API, use o Método jobs.create e montar o NFS no campo volumes.

POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME

   {
    "taskGroups": [
        {
            "taskSpec": {
                "runnables": [
                    {
                        "script": {
                            "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
                        }
                    }
                ],
                "volumes": [
                    {
                        "nfs": {
                            "server": "NFS_IP_ADDRESS",
                            "remotePath": "NFS_PATH"
                        },
                        "mountPath": "MOUNT_PATH"
                    }
                ]
            },
            "taskCount": 3
        }
    ],
    "logsPolicy": {
        "destination": "CLOUD_LOGGING"
    }
}

Substitua:

  • PROJECT_ID: o ID do projeto do seu projeto.
  • LOCATION: o local do trabalho.
  • JOB_NAME: o nome do job.
  • NFS_IP_ADDRESS: o Endereço IP do sistema de arquivos de rede. Por exemplo, se sua O NFS é um compartilhamento de arquivos do Filestore, especifique o endereço IP do Filestore, que você pode conseguir ao que descreve a instância do Filestore.
  • NFS_PATH: o caminho do diretório do NFS que você quer que este job acesse, que precisa começar com /. seguido pelo diretório raiz do NFS. Por exemplo, para um O compartilhamento de arquivos do Filestore chamado FILE_SHARE_NAME, o caminho /FILE_SHARE_NAME representa a raiz do compartilhamento de arquivos e o caminho /FILE_SHARE_NAME/subdirectory representa um subdiretório.
  • MOUNT_PATH: o caminho de ativação em que o executáveis usam para acessar esse NFS. O caminho precisa começar com /mnt/disks/ seguido por um diretório ou caminho que você escolher. Por exemplo, se você quiser representar esse NFS com um my-nfs, defina o caminho de montagem como /mnt/disks/my-nfs.

A seguir