Ambiente de desenvolvimento

Como parte de um conjunto de tecnologias incluído em uma solução de machine learning, o AI Platform Training requer um ambiente de desenvolvimento com pré-requisitos e dependências cuidadosamente configurados. Nesta página, você verá os elementos que compõem o ambiente de desenvolvimento e os problemas correspondentes.

Suporte à versão Python

O AI Platform Training executa o Python 2.7 ou 3. É possível definir a versão do Python dos jobs de treinamento em um arquivo de configuração ou com comandos da gcloud.

A previsão on-line e em lote funciona com modelos treinados, independentemente de terem sido treinados com Python 2 ou Python 3.

Se for preciso transferir o código entre o Python 2 e o Python 3, use bibliotecas de compatibilidade como six para ajudar. Por padrão, o six está incluído nas imagens do ambiente de execução do AI Platform Training.

Acesso raiz

Se você estiver configurando o ambiente de desenvolvimento básico, talvez seja necessário usar o sudo para executar a instalação do pip no macOS ou no Linux. No entanto, se usar um ambiente virtual, você não precisará de acesso raiz porque a instalação acontece fora dos diretórios do sistema protegidos pelo SO.

Ambiente de execução

A configuração das máquinas virtuais que executam o projeto do Google Cloud na nuvem é definida pela versão de ambiente de execução que você usa.

Ambientes virtuais do Python

A configuração do Python pode ser complicada, especialmente se você desenvolver outros aplicativos em Python com diferentes tecnologias no mesmo computador. Simplifique o gerenciamento de versões e pacotes usando um ambiente virtual para fazer o desenvolvimento em Python.

Um ambiente virtual do Python gerencia um interpretador do Python e pacotes que são isolados do ambiente padrão do seu computador e dedicados ao projeto. Use ambientes virtuais para configurar ambientes separados para cada projeto do Python em que trabalha, cada um com sua própria versão do Python e os módulos necessários.

Há várias opções para ambientes virtuais do Python. É recomendável usar Anaconda ou a versão compacta dele, o Miniconda (páginas em inglês). Eles incluem um gerenciador de ambiente virtual denominado Conda (em inglês). O Anaconda é um conjunto de pacotes e ferramentas muito usado por cientistas de dados.

Frameworks de machine learning

O AI Platform Training e o AI Platform Prediction são compatíveis com os frameworks a seguir:

Conta do Google Cloud Platform

Você precisa ter uma conta do Google Cloud com o faturamento ativado e um projeto com o AI Platform Training e a API Prediction ativados para usar as funcionalidades de nuvem do AI Platform Training. Se você ainda não conhece o Google Cloud, leia a visão geral dos projetos para mais informações.

Regiões do Cloud Compute

Os recursos de processamento são alocados por região e zona, que correspondem aos data centers em que os recursos estão localizados fisicamente. Normalmente, é necessário executar jobs pontuais, como o treinamento de modelos, na região mais próxima da sua localização física (ou da dos usuários pretendidos), porém:

  • Verifique as regiões disponíveis para os serviços do AI Platform Training, incluindo treinamento de modelo em GPUs e outros hardwares e previsão on-line e em lote.

  • Sempre execute os jobs do AI Platform Training na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.

  • É preciso usar a classe de armazenamento padrão em todos os buckets do Cloud Storage que você está usando para ler e gravar dados do job do AI Platform Training.

A seguir