Como parte de um conjunto de tecnologias incluído em uma solução de machine learning, o AI Platform Training requer um ambiente de desenvolvimento com pré-requisitos e dependências cuidadosamente configurados. Nesta página, você verá os elementos que compõem o ambiente de desenvolvimento e os problemas correspondentes.
Suporte à versão Python
O AI Platform Training executa o Python 2.7 ou 3. É possível definir a versão do Python dos jobs de treinamento em um arquivo de configuração ou com comandos da gcloud.
A previsão on-line e em lote funciona com modelos treinados, independentemente de terem sido treinados com Python 2 ou Python 3.
Se for preciso transferir o código entre o Python 2 e o Python 3, use bibliotecas de compatibilidade como six para ajudar. Por padrão, o six está incluído nas imagens do ambiente de execução do AI Platform Training.
Acesso raiz
Se você estiver configurando o ambiente de desenvolvimento básico, talvez seja necessário usar o sudo
para executar a instalação do pip
no macOS ou no Linux. No entanto, se usar um ambiente virtual, você não precisará de acesso raiz porque a instalação acontece fora dos diretórios do sistema protegidos pelo SO.
Ambiente de execução
A configuração das máquinas virtuais que executam o projeto do Google Cloud na nuvem é definida pela versão de ambiente de execução que você usa.
Ambientes virtuais do Python
A configuração do Python pode ser complicada, especialmente se você desenvolver outros aplicativos em Python com diferentes tecnologias no mesmo computador. Simplifique o gerenciamento de versões e pacotes usando um ambiente virtual para fazer o desenvolvimento em Python.
Um ambiente virtual do Python gerencia um interpretador do Python e pacotes que são isolados do ambiente padrão do seu computador e dedicados ao projeto. Use ambientes virtuais para configurar ambientes separados para cada projeto do Python em que trabalha, cada um com sua própria versão do Python e os módulos necessários.
Há várias opções para ambientes virtuais do Python. É recomendável usar Anaconda ou a versão compacta dele, o Miniconda (páginas em inglês). Eles incluem um gerenciador de ambiente virtual denominado Conda (em inglês). O Anaconda é um conjunto de pacotes e ferramentas muito usado por cientistas de dados.
Frameworks de machine learning
O AI Platform Training e o AI Platform Prediction são compatíveis com os frameworks a seguir:
- TensorFlow para treinamento, predição on-line e em lote. Consulte o guia sobre treinamento e previsão com o TensorFlow Estimator no AI Platform.
- scikit-learn e XGBoost para treinamento e previsão on-line. Consulte os tutoriais sobre como usar o scikit-learn e o XGBoost com o AI Platform Training.
Conta do Google Cloud Platform
Você precisa ter uma conta do Google Cloud com o faturamento ativado e um projeto com o AI Platform Training e a API Prediction ativados para usar as funcionalidades de nuvem do AI Platform Training. Se você ainda não conhece o Google Cloud, leia a visão geral dos projetos para mais informações.
Regiões do Cloud Compute
Os recursos de processamento são alocados por região e zona, que correspondem aos data centers em que os recursos estão localizados fisicamente. Normalmente, é necessário executar jobs pontuais, como o treinamento de modelos, na região mais próxima da sua localização física (ou da dos usuários pretendidos), porém:
Verifique as regiões disponíveis para os serviços do AI Platform Training, incluindo treinamento de modelo em GPUs e outros hardwares e previsão on-line e em lote.
Sempre execute os jobs do AI Platform Training na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.
É preciso usar a classe de armazenamento padrão em todos os buckets do Cloud Storage que você está usando para ler e gravar dados do job do AI Platform Training.
A seguir
- Siga o guia de primeiros passos do Estimator do TensorFlow no AI Platform Training.
- Siga o guia de início rápido do scikit-learn e do XGBoost no AI Platform Training.