Como parte de um conjunto de tecnologias que contribuem para uma solução de machine learning, o AI Platform Prediction requer um ambiente de desenvolvimento com pré-requisitos e dependências cuidadosamente configurados. Nesta página, você verá os elementos que compõem o ambiente de desenvolvimento e os problemas correspondentes.
Suporte à versão Python
O AI Platform Prediction pode executar o Python 2.7 ou o Python 3. É possível configurar a versão do Python para jobs de treinamento em um arquivo de configuração ou com os comandos do gcloud.
A previsão on-line e em lote funciona com modelos treinados, independentemente de terem sido treinados com Python 2 ou Python 3.
Se for preciso transferir o código entre o Python 2 e o Python 3, use bibliotecas de compatibilidade como six para ajudar. O six é incluído nas imagens de ambiente de execução do AI Platform Prediction por padrão.
Acesso raiz
Se você estiver configurando o ambiente de desenvolvimento básico, talvez seja necessário usar o sudo
para executar a instalação do pip
no macOS ou no Linux. No entanto, se usar um ambiente virtual, você não precisará de acesso raiz porque a instalação acontece fora dos diretórios do sistema protegidos pelo SO.
Ambiente de execução
A configuração das máquinas virtuais que executam o projeto do Google Cloud na nuvem é definida pela versão de ambiente de execução que você usa.
Ambientes virtuais do Python
A configuração do Python pode ser complicada, especialmente se você desenvolver outros aplicativos em Python com diferentes tecnologias no mesmo computador. Simplifique o gerenciamento de versões e pacotes usando um ambiente virtual para fazer o desenvolvimento em Python.
Um ambiente virtual do Python gerencia um interpretador do Python e pacotes que são isolados do ambiente padrão do seu computador e dedicados ao projeto. Use ambientes virtuais para configurar ambientes separados para cada projeto do Python em que trabalha, cada um com sua própria versão do Python e os módulos necessários.
Há várias opções para ambientes virtuais do Python. É recomendável usar Anaconda ou a versão compacta dele, o Miniconda (páginas em inglês). Eles incluem um gerenciador de ambiente virtual denominado Conda (em inglês). O Anaconda é um conjunto de pacotes e ferramentas muito usado por cientistas de dados.
Frameworks de machine learning
O AI Platform Training e o AI Platform Prediction são compatíveis com os frameworks a seguir:
- TensorFlow para treinamento, predição on-line e em lote. Consulte o guia sobre treinamento e previsão com o TensorFlow Estimator no AI Platform.
- scikit-learn e XGBoost para treinamento e previsão on-line. Consulte tutoriais sobre como usar scikit-learn e XGBoost com a previsão do AI Platform Prediction.
Conta do Google Cloud Platform
Você precisa ter uma conta do Google Cloud com o faturamento ativado e um projeto com a API AI Platform Training and Prediction ativada para usar qualquer funcionalidade de nuvem do AI Platform Prediction. Se você ainda não conhece o Google Cloud, leia a visão geral dos projetos para mais informações.
Regiões do Cloud Compute
Os recursos de processamento são alocados por região e zona, que correspondem aos data centers em que os recursos estão localizados fisicamente. Normalmente, é necessário executar jobs pontuais, como o treinamento de modelos, na região mais próxima da sua localização física (ou da dos usuários pretendidos), porém:
Considere as regiões disponíveis para serviços do AI Platform Prediction, incluindo treinamento de modelo em GPUs e outros hardwares e previsão on-line/em lote.
Sempre execute os jobs do AI Platform Prediction na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.
É preciso usar a classe de armazenamento padrão para todos os buckets do Cloud Storage que você estiver usando para ler e gravar dados do job do AI Platform Prediction.
A seguir
- Siga o guia de primeiros passos para o TensorFlow Estimator no AI Platform Prediction.
- Siga o guia de primeiros passos com scikit-learn e XGBoost no AI Platform Prediction.