Esta página fornece comparações entre o AutoML Text e o Gemini para ajudar os usuários do AutoML Text a entender como usar o Gemini.
Verifique as tabelas que se aplicam ao seu caso de uso e analise as alterações que podem afetar seu fluxo de trabalho.
Uso geral
Essas diferenças são aplicáveis a todos os usuários do Gemini.
Operação | Texto do AutoML | Gemini |
---|---|---|
Formatos de dados de treinamento | É possível usar arquivos CSV ou linhas JSON, exceto a extração de entidade de texto, para incluir snippets de texto in-line ou para referenciar documentos do tipo TXT . A extração de entidade é compatível apenas com arquivos JSON Lines. |
Só é possível usar arquivos JSON de linha. Cada linha no arquivo precisa representar um exemplo de treinamento. Faça o download de um conjunto de dados de exemplo para ajustar os modelos do Gemini. Os arquivos precisam ser armazenados no Cloud Storage. |
Anotação de conjunto de dados |
As anotações são agrupadas como um objeto AnnotationSet .
É possível usar diferentes conjuntos de anotações com o mesmo conjunto de dados.
|
As anotações de conjuntos de dados não são relevates ao Gemini. |
Importação de conjunto de dados | Especifique os valores de uso de ML em uma coluna opcional para CSV, na mesma linha
dos dados; ou como uma tag em linhas JSON no mesmo objeto JSON que os dados. Se você não especificar valores de uso de ML, os dados serão divididos automaticamente para treinamento, teste e validação. Para análise de sentimento, os arquivos CSV precisam incluir o valor máximo de sentimento na última coluna de cada linha. |
Você precisa ter dois arquivos JSONL separados, um para treinamento e outro para validação. O arquivo de validação é opcional. O arquivo de validação precisa ter de 10 a 256 exemplos. |
Custos de armazenamento | Quando você cria um conjunto de dados, os dados são carregados no Cloud Storage no projeto. Esse armazenamento será cobrado. Saiba mais. | Quando você cria um conjunto de dados, os dados são carregados no Cloud Storage no projeto. Esse armazenamento será cobrado. Saiba mais |
Rotulagem de dados |
Você fornece instruções de rotulagem usando um URL. As anotações fazem parte do objeto Dataset e não podem ser manipuladas por meio do uso da API.
|
A rotulagem de dados não é relevante ao Gemini. |
Implantação do modelo |
Você cria um objeto Endpoint com recursos para exibir predições on-line. Em seguida, implante o modelo no endpoint.
Para solicitar previsões, chame o método predict() .
|
Depois de ajustar o Gemini, o modelo é armazenado no Vertex AI Model Registry, e um endpoint é criado automaticamente. As previsões on-line do modelo ajustado podem ser solicitadas usando o SDK do Python, a API REST ou o console. Para solicitar previsões, primeiro busque o endpoint ajustado e depois use o método generate_content() . |
Como usar o número ou o ID do projeto |
Tanto project-number quanto
project-id funcionam na Vertex AI.
|
O Gemini usa project-id . |
Pontuações de confiança | O texto do AutoML é compatível com as pontuações de confiança. | O Gemini não oferece suporte a pontuações de confiança. |
Usuários da API
Para mais detalhes sobre a API, consulte a documentação de referência da API Vertex AI Generative AI Tuning.
Operação ou entidade | Texto do AutoML | Gemini |
---|---|---|
Criação de modelos |
Você cria um objeto TrainingPipeline , que retorna um job de treinamento.
|
Você cria um job de ajuste fino supervisionado, que retorna o job de ajuste. |
Usar a biblioteca de cliente | Há clientes de API diferentes para cada recurso de API. | É possível criar um job de ajuste supervisionado para Gemini usando o SDK do Python, a API REST ou o console. |
Como solicitar previsões |
Para solicitar previsões, chame o método
predict()
no recurso de Endpoint.
|
Para solicitar previsões, primeiro busque o endpoint ajustado e depois use o método generate_content . |
Endpoint de previsão on-line | A seguir, substitua REGION pela região em que seu modelo de previsão está.REGION-aiplatform.googleapis.com .
Por exemplo:us-central1-aiplatform.googleapis.com |
No exemplo a seguir, substitua TUNING_JOB_REGION pela região em que o job de ajuste é executado.TUNING_JOB_REGION-aiplatform.googleapis.com .
Por exemplo:us-central1-aiplatform.googleapis.com |
Arquivos de esquema e definição | Alguns campos de solicitação e resposta são definidos nos arquivos de esquema e definição. Os formatos de dados são definidos usando arquivos de esquema predefinidos. Isso proporciona flexibilidade para a API e os formatos de dados. | O corpo da solicitação, os parâmetros do modelo e o corpo da resposta são iguais aos dos modelos do Gemini não ajustados. Consulte os exemplos de solicitações. |
Nome do host | aiplatform.googleapis.com |
aiplatform.googleapis.com |
Nome do host regional | Obrigatório. Por exemplo:us-central1-aiplatform.googleapis.com |
Obrigatório. Por exemplo:us-central1-aiplatform.googleapis.com |
A seguir
Para começar a ajustar, consulte Ajuste de modelos de texto do Gemini.