Confira nesta página as atualizações de produção de suporte da IA generativa na Vertex AI e na Vertex AI Model Garden. É possível acessá-la periodicamente para consultar avisos sobre recursos novos ou atualizados, correções de bugs, problemas conhecidos e funcionalidades suspensas.
1º de setembro de 2023
Atualização de preços
O preço do text-bison
foi reduzido para US$ 0,0005 por 1.000 caracteres de entrada e
saída. Para mais detalhes, consulte Preços da Vertex AI.
29 de agosto de 2023
Novo suporte de IA generativa em modelos da Vertex AI e suporte expandido a idiomas
O suporte de IA generativa na Vertex AI foi atualizado para incluir novos candidatos a modelos de idiomas (modelos mais recentes), modelos de idiomas com suporte de tokens de entrada e saída de até 32 mil e mais idiomas compatíveis. Para mais informações, consulte Modelos disponíveis e Versões e ciclo de vida do modelo.
Respostas de stream de modelos de IA generativa
O suporte ao streaming de modelos de IA generativa está com disponibilidade geral (GA, na sigla em inglês). Depois que você envia um prompt, o modelo retorna tokens de resposta à medida que são gerados, em vez de esperar que toda a saída esteja disponível.
Os modelos compatíveis são:
text-bison
chat-bison
code-bison
codechat-bison
Para saber mais, consulte Transmitir respostas de modelos de IA generativa.
O ajuste do modelo text-bison
está com disponibilidade geral (GA, na sigla em inglês)
O ajuste supervisionado do modelo text-bison
já está disponível para todos os usuários (GA).
Para mais informações, consulte Ajustar modelos de texto.
O ajuste do modelo chat-bison
já está disponível na Visualização
Agora é possível usar o ajuste supervisionado para ajustar o modelo do chat-bison
. Esse recurso está na (Visualização).
Para mais informações, consulte Ajustar modelos de texto.
Novo modelo de incorporação disponível na Visualização
A compatibilidade com a IA generativa em usuários da Vertex AI agora pode criar embeddings usando um novo modelo treinado em uma ampla variedade de idiomas que não são o inglês. O modelo está em (Visualização).
textembedding-gecko-multilingual
Para saber mais, consulte Obter embeddings de texto.
O ajuste de objeto e o ajuste de estilo do Imagen agora possuem disponibilidade geral
O Imagen na Vertex AI agora oferece os seguintes recursos do GA:
- Ajuste do modelo de assunto (ajuste padrão)*
- Estilo do ajuste do modelo*
* Recurso de acesso restrito.
Para mais informações sobre o Imagen na Vertex AI ou como ter acesso à GA restrita, consulte a Visão geral do Imagen na Vertex AI.
Aprendizado por reforço com feedback humano (RLHF, na sigla em inglês) para text-bison
O suporte da IA generativa no modelo de fundação de geração de texto da Vertex AI (text-bison
) agora é compatível com o ajuste de
RLHF. O recurso de ajuste do RLHF está disponível (Visualização).
Para mais informações, consulte Usar ajuste de modelo RLHF.
Suporte com a linguagem das APIs do Vertex AI Codey
As APIs do Vertex AI Codey agora são compatíveis com outras linguagens de programação. Para mais informações, consulte Linguagens de codificação compatíveis.
As APIs Vertex AI Codey agora oferecem suporte a ajustes supervisionados
Os modelos de APIs Codey da Vertex AI agora oferecem suporte a ajustes supervisionados nos chats de código (codechat-bison
) e geração de código (code-bison
). O ajuste supervisionado
para modelos de APIs do Vertex AI Codey está em (Visualização). Para mais informações, consulte Ajustar modelos de código.
Avaliação de modelos com base em métricas
É possível avaliar o desempenho dos modelos de fundação e ajustados em um conjunto de dados de avaliação para classificação, resumo, resposta a perguntas e geração de texto geral. Esse recurso está disponível em (Visualização)
Para saber mais, consulte Avaliar o desempenho do modelo.
A API CountToken já está disponível em Visualização
A API CountToken agora está disponível em (Visualização). Use essa API para receber a contagem de tokens e o número de caracteres faturáveis de um comando. Para saber mais, consulte Contagem de tokens.
9 de agosto de 2023
Incorporações multimodais do Imagen em disponibilidade geral
O Imagen na Vertex AI agora oferece os seguintes recursos do GA:
- Embeddings multimodais
Esse recurso gerará preços diferentes se você usar a entrada de imagem ou de texto. Para mais informações, consulte a página do recurso de embeddings multimodais.
21 de agosto de 2023
Atualização de parâmetros de ajuste do modelo
Os jobs de ajuste de modelos agora aceitam parâmetros opcionais para avaliação de modelos e integração do Vertex AI TensorBoard. Isso permite avaliar o modelo e gerar visualizações com um único comando. Para mais informações, consulte Criar um job de ajuste de modelo.
28 de julho de 2023
Atualização de parâmetros de ajuste do modelo
O parâmetro learning_rate
no ajuste do modelo agora é learning_rate_multiplier
.
Para usar a taxa de aprendizado padrão do modelo ou do ajuste, use o valor learning_rate_multiplier
padrão de 1.0
.
Se você não configurou o learning_rate
antes, nenhuma ação é necessária.
Se você estiver usando tuning_method=tune_v2
com o modelo de pipeline v2.0.0 (SDK do Python v1.28.1+), a taxa de aprendizado recomendada será 0,0002. Para converter o
learning_rate
personalizado em learning_rate_multiplier
, calcule da seguinte maneira:
learing_rate_multiplier = custom_learning_rate_value / 0.0002
18 de julho de 2023
Atualizações de ajuste do modelo de texto
- O pipeline de ajuste de categoria superior agora oferece ajustes mais eficientes e melhor desempenho em texto bison.
- Nova região de ajuste (
us-central1
) disponível com suporte a GPUs. - O novo parâmetro
learning_rate
permite ajustar o tamanho da etapa em cada iteração.
Para mais informações, consulte Ajustar os modelos de fundação da linguagem.
17 de julho de 2023
Recursos do Imagen na Vertex AI em disponibilidade geral
O Imagen na Vertex AI agora oferece os seguintes recursos do GA:
- Geração de imagens (geração de texto para imagem)*
- Edição de imagem*
- Legendas visuais de imagens
- Resposta visual a perguntas (VQA)
* Recurso de acesso restrito.
Para mais informações sobre o Imagen ou como ter acesso a recurso em fase de pré-lançamento ou restritos do GA, consulte a Visão geral do Imagen na Vertex AI.
A geração de rostos humanos agora é compatível
O Imagen agora é compatível com a geração de rostos humanos para os seguintes recursos:
* Recurso de acesso restrito.
A geração de rostos humanos é ativada por padrão, exceto para imagens com crianças e/ou celebridades. Para mais informações, consulte as diretrizes de uso.
Suporte a idiomas adicionais
A API Vertex AI PaLM agora é compatível com as seguintes linguagens:
- Espanhol (es)
- Coreano (ko)
- Hindi (hi)
- Chinês (zh)
Para conferir a lista completa, consulte Idiomas compatíveis.
13 de julho de 2023
Suporte em lote para PaLM 2 para texto
O suporte solicitações de texto em lote (text-bison
)
agora está disponível em (GA).
É possível verificar os preços do modelo chat-bison
na
página de preços da Vertex AI.
10 de julho de 2023
PaLM 2 para o Chat
Suporte para Chat (chat-bison
)
agora está disponível em (GA).
É possível verificar os preços do modelo chat-bison
na
página de preços da Vertex AI.
29 de junho de 2023
APIs do Vertex AI Codey
As APIs do Vertex AI Codey agora estão com disponibilidade geral (GA, na sigla em inglês). Use as APIs do Vertex AI Codey para criar soluções com geração de código, conclusão de código e chat por código. Como as APIs do Vertex AI Codey são de disponibilidade geral, elas serão cobradas. Para saber mais sobre os preços, consulte Suporte de IA generativa na página de preços da Vertex AI.
Os modelos nesta versão incluem:
code-bison
(geração de códigos)codechat-bison
(chat de código)code-gecko
(preenchimento de códigos)
O número máximo de tokens de entrada foi aumentado de 4.096 para 6.144 tokens para
code-bison
e codechat-bison
, para permitir comandos mais longos e histórico de chat. Os tokens máximos para saída foram aumentados de 1.024 para 2.048 para code-bison
e codechat-bison
para permitir respostas mais longas.
Outras linguagens de programação são suportadas. Para mais informações, consulte Linguagens de codificação compatíveis.
Vários conjuntos de dados de ajuste fino foram removidos dos modelos code-bison
e codechat-bison
para implementar as seguintes melhorias:
- Chats em excesso.
- Artefatos, como caracteres NBSP (espaço sem quebra).
- Respostas de código de baixa qualidade.
Para aprender sobre nuvens horizontais, consulte Certificações da Vertex AI.
15 de junho de 2023
PaLM 2 para o Chat
O modelo chat-bison
foi atualizado para seguir melhor as instruções
no campo context
. Para informações sobre como criar comandos de chat para
chat-bison
, consulte
Criar comandos de chat.
7 de junho de 2013
APIs de texto e embeddings de PaLM e Generative AI Studio
O suporte de IA generativa na Vertex AI agora está disponível em (disponibilidade geral).
Com esse lançamento de recursos, é possível aproveitar a API do Vertex AI PaLM para gerar
modelos de IA que podem ser testados, ajustados e implantados nos aplicativos com tecnologia de IA.
Como esses recursos são de disponibilidade geral, você estará sujeito a custos de uso se usar as
APIs do PaLM text-bison
e textembedding-gecko
. Para saber mais sobre os preços, consulte
a página de preços da Vertex AI.
Os recursos e os modelos desta versão incluem:
- PaLM 2 para texto:
text-bison
- Embedding de texto:
textembedding-gecko
- Generative AI Studio para idiomas
Model Garden
O Model Garden está disponível em (disponibilidade geral). O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a Vertex AI e selecionar modelos de OSS. Esses modelos variam de ajustáveis a específicos de tarefas e estão todos disponíveis na página "Model Garden" no console do Google Cloud.
Para começar, consulte Explorar APIs e modelos de IA no Model Garden.
APIs do Vertex AI Codey
As APIs do Vertex AI Codey já estão em (Visualização).
Com as APIs do Codey, as APIs de geração, conclusão e chat por código podem ser usadas em qualquer
projeto do Google Cloud sem lista de permissões. As APIs podem ser acessadas na
região us-central1
. As APIs do Codey podem ser usadas no Generative AI Studio ou
de maneira programática em comandos REST.
Para começar, consulte a Visão geral dos modelos de código.
10 de maio de 2023
Suporte de IA generativa na Vertex AI
A compatibilidade com a IA generativa na Vertex AI agora está disponível em (Visualização). Com esse lançamento de recursos, é possível aproveitar a API do Vertex AI PaLM para gerar modelos de IA que podem ser testados, ajustados e implantados nos aplicativos com tecnologia de IA.
Os recursos e os modelos desta versão incluem:
- PaLM 2 para texto:
text-bison
- PaLM 2 para Chat:
chat-bison
- Embedding de texto:
textembedding-gecko
- Generative AI Studio para idiomas
- Como ajustar o PaLM 2
- SDK Vertex AI v1.25, que inclui novos recursos, como
TextGenerationModel (
text-bison
), ChatModel (chat-bison
), TextEmbedModel (textembedding-gecko@001
)
É possível interagir com os recursos de IA generativa na Vertex AI usando o Generative AI Studio no console do Google Cloud, a API do Vertex AI e o SDK da Vertex AI para Python.
- Saiba mais sobre o Suporte de IA generativa na Vertex AI.
- Consulte uma Introdução ao Generative AI Studio.
- Dê os primeiros passos com o Guia de início rápido do Generative AI Studio.
Model Garden
O Model Garden está disponível em (Visualização). O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implantar a Vertex AI e selecionar modelos de OSS. Esses modelos variam de ajustáveis a específicos de tarefas e estão todos disponíveis na página "Model Garden" no console do Google Cloud.