Redefinir um modelo
É possível refazer a base de um modelo ajustado tradicionalmente usando o console do Google Cloud ou programaticamente. Este guia explica como fazer a rebase, um processo que atualiza o modelo base de um modelo ajustado para a versão mais recente.
É importante fazer a rebase de um modelo porque modelos de base novos e aprimorados são lançados periodicamente. Eles geralmente são treinados com conjuntos de dados maiores, têm uma arquitetura melhor e incluem melhorias de desempenho. A rebaseação permite aproveitar essas melhorias. A rebaseação usa os hiperparâmetros recomendados para o novo modelo de base e oferece a melhor performance.
Os modelos bison models
e gemini-1.0
usam um formato de conjunto de dados diferente do
gemini-1.5 models
. Se você estiver fazendo upgrade de uma versão mais antiga do modelo para gemini-1.5
,
terá duas opções:
- Continue usando o conjunto de dados atual: o conjunto de dados de ajuste mais antigo ainda pode funcionar
com
gemini-1.5
, permitindo uma transição perfeita. - Crie um novo conjunto de dados: para ter o melhor desempenho com
gemini-1.5
, crie um novo conjunto de dados no bucket do Cloud Storage usando o formato atualizado.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- LOCATION: a região onde o job de ajuste é executado. Essa também é a região padrão para onde o modelo ajustado é transferido.
- PROJECT_ID: o ID do projeto.
- MODEL_ID: o nome do modelo ajustado que você quer refazer.
- TUNING_JOB_ID: para modelos legados do Gemini que usam tuning_job.
- PIPELINE_JOB_NAME: o pipeline de ajuste de modelos bison legados.
Método HTTP e URL:
POST https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel
Corpo JSON da solicitação:
{ "tunedModelRef": { "tuned_model": "projects/PROJECT_ID/locations/REGION/models/MODEL_ID" } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel"
PowerShell
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel" | Select-Object -Expand Content
Você receberá uma resposta JSON semelhante a seguinte.
Console do Google Cloud
Use estas instruções para mudar a base de um modelo ajustado para um modelo de fundação mais recente
- Na seção "Vertex AI" do console do Google Cloud, acesse a página Vertex AI Studio para fazer a sintonização.
- Na coluna de notificação da lista de modelos ajustados, os modelos que estão desatualizados ou podem ser repassados têm a opção Retune.
- Selecione Retornar.
- Escolha um nome para o modelo ajustado.
- No menu suspenso, selecione o novo modelo base a ser usado.
- Selecione a região que você quer usar.
- Selecione o local do diretório de saída, o local do Cloud Storage em que os conjuntos de dados de ajuste reformatados são armazenados.
- Atualize o local do conjunto de dados de ajuste fazendo upload de um novo arquivo para o Cloud Storage ou use um caminho do Cloud Storage atual.
- Opcional: ative a validação do modelo e conecte-se ao conjunto de dados de validação do Cloud Storage.
- Clique em Iniciar ajuste.
A seguir
- Para saber como ajustar um modelo, consulte Ajustar modelos Gemini usando ajuste supervisionado de detalhes.
- Para saber como o ajuste supervisionado de detalhes pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.