Na IA generativa, embasamento é a capacidade de conectar a saída do modelo a fontes de informações verificáveis. Se você fornecer aos modelos acesso a fontes de dados específicas, o embasamento da saída deles a esses dados reduz as chances de inventar conteúdo. Isso é especialmente importante em situações em que a acurácia e a confiabilidade são significativas.
O embasamento oferece os seguintes benefícios:
- Reduz alucinações de modelos, que são casos em que o modelo gera conteúdo que não é factual.
- Ancora respostas do modelo a informações específicas.
- Melhora a confiabilidade e aplicabilidade do conteúdo gerado.
Na Vertex AI, há duas maneiras principais de embasar a saída de modelo compatível:
Embasamento com a Pesquisa Google
Quando você usa o Embasamento com a Pesquisa Google, ele vincula o modelo do Google à Internet. Como as respostas de modelos de IA generativa não embasadas são consideradas conteúdo novo com base em padrões aprendidos, você não vai receber respostas factuais específicas para o horário, por exemplo, perguntando qual a previsão do tempo. está no comando. Como a Internet fornece acesso a informações novas e atuais, um comando embasado pode fornecer respostas de solicitação específicas e diferenciadas, com poucos erros e com as fontes citadas.
A integração com a Pesquisa Google oferece suporte à recuperação dinâmica, que permite gerar resultados embasados na pesquisa apenas quando necessário. Portanto, a configuração de recuperação dinâmica avalia se um comando exige conhecimento sobre eventos recentes e ativa a integração com a Pesquisa Google. Para mais informações, consulte Recuperação dinâmica.
Confira um exemplo que compara uma resposta de comando não embasada e uma resposta embasada:
Gêmeos sem terra | Embasamento com a Pesquisa Google |
---|---|
Prompt: Qual é o limite de contribuições para o 401k? Resposta: em 2023, o limite de contribuição anual para os planos de 401(k) é de US$ 22.500, em comparação aos US$ 20.500 em 2022. As contribuições para pessoas com 50 anos ou mais permanecerão como US $7.500. |
Prompt: Qual é o limite de contribuições para o 401k? Resposta: Confira a oferta com limites de contribuição de 401(k) em 2024: O limite básico para contribuições de funcionários é de US $23.000 para 2024. Um aumento em relação aos US$ 22.500 de 2023. Se você tiver 50 anos ou mais, também poderá contribuir com mais US $7.500 em contribuições de atualização. |
- Para usar o embasamento com a Pesquisa Google, consulte Terrestre para dados públicos usando a Pesquisa Google.
Quando você usa o Embasamento com a Pesquisa Google e recebe uma sugestões de pesquisa na sua resposta, é necessário mostrar as Sugestões de pesquisa na produção e nos seus apps. Consulte os requisitos para usar o embasamento com a Pesquisa Google em Sugestões de pesquisa.
O diagrama a seguir explica como o uso do embasamento com a Pesquisa Google funciona na API Gemini:
Baseado nos seus próprios dados
É possível embasar modelos de linguagem nos seus próprios dados de texto usando a Vertex AI para Pesquisa como um repositório de dados. Com a Vertex AI para Pesquisa, você integra seus próprios dados, independentemente do formato, para refinar a saída do modelo. Os tipos de dados compatíveis incluem:
- Dados do site: use diretamente o conteúdo do seu site.
- Dados não estruturados: use dados brutos e não formatados.
Quando você fundamenta seus dados específicos, o modelo pode ter um desempenho além dos dados de treinamento. Ao vincular-se a repositórios de dados designados na Vertex AI para Pesquisa, o modelo baseado em dados pode produzir respostas mais precisas e relevantes, além de respostas diretamente relacionadas ao seu caso de uso.
Confira um exemplo que compara uma resposta de comando privada não embasada e uma resposta embasada:
Gêmeos sem terra | Gêmeos com base na privacidade |
---|---|
Prompt: Qual é a política de PTO da minha empresa? Resposta : não consigo responder a dúvidas sobre a política específica de PTO da sua empresa. As políticas de PTO são definidas por empresas individuais e podem variar de acordo com o tamanho, a localização e o setor da sua empresa. |
Prompt: Qual é a política de PTO da minha empresa? Resposta : sua empresa tem uma política de PTO ilimitada. A aprovação ainda é necessária: seu gerente precisa aprovar ou negar solicitações com base na carga de trabalho, na cobertura e nas necessidades da empresa. |
- Para basear modelos do Gemini nos seus dados, consulte Terrestre dos seus dados.
A seguir
- Saiba mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI.