Na IA generativa, embasamento é a capacidade de conectar a saída do modelo a fontes de informações verificáveis. Se você fornecer aos modelos acesso a fontes de dados específicas, o embasamento da saída deles a esses dados reduz as chances de inventar conteúdo. Isso é particularmente importante em situações em que a precisão e a confiabilidade são significativas.
O embasamento oferece os seguintes benefícios:
- Reduz alucinações de modelos, que são casos em que o modelo gera conteúdo que não é factual.
- Ancora respostas do modelo às suas fontes de dados.
- Melhora a confiabilidade e aplicabilidade do conteúdo gerado, fornecendo citações e pontuações de confiança.
Na Vertex AI, há duas maneiras principais de embasar a saída de modelo compatível:
Para conferir informações sobre o suporte a idiomas, consulte Idiomas compatíveis para comandos.
Embasamento com a Pesquisa Google
Quando você usa o Embasamento com a Pesquisa Google, ele vincula o modelo do Google à Internet. Como as respostas de modelos de IA generativa não embasadas são consideradas conteúdo novo com base em padrões aprendidos, você não vai receber respostas factuais específicas para o horário, por exemplo, perguntando qual a previsão do tempo está no comando. Como a Internet fornece acesso a informações novas e atuais, um comando embasado pode fornecer respostas de solicitação específicas e diferenciadas, com poucos erros e fontes citadas.
A integração com a Pesquisa oferece suporte à recuperação dinâmica, que permite gerar resultados com embasamento na pesquisa apenas quando necessário. Portanto, a configuração de recuperação dinâmica avalia se um comando exige conhecimento sobre eventos recentes e ativa a integração com a Pesquisa. Para mais informações, consulte Recuperação dinâmica.
Confira um exemplo que compara uma resposta de comando não embasada e uma resposta embasada:
Gêmeos sem terra | Embasamento com a Pesquisa |
---|---|
Prompt: Qual é o limite de contribuições para o 401k? Resposta: em 2023, o limite de contribuição anual para os planos de 401(k) é de US$ 22.500, em comparação aos US$ 20.500 em 2022. As contribuições para pessoas com 50 anos ou mais permanecerão como US $7.500. |
Prompt: Qual é o limite de contribuições para o 401k? Resposta: Confira a oferta com limites de contribuição de 401(k) em 2024: O limite básico para contribuições de funcionários é de US $23.000 para 2024. Um aumento em relação aos US$ 22.500 de 2023. Se você tiver 50 anos ou mais, também poderá contribuir com mais US $7.500 em contribuições de atualização. |
- Para usar o embasamento com a Pesquisa, consulte Basear em dados públicos usando a Pesquisa.
Quando você usa o embasamento com a Pesquisa e recebe sugestões de pesquisa na resposta, é necessário mostrar sugestões de pesquisa na produção e nos seus aplicativos. Consulte os requisitos para usar o embasamento com a Pesquisa.
O diagrama a seguir explica como o uso do embasamento com a Pesquisa funciona na API Gemini:
Basear-se nos seus dados
É possível embasar modelos de linguagem nos seus dados de texto usando a Vertex AI para Pesquisa como um repositório de dados. Para refinar a saída do modelo com a Vertex AI para Pesquisa, é possível integrar seus dados, independentemente do formato.
Para mais informações sobre como basear seus dados, consulte Basear com seus dados.
Tipos de dados compatíveis
Tipo de dado | Descrição |
---|---|
Site | Use diretamente o conteúdo do seu site. Você precisa criar um repositório de dados do site e ativar o seguinte: |
Formatos de documentos e arquivos | Os tipos de documentos aceitos incluem arquivos PDF, HTML, TXT, DOCX e PPTX. O CSV está disponível para perguntas frequentes. |
Exemplo
Quando você fundamenta seus dados específicos, o modelo pode ter um desempenho além dos dados de treinamento. Ao vincular-se a repositórios de dados designados na Vertex AI para Pesquisa, o modelo baseado em dados pode produzir respostas e citações mais precisas e relevantes para suas fontes de dados relevantes.
Confira um exemplo que compara uma resposta de comando não embasada e uma resposta embasada:
Gêmeos sem terra | Gêmeos com base na privacidade |
---|---|
Prompt: Qual é a política de PTO da minha empresa? Resposta : não consigo responder a dúvidas sobre a política específica de PTO da sua empresa. As políticas de PTO são definidas por empresas individuais e podem variar de acordo com o tamanho, a localização e o setor da sua empresa. |
Prompt: Qual é a política de PTO da minha empresa? Resposta : sua empresa tem uma política de PTO ilimitada. A aprovação ainda é necessária: seu gerente precisa aprovar ou negar solicitações com base na carga de trabalho, na cobertura e nas necessidades da empresa.[1] Fonte de aterramento: 1. Manual do funcionário.pdf |
A seguir
- Para saber mais sobre como basear modelos do Gemini nos seus dados, consulte Basear nos seus dados.
- Para saber mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI, consulte IA responsável.