Esta página foi traduzida pela API Cloud Translation.

Informações gerais sobre embasamento

Na IA generativa, embasamento é a capacidade de conectar a saída do modelo a fontes de informações verificáveis. Se você fornecer aos modelos acesso a fontes de dados específicas, o embasamento da saída deles a esses dados reduz as chances de inventar conteúdo. Isso é particularmente importante em situações em que a precisão e a confiabilidade são significativas.

O embasamento oferece os seguintes benefícios:

Reduz alucinações de modelos, que são casos em que o modelo gera conteúdo que não é factual.
Ancora respostas do modelo às suas fontes de dados.
Melhora a confiabilidade e aplicabilidade do conteúdo gerado, fornecendo citações e pontuações de confiança.

Na Vertex AI, há duas maneiras principais de embasar a saída de modelo compatível:

Embasamento com a Pesquisa Google
Basear nas suas informações (pré-lançamento).

Para conferir informações sobre o suporte a idiomas, consulte Idiomas compatíveis para comandos.

Embasamento com a Pesquisa Google

Quando você usa o Embasamento com a Pesquisa Google, ele vincula o modelo do Google à Internet. Como as respostas de modelos de IA generativa não embasadas são consideradas conteúdo novo com base em padrões aprendidos, você não vai receber respostas factuais específicas para o horário, por exemplo, perguntando qual a previsão do tempo está no comando. Como a Internet fornece acesso a informações novas e atuais, um comando embasado pode fornecer respostas de solicitação específicas e diferenciadas, com poucos erros e fontes citadas.

A integração com a Pesquisa oferece suporte à recuperação dinâmica, que permite gerar resultados com embasamento na pesquisa apenas quando necessário. Portanto, a configuração de recuperação dinâmica avalia se um comando exige conhecimento sobre eventos recentes e ativa a integração com a Pesquisa. Para mais informações, consulte Recuperação dinâmica.

Confira um exemplo que compara uma resposta de comando não embasada e uma resposta embasada:

Gêmeos sem terra	Embasamento com a Pesquisa
Prompt: Qual é o limite de contribuições para o 401k? Resposta: em 2023, o limite de contribuição anual para os planos de 401(k) é de US$ 22.500, em comparação aos US$ 20.500 em 2022. As contribuições para pessoas com 50 anos ou mais permanecerão como US $7.500.	Prompt: Qual é o limite de contribuições para o 401k? Resposta: Confira a oferta com limites de contribuição de 401(k) em 2024: O limite básico para contribuições de funcionários é de US $23.000 para 2024. Um aumento em relação aos US$ 22.500 de 2023. Se você tiver 50 anos ou mais, também poderá contribuir com mais US $7.500 em contribuições de atualização.

Para usar o embasamento com a Pesquisa, consulte Basear em dados públicos usando a Pesquisa.

Quando você usa o embasamento com a Pesquisa e recebe sugestões de pesquisa na resposta, é necessário mostrar sugestões de pesquisa na produção e nos seus aplicativos. Consulte os requisitos para usar o embasamento com a Pesquisa.

O diagrama a seguir explica como o uso do embasamento com a Pesquisa funciona na API Gemini:

Informações gerais sobre embasamento

Basear-se nos seus dados

É possível embasar modelos de linguagem nos seus dados de texto usando a Vertex AI para Pesquisa como um repositório de dados. Para refinar a saída do modelo com a Vertex AI para Pesquisa, é possível integrar seus dados, independentemente do formato.

Para mais informações sobre como basear seus dados, consulte Basear com seus dados.

Tipos de dados compatíveis

Tipo de dado	Descrição
Site	Use diretamente o conteúdo do seu site. Você precisa criar um repositório de dados do site e ativar o seguinte: Indexação avançada de sites
Formatos de documentos e arquivos	Os tipos de documentos aceitos incluem arquivos PDF, HTML, TXT, DOCX e PPTX. O CSV está disponível para perguntas frequentes.

Exemplo

Quando você fundamenta seus dados específicos, o modelo pode ter um desempenho além dos dados de treinamento. Ao vincular-se a repositórios de dados designados na Vertex AI para Pesquisa, o modelo baseado em dados pode produzir respostas e citações mais precisas e relevantes para suas fontes de dados relevantes.

Confira um exemplo que compara uma resposta de comando não embasada e uma resposta embasada:

Gêmeos sem terra	Gêmeos com base na privacidade
Prompt: Qual é a política de PTO da minha empresa? Resposta : não consigo responder a dúvidas sobre a política específica de PTO da sua empresa. As políticas de PTO são definidas por empresas individuais e podem variar de acordo com o tamanho, a localização e o setor da sua empresa.	Prompt: Qual é a política de PTO da minha empresa? Resposta : sua empresa tem uma política de PTO ilimitada. A aprovação ainda é necessária: seu gerente precisa aprovar ou negar solicitações com base na carga de trabalho, na cobertura e nas necessidades da empresa.[1] Fonte de aterramento: 1. Manual do funcionário.pdf

A seguir

Para saber mais sobre como basear modelos do Gemini nos seus dados, consulte Basear nos seus dados.
Para saber mais sobre as práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI, consulte IA responsável.