Esta página foi traduzida pela API Cloud Translation.

Gere respostas fundamentadas com a RAG

Como parte da sua experiência de geração aumentada de obtenção (RAG) no Vertex AI Search, pode gerar respostas fundamentadas a comandos com base nas seguintes fontes de fundamentação:

Pesquisa Google: use a fundamentação com a Pesquisa Google se quiser associar o modelo a conhecimentos mundiais, a uma grande variedade de tópicos ou a informações atualizadas na Internet. A fundamentação com a Pesquisa Google suporta a obtenção dinâmica, o que lhe dá a opção de gerar resultados fundamentados com a Pesquisa Google apenas quando necessário. Por conseguinte, a configuração de obtenção dinâmica avalia se um comando requer conhecimentos sobre eventos recentes e ativa a fundamentação com a Pesquisa Google. Para mais informações, consulte o artigo Obtenção dinâmica.
Importante: se receber sugestões da Pesquisa Google com uma resposta, essa resposta é um "resultado fundamentado" sujeito aos termos de fundamentação com a Pesquisa Google na secção Termos de Utilização dos Termos Específicos do Serviço. Para usar as sugestões da Pesquisa Google, consulte o artigo Use sugestões da Pesquisa Google.
Texto inline: use a fundamentação com texto inline para fundamentar a resposta em partes de texto denominadas texto de factos que são fornecidas no pedido. Um texto de factos é uma declaração fornecida pelo utilizador que é considerada factual para um determinado pedido. O modelo não verifica a autenticidade do texto de factos.
Bases de dados do Vertex AI Search: use o fundamento com o Vertex AI Search se quiser associar o modelo aos seus documentos empresariais das bases de dados do Vertex AI Search.

Esta página descreve como gerar respostas fundamentadas com base nestas fontes de fundamentação através das seguintes abordagens:

Geração de respostas de interação única
- Texto inline e arquivo de dados do Vertex AI Search
- Pesquisa Google
Geração de respostas com várias interações

Além disso, pode optar por transmitir as respostas do modelo. A geração de uma resposta fundamentada através do streaming é uma funcionalidade experimental.

Pode usar outros métodos para gerar respostas fundamentadas, de acordo com a sua aplicação. Para mais informações, consulte o artigo APIs Vertex AI para criar experiências de pesquisa e RAG.

Terminologia

Antes de usar o método de geração de respostas fundamentadas, é útil compreender as entradas e as saídas, como estruturar o seu pedido e a terminologia relacionada com a RAG.

Termos RAG

A RAG é uma metodologia que permite aos grandes modelos de linguagem (GMLs) gerar respostas baseadas na origem de dados à sua escolha. Existem duas fases na RAG:

Obtenção: obter rapidamente os factos mais relevantes pode ser um problema comum de pesquisa. Com a RAG, pode obter rapidamente os factos importantes para gerar uma resposta.
Geração: os factos obtidos são usados pelo GML para gerar uma resposta fundamentada.

Por conseguinte, o método de geração de respostas fundamentadas obtém os factos da fonte de fundamentação e gera uma resposta fundamentada.

Dados de entrada

O método de geração de respostas fundamentadas requer as seguintes entradas no pedido:

Função: o remetente de um determinado texto que é um utilizador (user) ou um modelo (model).
Texto: quando a função é user, o texto é um comando e, quando a função é model, o texto é uma resposta fundamentada. A forma como especifica a função e o texto num pedido é determinada da seguinte forma:
- Para uma geração de respostas de interação única, o utilizador envia o texto do comando no pedido e o modelo envia o texto da resposta na resposta.
- Para uma geração de respostas em várias fases, o pedido contém o par comando-resposta para todas as fases anteriores e o texto do comando do utilizador para a fase atual. Por conseguinte, num pedido deste tipo, a função é user para um texto de comando e model para o texto de resposta.
Instrução do sistema: um preâmbulo ao seu comando que rege o comportamento do modelo e modifica o resultado em conformidade. Por exemplo, pode adicionar uma personagem à resposta gerada ou instruir o modelo para formatar o texto de saída de uma determinada forma. Para a geração de respostas com várias interações, tem de fornecer as instruções do sistema para cada interação. Para mais informações, consulte o artigo Use instruções do sistema.

Fonte de fundamentação: a fonte na qual a resposta se baseia e pode ser uma ou mais das seguintes:

Pesquisa Google: baseie as respostas em resultados da Pesquisa Google. Quando a origem de fundamentação é a Pesquisa Google, pode especificar uma configuração de obtenção dinâmica com um limite de obtenção dinâmica. Para mais informações, consulte o artigo Obtenção dinâmica.
Importante: se receber sugestões da Pesquisa Google com uma resposta, essa resposta é um "resultado fundamentado" sujeito aos termos de fundamentação com a Pesquisa Google na secção Termos de Utilização dos Termos Específicos do Serviço. Para usar as sugestões da Pesquisa Google, consulte o artigo Use sugestões da Pesquisa Google.
Texto inline: fundamentar a resposta em texto factual fornecido no pedido. Um texto de factos é uma declaração fornecida pelo utilizador que é considerada factual para um determinado pedido. O modelo não verifica a autenticidade do texto de factos. Pode fornecer um máximo de 100 textos de factos em cada fonte de texto incorporado. Os textos de factos podem ser suportados através de meta atributos, como o título, o autor e o URI. Estes meta atributos são devolvidos na resposta quando cita os fragmentos que suportam a resposta.
Armazenamento de dados do Vertex AI Search: fundamentar a resposta nos documentos dos armazenamentos de dados do Vertex AI Search. Não pode especificar um arquivo de dados de pesquisa de um Website como a origem de base.

Num determinado pedido, pode fornecer uma origem de texto incorporada e uma origem de arquivo de dados do Vertex AI Search. Não pode combinar a Pesquisa Google com nenhuma destas origens. Por conseguinte, se quiser fundamentar as suas respostas com resultados da Pesquisa Google, tem de enviar um pedido separado que especifique a Pesquisa Google como a única fonte de fundamentação.

Pode fornecer um máximo de 10 origens de fundamentação em qualquer ordem. Por exemplo, suponhamos que fornece as origens de base com a seguinte contagem, pela seguinte ordem, para obter um total de 10 origens de base:

Três fontes de texto incorporadas, cada uma das quais pode conter um máximo de 100 textos de factos
Seis armazéns de dados do Vertex AI Search
Uma origem de texto inline, que contém um máximo de 100 textos de factos

É atribuído um índice a cada origem pela ordem em que é especificada no pedido. Por exemplo, se tiver especificado uma combinação de origens no seu pedido, o índice da origem é atribuído conforme ilustrado na tabela seguinte:

Origem da superfície de referência	Índice
Texto inline n.º 1	0
Texto inline n.º 2	1
Armazenamento de dados do Vertex AI Search n.º 1	2
Texto inline n.º 3	3
Vertex AI Search data store #2	4

Este índice é citado na resposta e é útil para rastrear a proveniência.

Especificações de geração: as especificações para a configuração do modelo que consistem nas seguintes informações:
- ID do modelo: especifica o modelo do Vertex AI Gemini a usar para a geração de respostas. Para ver uma lista dos modelos que pode usar para gerar respostas fundamentadas, consulte o artigo Modelos suportados.
- Parâmetros do modelo: especifique os parâmetros que pode definir para o modelo que optar por usar. Estes parâmetros são: idioma, temperatura, top-P e top-K. Para ver detalhes acerca destes parâmetros, consulte o artigo Parâmetros do modelo Gemini.
Código do idioma: o idioma da resposta gerada é geralmente definido para corresponder ao idioma do comando. Se não existir um único idioma no comando (por exemplo, se o comando for muito curto e puder ser válido em vários idiomas), o campo do código do idioma determina o idioma da resposta.

Para ver uma lista de códigos de idiomas, consulte Idiomas.
Latitude e longitude: especifica a latitude e a longitude do utilizador. Se a consulta contiver perguntas específicas da localização, como "Encontra um café perto de mim", estes campos são usados. Se não for possível determinar o idioma da consulta e o código de idioma não estiver definido, a latitude e a longitude são usadas para determinar o idioma da resposta.

Dados de saída

A resposta gerada pelo modelo é denominada candidato e contém os seguintes dados. Nem todos os campos podem estar presentes no resultado.

Função: o remetente da resposta fundamentada. A resposta contém sempre o texto da resposta fundamentada. Por conseguinte, a função numa resposta é sempre um modelo.
Texto: uma resposta fundamentada.
Classificação de fundamentação: um valor de ponto flutuante no intervalo [0, 1] que indica o quão bem uma resposta está fundamentada nas fontes fornecidas.
Metadados de fundamentação: metadados sobre a origem da fundamentação. Os metadados de fundamentação contêm as seguintes informações:
- Suporte de fragmentos: uma lista de fragmentos que suportam a resposta. A cada fragmento de apoio técnico é atribuído um índice de fragmento de apoio técnico que é útil ao rastrear a proveniência. Cada bloco de apoio técnico contém o seguinte:
  - Texto do fragmento: uma parte do texto citado literalmente da fonte da qual a resposta ou uma parte da resposta (denominada texto da reivindicação) é extraída. Este elemento pode nem sempre estar presente na resposta.
  - Origem: um índice atribuído à origem no pedido.
  - Metadados de origem: metadados sobre o fragmento. Consoante a origem, os metadados de origem podem ser qualquer um dos seguintes:
    - Para uma origem incorporada, os metadados podem ser os detalhes adicionais especificados no pedido, como o título, o autor ou o URI.
    - Para o repositório de dados do Vertex AI Search, os metadados podem ser o ID do documento, o título do documento, o URI (localização do Cloud Storage) ou o número da página.
    - Para a fundamentação com a Pesquisa Google, quando é gerado um resultado fundamentado, os metadados contêm um URI que redireciona para o publicador do conteúdo que foi usado para gerar o resultado fundamentado. Os metadados também contêm o domínio da editora. Os URIs fornecidos permanecem acessíveis durante um máximo de 30 dias após a geração do resultado fundamentado.
    Importante: o URI fornecido tem de ser acedido diretamente pelos utilizadores finais e não pode ser consultado programaticamente através de meios automáticos. Se for detetado acesso automatizado, o serviço Grounding com a Pesquisa Google pode deixar de fornecer os URIs de redirecionamento. Para reiniciar os URIs de redirecionamento, contacte o seu engenheiro de clientes.
- Apoio técnico de fundamentação: informações de fundamentação para uma afirmação na resposta. O apoio técnico de fundamentação contém as seguintes informações:
  - Texto da reivindicação: a resposta ou uma parte da resposta que é fundamentada com o texto do fragmento de apoio técnico.
  - Support chunk index: um índice atribuído ao fragmento de apoio técnico na ordem em que o fragmento aparece na lista de fragmentos de apoio técnico.
  - Consultas de pesquisa na Web: as consultas de pesquisa sugeridas para as sugestões da Pesquisa Google.
  - Sugestões de pesquisa: se receber sugestões de pesquisa do Google com uma resposta, essa resposta é um "resultado fundamentado" sujeito aos termos de serviço para fundamentação com a Pesquisa Google. Para mais informações, consulte os Termos de Serviço. O campo renderedContent no campo searchEntryPoint é o código fornecido para implementar sugestões da Pesquisa Google. Para usar as sugestões da Pesquisa Google, consulte o artigo Use as sugestões da Pesquisa Google.

Gerar uma resposta fundamentada num único turno

Esta secção descreve como gerar respostas baseadas nas seguintes fontes:

Texto inline e arquivo de dados do Vertex AI Search
Pesquisa Google

Fundamente a resposta no texto inline e no arquivo de dados do Vertex AI Search

O exemplo seguinte mostra como enviar texto de comando especificando um texto inline e um arquivo de dados do Vertex AI Search como a origem de fundamentação. Não pode especificar um arquivo de dados de pesquisa de Websites como a origem de fundamentação. Esta amostra usa o método generateGroundedContent.

REST

Envie o comando no seguinte pedido curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_1",
           "attributes": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ]
     }
   },
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_2",
           "attributes": {
             "title": "TITLE_2",
             "uri": "URI_2"
           }
         },
         {
           "factText": "FACT_TEXT_3",
           "attributes": {
             "title": "TITLE_3",
             "uri": "URI_3"
           }
         }
       ]
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_1/servingConfigs/default_search"
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_2/servingConfigs/default_search"
     }
   }
  ]
},
"generationSpec": {
  "modelId": "MODEL_ID",
  "temperature": TEMPERATURE,
  "topP": TOP_P,
  "topK": TOP_K
},
"user_context": {
  "languageCode: "LANGUAGE_CODE",
  "latLng": {
    "latitude": LATITUDE,
    "longitude": LONGITUDE
 },
}
}'

Substitua o seguinte:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do utilizador.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
FACT_TEXT_N: o texto inline para fundamentar a resposta. Pode fornecer um máximo de 100 textos de factos.
TITLE_N: um campo opcional para definir o meta atributo do título para o texto inline.
URI_N: um campo opcional para definir o atributo meta URI para o texto inline.
AUTHOR_N: um campo opcional para definir o meta atributo do autor para o texto inline.
APP_ID_N: o ID da app Vertex AI Search.
MODEL_ID: um campo opcional para definir o ID do modelo Gemini que quer usar para gerar a resposta fundamentada. Para ver uma lista dos IDs dos modelos disponíveis, consulte o artigo Modelos suportados.
TEMPERATURE: um campo opcional para definir a temperatura usada para a amostragem. A Google recomenda uma temperatura de 0,0. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_P: um campo opcional para definir o valor de top-P para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_K: um campo opcional para definir o valor top-K para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do fragmento devolvido. Se não for possível determinar o idioma a partir da consulta, este campo é usado. O valor predefinido é en. Para ver uma lista de códigos de idiomas, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Introduza o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Introduza o valor em graus decimais, por exemplo, 131.04.

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore": GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "CHUNK_TEXT_FROM_A_DOCUMENT_IN_A_DATA_STORE ",
           "source": "4",
           "sourceMetadata": {
             "title": "DOCUMENT_TITLE",
             "uri": "gs://PATH/TO/DOCUMENT.pdf",
             "document_id": "DOCUMENT_ID",
             "page_identifier": "PAGE_NUMBER"
           }
         },
         {
           "chunkText": "CHUNK_TEXT_FROM_FACT_TEXT_1",
           "source": "0",
           "sourceMetadata": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0,
             1
           ]
         }
       ]
     }
   }
 ]
}

Exemplo de geração de respostas de interação única baseada em texto inline e na Vertex AI Search

No exemplo seguinte, o pedido especifica as seguintes origens de fundamentação: um facto de texto inline e um arquivo de dados do Vertex AI Search. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta com um emoji de sorriso.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "How did Google do in 2020? Where can I find BigQuery docs?"
        }
      ]
    }
  ],
  "systemInstruction": {
      "parts": {
          "text": "Add a smiley emoji after the answer."
      }
  },
  "groundingSpec": {
    "groundingSources": [
      {
        "inline_source": {
          "grounding_facts": [
            {
              "fact_text": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction",
              "attributes": {
                "title": "BigQuery Overview",
                "uri": "https://cloud.google.com/bigquery/docs/introduction"
              }
            }
          ]
        }
      },
      {
        "searchSource": {
          "servingConfig": "projects/123456/locations/global/collections/default_collection/engines/app_id_example/servingConfigs/default_search"
        }
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  },
  "user_context": {
    "languageCode: "en",
    "latLng": {
       "latitude": 37.422131,
       "longitude": -122.084801
    }
  }
}'

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Google's revenue increased by 23% in 2020, reaching $182.5 billion. Google Cloud revenue was $13.1 billion for 2020. You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.86738646,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "title": "GOOG Exhibit 99.1 Q4'20",
             "page_identifier": "2",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf",
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243"
           }
         },
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243",
             "page_identifier": "2",
             "title": "GOOG Exhibit 99.1 Q4'20",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf"
           }
         },
         {
           "chunkText": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction ",
           "source": "0",
           "sourceMetadata": {
             "uri": "https://cloud.google.com/bigquery/docs/introduction",
             "title": "BigQuery Overview"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "Google's revenue increased by 23% in 2020, reaching $182.5 billion.",
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "Google Cloud revenue was $13.1 billion for 2020.",
           "supportChunkIndices": [
             1
           ]
         },
         {
           "claimText": "You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction.😊 ",
           "supportChunkIndices": [
             2
           ]
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"
# engine_id = "YOUR_ENGINE_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How did Google do in 2020? Where can I find BigQuery docs?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(
                text="Add a smiley emoji after the answer."
            )
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                inline_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.InlineSource(
                    grounding_facts=[
                        discoveryengine.GroundingFact(
                            fact_text=(
                                "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction"
                            ),
                            attributes={
                                "title": "BigQuery Overview",
                                "uri": "https://cloud.google.com/bigquery/docs/introduction",
                            },
                        ),
                    ]
                ),
            ),
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.SearchSource(
                    # The full resource name of the serving config for a Vertex AI Search App
                    serving_config=f"projects/{project_number}/locations/global/collections/default_collection/engines/{engine_id}/servingConfigs/default_search",
                ),
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Gere uma resposta fundamentada com a Pesquisa Google

Pode fundamentar as respostas geradas com dados da Web disponíveis publicamente.

Obtenção dinâmica

Pode usar a obtenção dinâmica no seu pedido para escolher quando desativar a fundamentação com a Pesquisa Google. Isto é útil quando o comando não requer uma resposta fundamentada na Pesquisa Google e os modelos suportados podem fornecer uma resposta com base nos respetivos conhecimentos sem fundamentação. Isto ajuda a gerir a latência, a qualidade e o custo de forma mais eficaz.

Limite e pontuação de previsão de obtenção dinâmica

Quando envia um pedido para gerar uma resposta fundamentada, o Vertex AI Search atribui uma classificação de previsão ao comando. A pontuação de previsão é um valor de vírgula flutuante no intervalo [0,1]. O seu valor depende de a instrução poder beneficiar da fundamentação da resposta com as informações mais atualizadas da Pesquisa Google. Por conseguinte, um comando que requer uma resposta baseada nos factos mais recentes na Web tem uma pontuação de previsão mais elevada, e um comando para o qual uma resposta gerada pelo modelo é suficiente tem uma pontuação de previsão mais baixa.

Seguem-se exemplos de alguns comandos e as respetivas pontuações de previsão.

Comando	Pontuação de previsão	Comentário
"Escreve um poema sobre peónias"	0,13	O modelo pode basear-se nos seus conhecimentos e a resposta não precisa de fundamentação
"Sugere um brinquedo para uma criança de 2 anos"	0,36	O modelo pode basear-se nos seus conhecimentos e a resposta não precisa de fundamentação
"Podes dar-me uma receita de guacamole de inspiração asiática?"	0,55	A Pesquisa Google pode dar uma resposta fundamentada, mas o fundamento não é estritamente necessário. O conhecimento do modelo pode ser suficiente
"O que é o Vertex AI Search? Como é que a fundamentação é faturada no Vertex AI Search?"	0,72	Requer que a Pesquisa Google gere uma resposta bem fundamentada
"Quem venceu o último Grande Prémio de F1?"	0.97	Requer que a Pesquisa Google gere uma resposta bem fundamentada

No seu pedido de geração de respostas fundamentadas, pode especificar uma configuração de obtenção dinâmica com um limite. O limite é um valor de vírgula flutuante no intervalo [0,1] e é predefinido como 0,7. Se o valor do limite for zero, a resposta é sempre baseada na Pesquisa Google. Para todos os outros valores de limite, aplica-se o seguinte:

Se a pontuação de previsão for igual ou superior ao limite, a resposta é fundamentada na Pesquisa Google. Um limite inferior implica que mais comandos têm respostas geradas com base na fundamentação com a Pesquisa Google.
Se a pontuação de previsão for inferior ao limite, o modelo pode continuar a gerar a resposta, mas não está fundamentada na Pesquisa Google.

Para encontrar um bom limite que se adeque às necessidades da sua empresa, pode criar um conjunto representativo de consultas que espera encontrar. Em seguida, pode ordenar as consultas de acordo com a pontuação de previsão na resposta e selecionar um bom limite para o seu exemplo de utilização.

Fundamente a resposta com a Pesquisa Google

O exemplo seguinte mostra como gerar uma resposta fundamentada a partir de um comando especificando a Pesquisa Google como fonte de fundamentação. Este exemplo usa o método generateGroundedContent.

REST

Envie o comando no seguinte pedido curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
 {
     "googleSearchSource": {
          "dynamicRetrievalConfig": {
              "predictor":{
                  "threshold": DYNAMIC_RETRIEVAL_THRESHOLD
              }
          }
     }
 }
]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'

Substitua o seguinte:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do utilizador.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
DYNAMIC_RETRIEVAL_THRESHOLD: um campo opcional para definir o limite para invocar a configuração de obtenção dinâmica. É um valor de vírgula flutuante no intervalo [0,1]. Se adicionar o campo dynamicRetrievalConfig, mas não definir o campo predictor ou threshold, o valor limite é predefinido como 0,7. Se não definir o campo dynamicRetrievalConfig, a resposta é sempre fundamentada.
MODEL_ID: um campo opcional para definir o ID do modelo Gemini que quer usar para gerar a resposta fundamentada. Para ver uma lista dos IDs dos modelos disponíveis, consulte o artigo Modelos suportados.
TEMPERATURE: um campo opcional para definir a temperatura usada para a amostragem. A Google recomenda uma temperatura de 0,0. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_P: um campo opcional para definir o valor de top-P para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_K: um campo opcional para definir o valor top-K para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do fragmento devolvido. Se não for possível determinar o idioma a partir da consulta, este campo é usado. O valor predefinido é en. Para ver uma lista de códigos de idiomas, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Introduza o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Introduza o valor em graus decimais, por exemplo, 131.04.

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
     }
   }
 ]
}
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {}
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": PREDICTION_SCORE
             }
           }
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How much is Google stock?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(text="Be comprehensive.")
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource(
                    # Optional: For Dynamic Retrieval
                    dynamic_retrieval_config=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration(
                        predictor=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration.DynamicRetrievalPredictor(
                            threshold=0.7
                        )
                    )
                )
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Exemplo de geração de respostas únicas baseadas na Pesquisa Google

No exemplo seguinte, o pedido especifica a Pesquisa Google como a fonte de base. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta com um emoji de sorriso.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [{
  "role": "user",
  "parts": [{
    "text": "What is vertex ai search?"
}]
}],
"systemInstruction": {
   "parts": {
      "text": "Add a smiley emoji after the answer."
   }
},
"groundingSpec": {
  "groundingSources": [
  {
      "googleSearchSource": {
        "dynamicRetrievalConfig": {
               "predictor":{
                   "threshold": 0.6
               }
           }
      }
  }
 ]
},
"generationSpec": {
  "modelId": "gemini-1.5-flash"
}
}
'

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Vertex AI Search is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents. It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents. \n\nHere are some key features of Vertex AI Search:\n\n* **No-code interface:**  Use natural language to design and build agents without writing code.\n* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.\n* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.\n* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.\n* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.\n* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.\n* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.\n\nVertex AI Search is designed to help developers create AI agents that can:\n\n* Answer complex questions\n* Provide support and personalize user experiences\n* Automate tasks and processes\n* Interact with backend systems\n\nOverall, Vertex AI Search is a powerful tool that makes it easier for developers to build and deploy generative AI agents, regardless of their experience level. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.80400103,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
          "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
          "domain": "example.com"
         }
        }
       ],
       "groundingSupport": [
         {
           "claimText": "Vertex AI Search is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents.",
           "supportScore": 0.9648506,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **No-code interface:**  Use natural language to design and build agents without writing code.",
           "supportScore": 0.77115613,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.",
           "supportScore": 0.9574074,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.",
           "supportScore": 0.9533333,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.",
           "supportScore": 0.9457701,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.",
           "supportScore": 0.97726375,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Provide support and personalize user experiences",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Automate tasks and processes",
           "supportScore": 0.82046676,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "what is vertex ai search"
       ],
       "searchEntryPoint": {
         "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=what+is+ai-applications&client=app-vertex-grounding&safesearch=active\"\u003ewhat is vertex ai search\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": 0.671875
             }
           }
         }
       ]
     }
   }
 ]
}

Gerar uma resposta fundamentada em várias interações

Na geração de respostas em várias fases, em cada pedido, tem de enviar todo o texto trocado entre o utilizador e o modelo em todas as fases anteriores. Isto garante a continuidade e mantém o contexto para gerar a resposta ao comando mais recente.

Para obter uma resposta fundamentada através da geração de respostas em várias interações, faça o seguinte:

REST

Os exemplos seguintes mostram como enviar texto de comando de seguimento em vários turnos. Estes exemplos usam o método generateGroundedContent e fundamentam as respostas com a Pesquisa Google. Pode usar passos semelhantes para gerar respostas fundamentadas com outras fontes de fundamentação.

Envie o primeiro comando no seguinte pedido curl.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_1"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Substitua o seguinte:
- PROJECT_NUMBER: o número do seu projeto Google Cloud .
- PROMPT_TEXT_TURN_1: o texto do comando do utilizador na primeira interação.
- SYSTEM_INSTRUCTION_TURN_1: um campo opcional para fornecer um preâmbulo ou algum contexto adicional. Para a geração de respostas com várias interações, tem de fornecer as instruções do sistema para cada interação.
- MODEL_ID: um campo opcional para definir o ID do modelo Gemini que quer usar para gerar a resposta fundamentada. Para ver uma lista dos IDs dos modelos disponíveis, consulte o artigo Modelos suportados.
- TEMPERATURE: um campo opcional para definir a temperatura usada para a amostragem. A Google recomenda uma temperatura de 0,0. Para mais informações, consulte os parâmetros do modelo Gemini.
- TOP_P: um campo opcional para definir o valor de top-P para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
- TOP_K: um campo opcional para definir o valor top-K para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
- LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do fragmento devolvido. Se não for possível determinar o idioma a partir da consulta, este campo é usado. O valor predefinido é en. Para ver uma lista de códigos de idiomas, consulte Idiomas.
- LATITUDE: um campo opcional para definir a latitude. Introduza o valor em graus decimais, por exemplo, -25.34.
- LONGITUDE: um campo opcional para definir a longitude. Introduza o valor em graus decimais, por exemplo, 131.04.
Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_1"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0,
           1
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
} 
```
Envie o segundo comando como acompanhamento. Adicione o primeiro comando do utilizador seguido da respetiva resposta do modelo para contexto.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "ANSWER_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_2"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_2"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Substitua o seguinte:
- PROJECT_NUMBER: o número do seu projeto Google Cloud .
- PROMPT_TEXT_TURN_1: o texto do comando do utilizador na primeira interação.
- ANSWER_TEXT_TURN_1: o texto da resposta do modelo no primeiro turno.
- PROMPT_TEXT_TURN_2: o texto do comando do utilizador no segundo turno.
- SYSTEM_INSTRUCTION_TURN_2: um campo opcional para fornecer um preâmbulo ou algum contexto adicional. Para a geração de respostas com várias interações, tem de fornecer as instruções do sistema para cada interação.
- MODEL_ID: um campo opcional para definir o ID do modelo Gemini que quer usar para gerar a resposta fundamentada. Para ver uma lista dos IDs dos modelos disponíveis, consulte o artigo Modelos suportados.
- TEMPERATURE: um campo opcional para definir a temperatura usada para a amostragem. A Google recomenda uma temperatura de 0,0. Para mais informações, consulte os parâmetros do modelo Gemini.
- TOP_P: um campo opcional para definir o valor de top-P para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
- TOP_K: um campo opcional para definir o valor top-K para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
- LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do fragmento devolvido. Se não for possível determinar o idioma a partir da consulta, este campo é usado. O valor predefinido é en. Para ver uma lista de códigos de idiomas, consulte Idiomas.
- LATITUDE: um campo opcional para definir a latitude. Introduza o valor em graus decimais, por exemplo, -25.34.
- LONGITUDE: um campo opcional para definir a longitude. Introduza o valor em graus decimais, por exemplo, 131.04.
Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_2"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1,
           2
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
}   
```
Repita este processo para obter mais respostas de seguimento. Em cada turno, adicione todos os comandos anteriores do utilizador, seguidos das respetivas respostas do modelo.

Exemplo de geração de respostas com várias interações

No exemplo seguinte, o pedido especifica três textos factuais inline como a origem de fundamentação para gerar respostas em dois turnos. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta no primeiro turno com um emoji de cara sorridente.

REST

Envie o primeiro comando no seguinte pedido curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 }
],
"systemInstruction": {
  "parts": {
      "text": "Add a smiley emoji after the answer."
  }
},
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
       }
     ]
   },
   "groundingScore": 1,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "uri": "some-uri-2",
           "title": "title_2"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "title": "title_3",
           "uri": "some-uri-3"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.",
         "supportScore": 1,
         "supportChunkIndices": [
           0,
           1,
           2
         ]
       }
     ]
   }
 }
]
}

Envie o segundo comando como acompanhamento. Adicione o primeiro comando do utilizador seguido da respetiva resposta do modelo para contexto.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "Rephrase the answer in an abstracted list."
     }
   ]
 }
],
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "- The global average surface temperature increased in 2023.\n- The world population surpassed 8 billion in 2023.\n- Global e-commerce sales reached an estimated $5.7 trillion in 2023. \n"
       }
     ]
   },
   "groundingScore": 0.99073017,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "uri": "some-uri-3",
           "title": "title_3"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "title": "title_2",
           "uri": "some-uri-2"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "- The global average surface temperature increased in 2023.",
         "supportScore": 0.9883382,
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "- The world population surpassed 8 billion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           1
         ]
       },
       {
         "claimText": "- Global e-commerce sales reached an estimated $5.7 trillion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           2
         ]
       }
     ]
   }
 }
]
}

Faça stream de respostas fundamentadas

Pode optar por transmitir as respostas do modelo. Isto é útil nos exemplos de utilização em que a resposta é especialmente longa e o envio da resposta completa de uma só vez causa um atraso significativo. O streaming da resposta divide a resposta num conjunto de vários candidatos que contêm partes sequenciais do texto da resposta.

Para obter uma resposta fundamentada transmitida, faça o seguinte:

REST

O exemplo seguinte mostra como transmitir uma resposta fundamentada. Este exemplo usa o método streamGenerateGroundedContent e fundamenta a resposta com a Pesquisa Google sem a configuração de obtenção dinâmica. Pode usar passos semelhantes para gerar respostas fundamentadas com outras fontes de fundamentação.

Envie o comando no seguinte pedido curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_NUMBER/locations/global:streamGenerateGroundedContent" \
-d '
[
{
 "contents": [
   {
     "role": "user",
     "parts": [
       {
         "text": "PROMPT_TEXT"
       }
     ]
   }
 ],
 "systemInstruction": {
     "parts": {
         "text": "SYSTEM_INSTRUCTION"
     }
 },
 "groundingSpec": {
   "groundingSources": [
     {
       "googleSearchSource": {}
     }
   ]
 },
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}
]'

Substitua o seguinte:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do utilizador.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
MODEL_ID: um campo opcional para definir o ID do modelo Gemini que quer usar para gerar a resposta fundamentada. Para ver uma lista dos IDs dos modelos disponíveis, consulte o artigo Modelos suportados.
TEMPERATURE: um campo opcional para definir a temperatura usada para a amostragem. A Google recomenda uma temperatura de 0,0. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_P: um campo opcional para definir o valor de top-P para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
TOP_K: um campo opcional para definir o valor top-K para o modelo. Para mais informações, consulte os parâmetros do modelo Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do fragmento devolvido. Se não for possível determinar o idioma a partir da consulta, este campo é usado. O valor predefinido é en. Para ver uma lista de códigos de idiomas, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Introduza o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Introduza o valor em graus decimais, por exemplo, 131.04.

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

[{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_1"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_2"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_3"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       }
     }
   }
 ]
}]

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="Summarize how to delete a data store in Vertex AI Agent Builder?"
                )
            ],
        )
    ],
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource()
            ),
        ]
    ),
)
responses = client.stream_generate_grounded_content(iter([request]))

for response in responses:
    # Handle the response
    print(response)

Exemplo de respostas fundamentadas em streaming

No exemplo seguinte, o pedido especifica a Pesquisa Google como a origem de base para transmitir uma resposta sem a configuração de obtenção dinâmica. A resposta transmitida é distribuída por vários candidatos a respostas. Esta amostra usa o método streamGenerateGroundedContent.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/123456/locations/global:streamGenerateGroundedContent" \
-d '
[
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Summarize How to delete a data store in Vertex AI Search?"
        }
      ]
    }
  ],
  "groundingSpec": {
    "groundingSources": [
      {
        "googleSearchSource": {}
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  }
}
]'

Resposta

Deve receber uma resposta JSON semelhante à seguinte resposta reduzida. Para compreender a sua resposta, consulte Dados de saída.

[{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "To"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " delete a data store in Vertex AI Search, you must first purge all data"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " from the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "supportChunks": [
        {
          "source": "0",
          "sourceMetadata": {
            "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
            "domain": "cloud.google.com"
          }
        }
      ],
      "groundingSupport": [
        {
          "claimText": "To delete a data store in Vertex AI Search, you must first purge all data from the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ],
      "webSearchQueries": [
        "how to delete a data store in vertex ai search"
      ],
      "searchEntryPoint": {
        "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=how+to+delete+a+data+store+in+ai+applications&client=app-vertex-grounding&safesearch=active\"\u003ehow to delete a data store in vertex ai search\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
      }
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You can purge data from a data store"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " using the Google Cloud console or the command line. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You can purge data from a data store using the Google Cloud console or the command line. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "Once the data is purged, you can delete the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "Once the data is purged, you can delete the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You cannot delete"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " a data store that is connected to an app. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You cannot delete a data store that is connected to an app. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must first delete the app that the data store is connected to. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must first delete the app that the data store is connected to. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You also"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " cannot delete a data store that is in the process of upgrading or downgrading. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You also cannot delete a data store that is in the process of upgrading or downgrading. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must wait for the upgrade or downgrade to complete before deleting the data store."
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " \n"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must wait for the upgrade or downgrade to complete before deleting the data store. \n",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
]

Modelos suportados

Os seguintes modelos suportam a fundamentação:

Gemini 1.5 Pro apenas com entrada de texto
Gemini 1.5 Flash com entrada apenas de texto

Para saber mais acerca destes modelos Gemini, consulte o artigo Versões e ciclo de vida do modelo Gemini.

Quando chama o método generateGroundedContent, pode usar os seguintes IDs de modelos:

ID do modelo	Atualizado automaticamente
`default`	Sim
`gemini-1.5-flash`	Sim
`gemini-1.5-flash-001`	Não
`gemini-1.5-flash-002`	Não
`gemini-1.5-pro`	Sim
`gemini-1.5-pro-001`	Não
`gemini-1.5-pro-002`	Não

O que se segue?

Saiba como usar o método de geração fundamentada com outras APIs RAG para gerar respostas fundamentadas a partir de dados não estruturados.