Se usó la API de Cloud Translation para traducir esta página.

Genera respuestas fundamentadas con RAG

Como parte de tu experiencia de generación mejorada por recuperación (RAG) en Vertex AI Agent Builder, puedes generar respuestas fundamentadas a las instrucciones en función de las siguientes fuentes de fundamentación:

Búsqueda de Google: Usa Grounding with Google Search si deseas conectar el modelo con conocimiento mundial, una amplia variedad de temas o información actualizada en Internet. La fundamentación con la Búsqueda de Google admite la recuperación dinámica, que te brinda la opción de generar Resultados Fundamentados con la Búsqueda de Google solo cuando sea necesario. Por lo tanto, la configuración de recuperación dinámica evalúa si una instrucción requiere conocimiento sobre eventos recientes y habilita la vinculación con la Búsqueda de Google. Para obtener más información, consulta Recuperación dinámica.
Importante: Si recibes sugerencias de la Búsqueda de Google con una respuesta, esa respuesta es un "Resultado fundamentado" sujeto a las condiciones de Fundamentación con la Búsqueda de Google en la sección Condiciones del Servicio de las Condiciones Específicas del Servicio. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.
Texto intercalado: Usa la fundamentación con texto intercalado para fundamentar la respuesta en fragmentos de texto llamados texto de hechos que se proporcionan en la solicitud. Un texto de hecho es una declaración proporcionada por el usuario que se considera fáctica para una solicitud determinada. El modelo no verifica la autenticidad del texto de los hechos.
Almacenes de datos de Vertex AI Search: Usa la fundamentación con Vertex AI Search si deseas conectar el modelo a tus documentos empresariales desde los almacenes de datos de Vertex AI Search.

En esta página, se describe cómo generar respuestas fundamentadas en función de estas fuentes de fundamentación con los siguientes enfoques:

Generación de respuestas de un solo turno
- Texto intercalado y almacén de datos de Vertex AI Search
- Búsqueda de Google
Generación de respuestas de varios turnos

Además, puedes elegir transmitir las respuestas desde el modelo. Generar una respuesta fundamentada mediante la transmisión es una función experimental.

Puedes usar otros métodos para generar respuestas fundamentadas que se adapten a tu aplicación. Para obtener más información, consulta APIs de Vertex AI para crear experiencias de búsqueda y RAG.

Terminología

Antes de usar el método de generación de respuestas fundamentadas, es útil comprender las entradas y salidas, cómo estructurar tu solicitud y la terminología relacionada con la RAG.

Términos de RAG

La RAG es una metodología que permite que los modelos de lenguaje grandes (LLM) generen respuestas basadas en la fuente de datos que elijas. Existen dos etapas en el RAG:

Recuperación: Obtener rápidamente los hechos más relevantes puede ser un problema de búsqueda común. Con la RAG, puedes recuperar rápidamente los hechos que son importantes para generar una respuesta.
Generación: El LLM usa los hechos recuperados para generar una respuesta fundamentada.

Por lo tanto, el método de generación de respuestas fundamentadas recupera los hechos de la fuente de fundamentación y genera una respuesta fundamentada.

Datos de entrada

El método de generación de respuestas fundamentadas requiere las siguientes entradas en la solicitud:

Rol: Es el remitente de un texto determinado que es un usuario (user) o un modelo (model).
Text: Cuando el rol es user, el texto es una instrucción y, cuando el rol es model, el texto es una respuesta fundamentada. La forma en que especificas el rol y el texto en una solicitud se determina de la siguiente manera:
- Para la generación de respuestas de un solo turno, el usuario envía el texto de la instrucción en la solicitud y el modelo envía el texto de la respuesta en la respuesta.
- Para una generación de respuestas de varios turnos, la solicitud contiene el par de instrucción-respuesta para todos los turnos anteriores y el texto de la instrucción del usuario para el turno actual. Por lo tanto, en una solicitud de este tipo, el rol es user para un texto de instrucción y model para el texto de la respuesta.
Instrucción del sistema: Es un preámbulo a tu instrucción que rige el comportamiento del modelo y modifica el resultado según corresponda. Por ejemplo, puedes agregar un arquetipo a la respuesta generada o indicarle al modelo que le dé formato al texto de salida de una manera determinada. Para la generación de respuestas de varios turnos, debes proporcionarle instrucciones al sistema para cada turno. Para obtener más información, consulta Usa instrucciones del sistema.

Fuente de los fundamentos: Es la fuente en la que se basa la respuesta y puede ser una o más de las siguientes:

Búsqueda de Google: Fundamenta las respuestas con los resultados de la Búsqueda de Google. Cuando la fuente de puesta a tierra es la Búsqueda de Google, puedes especificar una configuración de recuperación dinámica con un umbral de recuperación dinámica. Para obtener más información, consulta Recuperación dinámica.
Importante: Si recibes sugerencias de la Búsqueda de Google con una respuesta, esa respuesta es un "Resultado fundamentado" sujeto a las condiciones de Fundamentación con la Búsqueda de Google en la sección Condiciones del Servicio de las Condiciones Específicas del Servicio. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.
Texto intercalado: Basar la respuesta en el texto de hechos que se proporciona en la solicitud Un texto de hecho es una declaración proporcionada por el usuario que se considera fáctica para una solicitud determinada. El modelo no verifica la autenticidad del texto de los hechos. Puedes proporcionar un máximo de 100 textos de datos en cada fuente de texto intercalado. Los textos de hechos se pueden admitir con metaatributos, como el título, el autor y el URI. Estos meta atributos se muestran en la respuesta cuando se citan los fragmentos que respaldan la respuesta.
Almacenes de datos de Vertex AI Search: Fundamenta la respuesta en los documentos de los almacenes de datos de Vertex AI Search. No puedes especificar un almacén de datos de búsqueda de sitios web como la fuente de puesta a tierra.

En una solicitud determinada, puedes proporcionar una fuente de texto intercalado y una fuente de almacén de datos de Vertex AI Search. No puedes combinar la Búsqueda de Google con ninguna de estas fuentes. Por lo tanto, si deseas fundamentar tus respuestas con los resultados de la Búsqueda de Google, debes enviar una solicitud independiente en la que especifiques la Búsqueda de Google como la única fuente de fundamentación.

Puedes proporcionar un máximo de 10 fuentes de puesta a tierra en cualquier orden. Por ejemplo, supongamos que proporcionas las fuentes de puesta a tierra con el siguiente recuento, en el siguiente orden para obtener un total de 10 fuentes de puesta a tierra:

Tres fuentes de texto intercalado, cada una de las cuales puede contener un máximo de 100 textos de hechos
Seis almacenes de datos de Vertex AI Search
Una fuente de texto intercalado que contiene un máximo de 100 textos de hechos

A cada fuente se le asigna un índice en el orden en que se especifica en la solicitud. Por ejemplo, si especificaste una combinación de fuentes en tu solicitud, el índice de origen se asigna como se muestra en la siguiente tabla:

Fuente de los fundamentos	Índice
Texto intercalado n° 1	0
Texto intercalado n° 2	1
Almacén de datos de Vertex AI Search n.° 1	2
Texto intercalado n.° 3	3
Almacén de datos de Vertex AI Search n.° 2	4

Este índice se cita en la respuesta y es útil para rastrear el origen.

Especificaciones de generación: Son las especificaciones para la configuración del modelo que consisten en la siguiente información:
- ID de modelo: Especifica el modelo de Gemini de Vertex AI que se usará para la generación de respuestas. Para obtener una lista de los modelos que puedes usar para generar respuestas fundamentadas, consulta Modelos compatibles.
- Parámetros del modelo: Especifica los parámetros que puedes configurar para el modelo que elijas usar. Estos parámetros son: idioma, temperatura, Top-P y Top-K. Para obtener más información sobre estos parámetros, consulta Parámetros del modelo de Gemini.
Código de idioma: El idioma de la respuesta generada suele establecerse para coincidir con el idioma de la instrucción. Si no hay un solo idioma en la instrucción (por ejemplo, si la instrucción es muy breve y puede ser válida en varios idiomas), el campo de código de idioma determina el idioma de la respuesta.

Para obtener una lista de los códigos de idioma, consulta Idiomas.
Latitud y longitud: Especifica la latitud y la longitud del usuario. Si la consulta contiene preguntas específicas de ubicación, como "Buscar una cafetería cerca de mí", se usan estos campos. Si no se puede determinar el idioma de la búsqueda y no se establece el código de idioma, se usan la latitud y la longitud para determinar el idioma de la respuesta.

Datos de salida

La respuesta que genera el modelo se denomina candidato y contiene los siguientes datos. Es posible que no todos los campos estén presentes en el resultado.

Rol: Es el remitente de la respuesta fundamentada. La respuesta siempre contiene el texto de la respuesta fundamentada. Por lo tanto, el rol en una respuesta siempre es un modelo.
Texto: Es una respuesta fundamentada.
Puntuación de fundamentación: Es un valor de número de punto flotante en el rango [0, 1] que indica qué tan bien se fundamenta una respuesta en las fuentes proporcionadas.
Metadatos de puesta a tierra: Son metadatos sobre la fuente de puesta a tierra. Los metadatos de puesta a tierra contienen la siguiente información:
- Fragmentos de compatibilidad: Es una lista de fragmentos que respaldan la respuesta. A cada fragmento de compatibilidad se le asigna un índice de fragmento de compatibilidad que es útil cuando se rastrea la procedencia. Cada fragmento de compatibilidad contiene lo siguiente:
  - Texto de fragmento: Es un fragmento de texto citado textualmente de la fuente de la que se extrae la respuesta o una parte de la respuesta (denominada texto de la declaración). Es posible que no siempre esté presente en la respuesta.
  - Fuente: Es un índice asignado a la fuente en la solicitud.
  - Metadatos de origen: Son metadatos sobre el fragmento. Según la fuente, los metadatos de la fuente pueden ser cualquiera de los siguientes:
    - En el caso de una fuente intercalada, los metadatos pueden ser los detalles adicionales que se especificaron en la solicitud, como el título, el autor o el URI.
    - En el caso del almacén de datos de Vertex AI Search, los metadatos pueden ser el ID del documento, el título del documento, el URI (ubicación de Cloud Storage) o el número de página.
    - En el caso de Fundamentos con la Búsqueda de Google, cuando se genera un resultado basado en la ubicación, los metadatos contienen un URI que redirecciona al editor del contenido que se usó para generar el resultado basado en la ubicación. Los metadatos también contienen el dominio del publicador. Se puede acceder a los URIs proporcionados durante un máximo de 30 días después de que se genera el resultado de la conexión a tierra.
    Importante: Los usuarios finales deben poder acceder directamente al URI proporcionado y no se debe consultar de forma programática a través de medios automatizados. Si se detecta acceso automatizado, es posible que el servicio de Grounding with Google Search deje de proporcionar los URIs de redireccionamiento. Para reiniciar los URI de redireccionamiento, comunícate con el Ingeniero de atención al cliente.
- Certificación de fuentes: Es la información de respaldo de una afirmación en la respuesta. La asistencia de puesta a tierra contiene la siguiente información:
  - Texto del argumento: Es la respuesta o una parte de la respuesta que se justifica con el texto del fragmento de respaldo.
  - Índice de fragmento de compatibilidad: Es un índice asignado al fragmento de compatibilidad en el orden en que aparece en la lista de fragmentos de compatibilidad.
  - Búsquedas web: Son las búsquedas sugeridas para las sugerencias de la Búsqueda de Google.
  - Sugerencias de búsqueda: Si recibes sugerencias de la Búsqueda de Google con una respuesta, esa respuesta es un "Resultado fundamentado" sujeto a las condiciones del servicio de Grounding with Google Search. Para obtener más información, consulta las Condiciones del Servicio . El campo renderedContent dentro del campo searchEntryPoint es el código proporcionado para implementar las sugerencias de la Búsqueda de Google. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.

Genera una respuesta fundamentada en un solo turno

En esta sección, se describe cómo generar respuestas basadas en las siguientes fuentes:

Texto intercalado y almacén de datos de Vertex AI Search
Búsqueda de Google

Fundamenta la respuesta en el texto intercalado y el almacén de datos de Vertex AI Search

En el siguiente ejemplo, se muestra cómo enviar texto de instrucción especificando un texto intercalado y un almacén de datos de Vertex AI Search como fuente de fundamentación. No puedes especificar un almacén de datos de búsqueda de sitios web como fuente de puesta a tierra. En este ejemplo, se usa el método generateGroundedContent.

REST

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_1",
           "attributes": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ]
     }
   },
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_2",
           "attributes": {
             "title": "TITLE_2",
             "uri": "URI_2"
           }
         },
         {
           "factText": "FACT_TEXT_3",
           "attributes": {
             "title": "TITLE_3",
             "uri": "URI_3"
           }
         }
       ]
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_1/servingConfigs/default_search"
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_2/servingConfigs/default_search"
     }
   }
  ]
},
"generationSpec": {
  "modelId": "MODEL_ID",
  "temperature": TEMPERATURE,
  "topP": TOP_P,
  "topK": TOP_K
},
"user_context": {
  "languageCode: "LANGUAGE_CODE",
  "latLng": {
    "latitude": LATITUDE,
    "longitude": LONGITUDE
 },
}
}'

Reemplaza lo siguiente:

PROJECT_NUMBER: El número de tu proyecto de Google Cloud .
PROMPT_TEXT: Es la instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
FACT_TEXT_N: El texto intercalado para fundamentar la respuesta. Puedes proporcionar un máximo de 100 textos de hechos.
TITLE_N: Es un campo opcional para establecer el atributo meta de título para el texto intercalado.
URI_N: Es un campo opcional para establecer el atributo meta URI del texto intercalado.
AUTHOR_N: Es un campo opcional para establecer el atributo meta de autor para el texto intercalado.
APP_ID_N: El ID de la app de Vertex AI Search.
MODEL_ID: Un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelo disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: un campo opcional para establecer el valor Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se muestra. Si no se puede determinar el idioma a partir de la consulta, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: Un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore": GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "CHUNK_TEXT_FROM_A_DOCUMENT_IN_A_DATA_STORE ",
           "source": "4",
           "sourceMetadata": {
             "title": "DOCUMENT_TITLE",
             "uri": "gs://PATH/TO/DOCUMENT.pdf",
             "document_id": "DOCUMENT_ID",
             "page_identifier": "PAGE_NUMBER"
           }
         },
         {
           "chunkText": "CHUNK_TEXT_FROM_FACT_TEXT_1",
           "source": "0",
           "sourceMetadata": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0,
             1
           ]
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"
# engine_id = "YOUR_ENGINE_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-1.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How did Google do in 2020? Where can I find BigQuery docs?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(
                text="Add a smiley emoji after the answer."
            )
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                inline_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.InlineSource(
                    grounding_facts=[
                        discoveryengine.GroundingFact(
                            fact_text=(
                                "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction"
                            ),
                            attributes={
                                "title": "BigQuery Overview",
                                "uri": "https://cloud.google.com/bigquery/docs/introduction",
                            },
                        ),
                    ]
                ),
            ),
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.SearchSource(
                    # The full resource name of the serving config for a Vertex AI Search App
                    serving_config=f"projects/{project_number}/locations/global/collections/default_collection/engines/{engine_id}/servingConfigs/default_search",
                ),
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Ejemplo de generación de respuestas de un solo turno basada en texto intercalado y Vertex AI Search

En el siguiente ejemplo, la solicitud especifica las siguientes fuentes de fundamentación: un hecho de texto intercalado y un almacén de datos de Vertex AI Search. En este ejemplo, se usa el método generateGroundedContent. En este ejemplo, también se usa una instrucción del sistema para finalizar la respuesta con un emoji de cara sonriente.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "How did google do in 2020? Where can I find Bigquery docs?"
        }
      ]
    }
  ],
  "systemInstruction": {
      "parts": {
          "text": "Add a smiley emoji after the answer."
      }
  },
  "groundingSpec": {
    "groundingSources": [
      {
        "inline_source": {
          "grounding_facts": [
            {
              "fact_text": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction",
              "attributes": {
                "title": "BigQuery Overview",
                "uri": "https://cloud.google.com/bigquery/docs/introduction"
              }
            }
          ]
        }
      },
      {
        "searchSource": {
          "servingConfig": "projects/123456/locations/global/collections/default_collection/engines/app_id_example/servingConfigs/default_search"
        }
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  },
  "user_context": {
    "languageCode: "en",
    "latLng": {
       "latitude": 37.422131,
       "longitude": -122.084801
    }
  }
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Google's revenue increased by 23% in 2020, reaching $182.5 billion. Google Cloud revenue was $13.1 billion for 2020. You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.86738646,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: “Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future.” Ruth Porat, CFO of Google and Alphabet, said: “Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see.” New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned “Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues” for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "title": "GOOG Exhibit 99.1 Q4'20",
             "page_identifier": "2",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf",
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243"
           }
         },
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: “Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future.” Ruth Porat, CFO of Google and Alphabet, said: “Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see.” New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned “Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues” for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243",
             "page_identifier": "2",
             "title": "GOOG Exhibit 99.1 Q4'20",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf"
           }
         },
         {
           "chunkText": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction ",
           "source": "0",
           "sourceMetadata": {
             "uri": "https://cloud.google.com/bigquery/docs/introduction",
             "title": "BigQuery Overview"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "Google's revenue increased by 23% in 2020, reaching $182.5 billion.",
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "Google Cloud revenue was $13.1 billion for 2020.",
           "supportChunkIndices": [
             1
           ]
         },
         {
           "claimText": "You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction.😊 ",
           "supportChunkIndices": [
             2
           ]
         }
       ]
     }
   }
 ]
}

Genera una respuesta fundamentada con la Búsqueda de Google

Puedes fundamentar las respuestas generadas con datos web disponibles públicamente.

Recuperación dinámica

Puedes usar la recuperación dinámica en tu solicitud para elegir cuándo desactivar la fundamentación con la Búsqueda de Google. Esto es útil cuando la instrucción no requiere una respuesta basada en la Búsqueda de Google y los modelos compatibles pueden proporcionar una respuesta basada en su conocimiento sin fundamentación. Esto te ayuda a administrar la latencia, la calidad y el costo de manera más eficaz.

Puntuación y umbral de predicción de recuperación dinámica

Cuando envías una solicitud para generar una respuesta fundamentada, Vertex AI Agent Builder asigna una puntuación de predicción a la instrucción. La puntuación de predicción es un valor de punto flotante en el rango [0,1]. Su valor depende de si la instrucción puede beneficiarse de fundamentar la respuesta con la información más actualizada de la Búsqueda de Google. Por lo tanto, una instrucción que requiere una respuesta basada en los hechos más recientes de la Web tiene una puntuación de predicción más alta, y una instrucción para la que una respuesta generada por un modelo es suficiente tiene una puntuación de predicción más baja.

Estos son ejemplos de algunas instrucciones y sus puntuaciones de predicción.

Instrucción	Puntuación de predicción	Comentario
"Escribe un poema sobre las peonías"	0.13	El modelo puede basarse en su conocimiento y la respuesta no necesita fundamentación.
"Sugiere un juguete para un niño de 2 años"	0.36	El modelo puede basarse en su conocimiento y la respuesta no necesita fundamentación.
"¿Puedes darme la receta de un guacamole inspirado en la cocina asiática?"	0.55	La Búsqueda de Google puede proporcionar una respuesta fundamentada, pero no es estrictamente necesaria; el conocimiento del modelo puede ser suficiente.
"¿Qué es Agent Builder? "¿Cómo se factura la conexión a tierra en Agent Builder?"	0.72	Requiere que la Búsqueda de Google genere una respuesta fundamentada
"¿Quién ganó el último Gran Premio de Fórmula 1?"	0.97	Requiere que la Búsqueda de Google genere una respuesta fundamentada

En tu solicitud de generación de respuestas fundamentadas, puedes especificar una configuración de recuperación dinámica con un umbral. El umbral es un valor de punto flotante en el rango [0,1] y su valor predeterminado es 0.7. Si el valor del umbral es cero, la respuesta siempre se basa en la Búsqueda de Google. Para todos los demás valores de umbral, se aplica lo siguiente:

Si la puntuación de predicción es mayor o igual que el umbral, la respuesta se basa en la Búsqueda de Google. Un umbral más bajo implica que más instrucciones tienen respuestas que se generan con la fundamentación en la Búsqueda de Google.
Si la puntuación de la predicción es inferior al umbral, es posible que el modelo genere la respuesta, pero no se basa en la Búsqueda de Google.

Para encontrar un buen umbral que se adapte a las necesidades de tu empresa, puedes crear un conjunto representativo de las búsquedas que esperas encontrar. Luego, puedes ordenar las consultas según la puntuación de predicción en la respuesta y seleccionar un buen umbral para tu caso de uso.

Cómo fundamentar la respuesta con la Búsqueda de Google

En el siguiente ejemplo, se muestra cómo generar una respuesta basada en una instrucción especificando la Búsqueda de Google como la fuente de información. En este ejemplo, se usa el método generateGroundedContent.

REST

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
 {
     "googleSearchSource": {
          "dynamicRetrievalConfig": {
              "predictor":{
                  "threshold": DYNAMIC_RETRIEVAL_THRESHOLD
              }
          }
     }
 }
]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'

Reemplaza lo siguiente:

PROJECT_NUMBER: El número de tu proyecto de Google Cloud .
PROMPT_TEXT: Es la instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
DYNAMIC_RETRIEVAL_THRESHOLD: Es un campo opcional para establecer el umbral para invocar la configuración de recuperación dinámica. Es un valor de punto flotante en el rango [0,1]. Si agregas el campo dynamicRetrievalConfig, pero no configuras el campo predictor o threshold, el valor del umbral se establece de forma predeterminada en 0.7. Si no configuras el campo dynamicRetrievalConfig, la respuesta siempre estará a tierra.
MODEL_ID: Un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelo disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: un campo opcional para establecer el valor Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se muestra. Si no se puede determinar el idioma a partir de la consulta, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: Un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
     }
   }
 ]
}
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {}
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": PREDICTION_SCORE
             }
           }
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-1.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How much is Google stock?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(text="Be comprehensive.")
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource(
                    # Optional: For Dynamic Retrieval
                    dynamic_retrieval_config=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration(
                        predictor=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration.DynamicRetrievalPredictor(
                            threshold=0.7
                        )
                    )
                )
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Ejemplo de generación de respuestas de un solo turno fundamentadas en la Búsqueda de Google

En el siguiente ejemplo, la solicitud especifica la Búsqueda de Google como la fuente de referencia. En este ejemplo, se usa el método generateGroundedContent. En este ejemplo, también se usa una instrucción del sistema para finalizar la respuesta con un emoji de sonrisa.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [{
  "role": "user",
  "parts": [{
    "text": "What is vertex ai agent builder?"
}]
}],
"systemInstruction": {
   "parts": {
      "text": "Add a smiley emoji after the answer."
   }
},
"groundingSpec": {
  "groundingSources": [
  {
      "googleSearchSource": {
        "dynamicRetrievalConfig": {
               "predictor":{
                   "threshold": 0.6
               }
           }
      }
  }
 ]
},
"generationSpec": {
  "modelId": "gemini-1.5-flash"
}
}
'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Vertex AI Agent Builder is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents. It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents. \n\nHere are some key features of Vertex AI Agent Builder:\n\n* **No-code interface:**  Use natural language to design and build agents without writing code.\n* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.\n* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.\n* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.\n* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.\n* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.\n* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.\n\nVertex AI Agent Builder is designed to help developers create AI agents that can:\n\n* Answer complex questions\n* Provide support and personalize user experiences\n* Automate tasks and processes\n* Interact with backend systems\n\nOverall, Vertex AI Agent Builder is a powerful tool that makes it easier for developers to build and deploy generative AI agents, regardless of their experience level. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.80400103,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
          "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
          "domain": "example.com"
         }
        }
       ],
       "groundingSupport": [
         {
           "claimText": "Vertex AI Agent Builder is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents.",
           "supportScore": 0.9648506,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **No-code interface:**  Use natural language to design and build agents without writing code.",
           "supportScore": 0.77115613,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.",
           "supportScore": 0.9574074,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.",
           "supportScore": 0.9533333,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.",
           "supportScore": 0.9457701,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.",
           "supportScore": 0.97726375,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Provide support and personalize user experiences",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Automate tasks and processes",
           "supportScore": 0.82046676,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "what is vertex ai agent builder"
       ],
       "searchEntryPoint": {
         "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=what+is+vertex+ai+agent+builder&client=app-vertex-grounding&safesearch=active\"\u003ewhat is vertex ai agent builder\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": 0.671875
             }
           }
         }
       ]
     }
   }
 ]
}

Genera una respuesta fundamentada en varios turnos

En la generación de respuestas de varios turnos, en cada solicitud, debes enviar todo el texto que se intercambió entre el usuario y el modelo en todos los turnos anteriores. Esto garantiza la continuidad y mantiene el contexto para generar la respuesta de la instrucción más reciente.

Para obtener una respuesta fundamentada mediante la generación de respuestas de varios turnos, haz lo siguiente:

REST

En los siguientes ejemplos, se muestra cómo enviar texto de indicaciones de seguimiento en varios turnos. En estos ejemplos, se usa el método generateGroundedContent y se basan las respuestas en la Búsqueda de Google. Puedes seguir pasos similares para generar respuestas fundamentadas con otras fuentes de fundamentación.

Envía la primera instrucción en la siguiente solicitud curl.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_1"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Reemplaza lo siguiente:
- PROJECT_NUMBER: El número de tu proyecto de Google Cloud .
- PROMPT_TEXT_TURN_1: Es el texto de la instrucción del usuario en el primer turno.
- SYSTEM_INSTRUCTION_TURN_1: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional. Para la generación de respuestas de varios turnos, debes proporcionar las instrucciones del sistema para cada turno.
- MODEL_ID: Un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelo disponibles, consulta Modelos compatibles.
- TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_P: un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_K: un campo opcional para establecer el valor Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- LANGUAGE_CODE: Un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se muestra. Si no se puede determinar el idioma a partir de la consulta, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
- LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
- LONGITUDE: Un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.
Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_1"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0,
           1
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
} 
```
Envía la segunda instrucción como un mensaje de seguimiento. Agrega la primera instrucción del usuario seguida de su respuesta correspondiente del modelo para el contexto.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "ANSWER_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_2"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_2"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Reemplaza lo siguiente:
- PROJECT_NUMBER: El número de tu proyecto de Google Cloud .
- PROMPT_TEXT_TURN_1: Es el texto de la instrucción del usuario en el primer turno.
- ANSWER_TEXT_TURN_1: El texto de la respuesta del modelo en el primer turno.
- PROMPT_TEXT_TURN_2: Es el texto de la instrucción del usuario en el segundo turno.
- SYSTEM_INSTRUCTION_TURN_2: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional. Para la generación de respuestas de varios turnos, debes proporcionar las instrucciones del sistema para cada turno.
- MODEL_ID: Un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelo disponibles, consulta Modelos compatibles.
- TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_P: un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_K: un campo opcional para establecer el valor Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- LANGUAGE_CODE: Un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se muestra. Si no se puede determinar el idioma a partir de la consulta, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
- LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
- LONGITUDE: Un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.
Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_2"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1,
           2
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
}   
```
Repite este proceso para obtener más respuestas de seguimiento. En cada turno, agrega todas las instrucciones anteriores del usuario, seguidas de sus respuestas correspondientes del modelo.

Ejemplo de generación de respuestas de varios turnos

En el siguiente ejemplo, la solicitud especifica tres textos de hechos intercalados como la fuente de información para generar respuestas en dos turnos. En esta muestra, se usa el método generateGroundedContent. En este ejemplo, también se usa una instrucción del sistema para finalizar la respuesta en el primer turno con un emoji de sonrisa.

REST

Envía la primera instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 }
],
"systemInstruction": {
  "parts": {
      "text": "Add a smiley emoji after the answer."
  }
},
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
       }
     ]
   },
   "groundingScore": 1,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "uri": "some-uri-2",
           "title": "title_2"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "title": "title_3",
           "uri": "some-uri-3"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.",
         "supportScore": 1,
         "supportChunkIndices": [
           0,
           1,
           2
         ]
       }
     ]
   }
 }
]
}

Envía la segunda instrucción como un mensaje de seguimiento. Agrega la primera instrucción del usuario seguida de su respuesta correspondiente del modelo para el contexto.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "Rephrase the answer in an abstracted list."
     }
   ]
 }
],
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "- The global average surface temperature increased in 2023.\n- The world population surpassed 8 billion in 2023.\n- Global e-commerce sales reached an estimated $5.7 trillion in 2023. \n"
       }
     ]
   },
   "groundingScore": 0.99073017,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "uri": "some-uri-3",
           "title": "title_3"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "title": "title_2",
           "uri": "some-uri-2"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "- The global average surface temperature increased in 2023.",
         "supportScore": 0.9883382,
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "- The world population surpassed 8 billion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           1
         ]
       },
       {
         "claimText": "- Global e-commerce sales reached an estimated $5.7 trillion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           2
         ]
       }
     ]
   }
 }
]
}

Cómo transmitir respuestas fundamentadas

Puedes transmitir las respuestas del modelo. Esto es útil en aquellos casos en los que la respuesta es especialmente larga y enviar toda la respuesta a la vez causa una demora significativa. La transmisión de la respuesta la divide en un array de varios candidatos que contienen partes secuenciales del texto de la respuesta.

Para obtener una respuesta transmitida y fundamentada, haz lo siguiente:

REST

En el siguiente ejemplo, se muestra cómo transmitir una respuesta fundamentada. En este ejemplo, se usa el método streamGenerateGroundedContent y se basa la respuesta en la Búsqueda de Google sin la configuración de recuperación dinámica. Puedes seguir pasos similares para generar respuestas fundamentadas con otras fuentes de fundamentación.

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_NUMBER/locations/global:streamGenerateGroundedContent" \
-d '
[
{
 "contents": [
   {
     "role": "user",
     "parts": [
       {
         "text": "PROMPT_TEXT"
       }
     ]
   }
 ],
 "systemInstruction": {
     "parts": {
         "text": "SYSTEM_INSTRUCTION"
     }
 },
 "groundingSpec": {
   "groundingSources": [
     {
       "googleSearchSource": {}
     }
   ]
 },
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}
]'

Reemplaza lo siguiente:

PROJECT_NUMBER: El número de tu proyecto de Google Cloud .
PROMPT_TEXT: Es la instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
MODEL_ID: Un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelo disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: un campo opcional para establecer el valor Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se muestra. Si no se puede determinar el idioma a partir de la consulta, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: Un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

[{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_1"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_2"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_3"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       }
     }
   }
 ]
}]

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-1.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="Summarize how to delete a data store in Vertex AI Agent Builder?"
                )
            ],
        )
    ],
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource()
            ),
        ]
    ),
)
responses = client.stream_generate_grounded_content(iter([request]))

for response in responses:
    # Handle the response
    print(response)

Ejemplo para transmitir respuestas fundamentadas

En el siguiente ejemplo, la solicitud especifica la Búsqueda de Google como la fuente de referencia para transmitir una respuesta sin la configuración de recuperación dinámica. La respuesta transmitida se distribuye en varios candidatos de respuesta. En este ejemplo, se usa el método streamGenerateGroundedContent.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/123456/locations/global:streamGenerateGroundedContent" \
-d '
[
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Summarize How to delete a data store in Vertex AI Agent Builder?"
        }
      ]
    }
  ],
  "groundingSpec": {
    "groundingSources": [
      {
        "googleSearchSource": {}
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  }
}
]'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

[{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "To"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " delete a data store in Vertex AI Agent Builder, you must first purge all data"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " from the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "supportChunks": [
        {
          "source": "0",
          "sourceMetadata": {
            "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
            "domain": "cloud.google.com"
          }
        }
      ],
      "groundingSupport": [
        {
          "claimText": "To delete a data store in Vertex AI Agent Builder, you must first purge all data from the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ],
      "webSearchQueries": [
        "how to delete a data store in vertex ai agent builder"
      ],
      "searchEntryPoint": {
        "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=how+to+delete+a+data+store+in+vertex+ai+agent+builder&client=app-vertex-grounding&safesearch=active\"\u003ehow to delete a data store in vertex ai agent builder\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
      }
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You can purge data from a data store"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " using the Google Cloud console or the command line. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You can purge data from a data store using the Google Cloud console or the command line. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "Once the data is purged, you can delete the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "Once the data is purged, you can delete the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You cannot delete"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " a data store that is connected to an app. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You cannot delete a data store that is connected to an app. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must first delete the app that the data store is connected to. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must first delete the app that the data store is connected to. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You also"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " cannot delete a data store that is in the process of upgrading or downgrading. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You also cannot delete a data store that is in the process of upgrading or downgrading. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must wait for the upgrade or downgrade to complete before deleting the data store."
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " \n"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must wait for the upgrade or downgrade to complete before deleting the data store. \n",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
]

Modelos compatibles

Los siguientes modelos admiten la fundamentación:

Gemini 1.5 Pro solo con entrada de texto
Gemini 1.5 Flash solo con entrada de texto
Gemini 1.0 Pro solo con entrada de texto

Para obtener más información sobre estos modelos de Gemini, consulta Versiones de modelos y ciclo de vida de Gemini.

Cuando llames al método generateGroundedContent, puedes usar los siguientes ID de modelos:

ID de modelo	Actualización automática
`default`	Sí
`gemini-1.0-pro`	Sí
`gemini-1.0-pro-001`	No
`gemini-1.0-pro-002`	No
`gemini-1.5-flash`	Sí
`gemini-1.5-flash-001`	No
`gemini-1.5-flash-002`	No
`gemini-1.5-pro`	Sí
`gemini-1.5-pro-001`	No
`gemini-1.5-pro-002`	No

Modelos de alta fidelidad

En el caso de los casos de uso de uso general, como la asistencia de viaje, el método de generación de respuestas fundamentadas puede generar buenos resultados si se combina el contexto proporcionado, como el texto intercalado o los datos empresariales, con el entrenamiento del modelo. Sin embargo, las industrias especializadas, como los servicios financieros, la atención médica y los seguros, a menudo requieren que los resultados generados provengan exclusivamente del contexto proporcionado. Para admitir esos casos de uso de fundamentación, el siguiente modelo de alta fidelidad está disponible para usarse con el método de generación de respuestas fundamentadas:

Nombre del modelo	ID de modelo	Basado en	Ventana de contexto	Descripción
Gemini 1.5 Flash de alta fidelidad	`gemini-1.5-flash-002-high-fidelity`	Modelo Gemini 1.5 Flash	32,000	Acepta instrucciones de texto como entradas y genera respuestas de texto basadas en el contexto. Se enfoca en la precisión, la confiabilidad y la seguridad.

¿Qué sigue?

Aprende a usar el método de generación de respuestas fundamentadas con otras APIs de RAG para generar respuestas fundamentadas a partir de datos no estructurados.