Guía de inicio rápido: Genera texto con la API de Vertex AI Gemini
En esta guía de inicio rápido, enviarás las siguientes solicitudes multimodales a la API de Gemini de Vertex AI y verás las respuestas:
- Una instrucción de texto
- Una instrucción y una imagen
- Una instrucción y un archivo de video (con una pista de audio)
Para completar esta guía, puedes usar un SDK de lenguaje de programación en tu entorno local o la API de REST.
Requisitos previos
Para completar esta guía de inicio rápido, debes hacer lo siguiente:
- Configura un proyecto de Google Cloud y habilita la API de Vertex AI
- En tu máquina local, haz lo siguiente:
- Instala, inicializa y autentica con Google Cloud CLI
- Instala el SDK para tu idioma
Configura un proyecto de Google Cloud
Configura tu proyecto de Google Cloud y habilita la API de Vertex AI.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Configura la CLI de Google Cloud
En tu máquina local, configura y autentica con Google Cloud CLI. Si estás familiarizado con la API de Gemini en Google AI Studio, ten en cuenta que la API de Gemini de Vertex AI usa Identity and Access Management en lugar de claves de API para administrar el acceso.
-
Instala y, luego, inicializa Google Cloud CLI.
-
Si ya instalaste gcloud CLI, ejecuta este comando para asegurarte de que los componentes de
gcloud
estén actualizados.gcloud components update
-
Para autenticarte con gcloud CLI, ejecuta este comando para generar un archivo local de credenciales predeterminadas de la aplicación (ADC). El flujo web que inicia el comando se usa para proporcionar tus credenciales de usuario.
gcloud auth application-default login
Para obtener más información, consulta Configura credenciales predeterminadas de la aplicación.
Configura el SDK para tu lenguaje de programación
En tu máquina local, haz clic en una de las siguientes pestañas para instalar el SDK de tu lenguaje de programación.
Python
Ejecuta este comando para instalar y actualizar el SDK de Vertex AI para Python.
pip3 install --upgrade "google-cloud-aiplatform>=1.64"
Node.js
Ejecuta este comando para instalar o actualizar el SDK de aiplatform
para Node.js.
npm install @google-cloud/vertexai
Java
Para agregar google-cloud-vertexai
como dependencia, agrega el código apropiado para tu entorno.
Maven con BOM
Agrega el siguiente código HTML a tu pom.xml
:
<dependencyManagement> <dependencies> <dependency> <artifactId>libraries-bom</artifactId> <groupId>com.google.cloud</groupId> <scope>import</scope> <type>pom</type> <version>26.34.0</version> </dependency> </dependencies> </dependencyManagement> <dependencies> <dependency> <groupId>com.google.cloud</groupId> <artifactId>google-cloud-vertexai</artifactId> </dependency> </dependencies>
Maven sin BOM
Agrega lo siguiente a tu pom.xml
:
<dependency> <groupId>com.google.cloud</groupId> <artifactId>google-cloud-vertexai</artifactId> <version>0.4.0</version> </dependency>
Gradle sin BOM
Agrega lo siguiente a tu build.gradle
:
implementation 'com.google.cloud:google-cloud-vertexai:0.4.0'
Go
Revisa los paquetes disponibles de Go de la API de Vertex AI para determinar qué paquete se adapta mejor a las necesidades de tu proyecto.
(recomendado)
cloud.google.com/go/vertexai
vertexai
es un paquete creado por personas que proporciona acceso a capacidades y funciones comunes.Se recomienda este paquete como punto de partida para la mayoría de los desarrolladores que compilan con la API de Vertex AI. Para acceder a las capacidades y funciones que aún no se incluyen en este paquete, usa el paquete
aiplatform
generado de forma automática.Para instalar este paquete, ejecuta este comando.
go get cloud.google.com/go/vertexai
cloud.google.com/go/aiplatform
aiplatform
es un paquete generado de forma automática.Este paquete está diseñado para proyectos que requieren acceso a capacidades y funciones de la API de Vertex AI que aún no proporciona el paquete
vertexai
creado por personas.Para instalar este paquete, ejecuta este comando.
go get cloud.google.com/go/aiplatform
C#
Instala el paquete Google.Cloud.AIPlatform.V1
de NuGet. Usa el método que prefieras para agregar paquetes a tu proyecto. Por ejemplo, haz clic con el botón derecho en el proyecto de Visual Studio y selecciona Administrar paquetes de NuGet….
REST
Ingresa lo siguiente para configurar tus variables de entorno. Reemplaza
PROJECT_ID
por el ID del proyecto de Google Cloud.MODEL_ID="gemini-1.5-flash-002" PROJECT_ID="PROJECT_ID"
Ejecuta este comando para usar Google Cloud CLI y aprovisionar el extremo.
gcloud beta services identity create --service=aiplatform.googleapis.com --project=${PROJECT_ID}
Envía una instrucción a la API de Gemini de Vertex AI
Usa el siguiente código para enviar una instrucción a la API de Gemini de Vertex AI. En este ejemplo, se muestra una lista de nombres posibles para una florería especializada.
Puedes ejecutar el código desde la línea de comandos, con un IDE o incorporando el código en tu aplicación.
Python
Para enviar una solicitud de mensaje, crea un archivo de Python (.py
) y copia el siguiente código en el archivo. Establece el valor de PROJECT_ID
como el ID de tu proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Node.js
Para enviar una solicitud de instrucción, crea un archivo Node.js (.js
) y copia el siguiente código en el archivo. Reemplaza PROJECT_ID
por el ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Java
Para enviar una solicitud de mensaje, crea un archivo Java (.java
) y copia el siguiente código en el archivo. Establece your-google-cloud-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Go
Para enviar una solicitud de mensaje, crea un archivo de Go (.go
) y copia el siguiente código en el archivo. Reemplaza projectID
por tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
C#
Para enviar una solicitud de mensaje, crea un archivo C# (.cs
) y copia el siguiente código en el archivo. Establece your-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
REST
Para enviar esta solicitud de solicitud, ejecuta el comando curl desde la línea de comandos o incluye la llamada REST en tu aplicación.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/${MODEL_ID}:generateContent -d \ $'{ "contents": { "role": "user", "parts": [ { "text": "What\'s a good name for a flower shop that specializes in selling bouquets of dried flowers?" } ] } }'
Envía una instrucción y una imagen a la API de Gemini de Vertex AI
Usa el siguiente código para enviar una instrucción que incluya texto y una imagen a la API de Gemini de Vertex AI. En este ejemplo, se muestra una descripción de la imagen proporcionada (imagen para la muestra de Java).
Python
Para enviar una solicitud de mensaje, crea un archivo de Python (.py
) y copia el siguiente código en el archivo. Establece el valor de PROJECT_ID
como el ID de tu proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Node.js
Para enviar una solicitud de instrucción, crea un archivo Node.js (.js
) y copia el siguiente código en el archivo. Reemplaza PROJECT_ID
por el ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Java
Para enviar una solicitud de mensaje, crea un archivo Java (.java
) y copia el siguiente código en el archivo. Establece your-google-cloud-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Go
Para enviar una solicitud de mensaje, crea un archivo de Go (.go
) y copia el siguiente código en el archivo. Reemplaza projectID
por tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
C#
Para enviar una solicitud de mensaje, crea un archivo C# (.cs
) y copia el siguiente código en el archivo. Establece your-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
REST
Puedes enviar esta solicitud de solicitud desde tu IDE, o puedes incorporar la llamada REST en tu aplicación cuando corresponda.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/${MODEL_ID}:generateContent -d \ $'{ "contents": { "role": "user", "parts": [ { "fileData": { "mimeType": "image/jpeg", "fileUri": "gs://generativeai-downloads/images/scones.jpg" } }, { "text": "Describe this picture." } ] } }'
El modelo muestra una respuesta. Ten en cuenta que la respuesta se genera en secciones y cada sección se evalúa por separado para garantizar la seguridad.
Envía una instrucción y un video a la API de Gemini de Vertex AI
Usa el siguiente código para enviar una instrucción que incluya texto, audio y video a la API de Vertex AI Gemini. En este ejemplo, se muestra una descripción del video proporcionado, que incluye cualquier elemento importante de la pista de audio.
Puedes enviar esta solicitud de solicitud desde la línea de comandos, desde tu IDE o si incluyes la llamada REST en tu aplicación.
Python
Para enviar una solicitud de mensaje, crea un archivo de Python (.py
) y copia el siguiente código en el archivo. Establece el valor de PROJECT_ID
como el ID de tu proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Node.js
Para enviar una solicitud de instrucción, crea un archivo Node.js (.js
) y copia el siguiente código en el archivo. Reemplaza PROJECT_ID
por el ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Java
Para enviar una solicitud de mensaje, crea un archivo Java (.java
) y copia el siguiente código en el archivo. Establece your-google-cloud-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
Go
Para enviar una solicitud de mensaje, crea un archivo de Go (.go
) y copia el siguiente código en el archivo. Reemplaza projectID
por tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
C#
Para enviar una solicitud de mensaje, crea un archivo C# (.cs
) y copia el siguiente código en el archivo. Establece your-project-id
como tu ID del proyecto de Google Cloud. Después de actualizar los valores, ejecuta el código.
REST
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://us-central1-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/us-central1/publishers/google/models/${MODEL_ID}:generateContent -d \ $'{ "contents": { "role": "user", "parts": [ { "fileData": { "mimeType": "video/mp4", "fileUri": "gs://cloud-samples-data/generative-ai/video/pixel8.mp4" } }, { "text": "Provide a description of the video. The description should also contain anything important which people say in the video." } ] } }'
El modelo muestra una respuesta. Ten en cuenta que la respuesta se genera en secciones y cada sección se evalúa por separado para garantizar la seguridad.
¿Qué sigue?
- Obtén más información sobre la API de Gemini en Vertex AI.
- Explora la referencia del SDK de la API de Gemini de Vertex AI para Python, Node.js, Java, Go o C#.
- Consulta la API de modelo para Gemini en Vertex AI.
- Obtén información para llamar a modelos de Vertex AI con la biblioteca de OpenAI.