Cómo describir una imagen

En esta muestra de código, se muestra cómo usar Gemini para generar descripciones de texto para una imagen.

Muestra de código

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.

Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

import vertexai
from vertexai.generative_models import GenerativeModel, Part

# TODO (developer): update project id
vertexai.init(project=PROJECT_ID, location="us-central1")

model = GenerativeModel("gemini-1.5-flash-002")

contents = [
    # Text prompt
    "Describe this image.",
    # Example image of a Jack Russell Terrier puppy from Wikipedia.
    Part.from_uri(
        "https://upload.wikimedia.org/wikipedia/commons/1/1d/Szczenie_Jack_Russell_Terrier.jpg",
        "image/jpeg",
    ),
]

response = model.generate_content(contents)
print(response.text)
# Example response:
#     'Here is a description of the image:'
#     'Close-up view of a young Jack Russell Terrier puppy sitting in short grass ...'

¿Qué sigue?

Para buscar y filtrar muestras de código para otros productos de Google Cloud , consulta el navegador de muestras deGoogle Cloud .