Vision Warehouse es una API que permite a los desarrolladores integrar el almacenamiento y la búsqueda basada en IA de contenido multimedia no estructurado (videos, imágenes y videos por lotes en transmisión) en herramientas y aplicaciones existentes.
Vision Warehouse es un componente importante de Vertex AI Vision. Funciona como repositorio de almacenamiento y proporciona capacidades de búsqueda avanzadas para varios tipos de datos y casos de uso. En particular, haz lo siguiente:
- Videos en tiempo real: Puedes importar transmisiones de video en vivo y datos de análisis de video en vivo con la aplicación de la plataforma de Vertex AI Vision o la API de Vision Warehouse, y buscar imágenes con la API de Vision Warehouse o la consola de Google Cloud .
- Imagen: Puedes importar imágenes y metadatos con la API de Vision Warehouse, analizar imágenes con la API de Vision Warehouse y buscar imágenes con la API de Vision Warehouse o la consola de Google Cloud .
- Video por lotes: Puedes importar videos y metadatos por lotes con la API de Vision Warehouse, analizar videos por lotes con la API de Vision Warehouse y buscar videos por lotes con la API de Vision Warehouse o la consola de Google Cloud .
Descripción general de los recursos de la API
Recursos de la API de Storage
Corpus: Es un contenedor que contiene recursos multimedia de un tipo en particular. Puedes crear varios corpus para organizar diferentes tipos de recursos multimedia.
Recurso: Es un objeto multimedia almacenado en un corpus. Los activos pueden ser imágenes, videos por lotes o transmisiones de video. Por lo general, un corpus contiene muchos recursos del mismo tipo. Puedes especificar anotaciones asociadas con los recursos. Los recursos también se pueden agrupar en colecciones para su administración.
Colección: Es un recurso dentro de un corpus que sirve como contenedor de referencias a activos.
Anotaciones: Son metadatos o datos proporcionados por el usuario derivados de Vertex AI Vision que están asociados con un recurso. Un activo puede tener varias anotaciones.
- Ejemplo 1: Especifica una anotación de texto llamada "video-title" para los recursos de video por lotes.
- Ejemplo 2: Almacena los datos analizados de los modelos de Vertex AI Vision como anotaciones. Por ejemplo, las etiquetas de reconocimiento de objetos en diferentes períodos de un video se pueden almacenar como anotaciones.
Esquema de datos: Define cómo se interpreta una anotación dentro de un corpus. Un esquema de datos define un tipo de anotación y su estrategia de búsqueda. Cada anotación debe estar asociada a un esquema de datos.
Recursos de la API de búsqueda
Índice (disponible para las verticales de imágenes y videos por lotes): Es un recurso a nivel del corpus que es una representación administrada de los recursos y las anotaciones analizados. Un índice se puede ver como un conjunto de datos de vectores de incorporación y restricciones semánticas que representan el significado del contenido multimedia. Los índices se pueden implementar en extremos de índice para la búsqueda.
Extremo de índice (disponible para las verticales de imágenes y videos por lotes): Es un entorno administrado que entrega índices de Vision Warehouse. Los extremos de índice proporcionan un único punto de acceso para enviar solicitudes de búsqueda.
Configuración de búsqueda: Almacena varias propiedades que afectan los comportamientos y los resultados de la búsqueda.
- Propiedad de faceta (disponible para la transmisión vertical de video): Crea una configuración para habilitar los resultados de la búsqueda de histogramas basados en facetas.
- Propiedad de criterios de búsqueda (disponible para las verticales de transmisión de video y videos por lotes): Crea una asignación entre un criterio de búsqueda personalizado y una o más claves de esquema de datos.
Hiperónimo de búsqueda: Es un tipo específico de configuración de búsqueda que te permite personalizar la capacidad del servicio de búsqueda para reconocer hiperónimos de palabras. Por ejemplo, los usuarios pueden especificar "animal" como hiperónimo de "gato" y "perro". Si buscas "animal", también se mostrarán resultados con "gato" y "perro" en los datos del índice.
Idiomas compatibles
Los almacenes de videos y de imágenes por lotes admiten los siguientes idiomas para la búsqueda semántica:
- Inglés
- Español
- Portugués
- Francés
- Japonés
- Chino
Streaming Warehouse no tiene restricciones de idioma.
¿Qué sigue?
- Comprende los flujos de usuarios clave de la API para cada vertical de contenido multimedia: video de transmisión continua, imagen y video por lotes.
- Explora las cuotas y los límites de Vision Warehouse.
- Familiarízate con los precios.
- Descubre cómo obtener asistencia.