Modelo de datos y recursos

En las siguientes secciones, se presenta el modelo de datos y la terminología de Vertex AI Feature Store (heredado) que se usa para describir los recursos y componentes de Vertex AI Feature Store (heredado).

Modelo de datos de Vertex AI Feature Store (heredado)

Vertex AI Feature Store (heredado) usa un modelo de datos de series temporales a fin de almacenar una serie de valores para los atributos. Este modelo permite que Vertex AI Feature Store (heredado) mantenga los valores de los atributos a medida que cambian con el tiempo. Vertex AI Feature Store (heredado) organiza los recursos de forma jerárquica en el siguiente orden: Featurestore -> EntityType -> Feature. Debes crear estos recursos antes de poder transferir datos a Vertex AI Feature Store (heredado).

A modo de ejemplo, supongamos que tienes los siguientes datos de origen de muestra de una tabla de BigQuery. Estos datos de origen son sobre películas y sus atributos.

Muestra cómo los datos de origen se asignan al modelo de datos de Vertex AI Feature Store (heredado)

Antes de transferir estos datos a Vertex AI Feature Store (heredado), debes crear un featurestore, que es un contenedor de nivel superior para todos los demás recursos. En el almacén de atributos, crea tipos de entidades que agrupen y contengan atributos relacionados. Luego, puedes crear atributos que se mapeen a atributos en los datos de origen. Los nombres del tipo de entidad y los atributos pueden duplicar los nombres de encabezado de la columna, pero esto no es obligatorio.

En este ejemplo, el encabezado de la columna movie_id se puede asignar a un tipo de entidad movie. average_rating, title y genre son atributos del tipo de entidad movie. Los valores de cada columna se asignan a instancias específicas de un tipo de entidad o atributos, que se denominan entidades y valores de atributos.

La columna de marca de tiempo indica cuándo se generaron los valores de los atributos. En el featurestore, las marcas de tiempo son un atributo de los valores de atributos, y no un tipo de recurso independiente. Si todos los valores de atributos se generaron al mismo tiempo, no es necesario que tengas una columna de marca de tiempo. Puedes especificar la marca de tiempo como parte de tu solicitud de transferencia.

Featurestore

Un featurestore es el contenedor de nivel superior para los tipos de entidades, los atributos y los valores de atributos. Por lo general, una organización crea un almacén de atributos compartido para importar, entregar y compartir atributos en todos los equipos de la organización. Sin embargo, a veces puedes elegir crear varios almacenes de atributos dentro del mismo proyecto para aislar entornos. Por ejemplo, puedes contar con featurestores separados para la experimentación, las pruebas y la producción.

Tipo de entidad

Un tipo de entidad es una colección de atributos relacionados de manera semántica. Defines tus propios tipos de entidades en función de los conceptos que son relevantes para tu caso de uso. Por ejemplo, un servicio de cine puede tener los tipos de entidades movie y user, que agrupan los atributos relacionados que corresponden a películas o clientes.

Entity

Una entidad es una instancia de un tipo de entidad. Por ejemplo, movie_01 y movie_02 son entidades del tipo de entidad movie. En una tienda de funciones, cada entidad debe tener un ID único y debe ser del tipo STRING.

Función

Un atributo es una propiedad o un atributo medible de un tipo de entidad. Por ejemplo, el tipo de entidad movie tiene atributos como average_rating y title, que realizan un seguimiento de varias propiedades de películas. Los atributos están asociados con los tipos de entidades. Los atributos deben ser distintos dentro de un tipo de entidad determinado, pero no es necesario que sean únicos a nivel global. Por ejemplo, si usas title para dos tipos de entidades diferentes, Vertex AI Feature Store interpreta title como dos atributos diferentes. Cuando lees los valores de atributos, debes proporcionar el atributo y el tipo de entidad como parte de la solicitud.

Cuando creas un atributo, debes especificar su tipo de valor, como BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY y STRING. Esto determina qué tipos de valores puedes transferir para un atributo en particular. Para obtener más información sobre los tipos de valores admitidos, consulta valueType en la referencia de la API.

Valor del atributo

Vertex AI Feature Store captura los valores de los atributos para un atributo en un momento específico. En otras palabras, puedes tener varios valores para una entidad y un atributo determinados. Por ejemplo, la entidad movie_01 puede tener varios valores de atributo para el atributo average_rating. El valor puede ser 4.4 en un momento y 4.8 más adelante. Vertex AI Feature Store (heredados) asocia un identificador de tupla con cada valor de atributo (entity_id, feature_id, timestamp), que Vertex AI Feature Store (heredado) usa para buscar valores en el momento de la entrega.

Vertex AI Feature Store (heredado) almacena valores discretos, aunque el tiempo sea continuo. Cuando solicitas un valor de atributo en el tiempo t, Vertex AI Feature Store (heredado) muestra el último valor almacenado en el tiempo t o antes. Por ejemplo, si Vertex AI Feature Store (heredado) almacena la información de ubicación de un automóvil en los tiempos 100 y 110, se usa la ubicación en el tiempo 100 para solicitudes en todos los tiempos entre 100 (inclusive) y 110 (exclusivo). Por ejemplo, si necesitas una resolución más alta, puedes inferir la ubicación entre los valores o aumentar la tasa de muestreo de tus datos.

Importación de atributos

La transferencia de atributos es el proceso de importar valores de atributos calculados por trabajos de ingeniería de atributos a un almacén de atributos. Para poder transferir datos, el tipo de entidad y los atributos correspondientes deben definirse en el almacén de atributos. Vertex AI Feature Store (heredada) ofrece transferencia por lotes y de transmisión, lo que te permite agregar valores de atributos de forma masiva o en tiempo real.

Por ejemplo, es posible que hayas calculado datos de origen que se encuentran en ubicaciones como BigQuery o Cloud Storage. Puedes transferir datos por lotes desde esas fuentes a un almacén de atributos central para que esos valores de atributos se puedan entregar en un formato uniforme. A medida que los datos de origen cambian, puedes usar la transferencia de transmisión para obtener esos cambios en tu almacén de atributos con rapidez. De esta manera, tienes los datos más recientes disponibles para las situaciones de entrega en línea.

Para obtener más información, consulta Valores de atributos de importación por lotes o Importación de transmisión.

Entrega de atributos

La entrega de atributos es el proceso de exportar valores de atributos almacenados para el entrenamiento o la inferencia. Vertex AI Feature Store (heredado) ofrece dos métodos para entregar atributos: por lotes y en línea. La entrega por lotes sirve para una capacidad de procesamiento alta y para entregar grandes volúmenes de datos a fin de realizar procesamiento sin conexión (como el entrenamiento de modelos o las predicciones por lotes). La entrega en línea sirve para la recuperación de datos de baja latencia de lotes pequeños de datos a fin de realizar un procesamiento en tiempo real (como las predicciones en línea).

Para obtener más información, consulta la entrega en línea o por lotes.

Vista de entidades

Cuando recuperas valores de un featurestore, el servicio muestra una vista de entidades que contiene los valores de atributos que solicitaste. Se puede pensar la vista de entidades como una proyección de los atributos y valores que muestra Vertex AI Feature Store (heredado) desde una solicitud de entrega en línea o por lotes:

  • Para las solicitudes de entrega en línea, puedes obtener todos tus atributos o un subconjunto de ellos para un tipo de entidad en particular.
  • Para las solicitudes de entrega por lotes, puedes obtener todos los atributos o un subconjunto de ellos de uno o más tipos de entidades. Por ejemplo, si los atributos se distribuyen en varios tipos de entidades, puedes recuperarlas en una sola solicitud, que une esos atributos. Luego, puedes usar los resultados para alimentar una solicitud de predicción por lotes o del aprendizaje automático.

Exportar datos

Vertex AI Feature Store te permite exportar datos desde tus almacenes de atributos para que puedas crear copias de seguridad y archivar valores de los atributos. Puedes elegir exportar los valores de los atributos más recientes (instantánea) o un rango de valores (exportación completa). Para obtener más información, consulta Exporta valores de atributos.

¿Qué sigue?