BigQuery ML te permite crear y ejecutar modelos de aprendizaje automático en BigQuery mediante consultas de Google SQL. BigQuery ML permite que los profesionales de SQL compilen modelos mediante las herramientas y las habilidades existentes de SQL para democratizar el aprendizaje automático. BigQuery ML aumenta la velocidad de desarrollo mediante la eliminación de la necesidad de mover datos.
La funcionalidad de BigQuery ML está disponible mediante los siguientes recursos:
- La consola de Google Cloud
- La herramienta de línea de comandos
bq
- La API de REST de BigQuery
- Una herramienta externa, como un notebook Jupyter o la plataforma de inteligencia comercial
El aprendizaje automático en grandes conjuntos de datos requiere una programación extensa y conocimiento de los marcos de trabajo de AA. Estos requisitos restringen el desarrollo de soluciones a un conjunto pequeño de personas dentro de cada empresa, y excluyen a los analistas de datos que comprenden los datos, pero que tienen poco conocimiento sobre aprendizaje automático y poca experiencia en programación.
BigQuery ML les permite a los analistas de datos utilizar el aprendizaje automático mediante herramientas y habilidades de SQL existentes. Los analistas pueden utilizar BigQuery ML para compilar y evaluar modelos de AA en BigQuery. Los analistas no necesitan exportar pequeñas cantidades de datos a hojas de cálculo o a otras aplicaciones, ni esperar recursos limitados de un equipo de ciencia de datos.
Modelos admitidos en BigQuery ML
Un modelo en BigQuery ML representa lo que un sistema de AA aprendió de los datos de entrenamiento.
BigQuery ML es compatible con los siguientes tipos de modelos:
- Regresión lineal para la previsión; por ejemplo, las ventas de un artículo en un día determinado. Las etiquetas tienen un valor real (no pueden ser +/- infinito o NaN)
- Regresión logística binaria para la clasificación; por ejemplo, determinar si un cliente hará una compra. Las etiquetas solo deben tener dos valores posibles
- Regresión logística multiclase para la clasificación. Estos modelos pueden usarse para predecir varios valores posibles; por ejemplo, si una entrada tiene un valor “bajo”, “medio” o “alto”. Las etiquetas pueden tener hasta 50 valores únicos. En BigQuery ML, el entrenamiento de regresión logística multiclase usa un clasificador multinomial con una función de pérdida de entropía cruzada
- Agrupamiento en clústeres de k-means para la segmentación de datos, por ejemplo, identificar segmentos de clientes. K-means es una técnica de aprendizaje no supervisada, por lo que el entrenamiento de modelos no requiere etiquetas ni datos divididos para el entrenamiento o la evaluación
- Factorización de matrices para crear sistemas de recomendación de productos. Puedes crear recomendaciones de productos según el historial del comportamiento, las transacciones y las calificaciones de productos de los clientes y, luego, usar esas recomendaciones para que los clientes tengan experiencias personalizadas
- Series temporales para realizar previsiones de series temporales. Puedes usar esta función a fin de crear millones de modelos de serie temporal y usarlos para la previsión. El modelo maneja automáticamente las anomalías, la estacionalidad y las festividades.
- Árbol mejorado para crear modelos de regresión y clasificación basados en XGBoost
- Red neuronal profunda (DNN) para crear redes neuronales profundas basadas en TensorFlow destinadas a modelos de clasificación y regresión
- Vertex AI AutoML Tables para realizar el aprendizaje automático con datos tabulares mediante interfaces y procesos simples
- Importación de modelos de TensorFlow. Este atributo te permite crear modelos de BigQuery ML a partir de modelos de TensorFlow entrenados con anterioridad y, luego, realizar predicciones en BigQuery ML
- Autoencoder para crear modelos de BigQuery ML basados en TensorFlow con la asistencia de representaciones de datos dispersos. Los modelos se pueden usar en BigQuery ML para tareas como la detección de anomalías no supervisada y la reducción de dimensiones no lineal.
En BigQuery ML, puedes usar un modelo con datos de varios conjuntos de datos de BigQuery para el entrenamiento y la predicción.
Guía de selección de modelos
Ventajas de BigQuery ML
BigQuery ML tiene las siguientes ventajas sobre otros enfoques en relación con el uso del AA con almacenes de datos basados en la nube:
- BigQuery ML democratiza el uso del AA gracias a que permite a los analistas de datos y a los usuarios principales de almacenes de datos compilar y ejecutar modelos mediante hojas de cálculo y herramientas de inteligencia comercial existentes. Las estadísticas predictivas pueden guiar la toma de decisiones empresariales en toda la organización.
No es necesario programar una solución de AA con Python o Java. Los modelos se entrenan y se accede a ellos en BigQuery mediante SQL, un lenguaje familiar para los analistas de datos.
BigQuery ML aumenta la velocidad de innovación y desarrollo del modelo, ya que quita la necesidad de exportar datos desde el almacén de datos. En cambio, BigQuery ML acerca el AA a los datos. BigQuery ML tiene las siguientes ventajas sobre la exportación y el reformato de datos:
- Reduce la complejidad porque se necesitan menos herramientas
- Aumenta la velocidad a la producción porque mover y dar formato a grandes cantidades de datos para los marcos de trabajo de AA basados en Python no es necesario en el entrenamiento de modelos en BigQuery.
BigQuery ML y Vertex AI
BigQuery ML se integra en Vertex AI, la plataforma de IA/AA de extremo a extremo de Google Cloud. Cuando registras tus modelos de BigQuery ML en el Registro de modelos de Vertex AI, puedes implementarlos en extremos de predicción en línea.
- Para obtener más información sobre cómo usar tus modelos de BigQuery ML con Vertex AI, consulta Administra modelos de BigQuery ML con Vertex AI
- Si no estás familiarizado con Vertex AI y quieres obtener más información sobre cómo se integra en BigQuery ML, consulta Vertex AI para usuarios de BigQuery.
Regiones admitidas
BigQuery ML es compatible con las mismas regiones que BigQuery. Consulta la página Ubicaciones para ver una lista completa de las regiones y multiregiones compatibles.
Precios
Los modelos de BigQuery ML se almacenan en conjuntos de datos de BigQuery como tablas y vistas. Si deseas obtener información sobre los precios de BigQuery ML, consulta los precios de BigQuery ML.
Para obtener información sobre los precios de almacenamiento de BigQuery, consulta los Precios de almacenamiento. Para obtener información sobre los precios de las consultas de BigQuery ML, consulta los Precios de consulta.
Cuotas
Además de los límites específicos de BigQuery ML, las consultas que utilizan funciones de BigQuery ML y declaraciones CREATE MODEL
están sujetas a las cuotas y los límites de los Trabajos de consulta de BigQuery.
Para obtener más información sobre todas las cuotas y los límites de BigQuery ML, consulta Cuotas y límites.
¿Qué sigue?
- Para comenzar a usar BigQuery ML, consulta Comienza a usar BigQuery ML con la consola de Google Cloud.
- Para obtener más información sobre el aprendizaje automático y BigQuery ML, consulta los siguientes recursos:
- Curso Applying machine learning to your data with Google Cloud en Coursera
- Programa de capacitación Datos y aprendizaje automático
- Curso intensivo de aprendizaje automático
- Glosario sobre aprendizaje automático
- Para obtener información sobre las MLOps con el registro de modelos de Vertex AI, consulte MLOps con Vertex AI.