Ciencia de datos en Google Cloud

Plataforma unificada para la gestión de datos, las analíticas y las herramientas de aprendizaje automático que te permite acelerar tus flujos de trabajo de datos a IA.

Una guía práctica de ciencia de datos con Google Cloud

Por qué elegir Google Cloud para la ciencia de datos

Plataforma unificada de datos e IA de Google Cloud

Mejora la velocidad y la agilidad de tu empresa, y aporta valor a corto y largo plazo.

3 veces


Más rentable con una transferencia de datos minimizada

4x


Entrenamiento, afinamiento y despliegue de modelos más rápidos

10 x


Menor coste de la IA, lo que permite alcanzar objetivos de ROI más realistas

Herramientas integradas para la ciencia de datos

Plataforma unificada para flujos de trabajo de ciencia de datos integrales

Solución unificada para todo el ciclo de vida de la ciencia de datos y el aprendizaje automático, basada en una infraestructura de datos multimodales que garantiza una gobernanza unificada. Aprovecha los potentes motores de analíticas como BigQuery SQL y Spark, y crea modelos con BigQuery ML o Vertex AI. Optimiza el desarrollo con un cuaderno de Colab Enterprise que prioriza la IA y que incluye MLOps robustas basadas en una IA líder en el sector.

Espacio de trabajo centralizado con cuadernos centrados en la IA

Elige entre un paquete de soluciones de cuadernos para la ciencia de datos empresariales. Colab Enterprise ofrece un entorno seguro y gestionado que se integra con Vertex AI y BigQuery. Vertex AI Workbenches proporciona instancias de JupyterLab personalizables, mientras que Cloud Workstations admite IDEs completos. Las extensiones también conectan herramientas autohospedadas directamente con los servicios de Google Cloud.

Data Science Agent

Agente de ciencia de datos integrado

Acelera el desarrollo de la ciencia de datos con funciones de agente que facilitan la exploración, la transformación y la modelización de datos con aprendizaje automático. Empieza con un objetivo general en lenguaje natural y el agente de ciencia de datos genera un plan detallado que abarca todos los aspectos del modelado de ciencia de datos, desde la carga, la exploración, la limpieza y la visualización de datos hasta la ingeniería de características, la división de datos, el entrenamiento y la optimización de modelos, y la evaluación.

Preparación de datos asistida por IA sin silos

Aprovecha una base de datos unificada que gestione datos estructurados y no estructurados (imágenes, documentos, etc.) mediante SQL para el análisis y funciones de IA para el procesamiento. La preparación de datos asistida por IA ofrece sugerencias para limpiar y transformar datos. El agente de ingeniería de datos automatiza las tareas de ingeniería de datos, como la ingestión y la creación de flujos de procesamiento, mediante instrucciones en lenguaje natural.

Data Engineering Agent
Dataproc gestionado y Spark sin servidor

Procesamiento de datos flexible con varios motores

Elige cualquier motor de procesamiento, ya sea el motor de SQL de BigQuery o un framework de código abierto como Apache Spark, para trabajar directamente en una única copia unificada de los datos. De esta forma, no es necesario mantener copias de datos independientes para distintos sistemas.

Escala la ciencia de datos con BigQuery DataFrames para Python

¿Prefieres las bibliotecas nativas de Python? BigQuery DataFrames proporciona una API similar a pandas que traduce el código de Python en SQL optimizado para su ejecución en el motor de BigQuery. Esto ofrece la flexibilidad de usar la herramienta adecuada para cada tarea, ya sea SQL, PySpark o un DataFrame de estilo pandas, todo ello mientras se trabaja con los mismos datos subyacentes.

Vídeo de BigQuery DataFrames
BQML

Crea, entrena, ajusta y ejecuta modelos de aprendizaje automático

Crea, entrena, evalúa y despliega modelos con BigQuery ML usando SQL, lo que elimina la necesidad de mover datos. Aprovecha los modelos preentrenados o las funciones de SQL integrados que llaman a Gemini para analizar o enriquecer datos. En el caso de los modelos personalizados, Vertex AI es compatible con PyTorch, TensorFlow y otras bibliotecas de aprendizaje automático. La integración perfecta permite la ingeniería de funciones en BigQuery, el entrenamiento de modelos personalizados en Vertex AI y la inferencia de nuevo en BigQuery mediante SQL.

Genera elementos insertados y habilita la búsqueda de vectores

Genera y usa incrustaciones multimodales para realizar búsquedas de vectores, lo que permite la comprensión semántica y la recuperación de datos multimodales basada en la similitud. Esto te permite crear sistemas sofisticados de búsqueda semántica, recomendación o segmentación sin tener que gestionar una base de datos de vectores independiente y especializada.

elementos insertados y búsqueda de vectores

Pasa del modelo a la producción con MLOps integrado

BigQuery y Vertex AI se integran para optimizar el "último kilómetro" de MLOps. Centraliza las características en Vertex AI Feature Store para evitar la desviación entrenamiento-utilización, así como el trabajo redundante. Usa Vertex AI AutoML para automatizar la creación de modelos de datos tabulares. Todos los modelos, tanto los de BigQuery ML como los de Vertex AI, se registran automáticamente en el registro de modelos de Vertex AI. A partir de ahí, puedes crear versiones, evaluarlas y desplegarlas fácilmente, lo que te permite disfrutar de un ciclo de vida integral y fluido en una sola plataforma.


Google Cloud