Prepara tus datos para la IA con servicios de migración de análisis de datos potenciados por Gemini

Con un TCO más bajo que las alternativas de la industria y una experiencia de Spark de alto rendimiento, la nube de datos de Google ayuda a que tus cargas de trabajo de IA generativa y AA más exigentes se ejecuten de manera eficiente y rentable. Unificando tus datos, el procesamiento y la infraestructura en Google Cloud, puedes romper los silos de datos, optimizar los costos y acelerar drásticamente tus iniciativas de IA desde el prototipo hasta la producción.

Nuestra nueva plataforma de datos unificada en BigQuery se convirtió en la fuente de la próxima ola de innovación de PayPal, lo que nos permite crear experiencias más intuitivas y personalizadas en todo nuestro ecosistema y aprovechar el poder de la IA generativa.

Mani Iyer

Vicepresidente sénior y director global de Tecnología de IA y AA de Datos, PayPal

Leer la historia de PayPal

Google integra la IA de forma nativa en toda nuestra pila tecnológica, desde las TPU y nuestra red global hasta los modelos y la nube de datos. Con la conexión directa de modelos de Gemini y herramientas de desarrollador de IA a tu infraestructura de datos, eliminamos los saltos de red adicionales y simplificamos la administración de costos, escalamiento y seguridad.

Google Data Cloud admite un data lakehouse abierto que combina formatos abiertos (Apache Iceberg) con motores de nivel empresarial como BigQuery y Google Cloud Managed Service for Apache Spark. Junto con Knowledge Catalog para una administración integral y un contexto de agente, esta infraestructura permite que los agentes de IA accedan de forma segura a los datos y los activen en toda tu organización.

Google Cloud activa los datos incorporando IA, búsqueda de vectores y razonamiento de grafos directamente en BigQuery, lo que permite que los modelos se ejecuten donde residen los datos. Esta arquitectura admite un ciclo de vida que prioriza los agentes, con herramientas de lenguaje natural y computación sin servidores para implementar rápidamente flujos de trabajo basados en agentes. Antigravity optimiza aún más este proceso con la introducción de la automatización autónoma para descubrir, crear y optimizar cargas de trabajo de Spark y SQL con una intervención manual mínima.

Servicios de migración potenciados por IA

Con los servicios de migración de análisis de datos de Google Cloud, la IA se integra en cada paso de la migración, lo que crea un socio inteligente que trabaja sin problemas en todo el proceso de migración, desde el descubrimiento hasta la validación. Este enfoque basado en la IA puede ayudar a acelerar tus migraciones reduciendo drásticamente los esfuerzos manuales, proporcionar un plan de migración predecible y reducir los riesgos del proyecto.

El servicio de evaluación de la migración modela los costos operativos reales en Google Cloud en función de tus patrones de consulta específicos y el uso de datos. Define el impacto financiero teniendo en cuenta la velocidad, la agilidad y el aprovechamiento de la IA para ayudarte a crear un caso de negocio sólido para la modernización.

El servicio de migración de BigQuery incluye la traducción de SQL, que admite la migración de 18 dialectos a BigQuery SQL. Gemini traduce el SQL procedimental complejo que las herramientas estándar no detectan, lo que impulsa la automatización hacia el 100%. A través del análisis del esquema y el código completos, Gemini crea traducciones que son funcionalmente idénticas, no solo sintácticamente correctas. Gemini también proporciona análisis y conversión automatizados de notebooks de Databricks, lo que traduce el código de Spark SQL y PySpark para que sea totalmente compatible con Google Cloud. El servicio controla las dependencias de la biblioteca y los ajustes de configuración.

Gemini optimiza la validación de la migración proporcionando una verificación holística en el esquema, los datos y la lógica semántica para garantizar una exactitud completa. Al comparar los resultados de las consultas heredadas y modernizadas, se enfoca en los resultados empresariales coherentes en lugar de la estructura del código, lo que elimina de manera eficaz las falsas alarmas. Este enfoque automatizado reduce drásticamente las pruebas de aceptación del usuario de meses a semanas, lo que acelera el tiempo de obtención de valor y libera a los expertos técnicos para tareas de mayor prioridad.

Gemini CLI transforma las migraciones en flujos de trabajo basados en agentes, ya que proporciona un entorno amigable para desarrolladores en el que la IA integra de forma inteligente los servicios de migración y selecciona las herramientas óptimas para la tarea. Al trabajar directamente en las bases de código existentes, permite a los equipos "clonar y listo", lo que aumenta drásticamente la eficiencia y acelera la transición a Google Cloud.

Migración del almacén de datos empresarial (EDW)

Transformar un almacén de datos empresarial (EDW) heredado en una arquitectura de data lakehouse moderna y unificada ya no es la odisea riesgosa y de varios años que solía ser. Hoy en día, los servicios de migración potenciados por IA de extremo a extremo automatizan las fases más complejas y tediosas del proceso. 

Comienza por crear un caso empresarial basado en datos y una hoja de ruta clara. El descubrimiento y la evaluación automatizados te ayudan a analizar tu EDW existente, como Teradata, Snowflake y Redshift, para comprender el linaje de datos, las dependencias y los patrones de consulta. Obtén un informe detallado que compara tus costos actuales con un TCO proyectado de BigQuery, en el que se destacan los ahorros potenciales y el ROI.

La planificación meticulosa es la clave para una migración exitosa. Identifica "victorias rápidas", asigna dependencias y agrupa cargas de trabajo en ondas de migración lógicas para entregar valor rápidamente y reducir el riesgo.

Las traducciones de código potenciadas por Gemini, la transferencia automatizada de datos y metadatos, y la validación de extremo a extremo proporcionan un enfoque basado en IA para las migraciones que reduce drásticamente el tiempo, el costo y los errores humanos.

Migraciones de data lakes y Spark

Los data lakes heredados no pueden almacenar y procesar de forma eficiente los grandes volúmenes de datos no estructurados de los que se alimenta la IA. Muchas veces, los silos de datos persisten entre los almacenes de datos, los lakes y las nubes, y muchas organizaciones simplemente no tienen los recursos de procesamiento necesarios para compilar y entregar modelos de IA. Google Cloud proporciona servicios potenciados por IA para acelerar la migración de tu data lake.

Minimiza el riesgo y la interrupción de las cargas de trabajo de Spark y Hadoop, o inicia una migración rápida de Cloudera a un ecosistema empresarial completamente administrado. Si no quieres volver a compilar tus data lakes locales en la nube, usa la estrategia lift-and-shift con tus datos para migrarlos a Google Cloud y aprovechar la escala y el ahorro en los costos.

A medida que te familiarices con Google Cloud, introduce más agilidad y velocidad en tus equipos de datos. Google Managed Service para Apache Spark aprovecha Lightning Engine para ejecutar cargas de trabajo de Spark 4.5 veces más rápido que las comparativas estándar.

Simplifica la administración y las operaciones. Después de migrar tu data lake heredado, comienza a introducir optimizaciones nativas de la nube, como la organización automática en niveles de almacenamiento para el TCO, la facilidad de administración, la velocidad y la escala.

Moderniza tu lakehouse abierto

Las migraciones de lakehouse son notoriamente complejas, lo que obliga a los equipos a unir diversos motores de procesamiento, formatos abiertos como Apache Iceberg y modelos de seguridad fragmentados. Google Cloud elimina este problema con una base unificada y completamente administrada. Con la conexión fluida de Lakehouse de Google, Managed Service para Apache Spark y Knowledge Catalog, Google acelera tu transición a un lakehouse abierto e interoperable para que puedas enfocarte en activar la IA en lugar de administrar la infraestructura.

La nueva evaluación de migración para Databricks te permite analizar tu entorno de Databricks existente para determinar el esfuerzo de migración y los ahorros estimados del TCO, de modo que puedas sentirte seguro de tu elección de migrar.

Mantén las ventajas de los datos abiertos y los formatos de tabla, mientras obtienes acceso a varios motores y te beneficias de una arquitectura de lakehouse integrada que ofrece un rendimiento superior en relación con el precio. Obtén una ruta simple y automatizada para migrar datos, metadatos y permisos de Delta Lake a Lakehouse para Apache Iceberg, de modo que obtengas todos los beneficios de la administración unificada, la escala empresarial, el rendimiento de precios líder y el acceso a modelos y herramientas de IA.

Automatiza la migración de tus entornos de Cloudera o Hadoop directamente a Google Cloud para ahorrar tiempo y esfuerzo manual significativos. Cuando mueves tus tablas y metadatos sin problemas a Cloud Storage y a un catálogo de Lakehouse administrado, tus datos se vuelven accesibles de forma instantánea para cargas de trabajo de SQL, Spark y Python en el momento en que llegan.

Un ecosistema de socios para ayudarte en tu recorrido

Comienza tu migración con uno de nuestros socios o contrata los servicios profesionales de Google Cloud.

Google Cloud tiene asociaciones sólidas con integradores de sistemas globales como Accenture, Capgemini, Deloitte, KPMG, PwC y Tata Consultancy Services para planificar estratégicamente y llevar a cabo migraciones de extremo a extremo.

Los servicios profesionales de Google Cloud pueden ayudarte a planificar y ejecutar tu migración de EDW o data lake. Tenemos expertos en migración que ofrecen una profunda experiencia técnica. Obtén más información sobre los servicios de Google Cloud Consulting.

Comienza tu recorrido de migración hoy mismo

Desde cargas de trabajo de Spark hasta tus datos empresariales principales, acelera tu migración a Google Cloud hoy mismo con servicios de migración potenciados por IA.

Preguntas sobre migraciones de datos

¿Estás pensando en una migración? Estas son algunas preguntas frecuentes que hacen los clientes cuando consideran migrar a la nube de datos de Google.

¿Por qué migrar mis cargas de trabajo de datos a Google Cloud?

Migrar tu almacén de datos a BigQuery te ayuda a maximizar el valor de tus datos multimodales. Admite diversas cargas de trabajo de lakehouse y análisis de datos con una interfaz fácil de usar que permite a los analistas, ingenieros y científicos de datos trabajar en el mismo conjunto de datos administrados. Es más rentable en comparación con otras soluciones, por lo que es una opción inteligente para las empresas que buscan aprovechar los datos empresariales para la IA.

¿Qué servicios ofrece Google para ayudarme a migrar?

Los servicios de migración de datos de Google Cloud optimizan tus migraciones con la mejor automatización de su clase y costos predecibles y limitados. La evaluación totalmente automatizada con TCO te ayuda a predecir el estado final de tu plataforma de datos y planificar tu migración. Los traductores interactivos y por lotes mejorados de Gemini convierten tu código de más de 15 fuentes. La migración de datos y la validación inteligentes garantizan la disponibilidad inmediata de tus cargas de trabajo modernizadas.

¿Cómo migro de Snowflake a BigQuery?

BigQuery ofrece una plataforma de datos unificada, rentable y sin servidores lista para usar con IA. Gracias al ajuste de escala automático, se eliminan la sobrecarga de administración de la infraestructura y se reducen los costos. La integración nativa de BigQuery en los modelos de IA y las herramientas para desarrolladores de Google Cloud optimiza tu habilidad de usar IA en tus datos para llevar tus casos de uso de IA a producción. Aquí tienes la guía completa sobre cómo migrar de Snowflake a BigQuery.

¿Cómo migro de Databricks a Lakehouse de Google?

Evoluciona tu estrategia de datos migrando de Databricks a un Lakehouse de Google creado en Apache Iceberg, unificando BigQuery y el servicio de Google Cloud para Spark administrado en una única versión de la verdad. Esta transición permite que las cargas de trabajo de PySpark se ejecuten sin problemas en una infraestructura flexible sin servidores, a la vez que elimina los silos de datos. Modernizar Spark SQL a SQL estándar de BigQuery desbloquea aún más el rendimiento superior y la administración avanzada para un ecosistema de próxima generación verdaderamente escalable.

¿Cómo migro de Teradata a BigQuery?

La migración a BigQuery proporciona una solución moderna, escalable y rentable para la analítica avanzada, el aprendizaje automático y las estadísticas en tiempo real. BigQuery elimina la necesidad de administrar la infraestructura y escala automáticamente para satisfacer tus demandas, lo que permite que tu equipo se enfoque en el análisis de datos en lugar del mantenimiento del sistema. Además, el modelo de precios de pago por uso de BigQuery puede reducir los costos. Creamos una guía completa que describe el proceso para migrar de Teradata a BigQuery.


¿Cómo migro mis cargas de trabajo de Spark desde Cloudera?

Moderniza tu infraestructura de datos migrando las cargas de trabajo de Cloudera Spark a Google Managed Service para Apache Spark. Este cambio elimina la sobrecarga de Hadoop a través de clústeres flexibles sin servidores o dedicados, utilizando el Lightning Engine para superar significativamente las velocidades de ejecución tradicionales de JVM. Con la facturación por segundo y el escalado automático, tus canalizaciones de procesamiento por lotes y transmisión se convierten en una base sólida y rentable para el análisis empresarial.

¿Cómo migro mi lakehouse a Google Cloud?

Google Cloud proporciona la infraestructura de IA integrada verticalmente y la arquitectura integral para crear un data lakehouse nativo de IA y abierto. Para migrar tu lakehouse a Google Cloud, primero debes mover los datos sin procesar y los formatos de tabla abiertos (como Delta o Iceberg) a Google Cloud Storage. Obtienes una administración completa de tablas con Google Cloud Lakehouse, que funciona con BigQuery para estadísticas avanzadas y una sólida relación precio-rendimiento. Puedes ejecutar tus cargas de trabajo de Spark en Managed Service para Apache Spark de Google en las mismas tablas de Iceberg. Puedes centralizar tus metadatos y crear una administración de datos de extremo a extremo y contexto para los agentes con Knowledge Catalog.

Google Cloud