Crear un lago de datos en Google Cloud

Almacena, trata y analiza todos tus datos de forma ágil y rentable.

Descripción general del lago de datos en la nube

Innova con los datos sin procesar

¿Dónde guardas tus datos? ¿Estás sacándole el máximo partido? Carga todos tus datos estructurados o no estructurados en Google Cloud y con nuestras herramientas de procesamiento, análisis y aprendizaje automático, podrás convertirlos en información que impulse el crecimiento en toda tu empresa.

Ingerir datos para obtener información valiosa

Datos en un lago de datos en GCP

Migración sencilla a la nube

¿Usas datos por lotes o en streaming? ¿Quieres migrar entre redes con un dispositivo de transferencia offline o capturar flujos de datos en tiempo real? Independientemente de dónde guardes tus datos y cómo necesites gestionar la migración, es muy fácil migrarlos a Google Cloud, donde podrás disfrutar de la durabilidad del 99,999999999 % de Cloud Storage.

Almacena datos a escala de petabytes

Almacenamiento potente, flexible y rentable

Al desvincular el almacenamiento de los ordenadores, podrás añadir datos de forma gradual en incrementos de tan solo un gigabyte y pagar solo por lo que almacenes. Las distintas clases de almacenamiento te permiten reducir los costes y aumentar la disponibilidad, y no es necesario ningún diseño de esquemas. Además, la compatibilidad total con Google Cloud Platform te permite experimentar con nuevas analíticas y datos en poco tiempo para cualquier caso práctico.

Procesa los datos

Procesa los datos como quieras

Con Cloud Storage, puedes procesar los datos de la forma más adecuada para tu empresa. Con Cloud Dataproc, nuestro servicio totalmente gestionado de Apache Hadoop y Apache Spark, podrás poner en marcha clústeres en cuestión de segundos y pagar solo por el tiempo que tardan las tareas en ejecutarse. Cloud Dataflow, nuestro servicio totalmente gestionado de Apache Beam, te permite utilizar cargas de trabajo tanto en streaming como por lotes en una experiencia sin servidor que te ahorra las complejas tareas de aprovisionamiento y gestión.

Almacén de datos sin servidor

Visualizaciones y paneles rápidos

¿Quieres llevar a cabo analíticas de los datos estructurados a velocidades de vértigo en grandes volúmenes? Con BigQuery, el almacén de datos sin servidor de Google Cloud a escala de petabytes, puedes configurar tu almacén de datos en cuestión de segundos, comenzar a consultar datos de forma inmediata, así como crear rápidamente informes empresariales e inteligencia empresarial con BigQuery BI Engine en la memoria.

Analíticas avanzadas con aprendizaje automático

Nueva información gracias al aprendizaje automático

Nuestras integraciones nativas con IA de Cloud ofrecen a tu lago de datos el amplio potencial del aprendizaje automático, y podrás desde extraer información valiosa oculta en las imágenes y vídeos hasta desplegar algoritmos de aprendizaje automático a gran escala. La sencilla función integrada de BigQuery ML democratiza el aprendizaje automático y fomenta una cultura basada en los datos dentro de tu empresa al permitir que todas las personas puedan crear y desplegar modelos.

¿Todo listo para crear tu lago de datos?

Asigna cargas de trabajo de los lagos de datos de Hadoop on-premise a los productos de GCP

Building a cloud data lake on GCPYESNOIm processingstreaming dataWe useApache BeamWe useApache Spark or KafkaCloud DataflowCloud DataprocCloud DataprocIm doinginteractive dataanalysis orad-hoc queryingWe use Apache Sparkwith interactive webnotebooksAre you interested in keepingthese SQL queries as they are?Cloud Dataproc in combinationwith Jupyter or Zeppelinoptional componentsCloud DataprocNo, Im interested inlearning more abouta serverless solution.YESNONo, Im interested inlearning more abouta managed solution.BigQueryWe use SQL with Apache Hive,Apache Drill, Impala,Presto or similarCloud DataprocCloud DataprocIm doing ELT/ETLor batch processingWe use MapReduce,Spark, Pig, or HiveWe use Oozie forworkflow orchestrationCloud ComposerAre you interested inkeeping these workflowjobs as they are?Im supportingNoSQL workloadsWe useApache AccumuloCloud DataprocYESNONeed to use coprocessorsor SQL with Apache Phoenix?Cloud DataprocCloud BigtableWe useApache HBaseIm running anApache Hadoopclusteron-premises

Recursos