Recursos de macrodatos y estadísticas

Last reviewed 2024-04-05 UTC

El Centro de arquitectura proporciona recursos de contenido en una amplia variedad de temas de macrodatos y estadísticas.

Recursos de macrodatos y estadísticas en el Centro de arquitectura

Puedes filtrar la siguiente lista de recursos de macrodatos y estadísticas si escribes un nombre de producto o una frase que esté en el título o la descripción del recurso.

Análisis de datos de FHIR en BigQuery

Se explican los procesos y las consideraciones para analizar los datos del estándar de interoperabilidad (FHIR) en BigQuery.

Productos usados: BigQuery

Arquitectura y funciones en una malla de datos

Orientación sobre la implementación de una malla de datos en Google Cloud...

Arquitectura: Almacén de datos de marketing

Proporciona una arquitectura de referencia en la que se describe cómo compilar almacenes de datos de marketing escalables.

Productos usados: AI Platform, Auto ML, BigQuery, Cloud Data Fusion, Dataflow, Dataprepby Trifacta, Google Analytics, Looker

Aplica de forma automática las etiquetas de sensibilidad de Data Catalog a archivos, bases de datos y tablas de BigQuery

Muestra cómo usar Data Catalog con una canalización automatizada de Dataflow para identificar y aplicar etiquetas de sensibilidad de datos a tus datos en archivos de Cloud Storage, bases de datos relacionales y BigQuery.

Productos usados: Cloud Build, Cloud Data Loss Prevention, Cloud SQL, Cloud Storage, Compute Engine, Data Catalog, Dataflow, Secret Manager

Compila y visualiza predicciones de previsión de la demanda a través de Datastream, Dataflow, BigQuery ML y Looker

En este documento, se muestra cómo replicar y procesar datos operativos de una base de datos de Oracle en Google Cloud en tiempo real. También se muestra cómo predecir la demanda futura y cómo visualizar estos datos de previsión a medida que llegan.

Productos que se usan: BigQuery, Dataflow, Looker

Compila una solución de estadísticas de vision de AA con Dataflow y la API de Cloud Vision

Cómo implementar una canalización de Dataflow para procesar archivos de imagen a gran escala con Cloud Vision. Dataflow almacena los resultados en BigQuery para que puedas usarlos para entrenar modelos compilados con anterioridad de BigQuery ML.

Productos usados: BigQuery, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Vision, Dataflow

Exportación de métricas de Cloud Monitoring

Describe una forma de exportar las métricas de Cloud Monitoring para realizar un análisis a largo plazo.

Productos usados: App Engine, BigQuery, Cloud Monitoring, Cloud Pub/Sub, Cloud Scheduler, Datalab, Looker Studio

Replicación de datos continua en BigQuery a través de Striim

Demuestra cómo migrar una base de datos de MySQL a BigQuery a través de Striim. Striim es una plataforma completa de extracción, transformación y carga (ETL).

Productos usados: BigQuery, Cloud SQL para MySQL, Compute Engine

Replicación de datos continua en Cloud Spanner a través de Striim

Cómo migrar una base de datos de MySQL a Cloud Spanner con Striim.

Productos usados: Cloud SQL, Cloud SQL para MySQL, Compute Engine, Spanner

Patrones de diseño de estadísticas de datos

En esta página, se proporcionan vínculos a casos de uso empresariales, códigos de muestra y guías de referencia técnica para casos de uso de estadísticas de datos de la industria. Usa estos recursos para aprender, identificar prácticas recomendadas para acelerar la implementación de tus cargas de trabajo.

Ciencia de datos con R en Google Cloud: instructivo exploratorio de análisis de datos

Te muestra cómo comenzar a usar la ciencia de datos a gran escala con R en Google Cloud. Esto está dirigido a aquellos usuarios que tengan experiencia con R y con notebooks de Jupyter, que se sientan cómodos con SQL.

Productos usados: BigQuery, Cloud Storage, Notebooks

Transformación de datos entre MongoDB Atlas y Google Cloud

Transformación de datos entre MongoDB Atlas como almacén de datos operativos y BigQuery como almacén de datos analítico.

Productos usados: BigQuery, Cloud Pub/Sub, Dataflow

Desidentificación y reidentificación de PII en conjuntos de datos a gran escala con Sensitive Data Protection

En este documento, se analiza cómo usar Sensitive Data Protection para crear una canalización de transformación de datos automatizada para desidentificar datos sensibles, como la información de identificación personal (PII).

Productos usados: BigQuery, Cloud Data Loss Prevention, Cloud Pub/Sub, Cloud Storage, Dataflow, Identity and Access Management

Arquitectura de ejemplo para usar un proxy de DLP para consultar una base de datos que contiene datos sensibles

En este documento, se describe el uso de Sensitive Data Protection para mitigar el riesgo de exponer los datos sensibles almacenados en las bases de datos de Google Cloud a los usuarios y permitirles consultar datos significativos de todos modos.

Productos usados: Registros de auditoría de Cloud, Cloud Data Loss Prevention, Cloud Key Management Service

Arquitectura de referencia del procesamiento de datos genómicos

En este documento, se describen las arquitecturas de referencia para usar Cloud Life Sciences API con otros productos de Google Cloud para realizar el procesamiento de datos genómicos a través de diferentes métodos y motores de flujo de trabajo.

Productos usados: Cloud Life Sciences, Cloud Storage y Compute Engine

Arquitectura de estadísticas geoespaciales

Obtén información sobre las capacidades geoespaciales de Google Cloud y cómo puedes usarlas en tus aplicaciones de estadísticas geoespaciales.

Productos usados: BigQuery, Dataflow

Importa datos de una red externa a un almacén de datos seguro de BigQuery

Describe una arquitectura que puedes usar para proteger un almacén de datos en un entorno de producción y proporciona prácticas recomendadas para importar datos a BigQuery desde una red externa, como un entorno local.

Productos usados: BigQuery

Importa datos de Google Cloud a un almacén de datos seguro de BigQuery

Describe una arquitectura que puedes usar para ayudar a proteger un almacén de datos en un entorno de producción y proporciona prácticas recomendadas para la administración de datos de un almacén de datos en Google Cloud.

Productos usados: BigQuery, Cloud Data Loss Prevention, Cloud Key Management Service, Dataflow

Transferencia de datos clínicos y operativos con Cloud Data Fusion

En este documento, se explica a los investigadores, científicos de datos y equipos de TI cómo Cloud Data Fusion puede desbloquear datos a través de la transferencia, transformación y almacenamiento de datos en BigQuery, un almacén de datos agregado en Google Cloud.

Productos usados: BigQuery, Cloud Data Fusion, Cloud Storage

Solución de inicio rápido: lakehouse de Analytics

Unifica los data lakes y los almacenes de datos mediante la creación de un lakehouse de análisis con BigQuery para almacenar, procesar, analizar y activar datos.

Solución de inicio rápido: almacén de datos con BigQuery

Crea un almacén de datos con un panel y una herramienta de visualización mediante BigQuery.

Solución de inicio rápido: App web de Go para compartir datos de gran tamaño

Implementa una aplicación de Go en Cloud Run para entregar una gran cantidad de archivos a través de una red de distribución de contenidos y almacenamiento de objetos.

Solución de inicio rápido: App web de Java para compartir datos de gran tamaño

Implementa una aplicación de Java en Cloud Run para entregar una gran cantidad de archivos a través de una red de distribución de contenidos y almacenamiento de objetos.

Migra a Google Cloud

Te ayuda a planificar, diseñar y, también, implementar el proceso de migración de las cargas de trabajo de infraestructura y aplicación en Google Cloud, incluidas las cargas de trabajo de procesamiento, de bases de datos y de almacenamiento.

Productos usados: App Engine, Cloud Build, Cloud Data Fusion, Cloud Deployment Manager, Cloud Functions, Cloud Run, Cloud Storage, Container Registry, Data Catalog, Dataflow, intercambio de tráfico directo, Google Kubernetes Engine (GKE), Transfer Appliance

Migra la infraestructura de Hadoop local a Google Cloud

Guía sobre cómo migrar las cargas de trabajo locales de Hadoop a Google Cloud…

Productos usados: BigQuery, Cloud Storage, Dataproc

Optimiza las transferencias a gran escala de los eventos de estadísticas y registros

Describe una arquitectura para optimizar la transferencia de estadísticas a gran escala en Google Cloud, en la que “gran escala” significa más de 100,000 eventos por segundo o con un total de eventos agregados de tamaño de carga útil por encima de 100 MB por segundo.

Productos usados: BigQuery, Cloud Logging, Cloud Pub/Sub, Compute Engine, Dataflow

Realiza operaciones ETL desde una base de datos relacional en BigQuery con Dataflow

En este instructivo, se muestra cómo usar Dataflow para extraer, transformar y cargar datos (ETL) de una base de datos relacional de procesamiento de transacciones en línea (OLTP) en BigQuery para su análisis.

Productos usados: BigQuery, Cloud Storage, Compute Engine, Dataflow

Modelos de propensión para aplicaciones de videojuegos

Aprende a usar BigQuery ML para entrenar, evaluar y obtener predicciones de diversos tipos de modelos de propensión diferentes. Los modelos de propensión pueden ayudarte a determinar la probabilidad de que usuarios específicos vuelvan a tu app para que puedas usarla...

Estadísticas del registro de seguridad en Google Cloud

Muestra cómo recopilar, exportar y analizar registros de Google Cloud para ayudarte a auditar el uso y detectar amenazas a tus datos y cargas de trabajo. Usa las consultas de detección de amenazas incluidas para BigQuery o Chronicle, o usa tu propio SIEM.

Productos usados: BigQuery, Cloud Logging, Compute Engine, Looker Studio

API inteligente para predecir la propensión del cliente a comprar a través de Apigee, BigQuery ML y Spanner

Crea una API que pueda predecir la probabilidad de que un cliente realice una compra.

Productos usados: Apigee, Hojas de cálculo de apps, BigQuery ML, Spanner

Seguimiento de los metadatos de procedencia y linaje para datos de atención médica

Describe cómo realizar un seguimiento de los metadatos de origen y de linaje para los datos de atención médica en Google Cloud para investigadores, científicos de datos y equipos de TI.

Productos usados: BigQuery, Cloud Data Fusion, Cloud Storage

Transforma y unifica datos de atención médica para BigQuery

En este documento, se describen los procesos y las consideraciones relacionadas con la unificación de los datos de atención médica en Google Cloud para investigadores, científicos de datos y equipos de TI que desean crear un data lake de estadísticas en BigQuery.

Productos usados: BigQuery, Cloud Data Fusion, Cloud Data Loss Prevention y Cloud Storage

Usa una canalización de CI/CD para flujos de trabajo de procesamiento de datos

En este documento, se describe cómo configurar una canalización de integración continua/implementación continua (CI/CD) para procesar datos a través de la aplicación de métodos de CI/CD con productos administrados en Google Cloud.

Productos usados: Cloud Build, Cloud Composer, Cloud Source Repositories, Cloud Storage, Compute Engine y Dataflow

Usa Apache Hive en Dataproc

En este instructivo, se muestra cómo usar Apache Hive en Dataproc de manera eficiente y flexible a través del almacenamiento de datos de Hive en Cloud Storage y el alojamiento del almacén de metadatos en una base de datos MySQL en Cloud SQL.

Productos usados: Cloud SQL, Cloud Storage, Dataproc