El Centro de arquitectura proporciona recursos de contenido en una amplia variedad de temas de macrodatos y estadísticas.
Recursos de macrodatos y estadísticas en el Centro de arquitectura
Puedes filtrar la siguiente lista de recursos de macrodatos y estadísticas si escribes un nombre de producto o una frase que esté en el título o la descripción del recurso.
Análisis de datos de FHIR en BigQuery Se explican los procesos y las consideraciones para analizar los datos del estándar de interoperabilidad (FHIR) en BigQuery. Productos usados: BigQuery |
Arquitectura y funciones en una malla de datos Orientación sobre la implementación de una malla de datos en Google Cloud... |
Arquitectura: Almacén de datos de marketing Proporciona una arquitectura de referencia en la que se describe cómo compilar almacenes de datos de marketing escalables. Productos usados: AI Platform, Auto ML, BigQuery, Cloud Data Fusion, Dataflow, Dataprepby Trifacta, Google Analytics, Looker |
Muestra cómo usar Data Catalog con una canalización automatizada de Dataflow para identificar y aplicar etiquetas de sensibilidad de datos a tus datos en archivos de Cloud Storage, bases de datos relacionales y BigQuery. Productos usados: Cloud Build, Cloud Data Loss Prevention, Cloud SQL, Cloud Storage, Compute Engine, Data Catalog, Dataflow, Secret Manager |
En este documento, se muestra cómo replicar y procesar datos operativos de una base de datos de Oracle en Google Cloud en tiempo real. También se muestra cómo predecir la demanda futura y cómo visualizar estos datos de previsión a medida que llegan. Productos que se usan: BigQuery, Dataflow, Looker |
Compila una solución de estadísticas de vision de AA con Dataflow y la API de Cloud Vision Cómo implementar una canalización de Dataflow para procesar archivos de imagen a gran escala con Cloud Vision. Dataflow almacena los resultados en BigQuery para que puedas usarlos para entrenar modelos compilados con anterioridad de BigQuery ML. Productos usados: BigQuery, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Vision, Dataflow |
Exportación de métricas de Cloud Monitoring Describe una forma de exportar las métricas de Cloud Monitoring para realizar un análisis a largo plazo. Productos usados: App Engine, BigQuery, Cloud Monitoring, Cloud Pub/Sub, Cloud Scheduler, Datalab, Looker Studio |
Replicación de datos continua en BigQuery a través de Striim Demuestra cómo migrar una base de datos de MySQL a BigQuery a través de Striim. Striim es una plataforma completa de extracción, transformación y carga (ETL). Productos usados: BigQuery, Cloud SQL para MySQL, Compute Engine |
Replicación de datos continua en Cloud Spanner a través de Striim Cómo migrar una base de datos de MySQL a Cloud Spanner con Striim. Productos usados: Cloud SQL, Cloud SQL para MySQL, Compute Engine, Spanner |
Patrones de diseño de estadísticas de datos En esta página, se proporcionan vínculos a casos de uso empresariales, códigos de muestra y guías de referencia técnica para casos de uso de estadísticas de datos de la industria. Usa estos recursos para aprender, identificar prácticas recomendadas para acelerar la implementación de tus cargas de trabajo. |
Ciencia de datos con R en Google Cloud: instructivo exploratorio de análisis de datos Te muestra cómo comenzar a usar la ciencia de datos a gran escala con R en Google Cloud. Esto está dirigido a aquellos usuarios que tengan experiencia con R y con notebooks de Jupyter, que se sientan cómodos con SQL. Productos usados: BigQuery, Cloud Storage, Notebooks |
Transformación de datos entre MongoDB Atlas y Google Cloud Transformación de datos entre MongoDB Atlas como almacén de datos operativos y BigQuery como almacén de datos analítico. Productos usados: BigQuery, Cloud Pub/Sub, Dataflow |
En este documento, se analiza cómo usar Sensitive Data Protection para crear una canalización de transformación de datos automatizada para desidentificar datos sensibles, como la información de identificación personal (PII). Productos usados: BigQuery, Cloud Data Loss Prevention, Cloud Pub/Sub, Cloud Storage, Dataflow, Identity and Access Management |
En este documento, se describe el uso de Sensitive Data Protection para mitigar el riesgo de exponer los datos sensibles almacenados en las bases de datos de Google Cloud a los usuarios y permitirles consultar datos significativos de todos modos. Productos usados: Registros de auditoría de Cloud, Cloud Data Loss Prevention, Cloud Key Management Service |
Arquitectura de referencia del procesamiento de datos genómicos En este documento, se describen las arquitecturas de referencia para usar Cloud Life Sciences API con otros productos de Google Cloud para realizar el procesamiento de datos genómicos a través de diferentes métodos y motores de flujo de trabajo. Productos usados: Cloud Life Sciences, Cloud Storage y Compute Engine |
Arquitectura de estadísticas geoespaciales Obtén información sobre las capacidades geoespaciales de Google Cloud y cómo puedes usarlas en tus aplicaciones de estadísticas geoespaciales. Productos usados: BigQuery, Dataflow |
Importa datos de una red externa a un almacén de datos seguro de BigQuery Describe una arquitectura que puedes usar para proteger un almacén de datos en un entorno de producción y proporciona prácticas recomendadas para importar datos a BigQuery desde una red externa, como un entorno local. Productos usados: BigQuery |
Importa datos de Google Cloud a un almacén de datos seguro de BigQuery Describe una arquitectura que puedes usar para ayudar a proteger un almacén de datos en un entorno de producción y proporciona prácticas recomendadas para la administración de datos de un almacén de datos en Google Cloud. Productos usados: BigQuery, Cloud Data Loss Prevention, Cloud Key Management Service, Dataflow |
Transferencia de datos clínicos y operativos con Cloud Data Fusion En este documento, se explica a los investigadores, científicos de datos y equipos de TI cómo Cloud Data Fusion puede desbloquear datos a través de la transferencia, transformación y almacenamiento de datos en BigQuery, un almacén de datos agregado en Google Cloud. Productos usados: BigQuery, Cloud Data Fusion, Cloud Storage |
Solución de inicio rápido: lakehouse de Analytics Unifica los data lakes y los almacenes de datos mediante la creación de un lakehouse de análisis con BigQuery para almacenar, procesar, analizar y activar datos. |
Solución de inicio rápido: almacén de datos con BigQuery Crea un almacén de datos con un panel y una herramienta de visualización mediante BigQuery. |
Solución de inicio rápido: App web de Go para compartir datos de gran tamaño Implementa una aplicación de Go en Cloud Run para entregar una gran cantidad de archivos a través de una red de distribución de contenidos y almacenamiento de objetos. |
Solución de inicio rápido: App web de Java para compartir datos de gran tamaño Implementa una aplicación de Java en Cloud Run para entregar una gran cantidad de archivos a través de una red de distribución de contenidos y almacenamiento de objetos. |
Te ayuda a planificar, diseñar y, también, implementar el proceso de migración de las cargas de trabajo de infraestructura y aplicación en Google Cloud, incluidas las cargas de trabajo de procesamiento, de bases de datos y de almacenamiento. Productos usados: App Engine, Cloud Build, Cloud Data Fusion, Cloud Deployment Manager, Cloud Functions, Cloud Run, Cloud Storage, Container Registry, Data Catalog, Dataflow, intercambio de tráfico directo, Google Kubernetes Engine (GKE), Transfer Appliance |
Migra la infraestructura de Hadoop local a Google Cloud Guía sobre cómo migrar las cargas de trabajo locales de Hadoop a Google Cloud… Productos usados: BigQuery, Cloud Storage, Dataproc |
Optimiza las transferencias a gran escala de los eventos de estadísticas y registros Describe una arquitectura para optimizar la transferencia de estadísticas a gran escala en Google Cloud, en la que “gran escala” significa más de 100,000 eventos por segundo o con un total de eventos agregados de tamaño de carga útil por encima de 100 MB por segundo. Productos usados: BigQuery, Cloud Logging, Cloud Pub/Sub, Compute Engine, Dataflow |
Realiza operaciones ETL desde una base de datos relacional en BigQuery con Dataflow En este instructivo, se muestra cómo usar Dataflow para extraer, transformar y cargar datos (ETL) de una base de datos relacional de procesamiento de transacciones en línea (OLTP) en BigQuery para su análisis. Productos usados: BigQuery, Cloud Storage, Compute Engine, Dataflow |
Modelos de propensión para aplicaciones de videojuegos Aprende a usar BigQuery ML para entrenar, evaluar y obtener predicciones de diversos tipos de modelos de propensión diferentes. Los modelos de propensión pueden ayudarte a determinar la probabilidad de que usuarios específicos vuelvan a tu app para que puedas usarla... |
Estadísticas del registro de seguridad en Google Cloud Muestra cómo recopilar, exportar y analizar registros de Google Cloud para ayudarte a auditar el uso y detectar amenazas a tus datos y cargas de trabajo. Usa las consultas de detección de amenazas incluidas para BigQuery o Chronicle, o usa tu propio SIEM. Productos usados: BigQuery, Cloud Logging, Compute Engine, Looker Studio |
Crea una API que pueda predecir la probabilidad de que un cliente realice una compra. Productos usados: Apigee, Hojas de cálculo de apps, BigQuery ML, Spanner |
Seguimiento de los metadatos de procedencia y linaje para datos de atención médica Describe cómo realizar un seguimiento de los metadatos de origen y de linaje para los datos de atención médica en Google Cloud para investigadores, científicos de datos y equipos de TI. Productos usados: BigQuery, Cloud Data Fusion, Cloud Storage |
Transforma y unifica datos de atención médica para BigQuery En este documento, se describen los procesos y las consideraciones relacionadas con la unificación de los datos de atención médica en Google Cloud para investigadores, científicos de datos y equipos de TI que desean crear un data lake de estadísticas en BigQuery. Productos usados: BigQuery, Cloud Data Fusion, Cloud Data Loss Prevention y Cloud Storage |
Usa una canalización de CI/CD para flujos de trabajo de procesamiento de datos En este documento, se describe cómo configurar una canalización de integración continua/implementación continua (CI/CD) para procesar datos a través de la aplicación de métodos de CI/CD con productos administrados en Google Cloud. Productos usados: Cloud Build, Cloud Composer, Cloud Source Repositories, Cloud Storage, Compute Engine y Dataflow |
En este instructivo, se muestra cómo usar Apache Hive en Dataproc de manera eficiente y flexible a través del almacenamiento de datos de Hive en Cloud Storage y el alojamiento del almacén de metadatos en una base de datos MySQL en Cloud SQL. Productos usados: Cloud SQL, Cloud Storage, Dataproc |