Big data dan referensi analisis

Last reviewed 2024-04-05 UTC

Architecture Center menyediakan referensi konten dari berbagai subjek big data dan analisis.

Referensi analisis dan big data di Architecture Center

Anda dapat memfilter daftar big data dan referensi analisis berikut dengan mengetik nama produk atau frasa yang ada di judul referensi atau deskripsi.

Menganalisis data FHIR di BigQuery

Menjelaskan proses dan pertimbangan untuk menganalisis data Fast Healthcare Interoperability Resources (FHIR) di BigQuery.

Penggunaan produk: BigQuery

Architecture dan fungsi di mesh data

Panduan cara penerapan mesh data di Google Cloud...

Architecture: Warehouse Data Marketing

Menyediakan referensi arsitektur dengan penjelasan untuk Anda membuat data warehouse yang terukur

Penggunaan produk: AIPlatform, Auto, ML, BigQuery, Cloud, Data Fusion, Dataflow, Dataprepby, Trifacta, Google, Analytics, Looker

Terapkan tag sensitivitas di Data Catalog secara otomatis ke file, database, dan tabel BigQuery

Menampilkan cara penggunaan Data Catalog dengan pipeline Dataflow otomatis untuk mengidentifikasi dan menerapkan penanda sensitivitas pada data Anda di file Cloud Storage, database relasional, dan BigQuery.

Penggunaan produk: Cloud Build, Cloud Data Loss Prevention, Cloud SQL, Cloud Storage, Compute Engine, Data Catalog, Dataflow, Secret Manager

Buat dan visualisasi prediksi perkiraan permintaan dengan Datastream, Dataflow, BigQuery, dan Looker

Menunjukan Anda cara mereplikasi dan memproses data operasional secara real time dari database Oracle ke Google Cloud Laporan ini juga menunjukan cara memprediksi permintaan di masa mendatang, dan cara memvisualisasi data prakiraan ketika didapatkan.

Penggunaan produk: BigQuery, Dataflow, Looker

Membangun solusi analisis visi ML dengan Dataflow dan Cloud Vision API

Cara men-deploy pipeline Dataflow untuk memproses file image berskala besar dengan Cloud Vision. Dataflow menyimpan hasil di BigQuery sehingga Anda dapat menggunakannya untuk melatih model bawaan BigQuery ML.

Produk yang digunakan: BigQuery, Cloud Build, Cloud Pub/Sub, Cloud Storage, Cloud Vision, Dataflow

Ekspor metric Cloud Monitoring

Menjelaskan cara mengekspor metrik Cloud Monitoring untuk analisis jangka panjang.

Penggunaan produk: App Engine, BigQuery, Cloud Monitoring, Cloud Pub/Sub, Cloud Scheduler, Datalab, Looker Studio

Replikasi data berkelanjutan ke BigQuery menggunakan Striim

Mendemonstrasi cara memindahkan database MySQL ke BigQuery menggunakan Striim. Striim adalah platform streaming komperhensif untuk ekstraksi, transformasi, dan pemuatan (ETL)

Produk yang digunakan: BigQuery, Cloud SQL for MySQL, Compute Engine

Replikasi data berkelanjutan ke Spanner menggunakan Striim

Cara memigrasikan database MySQL ke Cloud Spanner menggunakan Striim.

Produk yang digunakan: Cloud SQL, Cloud SQL untuk MySQL, Compute Engine, Spanner

Pola desain analisis data

Menyediakan link untuk kasus penggunaan bisnis, kode sampel, dan panduan referensi teknis untuk kasus penggunaan analisis data industri Gunakan referensi ini untuk belajar, identifikasi praktik terbaik untuk mempercepat penerapan pekerjaan Anda.

Data science dengan R pada Google Cloud: Analisis data eksplorasi

Menunjukkan kepada Anda cara memulai data science dalam skala besar dengan R pada Google Cloud. Dokumen ini ditujukan bagi mereka yang memiliki pengalaman menggunakan R dan Jupyter notebook, serta terbiasa menggunakan SQL.

Produk yang digunakan: BigQuery, Cloud Storage, Notebooks

Transformasi data antara MongoDB Atlas dan Google Cloud

Transformasi data antara MongoDB Atlas sebagai penyimpanan data operasional dan BigQuery sebagai data warehouse analisis.

Produk yang digunakan: BigQuery, Cloud Pub/Sub, Dataflow

De-identifikasi dan identifikasi ulang PII dalam set data berskala besar menggunakan Perlindungan Data Sensitif

Membahas cara menggunakan Perlindungan Data Sensitif untuk membuat pipeline transformasi data otomatis guna melakukan de-identifikasi data sensitif seperti informasi identitas pribadi (PII).

Penggunaan produk: BigQuery, Cloud Data Loss Prevention, Cloud Pub/Sub, Cloud Storage, Dataflow, Identity and Access Management

Contoh arsitektur untuk penggunaan DLP proxy guna membuat kueri database berisi data sensitif

Menjelaskan penggunaan Perlindungan Data Sensitif untuk mengurangi risiko pengungkapan data sensitif yang disimpan dalam database Google Cloud kepada pengguna, tetapi tetap mengizinkan mereka membuat kueri data yang penting.

Penggunaan produk: Cloud Audit Logs, Cloud Data Loss Prevention, Cloud Key Management Service

Arsitektur referensi pengolahan data genomik

Menjelaskan arsitektur referensi untuk penggunaan Cloud Life Sciences API dengan produk Google Cloud lainnya dalam melakukan pengolahan data genomik menggunakan berbagai metode dan engine alur kerja.

Penggunaan produk: Cloud Life Sciences, Cloud Storage, Compute Engine

Arsitektur analisis geospasial

Pelajari kemampuan geospasial Google Cloud dan cara Anda menggunakan kemampuannya di aplikasi analisis geospasial Anda.

Penggunaan produk: BigQuery, Dataflow

Mengimpor data dari jaringan eksternal ke warehouse data BigQuery yang aman

Menjelaskan arsitektur yang dapat Anda gunakan untuk membantu mengamankan data warehouse di lingkungan produksi, dan memberikan praktik terbaik untuk mengimpor data ke BigQuery dari jaringan eksternal seperti lingkungan lokal.

Produk yang digunakan: BigQuery

Mengimpor data dari Google Cloud ke data warehouse BigQuery yang aman

Menjelaskan arsitektur yang dapat Anda gunakan untuk membantu mengamankan data warehouse di lingkungan produksi, dan memberikan praktik terbaik untuk tata kelola data dalam data warehouse di Google Cloud.

Produk yang digunakan: BigQuery, Cloud Data Loss Prevention, Cloud Key Management Service, Dataflow

Menyerap data klinis dan operasional dengan Cloud Data Fusion

Menjelaskan kepada peneliti, data scientist, dan tim IT bagaimana Cloud Data Fusion dapat membuka data dengan menyerap, mengubah, dan menyimpan data di BigQuery, data warehouse gabungan di Google Cloud.

Produk yang digunakan: BigQuery, Cloud Data Fusion, Cloud Storage

Solusi Praktis: Lakehouse analisis

Satukan data lake dan data warehouse dengan membuat lakehouse analisis menggunakan BigQuery untuk menyimpan, memproses, menganalisis, dan mengaktifkan data.

Solusi Langsung Mulai: Data warehouse dengan BigQuery

Bangun data warehouse dengan dasbor dan alat visualisasi menggunakan BigQuery.

Solusi Langsung: Aplikasi web Go berbagi data besar

Men-deploy aplikasi Go di Cloud Run untuk menyajikan file dalam jumlah besar menggunakan jaringan penayangan konten (CDN) dan penyimpanan objek.

Solusi Praktis: Aplikasi web berbagi data besar, Java

Men-deploy aplikasi Java di Cloud Run untuk menyajikan file dalam jumlah besar menggunakan jaringan penayangan konten (CDN) dan penyimpanan objek.

Bermigrasi ke Google Cloud

Membantu Anda merencanakan, mendesain, dan menerapkan proses migrasi workload aplikasi dan infrastruktur Anda ke Google Cloud, termasuk workload komputasi, database, dan penyimpanan.

Penggunaan produk: App Engine, Cloud Build, Cloud Data Fusion, Cloud Deployment Manager, Cloud Functions, Cloud Run, Cloud Storage, Container Registry, Data Catalog, Dataflow, Direct Peering, Google Kubernetes Engine (GKE), Transfer Appliance

Melakukan Migrasi Infrastruktur Hadoop Lokal ke Google Cloud

Panduan memindahkan workload Hadoop lokal ke Google Cloud...

Penggunaan produk: BigQuery, Cloud Storage, Dataproc

Mengoptimalisasi proses transfer berskala besar dari analisis dan logs

Menjelaskan arsitektur untuk mengoptimalkan penyerapan analisis berskala besar di Google Cloud, dengan 'skala besar' yang berarti lebih dari 100000 peristiwa per detik, atau memiliki total ukuran payload peristiwa gabungan lebih dari 100 MB per detik.

Penggunaan produk: BigQuery, Cloud Logging, Cloud Pub/Sub, Compute Engine, Dataflow

Melakukan ETL dari database relasional ke BigQuery menggunakan Dataflow

Menunjukan cara penggunaan Dataflow untuk mengekstrak, mengubah, dan memuat data (ETL) dari database relasional pengolahan transaksi online (OLTP) ke BigQuery untuk analisis.

Penggunaan produk: BigQuery, Cloud Storage, Compute Engine, Dataflow

Pemodelan kecenderungan untuk aplikasi gaming

Pelajari cara penggunaan BigQuery ML untuk melatih, mengevaluasi, dan mendapatkan prediksi dari beberapa jenis model kecenderungan. Model kecenderungan dapat membantu Anda menentukan kemungkinan pengguna tertentu untuk kembali ke aplikasi Anda, sehingga Anda bisa menggunakannya...

Analisis log keamanan di Google Cloud

Menunjukkan cara mengumpulkan, mengekspor, dan menganalisis log dari Google Cloud untuk membantu Anda mengaudit penggunaan serta mendeteksi ancaman terhadap data dan workload Anda. Gunakan kueri deteksi ancaman yang disertakan untuk BigQuery atau Chronicle, atau gunakan SIEM Anda sendiri.

Produk yang digunakan: BigQuery, Cloud Logging, Compute Engine, Looker Studio

Smart API untuk memprediksi kecenderungan pelanggan untuk membeli menggunakan Apigee, BigQuery ML, dan Spanner

Buat API yang memprediksi seberapa besar kemungkinan pelanggan melakukan pembelian.

Produk yang digunakan: Apigee, App Sheet, BigQuery ML, Spanner

Melacak metadata provenance dan silsilah untuk data layanan kesehatan

Menjelaskan cara melacak metadata silsilah dan sumber untuk data layanan kesehatan di Google Cloud bagi peneliti, ilmuwan data, dan tim IT.

Produk yang digunakan: BigQuery, Cloud Data Fusion, Cloud Storage

Mentransformasi dan menyesuaikan data layanan kesehatan untuk BigQuery

Menjelaskan proses dan pertimbangan yang terlibat dalam penyesuaian data layanan kesehatan di Google Cloud bagi peneliti, ilmuwan data, dan tim IT yang ingin membuat data lake analisis di BigQuery.

Penggunaan produk: BigQuery, Cloud Data Fusion, Cloud Data Loss Prevention, Cloud Storage

Menggunakan pipeline CI/CD untuk alur kerja pengolahan data

Menjelaskan cara menyiapkan pipeline continuous integration/continuous deployment (CI/CD) untuk memproses data dengan menerapkan metode CI/CD dengan produk yang terkelola di Google Cloud.

Penggunaan produk: Cloud Build, Cloud Composer, Cloud Source Repositories, Cloud Storage, Compute Engine, Dataflow

Penggunaan Apache Hive di Dataproc

Menunjukkan cara penggunaan Apache Hive di Dataproc secara efisien dan fleksibel dengan menyimpan data Hive di Cloud Storage dan hosting metastore Hive di database MySQL di Cloud SQL.

Produk yang digunakan: Cloud SQL, Cloud Storage, Dataproc