Diese Seite enthält Links zu öffentlichen Artikeln, Videos und Podcasts zu Dataflow.
Ankündigungen
Informationen zu Ankündigungen und Updates finden Sie in den folgenden Ressourcen:
- Dataflow-Neuigkeiten: Google Cloud Blog
- Dataflow-Aktualisierungen: Dataflow-Versionshinweise
- Apache Beam-Updates: Apache Beam SDK-Versionshinweise
Dataflow-Umgebung
- Dataflow, das Rückgrat der Datenanalyse
- Dataflow hinter den Kulissen: die Ursprünge Teil 1, Teil 2, Teil 3
- In den Open-Source-Dokumenten von Apache Beam finden Sie weitere Informationen zur Entwicklung eines einheitlichen Modells, zur Definition von Pipelines und zur Ausführung von Pipelines in Dataflow oder einem der von Apache Beam unterstützten verteilten Back-Ends.
Kundenberichte
- Sammlung von Dataflow-Berichten – Medium-Publikation
- Dataflow ein führender Anbieter 2021 bei Streamanalyse – Forrester Wave
- Tool für Echtzeit-Feedback für Live-Zielgruppen erstellen – ITV
- Dataflow-Pipelines überwachen – Medium-Publikation
- Ausführungsmodell für hochskalierbare Datenverarbeitung mit niedriger Latenz – Medium-Publikation
- Beschleunigung der Modellinferenz beim maschinellen Lernen in Dataflow mit GPUs – Nvidia
- Berechnung anhand großer Datasets ausführen – Pandora
- Größter Dataflow-Job aller Zeiten für Wrapped 2020 optimiert – Spotify
- Milliarden von Ereignissen in Echtzeit mit Dataflow verarbeiten – Twitter
- Dataflow in der Smart Home-Data Pipeline – Nest
- JSON-Nachrichten in BigQuery-JSON-Spalte streamen – Mittel
- AXA Schweiz: Mit Google Cloud Analyselösungen interne Prozesse fördern und Dienste entwickeln
- Bayer Crop: Bodengesundheit und Ernteverwaltung mit raumbezogener Analyse in BigQuery and Dataflow verbessern
- Dow Jones: Built a knowledge Graph of key events documented in over 30 years of news content
- HSBC: Mit der Cloud durch schnelle Einblicke und Analysefunktionen Risiken senken
- Nintendo: Dataflow und Pub/Sub zum Erfassen und Analysieren von Nutzungslogs für Spiele in BigQuery verwenden
- Quantiphi: Serverlose Lösung zur Erkennung von Kreditkartenbetrug in Echtzeit
- SoFi Metro: Entwicklung einer Fan-App für persönlichen Concierge, um Spielerfahrung für jeden Nutzer anzupassen
- Spotify: Experimente mit der Streamverarbeitung in Dataflow
- Subaru Corporation: Mit Google Cloud KI und maschinellem Lernen die Entwicklung beschleunigen
- Telus: Modernisierung mit Data Science beschleunigen
- Tokopedia: Kundendatenplattform in Google Cloud erstellt
- Tyson Foods: Neue Datenplattform durch Entwicklung von Ingestion as a Service
- Vodafone: Google Cloud für die sichere Freigabe von Smartphonedaten verwenden
Brightcove: Serverless data processing with Dataflow and Pub/Sub
Sky: Echtzeit-Streamanalyse mit Dataflow
Spotify: Von Music-Intelligence-Pipeline und Mikrodiensten zu Dataflow und Pub/Sub migrieren
Two Sigma: Serverlose Datenverarbeitung in Dataflow voranbringen
Tyson Foods: Echtzeitnutzen mit Streaminganalysen generieren
Veolia: Dataflow in der Produktion nutzen, um Zehntausende von Dateien umzuwandeln, zu bereinigen und in unseren BigQuery-Data Lake einzufügen
Verizon: Analyseplattform für das Internet auf Google Cloud
Technische Anleitung
Dataflow in einer Minute
Was ist Dataflow?
Google Cloud Technologie: 1) Was ist Apache Beam?
Google Cloud Tech: 2) So verwenden Sie WordCount in Apache Beam
Google Cloud Tech: 3) So verarbeiten Sie Streamdaten in Apache Beam
Google Cloud Tech: 4) So verarbeiten Sie verspätete Daten in Apache Beam
Google Cloud Technologie: 5) Daten in Apache Beam zusammenführen
Apache Beam – ein einheitliches Modell für die Batch- und Streaming-Datenverarbeitung
Kurze Einführung in Dataflow-Datenpipelines
Einfacher Zugriff auf Streamanalysen mit Google Cloud
- Data Engineering-gestützte Organisation aufbauen
- Vorlagen aus einer beliebigen Dataflow-Pipeline erstellen
- Dataflow-Vorlagen für Elastic Cloud
- Dataflow-Pipelines – Datenpipelines im großen Maßstab bereitstellen und verwalten
- Automatische Dataflow-Fragmentierung für BigQuery liefert 3-fache Leistung
- Google Cloud Daten mit Dataflow-Vorlagen in Elastic Stack exportieren
- Dataflow-Vorlage mit UDF erweitern
- Genau einmalige Verarbeitung in Dataflow: Teil 1, Teil 2, Teil 3
- Datenverarbeitung mit Dataflow-GPU optimieren
- Duplikate in Streamingpipelines mit Dataflow und Pub/Sub verarbeiten
- Informationen zu Apache Beam-Mustern mit Clickstream-Verarbeitung von Google Tag Manager-Daten
- Muster des maschinellen Lernens mit Apache Beam und Dataflow Runner
- Daten mit der Big Query Storage Write API in BigQuery streamen
- Datenverarbeitung mit Dataflow Prime vereinfachen und automatisieren
- Drei Möglichkeiten, wie Dataflow-Kunden ihren ROI steigern
- Referenzmuster zur Anomalieerkennung in Echtzeit verwenden, um Betrug zu bekämpfen
- TFX-Inferenz mit Dataflow für umfangreiche ML-Inferenzmuster verwenden
- Vorteile flexibler Vorlagen für Dataflow-Bereitstellungen
- "Writing Dataflow pipelines with scalability in mind" (Dataflow-Pipelines unter Berücksichtigung von Skalierbarkeit schreiben)
- Leitfaden zu gängigen Dataflow-Anwendungsfallmustern: Teil 1, Teil 2.
Apache Beam Summit: Umgang mit doppelten Daten in Streaming-Pipelines mit Dataflow und Pub/Sub
Cloud OnAir: Streamverarbeitung mit Dataflow: SDKs und Architekturen
Cloud Next: Datenverarbeitung in Google Cloud: Hadoop, Spark und Dataflow
Cloud Next: Echtzeit-KI – Dataflow, TensorFlow Extended und Cloud AI zusammenführen
Cloud Next: Apache Beam – Portierbare und parallele Datenverarbeitung
Cloud Next: Serverlose Datenverarbeitung in Dataflow voranbringen
Cloud Next: Reale Datenintegrationsmuster in Google Cloud
Cloud Next: Streaminganalysen in Google Cloud
Cloud Next: Eigene Ereignisanalyse-Pipeline mit BigQuery, Dataflow und Kubernetes erstellen
Cloud Next: Moderne Datenpipeline in Aktion
Cloud Next: Apache Kafka-Umgebung As-a-Service in Google Cloud mit Confluent Cloud
Fehlerbehebung und Monitoring
Dataflow-Beobachtbarkeit, Monitoring und Fehlerbehebung
Apache Beam College: Dataflow-Monitoring
Apache Beam College: Dataflow-Logging
Apache Beam College: Fehlerbehebung und Fehlerbehebung für Apache Beam und Dataflow
Podcasts
- Google Cloud Podcastfolge 81 – Dataflow mit Frances Perry
- Software Engineering Daily Podcast – Dataflow mit Eric Anderson
- Software Engineering Radio Podcast – Folge 272: Apache Beam