Daten mit einer parallelen Schleife aggregieren
Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Separate Abfragen für ein öffentliches BigQuery-Dataset geben jeweils die Anzahl der Wörter in einem Dokument oder einer Gruppe von Dokumenten zurück. Mit einer gemeinsam genutzten Variablen kann die Anzahl der Wörter kumuliert und nach Abschluss aller Iterationen gelesen werden.
Weitere Informationen
Eine ausführliche Dokumentation, die dieses Codebeispiel enthält, finden Sie hier:
Codebeispiel
Nächste Schritte
Wenn Sie nach Codebeispielen für andere Google Cloud -Produkte suchen und filtern möchten, können Sie den Google Cloud -Beispielbrowser verwenden.
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],[],[],[],null,["# Aggregate data using a parallel loop\n\nSeparate queries to a public BigQuery dataset each return the number of words in a document, or set of documents. A shared variable allows the count of the words to accumulate and be read after all the iterations complete.\n\nExplore further\n---------------\n\n\nFor detailed documentation that includes this code sample, see the following:\n\n- [Execute workflow steps in parallel](/workflows/docs/execute-parallel-steps)\n\nCode sample\n-----------\n\n### YAML\n\n # Use a parallel loop to make ten queries to a public BigQuery dataset and\n # use a shared variable to accumulate a count of words; after all iterations\n # complete, return the total number of words across all documents\n main:\n params: [input]\n steps:\n - init:\n assign:\n - numWords: 0\n - corpuses:\n - sonnets\n - various\n - 1kinghenryvi\n - 2kinghenryvi\n - 3kinghenryvi\n - comedyoferrors\n - kingrichardiii\n - titusandronicus\n - tamingoftheshrew\n - loveslabourslost\n - runQueries:\n parallel: # 'numWords' is shared so it can be written within the parallel loop\n shared: [numWords]\n for:\n value: corpus\n in: ${corpuses}\n steps:\n - runQuery:\n call: googleapis.bigquery.v2.jobs.query\n args:\n projectId: ${sys.get_env(\"GOOGLE_CLOUD_PROJECT_ID\")}\n body:\n useLegacySql: false\n query: ${\"SELECT COUNT(DISTINCT word) FROM `bigquery-public-data.samples.shakespeare` \" + \" WHERE corpus='\" + corpus + \"' \"}\n result: query\n - add:\n assign:\n - numWords: ${numWords + int(query.rows[0].f[0].v)} # first result is the count\n - done:\n return: ${numWords}\n\nWhat's next\n-----------\n\n\nTo search and filter code samples for other Google Cloud products, see the\n[Google Cloud sample browser](/docs/samples?product=workflows)."]]