Cloud Storage sortieren

Beispiel eines PySpark-Jobs, um den Inhalt einer Textdatei in Google Cloud Storage zu sortieren

Codebeispiel

Python

Folgen Sie der Einrichtungsanleitung für Python in der Dataproc-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Dataproc Python API.

Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Dataproc zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Nächste Schritte

Wenn Sie nach Codebeispielen für andere Google Cloud -Produkte suchen und filtern möchten, können Sie den Google Cloud -Beispielbrowser verwenden.