Cloud Storage sortieren

Beispiel eines PySpark-Jobs, um den Inhalt einer Textdatei in Google Cloud Storage zu sortieren

Codebeispiel

Python

Folgen Sie der Einrichtungsanleitung für Python in der Dataproc-Kurzanleitung zur Verwendung von Clientbibliotheken, bevor Sie dieses Beispiel anwenden. Weitere Informationen finden Sie in der Referenzdokumentation zur Dataproc Python API.

Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Dataproc zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Nächste Schritte

Informationen zum Suchen und Filtern von Codebeispielen für andere Google Cloud-Produkte finden Sie im Google Cloud-Beispielbrowser.