Cloud Storage sortieren

Beispiel eines PySpark-Jobs, um den Inhalt einer Textdatei in Google Cloud Storage zu sortieren

Codebeispiel

Python

Folgen Sie der Einrichtungsanleitung Python in der Dataproc-Kurzanleitung mit Clientbibliotheken, bevor Sie dieses Beispiel ausprobieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Dataproc Python API.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Nächste Schritte

Informationen zum Suchen und Filtern von Codebeispielen für andere Google Cloud-Produkte finden Sie im Google Cloud-Beispielbrowser.