Ordinamento di Cloud Storage

Un job PySpark di esempio per ordinare i contenuti di un file di testo in Cloud Storage.

Esempio di codice

Python

Prima di provare questo esempio, segui le istruzioni di configurazione di Python disponibili nella guida rapida di Dataproc sull'utilizzo delle librerie client. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Dataproc Python.

Per eseguire l'autenticazione su Dataproc, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Passaggi successivi

Per cercare e filtrare esempi di codice per altri prodotti Google Cloud, consulta il browser di esempio Google Cloud.