Trier dans Cloud Storage

Exemple de tâche PySpark permettant de trier le contenu d'un fichier texte dans Cloud Storage

Exemple de code

Python

Avant d'essayer cet exemple, suivez les instructions de configuration de Python dans le guide de démarrage rapide de Dataproc : Utiliser les bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Dataproc Python.

Pour vous authentifier auprès de Dataproc, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.

import pyspark

sc = pyspark.SparkContext()
rdd = sc.textFile("gs://path-to-your-GCS-file")
print(sorted(rdd.collect()))

Étapes suivantes

Pour rechercher et filtrer des exemples de code pour d'autres produits Google Cloud, consultez l'exemple de navigateur Google Cloud.