Cette page a été traduite par l'API Cloud Translation.

Méthodes Monte Carlo avec Cloud Dataproc et Apache Spark

Dataproc et Apache Spark vous fournissent l'infrastructure et la capacité dont vous avez besoin pour exécuter des simulations Monte Carlo rédigées en langage Java, Python ou Scala.

Les méthodes de Monte-Carlo peuvent permettre de répondre à un large éventail de questions dans les domaines des affaires, de l'ingénierie, des sciences, des mathématiques, etc. En procédant par échantillonnage aléatoire répété afin de créer une distribution de probabilité pour une variable, une simulation Monte-Carlo permet de répondre à des questions qui seraient insolubles par tout autre moyen. Ainsi, dans le domaine financier, la fixation du prix d'une option sur titres nécessite d'analyser les milliers de façons dont le cours de ce titre pourrait varier sur une certaine période. Les méthodes de Monte-Carlo offrent un moyen de simuler ces variations de cours des actions sur différents résultats possibles, tout en gardant le contrôle sur le domaine des intrants possibles du problème.

Auparavant, l'exécution de milliers de simulations pouvait prendre un temps considérable et engendrer des coûts élevés. Dataproc vous offre la possibilité de provisionner la capacité à la demande en payant à la minute. Apache Spark vous permet d'utiliser des clusters de plusieurs dizaines, centaines ou milliers de serveurs pour exécuter des simulations de manière intuitive et évolutive en fonction de vos besoins. Résultat : vous pouvez exécuter plus de simulations en moins de temps, ce qui peut aider votre entreprise à innover plus rapidement et à mieux gérer les risques.

La sécurité est toujours importante lorsque vous travaillez sur des données financières. Dataproc s'exécute sur Google Cloud, qui vous offre plusieurs moyens de gérer vos données de manière sécurisée et privée. Par exemple, toutes les données sont chiffrées en transit et au repos, et Google Cloud est conforme aux normes ISO 27001, SOC3 et PCI.

Objectifs

Créer un cluster Dataproc géré avec Apache Spark préinstallé
Exécuter une simulation Monte-Carlo à l'aide de Python pour estimer la croissance d'un portefeuille d'actions au fil du temps
Exécuter une simulation Monte-Carlo à l'aide de Scala pour simuler les gains d'un casino

Coûts

Dans ce document, vous utilisez les composants facturables suivants de Google Cloud :

Pour obtenir une estimation des coûts en fonction de votre utilisation prévue, utilisez le simulateur de coût.

Les nouveaux utilisateurs de Google Cloud peuvent bénéficier d'un essai gratuit.

Une fois que vous avez terminé les tâches décrites dans ce document, vous pouvez éviter de continuer à payer des frais en supprimant les ressources que vous avez créées. Pour en savoir plus, consultez la section Effectuer un nettoyage.

Avant de commencer

Configurer un projet Google Cloud

Méthodes Monte Carlo avec Cloud Dataproc et Apache Spark

Objectifs

Coûts

Avant de commencer

Créer un cluster Dataproc

Désactiver la journalisation des avertissements

Utiliser `ssh` pour se connecter au nœud principal du cluster Dataproc

Redéfinir le paramètre de journalisation

Langages de programmation Spark

Estimer la croissance d'un portefeuille

Programmer une simulation Monte-Carlo en langage Scala

Effectuer un nettoyage

Supprimer le projet

Étapes suivantes

Méthodes Monte Carlo avec Cloud Dataproc et Apache Spark Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Objectifs

Coûts

Avant de commencer

Créer un cluster Dataproc

Désactiver la journalisation des avertissements

Utiliser ssh pour se connecter au nœud principal du cluster Dataproc

Redéfinir le paramètre de journalisation

Langages de programmation Spark

Estimer la croissance d'un portefeuille

Programmer une simulation Monte-Carlo en langage Scala

Effectuer un nettoyage

Supprimer le projet

Étapes suivantes

Méthodes Monte Carlo avec Cloud Dataproc et Apache Spark

Utiliser `ssh` pour se connecter au nœud principal du cluster Dataproc