Esta página foi traduzida pela API Cloud Translation.

Métodos Monte Carlo com o Dataproc e o Apache Spark

O Dataproc e o Apache Spark oferecem a infraestrutura e a capacidade para executar simulações Monte Carlo desenvolvidas em Java, Python ou Scala.

Os métodos Monte Carlo ajudam a responder uma grande variedade de perguntas relacionadas a negócios, engenharia, ciências, matemática e outros campos. Em uma simulação Monte Carlo, com o uso de amostragem aleatória repetida para criar uma distribuição de probabilidade para uma variável, você consegue respostas para perguntas que não conseguiria com outros métodos. Em finanças, por exemplo, a determinação do preço de uma opção de equidade requer a análise de milhares de possibilidades de mudança do preço da ação ao longo do tempo. Com os métodos Monte Carlo, você simula essas oscilações em uma ampla variedade de resultados possíveis e, ao mesmo tempo, mantém o controle sobre o domínio das entradas para o problema.

No passado, a execução de milhares de simulações poderia levar um longo tempo e ter um alto custo. Com o Dataproc, a capacidade é provisionada sob demanda e paga por minuto. Com o Apache Spark, você usa os clusters de dezenas, centenas ou milhares de servidores para executar simulações de maneira intuitiva, e faz o escalonamento de acordo com as suas necessidades. Isso significa que você consegue executar mais simulações com mais rapidez, o que ajuda a inovar no seu negócio com mais agilidade e possibilita um melhor gerenciamento dos riscos.

A segurança é sempre importante ao lidar com dados financeiros. O Dataproc é executado no Google Cloud, o que ajuda a manter os dados seguros, protegidos e particulares de várias maneiras. Por exemplo, todos os dados são criptografados durante a transmissão e quando em repouso, e Google Cloud está em conformidade com ISO 27001, SOC3 e PCI.

Objetivos

Criar um cluster gerenciado do Dataproc com o Apache Spark pré-instalado.
Executar uma simulação Monte Carlo com o Python que faça a estimativa do crescimento de um portfólio de ações ao longo do tempo.
Executar uma simulação de Monte Carlo com o Scala que simule os lucros de um cassino.

Custos

Neste documento, você vai usar os seguintes componentes faturáveis do Google Cloud:

Para gerar uma estimativa de custo baseada na sua projeção de uso, use a calculadora de preços.

Novos usuários do Google Cloud podem estar qualificados para um teste gratuito.

Ao concluir as tarefas descritas neste documento, é possível evitar o faturamento contínuo excluindo os recursos criados. Para mais informações, consulte Limpeza.

Antes de começar

Configure um Google Cloud projeto

Métodos Monte Carlo com o Dataproc e o Apache Spark

Objetivos

Custos

Antes de começar

Criar um cluster do Dataproc

Desativar a geração de registros para avisos

Use `ssh` para se conectar ao nó principal do cluster do Dataproc

Alterar a configuração de geração de registros

Linguagens de programação do Spark

Estimar o crescimento do portfólio

Programar uma simulação Monte Carlo em Scala

Limpar

Excluir o projeto

A seguir

Métodos Monte Carlo com o Dataproc e o Apache Spark Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Objetivos

Custos

Antes de começar

Criar um cluster do Dataproc

Desativar a geração de registros para avisos

Use ssh para se conectar ao nó principal do cluster do Dataproc

Alterar a configuração de geração de registros

Linguagens de programação do Spark

Estimar o crescimento do portfólio

Programar uma simulação Monte Carlo em Scala

Limpar

Excluir o projeto

A seguir

Métodos Monte Carlo com o Dataproc e o Apache Spark

Use `ssh` para se conectar ao nó principal do cluster do Dataproc