Analyser des séries temporelles financières à l'aide de BigQuery et de Cloud Datalab

Cette solution illustre la puissance et l'utilité de BigQuery et Cloud Datalab en tant qu'outils d'analyse quantitative. Elle fournit une présentation (ce document) et vous permet de configurer un tutoriel Cloud Datalab basé sur des blocs-notes.

Si vous occupez le poste d'analyste quantitatif, vous employez un éventail varié d'outils et de techniques pour explorer le big data, comme l'historique des opérations de marché, afin d'obtenir des informations permettant de mieux comprendre les tendances du marché. Étant donné que les cotes et les opérations se produisent à des intervalles prévisibles, ces données représentent une série temporelle financière que vous pouvez analyser à l'aide de techniques éprouvées (par exemple, l'analyse de la fréquence et les moyennes mobiles).

Toutefois, le traitement d'ensembles de données volumineux peut s'avérer difficile. Les outils traditionnels peuvent ne pas s'adapter au développement de l'ensemble de données. Les exigences en matière de stockage peuvent croître aussi rapidement que l'ensemble de données. Le téléchargement de données sur le disque dur de votre ordinateur n'est donc plus une solution viable. De plus, la récupération des sous-ensembles de données appropriés à partir d'une requête de base de données classique peut prendre beaucoup de temps.

BigQuery résout ces problèmes en vous permettant d'exécuter des requêtes SQL et d'obtenir des résultats rapidement grâce à la puissance de traitement de l'infrastructure de Google. Vous pouvez employer BigQuery sur le Web, sur la ligne de commande et via des API. Lorsqu'il est associé à d'autres composants de Google Cloud Platform (GCP) ou à des outils tiers, BigQuery vous permet de créer les applications d'analyse de données dont vous avez besoin actuellement, tout en étant assuré de pouvoir les faire évoluer à l'avenir.

Dans cette solution, vous utilisez un modèle puissant pour l'analyse des données : BigQuery se charge de la majeure partie du travail en SQL, et Cloud Datalab effectue une manipulation et une visualisation détaillées des données en Python.

La sécurité est toujours une considération importante lorsque vous travaillez sur des données financières. GCP permet d'assurer la protection, la sécurité et la confidentialité des données de plusieurs manières. Toutes les données sont chiffrées pendant la transmission et au repos. GCP est également conforme aux normes ISO 27001, ISO 27017, ISO 27018, SOC3, FINRA et PCI.

Objectifs

  • Charger un ensemble de données dans BigQuery
  • Interroger des données de séries temporelles financières à l'aide de BigQuery et de Cloud Datalab
  • Visualiser les résultats de la requête dans Cloud Datalab

Coûts

Ce tutoriel utilise les composants facturables de Google Cloud Platform répertoriés ici :

  • Cloud Datalab : les ressources nécessaires pour exécuter Cloud Datalab sur GCP sont facturables. Ces ressources incluent une machine virtuelle Compute Engine, deux disques persistants et de l'espace pour les sauvegardes Cloud Storage. Pour en savoir plus, consultez la page Tarifs de Cloud Datalab.
  • BigQuery : ce tutoriel stocke près de 100 Mo de données dans BigQuery et a besoin de moins de 300 Mo pour exécuter les requêtes une fois. Cette quantité de données est couverte par les limites d'utilisation gratuite prévues chaque mois par BigQuery. Pour obtenir des informations complètes sur les coûts BigQuery, consultez la page Tarifs de BigQuery.

Vous pouvez vous servir du simulateur de coût pour générer une estimation des coûts en fonction de votre utilisation prévue. Les nouveaux utilisateurs de GCP peuvent bénéficier d'un essai gratuit.

Avant de commencer

Avant de commencer le tutoriel, vous devez configurer Cloud Datalab.

Utiliser Cloud Shell

LANCEMENT DEPUIS Cloud Shell

Utiliser le SDK Cloud

Si le SDK est installé :

LANCEMENT DEPUIS LE SDK Cloud

Si le SDK n'est pas installé, mais que vous souhaitez vous en servir pour configurer Cloud Datalab : Installez et initialisez le SDK Cloud.

Exécuter le tutoriel dans le bloc-notes

  1. Sur la page d'accueil de Cloud Datalab, ajoutez un bloc-notes en cliquant sur add_box Notebook (Bloc-notes) dans l'angle supérieur gauche.

    ajouter un nouveau bloc-notes

    Un nouvel onglet contenant un bloc-notes vide avec une cellule de code s'ouvre dans le navigateur.

  2. Copiez le code suivant dans cette cellule, puis cliquez sur Run (Exécuter) pour l'exécuter.

    !gsutil cp gs://solutions-public-assets/bigquery-datalab/* .
    

    exécuter le nouveau bloc-notes

  3. Revenez à l'onglet d'origine pour voir des fichiers supplémentaires. Cliquez sur Analyzing Financial Time Series using BigQuery and Datalab.ipynb (Analyser des séries temporelles financières à l'aide de BigQuery et de Datalab.ipynb) pour commencer à travailler de manière interactive tout au long du tutoriel.

    Analyser des séries temporelles financières à l'aide de BigQuery et de Datalab.ipynb

  4. Si vous ne connaissez pas les blocs-notes Cloud Datalab, consultez le document Introduction to Notebooks.ipynb (Présentation des blocs-notes.ipynb) qui se trouve dans le sous-dossier docs/intro.

    Présentation des blocs-notes.ipynb

  5. Suivez le reste du tutoriel dans le bloc-notes.

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…