Analiza series temporales financieras con BigQuery y Cloud Datalab

Esta solución ilustra el poder y la utilidad de BigQuery y Cloud Datalab como herramientas para el análisis cuantitativo. La solución proporciona una introducción (este documento) y sirve como preparación para ejecutar un instructivo de Cloud Datalab basado en notebooks.

Si eres especialista en análisis cuantitativo, usas varias herramientas y técnicas para analizar macrodatos, como historiales de transacciones de mercado, a fin de obtener información valiosa sobre las tendencias del mercado. Debido a que los presupuestos y las transacciones suceden a intervalos predecibles, esos datos representan una serie temporal financiera que puedes analizar mediante técnicas establecidas, que incluyen el análisis de la frecuencia y los promedios móviles.

Sin embargo, trabajar con conjuntos de datos de gran tamaño puede ser difícil. Las herramientas tradicionales pueden no escalar a medida que el conjunto de datos crece. Los requisitos de almacenamiento pueden crecer al mismo ritmo que el conjunto de datos, por lo que descargar los datos al disco duro de tu computadora ya no es un enfoque practicable. Y puede llevar mucho tiempo recuperar los subconjuntos de datos correctos desde una consulta de base de datos tradicional.

Para resolver estos problemas, BigQuery te permite ejecutar consultas de SQL y obtener resultados con rapidez gracias a la potencia de procesamiento de la infraestructura de Google. Puedes usar BigQuery en la Web, en la línea de comandos y a través de las API. Cuando se combina con otros componentes de Google Cloud Platform (GCP) o herramientas de terceros, BigQuery te permite compilar las aplicaciones del análisis de datos que necesitas en este momento y aun así tener la confianza de que podrás escalarlas en el futuro.

En esta solución, usas un poderoso patrón para el análisis de datos: BigQuery se encarga del trabajo pesado SQL y Cloud Datalab manipula y visualiza los datos en Python en detalle.

La seguridad siempre es importante cuando se trabaja con datos financieros. GCP ayuda a mantener la seguridad y privacidad de tus datos de varias maneras y todos ellos se encriptan durante la transmisión y cuando están en reposo. GCP cumple con las normas ISO 27001, ISO 27017, ISO 27018, SOC3, FINRA y PCI.

Objetivos

  • Cargar un conjunto de datos en BigQuery
  • Usar BigQuery y Cloud Datalab para consultar series temporales de datos financieros
  • Visualizar los resultados de tu consulta en Cloud Datalab

Costos

En este instructivo se usan los siguientes componentes facturables de Google Cloud Platform:

  • Cloud Datalab: los recursos necesarios para ejecutar Cloud Datalab en GCP son facturables. Estos recursos incluyen una máquina virtual Compute Engine, dos discos persistentes y espacio para realizar copias de seguridad en Cloud Storage. Para obtener más información, consulta la página de precios de Cloud Datalab.
  • BigQuery: este instructivo almacena casi 100 MB de datos en BigQuery y procesa menos de 300 MB para ejecutar las consultas una vez. Esta cantidad de datos está dentro de los límites gratuitos mensuales que ofrece BigQuery. Para obtener los detalles completos sobre los costos de BigQuery, consulta la página de precios de BigQuery.

Usa la calculadora de precios a fin de generar una estimación de los costos según el uso previsto. Los usuarios nuevos de GCP pueden optar a una prueba gratuita.

Antes de comenzar

Antes de que comiences el instructivo, debes configurar Cloud Datalab.

Usa Cloud Shell

INICIAR DESDE Cloud Shell

Usa el SDK de Cloud

Si tienes el SDK instalado:

INICIAR DESDE EL SDK de Cloud

Si no tienes el SDK instalado, pero quieres usarlo, debes configurar Cloud Datalab: Realiza la instalación y la inicialización del SDK de Cloud.

Completa el instructivo en la notebook

  1. En la página principal de Cloud Datalab, haz clic en add_box Notebook en la esquina superior izquierda para agregar una notebook nueva.

    agregar una notebook nueva

    Una pestaña nueva que contiene un notebook vacío con una celda de código se abre en tu navegador.

  2. Copia el siguiente código en esa celda y haz clic en Run (ejecutar).

    !gsutil cp gs://solutions-public-assets/bigquery-datalab/* .
    

    ejecutar la notebook nueva

  3. Vuelve a la pestaña original para ver archivos adicionales. Haz clic en Analyzing Financial Time Series using BigQuery and Datalab.ipynb (Analiza series temporales financieras con BigQuery y Datalab.ipynb) para comenzar a trabajar de forma interactiva con el instructivo.

    Analiza series temporales financieras con BigQuery.ipynb

  4. Si no estás familiarizado con las notebooks de Cloud Datalab, lee el documento Introduction to Notebooks.ipynb (Introducción a las notebooks.ipynb) que se encuentra en la subcarpeta docs / intro.

    Introducción a las notebooks.ipynb

  5. Sigue el resto del instructivo en la notebook.

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...