Aprendizaje automático con datos de series temporales financieras

Esta solución presenta un ejemplo del uso del aprendizaje automático con series temporales financieras en Google Cloud Platform.

Las series temporales son una parte esencial del análisis financiero. En la actualidad, contamos con más datos a nuestra disposición que nunca, más fuentes de datos y más frecuencia de entrega de estos. Las nuevas fuentes incluyen nuevos intercambios, nuevos canales de redes sociales y fuentes de noticias. La frecuencia de la entrega aumentó de decenas de mensajes por segundo hace diez años a cientos de miles de mensajes por segundo en la actualidad. Como es lógico, se están aplicando nuevas y diferentes técnicas de análisis como resultado. La mayor parte de las técnicas de análisis modernas no son diferentes en el sentido de ser nuevas, y todas se basan en estadísticas, pero su aplicabilidad ha seguido de cerca la cantidad de potencia informática disponible. La capacidad informática disponible crece a mayor velocidad que los volúmenes de series temporales, por lo que ahora es posible analizar series temporales a gran escala de formas que antes no eran viables.

En particular, las técnicas de aprendizaje automático, especialmente el aprendizaje profundo, son muy prometedoras para el análisis de series temporales. A medida que las series temporales se vuelven más densas y comienzan a superponerse, el aprendizaje automático ofrece una manera de separar la señal del ruido. El aprendizaje profundo tiene potencial porque generalmente se ajusta mejor a la naturaleza aparentemente aleatoria de las series temporales financieras.

Esta solución utiliza datos públicos de Quandl.

Objetivos

  • Obtener datos para diferentes mercados financieros
  • Transformar los datos en un formato utilizable y realizar análisis exploratorios de datos a fin de explorar y validar una premisa
  • Utilizar TensorFlow para crear, entrenar y evaluar diferentes modelos a fin de predecir lo que pasará en mercados financieros

Costos

Consulta Precios de Cloud Datalab para comprender los costos de Cloud Datalab.

En este instructivo, se utilizan Google BigQuery y Google Cloud Storage, lo que podría aumentar los costos.

Antes de comenzar

Implementa y accede a Cloud Datalab. Sigue los pasos en la Guía de inicio rápido de Cloud Datalab.

Utilizar el instructivo

El instructivo se ejecuta en un notebook de Cloud Datalab. Cloud Datalab se crea en notebooks de Jupyter. Con Cloud Datalab, puedes analizar datos en Google BigQuery y Google Cloud Storage mediante Python y SQL.

Utilizar el notebook

El notebook es una muestra preinstalada que se incluye en la distribución de Cloud Datalab. Si deseas ver el notebook, haz lo siguiente:

  1. En la página local de Cloud Datalab en tu navegador, ve a la carpeta datalab/docs/samples/TensorFlow. Por ejemplo, una URL local de Datalab para la carpeta es localhost:8081/tree/datalab/docs/samples/TensorFlow.
  2. Abre el notebook llamado Machine Learning with Financial Data.ipynb.
  3. Sigue los pasos detallados en el notebook.

Cuando sigues el instructivo, puedes ejecutar celdas individuales sobre la marcha o ejecutar todas las celdas primero y luego leer el instructivo.

Pasos siguientes

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…