Aprendizaje automático con datos de series temporales financieras

En esta solución, se presenta un ejemplo de uso del aprendizaje automático con series temporales financieras en Google Cloud Platform.

Las series temporales son una parte esencial del análisis financiero. En la actualidad, contamos con más datos a nuestra disposición que nunca, más fuentes de datos y mayor frecuencia de entrega de estos. Las fuentes nuevas incluyen intercambios nuevos, canales de redes sociales y fuentes de noticias. Hace diez años, la frecuencia de entrega era de decenas de mensajes por segundo; en la actualidad, esa frecuencia es de cientos de miles de mensajes por segundo. Como era de esperarse, se están aplicando nuevas y diferentes técnicas de análisis como resultado. La mayoría de las técnicas de análisis modernas no son diferentes por ser nuevas, ya que todas se basan en estadísticas, pero su aplicabilidad siguió de cerca la cantidad de recursos de procesamiento informático disponible. La potencia del procesamiento de datos crece a mayor velocidad que los volúmenes de series temporales, por lo que ahora es posible analizar series temporales a gran escala de formas que antes no eran viables.

En particular, las técnicas de aprendizaje automático, en especial el aprendizaje profundo, son muy prometedoras para el análisis de series temporales. A medida que las series temporales se vuelven más densas y comienzan a superponerse, el aprendizaje automático ofrece una manera de separar la señal del ruido. El aprendizaje profundo tiene potencial porque, a menudo, se ajusta mejor a la supuesta naturaleza aleatoria de las series temporales financieras.

Esta solución utiliza datos públicos de Quandl.

Objetivos

  • Obtener datos para diferentes mercados financieros
  • Transformar los datos a un formato utilizable y realizar análisis exploratorios de datos para explorar y validar una premisa
  • Utilizar TensorFlow a fin de crear, entrenar y evaluar diferentes modelos para predecir lo que pasará en los mercados financieros

Costos

Consulta Precios de Cloud Datalab para comprender los costos que implica.

En este instructivo, se utiliza Google BigQuery y Google Cloud Storage, lo que podría aumentar los costos.

Antes de comenzar

Implementa y accede a Cloud Datalab. Sigue los pasos en la Guía de inicio rápido de Cloud Datalab.

Utiliza el instructivo

El instructivo se ejecuta en un notebook de Cloud Datalab. Cloud Datalab se compila en notebooks de Jupyter. Con Cloud Datalab, puedes analizar datos en Google BigQuery y Google Cloud Storage mediante Python y SQL.

Utiliza el notebook

El notebook es una muestra preinstalada que se incluye en la distribución de Cloud Datalab. Si deseas ver el notebook, haz lo siguiente:

  1. Mediante la página local de Cloud Datalab en tu navegador, ve a la carpeta datalab/docs/samples/TensorFlow. Por ejemplo, una URL local de Datalab para la carpeta es localhost:8081/tree/datalab/docs/samples/TensorFlow.
  2. Abre el notebook llamado Machine Learning with Financial Data.ipynb.
  3. Sigue los pasos detallados en el notebook.

Si sigues el instructivo, podrás ejecutar celdas individuales sobre la marcha o ejecutar primero todas las celdas y, luego, leer el instructivo.

Próximos pasos