Maschinelles Lernen mit Zeitachsendaten im Finanzbereich

Diese Lösung zeigt ein Beispiel für den Einsatz von maschinellem Lernen bei Zeitserien von Finanzdaten unter Verwendung der Google Cloud Platform.

Zeitserien sind ein essentieller Teil der Finanzanalyse. Heutzutage haben wir nicht nur mehr Daten zur Verfügung als jemals zuvor, sondern es gibt auch mehr Datenquellen und eine häufigere Bereitstellung von Daten. Zu den neuen Quellen gehören neue Plattformen, soziale Medien und Nachrichten. Die Häufigkeit der Datenlieferung hat sich von Dutzenden von Nachrichten pro Sekunde vor 10 Jahren zu Hunderttausenden von Nachrichten pro Sekunde gesteigert. Aus diesem Grund gibt es immer mehr verschiedene Analysetechniken. Die meisten modernen Analysetechniken basieren alle auf Statistiken und unterscheiden sich im Sinne der Neuartigkeit zwar nicht, aber ihre Anwendbarkeit geht eng mit der verfügbaren Menge an Rechenleistung einher. Die Steigerung der verfügbaren Rechenleistung ist schneller als das Wachstum von Zeitreihenvolumina. Es ist also mittlerweile möglich, große Zeitreihen mit Verfahren zu analysieren, die vorher nicht praktikabel waren.

Techniken des maschinellen Lernen, insbesondere Deep Learning, sind für die Zeitreihenanalyse vielversprechend. Da Zeitreihen immer dichter werden und beginnen, sich zu überlappen, bietet das maschinelle Lernen eine Möglichkeit, das Signal von Störungen zu trennen. Deep Learning hat Potential, da es oft die beste Methode für scheinbar willkürliche Finanzzeitreihen ist.

Diese Lösung nutzt öffentliche Daten von Quandl.

Ziele

  • Daten für verschiedene Finanzmärkte erwerben.
  • Diese Daten in ein verarbeitbares Format bringen und eine explorative Datenanalyse vornehmen, um eine Prämisse zu erkunden und zu bewerten.
  • TensorFlow nutzen, um mehrere Modelle zu erstellen, zu schulen und zu prüfen und dadurch vorherzusagen, was in den Finanzmärkten passieren wird.

Kosten

Weitere Informationen zu den Cloud Datalab-Kosten finden Sie unter Cloud Datalab-Preise.

Da diese Anleitung Google BigQuery und Google Cloud Storage nutzt können zusätzliche Kosten entstehen.

Vorbereitung

Stellen Sie Cloud Datalab bereit und melden Sie sich für den Dienst an. Führen Sie die in der Cloud Datalab-Schnellstartanleitung angegebenen Schritte durch.

Nutzung der Anleitung

Diese Anleitung wird auf einem Cloud Datalab-Notebook ausgeführt. Cloud Datalab ist auf Jupyter-Notebooks aufgebaut. Mit Cloud Datalab können Sie in Google BigQuery und Google Cloud Storage Daten durch die Nutzung von Python und SQL analysieren.

Nutzung des Notebooks

Bei dem Notebook handelt es sich um ein vorinstalliertes Beispiel, das in Cloud Datalab enthalten ist. So rufen Sie das Notebook auf:

  1. Wechseln Sie auf der lokalen Cloud Datalab-Seite im Browser zum Ordner datalab/docs/samples/TensorFlow. Eine lokale Datalab-URL für den Ordner lautet beispielsweise localhost:8081/tree/datalab/docs/samples/TensorFlow.
  2. Öffnen Sie das Notebook mit dem Namen Machine Learning with Financial Data.ipynb.
  3. Führen Sie die im Notebook angegebenen Schritte durch.

Sie haben die Möglichkeit, der Anleitung zu folgen und dabei die individuellen Zellen auszuführen oder zuerst alle Zellen auszuführen und anschließend die Anleitung zu lesen.

Nächste Schritte