Flow Analyzer analysiert Daten von VPC-Flusslogs, die in einem Datensatzformat. Logdatensätze umfassen Basisfelder – die wichtigsten Felder jedes Logdatensatzes – sowie Metadatenfelder, die zusätzliche Informationen enthalten. Die Protokolleinträge zum Überwachen von Trafficflüssen bestehen aus drei Hauptkomponenten:
- Ressourceninformationen
- Messwerttypen
- Zeitreihe
Ressourceninformationen
Die Logeinträge enthalten die folgenden Daten zu den Ressourcen:
Messwerttypen
Die Protokolleinträge enthalten Daten für die folgenden Messwerttypen:
- Gesendete Bytes: Enthält Informationen zum Nutzlastvolumen, ohne Header. Dieser Messwert kann null sein, da einige Pakete nur Header und keine Nutzlasten enthalten.
- Gesendete Pakete: Gibt die Anzahl der Pakete an, die von der Quelle an das Ziel gesendet wurden.
Unformatierte Zeitachsendaten
Die Menge der Messwert-Rohdaten in einer einzelnen Zeitachse kann enorm sein und einem Messwerttyp sind in der Regel viele Zeitachsen zugeordnet. Um den gesamten Datensatz auf Gemeinsamkeiten, Trends oder Ausreißer zu analysieren, müssen die Zeitreihen im Satz verarbeitet werden. Andernfalls sind zu viele Daten zu berücksichtigen.
Um eine Einführung in die Stichproben- und Aggregation der Beispiele auf dieser Seite zu erhalten, verwenden Sie eine kleine Anzahl der hypothetischen Zeitreihen. Das folgende Diagramm einige Minuten an Rohdaten für den Messwerttyp Byte pro an zweiter Stelle:
Unformatierte Zeitreihendaten müssen bearbeitet werden, bevor sie analysiert werden können. Bei der Analyse werden häufig Stichproben aus den Daten gezogen und zusammengefasst. Auf dieser Seite werden zwei primäre Techniken zum Verfeinern von Rohdaten beschrieben:
- Stichproben, um einige Daten nicht in Betracht zu ziehen. Google Cloud führt die Stichprobenerhebung durch und verwendet die erforderlichen Daten aus dem Log Datensätze, um Vorgänge wie in den Abfragen angegeben auszuführen.
- Aggregation: Kombiniert mehrere Daten in einem kleineren Satz zusammen mit den von Ihnen angegebenen Dimensionen.
Sampling und Aggregation sind leistungsstarke Tools zur Identifizierung interessanter Muster erkennen und u. a. Trends oder Ausreißer in den Daten hervorheben.
Informationen zum Ausrichtungszeitraum
Der erste Schritt beim Aggregieren von Zeitachsendaten ist die Ausrichtung. Ausrichtung erstellt eine neue Zeitreihe, in der die Rohdaten im zeitlichen Rahmen reguliert werden, kann er mit anderen ausgerichteten Zeitreihen kombiniert werden. Durch die Ausrichtung wird Zeit Reihe mit Daten in regelmäßigen Abständen.
Die Ausrichtung umfasst zwei Schritte:
- Unterteilen der Zeitachsen in regelmäßige Zeitintervalle, auch Daten-Bucketing genannt. Das Intervall wird als Ausrichtungszeitraum bezeichnet.
- Einen einzelnen Messwert für die Punkte im Ausrichtungszeitraum berechnen. Sie entscheiden, wie dieser einzelne Punkt berechnet wird. könnten Sie alle Werte summieren, oder den Durchschnitt berechnen oder das Maximum verwenden.
Das folgende Diagramm zeigt, wie die Daten im Intervall zwischen Start- und Endzeit mithilfe des Intervalls für die Zeitsynchronisierung in Gruppen zusammengefasst werden.
Das folgende Diagramm zeigt das Ergebnis der Verwendung eines Ausrichtungszeitraums von mit den folgenden Schritten:
- Erstellen eines Ausrichtungszeitraums mit einem Zeitintervall von fünf Minuten.
- Der einzelne Messwert wird anhand der Summe der Messwerte aus den Rohdaten berechnet.
Detaillierungsgrad
Wenn Sie wissen, dass etwas innerhalb weniger Minuten passiert ist und mehr ins Detail gehen möchten, sollten Sie eine Minute für Abstimmung.
Wenn Sie Trends über längere Zeiträume untersuchen möchten, Ausrichtungszeitraum sinnvoller sein. Große Ausrichtungszeiträume sind in der Regel nicht nützlich für die Analyse kurzfristiger anomaler Bedingungen, wie z. B. kurzer Spitzen. im Stau. Wenn Sie beispielsweise einen mehrwöchigen Ausrichtungszeitraum verwenden, kann zwar eine Anomalie in diesem Zeitraum erkannt werden, sind Daten möglicherweise zu allgemein, um ihnen viel weiterzuhelfen.
Bei großen Zeiträumen ist ein kürzerer Ausrichtungszeitraum nicht hilfreich. Für Wenn Sie beispielsweise eine 1-minütige Ausrichtung für einen Zeitraum von 30 Tagen auswählen, mehr als 43.000 Datenpunkte. Weil 43.000 Datenpunkte zehnmal mehr als 4K Pixel groß sind, können Sie nicht alle Details und sind einige Optionen für längere Zeiträume deaktiviert.
Ausrichtungsoptionen
Zu den Ausrichtungsoptionen gehören das Addieren der Werte oder das Ermitteln des Höchst-, Mindest- oder Mittelwerts der Werte, Ermitteln eines ausgewählten Perzentilwerts, Zählen der Werte andere. In Flow Analyzer können Sie verschiedene Messwertaggregationen als Ausrichtungsoptionen verwenden.
Wenn Sie Gesendete Bytes als Messwerttyp und Quelle und Ziel als Traffic-Aggregation auswählen, sind die folgenden Optionen verfügbar.
- Traffic insgesamt
- Durchschnittliche Traffic-Rate
- Median-Traffic-Rate
- P95-Traffic-Rate
- Maximale Traffic-Rate
Wenn Sie als Messwerttyp Gesendete Pakete und Quelle und Ziel als Traffic-Aggregation verwenden, sind die folgenden Optionen verfügbar.
- Aggregierte Pakete
- Durchschnittliche Paketrate
- Median-Paketsenderate
- P95-Paketsenderate
- Maximale Paketrate
Das folgende Diagramm zeigt das Ergebnis der Verwendung der beiden Ausrichtungsoptionen Gesamttraffic und durchschnittliche Zugriffsrate.
Ausrichtungszeitraum verwenden
Mit der Option Ausrichtungszeitraum können Sie die Trafficflüsse in Zeitintervalle der ausgewählten Dauer. Sie können die Grafik bei Bedarf weiter heranzoomen und sich die Details ansehen.
Nächste Schritte
- Trafficflüsse analysieren
- Log Analytics aktivieren
- Zentralen Bucket konfigurieren
- Konnektivitätstests über den Flow Analyzer ausführen
- Trafficflüsse überwachen
- Datenprobleme in Flow Analyzer beheben