Bei der Zeitreihenanalyse werden die Merkmale eines Ereignisses im vergangenen Zeitraum verwendet, um die Merkmale des Ereignisses im zukünftigen Zeitraum vorherzusagen. Hierbei handelt es sich um ein relativ komplexes Vorhersagemodellierungsproblem, das sich von den Vorhersagen von Regressionsanalysemodellen unterscheidet. Das Zeitreihenmodell hängt von der Reihenfolge ab, in der Ereignisse auftreten. Wenn die Reihenfolge geändert wird, werden Zeitreihenprobleme alle als Regressionsprobleme betrachtet, aber die Regressionsmethode (lineare Regression, Baummodell). , Deep Learning usw.) gibt es gewisse Unterschiede.
Die Timing-Analyse umfasst die statische Timing-Analyse (STA) und die dynamische Timing-Analyse.
Im Folgenden sind einige gängige Timing-Analyse-Algorithmen aufgeführt.
1 Deep-Learning-Timing-Analyse.
RNN (Recurrent Neural Network) Es verfügt über ein sehr breites Anwendungsspektrum in der Verarbeitung natürlicher Sprache (NLP), Sprachbildern und anderen Bereichen. Der größte Unterschied zwischen RNN-Netzwerken und anderen Netzwerken besteht darin, dass RNN eine bestimmte „Speicherfunktion“ erreichen kann und die beste Wahl für die Zeitreihenanalyse ist. Genauso wie Menschen die Welt durch ihre eigenen Erinnerungen aus der Vergangenheit besser verstehen können. RNN implementiert auch einen Mechanismus, der dem des menschlichen Gehirns ähnelt und eine gewisse Menge an Speicher für die verarbeiteten Informationen behält, im Gegensatz zu anderen Arten von neuronalen Netzen, die keinen Speicher für die verarbeiteten Informationen behalten können.Nachteile:
Langschrittdaten neigen zu Problemen mit dem Verschwinden von Gradienten und der Explosion von Gradienten.LSTM (Long Short-Term Memory Network)
LSTM (Long Short-Term Memory) ist ein zeitlich wiederkehrendes neuronales Netzwerk, das das Problem der Langzeitabhängigkeit lösen soll, das in herkömmlichen rekurrenten neuronalen Netzwerken (RNN) besteht. Alle RNNs bestehen aus einer Reihe sich wiederholender neuronaler Netzwerkmodule.Stärken:
Geeignet für die Verarbeitung und Vorhersage wichtiger Ereignisse in Zeitreihen mit sehr langen Intervallen und Verzögerungen.Nachteile:
Zu viele Modellparameter führen zu Überanpassungsproblemen2 Traditionelles Zeitreihenanalysemodell
Auto Regression (AR)
Gleitender Durchschnitt (Moving Average, MA)
Modellierungsfunktionen: AR-Modelle können die Autokorrelationsstruktur von Zeitreihendaten erfassen, also die Beziehung zwischen aktuellen Beobachtungen und vergangenen Beobachtungen. Es liefert Vorhersagen über zukünftige Beobachtungen und deckt Trends und Muster in den Daten auf.
Moving Average Method (MA): Diese Methode basiert auf dem Durchschnitt der Daten und geht von einer gewissen Stabilität zwischen zukünftigen Werten und vergangenen Werten aus
Stärken:
Erfasst die Beziehung des gleitenden Durchschnitts in Zeitreihendaten. Das MA-Modell verwendet eine lineare Kombination von Fehlertermen des weißen Rauschens aus vergangenen Zeitschritten, um aktuelle Beobachtungen vorherzusagen, und erfasst daher die Natur des gleitenden Durchschnitts in den Daten.
Relativ einfach und intuitiv. Die Parameter des MA-Modells stellen die Gewichte der Fehlerterme des weißen Rauschens in vergangenen Zeitschritten dar, und das Modell kann durch Schätzung dieser Gewichte angepasst werden.
Nachteile:
Autoregressives gleitendes Durchschnittsmodell (ARMA-Modell, Auto-Regression und gleitendes Durchschnittsmodell) ist eine wichtige Methode zur Untersuchung von Zeitreihen. Es besteht aus einem autoregressiven Modell (AR-Modell) und einem gleitenden Durchschnittsmodell (MA). ).-Modell) als Grundlage hat es die Eigenschaften eines breiten Anwendungsbereichs und eines geringen Vorhersagefehlers.
Das ARIMA-Modell ist die Abkürzung für Autoregressive Differential Moving Average Model und der vollständige Name lautet Autoregressive Integrated Moving Average Model. Dieses Modell besteht im Wesentlichen aus drei Teilen, nämlich dem autoregressiven Modell (AR), dem Differenzprozess (I) und dem gleitenden Durchschnittsmodell (MA). Die Grundidee des ARIMA-Modells besteht darin, die historischen Informationen der Daten selbst zu verwenden um die Zukunft vorherzusagen. Der Tag-Wert zu einem bestimmten Zeitpunkt wird sowohl durch den Tag-Wert im vergangenen Zeitraum als auch durch zufällige Ereignisse im vergangenen Zeitraum beeinflusst. Mit anderen Worten geht das ARIMA-Modell davon aus, dass der Tag-Wert um den allgemeinen Zeittrend herum schwankt Der Trend wird durch historische Etiketten beeinflusst, Schwankungen werden durch zufällige Ereignisse innerhalb eines bestimmten Zeitraums beeinflusst und der allgemeine Trend selbst ist nicht unbedingt stabil. Das ARIMA-Modell ist eine Zeitreihenanalysemethode, die Daten anhand der Autokorrelation und Differenz analysiert Extrahieren Sie die in den Daten verborgenen Zeitreihenmuster und sagen Sie dann zukünftige Daten voraus der aktuelle Wert.
Der I-Teil wird verwendet, um die instationäre Zeitreihe stationär zu machen. Durch Differenzverarbeitung erster oder zweiter Ordnung werden die Trend- und Saisonfaktoren in der Zeitreihe eliminiert.
Der MA-Teil wird zur Verarbeitung des gleitenden Durchschnittsteils der Zeitreihe verwendet, der die Auswirkungen vergangener Prognosefehler auf den aktuellen Wert berücksichtigt.
Zeitreihendaten müssen stabil sein oder nach differenzieller Verarbeitung stabil werden
Im Wesentlichen können nur lineare Beziehungen erfasst werden, nicht jedoch nichtlineare Beziehungen.
SARIMA ist eine häufig verwendete Zeitreihenanalysemethode, die eine Erweiterung des ARIMA-Modells für saisonale Daten darstellt. SARIMA-Modelle können verwendet werden, um saisonale Zeitreihendaten wie Jahresverkäufe oder wöchentliche Website-Besuche vorherzusagen. Im Folgenden sind die Vor- und Nachteile des SARIMA-Modells aufgeführt:
Stärken:
Nachteile:
Saisonales autoregressives integriertes gleitendes Durchschnittsmodell (SARIMAX) basiert auf dem differenziellen gleitenden autoregressiven Modell (ARIMA) plus exogenem Regressormodell. Es eignet sich für Zeitreihendaten mit offensichtlichen periodischen und saisonalen Merkmalen Technische und maschinelle Lernmethoden zur Vorhersage; dieses Modell kann die komplexesten Zeitreihenvorhersagemodelle lösen. Unterstützt komplexe Datenmodellierung, kollaborative Regression mit mehreren Variablen und nichtlineare Probleme.
Die Bedeutung des Feature Engineering liegt auf der Hand und spielt eine Schlüsselrolle für den Erfolg des maschinellen Lernens. Allerdings ist Feature Engineering keine einfache Aufgabe und erfordert eine komplexe manuelle Verarbeitung und einzigartiges Fachwissen. Der Grad des Feature-Engineerings bestimmt oft die Obergrenze des maschinellen Lernens, und der Algorithmus des maschinellen Lernens liegt so nah wie möglich an dieser Obergrenze. Sobald das Feature-Engineering abgeschlossen ist, können wir die Baummodellalgorithmen – lightgbm und xgboost – direkt anwenden. Bei diesen beiden Modellen handelt es sich um sehr verbreitete und effiziente Modellierungsmethoden. Darüber hinaus verfügen sie über die folgenden Eigenschaften:
schnelle Berechnung und hohe Modellgenauigkeit;
Das obige ist der detaillierte Inhalt vonHier finden Sie alle häufig verwendeten Algorithmen für die Timing-Analyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!