Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung-KI-php.cn

Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung

WBOY

Freigeben： 2023-10-05 16:53:06

nach vorne

1251 Leute haben es durchsucht

Bei Zeitreihenproblemen gibt es eine Art von Zeitreihen, die nicht mit gleichen Häufigkeiten abgetastet werden, d. h. die Zeitintervalle zwischen zwei benachbarten Beobachtungen in jeder Gruppe sind unterschiedlich. Das Lernen der Zeitreihendarstellung wurde in Zeitreihen mit gleicher Häufigkeit viel untersucht, es gibt jedoch weniger Forschung zu dieser Zeitreihe mit unregelmäßiger Stichprobe, und die Modellierungsmethode dieser Art von Zeitreihen unterscheidet sich von der bei der Stichprobe mit gleicher Häufigkeit ist ein großer Unterschied in den Modellierungsmethoden

Der heute vorgestellte Artikel untersucht die Anwendungsmethode des Repräsentationslernens beim Problem der unregelmäßigen Stichprobenzeitreihen, stützt sich auf relevante Erfahrungen im NLP und erzielt bemerkenswerte Vergleichsergebnisse bei nachgelagerten Aufgaben. 🔜 Datendefinition

Das Folgende ist eine Darstellung unregelmäßiger Zeitreihendaten, wie in der folgenden Abbildung dargestellt. Jede Zeitreihe besteht aus einer Reihe von Tripeln. Jedes Tripel enthält drei Felder: Zeit, Wert und Merkmal, die jeweils die Abtastzeit, den Wert und andere Merkmale jedes Elements in der Zeitreihe darstellen. Zusätzlich zu diesen Tripeln enthält jede Sequenz auch andere statische Merkmale, die sich im Laufe der Zeit nicht ändern, sowie Beschriftungen für jede Zeitreihe Dreifache Daten werden separat eingebettet, zusammengefügt und in Modelle wie Transformer eingegeben. Auf diese Weise werden die Informationen zu jedem Zeitpunkt und die Zeitdarstellung zu jedem Zeitpunkt integriert und in das Modell eingegeben, um nachfolgende Aufgaben vorherzusagen. Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung

Bilder

In der Aufgabe dieses Artikels umfassen die verwendeten Daten nicht nur die gekennzeichneten Daten, sondern auch die unbeschrifteten Daten für unbeaufsichtigtes Vortraining.
2. Methodenübersicht

Die Vortrainingsmethode in diesem Artikel bezieht sich auf die Erfahrung im Bereich der Verarbeitung natürlicher Sprache und deckt hauptsächlich zwei Aspekte ab.

Gestaltung von Vortrainingsaufgaben: Um unregelmäßige Zeitreihen zu verarbeiten, angemessen Das Vortraining muss entworfen werden. Die Aufgabe ermöglicht es dem Modell, effektive Darstellungen aus unbeaufsichtigten Daten zu lernen. In diesem Artikel werden hauptsächlich zwei Vortrainingsaufgaben vorgestellt, die auf Vorhersagen und Rekonstruktionen basieren.

Entwurf von Datenverbesserungsmethoden: In dieser Studie wurde eine Datenverbesserungsmethode für unbeaufsichtigtes Lernen entwickelt, einschließlich Hinzufügen von Rauschen, Hinzufügen von Zufallsmasken usw. Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung Darüber hinaus stellt der Artikel auch einen Algorithmus für verschiedene verteilte Datensätze vor, um die optimale Methode für unbeaufsichtigtes Lernen zu erkunden und Wiederaufbau-Vorschulung.

Beim Prognose-Vortraining wird für jedes Feature in der Zeitreihe sein Wert basierend auf der Vorbestellungssequenz eines Zeitfensters einer bestimmten Größe vorhergesagt. Die Merkmale beziehen sich hier auf die Merkmale im Triplett. Da jedes Feature in einem Zeitfenster mehrmals oder überhaupt nicht erscheinen kann, wird der Wert des ersten Vorkommens dieses Features als Bezeichnung für das Vortraining verwendet. Die Eingabedaten umfassen Originalreihen und erweiterte Zeitreihen.

Beim Rekonstruktions-Vortraining wird zunächst für eine ursprüngliche Zeitreihe eine erweiterte Sequenz durch eine Datenverbesserungsmethode generiert, und dann wird die erweiterte Sequenz als Eingabe verwendet, und der Darstellungsvektor wird vom Encoder generiert und dann eingegeben an einen Decoder. Stellen Sie die ursprüngliche Zeitreihe im Prozessor wieder her. Der Artikel verwendet eine Maske, um zu steuern, welche Teile der Sequenz wiederhergestellt werden müssen. Wenn die Maske alle 1 ist, wird die gesamte Sequenz wiederhergestellt

Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung Nach Erhalt der Parameter vor dem Training kann sie direkt auf die nachgelagerte Feinabstimmungsaufgabe angewendet werden. Der gesamte Pretrain-Finetune-Prozess Wie unten gezeigt.

Bilder

4. Design der Datenverbesserungsmethode

In diesem Artikel schlagen wir zwei Datenverbesserungsmethoden vor. Die erste Methode besteht darin, Rauschen hinzuzufügen, indem zufällige Interferenzen in die Daten eingefügt werden, um die Vielfalt der Daten zu erhöhen. Die zweite Methode ist die Zufallsmaskierung, die das Modell dazu ermutigt, robustere Merkmale zu lernen, indem Teile der zu maskierenden Daten zufällig ausgewählt werden. Diese Datenverbesserungsmethoden können uns dabei helfen, die Leistung und Generalisierungsfähigkeit des Modells zu verbessern

Für jeden Wert oder Zeitpunkt der Originalsequenz kann durch Hinzufügen von Gaußschem Rauschen Rauschen hinzugefügt werden. Die spezifische Berechnungsmethode ist wie folgt:

Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung Bilder

Die Methode der Zufallsmaske basiert auf Ideen aus dem NLP und erstellt eine erweiterte Zeitreihe durch zufällige Auswahl von Zeit, Merkmal, Wert und anderen Elementen für die zufällige Maskierung und Ersetzung.

Die folgende Abbildung zeigt die Wirkung der beiden oben genannten Arten von Datenverbesserungsmethoden:

Google: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung Bild

Darüber hinaus verwendet der Artikel verschiedene Kombinationen von Datenverbesserung, Vortrainingsmethoden usw. für verschiedene Zeitreihen Daten, aus diesen Kombinationen Suche nach der optimalen Vortrainingsmethode.

5. Experimentelle Ergebnisse

In diesem Artikel wurden Experimente mit mehreren Datensätzen durchgeführt, um die Auswirkungen verschiedener Vortrainingsmethoden auf diese Datensätze zu vergleichen. Es ist zu beobachten, dass die im Artikel vorgeschlagene Vortrainingsmethode bei den meisten Datensätzen eine deutliche Verbesserung erzielt hat

Das obige ist der detaillierte Inhalt vonGoogle: Neue Methode zum Erlernen der Zeitreihendarstellung mit ungleicher Frequenzabtastung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!