Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?-KI-php.cn

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Papieradresse: https://arxiv.org/abs/2205.15508

Codeadresse: https://github.com/squareRoot3/Rethinking-Anomaly-Detection

Anomalie für strukturierte Diagrammdatenerkennung: Hintergrund und Herausforderungen

Die Erkennung von Anomalien ist eine der klassischen Aufgaben des Data Mining. Die Analyse abnormaler Daten kann Unternehmen oder Benutzern helfen, den dahinter stehenden Entstehungsmechanismus zu verstehen, um entsprechende Entscheidungen zu treffen und Verluste zu vermeiden. Mit der Entwicklung des Internets hat die Anomalieerkennung für strukturierte Daten, insbesondere die Erkennung von Diagrammanomalien, immer mehr Aufmerksamkeit erhalten.

Die Erkennung von Diagrammanomalien kann konkret definiert werden als: Finden einer kleinen Anzahl von Objekten im Diagramm (Knoten, Kanten, Unterdiagramme usw.), die andere Verteilungsmuster als die meisten anderen Objekte aufweisen. Dieser Artikel konzentriert sich auf die Erkennungsaufgabe abnormaler Knoten im Diagramm. Im Vergleich zu herkömmlichen Methoden zur Erkennung von Anomalien kann die Erkennung von Diagrammanomalien die zugehörigen Informationen zwischen verschiedenen Einheiten nutzen, um tatsächliche Szenarien wie Netzwerksicherheit, Betrugserkennung, Trollerkennung, finanzielle Risikokontrolle und Fehlerüberwachung besser zu bedienen.

Die folgende Abbildung vergleicht visuell den Unterschied zwischen herkömmlicher Anomalieerkennung und diagrammorientierten Anomalieerkennungsaufgaben.

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Abbildung 1: Vergleich traditioneller Anomalieerkennungs- und diagrammorientierter Anomalieerkennungsaufgaben.

In den letzten Jahren haben sich graphische neuronale Netze zu einem leistungsstarken Werkzeug zur Analyse und Verarbeitung strukturierter Daten entwickelt. Graphische neuronale Netze können nachgelagerte Aufgaben wie Klassifizierung, Rekonstruktion und Regression besser erledigen, indem sie eingebettete Darstellungen lernen, die die eigenen Eigenschaften und Nachbarinformationen des Knotens enthalten.

Allgemeine graphische neuronale Netze (z. B. Faltungsnetze usw.) sind jedoch hauptsächlich für normale Daten konzipiert und neigen dazu, bei Anomalieerkennungsaufgaben auf das Problem der „Überglättung“ zu stoßen, d Normale Knoten sind schwer zu unterscheiden, was die Genauigkeit der Anomalieerkennung beeinträchtigt. In der praktischen Anwendung der Erkennung von Finanzbetrug beispielsweise tarnen sich abnormale Konten normalerweise, indem sie normale Transaktionen mit mehreren normalen Konten durchführen, um ihren Verdacht zu verringern, und führen dann illegale Transaktionen durch. Dieser „Beziehungsbetrug“ erhöht die Schwierigkeit der Erkennung von Diagrammanomalien zusätzlich.

Um die oben genannten Schwierigkeiten zu lösen, haben Forscher speziell ein „Graph Neural Network Model“ für Anomalieerkennungsaufgaben vorgeschlagen, einschließlich (1) der Verwendung des Aufmerksamkeitsmechanismus zur Aggregation von Nachbarschaftsinformationen aus mehreren Ansichten; (2) der Verwendung der Resampling-Methode zur Aggregation verschiedener Kategorien Nachbarschaftsinformationen; (3) Entwerfen Sie zusätzliche Verlustfunktionen, um das Training von graphischen neuronalen Netzen usw. zu unterstützen. Diese Methoden entwerfen hauptsächlich graphische neuronale Netze, um Anomalien aus der Perspektive des räumlichen Bereichs zu behandeln, aber niemand hat dieses Problem aus der Perspektive des Spektralbereichs betrachtet. Es stellt sich heraus, dass die Wahl verschiedener Spektralfilter die Ausdrucksfähigkeit des graphischen neuronalen Netzwerks beeinflusst und somit zu Leistungsunterschieden führt.

Ein neuer Ansatz: Graphanomalieerkennung aus der Perspektive des Spektralbereichs

Um die Lücken in der bestehenden Forschung zu schließen, möchte dieser Artikel diese Frage beantworten: Wie kann ein Spektralfilter für graphische neuronale Netze zur Anomalieerkennung angepasst werden?

In diesem Artikel wird zum ersten Mal versucht, die abnormalen Daten im Diagramm aus der Perspektive des

Spektralbereichs

zu analysieren, und es wird festgestellt, dass: abnormale Daten dazu führen, dass sich die Spektrumsenergie „nach rechts verschiebt“, d. h. die Energie beträgt weniger konzentriert auf niedrige Frequenzen und stärker auf hohe Frequenzen. Um dieses Rechtsverschiebungsphänomen zu visualisieren, erstellten die Forscher zunächst zufällig ein Barabási-Albert-Diagramm (BA-Diagramm) mit 500 Knoten und gingen davon aus, dass die Attribute normaler Knoten und abnormaler Knoten im Diagramm zwei verschiedenen Gaußschen Verteilungen folgen. wobei die Varianz abnormaler Knoten größer ist.

Der obere Teil des Bildes zeigt die Verteilung von Daten mit unterschiedlichen Graden von Anomalien auf dem BA-Diagramm, während der untere Teil die entsprechende spektrale Energieverteilung zeigt. Unter diesen stellt das Histogramm den Energieanteil des entsprechenden Spektrumintervalls dar, und das Liniendiagramm stellt den kumulativen Anteil der Frequenzdomänenenergie von Null bis zu diesem Punkt dar.

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Abbildung 2: Visualisierung des Phänomens der „Rechtsverschiebung“ der Spektralenergie.

Wie aus der obigen Abbildung ersichtlich ist, konzentriert sich die meiste Energie im Niederfrequenzteil (λ

In realen Szenarien folgen abnormale Daten normalerweise einer komplexeren Verteilung. Anhand von vier groß angelegten Datensätzen zur Erkennung von Graphanomalien bestätigten die Forscher auch die Existenz des Phänomens der „Rechtsverschiebung“. Der Amazon-Datensatz zur Erkennung abnormaler Benutzer in der folgenden Abbildung ist ein Beispiel. Wenn ein Teil der abnormalen Knoten in den Daten gelöscht wird, erhöht sich die niederfrequente Energie im Spektrum erheblich, während die hochfrequente Energie entsprechend abnimmt. Wenn die gleiche Anzahl zufälliger Knoten gelöscht wird, ändert sich die Energieverteilung des Spektrums kaum. Dies bestätigt weiter, dass abnormale Daten der Schlüssel zur „richtigen Verschiebung“ der Spektrumsenergie sind.

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Abbildung 3: Die Auswirkung des Löschens verschiedener Knoten auf die Spektrumenergieverteilung auf den Amazon-Datensatz zur Erkennung abnormaler Benutzer: Originalbild (The Original), Löschen zufälliger Knoten (Drop-Random), Löschen abnormaler Knoten (Drop -Anomalie)

Ein neues Tool zur Erkennung von Graphanomalien: Beta-Wavelet-Graph-Neuronales Netzwerk

Die Analyse im vorherigen Abschnitt zeigt, dass wir bei der Erkennung von Graphanomalien auf den Effekt der „Rechtsverschiebung“ achten müssen. Beispielsweise stehen im obigen Amazon-Datensatz die Spektrumsinformationen in der Nähe des Eigenwerts λ=1 in engem Zusammenhang mit abnormalen Daten. Um abnormale Informationen besser erfassen zu können, muss das graphische neuronale Netzwerk über die Eigenschaften eines Bandpassfilters verfügen, der nur Signale in der Nähe von λ=1 zurückhält und die übrigen Signale filtert.

Leider handelt es sich bei den meisten vorhandenen graphischen neuronalen Netzen um Tiefpassfilter oder adaptive Filter, die keine Bandpasseigenschaften garantieren können. Obwohl der adaptive Filter in der Lage ist, sich jeder Funktion anzupassen, kann er bei der Anomalieerkennung auch zu einem Tiefpassfilter degenerieren. Dies liegt daran, dass im gesamten Datensatz die Hochfrequenzinformationen, die den abnormalen Daten entsprechen, einen relativ geringen Anteil ausmachen, während der größte Teil der Spektrumsenergie immer noch in niedrigen Frequenzen konzentriert ist.

Um die durch abnormale Daten verursachte „Rechtsverschiebung“ besser bewältigen zu können, haben Forscher eine neue Methode zur Erkennung von Graphanomalien vorgeschlagen – Beta Wavelet Graph Neural Network (BWGNN). Indem sie sich auf Hammonds Graph-Wavelet-Theorie stützten, entwarfen sie einen neuen Wavelet-Kernel, der auf der Beta-Funktion als Spektralfilter für das graphische neuronale Netzwerk basiert.

Im Vergleich zur häufig verwendeten Wärmekernfunktion erfüllt die Beta-Funktion als Wavelet-Kernel nicht nur die Anforderungen eines Bandpassfilters, sondern weist auch eine bessere Lokalität im Frequenzbereich und in der räumlichen Domäne auf. Die folgende Abbildung vergleicht den Unterschied zwischen Thermokernel-Wavelet und Beta-Kernel-Wavelet.

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Abbildung 4: Vergleich von thermischem Kernel-Wavelet und Beta-Kernel-Wavelet im Spektralbereich (links) und im räumlichen Bereich (rechts). Die Beta-Funktion weist bessere Bandpass- und lokale Eigenschaften auf.

Dieser Artikel überprüft die Leistung von BWGNN anhand von vier großen Datensätzen zur Erkennung von Diagrammanomalien. Unter anderem wird der Yelp-Datensatz verwendet, um abnormale Kommentare auf Dianping-Websites zu erkennen, der Amazon-Datensatz wird verwendet, um abnormale Benutzer auf E-Commerce-Plattformen zu erkennen, der T-Finance-Datensatz wird verwendet, um abnormale Benutzer in Transaktionsnetzwerken zu erkennen Der T-Social-Datensatz wird verwendet, um abnormale Benutzer in sozialen Netzwerken zu erkennen, darunter bis zu fünf Millionen Knoten und 70 Millionen Kanten.

Wie aus der folgenden Tabelle ersichtlich ist, hat BWGNN im Vergleich zu herkömmlichen Klassifizierungsmodellen, allgemeinen grafischen neuronalen Netzen und speziellen Modellen zur Erkennung von Diagrammanomalien in beiden Szenarien mit 40 % Trainingsdaten und 1 % Trainingsdaten (halbüberwacht) eine bessere Leistung erzielt ). Gute Ergebnisse. In Bezug auf die Betriebseffizienz liegt BWGNN nahe am Zeitverbrauch der meisten allgemeinen graphischen neuronalen Netze und ist effizienter als andere Modelle zur Erkennung von Graphanomalien.

Anomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?

Zusammenfassung

In diesem Artikel stellten Forscher fest, dass das Erscheinen abnormaler Knoten im Diagramm dazu führt, dass sich die Spektrumsenergie „nach rechts verschiebt“, was eine neue Perspektive für die Anomalieerkennung für strukturierte Daten bietet. Basierend auf dieser Erkenntnis schlägt dieser Artikel ein neues Tool zur Erkennung von Graphanomalien vor – das Beta Wavelet Graph Neural Network (BWGNN). Es erfasst die durch „Rechtsverschiebung“ erzeugten hochfrequenten Anomalieinformationen durch einen speziell entwickelten Bandpassfilter und erzielt optimale Ergebnisse bei mehreren Datensätzen.

In der tatsächlichen Implementierung ist die Erkennung von Graphanomalien normalerweise eine komplexe Systemtechnik, aber die Auswahl eines geeigneten graphischen neuronalen Netzwerks ist ein Schlüsselfaktor für die Systemleistung. Das von den Forschern vorgeschlagene BWGNN hat ein optimiertes Design, eine geringe Komplexität und ist leicht zu ersetzen. Es ist eine neue Wahl für graphische neuronale Netze.

Das obige ist der detaillierte Inhalt vonAnomalieerkennung basierend auf strukturierten Daten neu denken: Welche Art von graphischem neuronalem Netzwerk brauchen wir?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!