基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？-人工智慧-PHP中文網

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？

論文網址：https://arxiv.org/abs/2205.15508

程式碼位址：https://github. com/squareRoot3/Rethinking-Anomaly-Detection

面向結構化圖資料的異常檢測：背景與挑戰

異常檢測是資料探勘的經典任務之一。分析異常數據有助於企業或使用者理解背後的形成機制，從而做出相應決策，避免損失。隨著網路發展，面向結構化資料的異常檢測，即圖異常檢測，受到越來越多關注。

圖異常檢測具體可定義為：尋找圖上的少部分物件（節點、邊、子圖等），它們與其餘大多數物件有著不同分佈規律。 本文著重於圖上異常節點的偵測任務 。相較於傳統的異常檢測方法，圖異常檢測能夠利用不同實體之間的關聯訊息，更好服務於網路安全、詐欺檢測、水軍檢測、金融風控、故障監測等實際場景。

下圖直觀對比了傳統異常檢測與面向圖的異常檢測任務之間的差異。

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？

圖 1：傳統例外狀況偵測與面向圖的例外偵測任務比較。

近年來，圖神經網路成為分析處理結構化資料的一大利器。圖神經網路透過學習包含節點自身特徵和鄰居資訊的嵌入表示，來更好完成分類、重建、回歸等下游任務。

然而，通用的圖神經網路（如圖卷積網路等）主要針對正常資料設計，在異常檢測任務上容易遇到「過平滑」(over-smoothing) 問題，即異常節點和正常節點的表達難以區分，影響異常檢測的準確率。例如，在金融詐欺偵測的實際應用中，異常帳戶通常會先與多個正常帳戶進行正常交易來偽裝自己，降低自身可疑程度，之後再展開違規交易。這種「關係詐欺」進一步增加了圖異常檢測的難度。

為了解決上述困難，研究者專門提出 針對異常檢測任務的圖神經網路模型 ，包括（1）利用注意力機制從多個視圖聚合鄰域資訊；（2 ）利用重採樣方法聚合不同類別的鄰近資訊；（3）設計額外的損失函數來輔助圖神經網路的訓練等。這些方法主要從空域的角度設計圖神經網路來處理異常，但並沒有人從譜域的角度考慮過這個問題。

事實證明，選擇不同的頻譜濾波器（spectral filter）會影響圖神經網路的表達能力，進而造成效能上的差異。

另闢蹊徑：譜域視角下的圖異常檢測

為了填補現有研究的空白，本文希望回答這樣一個問題：如何為圖神經網路量身定做一個頻譜濾波器用於異常檢測？

本文首次嘗試了從 譜域視角 分析圖上的異常數據，並觀察到：異常數據會導致頻譜能量的“右移”，即能量更少集中在低頻，同時更集中在高頻。

為了視覺化這個右移現象，研究者首先隨機產生了一個有500 個節點的Barabási–Albert 圖（BA 圖），並假設圖上正常節點和異常節點的屬性分別遵循兩個不同的高斯分佈，其中異常節點的變異數較大。

圖片的上半部展示了包含不同程度異常的資料在 BA 圖上的分佈，而下半部則展示了對應的頻譜能量分佈。其中，長條圖代表對應頻譜區間的能量佔比，折線圖代表從零到該點頻域能量的累積佔比。

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？

圖 2：頻譜能量「右移」現象的視覺化。

從上圖可以看出，當異常資料佔比為 0% 時，大部分能量集中在低頻部分（λ

在实际场景中，异常数据通常遵循更加复杂的分布。在四个大规模图异常检测数据集上，研究者同样证实了 “右移” 现象的存在。以下图亚马逊异常用户检测数据集为例，当删除数据中一部分异常节点后，频谱上低频能量显著增多，同时高频则相应减少。如果删除同样数量的随机节点，频谱的能量分布几乎没有变化。这进一步验证了异常数据是频谱能量 “右移” 的关键。

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？

图 3 : 亚马逊异常用户检测数据集上删除不同节点对频谱能量分布的影响：原图 (The Original)，删除随机节点 (Drop-Random)，删除异常节点 (Drop-Anomaly)

图异常检测的新利器：Beta 小波图神经网络

上节的分析表明，在图异常检测时需要关注 “右移” 效应。例如上图亚马逊数据集中，特征值 λ=1 附近的频谱信息与异常数据有较大关联。为了更好地捕获异常信息，图神经网络需要具备带通滤波器的性质，只保留 λ=1 附近的信号同时过滤其余信号。

遗憾的是，现有的图神经网络大多属于低通滤波器或者自适应滤波器，它们无法保证带通性质。其中自适应滤波器虽然具有拟合任意函数的能力，但在异常检测中同样可能退化为低通滤波器。这是因为在整个数据集中，异常数据对应的高频信息占比较小，而大部分频谱能量仍然集中在低频。

为了更好处理异常数据造成的 “右移”，研究者提出了一种图异常检测的新方法 —— Beta 小波图神经网络 (BWGNN) 。通过借鉴 Hammond 图小波理论，他们基于 Beta 函数设计了新的小波核作为图神经网络的频谱滤波器。

相比于常用的热核 (Heat Kernel) 函数，Beta 函数作为小波核不仅符合带通滤波器的要求，还具有更好的频域局部性与空域局部性。下图对比了热核小波与 Beta 核小波的区别。

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？

图 4：热核小波与 Beta 核小波在谱域（左）和空域（右）上的对比，Beta 函数具有更好的带通与局部性质。

本文 在四个大规模图异常检测数据集上验证了 BWGNN 的性能 。其中，Yelp 数据集面向点评网站异常评论检测，Amazon 数据集面向电商平台异常用户检测，T-Finance 数据集面向交易网络异常用户检测，T-Social 数据集面向社交网络异常用户检测，包含多达五百万个节点和七千万条边。

从下表可以看出，与传统分类模型、通用图神经网络和专门的图异常检测模型相比，BWGNN 在 40% 训练数据和 1% 训练数据（半监督）两个场景下均取得更好的效果。在运行效率上，BWGNN 与大部分通用图神经网络耗时接近，比其余图异常检测模型更高效。

基於結構化資料的異常檢測再思考: 我們究竟需要怎樣的圖神經網路？