使用紋理對比度檢測檢測AI生成的影像-人工智慧-PHP中文網

在本篇文章中我們將介紹如何開發一個深度學習模型來偵測人工智慧產生的圖像。

使用紋理對比度檢測檢測AI生成的影像

許多用於檢測人工智慧生成圖像的深度學習方法都根據圖像生成的方式或圖像的特性/語義來確定，通常這些模型只能辨識人工智慧產生的特定對象，例如人、臉、汽車等。

然而，這項名為「Rich and Poor Texture Contrast: A Simple yet Effective Approach for AI-generated Image Detection」的研究提出的方法克服了這些挑戰，具有更廣泛的適用性。我們將深入探討這篇研究論文，闡明它是如何有效解決了其他檢測人工智慧生成圖像方法所面臨的問題。

泛化性問題

當我們使用一個模型(例如ResNet-50)來識別人工智慧產生的圖像時，模型會根據圖像的語意進行學習。如果我們訓練一個模型來識別人工智慧生成的汽車圖像，使用真實圖像和人工智慧生成的不同汽車圖像進行訓練，那麼該模型將只能從這些數據中獲取有關汽車的信息，而對於其他物體則無法進行準確辨識。

雖然可以對各種物件的資料進行訓練，但這種方式耗時較長，而且僅能在未知資料上達到大約72%的準確率。儘管可以透過增加訓練次數和資料量來提高準確性，但我們無法無限地取得訓練資料。

也就是說目前偵測模型的泛化性有很大的問題，為了解決這個問題，論文提出了以下的方法

Smash&Reconstruction

這篇論文介紹了一種獨特的方法，用於防止模型在訓練過程中從圖像的形狀中學習到人工智慧生成的特徵。作者提出了一種名為Smash&Reconstruction的方法來實現這一目標。

在這個方法中，圖像被分成預定大小的小塊，然後對它們進行重新排列，以產生新的圖像。這只是一個簡單的概述，因為在形成生成模型的最終輸入影像之前，還需要進行額外的步驟。

使用紋理對比度檢測檢測AI生成的影像

將影像分割成小塊後，我們將小塊分成兩組，一組是紋理豐富的小塊，另一組是紋理較差的小塊。

影像中細節豐富的區域，如物體或兩個對比色區域之間的邊界，就成為一個豐富的紋理區塊。與主要為背景的紋理區域(如天空或靜止的水)相比，豐富的紋理區域在像素上有很大的變化。

計算紋理豐富的指標

首先將影像分成預先決定大小的小塊，如上圖所示。然後找到這些圖像塊的像素梯度(即找出水平方向、對角線方向和反對角線方向上的像素值之差並將它們相加)，並將它們分離成豐富紋理塊和紋理較差塊。

與紋理較差的區塊相比，紋理豐富的區塊具有更高的像素梯度值，計算影像梯度值得公式如下：

使用紋理對比度檢測檢測AI生成的影像

在像素對比度的基礎上將影像分離，得到兩個合成影像。這個過程是本文稱為「Smash&Reconstruction」的完整過程。

使用紋理對比度檢測檢測AI生成的影像

這樣就讓模型學習到得是紋理的細節，而不是物體的內容表徵

fingerprint

大多數基於指紋的方法受到圖像生成技術的限制，這些模型/演算法只能檢測由特定方法/類似方法(如擴散、GAN或其他基於CNN的影像生成方法)產生的影像。

為了精確地解決這個問題，論文已經將這些圖像塊劃分為豐富或貧乏的紋理。然後作者提出了一種識別人工智慧生成圖像指紋的新方法，這也就是論文的標題。他們提出在應用30個高通濾波器後，找到影像中豐富和貧乏紋理斑塊之間的對比。

豐富與貧乏的紋理塊之間的對比度有什麼幫助呢？

為了更好理解，我們將圖像並排比較，真實圖像和人工智慧生成的圖像。

使用紋理對比度檢測檢測AI生成的影像

これら 2 つの画像を肉眼で見るのは難しいですよね?

この論文では、最初に Smash&Reconstruction プロセスが使用されています。

使用紋理對比度檢測檢測AI生成的影像

30 個のハイパスフィルターを適用した後の各画像間のコントラスト:

使用紋理對比度檢測檢測AI生成的影像

これらの結果から、AI が生成した画像と実際の画像のコントラストは同等であることがわかります。豊かなテクスチャパッチと貧弱なテクスチャパッチははるかに高くなります。

このようにして、肉眼で違いを確認できるため、コントラスト結果をトレーニング可能なモデルに入力し、結果データを分類器に入力できます。これが目的です。モデルアーキテクチャ:

使用紋理對比度檢測檢測AI生成的影像

#分類子の構造は次のとおりです:

使用紋理對比度檢測檢測AI生成的影像

この論文では、もともとステガナリシスのために導入された 30 個のハイパスフィルターについて言及しています。

注: ステガノグラフィー的にイメージ化する方法は多数あります。広義には、画像の中に何らかの方法で情報が隠されており、通常の手段では発見することが困難な情報を画像ステガノグラフィーと呼ぶことができます。

ここでのフィルターは、畳み込み法を使用して画像の行列値に適用されます。使用されるフィルターは、高周波の特徴のみを許可するハイパスフィルターです。そこを通過するイメージ。高周波の特徴には通常、エッジ、細かいディテール、強度や色の急速な変化が含まれます。

使用紋理對比度檢測檢測AI生成的影像

(f) と (g) を除くすべてのフィルターは、画像に再適用される前にある角度で回転され、合計 30 個のフィルターが形成されます。。これらの行列の回転は、SciPy を使用して行われるアフィン変換を使用して行われます。

まとめ

論文の結果は検証精度92%に達しており、さらにトレーニングを行えば、より良い結果が得られるでしょう結果として、これは非常に興味深い研究です。トレーニングコードも見つけました。興味があれば、詳しく調べることができます:

論文: https:// arxiv.org/abs/2311.12397

コード: https://github.com/hridayK/Detection-of-AI-generated-images

以上是使用紋理對比度檢測檢測AI生成的影像的詳細內容。更多資訊請關注PHP中文網其他相關文章！