社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 主體

蘋果「套娃」式擴散模型，訓練步數減少七成！

WBOY

發布： 2023-10-25 14:13:01

轉載

700 人瀏覽過

蘋果的一項最新研究，大幅提高了擴散模型在高解析度影像上表現。

利用這個方法，同樣解析度的影像，訓練步數減少了超過七成。

在1024×1024的解析度下，圖片畫質直接拉滿，細節都清晰可見。

蘋果「套娃」式擴散模型，訓練步數減少七成！

蘋果把這項成果命名為MDM，DM就是擴散模型（Diffusion Model）的縮寫，而第一個M則代表了套娃（Matryoshka）。

就像真的套娃一樣，MDM在高解析度過程中嵌套了低解析度過程，而且是多層嵌套。

高低解析度擴散過程同時進行，大幅降低了傳統擴散模型在高解析度過程中的資源消耗。

蘋果「套娃」式擴散模型，訓練步數減少七成！

對於256×256解析度的影像，在批次大小（batch size）為1024的環境下，傳統擴散模型需要訓練150萬步，而MDM僅需39萬，減少了超七成。

另外，MDM採用了端到端訓練，不依賴特定資料集和預訓練模型，在提速的同時依然保證了生成質量，而且使用靈活。

蘋果「套娃」式擴散模型，訓練步數減少七成！

不僅可以畫出高解析度的影像，還能合成16×256²的影片。

蘋果「套娃」式擴散模型，訓練步數減少七成！

有網友評論到，蘋果終於把文字連接到圖像中了。

蘋果「套娃」式擴散模型，訓練步數減少七成！

那麼，MDM的「套娃」技術，具體是怎麼做的呢？

整體與漸進式結合

蘋果「套娃」式擴散模型，訓練步數減少七成！

在開始訓練之前，需要將資料進行預處理，高解析度的影像會用一定演算法重新取樣，得到不同分辨率的版本。

然後就是利用這些不同分辨率的資料進行聯合UNet建模，小UNet處理低分辨率，並嵌套進處理高分辨率的大UNet。

透過跨解析度的連接，不同大小的UNet之間可以共用特徵和參數。

蘋果「套娃」式擴散模型，訓練步數減少七成！

MDM的訓練則是一個循序漸進的過程。

雖然建模是聯合進行的，但訓練過程並不會一開始就針對高解析度進行，而是從低解析度開始逐步擴大。

這樣做可以避免龐大的運算量，還可以讓低解析度UNet的預訓練可以加速高解析度訓練過程。

訓練過程中會逐步將更高解析度的訓練資料加入整體過程中，讓模型適應漸進增長的分辨率，平滑過渡到最終的高解析度過程。

蘋果「套娃」式擴散模型，訓練步數減少七成！

不過從整體來看，在高解析度過程逐步加入之後，MDM的訓練依舊是端到端的聯合過程。

在不同解析度的聯合訓練當中，多個解析度上的損失函數一起參與參數更新，避免了多階段訓練帶來的誤差累積。

每個解析度都有對應的資料項目的重建損失，不同解析度的損失被加權合併，其中為保證產生質量，低解析度損失權重較大。

在推理階段，MDM採用的同樣是並行與漸進結合的策略。

此外，MDM利還採用了預先訓練的圖像分類模型（CFG）來引導生成樣本向更合理的方向優化，並為低分辨率的樣本添加噪聲,使其更貼近高分辨率樣本的分佈。

那麼，MDM的效果究竟如何呢？

較少參數匹敵SOTA

影像方面，在ImageNet和CC12M資料集上，MDM的FID（數值越低效果越好）和CLIP表現都顯著優於一般擴散模型。

其中FID用來評價圖像本身的質量，CLIP則說明了圖像和文字指令之間的匹配程度。

蘋果「套娃」式擴散模型，訓練步數減少七成！

和DALL E、IMAGEN等SOTA模型相比，MDM的表現也很接近，但MDM的訓練參數遠少於這些模型。

蘋果「套娃」式擴散模型，訓練步數減少七成！

不僅是優於一般擴散模型，MDM的表現也超過了其他級聯擴散模型。

蘋果「套娃」式擴散模型，訓練步數減少七成！

消融實驗結果表明，低解析度訓練的步數越多，MDM效果增強就越明顯；另一方面，嵌套層級越多，取得相同的CLIP得分所需的訓練步數就越少。

蘋果「套娃」式擴散模型，訓練步數減少七成！

而關於CFG參數的選擇，則是多次測試後再FID和CLIP之間權衡的結果（CLIP得分高相對於CFG強度增加）。

蘋果「套娃」式擴散模型，訓練步數減少七成！

以上是蘋果「套娃」式擴散模型，訓練步數減少七成！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

模型訓練

來源：51cto.com

上一篇：大咖雲集，看點前瞻：螞蟻集團主辦CNCC2023五大論壇下一篇：LeCun又雙詠唱衰自回歸LLM：GPT-4的推理能力非常有限，有兩篇論文為證

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1418673
php入門教程之一週學會PHP

4260215
JAVA 初級入門影片教學

2495664
小甲魚零基礎入門學習Python影片教學

504741
PHP 零基礎入門教學

859733

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板