社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > ICML 2024 | 脫離LoRA架構，訓練參數大幅減少，新型傅立葉微調來了

ICML 2024 | 脫離LoRA架構，訓練參數大幅減少，新型傅立葉微調來了

王林

發布： 2024-06-10 17:58:01

原創

1149 人瀏覽過

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年，本站AIxiv專欄接收通報了2,000多篇內容，涵蓋全球各大專院校與企業的頂尖實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或聯絡報道。投稿信箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

本文介紹了香港科技大學（廣州）#本文介紹了香港科技大學（廣州）

的一篇關於大模型高效微調（LLM PEFT Fine-tuning） ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了的文章“Parameter-Efficient Fine-Tuning with Discrete Fourier Transform”，

本文被ICML 2024 接收，程式碼已開源。

#論文網址：https://arxiv.org/abs/2405.03003

專案網址：https://github.com/Chaos96/fourierft

背景

大型基座模型在自然語言處理（NLP）和電腦視覺（CV）領域都獲得了矚目的成就。微調（Finetuning）大型基座模型，使其更適應特殊的下游任務，成為了熱門研究主題。然而，在模型越來越大，下游任務越來越多元的今天，微調整個模型帶來的運算、儲存消耗已大到不再能被接受。 LoRA 採用低秩擬合微調增量的方案，成功降低了大量的此類消耗，但每個適應器（adapter）的大小仍然是不可忽視的。這激發了本文的核心問題：

比起 LoRA，如何進一步大幅減少可訓練參數？此外，一個有趣的附加問題是能否採用更少的參數量得到高秩增量矩陣

。

方法

#傅立葉基底在各類別資料壓縮應用中廣泛使用，例如一維向量訊號和二維影像的壓縮。在這些應用中，稠密的空域訊號透過傅立葉變換被轉換為稀疏的頻域訊號。基於此原理，作者推測模型權重的增量也可以被視為一種空域訊號，其對應的頻域訊號可以透過稀疏表示來實現。

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

在這假設的基礎上，作者提出了一種新的方法，用於在頻域中學習增量權重訊號。具體來說，該方法透過隨機位置的稀疏頻域訊號來表示空域權重增量。在載入預訓練模型時，首先隨機選擇 n 個點作為有效的頻域訊號，然後將這些訊號拼接成一個一維向量。在前向傳播過程中，這個一維向量被用來透過傅立葉變換恢復空域矩陣；在反向傳播過程中，由於傅立葉變換的可導性，可以直接對此可學習的向量進行更新。這種方法不僅有效減少了模型微調時所需的參數數量，同時確保了微調效能。透過這種方式，作者不僅實現了對大規模基礎模型的高效微調，還展示了傅立葉變換在機器學習領域中的潛在應用價值。

得益於傅立葉變換基底的高資訊量，只需很小的 n 值即可達到與 LoRA 相當甚至超過 LoRA 的表現。一般來說，傅立葉微調的可訓練參數僅為 LoRA 的千分之一到十分之一。

實驗

#1. 自然語言理解

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

###作者在自然語言理解的GLUE 基準測試上對傅立葉微調方法進行了評估。基準對比方法包括全量微調（FF，Full Finetuning）、Bitfit、適應器微調（Adapter Tuning）、LoRA、DyLoRA 和 AdaLoRA。下表展示了各種方法在 GLUE 各個任務上的表現及其所需的訓練參數量。結果表明，傅立葉微調以最少的參數量達到了甚至超越了其他微調方法的性能。 ############

2. 自然语言指令微调

大模型的自然语言生成是目前模型微调的重要应用领域。作者在 LLaMA 系列模型、MT-Bench 任务和 Vicuna 任务上评估了傅立叶微调的性能。结果显示，傅立叶微调以极低的训练参数量达到了与 LoRA 相似的效果，进一步验证了傅里叶微调方法的通用性和有效性。

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

3. 图像分类

作者在 Vision Transformer 上测试了傅里叶微调的性能，涵盖了 8 个常见的图像分类数据集。实验结果表明，虽然在图像分类任务中傅立叶微调相较LoRA的压缩率提升并不比自然语言任务中显著，但其仍然以远小于 LoRA 的参数量超越了 LoRA 的效果。这进一步展示了傅立叶微调在不同应用领域中的有效性和优势。

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

4. 突破低秩

在 GLUE 基准的 RTE 数据集上，FourierFT 可以实现明显高于 LoRA (通常为 4 或 8) 的增量的秩。

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

5.GPU 资源消耗

微调过程中，FourierFT 可以实现比 LoRA 更少的 GPU 消耗。下图为采用单张 4090 显卡在 RoBERTa-Large 模型上的巅峰内存消耗。

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

结论

作者介绍了一种名为傅立叶微调的高效微调方法，通过利用傅里叶变换来减少大基础模型微调时的可训练参数数量。该方法通过学习少量的傅里叶谱系数来表示权重变化，显著降低了存储和计算需求。实验结果显示，傅立叶微调在自然语言理解、自然语言生成、指令调优和图像分类等任务上表现优异，与现有的低秩适应方法（如 LoRA）相比，傅立叶微调在保持或超过 LoRA 性能的同时，所需的可训练参数大幅减少。

以上是ICML 2024 | 脫離LoRA架構，訓練參數大幅減少，新型傅立葉微調來了的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

工程

來源：jiqizhixin.com

上一篇：如何利用人工智慧增強API和微服務的雲端安全下一篇：TigerGraph CoPilot如何實現圖形增強式AI

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

創造未來：零基礎的 Java 編程

2024-10-13 13:32:21
你並不孤單：在社群的支持下掌握 Python

2024-10-12 11:58:51
從新手到程式設計師：利用 Python 程式設計的力量

2024-10-11 20:06:51
像程式設計師一樣思考：學習 Java 基礎知識

2024-10-11 18:59:31
Java 變得簡單：程式設計能力的初學者指南

2024-10-11 18:30:51
使用 PHP 建立部落格：一個適合初學者的項目

2024-10-11 15:51:51
講系統語言：學習 C，一次一行

2024-10-11 15:42:10
C 語言的資料結構與演算法：適合初學者的方法

2024-10-11 14:41:20
不流淚編碼：輕鬆學習 C

2024-10-11 14:08:31
使用 Java 進行資料分析：資訊處理初學者指南

2024-10-11 13:42:21

最新問題

傳回值中變數的格式是什麼？我是php的新學習者。我發現有一段程式碼：if($x<time()){return[false,'error'];}邏輯或變數並不重要，但我不明白[false,'error'...

來自於 2024-04-06 21:55:20

0

1

778

頁面突然無法拉動 css 或 bootstrap 所以我正在開發一個頁面，我昨天做了一部分，效果很好，今天我繼續做剩下的部分，一切都很好。當我嘗試將其作為普通html頁面打開時，CSS或BOOTSTRAP不起作用，僅顯示頁面文本，...

來自於 2024-04-06 21:58:04

0

1

800

數獨檢查器無法運作？誰能幫我辨識錯誤？我嘗試了在線編輯器上的所有方法，但仍然收到錯誤。但當我在我的機器上的VSCode上執行此操作時，它工作正常。我很困惑，在沒有發現錯誤的情況下無法提交程式碼。我不知道該去哪裡找了。我...

來自於 2024-04-06 21:21:07

0

1

474

動態修改Javafx中的內嵌CSS樣式我試圖在應用程式最大化時更改窗格的背景圖像。我的背景是使用內嵌css設定的。我為樣式設定了兩個不同的變數和一個if語句。但是，我沒有運氣讓它改變樣式。 StringcssStyle...

來自於 2024-04-06 20:57:16

0

1

487

在網路應用程式中顯示版本資訊的最佳實踐是什麼？我正在開發一個網頁應用程式。在網路應用程式中顯示版本資訊的最佳實踐是什麼？我正在使用語義版本控制，並且我已經有了semver，例如1.2.0但我很好奇在哪裡顯示它的最佳方式以及如何...

來自於 2024-04-06 19:13:16

0

2

476

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422680
php入門教程之一週學會PHP

4267588
JAVA 初級入門影片教學

2530371
小甲魚零基礎入門學習Python影片教學

507007
PHP 零基礎入門教學

862178

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板