文章专题学习下载问答编程词典手游最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

首页 > 科技周边 > 人工智能 > 正文

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

PHPz

发布： 2024-06-19 05:13:08

原创

920 人浏览过

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港科技大学、香港科技大学（广州）联合完成。主要作者包括：潘乐怡（第一作者），清华大学本科生，研究方向为大模型水印等；刘瑷玮，清华大学博士生，研究方向为安全可信大模型等；何志威，上海交通大学博士生，研究方向为大模型水印、大模型智能体等;高梓添，悉尼大学本科生，研究方向为大模型水印；赵宣栋，UCSB博士生，研究方向为可信生成式AI等；胡旭明，香港科技大学/香港科技大学（广州）助理教授，研究方向为安全可信大模型、信息抽取等；闻立杰，清华大学长聘副教授，研究方向为流程挖掘，自然语言处理。

本文介绍了由清华等校联合推出的个开源的模型印算法。MarkLLM提供了统的模型印算法实现框架、直观的印算法机制可视化、案以及系统性的评估模块，旨在持研究员便地实验、理解和评估最新的印技术展。通过MarkLLM，作者期望在给研究者提供便利的同时加深公众对模型印技术的认知形成，进⾛推进相关研究的发展和推⼴应。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

论⽂名称：MarkLLM: An Open-Source Toolkit for LLM Watermarking
论⽂链接：https://arxiv.org/abs/2405.10051
代码仓库：https://github.com/THU- BPM/MarkLLM

⼤模型⽔印技术的发展现状 & 仍然⾯临的问题

⼤模型⽔印是近期新兴的⼀项技术，通过在模型⽣成⽂本过程中植⼊特定的特征，来实现机⽣⽂本的辨别和来源追溯。它可⽤于虚假新闻检测、维护学术诚信、数据和模型版权保护等场景。

⽬前主流的⼤模型⽔印算法是在⼤模型推理阶段植⼊⽔印，这类⽅法主要分为两⼤算法家族：

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

KGW 家族：通过⼲预打分向量添加⽔印，将词表分为红绿列表，给绿⾊词加偏置，使输出偏好绿⾊词汇；
Christ 家族：在打分向量⽣成后，⽤伪随机数⼲预采样过程，使⽔印⽂本与该随机数更相关，以此植⼊⽔印。

然⽽，就像所有新兴技术⼀样，⼤语⾔模型⽔印技术在使⽤和理解上也⾯临⼀些挑战。

1. 如何便捷地使⽤各个⼤模型⽔印算法进⾏⽔印添加和检测？

各类⼤模型⽔印算法不断涌现。然⽽它们的实现⼤都基于作者⾃⾝的需求，缺乏统⼀的类和调⽤接⼝设计，使得研究⼈员和⼤众需要投⼊⼤量精⼒去使⽤和复现这些算法。

2. 如何直观地理解各个⼤模型⽔印算法的内部机制？

⼤模型⽔印算法的底层机制相对复杂，涉及对⼤模型⽣成⽂本过程中打分向量⽣成以及采样过程的⼲预，不便于研究者和⼤众理解。

3. 如何便捷、全⾯的评估各个⼤模型⽔印算法？

评估⻆度和指标多样（包含可检测性、鲁棒性、对⽂本质量的影响等），且⼀次评估涉及多步骤，全⾯快速评估算法性能极具挑战。

MarkLLM：⾸个开源⼤模型⽔印多功能⼯具包

针对刚才提到的 3 个问题，作者设计并实现了⾯向⼤语⾔模型⽔印技术的⼯具包 MarkLLM。

MarkLLM 的主要贡献可总结如下：

1. 功能⻆度

统⼀的⼤模型⽔印算法实现框架：⽀持两个关键⽔印算法家族（KGW 家族和 Christ 家族）的 9 种具体算法。
⼀致、⽤⼾友好的顶层调⽤接⼝：1 ⾏代码实现添加⽔印、检测⽔印等各类操作。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

定制化的⼤模型⽔印算法机制可视化解决⽅案：使⽤⼾能够在各种配置下可视化不同⼤模型⽔印算法的内部机制。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

全⾯、系统的⼤模型⽔印算法评估模块：包含覆盖 3 个评估⻆度的共 12 个评估⼯具，以及两类⾃动化评估流⽔线。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

2. 设计⻆度：模块化、松耦合架构设计，具有极⾼的可扩展性和灵活性。

3. 实验⻆度：作者⽤ MarkLLM 作为研究⼯具，对⽀持的 9 种算法做了 3 个评估⻆度的全⾯实验，在证明 MarkLLM 的实⽤性的同时，为后续研究提供了宝贵的数据参考。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

4. 对开源社区的影响⼒：MarkLLM 在 GitHub 上线以来已经获得了较多关注，⽬前已有 140+ stars，并吸引了同⾏通过 Pull Request 进⾏代码贡献，以及在 issue 栏⽬进⾏交流讨论。

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

作者衷⼼希望 MarkLLM ⼯具包在为研究⼈员提供便利的同时，提⾼⼤众对⼤语⾔模型⽔印技术的理解和参与度，促进学术界和公众之间就该技术达成共识，推动⼤语⾔模型⽔印研究和应⽤的进⼀步发展，为⼤语⾔模型使⽤安全贡献⼒量。

作者真诚欢迎⼤家提出宝贵意⻅、相互交流学习，也⼗分欢迎通过 pull request 贡献代码，通过⼤家的共同努⼒维护更好的⼤模型⽔印技术⽣态！

以上是清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

工程⼤模型⽔印 MarkLLM

来源：jiqizhixin.com

上一篇：探索复合材料中的原子扩散，加州大学开发神经网络动力学方法下一篇：全域机动的豪华电动越野座驾，猛士917蛟龙战甲开启预售

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

Exclusive $VRSC Airdrop — Don’t Miss Out!

2024-09-20 15:48:33
Optimism (OP) Price Action Analysis: Underperformance, High Volatility, and a 75% Price Decline Raise Concerns

2024-09-20 15:29:32
Ethereum: A Resounding Example of the Future of Cryptocurrency

2024-09-20 15:25:32
Storj Airdrop is Here — Claim Your Tokens Today!

2024-09-20 15:13:32
MATIC币总发行量和上线交易所介绍

2024-09-20 14:41:00
ETH币交易所平台哪个好?

2024-09-20 13:47:02
Avalanche (AVAX), Aptos (APT), and BlockDAG: Which Crypto Will Break Out?

2024-09-20 09:48:12
DOGS's Price Prediction Looks Bright Thanks to a Growing User Base and Catizen's $CATI Token Is Preparing for a Major Launch This Month

2024-09-20 09:00:11
NEAR Protocol: Riding Trending Narratives or Market Leader?

2024-09-20 06:48:29
POPCAT, NEIRO, and DOGEN: A Trio of Cryptocurrencies Poised for Growth

2024-09-20 06:44:29

最新问题

返回值中变量的格式是什么？我是php的新学习者。我发现有一段代码：if($x<time()){return[false,'error'];}逻辑或变量并不重要，但我不明白[false,'error']...

来自于 2024-04-06 21:55:20

0

1

778

页面突然无法拉动 css 或 bootstrap 所以我正在开发一个页面，我昨天做了一部分，效果很好，今天我继续做剩下的部分，一切都很好。当我尝试将其作为普通html页面打开时，CSS或BOOTSTRAP不起作用，仅显示页面文本，...

来自于 2024-04-06 21:58:04

0

1

800

数独检查器无法工作？谁能帮我识别错误？我尝试了在线编辑器上的所有方法，但仍然收到错误。但当我在我的机器上的VSCode上执行此操作时，它工作正常。我很困惑，在没有发现错误的情况下无法提交代码。我不知道该去哪里寻找了。我...

来自于 2024-04-06 21:21:07

0

1

474

动态修改Javafx中的内联CSS样式我试图在应用程序最大化时更改窗格的背景图像。我的背景是使用内嵌css设置的。我为样式设置了两个不同的变量和一个if语句。但是，我没有运气让它改变样式。StringcssStyle=...

来自于 2024-04-06 20:57:16

0

1

487

在网络应用程序中显示版本信息的最佳实践是什么？我正在开发一个网络应用程序。在网络应用程序中显示版本信息的最佳实践是什么？我正在使用语义版本控制，并且我已经有了semver，例如1.2.0但我很好奇在哪里显示它的最佳方式以及如何...

来自于 2024-04-06 19:13:16

0

2

476

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1405570
php入门教程之一周学会PHP

4235321
JAVA 初级入门视频教程

2430116
小甲鱼零基础入门学习Python视频教程

499760
PHP 零基础入门教程

837792

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责声明 Sitemap: PHP中文网：公益在线PHP培训，帮助PHP学习者快速成长！