AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com
이 기사는 칭화 대학교, 상하이 자오퉁 대학교, 시드니 대학교, UCSB, 홍콩 중문 대학교, 홍콩 과학 대학교가 공동으로 작성했습니다. 및 기술, 홍콩 과학 기술 대학교 (광저우). 주요 저자는 다음과 같습니다: 대규모 모델 워터마킹을 연구 방향으로 삼고 있는 칭화대학교 학부생 Pan Leyi(제1저자), 안전하고 신뢰할 수 있는 대규모 모델을 연구 방향으로 두고 있는 칭화대학교 박사과정 학생 Liu Aiwei ; Shanghai Jiao Tong University의 박사 과정 학생인 He Zhiwei의 연구 방향은 대형 모델 워터마킹, 대형 모델 지능 등입니다. 시드니 대학의 학부생인 Gao Zitian의 연구 방향은 대형 모델 워터마킹입니다. , UCSB 박사 후보자, 연구 방향은 신뢰할 수 있는 생성 AI 등입니다. Hu Xuming, 홍콩 과학 기술 대학교/홍콩 과학 기술 그는 칭화 대학교(광저우)의 조교수이며 안전하고 신뢰할 수 있는 연구에 관심이 있습니다. 대형 모델, 정보 추출 등 프로세스 마이닝 및 자연어 처리에 관심이 있는 Tsinghua University의 영구 부교수인 Wen Lijie.
이 글에서는 칭화대학교와 타 대학이 공동으로 출시한 오픈소스 모델 프린팅 알고리즘을 소개합니다. MarkLLM은 통합 모델 프린팅 알고리즘 구현 프레임워크, 직관적인 프린팅 알고리즘 메커니즘 시각화, 예제 및 체계적인 평가 모듈을 제공하여 연구자가 최신 프린팅 기술 개발을 쉽게 실험, 이해 및 평가할 수 있도록 지원합니다. 저자는 MarkLLM을 통해 모형 프린팅 기술에 대한 대중의 이해를 심화하는 동시에 연구자에게 편의를 제공하고, 관련 연구의 발전과 진흥을 도모하고자 한다.
Theory⽂이름: MarkLLM: LLM 워터마킹을 위한 오픈 소스 도구 키트
Theory⽂링크: https://arxiv.org/abs/2405.10051
코드 저장소: https:/ /github.com/THU- BPM/MarkLLM
⼯대형 모델 프린팅 기술 개발 현황 및 여전히 직면한 문제
⼤대형 모델 프린팅은 최근 새롭게 떠오르는 기술로, 모델에 모델을 생성하는 데 사용할 수 있습니다. . 유기적 텍스트의 식별 및 소스 추적을 실현하기 위해 이 프로세스에 특정 기능이 삽입됩니다. 가짜 뉴스 탐지, 학문적 무결성 유지, 데이터 및 모델 저작권 보호와 같은 시나리오에 사용할 수 있습니다.
⽬현재 주류인 대형 모델 각인 알고리즘은 대형 모델 추론 단계에서 각인을 이식하는 것입니다. 이러한 유형의 방법은 주로 두 가지 주요 알고리즘 계열로 나뉩니다.
KGW 계열: 사전 채점 벡터에 의해 추가됨 ⽽인쇄하고, 단어 목록을 빨간색과 녹색 목록으로 나누고, 녹색 단어에 편향을 추가하여 출력이 녹색 단어를 선호하도록 합니다.
그리스도 가족: 채점 벡터가 생성된 후 의사 난수를 사용하여 사전 샘플링합니다. 이 과정에서 워터마크 텍스트를 난수와 더 관련되게 만들어 워터마크를 삽입합니다.
그러나 모든 신흥 기술과 마찬가지로 중국 모델 워터마킹 기술도 사용 및 이해에 있어 몇 가지 어려움에 직면해 있습니다.
1. 다양한 대형 모델 워터마킹 알고리즘을 쉽게 사용하여 워터마크를 추가하고 감지하는 방법은 무엇입니까?
다양한 대형 모델 워터마킹 알고리즘이 지속적으로 등장하고 있습니다. 그러나 구현은 대부분 작성자 자신의 요구에 기반을 두고 있으며 통일된 클래스 및 호출 인터페이스 디자인이 부족하여 연구자와 대중이 이러한 알고리즘을 사용하고 재현하는 데 많은 노력을 투자해야 합니다.
2. 각 대형 모델 워터마킹 알고리즘의 내부 메커니즘을 직관적으로 이해하는 방법은 무엇입니까?
⼼대형 모델 워터마킹 알고리즘의 기본 메커니즘은 상대적으로 복잡하며, 대형 모델의 텍스트 생성 과정에서 스코어링 벡터 생성 및 샘플링 프로세스가 개입되어 연구자와 대중이 이해하기 쉽지 않습니다.
3. 다양한 대형 모델 워터마킹 알고리즘을 편리하고 종합적으로 평가하는 방법은 무엇입니까?
평가 관점과 지표는 다양하며(탐지 가능성, 견고성, 텍스트 품질에 대한 영향 등 포함) 한 번의 평가에는 여러 단계가 포함되므로 알고리즘 성능을 종합적이고 신속하게 평가하는 것이 매우 어렵습니다.
MarkLLM: 최초의 오픈소스 대형 모델 워터 프린팅 다기능 도구 패키지
앞서 언급한 세 가지 문제에 대응하여 저자는 대형 언어 모델 워터 프린팅 기술을 위한 도구 패키지 MarkLLM을 설계하고 구현했습니다.
MarkLLM의 주요 기여는 다음과 같이 요약할 수 있습니다.
1. 기능적으로 통합된 대형 모델 인쇄 알고리즘 구현 프레임워크: 두 가지 주요 인쇄 알고리즘 제품군(KGW 제품군 및 Christ 제품군) 9가지 특정 알고리즘을 지원합니다.
맞춤형 대형 모델 물 각인 알고리즘 메커니즘 시각화 솔루션: 사용자는 다양한 구성에서 다양한 대형 모델 물 각인 알고리즘의 내부 메커니즘을 시각화할 수 있습니다.
포괄적이고 체계적인 대형 모델 프린팅 알고리즘 평가 모듈: 3가지 평가 각도를 포괄하는 총 12가지 평가 도구와 두 가지 유형의 자동화된 평가 파이프라인을 포함합니다.
2. 설계 수준: 확장성과 유연성이 뛰어난 모듈식, 느슨하게 결합된 아키텍처 설계.
3. 실험적 측면: 저자는 MarkLLM을 연구 도구로 사용하여 지원되는 9가지 알고리즘에 대해 평가 각도에서 3가지 포괄적인 실험을 수행했으며, 이는 MarkLLM의 실용성을 입증하는 동시에 후속 연구의 기초도 제공했습니다. 참조.
4. 오픈 소스 커뮤니티에 미치는 영향⼒: MarkLLM은 GitHub에서 출시된 이후로 140개 이상의 별을 받았으며 Pull Request를 통해 동료들이 코드를 제공하도록 유도했습니다. 이슈 칼럼을 통해 소통하고 토론해보세요.
저자는 MarkLLM 툴킷이 연구자에게 편의를 제공할 뿐만 아니라, 대용량 언어 모델 워터마킹 기술에 대한 대중의 이해와 참여를 높이고, 학계와 대중 간의 소통을 촉진하기를 진심으로 바랍니다. 기술에 관한 연구 및 대규모 언어 모델 워터마크 적용의 추가 개발을 촉진하고 대규모 언어 모델의 안전한 사용에 기여합니다.
저자는 모든 분들의 소중한 의견 제공을 진심으로 환영하며, 서로 교류하고 학습하며, 풀 리퀘스트를 통한 코드 기여도 환영합니다. 이를 통해 모두의 공동 노력을 통해 더 나은 대형 모델 워터마킹 기술 생태계를 유지할 수 있습니다!
위 내용은 Tsinghua University 및 기타 대학에서는 거의 10개의 최신 워터마킹 알고리즘을 지원하는 최초의 오픈 소스 대형 모델 워터마킹 툴킷 MarkLLM을 출시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!