社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 生物醫學NLP領域的特定預訓練模式：PubMedBERT

生物醫學NLP領域的特定預訓練模式：PubMedBERT

王林

發布： 2023-11-27 17:13:46

轉載

1222 人瀏覽過

今年大语言模型的迅速发展导致像BERT这样的模型现在被称为“小”模型。在Kaggle的LLM科学考试比赛中，使用deberta的选手获得了第四名，这是一个非常出色的成绩。因此，在特定领域或需求中，并不一定需要大型语言模型作为最佳解决方案，小型模型也有其用武之地。因此，今天我们要介绍的是PubMedBERT，它是微软研究院于2022年在ACM上发布的一篇论文，该模型通过使用特定领域的语料库进行BERT的从头预训练

生物醫學NLP領域的特定預訓練模式：PubMedBERT

以下是论文的主要要点：

对于具有大量未标记文本的特定领域，例如生物医学领域，从头开始预训练语言模型比持续预训练通用领域语言模型效果显著。为此，我们提出了生物医学语言理解与推理基准（BLURB），用于特定领域的预训练

PubMedBERT

1、特定领域Pretraining

生物醫學NLP領域的特定預訓練模式：PubMedBERT

研究表明，从头开始的特定领域预训练大大优于通用语言模型的持续预训练，从而表明支持混合领域预训练的主流假设并不总是适用。

2、模型

利用BERT模型，对于掩码语言模型(MLM)，全词屏蔽(WWM)的要求是必须屏蔽整个词

3、BLURB数据集

生物醫學NLP領域的特定預訓練模式：PubMedBERT

据作者介绍，BLUE[45]是在生物医学领域创建NLP基准的第一次尝试。但BLUE的覆盖范围有限。针对基于pubmed的生物医学应用，作者提出了生物医学语言理解与推理基准(BLURB)。

生物醫學NLP領域的特定預訓練模式：PubMedBERT

PubMedBERT使用更大的特定领域语料库(21GB)。

生物醫學NLP領域的特定預訓練模式：PubMedBERT

结果展示

生物醫學NLP領域的特定預訓練模式：PubMedBERT

在大多数生物医学自然语言处理（NLP）任务中，PubMedBERT一直表现优于其他所有BERT模型，并且通常具有明显的优势

以上是生物醫學NLP領域的特定預訓練模式：PubMedBERT的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

大語言模型 pubmedbert

來源：51cto.com

上一篇：結合物理引擎，GPT-4+擴散模型產生逼真、連貫、合理視頻下一篇：LLMLingua: 整合LlamaIndex，壓縮提示並提供高效率的大語言模型推理服務

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

創造未來：零基礎的 Java 編程

2024-10-13 13:32:21
你並不孤單：在社群的支持下掌握 Python

2024-10-12 11:58:51
從新手到程式設計師：利用 Python 程式設計的力量

2024-10-11 20:06:51
像程式設計師一樣思考：學習 Java 基礎知識

2024-10-11 18:59:31
Java 變得簡單：程式設計能力的初學者指南

2024-10-11 18:30:51
使用 PHP 建立部落格：一個適合初學者的項目

2024-10-11 15:51:51
講系統語言：學習 C，一次一行

2024-10-11 15:42:10
C 語言的資料結構與演算法：適合初學者的方法

2024-10-11 14:41:20
不流淚編碼：輕鬆學習 C

2024-10-11 14:08:31
使用 Java 進行資料分析：資訊處理初學者指南

2024-10-11 13:42:21

最新問題

TypeError：無法使用 ThreeJs 讀取未定義的屬性（讀取「位置」）我正在嘗試將3D模型整合到我網站的英雄部分的背景中。它有效，只是當我手動更改視窗大小時，3D模型不適應新大小。可能與第一個問題相關的另一個問題是我在控制台中收到此錯誤訊息，它引用了...

來自於 2024-04-01 12:01:52

0

1

416

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1423173
php入門教程之一週學會PHP

4268724
JAVA 初級入門影片教學

2536496
小甲魚零基礎入門學習Python影片教學

507439
PHP 零基礎入門教學

862763

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板