社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > 生物医学NLP领域的特定预训练模型：PubMedBERT

生物医学NLP领域的特定预训练模型：PubMedBERT

王林

发布： 2023-11-27 17:13:46

转载

1227 人浏览过

今年大语言模型的迅速发展导致像BERT这样的模型现在被称为“小”模型。在Kaggle的LLM科学考试比赛中，使用deberta的选手获得了第四名，这是一个非常出色的成绩。因此，在特定领域或需求中，并不一定需要大型语言模型作为最佳解决方案，小型模型也有其用武之地。因此，今天我们要介绍的是PubMedBERT，它是微软研究院于2022年在ACM上发布的一篇论文，该模型通过使用特定领域的语料库进行BERT的从头预训练

生物医学NLP领域的特定预训练模型：PubMedBERT

以下是论文的主要要点：

对于具有大量未标记文本的特定领域，例如生物医学领域，从头开始预训练语言模型比持续预训练通用领域语言模型效果显着。为此，我们提出了生物医学语言理解与推理基准（BLURB），用于特定领域的预训练

PubMedBERT

1、特定领域Pretraining

生物医学NLP领域的特定预训练模型：PubMedBERT

研究表明，从头开始的特定领域预训练大大优于通用语言模型的持续预训练，从而表明支持混合领域预训练的主流假设并不总是适用。

2、模型

利用BERT模型，对于掩码语言模型(MLM)，全词屏蔽(WWM)的要求是必须屏蔽整个词

3、BLURB数据集

生物医学NLP领域的特定预训练模型：PubMedBERT

据作者介绍，BLUE[45]是在生物医学领域创建NLP基准的第一次尝试。但BLUE的覆盖范围有限。针对基于pubmed的生物医学应用，作者提出了生物医学语言理解与推理基准(BLURB)。

生物医学NLP领域的特定预训练模型：PubMedBERT

PubMedBERT使用更大的特定领域语料库(21GB)。

生物医学NLP领域的特定预训练模型：PubMedBERT

结果展示

生物医学NLP领域的特定预训练模型：PubMedBERT

在大多数生物医学自然语言处理（NLP）任务中，PubMedBERT一直表现优于其他所有BERT模型，并且通常具有明显的优势

以上是生物医学NLP领域的特定预训练模型：PubMedBERT的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

大语言模型 pubmedbert

来源：51cto.com

上一篇：结合物理引擎，GPT-4+扩散模型生成逼真、连贯、合理视频下一篇：LLMLingua: 整合LlamaIndex，压缩提示并提供高效的大语言模型推理服务

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

创造未来：面向零基础的 Java 编程

2024-10-13 13:32:21
你并不孤单：在社区的支持下掌握 Python

2024-10-12 11:58:51
从新手到程序员：利用 Python 编程的力量

2024-10-11 20:06:51
像程序员一样思考：学习 Java 基础知识

2024-10-11 18:59:31
Java 变得简单：编程能力的初学者指南

2024-10-11 18:30:51
使用 PHP 构建博客：一个适合初学者的项目

2024-10-11 15:51:51
讲系统语言：学习 C，一次一行

2024-10-11 15:42:10
C 语言的数据结构和算法：适合初学者的方法

2024-10-11 14:41:20
不流泪编码：轻松学习 C

2024-10-11 14:08:31
使用 Java 进行数据分析：信息处理初学者指南

2024-10-11 13:42:21

最新问题

TypeError：无法使用 ThreeJs 读取未定义的属性（读取'位置”）我正在尝试将3D模型集成到我网站的英雄部分的背景中。它有效，只是当我手动更改窗口大小时，3D模型不适应新大小。可能与第一个问题相关的另一个问题是我在控制台中收到此错误消息，它引用了...

来自于 2024-04-01 12:01:52

0

1

416

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1423362
php入门教程之一周学会PHP

4268897
JAVA 初级入门视频教程

2536995
小甲鱼零基础入门学习Python视频教程

507502
PHP 零基础入门教程

862842

最新下载

更多>

网站特效

网站源码

网站素材

前端模板