目录
1.Label Studio
10.Potato
首页 科技周边 人工智能 十个推荐开源免费文本标注工具

十个推荐开源免费文本标注工具

Mar 26, 2024 pm 08:20 PM
ai 开源 文本标注

文本标注工作是将标签或标记与文本中特定内容相对应的工作。其主要目的是为文本提供额外的信息,以便进行更深入的分析和处理,尤其是在人工智能领域。

十个推荐开源免费文本标注工具

文本标注对于人工智能应用中的监督机器学习任务至关重要。用于训练AI模型,有助更准确地理解自然语言文本信息,提高文本分类、情感分析和语言翻译等任务的性能。通过文本标注,我们可以教AI模型识别文本中的实体、理解上下文,并在出现新的类似数据时做出准确的预测。

本文主要推荐一些较好的开源文本标注工具。

1.Label Studio

https://github.com/HumanSignal/label-studio

十个推荐开源免费文本标注工具

Label Studio是一个开源的数据标注工具,能够处理多种数据类型并支持导出为多种模型格式。它被广泛应用于准备原始数据或改进现有的训练数据,以提高机器学习模型的准确性。

2.Doccano

https://github.com/doccano/doccano

十个推荐开源免费文本标注工具

Doccano是一个开源文本标注工具,提供文本分类、序列标记和序列任务的功能。它支持文本标注团队协作、多语言、移动应用、表情符号、深色主题和REST风格的API。可以使用Docker和Docker Compose安装。

3.Universal Data Tool

https://github.com/UniversalDataTool/universal-data-tool

十个推荐开源免费文本标注工具

Universal Data Tool是一个用于编辑和注释各种类型的数据(包括图像、文本、音频和文档)的多功能应用程序。它支持广泛的数据类型,并提供实时协作、易于使用的GUI、为文本标注人员创建培训课程等功能。该工具可以在网络上使用,也可以作为桌面应用程序使用,并支持CSV或JSON格式的数据下载和上传。

4.YEDDA

https://github.com/jiesutd/YEDDA

十个推荐开源免费文本标注工具

十个推荐开源免费文本标注工具

YEDDA是一个可以用于各种语言、符号和表情符号的文本标注工具。它支持使用快捷方式、命令模型,并将标注文本导出为序列文本。支持智能推荐和管理员分析等功能。

YEDDA兼容所有主流操作系统,包括Windows、Linux和MacOS。

5.Argilla

https://github.com/argilla-io/argilla

Argilla是一个面向人工智能工程师和领域专家的开源数据协作平台,提供高质量、高效率的数据输出。

它有助于控制数据质量并提高AI输出质量,并通过实现数据和模型的快速迭代来提高效率。Argilla还提供了数据管理和模型训练工具。

6.KernAI Refinery

https://github.com/code-kern-ai/refinery

十个推荐开源免费文本标注工具

Refinery是KernAI的一个开源平台,专为处理自然语言数据的数据科学家设计。它提供半自动化数据标注、数据子集质量评估和集中数据监控等功能,旨在提高人工标记效率。

该工具利用Hugging Face和spaCy等技术构建预建语言模型,并与其他标签工具集成,以实现灵活的数据处理。

功能特征:

  • NLP任务的(半)自动化标签工作流程
  • 手动和程序化分类以及跨度标签
  • 支持与最先进的库和框架集成
  • 创建和管理查找表/知识库
  • 基于神经搜索的相似记录和离群值检索
  • 可切片标签会话
  • 每个项目多个标签任务
  • 丰富的自动化库
  • 广泛的数据管理和监控
  • 与Hugging Face集成,用于自动创建嵌入
  • 基于JSON的数据模型用于数据上传/下载
  • 项目指标概述
  • 通过Python SDK访问和扩展数据
  • 在位属性修改
  • 托管版本中的团队协作
  • 面向多个用户的基于角色的访问和最小化的标签视图
  • 集成群组标签工作流
  • 自动计算注释者之间的协

7.Recogito.js

https://github.com/recogito/recogito-js

十个推荐开源免费文本标注工具

ApplitoJS是一个用于文本注释的JavaScript库,用于向网页添加文本标注功能或构建自定义文本标注程序。可以通过npm或下载最新版本来安装。

8.Label Sleuth

https://github.com/label-sleuth/label-sleuth

十个推荐开源免费文本标注工具

Label Sleuth是一个用于文本标注和分类的开源、无代码系统。它使医生、律师、心理学家等领域的专家也能够在没有NLP专家配合的情况下构建自定义NLP模型。

通常NLP模型创建需要领域和机器学习专业知识。Label Sleuth通过直观的文本标注和AI模型构建,绕开了对NLP专业知识的要求。当用户在标注数据时,机器学习模型在后台进行训练,进行预测并建议下一步标记什么。

作为一个无代码系统,它不需要机器学习知识,并允许快速开发模型,从任务定义到完成模型只需几个小时。

9.Markup

https://github.com/samueldobbie/markup

十个推荐开源免费文本标注工具

Markup是一种在线标注工具,可用于将非结构化文档转换为NLP和ML任务的结构化格式,例如:实体识别。在您标注时进行同步学习,以预测和推荐更为复杂的标注,并且还提供对用于概念映射的通用和自定义本体的集成访问。

功能特征:

  • 预测性注释:Markup的机器学习驱动的预测性标注功能,可在您工作时推荐更复杂的标注,使标注的过程更加高效。
  • 集成本体访问标记:提供了对广泛的通用本体(例如UMLS、SNOMED-CT、ICD-10)的集成访问,以及上传自定义本体的能力,用于概念映射。
  • 预测性本体映射:Markup的预测性本体映射功能使用机器学习,根据您正在标注的文本,推荐到标准和自定义术语的适当映射。 
  • 友好的用户界面:无论您是技术专家还是初学者,标记的用户友好的界面使任何人都可以轻松地以最小的设置开始注释文档。

10.Potato

https://github.com/davidjurgens/potato

十个推荐开源免费文本标注工具

十个推荐开源免费文本标注工具

Potato是一个基于Web的文本标注工具,支持快速设置和部署各种文本标注任务。可以作为Web服务器运行,由单个配置文件驱动,不需要启动编码。但Potato很容易自定义,通常不需要额外的网页设计,就可以调整文本标注人员的操作界面。

关键特征:

  • 易于设置和定制
  • 广泛的内置模式和模板
  • 支持多种数据类型
  • 支持多任务设置
  • 通过键盘快捷键、动态高亮显示和标签工具提示等功能提高标注效率
  • 更好地了解注释者的功能,例如筛选前和筛选后的问题
  • 质量控制功能,如注意力测试、资格测试和内置时间检查

以上是十个推荐开源免费文本标注工具的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

PHP教程
1517
276
8月加密货币交易所优惠评比:新用户奖励、手续费减免大全 8月加密货币交易所优惠评比:新用户奖励、手续费减免大全 Aug 08, 2025 pm 11:15 PM

目录 8月Binance(币安)交易所优惠 8月Bybit交易所优惠 8月MEXC抹茶交易所优惠 8月Bitfinex(绿叶)交易所优惠加密货币交易所排名本文将整理2025年8月,各大加密货币交易所的最新优惠,一文让读者享有最优福利。很多币圈新手不知道的是,大部分交易所都有隐藏的申办优惠,这些优惠包含了:手续费减免(10–20%减免)新户赠金(可以充当保证金,用

MemeFi(MEMEFI币)未来价格如何?2025、2026、2027-2030年价格预测 MemeFi(MEMEFI币)未来价格如何?2025、2026、2027-2030年价格预测 Aug 08, 2025 pm 11:09 PM

目录MemeFi币是什么?MemeFi游戏玩法介绍MemeFi(MEMEFI)价格预测MemeFi(MEMEFI)价格预测:EMA集群和布林带挤压突破MemeFi(MEMEFI)价格预测:RSI和方向趋势动量MemeFi(MEMEFI)2025年至2030年的价格预测MemeFi(MEMEFI)2026年价格预测MemeFi(MEMEFI)2027年价格预测MemeFi(MEMEFI)2028年价格预测MemeFi(MEMEFI)2

火币HTX上新资产一周回顾(7.28-8.4):多赛道共振 Meme与AI概念领跑市场 火币HTX上新资产一周回顾(7.28-8.4):多赛道共振 Meme与AI概念领跑市场 Aug 08, 2025 pm 11:03 PM

目录Meme热度依旧:VINE、DONKEY继续上涨技术叙事升温:AI与隐私计算受热捧跨链、RWA与区域性叙事:OMNI崭露头角火币HTX财富效应持续释放关于火币HTX7月28日至8月4日,全球加密市场维持震荡格局,热点轮动节奏加快。本周火币HTX上线资产中,Meme、AI、隐私计算、跨链及RWA等多个赛道齐头并进,市场财富效应持续显现。这也是火币HTX自7月以来连续第五周实现上新资产集体上涨,进一步验证其在前沿项目挖掘与生态布局上的前瞻性,持续为用户把握新一轮市场周期提供有力支持。火币(HTX

比特币(BTC)短期持有者获利了结'降温”,价格稳守11.5万美元关口 比特币(BTC)短期持有者获利了结'降温”,价格稳守11.5万美元关口 Aug 08, 2025 pm 11:00 PM

目录市场处于“相对平衡状态”2025年剩余时间比特币展望积极尽管比特币价格从历史高点回落,Glassnode指出当前市场已进入“相对平衡的位置”。根据链上数据平台Glassnode的分析,随着比特币价格在112,000美元的局部低点后逐步反弹,处于盈利状态的短期持有者(STH)抛售压力正在减弱。在周三发布的市场报告中,Glassnode表示,短期持有者(指持币时间不足155天的投资者)的获利了结行为已明显“降温”。数据显示,衡量近期买入并盈利投资者卖出比例的“已花费产出利润率”(SOPR)已下降

上网404怎么解决 上网404怎么解决 Aug 12, 2025 pm 09:21 PM

如何解决上网 404 错误:检查 URL 是否正确。刷新页面。清除浏览器缓存:Chrome:右上角三个点 > 更多工具 > 清除浏览数据 > 勾选 "缓存的图片和文件" > 清除数据Firefox:右上角三个横线 > 选项 > 隐私与安全 > 清除历史记录 > 勾选 "缓存" > 确定Safari:菜

Succinct (PROVE币) 价格预测:2025、2026、2027-2030 年 Succinct (PROVE币) 价格预测:2025、2026、2027-2030 年 Aug 11, 2025 am 10:12 AM

目录什么是Succinct(PROVE)哪些风险投资支持Succinct(PROVE)?Succinct(PROVE)的工作原理SP1zkVM和Prover网络OPSuccinct技术跨链验证PROVE代币经济学代币详情2025、2026、2027-2030年Succinct(PROVE)价格预测Succinct(PROVE)价格预测Succinct(PROVE)价格预测:交易量扩张和上市势头2025年至20

一文全方位了解GENIUS 稳定币法案解析 一文全方位了解GENIUS 稳定币法案解析 Aug 08, 2025 pm 10:51 PM

2025年7月18日,美国总统签署了《指导与建立美国稳定币国家创新法案》(简称“GENIUS 法案”),标志着美国在数字资产监管领域迈出了历史性的一步。作为美国首部联邦层面的稳定币专项立法,该法案旨在为“支付型稳定币”建立一套全面、清晰的法律和监管框架。

如何在币圈用两千本金赚百万?短线狙击战法全解! 如何在币圈用两千本金赚百万?短线狙击战法全解! Aug 12, 2025 pm 07:00 PM

在数字货币的浪潮中,用有限的本金实现财富的巨大增值,是许多参与者的梦想。两千本金,目标百万,这并非遥不可及的神话,它需要的是一套极致的交易纪律、敏锐的市场嗅觉和冷酷的执行力。这套方法论的核心并非长期价值投资,而是一场场高强度、快节奏的短线狙击战。

See all articles