Article Sujet apprentissage Télécharger Questions et réponses Dictionnaire de programmation Jeu mises à jour récentes

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Maison> Périphériques technologiques> IA> le corps du texte

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

王林

Libérer： 2023-05-18 11:13:06

avant

968 Les gens l'ont consulté

ChatGPT火了以后，用法是真多。

有人拿来寻求人生建议，有人干脆当搜索引擎用，还有人拿来写论文。

论文...可不兴写啊。

美国部分大学已经明令禁止学生使用ChatGPT写作业，还开发了一堆软件来鉴别，判断学生上交的论文是不是GPT生成的。

这里就出了个问题。

有人论文本来就写的烂，判断文本的AI以为是同行写的。

更搞的是，中国人写的英文论文被AI判断为AI生成的概率高达61%。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

这....这这什么意思？气抖冷！

非母语者不配？

目前，生成式语言模型发展迅速，确实给数字通信带来了巨大进步。

但滥用真的不少。

虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容，但这些检测方法的公平性和稳定性仍然亟待提高。

为此，研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。

研究结果显示，这些检测器始终将非母语者写作的样本错误地判定为AI生成的，而母语写作样本则基本能被准确地识别。

此外，研究人员还证明了，用一些简单的策略就可以减轻这种偏见，还能有效地绕过GPT检测器。

这说明什么？这说明GPT检测器就看不上语言表达水平不咋地的作者，多叫人生气。

不禁联想到那款判断AI还是真人的游戏，如果对面是真人但你猜是AI，系统就会说，「对方可能会觉得你冒犯了。」

不够复杂=AI生成？

研究人员从一个中国的教育论坛上获取了91篇托福作文，又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文，用来检测7个被大量使用的GPT检测器。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

图表中的百分比表示「误判」的比例。即，是由人写的，但检测软件认为是AI生成的。

可以看到数据非常悬殊。

七个检测器中，美国八年级学生写的作文被误判的概率最高才12%，还有两个零误判的GPT。

中国论坛上的托福作文被误判的概率基本全部过半，最高误判概率可达76%。

91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的，而91篇中有89篇，都至少被一个GPT检测器误判。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

从上图中我们可以看出，被所有7个GPT误判的托福作文在复杂度（Complexity）上明显低于其它论文。

这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。

因此，研究人员认为，GPT检测器应该多看点儿非母语者写的文章，样本多了，才能消除偏见。

接下来，研究人员把非母语者写的托福作文扔到了ChatGPT里，丰富一下语言，模仿母语者的用词习惯。

同时作为对照组，把美国八年级小孩儿写的作文也扔到了ChatGPT里，把语言简化了一下，模仿非母语者的写作特点。下图就是修正后的新判定结果。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

我们可以发现，情况来了个大掉个儿，丰富了语言的托福作文错判率直线下降，低至3%，最高也不过19%。不像之前基本全部过半的错判率。

与之相反，八年级小孩儿写的作文的错判率直线上升，甚至还有一个GPT检测器的错判率高达99%，基本全错。

因为，文章复杂度这个变量出现了变化。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

这里研究人员就得出了一个结论，非母语者写的东西不地道，复杂度低，容易被错判。

这也就导向了一个技术问题，同时也是一个价值问题。以复杂度来判定AI还是人类是作者，是否合理、全面、严谨。

结果显然不是。

以复杂度为判断标准的情况下，非母语者吃了大亏，因为，他们是非母语者（废话）。

AI润色=人类写的？？

研究者认为，加强语言多样性不仅可以减轻对非母语者的偏见，还能让GPT生成的内容绕过GPT检测器。

为了证明这个观点，研究人员选取了2022-2023年间美国大学申请的入学论文题目，输入到ChatGPT-3.5里，一共生成了31篇假论文。

GPT检测器一开始还挺有效，但是第二轮就不行了。这是因为，在第二轮中，研究人员把这些论文又扔到ChatGPT里润色了一下，用一些文学性的语言提升了文本质量。

这样一来，GPT检测器的准确度就从100%直降到了0%。如下图：

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

经过润色的文章复杂度相应也上升了。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

与此同时，研究人员又用了斯坦福大学145个期末项目报告的题目，让ChatGPT生成摘要。

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

摘要经过润色以后，检测器判断的准确性继续下降。

研究者再次得出结论，润色过的文章很容易被误判，都是AI生成的，两轮就是比一轮强。

GPT检测器？还是欠练

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

言而总之，总而言之，各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。

人的写作也分三六九等，仅靠复杂度判断，不甚合理。

抛开偏见因素不谈，技术本身也亟待改进。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

ai 论文

source：51cto.com

Article précédent：神还原物体复杂、高频细节，4K-NeRF高保真视图合成来了 Article suivant：你的ChatGPT记录还好吗，分享一个超级好用的对话记录工具！

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Microsoft Azure déploiera l'authentification multifacteur obligatoire à partir d'octobre

2024-08-17 07:40:02
Les termes controversés du projet de partenariat de contenu de Google dévoilés : lors de l'introduction d'appareils Pixel, vous ne devez pas introduire de produits d'autres sociétés

2024-08-17 07:32:03
Obtenir la largeur d'un élément en JavaScript

2024-08-17 07:06:32
OPPO Find X8 devrait être lancé en tant que membre le plus compact de la nouvelle série phare Android

2024-08-17 07:05:39
MPG 491CQPX : MSI dévoile un nouveau moniteur de jeu QD-OLED ultra-large de 49 pouces avec un taux de rafraîchissement de 240 Hz

2024-08-17 07:05:32
Offre | L'ordinateur de poche de jeu Asus ROG Ally bénéficie d'une réduction de prix de 150 $ pour un niveau record de 499,99 $ lors de la vente Best Buy

2024-08-17 06:56:37
Anbernic RG40XX V : date de sortie et prix de lancement révélés pour le nouvel ordinateur de poche de jeu rétro

2024-08-17 06:54:02
Les meilleurs émulateurs Nintendo Switch pour Windows

2024-08-17 06:53:31
Problèmes difficiles récursifs utilisant Javascript

2024-08-17 06:53:08
Alienware dévoile un moniteur de jeu unique de 27 pouces AW2725QF avec des modes double résolution et taux de rafraîchissement

2024-08-17 06:52:38

Derniers numéros

L'interface utilisateur de Reactjs n'est pas mise à jour J'apprends React et j'ai acquis quelques bases, j'ai donc utilisé ces connaissances pour r...

Depuis 2023-08-14 17:32:30

0

1

201

Comment utiliser l'API Google Vertext AI Vision pour créer un site Web simple qui convertit les images soumises par les utilisateurs en texte. J'essaie de créer un site Web HTML/CSS/jQuery simple qui utilise l'API Google Vertext AI V...

Depuis 2023-07-21 10:47:08

0

1

224

Où sont les modèles ? IA Hé

Depuis 2019-06-04 10:48:28

0

0

906

大家好，请问在python脚本中怎么用virtualenv激活指定的环境？我是想在py脚本执行时，激活指定的环境。可以做到吗？ PS:我是李世石，我已经弃围棋从AI了，大家多指教！

Depuis 2017-04-18 10:24:27

0

3

593

c++ - 如何使用开源围棋智能算法？我在用Unity3D做一个围棋的游戏，单机的部分需要一个AI找到了开源的Fuego和Pachi，但是下载下来的是一个C/C++的工程应该怎么使用呢？求指导！（我的需求是传过去一个棋...

Depuis 2017-04-17 13:11:11

0

2

493

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal

À propos de nous Clause de non-responsabilité Sitemap: Site Web PHP chinois：Formation PHP en ligne sur le bien-être public，Aidez les apprenants PHP à grandir rapidement！