AI生成的内容的兴起会影响模型培训吗？ - 分析Vidhya-人工智能-PHP中文网

AI生成的内容的兴起会影响模型培训吗？ - 分析Vidhya

Christopher Nolan

发布： 2025-03-19 09:47:09

原创

365 人浏览过

AI内容检测工具的最新扩散具有高精度，这引发了有关其可靠性的问题。克里斯托弗·佩恩（Christopher Penn）强调的一个明显的例子看到了AI探测器将美国独立宣言标记为97％的AI生成 - 明显表明了重大缺陷。这强调了这些工具的不可靠性，这些工具通常依赖于简单的指标和缺陷的逻辑，从而导致不准确和误导性结果。

普林斯顿大学的Creston Brooks，Samuel Eggert和Denis Peskoff的一项研究，“ Wikipedia中AI生成的内容的兴起”提供了进一步的见解。这项研究研究了AI检测工具（例如GPTZERO和双筒望远镜）在识别Wikipedia上AI生成的含量方面的有效性。

AI生成的内容的兴起会影响模型培训吗？ - 分析Vidhya

普林斯顿研究的主要发现：

该研究表明，有关趋势的一种趋势：2024年8月，大约有5％的新英语维基百科文章显示出明显的AI生成含量，与GPT-3.5之前的水平相比大幅增加。尽管在其他语言中发现了较低的百分比，但趋势是一致的。 AI生成的文章通常具有较低的质量，缺乏参考和表现出偏见或自我促进。该研究还强调了检测的挑战，特别是在混合人机含量或大量编辑的文章中。误报仍然是一个重大问题。

AI生成的内容的兴起会影响模型培训吗？ - 分析Vidhya

AI探测器的分析：

该研究比较了GPTZERO（商业工具）和双筒望远镜（开源）。两者都旨在在gpt-3.5数据上提高1％的假阳性率（FPR），但两者都通过较新的数据显着超过了这个阈值。工具之间的不一致强调了个人偏见和局限性。 GPTZERO的Black-Box自然限制了透明度，而双筒望远镜的开源方法则进行了更大的审查。误报的高率带来了现实世界的后果，潜在的损害声誉和侵蚀信任。

AI生成的内容的兴起会影响模型培训吗？ - 分析Vidhya