高级AI型号的CO₂回答相同问题时的排放量比更常见的LLM
根据最近的一项研究,我们试图使AI模型的功能越精确,其碳排放量就越大 - 某些提示产生的二氧化碳的碳含量比其他提示高出50倍。
诸如Anthropic的Claude,OpenAI的O3和DeepSeek的R1之类的推理模型是高级大语言模型(LLMS),与早期版本相比,分配了额外的时间和计算资源以提供更准确的响应。
但是,尽管取得了令人印象深刻的结果,但在解决复杂问题方面,这些模型也表现出严重的局限性。现在,研究人员发现了另一个缺点 - 他们的碳足迹。他们的发现于6月19日发表在《通讯期刊》杂志上。
研究负责人Maximilian Dauner说:“查询训练有素的LLM的环境影响受其推理方法的严重影响,其明确的推理方法可显着增加能源使用和碳排放。” “我们观察到,基于推理的模型发出的co co级最多比为较短答案优化的模型高出50倍。”
在响应提示时,LLMS通过将其分为令牌来处理语言 - 单词段 - 在由神经网络处理之前转换为数值序列。这些网络是使用确定出现特定模式可能性的训练数据来完善的。基于这些概率,它们会产生响应。
为了提高准确性,推理模型采用一种称为“经过思考链”的方法。这涉及将复杂的问题分解为较小的逻辑步骤,类似于人类如何解决同一问题。
相关: AI经常“幻觉”,但是有一种方法可以解决
注册了《现场科学日报》,尽管如此,这些模型比标准LLM所需的精力要多得多,这可能会对希望实施它们的企业和用户构成经济挑战。尽管现有关于扩大AI使用的环境后果的研究,但不同模型之间碳足迹的直接比较仍然有限。
推理的成本
为了评估各种模型的批量排放,这项新研究背后的研究人员提出了1,000个问题,从多个主题到14个LLM。这些模型的规模从70亿到720亿个参数不等。
这些计算是使用NVIDIA A100 GPU上的Perun框架(评估LLM性能和功耗的评估)进行的。然后,假设每个千瓦时产生480克CO₂ ,则团队将能耗转化为Co₂排放。
他们的发现表明,平均每个问题的推理模型平均产生了543.5个令牌,而简洁模型仅37.7个令牌。这些额外的令牌意味着增加计算工作量,从而为更精确的推理模型带来了更高的排放。
最准确的模型是720亿个参数Cogito模型,该模型正确回答了84.9%的基准问题。但是,Cogito发射的CO₂发出的CO₂比旨在产生更短的答案的类似尺寸的模型高三倍。
Dauner说:“目前,我们观察到LLM技术中准确性和可持续性之间的独特权衡。” “没有一个模型将排放量低于500克的同等含量(释放的总温室气体)能够正确回答1,000个问题的精度超过80%。”
以上是高级AI型号的CO₂回答相同问题时的排放量比更常见的LLM的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undress AI Tool
免费脱衣服图片

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Stock Market GPT
人工智能驱动投资研究,做出更明智的决策

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Openai推出了ChatGptparents的父母控制措施现在可以与青少年的帐户联系起来,限制功能并获得警报,如果将情绪困扰检测到危险的对话将通过经过专门调整的模型来处理,以支持使用的特殊调谐模型

Notebooklm由Google Now具有新的音频概述格式:简短,批评和辩解的添加物带来活泼的互动和结构化讨论来上传内容,增强功能使工具更接近互动,播客风格的AI

微软发出了警告,警告网络潜伏期,影响了红海中的海底电缆的中断,影响了Azure服务,迫使公司通过替代路线重定向流量。

GPT-5的最新版本席卷了世界。 Openai的最新旗舰模式收到了不同的评论,而有些人赞扬其能力,而另一些则强调了其缺点。这让我感到奇怪:是GPT-

联邦调查局发布了一项关键的安全警报,警告说,臭名昭著的黑客集体被称为盐台风正在加强其在全球范围内的网络运营。根据该机构,这个中国国家支持的集团一直在广泛进行

如果您在五年前告诉一个充满风险的保险高管的房间,即将近一半的英国消费者欢迎AI的健康建议,那么您会受到严重的怀疑,即使不是完全笑声。我们的最新报告S

在2025年,多款可直接从终端访问的AI编程助手相继发布。Codex CLI、Gemini CLI 和 Claude Code 是其中一些热门工具,它们将大型语言模型嵌入到命令行工作流中。这些编程工具能够通过自然语言指令生成和修复代码,功能十分强大。我们对这三款工具在不同任务中的表现进行了详细评测,以确定哪一款更具实用性。每款助手都基于先进的AI模型,例如 o4-mini、Gemini 2.5 Pro 或 Claude Sonnet 4,旨在提升开发效率。我们将三者置于相同的环境中,使用具体指标
