目录
输入和数据压缩
稀疏方法:重点和变化
修改上下文字符串
动态模型和强烈的推理
首页 科技周边 人工智能 推进AI系统现代体系结构的六种方法

推进AI系统现代体系结构的六种方法

Jun 24, 2025 am 11:15 AM

推进AI系统现代体系结构的六种方法

项目正在遇到内存限制。随着参数进入数十亿和万亿,数据中心必须保持步伐。利益相关者需要密切监视供应商服务门槛。成本仍然是一个持续关注的问题。

但是,正在出现新兴技术,可以处理此内存使用和计算需求,从而使其更易于管理。

今天的创新者如何实现这一目标?

让我们探索。

输入和数据压缩

首先,有输入压缩。

您可以开发一种损失算法来压缩模型,甚至执行压缩版本,而不是完整的版本。这些压缩技术保留了专门的神经网络功能中的空间。

这是苹果机器学习研究网站上发表的论文的摘录:

“最近,几项研究表明,LLM的无训练和无数据压缩(修剪和量化)取得了显着的成功,达到50-60%的稀疏性,并将比特宽度降低到每重量的3或4位,而与未压缩的基线相比,同意性降低最小。”

这只是如何应用这种方法的一个例子。

该Microsoft资源还探讨了提示压缩,这是最大程度地减少或简化系统中数据的另一个方面。

稀疏方法:重点和变化

有时,您可以消除系统设计的一部分以节省资源。

想象一个模型,所有注意力区域都起作用。但是,输入的某些部分本质上可能是空的空间,而其他部分则复杂而重要。该模型应该施加统一的覆盖范围吗?您在高和低注意区域都使用相同数量的计算。

另外,系统工程师可以取消几乎没有关注的令牌,具体取决于其重要性。

在此开发阶段,硬件创新也很明显。更专业的GPU和多核处理器为这种差异化提供了优势,因此值得研究制造商在介绍新一代GPU技术方面所做的工作。

修改上下文字符串

与网络大小相关的另一个主要挑战涉及系统使用的上下文窗口。

如果它们是按序列运行的标准大语言模型,则这些序列的长度很重要。上下文提供了更大的功能,但需要额外的资源。

通过调整上下文,您可以更改系统的“食欲”。这是前面提到的提示压缩资源的一部分:

“尽管更长的提示具有巨大的潜力,但它们也带来了各种问题,例如超过聊天窗口的最大限制,降低上下文保留能力以及增加的API成本 - 在经济上和计算上都是如此。”

在此之后,作者深入研究了解决方案,这些解决方案可能在理论上对不同的修复具有广泛的适用性。

动态模型和强烈的推理

目前获得关注的另外两个关键趋势包括强大的推理系统的兴起,这些推理系统随着时间的流逝从过去的经验中学习,而动态体重的发展,其中输入权重演化而不是保持静态。

两种方法都表明满足开发这些系统的人的设计和工程要求的希望。

还有一个扩散模型,它引入了噪声,分析了噪声,然后将其删除以产生新的生成结果。上周,我们在有关最佳AI策略的帖子中介绍了这一点。

最后,我们可以重新审视传统方法,例如数字孪生。双胞胎在精确的模拟上脱颖而出,但会消耗大量资源 - 如果存在更好的方法,则可以节省相当大的计算功率。

这些是我们一直在听到的一些解决方案,与Edge Computing Concept良好保持一致,其中更多处理发生在网络边缘的端点设备上。微控制器和小组件可以用作处理数据的有效方法,而无需将其传输到集中式云位置。

当我们继续观察人们今天在AI领域所取得的成就时,请考虑所有这些发展。

以上是推进AI系统现代体系结构的六种方法的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

PHP教程
1596
276
埃隆·马斯克(Elon Musk)的自动驾驶特斯拉谎言终于赶上了他 埃隆·马斯克(Elon Musk)的自动驾驶特斯拉谎言终于赶上了他 Aug 21, 2025 pm 04:51 PM

九年前,埃隆·马斯克(Elon Musk)站在记者面前,宣布特斯拉(Tesla)正在大胆地迈向未来,这使每辆新的电动汽车与完全自动驾驶能力的完整硬件相提并论。

浏览器是代理AI未来的关键吗?歌剧,困惑这样认为 浏览器是代理AI未来的关键吗?歌剧,困惑这样认为 Aug 17, 2025 pm 03:45 PM

为什么困惑能确定获得网络浏览器?答案可能在于地平线的根本转变:代理AI互联网的兴起 - 浏览器可能是它的核心。

欧盟自然学分展示了通往市场驱动的亲社会AI的途径 欧盟自然学分展示了通往市场驱动的亲社会AI的途径 Aug 02, 2025 am 11:21 AM

了解欧盟自然信贷框架欧盟的性质信贷计划引入了一个可量化的生物多样性单位系统,旨在表彰和奖励个人和团体积极参与恢复和保存

您是完美的,就像您所说的生成型人工智能 您是完美的,就像您所说的生成型人工智能 Aug 03, 2025 am 11:15 AM

总而言之,“您一样完美的自我”线已经成为一种牢固的咒语,现代AI已准备好向任何想听到过时的陈词滥调的用户兴起。 让我们来谈谈。 对

TORQ和AI4ALL合作伙伴建立更具包容性的AI人才管道 TORQ和AI4ALL合作伙伴建立更具包容性的AI人才管道 Aug 01, 2025 am 11:21 AM

本周,我与Torq首席人民官Karin Ophir Zimet和AI4All首席执行官Tess Posner谈了他们的合作努力以及IT背后的变革性目标。

AI代理类型和内存 AI代理类型和内存 Aug 17, 2025 pm 06:27 PM

随着围绕AI代理商的对话在企业和个人之间继续发展,一个中心主题脱颖而出:并非所有的AI代理人都是平等的。从基本的,规则驱动的系统到高度先进的自适应模型,都有广泛的范围

AI和迷你兽人如何替代动物的测试药物 AI和迷你兽人如何替代动物的测试药物 Aug 01, 2025 am 11:23 AM

它们也是药物测试未来的核心 - 有一天可以使实验室动物过时。1937年,动物测试是法律要求,这是由于涉及污染的抗生素的致命事件而引起的,造成了100 d d。

害怕超级智能AI正在驱使哈佛大学和麻省理工学院的学生退学 害怕超级智能AI正在驱使哈佛大学和麻省理工学院的学生退学 Aug 07, 2025 am 11:39 AM

现在,她因担心“人工通用智能”的到来(一种能够匹配或超过无数领域的人类绩效的理论形式)而抓住了永久性的休假,这可能会导致CI崩溃

See all articles