社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > 国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一

PHPz

发布： 2024-05-07 17:34:01

转载

634 人浏览过

最新国产开源MoE大模型，刚刚亮相就火了。

DeepSeek-V2性能达GPT-4级别，但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。

因此一经发布，立马引发不小讨论。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

通过公布的性能指标来看，DeepSeek V2的中文综合能力超越一众开源模型，同时GPT-4 Turbo、文快4.0等闭源模型同处第一梯队。

英文综合能力也和LLaMA3-70B同处第一梯队，并且超过了同是MoE的Mixtral 8x22B。

在知识、数学、推理、编程等方面也表现出不错性能。并支持128K上下文。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

这些能力，普通用户都能直接免费使用。现在内测已开启，注册后立马就能体验。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

API更是是骨折价：每百万tokens输入1元、输出2元（32K上下文）。价格仅为GPT-4-Turbo的近百分之一。

同时在模型架构也进行创新，采用了自研的MLA（Multi-head Latent Attention）和Sparse结构，可大幅减少模型计算量、推理显存。

网友感叹：DeepSeek总是给人带来惊喜！

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

具体效果如何，我们已抢先体验！

实测一下

目前V2内测版可以体验通用对话和代码助手。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

在通用对话中可以测试大模型的逻辑、知识、生成、数学等能力。

比如可以要求它模仿《甄嬛传》的文风写口红种草文案。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

还可以通俗解释什么是量子纠缠。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

数学方面，能回答高数微积分问题，比如：

使用微积分证明自然对数的底e 的无穷级数表示。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

也能规避掉一些语言逻辑陷阱。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

测试显示，DeepSeek-V2的知识内容更新到2023年。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

代码方面，内测页面显示是使用DeepSeek-Coder-33B回答问题。

在生成较简单代码上，实测几次都没有出错。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

也能针对给出的代码做出解释和分析。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

不过测试中也有回答错误的情况。

如下逻辑题目，DeepSeek-V2在计算过程中，错误将一支蜡烛从两端同时点燃、燃烧完的时间，计算成了从一端点燃烧完的四分之一。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

带来哪些升级？

据官方介绍，DeepSeek-V2以236B总参数、21B激活，大致达到70B~110B Dense的模型能力。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

和此前的DeepSeek 67B相比，它的性能更强，同时训练成本更低，可节省42.5%训练成本，减少93.3%的KV缓存，最大吞吐量提高到5.76倍。

官方表示这意味着DeepSeek-V2消耗的显存（KV Cache）只有同级别Dense模型的1/5~1/100，每token成本大幅降低。

专门针对H800规格做了大量通讯优化，实际部署在8卡H800机器上，输入吞吐量超过每秒10万tokens，输出超过每秒5万tokens。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

在一些基础Benchmark上，DeepSeek-V2基础模型表现如下：

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

DeepSeek-V2 采用了创新的架构。

提出MLA（Multi-head Latent Attention）架构，大幅减少计算量和推理显存。

同时自研了Sparse结构，使其计算量进一步降低。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

有人就表示，这些升级对于数据中心大型计算可能非常有帮助。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

而且在API定价上，DeepSeek-V2几乎低于市面上所有明星大模型。

国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一图片

团队表示，DeepSeek-V2模型和论文也将完全开源。模型权重、技术报告都给出。

现在登录DeepSeek API开放平台，注册即赠送1000万输入/500万输出Tokens。普通试玩则完全免费。

以上是国产开源MoE指标炸裂：GPT-4级别能力，API价格仅百分之一的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

开源指标 moe

来源：51cto.com

上一篇：用于时间序列概率预测的分位数回归下一篇：探讨欧盟就人工智能监管达成协议

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

编码的关键：为初学者释放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 将您的网站连接到数据库

2024-10-13 09:56:31
使用 Python 解决问题：作为初学者，解锁强大的解决方案

2024-10-11 20:58:41
Python 的力量，简单：一种适合初学者的编程方法

2024-10-11 16:53:11
PHP 和社交媒体：将您的网站与世界融为一体

2024-10-11 11:54:51
使用 PHP 的动态图像画廊：在线展示您的作品

2024-10-10 16:21:01
使用 PHP 构建 API 和 Web 服务

2024-10-10 15:18:02
揭秘 Java：为新程序员提供一条清晰、简单的道路

2024-10-10 13:34:01
使用 C 创建游戏和图形：有趣且实用的介绍

2024-10-10 13:26:26
王者荣耀程咬金怎么玩？

2024-10-10 11:38:42

最新问题

页面突然无法拉动 css 或 bootstrap 所以我正在开发一个页面，我昨天做了一部分，效果很好，今天我继续做剩下的部分，一切都很好。当我尝试将其作为普通html页面打开时，CSS或BOOTSTRAP不起作用，仅显示页面文本，...

来自于 2024-04-06 21:58:04

0

1

800

有没有办法强制弹性框中的文本垂直居中，无论我们有什么其他 CSS 代码？我有以下CSS代码，它是我正在开发的网站中使用的更大CSS代码的一部分：.cards-u{display:flex;flex-wrap:wrap;justify-content:c...

来自于 2024-04-06 20:41:51

0

1

518

在网络应用程序中显示版本信息的最佳实践是什么？我正在开发一个网络应用程序。在网络应用程序中显示版本信息的最佳实践是什么？我正在使用语义版本控制，并且我已经有了semver，例如1.2.0但我很好奇在哪里显示它的最佳方式以及如何...

来自于 2024-04-06 19:13:16

0

2

476

状态更新在 Android 上的 React-Native 中不起作用我有一些代码，其中有成对的图像，它们都在可滑动的水平图库中。现在，当您单击两个图像的上部时，图像应该关闭切换，所以我所做的是，我将isImage2Active设置为状态，然后只需切...

来自于 2024-04-06 16:54:10

0

1

410

即使清除后，我的文件输入的值仍然保留正如您在屏幕截图中看到的那样。我选择一个文件，保留弹出窗口而不刷新页面，然后再次打开它，文件输入仍然是我选择的文件。<inputid="fileuploadbann...

来自于 2024-04-06 15:44:52

0

1

384

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1422953
php入门教程之一周学会PHP

4268233
JAVA 初级入门视频教程

2533404
小甲鱼零基础入门学习Python视频教程

507236
PHP 零基础入门教程

862365

最新下载

更多>

网站特效

网站源码

网站素材

前端模板