社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果

WBOY

發布： 2024-03-08 15:58:21

轉載

480 人瀏覽過

大模型競賽，又殺出一匹黑馬－

Inflection-2.5###，由DeepMind聯創Mustafa Suleyman的大模型新創公司打造。

只用40%的運算資源訓練，表現就超過了GPT-4的九成，尤其擅長程式碼和數學。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果

而早期的Inflection模型，訓練時只消耗了4%的運算資源，就達到了GPT-4表現的72%。

以Inflection模型為基礎，該公司還推出了網頁端對話機器人Pi，主打“高情商”和“個人化”，也支援中文。

自誕生以來，Pi的最高日活達到了100萬，累計產生了40億條訊息，平均對話時長來到了33分鐘。

而隨著這次基礎模型的升級，Pi也迎來了它的新版本。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

那麼，Inflection，或者說Pi，表現到底有沒有那麼強，量子位元進行了一番實測。

無需登入即可使用

開啟Pi的頁面，映入眼簾的是這樣一個極簡介面，而且還可以不用登錄，直接點選Next。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

連續Next幾次後，輸入希望Pi稱呼我們的方式。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

之後是選擇聲音和推薦主題，直接跳過就可以了，然後就進入正式的聊天介面了。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

簡單測試發現，Pi支援中文對話，既然如此那就先把弱智吧Benchmark給安排上。

第一題，老鼠生病了可以吃老鼠藥治好嗎，Pi成功解答。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

再來一道「陷阱」題，這次依舊沒有上當。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

兩道問題過後，雖然沒有出現什麼戲劇性效果，但看起來對中文也是有一定的理解了。

接下來就重點看看官方宣稱「尤其擅長」的數學和程式碼能力。

首先是一道涉及動態規劃的程式設計題目。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

Pi給出的程式碼成功解決了這個問題，並且配有清晰的解釋。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

接下來再提升難度看看，讓其分析一個數字的階乘中結尾有多少個0。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

Pi給出的程式碼不僅正確，而且簡潔高效，運行速度超過了LeetCode上73.8%的用戶。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

最後再來增加難度，以一個47.5%通過率的題目結束程式碼部分的測試。

40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果圖片

看完程式碼，再來測試Pi的數學能力怎麼樣，讓它做關於導數的題目：

求出函數f(x)=x³ 2x²-1的極值點

#解完全正確，而是十分詳細。

當然要想數學好，邏輯思維是必不可少的，所以我們在常規的數學題之外，又用一道經典的題目考驗了一下的Pi邏輯思維，結果還不錯。

透過Pi的表現，可以看出背後的Inflection-2.5模型的確可圈可點。

而從官方自己公佈的測試數據來看，無論是綜合能力還是各個子項，Inflection-2.5的表現都緊跟著GPT-4。

以數學和程式碼為例，Inflection-2.5在MATH、HumanEval等測驗中都比1.0版本都有大幅飛躍。

在這些常規的資料集之外，Inflection還挑戰了匈牙利高考數學試題和GRE物理測試，結果幾乎與GPT-4打成平手。

比較「刁鑽」的，還有人專門用大模型難以理解的問題建構了一個BIG-Bench資料集，而Inflection-2.5挑戰了其中的Hard子集，結果和GPT-4的差距不到一分。

那麼，Inflection-2.5的背後，是怎樣的公司呢？

DeepMind聯創大模型創業

這家公司名叫Inflection AI，由DeepMind聯創Mustafa Suleyman等人於2022年創立，目前共有70餘人。

同樣來自DeepMind的，還有資深研究員Karen Simonyan，現擔任Inflection AI的首席科學家。

此外，LinkedIn聯創Reid Hoffman也參與了Inflection AI的創立。

創立以來，Inflection AI已經獲得了來自英偉達、微軟、比爾蓋茲等巨頭的共計15億美元的融資。

目前，基於Inflection的Pi還是免費的，但CEO Suleyman也表示，一直用愛發電不現實，長久地看以後還是要收費。

想要體驗的朋友，可能要抓緊時間了~

傳送門：https://pi.ai

以上是40%算力訓練效果比肩GPT-4，實測DeepMind聯創大模型創業新成果的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

模型訓練

來源：51cto.com

上一篇：挑戰OpenAI的新模型免費上線，40%計算量表現逼近GPT-4 下一篇：人工智慧驅動的測試自動化的七個好處

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1421155
php入門教程之一週學會PHP

4264798
JAVA 初級入門影片教學

2515455
小甲魚零基礎入門學習Python影片教學

506139
PHP 零基礎入門教學

861248

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板