社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

PHPz

發布： 2023-10-19 11:13:01

轉載

1433 人瀏覽過

GPT-4V來做目標偵測？網友實測：還沒準備好。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

雖然偵測到的類別沒問題，但大多數邊界框都錯放了。

沒關係，有人會出手！

那個搶跑GPT-4看圖能力幾個月的迷你GPT-4升級啦－MiniGPT-v2。

△（左邊為GPT-4V生成，右邊為MiniGPT-v2生成）

而且只是一句簡單指令：[grounding] describe this image in detail就實現的結果。

不僅如此，還輕鬆處理各類視覺任務。

圈選一個物體，提示字前面加上 [identify] 可讓模型直接辨識出物體的名字。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

當然也可以什麼都不加，直接問~

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

#MiniGPT-v2由來自MiniGPT-4的原班人馬（KAUST沙烏地阿拉伯阿卜杜拉國王科技大學）以及Meta的五位研究員共同開發。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

上次MiniGPT-4剛出來就引發巨大關注，一時間伺服器被擠爆，如今GItHub專案已超22000 顆星。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

此番升級，已經有網友開始用上了~

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

多視覺任務的通用介面

大模型作為各文本應用的通用介面，大家已經司空見慣了。受此靈感，研究團隊想要建立一個可用於多種視覺任務的統一介面，例如圖像描述、視覺問題解答等。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

「如何在單一模型的條件下，使用簡單多模態指令來高效完成各類任務？」成為團隊需要解決的難題。

簡單來說，MiniGPT-v2由三個部分組成：視覺主幹、線性層和大型語言模型。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

此模型以ViT視覺主幹為基礎，所有訓練階段都保持不變。從ViT中歸納出四個相鄰的視覺輸出標記，並透過線性圖層將它們投影到 LLaMA-2語言模型空間。

團隊建議在訓練模型為不同任務使用獨特的標識符，這樣一來大模型就能輕鬆分辨出每個任務指令，還能提高每個任務的學習效率。

訓練主要分為三個階段：預訓練－多任務訓練－多模式指令調整。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

最終，MiniGPT-v2 在許多視覺問題解答和視覺接地基準測試中，成績都優於其他視覺語言通用模型。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

最終這個模型可以完成多種視覺任務，例如目標物件描述、視覺定位、圖像說明、視覺問題解答以及從給定的輸入文字直接解析圖片對象。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

有興趣的朋友，可戳下方Demo連結體驗：

https://minigpt-v2.github.io/
https://huggingface.co/spaces/Vision-CAIR/MiniGPT-v2

論文連結：https://arxiv.org/abs/2310.09478

GitHub連結：https://github.com/Vision-CAIR/MiniGPT-4

以上是超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

ai 模型

來源：51cto.com

上一篇：英特爾酷睿第14代處理器i7-14700K首度評測：AI超頻，性能無敵下一篇：Nature發文：該放開「一稿多投」了

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

編碼的關鍵：為初學者釋放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 將您的網站連接到資料庫

2024-10-13 09:56:31
使用 Python 解決問題：作為初學者，解鎖強大的解決方案

2024-10-11 20:58:41
Python 的力量，簡單：一種適合初學者的程式設計方法

2024-10-11 16:53:11
PHP 與社群媒體：將您的網站與世界融為一體

2024-10-11 11:54:51
使用 PHP 的動態圖像畫廊：在線展示您的作品

2024-10-10 16:21:01
使用 PHP 建立 API 和 Web 服務

2024-10-10 15:18:02
揭秘 Java：為新程式設計師提供一條清晰、簡單的道路

2024-10-10 13:34:01
使用 C 創建遊戲和圖形：有趣且實用的介紹

2024-10-10 13:26:26
王者榮耀程咬金怎麼玩？

2024-10-10 11:38:42

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422942
php入門教程之一週學會PHP

4268194
JAVA 初級入門影片教學

2533285
小甲魚零基礎入門學習Python影片教學

507233
PHP 零基礎入門教學

862361

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板