コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > テクノロジー周辺機器 > AI > 中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

PHPz

リリース： 2023-10-19 11:13:01

転載

1435 人が閲覧しました

GPT-4V はターゲット検出用ですか?ネチズンによる実際のテスト: まだ準備ができていません。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

#検出されたカテゴリには問題はありませんが、ほとんどの境界ボックスが間違って配置されています。

大丈夫、誰かが行動してくれるでしょう！

画像表示能力で GPT-4 を数か月上回った Mini GPT-4 がアップグレードされました ——MiniGPT-v2。

△ (GPT-4V は左側に生成され、MiniGPT-v2 は右側に生成されます)

これは単純なコマンドです: [グラウンディング] の詳細はこの画像で説明します が達成された結果です。

それだけでなく、さまざまな視覚的なタスクも簡単に処理できます。

オブジェクトを丸で囲み、プロンプト単語の前に [identify] を追加して、モデルがオブジェクトの名前を直接識別できるようにします。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

もちろん、何も追加せずに尋ねることもできます~

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

MiniGPT-v2 は MiniGPT によって作成されます- 4 オリジナルチーム (KAUST キング・アブドラ科学技術大学) と Meta の 5 人の研究者によって開発されました。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

前回の MiniGPT-4 は、登場時に大きな注目を集め、一時はサーバーがパンクする事態となりましたが、現在、GitHub プロジェクトのスター数は 22,000 を超えています。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

このアップグレードにより、一部のネチズンはすでにそれを使い始めています~

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

複数のビジュアルタスクのための共通インターフェース

さまざまなテキストアプリケーションの共通インターフェイスとして、大規模なモデルはすでに一般的になっています。これに触発されて、研究チームは、画像の説明や視覚的な質問応答など、さまざまな視覚的タスクに使用できる統一インターフェイスを構築したいと考えています。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

「単一モデルの条件下で、シンプルなマルチモーダル命令を使用してさまざまなタスクを効率的に完了するにはどうすればよいか?」は、チームが解決する必要がある難しい問題となっています。

簡単に言うと、MiniGPT-v2 は、ビジュアルバックボーン、線形層、大規模言語モデルの 3 つの部分で構成されています。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

モデルは ViT ビジュアルバックボーンに基づいており、すべてのトレーニング段階で変更されません。 4 つの隣接するビジュアル出力トークンが ViT から誘導され、線形層を介して LLaMA-2 言語モデル空間に投影されます。

チームは、大規模なモデルで各タスクの指示を簡単に区別し、各タスクの学習効率を向上させることができるように、トレーニングモデル内のさまざまなタスクに一意の識別子を使用することを推奨しています。

トレーニングは主に、事前トレーニング - マルチタスクトレーニング - マルチモード指導調整の 3 つの段階に分かれています。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

最終的に、MiniGPT-v2 は、多くの視覚的な質問応答や視覚的なグラウンディングのベンチマークにおいて、他の視覚言語の一般的なモデルよりも優れたパフォーマンスを示しました。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

最終的に、このモデルは、ターゲットオブジェクトの説明、視覚的な位置特定、画像の説明、視覚的な質問応答、指定された入力からの直接画像解析など、さまざまな視覚的なタスクを完了できます。テキスト、オブジェクト。

中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得

興味のあるお友達は、下のデモリンクをクリックして体験してください:

https://minigpt-v2.github.io/
https://huggingface.co/spaces/Vision-CAIR/MiniGPT-v2

紙のリンク: https://arxiv.org/abs/ 2310.09478

GitHub リンク: https://github.com/Vision-CAIR/MiniGPT-4

以上が中国チームが制作した超人気のミニ GPT-4 のビジュアル機能は飛躍的に向上し、GitHub で 20,000 個のスターを獲得の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

ai モデル

ソース：51cto.com

前の記事：Intel Core 第 14 世代プロセッサー i7-14700K 初レビュー: AI オーバークロック、比類のないパフォーマンス次の記事：Nature が「1 つの原稿に対する複数の投稿」を手放す時が来たという記事を掲載しました。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

コーディングの鍵: 初心者のための C の力を解き放つ

2024-10-13 11:44:01
PHP と MySQL を使用して Web サイトをデータベースに接続する

2024-10-13 09:56:31
Python による問題解決: 初心者プログラマーとして強力なソリューションをアンロックする

2024-10-11 20:58:41
Python Power、簡略化: 初心者に優しいプログラミングのアプローチ

2024-10-11 16:53:11
PHP とソーシャルメディア: ウェブサイトを世界と統合する

2024-10-11 11:54:51
PHP を使用したダイナミックイメージギャラリー: オンラインで作品を紹介します

2024-10-10 16:21:01
PHP を使用して API と Web サービスを構築する

2024-10-10 15:18:02
Java の謎を解く: 新人プログラマーのための明確で簡単な道

2024-10-10 13:34:01
C でゲームとグラフィックを作成する: 楽しくて実践的な入門

2024-10-10 13:26:26
「Glory of Kings」でチェン・ヤオジンを演じるにはどうすればよいですか?

2024-10-10 11:38:42

最新の問題

複数のルートで宣言されたワーカープールは、しきい値を気にせずに CPU 使用率を維持できますか CPU を集中的に使用するタスクを処理するワーカープールを備えた Node.js システムを見つけたいと考えていますが、複数のルートにわたる CPU 使用率については少し混乱してい...

から 2024-04-06 19:54:23

0

1

444

MySQL SQLクエリを使用して別のテーブルのフィールドの合計を計算する次のようなスキーマがあります。属性「user_id」と「username」を持つユーザーテーブルと、属性「customer_id」（user_idのFK）と「finalPrice...

から 2024-04-06 19:39:29

0

1

441

Web サイトから入力要素を取得できませんそこで、Twitter から入力要素を取得しようとしていますが、それを実行すると、ノードターミナルでこのようなエラーが表示され続け、その結果、このコードによって作成されたブラウザ...

から 2024-04-06 18:59:57

0

1

442

テンプレートのメソッドで定義された変数の使用 Vue (v3 ではなく v2) を使用するのは初めてで、テンプレート内 (メソッド内で定義された) で変数を使用しようとしています。私の簡略化されたコード: <templa...

から 2024-04-06 18:10:25

0

2

513

SCSSを使用してデフォルト値とCSS変数を生成するウェブサイトのスタイリングを実装しています。レガシーサポートの理由から、少なくともしばらくの間は IE11 をサポートする必要があります。ワークフローと私の健全性の理由から、私は...

から 2024-04-06 17:46:54

0

1

355

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート