需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

WBOY
リリース: 2023-06-12 19:24:10
転載
836 人が閲覧しました

このスムーズな操作プロセスは、専門家にとってまさに朗報です。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

最近、オートメーション研究所、中国科学院、香港理工大学、その他の機関の研究者らが、 「Table AI Assistant」「SheetCopilot」このインテリジェント エージェントは、ユーザーの指示に基づいてテーブルを操作するためのソリューションを生成し、特定のソフトウェア (Excel、GoogleSheets など) 上で実行できます。 SheetCopilot は、複数の表処理ソフトウェアに素早く接続でき、複数の表の操作、チャートの描画、ピボット テーブルの生成をサポートしており、複数の分野で表データの処理と視覚化を強化し、汎用的なインテリジェント アシスタントの実現に向けた重要な一歩を踏み出すことが期待されています。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

ウェブサイト: https://sheetcopilot-demo.github.io/

論文: https://arxiv.org/abs/2305.19308

次の例を通じて、SheetCopilot がどのように作業効率を大幅に向上させるかを最初に体験してみましょう。

あなたは新人で、ある日、上司から販売データの分析を手伝ってほしいと頼まれたとします。フォームを受け取ってそれを見ると、何千行ものデータに目がくらむでしょうが、どこから始めればよいのかわからないので、確認しながら確認していきます。

まず、各製品の名前を抽出し、式を使用して各製品の収入を合計します。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

20 分以上作業した後、SUMIF は「#NAME?」エラーを報告し続けたので、上。

ネットで検索を続けたところ、ピボットテーブルという便利なツールがあることを知り、2回目のチャレンジを開始しました。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

#最終的に完了するまでに 20 分以上かかりました。プロセス全体で 1 時間近くかかり、効率は満足のいくものではありませんでした。上司が新しいフォーム処理タスクを与えるたびに、これまでの経験はほとんど役に立たないため、Web サイトを表示して最初から処理することしかできません。

あなたの同僚は SheetCopilot を使用しており、あらゆる種類の奇妙な要件をわずか数秒で完了できます :)。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

SheetCopilot がとてもスムーズなので試してみると、絵を描くのが簡単でした。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

SheetCopilot を使用すると、画面を超えるデータを選択するためにテーブルの半分にマウスをスライドさせる必要がなくなりました。数千行を簡単に選択できます。データは複数のテーブル間を移動します。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

SheetCopilot が提案された理由

長い間、人々は次のような人材を求めてきました。専門的な経験がなくても熟練し、複雑なソフトウェアを使いこなす能力。私たちの多くは、PhotoShop の煩雑なインターフェースの操作方法が分からない、データを分析したいがピボットテーブルの高度な機能を知らない、歯車を描きたいが Solidworks について何も知らない、といった状況に陥ったことがあるでしょう。

強力な言語理解および生成機能を備えた大規模言語モデル (LLM) の出現により、このビジョンはこれまで以上に現実に近づきました。 LLM を誘導してさまざまなソフトウェアを使いこなすことができれば、LLM のほぼ無限の可能性が解放され、人間の生産性が前例のない高みに達することが可能になります。

この記事では、スプレッドシートは一般的で多用途な制作ツールであるため、この調査を実施するための理想的な基盤であることを指摘します。しかし、テーブル操作はさまざまな課題に直面しており、ユーザーが絶えず変化するタスク要件に対処するのに十分なテーブル処理スキルとプログラミング スキルを習得することは困難です。

豊富なソフトウェア制御スキルを習得したジェネラリスト AI エージェントがあれば、オフィスの効率が大幅に向上するだけでなく、企業の出力も大幅に加速されます。 SheetCopilot の登場はまさに人々のビジョンにぴったりです。

SheetCopilot のハイライト

1. テーブル処理の一般的なニーズをカバーします

#SheetCopilot は、テーブル操作のほぼすべての典型的なタスクを処理し、さまざまなチャート生成タスクを優れた方法で完了できます。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

# 販売データ分析

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

実験チャートの描画

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

##複雑な数式の計算

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

条件付き書式設定の適用

2. VBA ベースのアプローチを超えて

#SheetCopilot は、GPT-3.5 を使用して VBA コードを生成して実行する方法よりも優れており、生成されたソリューションは後者よりも大幅に優れており (下図を参照)、SheetCopilot は強力な AI 補助ツールになることが期待されています将来のデータ処理担当者向け。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインですそれだけでなく、難解な VBA コードと比較して、SheetCopilot によって生成されたソリューションには理解しやすい手順が含まれていますこれにより、新しいプログラミング言語を学習したり、デバッグに苦労したりする煩わしさがなくなります。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

#左の図: 長い VBA コード、右の図: SheetCopilot のシンプルで理解しやすいソリューションプラン。

#3. 快適な使用エクスペリエンス

SheetCopilot の Whenネットワーク接続が安定しているため、複数のテーブルの組み合わせ操作を約 10 ステップ行うだけで、数千の行と数十の列を持つテーブルのタスクを迅速に完了できます。これにより、ユーザーの疲れた目から解放されるだけでなく、Web サイトを見つけて手順を 1 つずつ試す無駄な時間を節約し、VBA の学習コストも節約できます。

メソッドの原理

この記事では、テーブル操作に必要なコア関数を一連の仮想 API (アトミック操作と呼ばれます。以下の図を参照) に抽象化します。これらの関数は、LLM A としてソリューションを生成するために使用されます。アプリケーション ソフトウェアとの対話のためのブリッジ。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

最も簡単な方法は、LLM の 1 つのクエリでタスクのすべてのステップを生成することです。しかし、タスクの複雑さが増すにつれて、後続のステップは前のステップの実行結果に依存するようになり、この種の開ループ制御では正しい結果を得ることが困難になります。たとえば、フィルタリング後にデータが表示される場所を決定できない場合、LLM は操作の範囲を決定することが困難になります。

効率的な閉ループ制御を実現するために、SheetCopilot はソフトウェア ステータスのフィードバックと外部のアトミック操作ナレッジ ベースに基づいてソリューションを最適化し、成功率と効率を向上させます。

評価方法

この記事では、高品質の評価ベンチマークを提案します。次のワード クラウドに示すように、このベンチマークのタスクにはさまざまな定式化があり、豊富なアトミック操作が含まれます。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

このベンチマークは、次のメトリクスを採用しています。成功率 (高いほど良い):

  • Exec@1: 生成されたタスク ソリューションの実行成功率。
  • Pass@1: タスクの合格率、つまり、実行後に参照回答と一致するソリューションの割合。

このベンチマークでは、次の効率指標も考慮されています (低いほど優れています):

  • A50: ミッション要件を満たします。解のステップ数を参照解答の最小ステップ数で割って、すべての計算の中央値が取られます。
  • A90: 計算方法は上記と同じですが、すべての計算結果の 90 パーセンタイルが取得されます。この指標は、アクション数の極値分布を反映します。
#実験結果

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

##表 1: SheetCopilot データ セット GPT の比較3.5-Turbo、GPT-4、Claude、および VBA の生成方法。

当然のことながら、GPT-4 はタスク要件を満たし、効率が最も高いソリューションの割合が最も高く、GPT-3.5-Turbo がそれに僅差で続き、クロードが優勝しました。最も多い回数ですが、GPT-3.5-Turbo にも近いです。

注目すべき結果の 1 つは、ユーザーの指示を VBA コードに変換して Excel 上で実行する方法と比較して、SheetCopilot が優れた成功率を達成したことです。これは、SheetCopilot がソフトウェア インテリジェント制御を私たちに大きく近づけ、コンピューターに命令するプログラムを作成できないユーザーでも、日常のコミュニケーションを通じて複雑なタスクを完了できるようにすることを意味します。

以下の各細分カテゴリの指標を通じて、これら 3 つの LLM それぞれの長所と短所を見てみましょう。

需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインです

GPT-3.5 と GPT-4 は、管理 (並べ替えやフィルタリングなどのテーブル管理操作) と入力および入力を簡単に解決します。操作(データ入力と操作)タスクは、両方とも実行率 100% を達成しました。さらに、3 つの LLM はそれぞれ、異なるタスク カテゴリで最高の効率を示しました。この興味深い発見は、各 LLM には独自の利点があり、GPT-4 が他のモデルを上回るパフォーマンスを発揮できないことを示しています。

結論

SheetCopilot は LLM を使用して、テキスト インターフェイスを介して認識、推論、意思決定の閉ループを形成し、効率的なスプレッドシート制御を実現し、よりスマートなソフトウェア制御を促進します。次のレベルに進むことは、ジェネラリストエージェントに興味のある研究者に新たなインスピレーションをもたらします。

以上が需要を管理し、大規模なモデルを使用して問題を解決する: チャート処理アーティファクト SheetCopilot はオンラインですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!