Kaifu Lee: 大規模な AI モデルは逃すことのできない歴史的な機会です-AI-php.cn

Kaifu Lee: 大規模な AI モデルは逃すことのできない歴史的な機会です

「将来、最も革新的な AI2.0 アプリケーションは AI-First になると思います。」と Sinovation Ventures 会長の Li Kaifu 氏はスピーチで述べました。

AI ファーストアプリケーションとは何ですか?これは、大規模なモデルなしでは存在できないアプリケーションを指します。

5月28日、Sinovation Venturesの会長兼最高経営責任者（CEO）であり、Sinovation Ventures人工知能工学研究所の所長でもある李海福氏は、2023年中関村フォーラムで「AI1.0からAI2.0への新たな機会」と題した講演を行った。

講演では、大規模モデル開発の商業的価値、将来のアプリケーションエコロジーに対する AI2.0 の影響、および将来のアプリケーションの展望など、大規模モデルの開発に疑問を抱く人々に対して独自の意見を述べました。中国では大型モデルの開発を行っております。

彼は、不完全な大型モデルであっても数十兆ドルの商品価値があると述べました。将来の AI2.0 市場は、モバイルインターネットの 10 倍の規模になると予想されており、巨大企業、中小企業、新興企業の 3 つのレベルに対応します。私たちは、大手、中小、零細の革新的企業が共に発展できる「イノベーション複合体」の形成を期待しています。

以下はリー・カイフー氏のスピーチ全文（一部抜粋）

「最近の AI 2.0 を投資機関の視点から見る機会ができてとてもうれしいです。私は投資機関の中で AI について一番詳しいかもしれませんし、AI についても一番知っているかもしれません」 AI分野への投資。過去 2 年間で AI2.0 と大規模モデルの登場により、過去 5 年間で関連する論文をほぼすべて読むようになったので、非常に興奮しています。 Sinovation Ventures の投資チームとテクノロジーチームもこの分野を研究しており、OpenAI、Google、Microsoft の最新開発について学ぶために米国まで行きました。

今日紹介したいのは、Sinovation Ventures が投資している企業やその他の実際のビジネスではなく、最近よく質問される AI2.0 大型モデルに関するもので、比較的簡単に皆さんの役に立つように説明できればと思います。

大型モデルのビジネス価値

AI2.0とは何ですか? Sinovation Ventures の観点では、経済的価値を生み出す投資の観点から、AI の開発段階は AI1.0 と 2.0 に分けられます。ディープラーニングはAlphaGoを経てAI1.0へと発展し、その後様々な業界で広く活用され価値を生み出しました。

1989 年以来、AI1.0 の開発が始まりました。しかし、近年、大型モデルによって解決できるいくつかの困難に直面しています。 AI1.0で直面するボトルネックは何ですか?大規模なモデルがなかった当時、ある分野に AI を適用するには、その分野のデータを収集、クリーニング、ラベル付けし、それを使用してモデルを調整する必要がありました。非常に高価です。

Douyin、Alibaba、Baidu のような大企業の場合は問題ありません。彼らはあまりにも多くのデータを収集しており、お金を稼ぐ機会がたくさんあります。しかし、銀行や保険会社、会社や工場の場合は、膨大な量のデータが発生するでしょう。 AI アプリケーションの実装には問題があり、そのコストは耐え難いものになるでしょう。

大規模モデルの利点は、一度完全にトレーニングしてから、転移学習や微調整を通じて適用できることです。 AI 1.0時代では、各アプリケーションは孤立していましたが、大規模モデルの出現により、大量のデータを使用して基本的な大規模モデルを一度にトレーニングし、このモデルを使用して必要なアプリケーションを調整できるようになりました。、したがってコストが大幅に削減されます。たとえば、「Xiao Ai」のようなスピーカー製品は、「Xiao Ai」が理解できる分野から一歩外に出ると混乱するかもしれません。スマートスピーカーは実際にはそれほどスマートではないことがわかります。再生などの一部の機能しか実行できません。 music. 、天気を確認するなどの簡単な事も出来ない事も沢山あります。しかし、ChatGPT のようなものを組み込むと、知識の蓄えが活性化され、会話モードを調整すれば、非常に優れた会話ロボットになる可能性があります。

非常に完璧な大規模モデルはビジネスにおいても大きな価値があり、数兆規模に達することもあります。それは人間がどのように協力するか、いわゆるHuman in the loopにかかっています。

記者は AI を使用して執筆を支援し、弁護士は AI を使用して訴訟を支援します。最終的には、人間が記事や訴訟の責任を負い、AI が下書きだけを行う限り、最終的には何も起こらないでしょう。問題。人工知能が間違いを犯す可能性があることを人々が学んだことを考慮し、誤った情報による被害からユーザーを守るために、人工知能がユーザーに直接サービスを提供するのではなく、最初は草稿の提供のみを許可します。

AIは、1,000件の記事を読んで新たな要約を作成したり、過去1万件の過去の訴訟を読んで要約を作成したりするなど、膨大なデータベースの利点を最大限に発揮し、質の高い要約を提供します。あるいは、弁護士が有益な情報を入手して、AI が間違いを犯したかどうかを人々にチェックさせることもできます。

また、一部の分野では、人々は AI の間違いを実際には気にしていません。たとえば、エンターテイメントアプリケーションでは、ゲームのヒーローになってひげが長くても短くても無害です。間違った文を言っても構いません、とにかくゲーム内ですべて作られています。実際、多くのアプリケーション分野ではこのような不完全な大規模モデルが許容されており、この事実の分析に基づいて、AI は生産性アプリケーションにおいて大きな可能性を秘めています。もちろん、ニュース検索や政府のウェブサイト、医療や教育関連など、ミスが許されない非常に重要な分野もあり、これらの分野は非常に難しいため、将来的には大規模なモデルミスの問題を解決する必要があります。解決しました。

AI2.0 はアプリケーションエコシステムを書き換えます

現在の Word、PowerPoint、Excel、Photoshop などのアプリケーションはすべて AI ラージモデルを使用して書き換えられ、書き換え後のユーザーエクスペリエンスは変化し、ビジネスモデルさえも変化することは十分に想像できます。プッシュ広告のように、間違ってもコストがそれほど高くない分野もありますが、広告が間違ってプッシュされても害はありません。今日、私たちは誤って多くの広告を押しつけられており、テレビやウェブサイトをオンにしたときに受信する広告はターゲットを絞ったものではありませんが、AI は、時には間違いを犯すこともありますが、広告をよりターゲットを絞ったものにすることができます。

ですから、上記の分野だけでも、数十兆ドルの価値があるチャンスだと思います。もちろん、そのナンセンスの頻度を減らすために努力を続ける必要があります。ここでは、トレーニング前のデータからトレーニングの調整、その後の処理に至るまでの完全な方法のセットと、いくつかの早期警告および一時的な迅速な修正方法を示します。 . これらの組み合わせを一緒にすれば、できると信じています。

生産性は最大の機会です。 AI2.0には大きく分けて3つのエコシステムがあり、我々は基本モデルとして下層の話をすることが多いのですが、今話したのは原稿を書く、訴訟を書く、絵を描く、写真を切り抜くなどのお手伝いをする最上位のアプリケーション層です。また、モデルを最適化し、大規模なモデルをより効率的に適用できるように転移学習を実装するためのさまざまなツールを提供する中間層もあります。中間層は 2 つの部分に分かれており、1 つは基本モデル層から外側に拡張するもので、たとえば、モデルが非常に大きい場合、推論が必要になったときにモデルを縮小したり、大きなモデルを小さなモデルに変換したりすることができます。特定の分野について?、あるいは、ナンセンスの頻度を減らすことについて先ほど述べた問題についても同様です。

もう 1 つは、アプリケーション層からの調整です。たとえば、Photoshop を書き換えたい場合、一文を言うだけで絵が出てきますが、さらに進んで「こうしたいです」と言う必要があるかもしれません。虹の色を変更したり、内部の観客の男女比を調整したりできます。これには、大きなモデルの賢明な切断といくつかのオブジェクトの理解が必要です。これらは実際には大きなモデル自体には直接関係ありませんが、これらの機能がなければ、絵を描きたい人にPhotoshopをプッシュすることはできません。

中間層は実はとても重要なのですが、中間層というと何を思い浮かべますか?たとえば、Windows、Android、Apple が提供する中間層の目的は非常に単純で、アプリケーション開発のコストを最小限に抑えることです。この方法によってのみアプリケーションの数が増加し、ユーザーがさらに多くのアプリケーションを持ち込むという好循環が生まれます。

前回のスピーチで、プラットフォームとアプリケーションのモデルである AI 2.0 時代の到来について言及しました。このプラットフォーム技術が習得されれば、あらゆる分野が変わります。たとえば、ゲームを作る場合、背景、小道具、服、さらにはすべてのコードを含むすべてのキャラクターの作成が最終的には AI を使用して作成されることをはっきりと感じられます。プレイしたいゲームをメモしておけば、みんなで言葉を使ってゲームを紹介し合い、数秒でプレイできます。

先ほどの電子商取引や広告も一例ですが、個人のニーズ、認知、教育レベル、買い物習慣に合わせて広告や写真をカスタマイズすることで、購買意欲を最大限に高めることができます。もちろん、ここには規制の問題がありますが、書いた内容が虚偽であったり、ユーザーを傷つけたりした場合はどうなりますか?これには依然として法的な監督が必要ですが、これら 2 つの例を皆さんに理解していただけると幸いです。この大きなモデルは実際には単なる質問と回答のエンジンではありません。すべての APP の生態系を変えました。今日私たちが使用しているすべての生態系を書き換えることになります。

大型モデルの時代に AI ファーストになるために

ビッグモデルは人工知能を改革するだけでなく、プラットフォームのような巨大なギャップももたらします。すべてのアプリケーションの中で、AI-First は最も重要なアプリケーションになります。ただ、このアプリケーションには AI が搭載されていないと機能しません。たとえば、現在使用されている Meituan、Didi、Douyin などのモバイルファーストアプリケーションの一部は、携帯電話が 24 時間身体に装着されているという前提に基づいてアプリケーションを開発しています。使用済み。

これらの企業は、携帯電話がもたらす機能を最大限に活用し、携帯電話に適応した新しいアプリケーションを開発し、私たちがタクシーの配車やテイクアウトなどの活動を完了できるように地理的な位置を取得しました。その後、Sina、NetEase、Douban などの他の企業も、モバイルインターネット時代には非常に好調でしたが、PC アプリケーションのみを移行したため、同じような爆発的な成長には至りませんでした。当時、ビジネスを始めたり、モバイルインターネットに投資したりしたい場合は、モバイルである必要があるアプリを選択する必要がありました。したがって、今日、人工知能の分野でビジネスを始めたい場合は、以下の機能を備えたアプリを作成する必要があります。人工知能を持つこと。

簡単に言えば、AI ファーストとは、大規模なモデルがなければアプリケーションがまったく役に立たなくなることを意味します。この種のアプリケーションは、今日私たちが行う必要があるものであり、将来的にはこの時代の寵児となるでしょう。そのユーザーエクスペリエンス全体は、コンピューター言語の学習を強制するものではなく、人間の言語でコミュニケーションする方法を学ぶことに近いものになるかもしれません。。

もちろん、虚偽の情報やプライバシー保護などの問題を含め、まだ多くの課題があることは誰もが知っています。監督の強化が必要であることを強調するとともに、これらの問題を解決するにはさらなる技術も必要であると強調した。監視やテクノロジーを単独で使用するだけでは決して十分ではなく、2 つの方法を組み合わせる必要があります。

最近、市場では「海外の大きなオープンソースモデルを使って中国版OpenAIを作ればいい」「大きなモデルを作る必要はない、小さなモデルで十分だ」といった物議を醸す声が上がっています。、「大型モデルは高価で時間がかかる」「皆さん、入場券があるのは巨人だけです」「中国には大型モデルのスタートアップが多すぎます」など。私の意見では、オープンソースは非常に重要であり、オープンソースを持たない大学の起業家がまだおり、その力を得るのが難しいため、中国のテクノロジーは将来的に間違いなくオープンソースを必要とします。

しかし、インターネット上で一部の人が言うことを信じてはなりません。私は GPT-4 などのオープンソースモデルをトレーニングに使用しましたが、そのモデルが GPT-4 と同じくらい優れていることが突然わかりました。はい、これは完全に間違っています。

まず、オープンソースモデル自体に制限がある可能性があるため、大規模なモデルをトレーニングすると、大量の GPU が必要になり、コストが比較的高くなります。オープンソースモデルは基本的にモデルの上限を設定し、内部で調整調整と学習作業を行います。これらのタスクがモデルにもたらす改善は、上限によって決まります。 GPT-4のような天井を最初から目標にしている場合、それ以上の大きなモデルを作ることは不可能です。第 2 に、多くの人が GPT-4 を使用してオープンソースモデルをトレーニングしていますが、GPT-4 が今後もオープンで使用できるかどうかは保証できません。海外でトレーニングしたモデルを国内で使用するために微調整するのは危険です。国内外の文化、習慣、法律や規制は異なるため、米国でトレーニングされた一連のモデルを中国でデバッグした場合、それらのフレームワークで国内の問題を解決できると思いますか?

したがって、私は依然として大規模なモデルをオープンソースにする必要があると信じています。もちろん、将来的には 50 社の大規模なモデル企業は存在しません。これは、米国の検索エンジンが約 10 社あったのと同じように、比較的少数に縮小するでしょう。残りの 5 ～ 6 社は、設立当初、そしてその後の合併や買収を通じて、非常に順調に発展してきました。例えばGoogleは最後に出てきましたが、最初に出てきた企業ですので、大企業中心か中小企業中心か、さらに具体的な企業が出てくると思います。早すぎます。誰にでもチャンスはまだあります。

今日、特にこの分野でまだ追いつきつつある今でも、誰がそれを実行できるのかを知るのは難しいため、さまざまな開発モデルを奨励する必要があります。

大型モデルの進化には 3 つのステップがあります。最初のステップは中型の大型モデルです。ほとんどの中国の参加者はこのステップにいます。第 2 ステップは、「新興」の閾値を超えて、主流の大型モデルになることです。現在、中国の一部の大手モデル企業のデータ規模は600億に達し、ほぼ第2段階にあるが、中国のデータの質は十分に高くなく、第3段階に入るには、データの品質と品質の両方が必要であるデータ規模とデータ規模が重要であり、第 3 のステップは、ビッグデータのリーディングプレーヤーとなるモデル企業になることです。現在、第 3 ステップに到達している外資系企業は 2 社のみであり、モデルデータの規模とデータ品質は非常に優れており、ヒューマンフィードバック強化学習も備えており、多くの下流アプリケーションと連携することができます。

私が話したいのはモデルの話です。特に OpenAI の GPT-4 には皆さんが気づいていない点があると思います。それはモデル拡張 (スケールアップ) 機能です。この機能はモデルのトレーニングが成功するかどうかを予測するには、1/1000 回または 1/10,000 回を使用できると言われています。

大規模なモデルを 1 か月間トレーニングする場合、一歩間違えると数千の GPU を無駄にすることになりますが、この一連のスケールアップ関数により、トレーニングが成功する可能性がある程度定量化され、無駄を削減できます。ただし、現時点では OpenAI がこのスケールアップをどのように運用しているのかは不明であり、OpenAI が発行したいくつかの論文からこれを試みることしかできません。 GPU が不足している場合でも、GPU を最大限に活用する方法を理解する必要があります。

大規模モデルの開発ではモデルのサイズだけが決定要因ではなく、データの品質がより重要です。 AI 1.0 時代、さまざまな言語モデルをトレーニングする場合、データは多ければ多いほど良いため、多少の間違いは問題ではありませんが、大規模なモデルのトレーニングで得た経験から、データの質と量の両方が重要ですが、品質を犠牲にすることはできません。これには国の援助と促進が必要だと思います。

米国のインターネットデータの品質は中国よりも高いです。たとえば、家族に健康上の問題がある場合、それを見つけるために WebMD またはクリーブランドクリニックに行かなければなりませんが、中国には同様の Web サイトがありません。。現在、中国には公的福祉データ収集プラットフォームがないため、高品質のデータ収集を促進し、諸外国とのデータ品質の差を縮めるには、依然として国家政府の力が必要である。このデータ品質には州が反映されている可能性があります。

AI2.0の展望

私は、将来最も革新的な AI2.0 アプリケーションは AI-First になると信じています。最終的に傑出したのは、新しいテクノロジーに積極的に投資する先駆者です。かつては人間がコンピューター言語を学ぶ必要がありましたが、将来的にはコンピューターが言語を学習することで、私たちの時間を大幅に節約できるようになるかもしれません。私たちがやりたいことをAIに伝えるだけで、AIがそれをやってくれます。たとえば、明日は妻の誕生日なので花、ケーキ、プレゼントが必要であるとスマートアシスタントに伝えると、すべて揃えてくれるので、時間を大幅に節約できます。現在、時間短縮のためこれらの作業を手伝ってくれるアシスタントを募集しています。将来的には、これらのタスクは AI アシスタントによって実行されるようになるでしょう。

将来的には、この大きなモデルは単なるチャットツールではなく、ゆっくりとユーザーの期待を超え、インテリジェントな生産性ツールに発展すると信じています。ついにその日が来ると、現在のビジネスモデルが変わり、App Storeが存在しなくなることが分かるでしょう。

たとえば、AIに「妻の誕生日にケーキと花を買いたい」と言ったとき、AIはECサイトにアクセスする必要はなく、倉庫に直接注文できるので、それは既存のビジネスモデルを覆し、より多くの顧客と経済的機会をもたらすでしょう。現在私たちが目にする AI アプリケーションは基本的に仮想世界にありますが、将来的には AI は物理世界に移動します。私たちは「Embedded AI」という概念を持っています。これは、大量の動画をトレーニングデータとして使用すると、ロボットがユーザーのニーズを理解することが可能であることを意味します。ポテトチップスを持ってくるように指示すると、引き出しを開け、皿を取り、注ぎ出すなどの操作が必要であることを認識します。もちろん、次の 3 ～ 5 年以内に実用化されるのは難しいかもしれません。何年も経っていますが、学術と産業の組み合わせにより、すべてがそれほど突飛なものではないように見えます。

つまり、大規模な AI モデルは中国にとって逃すことのできない歴史的なチャンスです。これは史上最大のプラットフォーム革命であり、Windows や Android によってもたらされた変化の 10 倍です。すべてのアプリケーションを書き換えて人間の仕事を再構築することで、創造的な人々が研究作業により集中できるようになり、創意工夫が 10 倍以上に増幅され、同時に多くの反復的なタスクが置き換えられます。

中国は米国より遅れてスタートしましたが、巨大なアプリケーション市場と経済のあらゆる側面の強力なつながりにより、依然として大きな発展の可能性を秘めています。中国政府は資源の配分や仕事の手配において西側諸国よりも優れており、より多くの中国人を自分たちに適した地位にうまく誘導することができる。中国には人材面でも大きな優位性があります。中国には非常に多くの AI エンジニアと AI 科学者がいます。おそらくトップはまだ米国にいますが、中国の多くの若い科学者も非常に強力です。しかし、私たちにはまだ課題があり、以前は計算能力が米国に及ばず、大型モデルの経験も浅かったのですが、政府の協力により、大企業が協力して開発を進められるようになると信じています。、投資会社、私たちはすぐにこの問題を克服できるでしょう。

アメリカの有名な投資機関であるアンドリーセン・ホロヴィッツは、この分野について次のように予測しています:「この市場の潜在的な規模を把握するのは困難です。すべてのソフトウェアとすべての人間の努力の間にあるでしょう。」 AI2.0 市場モバイルインターネットの10倍の規模になると予想されており、巨大企業、中小、零細の革新的企業が共に発展する「イノベーション複合体」を形成すると予想されている。

出典: 中国起業家マガジン

以上がKaifu Lee: 大規模な AI モデルは逃すことのできない歴史的な機会ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。