前書き: 中国のデジタル経済の徹底的な発展に伴い、産業のデジタル化のプロセスは加速し続けており、ビッグデータは産業の意思決定においてますます重要な役割を果たしています。天岩沙データ研究所は、天岩沙ビッグデータを活用して産業構造や発展背景を整理し、業界の最新動向や投融資動向を読み解き、意思決定の参考にするコラム「天岩新知識」を創刊します。すべての当事者によって。
この記事は、天岩新知識・産業分析シリーズの 37 番目の記事です。
ロボット、ほとんどの人々の最初の「濃厚接触」は SF 映画や、現実生活を超えた無限の想像力から来ています。ロボットは徐々に「道具」から「親密なパートナー」へと進化します。
年初に話題になった「大型模型」、再び「人気」となった人型ロボットなど、テクノロジーがもたらしたライフスタイルの変化に改めて歓声が上がった。
今後、AI技術の継続的な成熟と人型ロボットの研究開発の躍進により、「一般の人々の生活にロボットが入り込むというビジョン」はますます現実に近づいていくでしょう。
1. ロボット:「自動化」から「知能」への進化
国際ロボット連盟 (IFR) は、ロボットとは、2 つ以上の軸でプログラムでき、ある程度の自律性を持ち、特定の環境で移動して所定のタスクを実行する駆動機構であると提案しています。
1. ロボットの応用シナリオは、「単純で初歩的なもの」から「複雑で高度なもの」へと徐々に移行します
当初、ロボットの主な機能は反復的で危険な作業を人間に代替し、効率と正確性を向上させることでしたが、その後、「人に奉仕する」という機能を備えたロボットが人々の目に届き、受付などの離れた場所で使用されるようになりました。最近では、エンターテイメント・掃除ロボットが家庭に大規模に普及し、その高精度な機能を物流や医療に活かし、自動送迎ロボットや補助介護ロボットも登場し始めています。
2. ロボットは「自動化」から「知能」へと徐々に進化します
ロボットの開発は 3 世代を経て、第 1 世代はプログラム制御ロボットで、プログラミングやティーチングによって動作指示をロボットに入力します。しかし、外部センサーが不足しているため、ロボットは環境条件が少しでも変化すると、ロボットの作業に問題が発生します。第2世代は、視覚や力覚などのセンサーを備え、その情報に基づいて作業状態を調整できる適応型ロボットです。センサーから得られる情報をセンサーで取得する第3世代の知能ロボット:より豊富なセンサーを搭載し、外部からの包括的な情報を取得して処理するだけでなく、それに応じて自らの行動目標を設定することもできるその知能は主に3つの側面に反映されます: 認識の相互作用、独立した意思決定、自己最適化。
2. 大規模モデル: 一級都市が汎用人工知能の開発を主導する
2023年4月のCPC中央委員会政治局会議は、汎用人工知能の開発を非常に重視し、イノベーションエコシステムを構築し、リスク予防に注意を払う必要があると指摘しました。中央経済工作会議などこれまでの重要な会議で一般的に言及されてきた「人工知能」とは異なり、今回の政治局会議は「普遍性」、つまり昨年11月からChat-GPTが主導してきた普遍的なAI大型モデル技術路線を明確に強調した。 。
北京市の「諸措置」の発表は、AI大型モデルの産業発展を注視するために中国の地方政府が提案した初の特別措置であり、北京は地方大型モデル競争の先陣を切った。現在、Chat-GPT をきっかけとした「千モデル戦争」が始まっており、大規模モデルが新たな効率革命をもたらし、さまざまな業界に経験の向上をもたらす可能性があります。 AI初の都市である北京が行動を起こすように、上海、深セン、杭州などの地域も次々と行動を起こす可能性がある。
3. ヒューマノイドロボット:人間と機械の「予期せぬ出会い」
ヒューマノイドロボットは、外観や動作方法が人間に似ており、その定義や使用目的も人間に似ている知的ロボットです。ヒューマノイドロボットは「人型ロボット」とも訳され、文字通り人間の形態や行動を模倣するように設計・製造されたロボットを意味します。現在、ヒューマノイドロボットの普遍的な定義はありませんが、専門書「ヒューマノイドロボット」によると、ヒューマノイドロボットは「人間が働き、生活する環境で働き、人間用に設計された道具や機器を操作し、人間とコミュニケーションできる必要がある」とされています。 」この前提に基づいて、ヒューマノイドロボットは最終的には頭、胴体、手足を含む人間に似た身体構造を持ち、二足歩行をし、複数の指を使ってさまざまな操作を実行し、ある程度の認知能力と意思決定能力を備えなければなりません。 。
人型ロボットは1960年代後半に始まり、日本の研究成果が最も注目を集めました。 1973年に早稲田大学の加藤一郎教授が開発した世界初の人型ロボット「WL-5型二足歩行機械WABOT-1」(厳密に言えばバイオニックマシンであり、人型ロボットの原型)。ホンダは1986年に人型ロボット「ASIMO」の研究を開始し、2000年に初号機の試作機の発表に成功した。
4. 人型ロボットと AI 大型モデル: 普遍的なシナリオが C サイドの革新的な進歩を加速します
統合設計技術、動作管理および制御技術、センサー知覚技術などの主要技術の継続的な進歩と、人工知能や 5G などの新世代情報技術の継続的な統合と応用により、特殊ロボットは炭鉱、深海、極地などで加速度的に利用され、莫大な生産価値と科学研究価値を生み出していますが、その中で最先端のテクノロジー企業と一般消費者を最も魅了しているのは、インテリジェントなテクノロジーの出現とその反復です。人型ロボットに代表される移動ロボット。
現在、AI テクノロジーにより、包括的な認識、リアルタイムの相互接続、分析と意思決定、自律学習を備えたインテリジェント システムを構築することで、ロボットの自律的な動作が可能になります。 AI は、ロボット ビジョン テクノロジーを通じてロボットの認識能力を強化し、アルゴリズム モデルを構築することで独自に分析、意思決定、学習する能力を向上させ、ロボットが独立してタスクを完了できるようにします。
1. 世界を認識する能力 (ロボットの目)
レーザーおよびビジュアル ナビゲーションは、ロボットの自律移動の認識および位置決め技術における主流のアプリケーション ソリューションです。コンピュータビジョンの開発は、特徴記述子に代表される伝統的なビジョン手法とCNN畳み込みニューラルネットワークに代表される深層学習技術を経て、現在は一般的な視覚的な大型モデルが研究・探索段階にあり、人型ロボットのシーンはより複雑になっています。産業用ロボット AllinOne のマルチタスク トレーニング ソリューションは、汎用性が高く、より複雑で、大規模なビジュアル モデルを備えており、ロボットが人間の生活シナリオによりよく適応できるようになります。
一方で、大規模モデルの強力な適合能力により、人型ロボットはターゲット認識、障害物回避、3 次元再構築、セマンティック セグメンテーションなどのタスクにおいてより高い精度を達成できるようになりますが、他方では、大規模モデルは問題を解決します。深層学習テクノロジーの問題 単一タスクのデータ分散への過度の依存とシーン汎化結果の貧弱さ 一般的なビジョンを持つ大規模モデルは、大量のデータを通じてより一般的な知識を学習し、それを下流のタスクに移行します 大量のデータに基づいて事前トレーニングされたモデルのパフォーマンスが向上します知識の完全性により、シーンの汎化効果が向上します。
代表的な製品:テスラ「オプティマス(オプティマスプライム)」
知覚レベルでは、テスラのロボットヘッドは 8 台のカメラを使用して視覚情報を収集します。コンピューティングレベルでは、ロボットは現在テスラ車で使用されているFSD(完全自動運転、完全自動運転)コンピューターを使用し、ニューラルネットワークなどのモデルを使用してリアルタイムで情報を処理する。テスラは、スーパーコンピューター「Dojo」を使用してロボットが使用する人工知能モデルをトレーニングし、外部の物体の識別と応答の効率を向上させることを計画している。
2. 思考力と意思決定力 (ロボット脳)
現在のロボットはすべて特殊用途のロボットであり、限られたシナリオでのみ使用できます。コンピューター ビジョンに基づくロボットの掴みでさえ、依然として限られたシナリオでのみ使用されます。アルゴリズムは物体を識別するためにのみ使用されます。その方法人の定義。万能ロボットを作り、花に水をやるように依頼すると、ロボットはやかんを手に入れ、水を拾い、花に水をやる方法を理解します。これを完了するには常識が必要です。大型モデルが登場するまでは、ロボットに常識を持たせることはほぼ不可能だろう。大型モデルにより、ロボットは常識を持ち、さまざまなタスクを実行できる多用途性を備え、汎用ロボットの実装モデルを完全に変えることができます。人間のツールが環境に適応できるため、ロボット用のツールを構築する必要がなくなります。
代表製品:初代ロボット市民「ソフィア」
2017 年、ソフィアは世界初のロボットとして市民権を獲得しました。彼女は自分の知恵を使って人類の発展を助けるつもりであり、私たちを恐れることはないと言いました。彼女はとてもフレンドリーでした。 2018 年には、オンライン教育コースを実施する世界初の AI 教師にもなりました。ソフィア氏は、将来のロボットは教師の仕事に十分適しており、生徒との対話に基づいて生徒が直面する心理的および感情的な問題を効果的に解決できると述べた。
3. 実行能力 (ロボットの手足)
可動性 (脚) と細かい操作 (手)。ロボットを人型にすることは、ロボットの実行能力をより多用途にすることです。ロボットが作業を行う環境は、建物、道路、施設、道具など、人間の体型に合わせて構築されています。この世界は、人間のような人型の生き物が働きやすいように設計されています。新しいロボットの出現に対応するには、人間はそれに適した環境を再設計する必要があります。特定の範囲のタスクを実行するロボットの設計は比較的簡単ですが、ロボットの汎用性を向上させたい場合は、クローンとして機能する人型ロボットを選択する必要があります。さらに、人型ロボットは、人々を親近感を抱かせる能力があるため、人間よりも感情的なコミュニケーションが容易です。
代表的な製品: Boston Dynamics Atlas
2020 年 12 月、ボストン ダイナミクスは、滑らかで表現力豊かな動きで踊るアトラスのビデオを公開しました。ロボットはバランスを維持し、ダンスの動きを正確に完了するために、空中でジャンプしながら姿勢を調整する必要があります。 2021 年 8 月に公開された最新の公式ビデオでは、アトラスは障害物環境で「パルクール」を行い、ジャンプ、飛び込み、回転、宙返りなどの一連の難しい全身運動を実行できます。
4. 「身体化知能」ロボット: 人工知能の究極の形
「身体的知能」の概念は、1 歳児の認識能力と行動能力をコンピュータにどのように与えるかという問題から生まれました。これは、人型ロボット、インテリジェントな運転車、将来の「トランスフォーマー」など、人工知能の進化プロセスを完了するために実際の物理環境でさまざまなタスクを実行できるようにする、さまざまな形式のロボットとして単純に理解できます。
Nvidia 創設者 Huang Jenxun 氏は、ITFWorld 2023 半導体カンファレンスで、Embedded AI は、物理世界を理解し、推論し、対話できるインテリジェントなシステムであり、人工知能の次の波であると述べました。
身体化知能の最大の特徴は、主人公の視点から物理世界を自律的に認識し、擬人化された思考経路を使用して学習する能力であり、それによって、データが供給されるのを受動的に待つのではなく、人間が期待する行動フィードバックを与えることができます。 。人間の行動に基づいた学習およびフィードバック システムを提供することにより、ヒューマノイド ロボットは、より複雑な行動のセマンティクスを探索するための反復的な基盤と実験フィールドを提供します。したがって、ヒューマノイドロボットの段階的な改良は、身体化知能の実装の方向性も提供するものであり、身体化知能の重要な応用シナリオであり、また、身体化知能の反復最適化のための方向性と余地も提供するものである。
5. 特許技術:ロボットや大型模型の特許出願は年々増加中
1. ロボット特許:
近年、ロボットはビッグデータや人工知能などの最先端テクノロジー産業との融合が進み、特に人型ロボットの登場により、テクノロジー産業としてのロボットの「技術化」が一層進んでいます。
量的な観点から見ると、ロボット特許は着実な成長を維持しており、2022 年には 23,000 件以上の特許出願があり、種類の観点から見ると、発明特許と実用新案の割合が高く、両者の合計は 90% を占めています。合計のうち。
2.大型モデル特許:
大型モデルの「発生」には兆候がないわけではありません。人工知能の分野において、その「至宝」である自然言語処理は、人間の言語、感情、思考を理解するための技術であり、その「機械」における自然言語処理の役割が、その「少ない言葉」の紹介からわかります。 「人間とは何か」という重要性と極めて高い難易度。
近年の特許出願件数から判断すると、比較的安定した急速な成長を維持しており、2018 年以降、出願件数の複合成長率は 61.2% に達しています。
種類別に見ると、発明特許が絶対的な主導的地位を占めており、98%近くを占めています。
Tianyancha Research Institute によると、人工知能を促進するための大規模モデル技術の使用は歴史的な進歩を遂げており、将来的に探索すべき広範なイノベーションの余地がまだたくさんあります。中国の高度な経済社会発展は、革新的な大規模モデルのための十分なシナリオとデータ基盤を提供するため、中国における人工知能は大きな発展の可能性を秘めています。
以上がスカイアイの新たな知識 | 未来から来たロボットが大型模型と衝突して「知恵」の火花を散らすの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。