北京は、AIトレーニングに必要な計算能力の供給を調整し、大規模なモデルの中国語コーパスを統合することを計画している-AI-php.cn

北京拟对 AI 训练所需的算力推行统筹供给，整合大模型中文语料库

5 月 17 日のニュース: 5 月 12 日、北京は汎用人工知能の革新的な開発を促進するためのいくつかの措置 (2023 ～ 2025 年) (意見募集草案) (以下、草案と呼びます) を発表しました。「意見募集草案」）では意見を公募し、AIトレーニングに必要な計算能力の協調供給を実施する予定だ。

北京拟对 AI 训练所需的算力推行统筹供给，整合大模型中文语料库

「コメント草案」では、コンピューティングリソースの全体的な供給能力を強化し、主要なパブリッククラウドベンダーなどの市場主体との協力を強化し、コンピューティングパワーパートナーシップ計画を実施し、パートナーシッププログラムメンバーの最初のグループは、供給技術基準、ソフトウェアおよびハードウェアのサービス要件、コンピューティング電源の供給規模、優先戦略などを明確にし、大学および中小企業向けの高品質のコンピューティング電源サプライヤーのグループを発表します。北京の大手企業。

「コメント草案」では、政府の統一入口を利用することで、パブリッククラウドの調達コストが削減され、中小企業に利益をもたらし、同時に企業がさまざまな課題に直面する際の通信コストも削減できるとしている。クラウドベンダー。柔軟なコンピューティング能力の需要を満たすために、統合マルチクラウドコンピューティング能力スケジューリングプラットフォームを構築して、異種コンピューティング能力環境の統合管理と統合運用を実現し、企業がさまざまなクラウド環境でさまざまな人工知能コンピューティングタスクをシームレス、経済的、効率的に実行できるようにします。。北京、河北、天津、山西、内モンゴル、その他の省（都市）のコンピューティングパワークラスターに直接接続された基本的な光伝送ネットワークを構築し、4つの場所のコンピューティングパワーリソースを認識し、コンピューティングパワートランザクションを探索するプラットフォームの能力をさらに強化します。。

また、「コメント草案」では、現在の大規模モデル学習用の高品質な中国語コーパスの割合が少なすぎて、中国語の文脈表現や産業応用に役立たないという問題を考慮して、既存のオープンソースの中国語の事前トレーニングデータセットと高品質のインターネット中国語データを統合し、コンプライアンスに合わせてクリーンアップする必要があります。同時に、高品質のマルチモーダルデータソースの拡張を継続し、中国語、画像とテキストのペア、音声、ビデオなどの準拠した安全な大規模モデル事前トレーニングコーパスを構築し、対象を絞ったユーザーに公開していきます。北京国際ビッグデータ取引所のソーシャルデータ領域を通じた条件付き使用。

IT ホームは、「一般人工知能のイノベーションと開発を促進するための北京のいくつかの措置 (2023-2025) (コメント草案)」の完全な文書を添付します:ここをクリックして表示します

以上が北京は、AIトレーニングに必要な計算能力の供給を調整し、大規模なモデルの中国語コーパスを統合することを計画しているの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。