Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。-AI-php.cn

Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。

WBOY

リリース： 2023-09-17 22:29:01

転載

1091 人が閲覧しました

最近、Xiaomi は音声認識アルゴリズムで最新の進歩を遂げており、そのアルゴリズムモデルはパフォーマンスの点で他の機関をリードしており、国際ランキングのトップにランクされています。この画期的な進歩は、Google

がリリースした AudioSet オーディオラベル付けタスクで Xiaomi によって達成されました。

Google は AudioSet データセットを 3 つのサブセットに分割し、最初の 2 つのサブセットはトレーニングに使用され、統合されて「AudioSet-2M」と呼ばれました。 Xiaomi の音声認識アルゴリズムモデルが業界で 50 mAP を突破し、オーディオマーキングの技術指標を更新したのは、この統合されたトレーニングセットでした。さらに、Xiaomi は、リソースに制約のあるシナリオに適したモデルの Mini バージョンもリリースしました。

このテクノロジーのブレークスルーは、Xiaomi の音認識アルゴリズム機能における新たなブレークスルーを意味します。Xiaomi の多くのスマートハードウェアデバイスがこのテクノロジーを適用した後、環境音をより鋭く捕捉および識別できるようになり、ハードウェアのインテリジェンスが大幅に向上します。これにより、より多くの機能が作成されます。ユーザーに便利なスマートライフ体験を提供します。

同時に、Xiaomi の音声認識アルゴリズムによる音声タグ付け技術機能は、業界の最先端の研究開発プロセスを効果的に促進してきました。

Xiaomi の改良された音声認識アルゴリズムは、Xiaomi のスマートデバイスで広く使用できます。音声タグ付けアルゴリズムは、赤ちゃんの泣き声、動物の鳴き声、車のエンジン、爆発音、煙警報器、ドアベル、水の流れなど、幅広い環境音を識別でき、環境内の音を次のようなモダリティで表現できます。テキストとして、音を「見て」みましょう。これにより、ハードウェアデバイスがよりスマートになり、より効率的で正確な音声認識エクスペリエンスをユーザーに提供できます。

Xiaomi 携帯電話の「Xiaomi Hearing Sound」機能は、火災警報、赤ちゃんの泣き声、やかんの沸騰音などを含む 14 の重要な環境音を監視し、携帯電話の通知バーからテキストメッセージをプッシュできます。この機能は聴覚障害者の生活を効果的に支援し、Xiaomi ブレスレットはこれらの音情報を同時に表示および受信することもできます。

このアルゴリズムは、スマートホームデバイスでより広く使用されています。現在、Xiaomiの音声認識アルゴリズムは、赤ちゃんの泣き声を検出したときにユーザーの携帯電話にリアルタイムでプッシュ通知を送信できるMijiaカメラの赤ちゃんの泣き声監視機能など、多くのスマートホームデバイスで使用されています。 Xiaomi Soundスピーカーには音声認識機能も搭載されており、住宅警報音、赤ちゃんの泣き声、火災警報器、流水音、猫の鳴き声、犬の鳴き声など、ユーザーが気になる6種類の家庭環境音を識別できる。 Xiaomi Health APP の睡眠いびきモニタリングは、ユーザーのいびきと睡眠中の寝言を追跡するのに役立ちます。

このアルゴリズムの可能性をよりよく実現するために、Xiaomi は、AIoT プラットフォームエコシステムを通じてこのアルゴリズムテクノロジーを適用するための幅広いスペースを提供します。現在、Xiaomi の音響音声チームは、自社開発した音響音声技術を、Xiaomi の携帯電話、スピーカー、テレビ、ヘッドフォン、時計、ロボットなど 79 カテゴリの 5,000 以上のスマート製品に完全に適用しています。

音声認識アルゴリズムに属する人工知能の分野では、Xiaomi が長年投資を続けてきた下位トラックの 1 つとして積極的に取り組んでいます。 Xiaomiが2016年にAIチームを設立して以来、AIチームは7年間で6倍に拡大し、3,000人以上に達したと報告されています。同時に、Xiaomi の AI 技術力は、ビジョン、音響、音声、NLP、ナレッジグラフ、機械学習、大規模モデル、マルチモダリティなどの多くの方向をカバーしており、携帯電話などの多くのビジネス分野に十分な力を与えています。自動車、AIoT、ロボット。今年4月、Xiaomiは大規模モデルを完全に受け入れるためにAI大規模モデルチームを正式に設立し、現在いくつかのアプリケーションの試みが行われています。最初のアプリケーションモデルは、インテリジェント音声アシスタント Xiao Ai を大型モデルバージョンにアップグレードし、公開テストを行うことです。

Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。