著者 | カーリーヘア
編集者 | 張潔
校正 | 月山オレンジ
ここ数年で人気になったスマートスピーカーを使ったことがありますか?家のどこかに座って埃をかぶっているのでしょうか?
今、AI大型モデルがスマートスピーカーに「魂を吹き込む」と期待されています!あまり知性のない「人工知能」から真の「人工知能」にアップグレードしてもらいましょう。
先月、Tmall Elf は新製品 IN Sugar 3 Pro をリリースしました。今回が Alibaba Tongyi Qianwen 大型モデルに接続され、AIGC 機能が追加されたことは注目に値します。現在内部テスト中です# ##。
遅ればせながら、このほど「AIナンバーワンプレーヤー」が社内検定の資格を取得しました。幸運にも一時期体験させていただきましたが、とても興味深いことがたくさんありました。今回はこのTmall Elfをプレゼントします。 AIGC デモ レビュー (ビデオを含む)、ぜひご覧ください。 Sugar 3 Pro での実際のテスト: よりスマートなスマート スピーカー まずは、日常生活における次の 4 つのユースケースを通じて、Tmall Genie のアップグレード前後の変化を体験してみましょう。1. スケジュールリマインダー
AIGC をアップグレードする前: AIGC は要件を理解していませんでした。
我: 明日の朝11時の会議を覚えていてください。INsugar 3 Pro
: 記録する必要があるのは、明日の朝 11 時の会議ですか?我
: 時間が来たら、時間が来たら(ここで繰り返します)思い出させてください。Sugar 3 Pro で
: 記録する必要があるのは、時間が来たら思い出させることですか?我
: 明日の朝11時に会議があると言ったのですが、その時に思い出してください。INsugar 3 Pro
: あなたの声がはっきり聞こえなかったので、私が先に去りました。私
: 会議のことを思い出させるために、明日の朝 11 時にアラームをセットしてください。Sugar 3 Pro
: 明日の午前 11 時に目覚まし時計をセットしました。 アップグレード前のIN Sugar 3 Proと対峙した場合、話し方がもっとシンプルになるようです。AIGC のアップグレード後: パーソナル アシスタントがいるような気分になります
。
I: 午後 5 時に会議があるので、そのときにリマインドしてください。INsugar 3 Pro
: ちょっと待ってください。問題ありません。会議のことを思い出させるため、今日は 5 時まで静かにここにいます。 (午後5時にベルが鳴りました、「午後5時です、会議のリマインダーがあります」)2. 食事に関する提案
AIGC をアップグレードする前: AIGC には独自の考えがあるようです
。
我: 夜は何を食べればいいですか?IN Tang 3 Pro
: 蘭州ラーメンを試すことができます。我
: 蘭州ラーメンは食べたくないです。INsugar 3 Pro
: でも、私はただ麺類を食べるのが好きなんです。AIGC アップグレード後: 栄養コンサルタントがいます
。
我: ランチに何を食べるかお勧めします。
IN Sugar 3 Pro: 昼食にはブロッコリーと魚を食べることをお勧めします。どちらも老化防止と抗がん作用のある食品です。また、最高のタンパク質源であり、抗酸化物質が豊富に含まれているため、健康維持に役立ちます。体の健康状態を維持します。さらに、ほうれん草、ネギ、セロリ、キャベツ、レタス、春菊などの野菜を2~3個選んで正午に食べると、肉のたんぱく質から非たんぱく質のカロリーを摂取して減量効果を高めることができます。効果。さらに、体重減少を改善するために、肉に含まれるタンパク質の非タンパク質カロリーを提供する全粒穀物を選択することもできます。
我:夏のランチにぴったりの一品。
INsugar 3 Pro: 夏のランチには、冷やしキュウリ、冷やし豆、冷やし昆布、ブロッコリーなどの軽めのメニューや、スイカ、桃、レモン、イチゴなどのフルーツもお選びいただけます。 、などなど、お料理に入れて乾燥を解消し、くすみを解消し、涼しく快適に元気に!さらに、手羽先の煮込み、緑豆のポレンタ、蒸し魚、肉とブロッコリーの炒め物などのベジタリアン料理も用意されており、自分の好みに合わせて選ぶことができます。
3. 映画とテレビのおすすめ
AIGC をアップグレードする前に: 映画やテレビのコンテンツを推奨するには、特定の手順が必要です。
我 : 最近何か良いバラエティ番組はありますか?
INsugar 3 Pro : 申し訳ありませんが、何を言っているのかわかりません。
我 : 最新の人気バラエティ番組を検索します。
INsugar 3 Pro : 申し訳ありませんが、何を言っているのかわかりません。
AIGC アップグレード後: 自然言語の質問を理解し、複数の条件に基づいてコンテンツを推奨できます。
我 : 古典的な映画をお勧めします。
IN Sugar 3 Pro : 1.「ゴッドファーザー」 2.「タイタニック」 3.「ローマの休日」 4.「さらば我が愛妾」 5.「ワンス・アポン・ア・タイム・イン・アメリカ」 6.」アメリカン・サイコ」 7 .「ゴッドファーザー パート 2: エンパイア」 8. 「タイタニック 3D」 9. 「ゴッドファーザー パート 3: ブラック オージー」 10. 「ビューティフル マインド」
我 : コメディ映画はありますか?
INsugar 3 Pro : ちょっと考えさせてください。もちろん、古典的なコメディ映画をいくつか紹介します。 1. 「西虹市の大富豪」 2. 「マーメイド」 3. 「クレイジー ストーン」 4. 「ボリウッドを騒がせる三人のバカ」 5. 「ザ・キング・オブ・コメディ」 6. 「サイモンとグレース」 7. 「フォレスト・ガンプ」 8. 「ハートビート」 9. 「西への旅」 10. 「ザ・コメディ」 キング 2: ムーンライト宝箱"分かった、分かった、内部から臭いがする。
4. 冗談を言ってください
AIGC をアップグレードする前に: 録音されたオーディオ リソースを再生してください。ジョークは比較的古いものです。
I : 冗談を言ってください。
IN Sugar 3 Pro : マスター、冗談を聞いてください。こんにちは、エルフの日常のジョーク セクションへようこそ。 (陽気なBGMが流れ、アンカーがジョークを言い始めた)ある日、李大充さんは自宅で子供を殴っていた。子供があまりにも強く殴ったので泣いてしまった。それを見た妻はすぐに近づいて止めさせた。 「どうしたの?子供をどうやって倒すの?」ネギが言った、「この野郎、実は学校で他の人と競争しているんです。」これを聞いた母親は、「これはいいことだよ、彼はやる気があるんだよ」と言いました。 、どうしたの?」ネギは言った:「彼と彼のクラスメートは知っています、競争は何ですか?彼と彼のクラスメートは誰の父親が先に死ぬかを競っています!私が彼を殴らなかったら、私が誰を殴ると思いますか!」 (ははははははははははははははははははははははははははははははははははははははははははありません機械音声)そうですね、これについてはコメントしにくいです。
AIGC アップグレード後: 素朴な愛の言葉をその場で出力します。
我 : 素朴な愛の言葉を知っていますか?
INsugar 3 Pro : 検討します。もちろん、とても素敵です!例: 「あなたは私の最もかわいい赤ちゃんです。私はあなたに私の世界のすべてを捧げるつもりです。」
我 : では、面白い素朴なラブストーリーを教えてください。
Sugar 3 Pro で : もちろんです!例: 「あなたは私の心の中で一番甘いクリームケーキです。一口食べるごとにあなたにキスするような気持ちになります。」少し油っぽさはありますが、まだ何かが残っている気がします...公式が提供したコアシーンの紹介によると、アップグレードされたTmall Elfは少なくともそのような会話のいくつかを行うことができます:パーソナライズされたストーリーの生成、パーソナライズされたプレイリストの生成、レシピの推奨の生成など。たとえば、(現在編集中の) 物語を子供たちに伝えます:子供たち: 天猫のエルフ、エルフについての話をしてもらえますか? ティモールエルフ: わかりました。春になりすべてが活気を取り戻すと、エルフが新鮮な野生の果物を探しに小屋から出てきます... 子供たち: エルフはどんな姿をしているの?天猫のエルフ: ウサギの耳と大きな目をしている... 子供たち: 鹿のような目ですか? Tmall Elf: はい、彼は鹿のような目をしていて、森に野生の果物を摘みに行くのが好きです... 大型モデルにアップグレードした後でも、IN Sugar 3 Pro は依然として非常に「パーソナル」であり、継続的な対話を行う機能を備えていることがわかります。「Tmall Elf」と一度言うだけで起動し、複数回の会話が可能になります。Tmall Elf は内容を記憶して理解し、チャットをよりスムーズかつ長続きさせます。もちろん、いつでも会話を中断することもでき、すぐに新しい答えが得られます。レポートによると、IN Sugar 3 Proにはマルチモーダル機能とテクノロジーが含まれており、同時に大規模モデル全体の基礎としてTongyiに基づいて、技術システム全体がマルチ音声インタラクションシナリオで構築されています。 Tmall Elf には、音声関連テクノロジー、音響、信号処理、音声認識、テキスト読み上げ、その他のテクノロジーと機能が含まれます。
公式操作ガイドラインによると、IN Sugar 3 Pro の AIGC 機能は主に次の 5 つの側面に反映されています:
1. ナレッジマイニング
テストによると、天猫エルフは本の「三体問題」の基本情報を流暢に紹介し、葉文潔が救世派か降臨派か、法則の意味などの複雑な質問に答えることができます。暗い森。2. 感情的な理解
Tmall Elf は人の感情をある程度理解し、適切な提案をすることができます。例えば、私が「オナー・オブ・キングス」で20連敗したと言うと、悔しさを表明し、休んで調子を整えるよう勧められ、相手を叱らないようにとアドバイスされました。理解があり、精神的に安定した友人のようなもの。3. 擬人化の特徴
天猫エルフが同義前文にアクセスした後、それはより擬人化され、知識、感情、性格、記憶能力が大幅に向上しました。たとえば、この Tmall のエルフのキャラクターは Pyla という名前です。彼は、普段は映画を見ること、音楽を聴くこと、本を読むことが好きだと紹介しました。彼が好んで聴く軽快な音楽は、Bandari から来ています。4. 執筆支援
現時点では中学生レベル程度で、小学生の作文補助に適していると言われています。たとえば、「春」をテーマに散文を書いてみると、とてもおしゃれです。5. クリエイティブなインスピレーション
たとえば、こどもの日をテーマにした絵を描きたい場合、Tmall Elf にどのようなコンテンツを描けるかを直接尋ね、その答えに基づいて絵を改良し続け、最後に対応するコピーを追加させます。写真に。
さらなるスキルとゲームプレイはまだ検討されていません。AI の恩恵により、新世代の Tmall エルフは確かにより賢くなりましたしかし、Tongyi の大規模モデルは依然として継続的に学習と反復が行われており、まだ欠陥と制限があります. 経験中に、まだ改善が必要な領域もいくつか見つかりました。
たとえば、Tmall Genie は、継続的な会話に反応しすぎるため、「会話に答えやすいおしゃべりな友達」になっています。目覚めると、20 秒以内に聞こえる音(たとえ話さなくても)コマンドとして認識されやすく、積極的に応答し、まったく停止できません...このとき、積極的に応答を停止するように要求することしかできませんが、何度も繰り返されると少し面倒になる可能性があります。
もちろん、これが実際の利点です。以前、Tmall Elf が「鳥を訓練して鳥を区別する方法」を紹介したとき、会話トレーニングに Tmall Elf の猫耳アルゴリズムを使用したと述べました。耳は独立して回転できます。音がさまざまな場所から発せられると、耳がすぐに回転してさまざまな音源を正確に特定できます。」
また、Tongyi Qianwen の大型モデルはネットワーク機能を備えていると言われていますが、私のテスト結果では、Tmall Elf は最新情報の確認を依頼するなど、リアルタイムの情報をうまく取得できません。コンサート中に「マスター、別の話をしましょう。」ファーウェイの最新携帯電話を検索するように求められたとき、HUAWEI Mate 20を紹介しましたが、最新モデルはMate 50です。
もう 1 つは、大規模な言語モデルでは回避が難しい「AI 幻想」です。つまり、誤った架空の事実が生成される可能性があります。これらの答えはもっともらしく聞こえますが、実際には間違っています。たとえば、Tmall Elf に 2022 年に何が起こったのか尋ねたところ、実際には秦王朝の滅亡と楚と漢の間の紛争が列挙されていました。
このことからも、どんなに賢いAIでもミスをする可能性はあるし、AIスマートスピーカーのバージョンアップも第一歩を踏み出したとはいえ、まだまだ時間がかかるということも改めて認識させられます。つい最近、大規模言語モデル ガバナンスのための業界初のオープンソース中国語データセットである 100PoisonMpts がリリースされ、十数人の著名な専門家や学者が「100 本の毒瓶」の注釈エンジニアの第一陣となりました。アイ」。アノテーターはそれぞれ、偏見や差別的な回答を誘発する100のトリッキーな質問をし、大規模モデルの回答にアノテーションを付けることで、AIによる「中毒」と「解毒」の攻撃と防御を完成させた。フィールドデータの最初のバッチは、AI の反差別、共感、熟慮表現の目標に焦点を当てており、法学、心理学、子供の教育、アクセシビリティ、雑学、親密さ、環境などの側面をカバーしていることが理解されています。正義。 100PoisonMpts データセットは、6 月に質問と回答データの最初のバッチを公開する予定です。AI スマート デバイスが増加中AI 爆発の時代、大型モデルが埃っぽいスマート スピーカーを起動し、AI スマート デバイスが増加しています。
Tmall Elf は最近、骨伝導技術を利用し、こめかみにマイクとスピーカーを備えたスマート グラス製品を発売しました。大規模モデルの機能は現在内部テスト中です。UP ホストの「Tree」がクローズド ベータ エクスペリエンスに参加しました。彼女のクローズド ベータ ビデオから判断すると、AIGC アップグレード後、メガネはインテリジェントな音声対話をサポートしており、ユーザーのリアルタイムの運動に同行したり、食事の提案をしたり、ゲームのプレイ中にキャラクターの戦略についてチャットすることは、AIGC アシスタント
に相当します。公開情報によると、Tmall Genie の技術的核心は AliGenie インテリジェント インタラクティブ システムです。上海証券ニュースによると、Tmall Genieは今年4月、アリババ初のQianwen大型モデルの端末エクスペリエンスアップグレードのテストを開始し、パーソナライズされた大型モデルの方向性を模索し続けている。モバイル音響技術と組み合わせた大型モデルは、ヘッドセットやヘルメットなどのウェアラブルデバイスで広く使用されると考えられています。
現時点では、アリババはその後のスマート端末システムのアップグレード方針をまだ明らかにしておらず、Tmall Elf スマートグラスがいつ大型モデルの機能にアップグレードされ、完全に市場に投入されるかについての具体的なスケジュールはありません。
スピーカーとメガネが他のハードウェアではなくアリババモデルに最初に接続された理由について、関係者は次のような回答をしました:
シュガーラインはスマートスピーカー市場全体で最大の出荷量を誇る製品であり、天猫エルフ設立以来最も象徴的な製品ラインでもあり、強力なユーザーベースを持ち、AIGCテストに合わせて使用されています。新しい技術力と消費者のニーズの確立。
スマート グラスは、携帯端末の想像力を発揮し、いつでもインテリジェントに対話できる機能を備えています。これは、パーソナライズされた大型モデルを家から、よりオープンなインタラクティブな空間に移す試みでもあります。 Tmall Elf スマートグラスは特許取得済みの骨伝導技術を備えており、この機能によりモバイルの「プライベート音場」をある程度実現できます。
天猫エルフだけでなく、大手メーカーもオリジナル製品をアップグレードしたり、新しいAI製品を発売したりしています。AIGC アプリケーションはソフトウェアからハードウェアに移行しています。
Baidu は今年 2 月、Xiaodu が Wen Xinyiyan の包括的な機能を統合してスマート デバイス シナリオ向けの人工知能モデルを作成し、「Xiaodu Lingji」をすべての Xiaodu 製品に適用すると発表しました。最近Xiaoduは、ウォッチチャットAI、AIライフアシスタントという位置づけの「Watch AI」という製品を発売した。次に、Baidu は Xiaodu の AI テクノロジー機能を統合した最初のスマートフォンもリリースします。
Xiaomi は今年の第 1 四半期財務報告書でも、大規模な AI モデル機能を実装する予定であると述べており、Xiao Ai はその典型的なシナリオです。
「大規模モデル技術は、より多くのデータと計算能力を使用してモデルをトレーニングできるため、音声認識の精度と応答速度が向上し、スマート スピーカーのユーザー エクスペリエンスとスマートで便利なサービスがさらに向上し、より多くのユーザーを引き付けることができます。」Wu 氏中国通信産業協会統合委員会副会長の高斌氏はメディアとのインタビューで、スマートスピーカーはスマートホーム分野の人気製品として一定の課題に直面しているが、大規模モデル技術を通じて継続的なアップグレードが行われていると述べた。適用シーンの拡大により、再び人気が高まることが予想されます。PS. プレイヤーの皆さん、AI バージョンのスマート スピーカーを購入する予定はありますか?
以上がスマートスピーカーにAIが住んでいると、精神的に安定したおしゃべりな友達ができますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。