IT House News 9 月 12 日、Microsoft は最近、「無料デジタル ライブラリ プロジェクト」Project Gutenberg と協力し、AI を使用して電子書籍ライブラリ用に 5,000 冊以上の無料オーディオブックを制作しました。
▲ 画像ソース プロジェクト グーテンベルク Web サイト
報道によると、このプロジェクトでは、研究者らは機械学習、自動テキスト選択、自然音声合成などのさまざまな人工知能技術を使用して、電子書籍を自動的に音声に変換するプロセス全体の実現に成功しました。
IT ホームは問い合わせから、プロジェクト チームが最初に電子書籍の構造を自動的に分析し、本文とページ番号や表などの重要でない部分を区別できるアルゴリズムを開発し、その後 WaveNet を使用したことを知りました。 、Tacotron と FastSpeech によるテキスト変換音声技術により、実際の人間と同様の自然な読み上げ音声が生成されます。さらに、チームはシステムが本の中のナレーター、会話、さまざまな登場人物を識別し、それに応じて音声を調整してストーリーラインの音声表現を実現できるようにしました。マイクロソフトは、さまざまな古典文学、ドラマ、伝記、その他の作品を含む 35,000 時間以上のオーディオブックの音声データを収集し、整理したと発表しました。この音声データはオープンソースとして無料で公開されます。ユーザーは、自分の録音した音声を少量使用して、「本全体を自分の声で読む」効果を生み出すこともできます。このプロジェクトは、Web サイトのオーディオブック コンテンツを充実させ、視覚障害者にも利便性を提供します。
元の意味を変えずに内容を書き直すには、言語を中国語に変更する必要があります。元の文
は表示する必要はありません
以上がMicrosoft が Project Gutenberg と提携し、AI を使用して 5,000 冊の無料オーディオブックを作成の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。