Rumah > Peranti teknologi > AI > Model sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat

Model sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat

WBOY
Lepaskan: 2023-08-04 09:41:05
ke hadapan
1089 orang telah melayarinya

Model sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat

Berita pada 27 Julai, Microsoft baru-baru ini melancarkan model pertuturan yang dipanggil NaturalSpeech2 Model ini menggunakan reka bentuk "potensi resapan" dan mempunyai hasil yang cemerlang pada tahap sintesis pertuturan sampel sifar -gred" penyelesaian pertuturan/nyanyian boleh memberikan pengguna pengalaman sintesis pertuturan yang berkualiti tinggi dan pelbagai. . bahawa, tidak seperti sistem pertuturan-ke-teks (TTS) tradisional, NaturalSpeech2 Microsoft menggunakan "vektor berterusan" dan bukannya "penanda diskret" untuk mewakili pertuturan, dengan itu menghasilkan segmen pertuturan yang lebih lengkap, tanpa menghasilkan "kekurangan emosi" Fenomena " membaca tongkat (bercakap perkataan demi perkataan)"

.

Model sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat

▲ Sumber imej berasal daripada kertas NaturalSpeech 2

Hasil eksperimen menunjukkan bahawa pertuturan yang dihasilkan oleh

NaturalSpeech2 di bawah keadaan sampel sifar hampir konsisten dengan prosodi gesaan pertuturan dan pertuturan sebenar, dan adalah semula jadi pada Libri dan set ujian VCTK Ijazah (diukur dalam CMOS) tidak dapat dibezakan daripada pertuturan manusia .

Kertas projek ini telah diterbitkan di GitHub Rakan-rakan IT House yang berminat boleh

klik di sini untuk melawatModel sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat.

Atas ialah kandungan terperinci Model sintesis pertuturan NaturalSpeech2 terkini Microsoft: menyediakan pembinaan semula pertuturan yang lebih tepat dan mengelakkan kesan bacaan melekat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan