Ini adalah penyerahan untuk AssemblyAI Challenge : Canggih Ucapan-ke-Teks.
Saya membina halaman web yang mudah digunakan, dengan reka bentuk responsif supaya ia boleh digunakan dalam peranti yang berbeza seperti komputer riba, telefon bimbit, tablet, aplikasinya berfungsi 100%, mengandungi input untuk memuat naik fail (audio) anda ingin transkrip, butang untuk mula menyalin, sebaik sahaja anda mengklik butang ini, transkripsi akan bermula secara automatik dan teks yang ditranskripsi akan muncul betul-betul di bawah.
Aplikasi web digunakan supaya semua orang boleh mengakses dan menggunakannya, dari mana-mana peranti, dari mana-mana sahaja, secara ringkasnya saya mempunyai sedia untuk menggunakan aplikasi web untuk menyalin audio menggunakan model Universal -2 untuk memproses audio.
Kod adalah di bawah lesen percuma MIT, anda boleh mencapai repositori GitHub di sini.
Apl web juga digunakan pada Render, yang bermaksud ia mempunyai Kebolehgunaan dan Kebolehcapaian, anda boleh mencapai dan menggunakan aplikasi Di sini.
Apl ini berfungsi 100%, anda boleh melihatnya pada tangkapan skrin di bawah.
Juga antara muka adalah intuitif untuk sesiapa sahaja yang mempunyai atau tidak berpengalaman menggunakan teknologi, anda boleh melihatnya pada imej ini.
Reka bentuk aplikasi responsif, boleh diakses dan digunakan dalam mana-mana peranti, bermakna ia mempunyai Pengalaman dan Kebolehcapaian Pengguna yang Baik, anda boleh menyemaknya pada tangkapan skrin ini:
Pada tindanan Teknologi saya menggunakan HTML tradisional, CSS dan JS untuk membina bahagian hadapan web dengan Kebolehgunaan dan Pengalaman Pengguna, Di Bahagian Belakang saya menggunakan Flask untuk menentukan laluan dan melaksanakan logik, saya menggunakan Universal-2, Model AssamblyAI untuk menyalin audio, dengan kata mudah, Flask menerima audio, hantar ke API Assembly AI (Sambungan dimantapkan melalui Kunci API), API memproses audio dan menghantar 200 respons status.
Kelalang simpan audio pada folder muat naik, jadi apabila ia digunakan pada Render, hos tidak mempunyai akses untuk menyimpan dan mengakses fail pada direktori, yang boleh mengalami ralat dan halaman tidak akan menterjemah, untuk menyelesaikan isu ini, diperlukan untuk menggunakan storan awan untuk menyimpan audio dan akses kelalang daripada Awan dan bukan untuk direktori muat naik.
Atas ialah kandungan terperinci Apl Terjemah AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!