Python appelle l'interface Alibaba Cloud pour implémenter la fonction de reconnaissance audio-Tutoriel Python-php.cn

Python fait appel à l'interface Alibaba Cloud pour implémenter la fonction de reconnaissance audio

Ces dernières années, le développement rapide de l'intelligence artificielle a profité à de nombreux domaines. Parmi eux, l’application de la technologie de reconnaissance vocale est devenue un sujet brûlant. Alibaba Cloud est l'un des principaux fabricants de cloud computing en Chine et propose un riche ensemble d'interfaces d'intelligence artificielle, notamment des fonctions de reconnaissance audio. Cet article explique comment utiliser Python pour appeler l'interface Alibaba Cloud afin d'implémenter la fonction de reconnaissance audio.

Avant de commencer, nous devons d'abord demander la clé API correspondante sur la console Alibaba Cloud. Dans la console Alibaba Cloud, sélectionnez « Intelligence artificielle » - « Reconnaissance vocale », créez une nouvelle application et obtenez l'ID de clé d'accès et le secret de clé d'accès.

Ensuite, nous devons installer le SDK Python. Ouvrez un terminal de ligne de commande et entrez la commande suivante :

pip install aliyun-python-sdk-core pip install aliyun-python-sdk-asr

Copier après la connexion

Une fois l'installation terminée, nous pouvons commencer à écrire du code.

Tout d'abord, nous devons importer les bibliothèques et modules requis :

import time from aliyunsdkcore.client import AcsClient from aliyunsdkcore.request import CommonRequest

Copier après la connexion

Ensuite, créez un objet client Alibaba Cloud et utilisez la clé d'accès que nous avons demandée dans la console Alibaba Cloud pour l'authentification :

client = AcsClient('', '', 'cn-hangzhou')

Copier après la connexion

Ensuite, nous pouvons écrire un fonction pour télécharger le fichier audio et renvoyer le chemin du fichier une fois le téléchargement réussi. Ici, nous supposons que le fichier audio a été enregistré sur le disque local et que son chemin estfile_path:

def upload_audio(file_path): request = CommonRequest() request.set_domain('nls-meta.cn-shanghai.aliyuncs.com') request.set_uri_pattern('/pop/2019-02-28/2019-06-30/instances') request.set_method('POST') request.add_header('Content-type', 'multipart/form-data') # 创建上传参数 body_params = { 'Type': 'MultipartFormData', 'file': open(file_path, 'rb') } request.set_content(body_params) # 发送上传请求 response = client.do_action(request) # 解析返回结果，获取上传成功后的文件路径 file_id = response.decode('utf-8').split('"FileId":"')[1].split('","InstanceId"')[0] return file_id

Copier après la connexion

Ensuite, nous pouvons écrire une fonction pour implémenter la fonction de reconnaissance audio. Cette fonction utilisera l'interface de reconnaissance audio d'Alibaba Cloud pour identifier les fichiers audio téléchargés avec succès. Le résultat de la reconnaissance sera renvoyé sous forme de valeur de retour :

def recognize_audio(file_id): request = CommonRequest() request.set_domain('nls-meta.cn-shanghai.aliyuncs.com') request.set_uri_pattern('/pop/2019-02-28/2019-06-30/instances/%s' % file_id) request.set_method('GET') # 发送识别请求 response = client.do_action(request) # 解析返回结果，获取识别结果 result = response.decode('utf-8').split('"Result":"')[1].split('","CreateTime"')[0] return result

Copier après la connexion

Enfin, nous pouvons écrire une fonction principale pour appeler la fonction de téléchargement et de reconnaissance audio, et imprimer le résultat de la reconnaissance :

def main(): # 音频文件路径 file_path = '' # 上传音频文件 file_id = upload_audio(file_path) print('音频文件上传成功，文件ID：%s' % file_id) # 等待音频上传完成 time.sleep(10) # 开始音频识别 result = recognize_audio(file_id) print('音频文件识别结果：%s' % result) if __name__ == '__main__': main()

Copier après la connexion

À ce stade, nous avons terminé l'appel Python l'interface Alibaba Cloud pour mettre en œuvre l'écriture de code de la fonction de reconnaissance audio.

Grâce à la fonction de reconnaissance audio d'Alibaba Cloud, nous pouvons convertir des fichiers audio en texte pour fournir une prise en charge de base pour les applications liées à la reconnaissance vocale. Cette technologie offre de larges perspectives d'application dans les assistants vocaux, la traduction vocale, les sous-titres en temps réel et d'autres domaines.

Remarque : en raison de l'implication des requêtes réseau et des téléchargements de fichiers, l'exécution du code peut prendre beaucoup de temps, veuillez être patient.

Référence :

Document officiel d'Alibaba Cloud : https://help.aliyun.com/document_detail/139598.html

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Php8, je viens aussi

Apprenez la mise en page d'un site Web en 30 minutes

Tutoriel vidéo Shangguan Oracle débutant à compétent

Votre première ligne de code UNI-APP

Flutter de zéro au lancement de l'application

Brother Lian Nouveau didacticiel vidéo Linux

Tutoriel vidéo AXURE 9 (convient à l'interface utilisateur interactive de conception de produits du chef de produit)

Tutoriel vidéo PS Zero Basic Proficiency

Tutoriel vidéo de 16 jours sur l'interface utilisateur pour vous aider à démarrer

Tutoriel vidéo sur les techniques PS et les techniques de découpage

Tutoriel vidéo sur la construction et le lancement de projets d'Alibaba Cloud Environment

Présentation des réseaux informatiques - Connaissances de base que les programmeurs doivent maîtriser

Tutoriel essentiel pour les programmeurs - Explication du protocole HTTP

Tutoriel vidéo Websocket

Python appelle l'interface Alibaba Cloud pour implémenter la fonction de reconnaissance audio