首頁 > 後端開發 > Python教學 > Python語言實現百度語音辨識功能的實例

Python語言實現百度語音辨識功能的實例

小云云
發布: 2017-12-14 11:29:17
原創
2781 人瀏覽過

未來的一段時間,人工智慧在市場上佔有很重的位置,Python語言則是研究人工智慧的最佳程式語言,下面,就讓我們來感受一下它的魅力吧!

百度給的範例程序,無論C或Java版,都分為method1和method2兩種,前者稱為隱式(post的是json串,音訊資料編碼到json裡),後者稱為顯式(post的就是音訊資料)本文主要介紹了Python語言實現百度語音辨識API的使用實例,具有一定藉鏡價值,需要的朋友可以參考下,希望能幫助大家。

一開始考慮到pythonwave包處理的都是“字串”,擔心跟C語言的數組不一致,所以選擇低效但保險的method1,

即先將音頻數據base64編碼,再加上取樣率、通道數等資訊匯集集成dict,最後總體編碼成json字串

結果老是報:

#3300輸入參數不正確

先後試過urllib2和pycurl包,都是上面情況

不得已換用method2,成功(看來wave包對音頻的存儲並不是“字符串”)

#encoding=utf-8 
import wave 
import urllib, urllib2, pycurl 
import base64 
import json 
## get access token by api key & secret key 
 
def get_token(): 
  apiKey = "xxxxxxxx" 
  secretKey = "xxxxxxxxx" 
  auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey; 
  res = urllib2.urlopen(auth_url) 
  json_data = res.read() 
  return json.loads(json_data)['access_token'] 
 
def dump_res(buf): 
  print buf 
## post audio to server 
def use_cloud(token): 
  fp = wave.open('vad_0.wav', 'rb') 
  nf = fp.getnframes() 
  f_len = nf * 2 
  audio_data = fp.readframes(nf) 
 
  cuid = "xxxxxxxxxx" #my xiaomi phone MAC 
  srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token 
  http_header = [ 
    'Content-Type: audio/pcm; rate=8000', 
    'Content-Length: %d' % f_len 
  ] 
  c = pycurl.Curl() 
  c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode 
  #c.setopt(c.RETURNTRANSFER, 1) 
  c.setopt(c.HTTPHEADER, http_header)  #must be list, not dict 
  c.setopt(c.POST, 1) 
  c.setopt(c.CONNECTTIMEOUT, 30) 
  c.setopt(c.TIMEOUT, 30) 
  c.setopt(c.WRITEFUNCTION, dump_res) 
  c.setopt(c.POSTFIELDS, audio_data) 
  c.setopt(c.POSTFIELDSIZE, f_len) 
  c.perform() #pycurl.perform() has no return val  
if __name__ == "__main__": 
  token = get_token() 
  use_cloud(token)
登入後複製

運行結果

{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小苹果,"],"sn":"243903724071431919050"}
登入後複製

#相關推薦:

.Net開發之微信公有平台語音辨識實例詳解

淺析如何利用JavaScript進行語音辨識

#HTML5語音辨識標籤寫法附圖_html5教學技巧

以上是Python語言實現百度語音辨識功能的實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板