僅在有人說話時錄製音頻是一項強大的功能,可用於各種應用程序,從語音激活助手到通過消除靜音期來節省存儲空間。在本教學中,您將學習如何編寫 Python 程式碼,在偵測到語音時開始錄音,並在偵測到靜音時停止錄音。
開始之前,請確保您具備以下條件:
我們將使用以下函式庫:
您可以使用 pip 安裝它們:
首先,讓我們設定音訊串流以捕捉來自麥克風的音訊輸入。
我們將使用 webrtcvad 函式庫來偵測某人何時說話。該庫可以將音訊幀分類為語音或非語音。
現在,讓我們連續捕獲音訊幀並檢查它們是否包含語音。
最後,讓我們將錄製的音訊儲存到 .wav 檔案。
僅用幾行程式碼,您就實現了一個 Python 程序,該程序可以檢測語音並僅記錄說話部分,忽略靜音部分。該技術對於創建高效的語音啟動系統特別有用。
請隨意嘗試 VAD 攻擊性和音訊設置,以滿足您的特定需求。快樂編碼! ?????
以上是如何在Python中錄製音訊:自動偵測語音和靜音的詳細內容。更多資訊請關注PHP中文網其他相關文章!