PyPI には既製の音声認識パッケージがいくつかあります。
apiai
google-cloud-speech
pocketsphinx
SpeechRcognition
watson-developer-cloud
wit
一部のソフトウェア パッケージ (wit や apiai など) では、話者の意図を識別するための自然言語処理など、基本的な音声認識を超える機能が組み込まれています。 Google Cloud Speech などの他のソフトウェア パッケージは、音声からテキストへの変換に重点を置いています。
その中でも、SpeechRecognition はその使いやすさで際立っています。
音声の認識には音声入力が必要ですが、SpeechRecognition での音声入力の取得は非常に簡単です。マイクにアクセスして音声ファイルを最初から処理するためのスクリプトを構築する必要はありません。取得と音声ファイルの自動処理には数分しかかかりません。走る。
しかし、コマンド pip3 install SpeechRecognition を使用して関連する音声パッケージをインストールするときに、接続タイムアウトの問題が発生しました。
SpeechRecognitionの中核は認識クラスです。
Recognizer API の主な目的は、音声を認識することです。各 API には、オーディオ ソースの音声を認識するためのさまざまな設定と関数があります。つまり、
recognize_bing(): Microsoft Bing Speech
recognize_google( ): Google Web Speech API
recognize_google_cloud(): Google Cloud Speech - google-cloud-speech パッケージのインストールが必要
recognize_houndify(): SoundHound による Houndify
recognize_ibm(): IBM Speech to Text
recognize_sphinx() : CMU Sphinx - PocketSphinx のインストールが必要です
recognize_wit(): Wit.ai
上記の 7 つのうち、recognition_sphinx() のみが CMU Sphinx エンジンでオフラインで動作し、他の 6 つは CMU Sphinx エンジンに接続する必要があります。インターネット。
そこで、音声認識にrecognition_sphinx()を使用することにしました。
pip3 install PocketSphinx を使用して関連ライブラリをダウンロードすると、次の問題が発生しました:
多くの情報を確認しましたが、インストールはまだ失敗しました。 ! !pip3 install PocketSphinx
を使用する前に、sudo apt install python-pocketsphinx
を使用する必要があります。次に、pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple PocketSphinx
を使用します。このコマンドは正常にインストールされます。それでも失敗する場合は、コマンド sudo apt-get install python python-all-dev python-pip build-essential swig git libpulse-dev libasound2-dev
を使用できます。一般に、この問題は関連する依存関係が欠如しているために発生します。
以上がLinux で PocketSphinx をインストールする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。