Python プログラミングを使用して Baidu OCR インターフェイス ドッキングを実装し、写真からテキストを抽出する方法を説明します
前書き:
テクノロジーの継続的な発展に伴い、人工知能 知能の応用はますます広がっています。中でも、テキスト認識 (OCR) 技術の応用は特に重要であり、画像からテキストを抽出し、自動処理を実現するのに役立ちます。 Baidu OCR インターフェイスは現在非常に人気のあるテキスト認識テクノロジです。この記事では、Python プログラミングを使用して Baidu OCR インターフェイスに接続し、画像からテキストを抽出する方法を説明します。
まず、Baidu OCR アカウントを作成する必要があります。 Baidu Developer Center (https://cloud.baidu.com/) にアクセスし、アカウントを登録し、新しいアプリケーションを作成します。
次に、Baidu OCR Python SDK をインストールする必要があります。これは、テキスト処理を容易にするために、Baidu OCR インターフェイスとの対話ロジックをカプセル化します。手術。
ターミナルまたはコマンド プロンプトを開き、次のコマンドを実行して SDK をインストールします。
pip install baidu-aip
Python ファイル内で、必要なライブラリをインポートし、API キーを設定します。 API キーは、Baidu OCR アカウントで作成したアプリケーションが所有するキーであり、ID を認証するために使用されます。コード例は次のとおりです。
from aip import AipOcr # 设置APPID/AK/SK APP_ID = 'your_app_id' API_KEY = 'your_api_key' SECRET_KEY = 'your_secret_key' # 创建AipOcr对象 client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
上記のコードのyour_app_id
、your_api_key
、your_secret_key
を、Baidu で作成したアプリケーションに置き換えます。 OCR アカウント 対応する API キー。
次に、認識される画像を読み取り、Baidu OCR インターフェイスを呼び出して画像内のテキストを抽出する必要があります。
def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 读取图片 image = get_file_content('your_image_path') # 调用文字识别接口 result = client.basicGeneral(image) # 提取文字 words = [] for item in result['words_result']: words.append(item['words']) # 打印文字 for word in words: print(word)
上記のコードのyour_image_path
を、識別する画像のパスに置き換えます。
上記の手順を完了したら、Python ファイルを実行してテストし、画像から抽出されたテキストを確認できます。
概要:
この記事では、Python プログラミングを使用して Baidu OCR インターフェイス ドッキングを実装し、画像からテキストを抽出する手順を紹介します。さらに、必要に応じて他の Baidu OCR インターフェイスを呼び出して、より多くのテキスト認識機能を実現できます。この記事があなたのお役に立ち、プロジェクト開発に少しでも役立つことを願っています。
参考リンク: https://cloud.baidu.com/doc/OCR/index.html
コードサンプルリンク: https://github.com/baidu-aip/python- SDK
以上がPython プログラミングを使用して Baidu OCR インターフェイス ドッキングを実装し、画像からテキストを抽出する方法を教えますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。