Python は Alibaba Cloud インターフェイスを呼び出して OCR テキスト抽出機能を実装します
Alibaba Cloud は、OCR (光学文字認識) テキスト認識インターフェイスを含む一連の強力な API を提供します。このインターフェイスを通じて、画像内のテキストを識別できます。これは、紙文書内のテキストを電子テキストに変換するなど、一部のテキスト抽出シナリオに非常に適しています。
この記事では、Python で Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。具体的な手順は次のとおりです。
ステップ 1: Alibaba Cloud SDK のインストール
Alibaba Cloud の API インターフェイスを呼び出すには、まず対応する SDK をインストールする必要があります。 Python では、pip コマンドを通じて Alibaba Cloud SDK をインストールできます。
ターミナルを開いて次のコマンドを入力します:
pip install aliyun-python-sdk-core pip install aliyun-python-sdk-ocr
ステップ 2: アクセス キーと秘密キーを取得する
Alibaba Cloud の API を呼び出すには、アクセス キーと秘密キーを指定する必要があります。秘密鍵 。これら 2 つの重要な情報は、Alibaba Cloud コンソールで申請して取得できます。これらの情報は両方とも安全な場所に保管してください。
ステップ 3: OCR インターフェイスを呼び出すコードを作成する
まず、関連するライブラリをインポートする必要があります:
import base64 import json import urllib import urllib.request from aliyunsdkcore import client from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest
次に、Alibaba Cloud クライアントを初期化します:
def create_aliyun_client(): access_key = "<Your Access Key>" secret_key = "<Your Secret Key>" region_id = "cn-hangzhou" return client.AcsClient(access_key, secret_key, region_id)
次に、OCR インターフェイスを呼び出す関数を作成します。
def ocr_character(image_path): app_key = "<Your App Key>" request = RecognizeCharacterRequest.RecognizeCharacterRequest() request.set_accept_format('json') with open(image_path, 'rb') as file: image_data = file.read() base64_data = base64.b64encode(image_data) request.set_ImageURL(base64_data) response = create_aliyun_client().do_action_with_exception(request) result = json.loads(response) print(result)
上記のコードでは、アクセス キー、シークレット キー、アプリ キーを置き換えて、必要な画像のパスを渡す必要があります。特定する。
最後に、ocr_character
関数を呼び出し、認識する必要がある画像のパスを渡します。
if __name__ == "__main__": image_path = "<Your Image Path>" ocr_character(image_path)
ここでは画像のローカル パスが使用されていることに注意してください。ネットワーク上の画像を識別したい場合は、その URL を使用する必要があります。また、Alibaba Cloud の OCR インターフェイスは現在サポートされている画像形式が限られており、一般的には JPEG または PNG 形式の画像を使用することをお勧めします。
概要:
この記事では、Python を使用して Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。このインターフェースを介して、画像内のテキストを電子テキストに簡単に変換できるため、作業効率が向上し、手動での文字起こし作業の一部が簡素化されます。
この記事がお役に立てば幸いです!
以上がPython は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。