Python を使用して写真のフォント認識を実行する方法
フォント認識は、写真内のテキストを編集可能なテキストに変換するテクノロジーです。自動ドキュメント処理、テキスト抽出、OCR など、多くのアプリケーション シナリオで優れた実用性を備えています。この記事では、Python を使用して画像上のフォントを識別する方法と、対応するコード例を紹介します。
準備
まず、必要な Python ライブラリをいくつかインストールする必要があります。コマンド ラインで次のコマンドを入力してインストールします:
pip install pytesseract pip install pillow
その中で、pytesseract は Tesseract-OCR エンジンに基づく Python ライブラリで、写真内のテキストを識別するために使用されます; Pillow は一般的に使用される画像処理ですPython のライブラリ。画像処理に使用します。
まず、画像を読み取り、グレースケール処理を実行します。
from PIL import Image image = Image.open('image.jpg') gray_image = image.convert('L')
画像をグレースケールに変換します。グレースケール画像では、テキストと背景のコントラストがより明白になるため、役立ちます。認識精度を向上させるため。
次に、画像を 2 値化します。つまり、画像内のテキストを黒に、背景を白に処理します。
threshold = 150 binary_image = gray_image.point(lambda p: p > threshold and 255)
ここでの閾値は閾値であり、画像の明るさに応じて調整されます。
次に、画像に対してノイズ低減処理を実行して、干渉ノイズを除去します。
from PIL import ImageFilter denoised_image = binary_image.filter(ImageFilter.MinFilter)
MinFilter は、画像内のノイズを滑らかにすることができる最小値フィルターです。
最後に、前処理された画像を保存して表示できます:
denoised_image.save('processed_image.jpg') denoised_image.show()
上記は画像の前処理の手順です。前処理された画像をフォント認識エンジンに送信し、テキスト抽出を実行します。
フォント認識
フォント認識は、pytesseract ライブラリを使用すると非常に簡単です。処理された画像を入力として使用し、対応する関数を呼び出すだけです。
import pytesseract text = pytesseract.image_to_string(denoised_image, lang='eng') print(text)
このうち、denoized_image は前の手順で処理された画像で、lang パラメータは認識されたテキスト言語を示します。デフォルトは英語です。
完全なコード例
以下は、画像上のフォント認識のための完全な Python コード例です:
from PIL import Image, ImageFilter import pytesseract # 图片预处理 image = Image.open('image.jpg') gray_image = image.convert('L') threshold = 150 binary_image = gray_image.point(lambda p: p > threshold and 255) denoised_image = binary_image.filter(ImageFilter.MinFilter) denoised_image.save('processed_image.jpg') denoised_image.show() # 字体识别 text = pytesseract.image_to_string(denoised_image, lang='eng') print(text)
概要
これこの記事では、Python を使用して画像上のフォントを識別する方法を紹介し、対応するコード例を示します。 pytesseract ライブラリを前処理して呼び出すことで、画像からテキストを簡単かつ迅速に抽出し、その後のテキスト処理を実行できます。フォント認識は実用化に向けて幅広い応用が期待されており、この記事での紹介が読者の参考になれば幸いです。
以上がPython を使用して画像内のフォントを識別する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。