Python コードは画像テキスト認識を実装します-Python チュートリアル-php.cn

Python コードは画像テキスト認識を実装します

零到壹度

リリース： 2018-04-02 14:12:09

オリジナル

2717 人が閲覧しました

この記事は、画像テキスト認識を実装するための Python コードを共有します。その内容は、困っている友人に役立つことを願っています

必要な画像を例に挙げます。認識するには

Python コードは画像テキスト認識を実装します

まずレンダリングを見てみましょう

Python コードは画像テキスト認識を実装しますコードを実行した後の認識結果は、正しく認識されない単語がいくつかありますが、ほとんどの単語は認識できます。

风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

ログイン後にコピー

1 行のコードで画像を認識できますが、舞台裏でいくつかの準備作業を行う必要があります

ここでは、pytesseract と PIL の 2 つのライブラリを使用する必要があります
同時に、認識エンジン tesseract-ocr

これらのライブラリのインストールについて話しましょう。これらのライブラリがインストールされて初めて、Python は 1 行のコードで画像とテキストの認識を実現できるからです

まず、pytesseract と PIL のインストールです

これら 2 つのパッケージは、pip を使用してインストールできます

- 1. コマンドラインインストール
pip install PIL
pip install pytesseract
- 2. pycharm エディターを使用する場合は、pycharm を直接使用して迅速にインストールできます。
pycharm の設定ページで次の手順に従ってください

Python コードは画像テキスト認識を実装しますこのようにして、PIL をインストールするには、上記の 3 番目の手順で PIL を検索し、[インストール] をクリックするだけです

これで、ライブラリをインストールし、次のコードを実行すると

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open(&#39;denggao.jpeg&#39;),lang=&#39;chi_sim&#39;)
print(text)

ログイン後にコピー

、次のエラーが報告されます。エラーの理由は、認識エンジン tesseract-ocr がインストールされていません

Python コードは画像テキスト認識を実装します

次に、認識エンジン tesseract-ocr をインストールします

1. 以下のインストールパッケージをダウンロードし、直接クリックしてインストールします
tesseract-ocr インストールパッケージと中国語パッケージ

tesseract-ocr を解凍してインストールし、中国語の認識をサポートするには次の手順を実行します。 tesseract-ocr はデフォルトでは中国語の認識をサポートしていないためです。

Python コードは画像テキスト認識を実装します

2. tesseract-ocrをインストールした後、いくつかの設定を行う必要があります
C:UsershuxiuAppDataLocalProgramsPythonPython35Libsite-packagespytesseractでpytesseract.pyを見つけて開き、次の操作を実行します

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = &#39;tesseract&#39;
tesseract_cmd = &#39;C:/Program Files (x86)/Tesseract-OCR/tesseract.exe&#39;

ログイン後にコピー

以上がPython コードは画像テキスト認識を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。