ノードが ocr を実装する方法の簡単な分析-jsチュートリアル-php.cn

ノードが ocr を実装する方法の簡単な分析

青灯夜游

リリース： 2022-10-31 19:09:40

転載

1552 人が閲覧しました

ocr (光学式文字認識) を実装するにはどうすればよいですか?次の記事では、node を使用して OCR を実装する方法を紹介します。

ノードが ocr を実装する方法の簡単な分析

#ocr は光学式文字認識で、簡単に言えば、画像上の文字を認識することです。

残念ながら、私は単なる低レベルの Web プログラマーです。AI についてはあまり知りません。OCR を実装したい場合は、サードパーティのライブラリしか見つかりません。

Python 言語には OCR 用のサードパーティライブラリが多数あります。私は長い間、nodejs で OCR を実装するためのサードパーティライブラリを探していました。最終的に、ライブラリ tesseract.js を見つけました。 OCR は依然として非常に便利に実装できます。 [関連チュートリアルの推奨事項: nodejs ビデオチュートリアル ]

効果の表示

オンライン例: http://www.lolmbbs.com/tool/ ocr

ノードが ocr を実装する方法の簡単な分析

詳細コード

tesserract.js このライブラリには複数のバージョンが用意されており、ここではオフラインのものを使用します。バージョン tesseract.js-offline では、結局のところ、誰もがネットワークの状態が悪いことに悩まされています。
ノードが ocr を実装する方法の簡単な分析
#デフォルトのサンプルコード

const { createWorker } = require('tesseract.js');
const path = require('path');

const worker = createWorker({
  langPath: path.join(__dirname, '..', 'lang-data'), 
  logger: m => console.log(m),
});

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize(path.join(__dirname, '..', 'images', 'testocr.png'));
  console.log(text);
  await worker.terminate();
})();

ログイン後にコピー

1. 多言語認識のサポート

tesseract.js オフラインバージョンのデフォルト例このコードは英語の認識のみをサポートしていますが、中国語を認識すると、結果は疑問符の塊になります。しかし幸いなことに、複数のトレーニング済み言語モデルをインポートして、複数の言語の認識をサポートできます。

必要な対応する言語モデルを https://github.com/naptha/tessdata/tree/gh-pages/4.0.0 からダウンロードし、ルートディレクトリに置きます。 lang-data ディレクトリ
中国語 (
chi_sim.traineddata.gz) 日本語 (jpn.traineddata.gz) 英語 (eng.traineddata.gz ) を選択しました。 ) 3 か国の言語モデル。
コード内のモデルの読み込みと初期化の言語項目構成を変更して、中国語、日本語、英語の言語を同時にサポートします。

await worker.loadLanguage('chi_sim+jpn+eng');
await worker.initialize('chi_sim+jpn+eng');

ログイン後にコピー

皆さんのテストを容易にするために、オフラインバージョンには、中国、日本、韓国の 3 か国語でのトレーニングモデル、サンプルコード、テスト画像が含まれています。例。

https://github.com/Selenium39/tesseract.js-offline

2. 認識パフォーマンスの向上

オフラインバージョンを実行すると、モデルの読み込みと OCR の認識が少し遅いことがわかります。これら 2 つのステップを通じて最適化できます。

Web プロジェクトでは、アプリケーションの開始後すぐにモデルをロードできるため、後で OCR リクエストを受信したときにモデルがロードされるまで待つ必要がありません。。
「tesseract.js v2 をリファクタリングする理由」このブログを参照してください。
createScheduler メソッドを使用して複数のワーカースレッドを追加し、ocr リクエストを同時に処理できます。

OCR リクエストのマルチスレッド同時処理の例

const Koa = require('koa')
const Router = require('koa-router')
const router = new Router()
const app = new Koa()
const path = require('path')
const moment = require('moment')
const { createWorker, createScheduler } = require('tesseract.js')

;(async () => {
  const scheduler = createScheduler()
  for (let i = 0; i < 4; i++) {
    const worker = createWorker({
      langPath: path.join(__dirname, '.', 'lang-data'),
      cachePath: path.join(__dirname, '.'),
      logger: m => console.log(`${moment().format('YYYY-MM-DD HH:mm:ss')}-${JSON.stringify(m)}`)
    })
    await worker.load()
    await worker.loadLanguage('chi_sim+jpn+eng')
    await worker.initialize('chi_sim+jpn+eng')
    scheduler.addWorker(worker)
  }
  app.context.scheduler = scheduler
})()

router.get('/test', async (ctx) => {
  const { data: { text } } = await ctx.scheduler.addJob('recognize', path.join(__dirname, '.', 'images', 'chinese.png'))
  // await ctx.scheduler.terminate()
  ctx.body = text
})

app.use(router.routes(), router.allowedMethods())
app.listen(3002)

ログイン後にコピー

同時リクエストを開始すると、複数のワーカーが OCR タスクを同時に実行していることがわかります

ab -n 4 -c 4 localhost:3002/test

ノードが ocr を実装する方法の簡単な分析