Rumah > pembangunan bahagian belakang > tutorial php > Panduan teknologi pengecaman OCR dalam PHP

Panduan teknologi pengecaman OCR dalam PHP

王林
Lepaskan: 2023-05-21 06:02:02
asal
1886 orang telah melayarinya

Dengan kemunculan era digital, banyak syarikat dan individu perlu mendigitalkan dokumen kertas. Teknologi pengecaman OCR (Optical Character Recognition, optical character recognition) merupakan salah satu kaedah yang berkesan untuk menyelesaikan masalah ini. PHP, sebagai bahasa sebelah pelayan yang popular, juga menyediakan beberapa perpustakaan dan alatan untuk pengecaman OCR. Artikel ini akan memperkenalkan berbilang teknologi pengecaman OCR dalam PHP untuk memilih penyelesaian yang paling sesuai.

1. tesseract-ocr

tesseract-ocr ialah perpustakaan enjin OCR sumber terbuka popular yang ditulis dalam C++. PHP menyediakan integrasi dengan tesseract-ocr. Imej dalam PDF, JPEG, GIF, PNG dan format lain boleh dikenali melalui php-ext-tesseract. Ciri terbesar tesseract-ocr ialah ia direka untuk berbilang bahasa dan boleh mengecam teks dalam kebanyakan bahasa di dunia.

Penggunaan:

<?php
    require_once __DIR__.'/vendor/autoload.php';
    use thiagoalessioTesseractOCRTesseractOCR;

    $result = (new TesseractOCR('example.png'))
                    ->run();
    echo $result;
?>
Salin selepas log masuk

2. OCRopus

OCRopus ialah satu set alat dan perpustakaan OCR serta enjin OCR yang popular, yang berasaskan Python. OCRopus boleh menggunakan operasi pengikatan PHP. Ia bukan sahaja menyokong pengecaman teks, tetapi juga melaksanakan tugas pemprosesan OCR yang komprehensif seperti pengelasan dokumen, pembahagian dan penetapan taip.

Penggunaan:

<?php
    $image = new Imagick();
    $image->readImage('example.png');
    $image->setImageFormat('tif');
    $image->thresholdImage(127); //图像二值化
    $data = $image->getImagesBlob();
    $ocr = new     esseractOCR($data);
    echo $ocr->run();
?>
Salin selepas log masuk

3. Google Cloud Vision OCR

Google Cloud Vision API ialah set alat penglihatan mesin yang menyepadukan perkhidmatan OCR. API ini menyediakan keupayaan penglihatan komputer dan pengecaman imej Google Cloud Vision OCR boleh membantu kami mengenal pasti teks dan aksara dalam imej. Perlu diingat bahawa menggunakan perkhidmatan ini memerlukan pendaftaran akaun Google dan mendapatkan kunci API, dan bilangan penggunaan akan dikenakan bayaran.

Penggunaan:

<?php
    require_once __DIR__ . '/vendor/autoload.php';
    use GoogleCloudVisionV1ImageAnnotatorClient;

    $imageAnnotator = new ImageAnnotatorClient();

    try {
        # 图像文件的本地路径或者 URL 地址,即待识别的图像文件路径
        $image = file_get_contents('https://example.com/image.jpg');
        # 构建图像标注请求
        $response = $imageAnnotator->documentTextDetection($image);
        # 输出结果
        foreach ($response->getTextAnnotations() as $text) {
            printf('%s' . PHP_EOL, $text->getDescription());
        }
    } catch (Exception $exception) {
        echo $exception->getMessage();
    }
?>
Salin selepas log masuk

Di atas ialah tiga teknologi OCR yang popular dalam PHP. Sudah tentu, kami juga boleh menggunakan perpustakaan atau API lain untuk pengecaman imej OCR. Setiap teknologi ini mempunyai kelebihan dan kekurangannya dan perlu dipilih berdasarkan keperluan tertentu. Tidak kira kaedah yang anda pilih, kaedah ini boleh membantu kami mendigitalkan dokumen kertas dengan cepat dan tepat, meningkatkan kecekapan kerja, mengurangkan kos dan membawa nilai sebenar kepada perniagaan dan individu.

Atas ialah kandungan terperinci Panduan teknologi pengecaman OCR dalam PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan