Contoh Penglihatan Komputer dalam Python: Pengecaman Teks

WBOY
Lepaskan: 2023-06-10 13:53:11
asal
2639 orang telah melayarinya

Dengan perkembangan berterusan teknologi penglihatan komputer, semakin banyak senario aplikasi muncul. Antaranya, pengecaman teks merupakan aplikasi penting dalam penglihatan komputer dan telah digunakan secara meluas dalam semua lapisan masyarakat. Artikel ini akan memperkenalkan contoh pengecaman teks dalam Python dan membincangkan teknologi utama.

1. Senario aplikasi pengecaman teks

Pengecaman teks ialah proses menukar teks dalam imej kepada teks elektronik yang boleh diedit. Dalam kehidupan sebenar, pengecaman teks boleh digunakan dalam berbilang senario, seperti:

  1. Pengecaman tulisan tangan: secara automatik mengecam dan menukar nota tulisan tangan, huruf dan tulisan tangan dalam kontrak kepada teks elektronik.
  2. Pengecaman teks dalam gambar: Tukar teks dalam gambar kepada teks elektronik yang boleh diedit, seperti buku di perpustakaan, papan tanda stesen, papan iklan, iklan TV, dsb.
  3. Pengiktirafan nombor: Tukar nombor dalam dokumen kertas kepada teks elektronik yang boleh diedit, seperti bil dan bahan pensijilan di bank dan syarikat insurans.

2. Contoh pengecaman teks dalam Python

Python ialah bahasa pengaturcaraan popular yang juga digunakan secara meluas dalam bidang penglihatan komputer. Terdapat banyak perpustakaan sumber terbuka dan alatan dalam Python yang boleh membantu kami melaksanakan proses pengecaman teks. Artikel ini akan memperkenalkan contoh penggunaan Python untuk melaksanakan pengecaman teks.

  1. Gunakan Tesseract OCR untuk pengecaman teks

Tesseract OCR ialah enjin pengecaman teks sumber terbuka yang boleh mengecam teks termasuk berbilang bahasa. Sangat mudah untuk menggunakan Tesseract OCR dalam Python, kami hanya perlu memasang pustaka pytesseract dan enjin Tesseract OCR. Berikut ialah contoh kod untuk pengecaman teks menggunakan Tesseract OCR:

import pytesseract
from PIL import Image

image = Image.open('example.png')
text = pytesseract.image_to_string(image)
print(text)
Salin selepas log masuk
  1. Pengecaman teks menggunakan OpenCV

OpenCV ialah perpustakaan penglihatan komputer yang berkuasa yang menyediakan banyak Fungsi untuk pemprosesan imej dan analisis. Proses menggunakan OpenCV untuk pengecaman teks dalam Python boleh dibahagikan kepada langkah berikut:

(1) Baca imej dan lakukan prapemprosesan, seperti perduaan, penapisan Gaussian, dsb.

(2) Lakukan pengesanan tepi pada imej.

(3) Cari kawasan teks dalam imej.

(4) Lakukan pengecaman teks OCR pada kawasan teks.

Berikut ialah contoh kod menggunakan OpenCV untuk pengecaman teks:

import cv2
import pytesseract

def preprocess_image(image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)
    edges = cv2.Canny(blurred, 50, 200)
    return edges

def find_text_regions(image):
    contours, hierarchy = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    regions = []
    for contour in contours:
        (x, y, w, h) = cv2.boundingRect(contour)
        if w > h and w > 50 and h > 15:
            region = image[y:y+h, x:x+w]
            regions.append(region)
    return regions

image = cv2.imread('example.png')
preprocessed_image = preprocess_image(image)
text_regions = find_text_regions(preprocessed_image)

for region in text_regions:
    text = pytesseract.image_to_string(region)
    print(text)
Salin selepas log masuk

3 Teknologi utama untuk pengecaman teks

  1. prapemprosesan imej
<.>Prapemprosesan imej ialah salah satu langkah utama dalam pengecaman teks, yang boleh meningkatkan ketepatan pengecaman teks. Kaedah prapemprosesan imej biasa termasuk perduaan, penapisan Gaussian, hakisan dan pengembangan.

    Pengesanan Tepi
Pengesanan tepi ialah salah satu langkah utama dalam mencari kawasan teks. Kaedah pengesanan tepi biasa termasuk pengesanan tepi Canny, pengesanan tepi Sobel dan kaedah lain.

    Pengesanan kawasan teks
Pengesanan kawasan teks ialah salah satu langkah utama untuk mencari kawasan teks. Kaedah pengesanan kawasan teks biasa termasuk algoritma berdasarkan kawasan bersambung, algoritma berdasarkan pengesanan tepi dan kaedah lain.

    Pengecaman teks OCR
Pengecaman teks OCR ialah proses menukar aksara dalam kawasan teks kepada teks elektronik yang boleh diedit. Enjin pengecaman teks OCR biasa termasuk Tesseract OCR, OCRopus, dsb.

Kesimpulan

Artikel ini memperkenalkan contoh pengecaman teks dalam Python dan membincangkan teknologi utama. Pengecaman teks ialah aplikasi penting yang boleh digunakan dalam semua lapisan masyarakat untuk membantu kami meningkatkan kecekapan kerja dan meningkatkan kebolehbacaan dokumen.

Atas ialah kandungan terperinci Contoh Penglihatan Komputer dalam Python: Pengecaman Teks. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan