Dengan perkembangan berterusan teknologi penglihatan komputer, semakin banyak senario aplikasi muncul. Antaranya, pengecaman teks merupakan aplikasi penting dalam penglihatan komputer dan telah digunakan secara meluas dalam semua lapisan masyarakat. Artikel ini akan memperkenalkan contoh pengecaman teks dalam Python dan membincangkan teknologi utama.
1. Senario aplikasi pengecaman teks
Pengecaman teks ialah proses menukar teks dalam imej kepada teks elektronik yang boleh diedit. Dalam kehidupan sebenar, pengecaman teks boleh digunakan dalam berbilang senario, seperti:
2. Contoh pengecaman teks dalam Python
Python ialah bahasa pengaturcaraan popular yang juga digunakan secara meluas dalam bidang penglihatan komputer. Terdapat banyak perpustakaan sumber terbuka dan alatan dalam Python yang boleh membantu kami melaksanakan proses pengecaman teks. Artikel ini akan memperkenalkan contoh penggunaan Python untuk melaksanakan pengecaman teks.
Tesseract OCR ialah enjin pengecaman teks sumber terbuka yang boleh mengecam teks termasuk berbilang bahasa. Sangat mudah untuk menggunakan Tesseract OCR dalam Python, kami hanya perlu memasang pustaka pytesseract dan enjin Tesseract OCR. Berikut ialah contoh kod untuk pengecaman teks menggunakan Tesseract OCR:
import pytesseract from PIL import Image image = Image.open('example.png') text = pytesseract.image_to_string(image) print(text)
OpenCV ialah perpustakaan penglihatan komputer yang berkuasa yang menyediakan banyak Fungsi untuk pemprosesan imej dan analisis. Proses menggunakan OpenCV untuk pengecaman teks dalam Python boleh dibahagikan kepada langkah berikut:
(1) Baca imej dan lakukan prapemprosesan, seperti perduaan, penapisan Gaussian, dsb.
(2) Lakukan pengesanan tepi pada imej.
(3) Cari kawasan teks dalam imej.
(4) Lakukan pengecaman teks OCR pada kawasan teks.
Berikut ialah contoh kod menggunakan OpenCV untuk pengecaman teks:
import cv2 import pytesseract def preprocess_image(image): gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blurred = cv2.GaussianBlur(gray, (5, 5), 0) edges = cv2.Canny(blurred, 50, 200) return edges def find_text_regions(image): contours, hierarchy = cv2.findContours(image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) regions = [] for contour in contours: (x, y, w, h) = cv2.boundingRect(contour) if w > h and w > 50 and h > 15: region = image[y:y+h, x:x+w] regions.append(region) return regions image = cv2.imread('example.png') preprocessed_image = preprocess_image(image) text_regions = find_text_regions(preprocessed_image) for region in text_regions: text = pytesseract.image_to_string(region) print(text)
3 Teknologi utama untuk pengecaman teks
Atas ialah kandungan terperinci Contoh Penglihatan Komputer dalam Python: Pengecaman Teks. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!