Pejabat: Ekstrak teks daripada gambar
Microsoft mempunyai pakej komponen yang dipanggil "Pengimejan Dokumen Microsoft Office" antara komponen alat dalam Microsoft Office 2003. Komponen ini mengandungi ciri yang sangat berguna yang secara langsung melaksanakan pengecaman aksara optik (OCR). Dengan ciri ini, pengguna boleh mengekstrak teks daripada imej. Di bawah saya akan memperkenalkan kepada anda cara menggunakan fungsi OCR baharu dalam Office 2003 untuk pengekstrakan teks.
Langkah 1: Kita perlu memasang komponen "Pengimejan Dokumen Microsoft Office", klik "Mula → Program", klik "Pengimejan Dokumen Microsoft Office" dalam "Alat Microsoft Office" untuk memasang dan menjalankan (seperti yang ditunjukkan dalam Rajah 1).
Langkah 2: Buka gambar atau e-buku dengan teks, cari halaman yang ingin anda ekstrak dan tekan kekunci Cetak Skrin (Skrin Cetak) pada papan kekunci untuk mengambil tangkapan skrin.
Langkah ketiga ialah membuka Microsoft Office Word 2003 dan tampalkan tangkapan skrin tadi; Pengimejan". Pencetak penulis. Seperti yang ditunjukkan dalam Rajah 2, pilih pencetak "Penulis Pengimejan Dokumen Microsoft Office" dalam kotak senarai juntai bawah "Pencetak" Tiada tetapan tambahan diperlukan untuk pilihan lain Selepas mengklik butang "OK", tetapkan laluan keluaran fail dan nama fail (lalai Menggunakan nama fail sumber), dokumen format MDI boleh dijana secara automatik tidak lama lagi.
Gambar 2 Pilih pencetak
Buka fail jenis MDI yang baru anda simpan (seperti yang ditunjukkan dalam Rajah 3), gunakan tetikus untuk memilih kandungan teks mengikut keperluan anda (kandungan yang dipilih adalah dalam kotak merah), kemudian klik kanan tetikus dan pilih daripada menu pintasan pop timbul "Hantar teks ke Word" secara automatik akan menukar kandungan imej kepada dokumen Word baharu, dan kemudian anda boleh mengeditnya sesuka hati dalam dokumen Word.
Rajah 3 Hantar teks ke Word
Petua: Jika anda tidak mahu memasukkan kandungan yang ditukar ke dalam dokumen Word baharu, tetapi ingin menampalnya ke dalam dokumen Word yang sudah terbuka, cuma klik "Salin" pada menu klik kanan dalam operasi di atas, dan kemudian pergi untuk Tentukan Hanya tampalkannya ke dalam dokumen.
Caranya adalah seperti berikut:
1 Mula-mula, buka alat media "Notepad", salin dan tampal data yang akan diimport daripada fail perkataan ke dalam Notepad, dan kemudian simpannya sebagai fail txt Dalam contoh ini, namakan fail txt "1.txt". .
2. Buka jadual excel, klik tab "Data", dan cari "Teks Diri" dalam "Dapatkan Data Luaran".
3 Klik "Dari Teks", tetingkap seterusnya akan muncul, pilih fail jenis txt bernama 1 yang baru anda simpan, dan klik "Import". Oleh kerana hanya terdapat tiga jenis fail txt, csv dan prn yang tersedia untuk import data dalam mod "teks kendiri", anda perlu menukar perkataan kepada txt terlebih dahulu.
4 Kotak dialog import teks muncul dan pilih lebar tetap lalai, yang bermaksud bahawa data sepadan dengan sel satu-satu. Jika anda memilih pembatas, semua data yang diimport akan berada dalam satu sel, kemudian klik Seterusnya.
5. Menetapkan talian cawangan sebenarnya untuk mengawal bilangan lajur data yang diimport Anda boleh menambah garisan cawangan di mana-mana kedudukan dengan mengklik tetikus. Klik dua kali mana-mana baris cawangan untuk memadamnya. Selepas melengkapkan tetapan, klik Seterusnya.
6. Tetapkan format data output Secara amnya, tiada tetapan diperlukan. Hanya pilih Umum dan klik "Selesai".
7. Import selesai.
Atas ialah kandungan terperinci Bagaimana untuk mengeksport teks dalam foto. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!