


Bagaimana Saya Boleh Dapatkan Pemformatan Teks (Fon, Saiz, Gaya) daripada PDF Menggunakan iTextSharp?
Jan 11, 2025 am 10:56 AMCara mengekstrak format teks menggunakan iTextSharp
Walaupun iTextSharp menyediakan kaedah pengekstrakan teks yang cekap, ia mungkin mempunyai kelemahan dalam mengekalkan butiran pemformatan seperti fon, warna dan saiz. Untuk mengatasi batasan ini, kami meneroka pendekatan alternatif.
Strategi pengekstrakan teks tersuai
Kelas TextWithFontExtractionStategy
tersuai memanjangkan antara muka ITextExtractionStrategy
untuk menangkap maklumat format. Dalam kaedah RenderText
:
- Ia memantau nama fon, penggunaan pseudo-bold, perubahan garis dasar dan perubahan saiz fon.
- Jika mana-mana atribut ini berubah, ia akan menutup teg span HTML semasa dan mencipta yang baharu dengan gaya yang sepadan.
Contoh output
Kod C# berikut menunjukkan cara mengekstrak teks dan pemformatan berkaitan fon daripada PDF:
1 2 3 4 5 |
|
Output HTML yang dijana mengandungi teg untuk keluarga fon, saiz fon dan gaya fon.
Pertimbangan lain
-
PostscriptFontName
mungkin mengandungi aksara tambahan, yang mungkin berkaitan dengan subset fon. - Kod contoh menganggap bahawa perubahan dalam garis dasar mewakili baris baharu dalam HTML.
- Proses pengekstrakan pada masa ini tidak menangkap maklumat warna, tetapi terdapat tanda-tanda bahawa ini boleh dicapai secara manual.
Atas ialah kandungan terperinci Bagaimana Saya Boleh Dapatkan Pemformatan Teks (Fon, Saiz, Gaya) daripada PDF Menggunakan iTextSharp?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Artikel Panas

Alat panas Tag

Artikel Panas

Tag artikel panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Langkah Format Fungsi Fungsi C Langkah Penukaran Kes

Gulc: Perpustakaan C dibina dari awal

Apakah jenis nilai yang dikembalikan oleh fungsi bahasa C? Apa yang menentukan nilai pulangan?

Apakah definisi dan peraturan panggilan fungsi bahasa C dan apakah itu

Bagaimana Perpustakaan Templat St Standard (STL) berfungsi?

Di manakah nilai pulangan fungsi bahasa C yang disimpan dalam ingatan?

Penggunaan dan perkongsian frasa yang berbeza

Bagaimanakah saya menggunakan algoritma dari STL (jenis, mencari, mengubah, dll) dengan cekap?
