Rumah pembangunan bahagian belakang C++ Bagaimana Saya Boleh Dapatkan Pemformatan Teks (Fon, Saiz, Gaya) daripada PDF Menggunakan iTextSharp?

Bagaimana Saya Boleh Dapatkan Pemformatan Teks (Fon, Saiz, Gaya) daripada PDF Menggunakan iTextSharp?

Jan 11, 2025 am 10:56 AM

How Can I Retrieve Text Formatting (Font, Size, Style) from a PDF Using iTextSharp?

Cara mengekstrak format teks menggunakan iTextSharp

Walaupun iTextSharp menyediakan kaedah pengekstrakan teks yang cekap, ia mungkin mempunyai kelemahan dalam mengekalkan butiran pemformatan seperti fon, warna dan saiz. Untuk mengatasi batasan ini, kami meneroka pendekatan alternatif.

Strategi pengekstrakan teks tersuai

Kelas TextWithFontExtractionStategy tersuai memanjangkan antara muka ITextExtractionStrategy untuk menangkap maklumat format. Dalam kaedah RenderText:

  • Ia memantau nama fon, penggunaan pseudo-bold, perubahan garis dasar dan perubahan saiz fon.
  • Jika mana-mana atribut ini berubah, ia akan menutup teg span HTML semasa dan mencipta yang baharu dengan gaya yang sepadan.

Contoh output

Kod C# berikut menunjukkan cara mengekstrak teks dan pemformatan berkaitan fon daripada PDF:

1

2

3

4

5

StringBuilder result = new StringBuilder();

PdfReader reader = new PdfReader(System.IO.Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "Document.pdf"));

TextWithFontExtractionStategy S = new TextWithFontExtractionStategy();

string F = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(reader, 1, S);

Console.WriteLine(F);

Salin selepas log masuk

Output HTML yang dijana mengandungi teg untuk keluarga fon, saiz fon dan gaya fon.

Pertimbangan lain

  • PostscriptFontName mungkin mengandungi aksara tambahan, yang mungkin berkaitan dengan subset fon.
  • Kod contoh menganggap bahawa perubahan dalam garis dasar mewakili baris baharu dalam HTML.
  • Proses pengekstrakan pada masa ini tidak menangkap maklumat warna, tetapi terdapat tanda-tanda bahawa ini boleh dicapai secara manual.

Atas ialah kandungan terperinci Bagaimana Saya Boleh Dapatkan Pemformatan Teks (Fon, Saiz, Gaya) daripada PDF Menggunakan iTextSharp?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Tag artikel panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Langkah Format Fungsi Fungsi C Langkah Penukaran Kes Langkah Format Fungsi Fungsi C Langkah Penukaran Kes Mar 03, 2025 pm 05:53 PM

Langkah Format Fungsi Fungsi C Langkah Penukaran Kes

Gulc: Perpustakaan C dibina dari awal Gulc: Perpustakaan C dibina dari awal Mar 03, 2025 pm 05:46 PM

Gulc: Perpustakaan C dibina dari awal

Apakah jenis nilai yang dikembalikan oleh fungsi bahasa C? Apa yang menentukan nilai pulangan? Apakah jenis nilai yang dikembalikan oleh fungsi bahasa C? Apa yang menentukan nilai pulangan? Mar 03, 2025 pm 05:52 PM

Apakah jenis nilai yang dikembalikan oleh fungsi bahasa C? Apa yang menentukan nilai pulangan?

Apakah definisi dan peraturan panggilan fungsi bahasa C dan apakah itu Apakah definisi dan peraturan panggilan fungsi bahasa C dan apakah itu Mar 03, 2025 pm 05:53 PM

Apakah definisi dan peraturan panggilan fungsi bahasa C dan apakah itu

Bagaimana Perpustakaan Templat St Standard (STL) berfungsi? Bagaimana Perpustakaan Templat St Standard (STL) berfungsi? Mar 12, 2025 pm 04:50 PM

Bagaimana Perpustakaan Templat St Standard (STL) berfungsi?

Di manakah nilai pulangan fungsi bahasa C yang disimpan dalam ingatan? Di manakah nilai pulangan fungsi bahasa C yang disimpan dalam ingatan? Mar 03, 2025 pm 05:51 PM

Di manakah nilai pulangan fungsi bahasa C yang disimpan dalam ingatan?

Penggunaan dan perkongsian frasa yang berbeza Penggunaan dan perkongsian frasa yang berbeza Mar 03, 2025 pm 05:51 PM

Penggunaan dan perkongsian frasa yang berbeza

Bagaimanakah saya menggunakan algoritma dari STL (jenis, mencari, mengubah, dll) dengan cekap? Bagaimanakah saya menggunakan algoritma dari STL (jenis, mencari, mengubah, dll) dengan cekap? Mar 12, 2025 pm 04:52 PM

Bagaimanakah saya menggunakan algoritma dari STL (jenis, mencari, mengubah, dll) dengan cekap?

See all articles