Dengan perkembangan teknologi Internet yang berterusan, kami semakin menggunakan pelbagai dokumen dan bahan dalam talian untuk belajar dan bekerja. Walau bagaimanapun, kadangkala kita perlu menukar beberapa halaman web format HTML atau dokumen dalam talian ke dalam fail format PDF untuk pemeliharaan dan perkongsian yang lebih baik. Hari ini kami akan memperkenalkan cara menukar HTML kepada PDF menggunakan program Java.
Pertama sekali, kita perlu memilih alat penukaran PDF yang sangat baik. Terdapat banyak alat sedemikian di pasaran, seperti iText, PDFBox, Flying Saucer, dll. Kita boleh memilih alat yang sesuai dengan kita berdasarkan keperluan dan pengalaman pembelajaran kita. Artikel ini akan menggunakan iText sebagai contoh untuk menerangkan.
Sebelum menggunakan iText untuk menukar HTML kepada PDF, kami perlu memuat turun dan mengkonfigurasi perpustakaan iText. Laman web rasmi iText menyediakan pautan muat turun untuk perpustakaan iText 7 dan perpustakaan iText 5 yang terkini. Kami boleh memilih versi yang sepadan mengikut keperluan kami. Selepas muat turun selesai, kami perlu memperkenalkan pakej balang iText ke dalam projek Java kami dan mewujudkan kebergantungan yang sepadan.
Sekarang kita boleh mula menulis kod Java. Kita perlu menggunakan kelas PdfWriter dan XMLWorkerHelper dalam iText untuk menukar HTML kepada PDF. Kod khusus adalah seperti berikut:
public class Html2Pdf { public static void main(String[] args) { String htmlFilePath = "/path/to/your/html/file"; String pdfFilePath = "/path/to/your/pdf/file"; try { // 创建文档对象 Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(pdfFilePath)); // 打开文档 document.open(); XMLWorkerHelper worker = XMLWorkerHelper.getInstance(); // 读入html文件 FileInputStream fis = new FileInputStream(htmlFilePath); InputStreamReader isr = new InputStreamReader(fis, "utf-8"); BufferedReader br = new BufferedReader(isr); // 将html文件转换为pdf文件 worker.parseXHtml(writer, document, fis, Charset.forName("utf-8")); // 关闭文档 document.close(); fis.close(); } catch (Exception e) { e.printStackTrace(); } } }
Dalam kod di atas, kami mula-mula mencipta objek Dokumen dan objek PdfWriter, dan membuka dokumen itu. Kemudian, kami menggunakan kaedah parseXHtml kelas XMLWorkerHelper untuk menukar fail HTML kepada fail PDF. Akhir sekali, kami menutup aliran dokumen dan fail. Sebelum itu, kita perlu menetapkan laluan fail HTML dan laluan fail PDF masing-masing kepada htmlFilePath dan pdfFilePath.
Selepas kami selesai menulis kod Java, kami boleh menjalankan atur cara untuk menukar HTML kepada PDF. Sebelum menjalankan program, kami perlu memastikan bahawa fail HTML input dan laluan fail PDF output adalah betul, dan kami telah memuat turun dan mengkonfigurasi perpustakaan iText dengan betul. Jika program gagal dijalankan, kami boleh melihat mesej ralat pada konsol untuk nyahpepijat dan mengubah suai atur cara.
Kesimpulan
Melalui pengenalan artikel ini, kita dapat melihat bahawa adalah sangat mudah untuk menggunakan program Java untuk menukar HTML kepada PDF. Sudah tentu, dalam kerja dan kajian sebenar, kita juga perlu mempertimbangkan lebih banyak butiran dan isu, seperti format pengekodan, penataan teks, susun atur halaman, dsb. Oleh itu, kami perlu terus belajar dan meneroka, serta meningkatkan kemahiran pengaturcaraan Java dan kemahiran pengendalian PDF kami untuk memenuhi keperluan kami dengan lebih baik.
Atas ialah kandungan terperinci html ke pdf java. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!