Conversion de fichiers PDF en images avec PDFBox
Apache PDFBox offre un ensemble complet d'outils pour manipuler des documents PDF, y compris leur conversion en images. En utilisant PDFBox, vous pouvez extraire efficacement des pages individuelles d'un fichier PDF sous forme d'images distinctes.
Solution (Version 1.8.*) :
PDDocument document = PDDocument.loadNonSeq(new File(pdfFilename), null); List<PDPage> pdPages = document.getDocumentCatalog().getAllPages(); int page = 0; for (PDPage pdPage : pdPages) { ++page; BufferedImage bim = pdPage.convertToImage(BufferedImage.TYPE_INT_RGB, 300); ImageIOUtil.writeImage(bim, pdfFilename + "-" + page + ".png", 300); } document.close();
Solution (Version 2.0) :
PDDocument document = PDDocument.load(new File(pdfFilename)); PDFRenderer pdfRenderer = new PDFRenderer(document); for (int page = 0; page < document.getNumberOfPages(); ++page) { BufferedImage bim = pdfRenderer.renderImageWithDPI(page, 300, ImageType.RGB); ImageIOUtil.writeImage(bim, pdfFilename + "-" + (page+1) + ".png", 300); } document.close();
Solution (Version 3.0) :
PDDocument document = Loader.loadPDF(new File(pdfFilename));
Rappelez-vous pour configurer la journalisation et utiliser la dernière version du JDK disponible.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!