インターネット情報技術の継続的な発展に伴い、編集、植字、印刷などのために HTML ページを Word 文書に変換する必要性がますます高まっています。この記事では、POI ライブラリを使用して HTML ページを Word ドキュメントに変換する方法を紹介し、いくつかの実用的なコード例を示します。
1. POI の概要
POI は、「Poor Obfuscation Implementation」の略語で、Apache Software Foundation のオープンソース プロジェクトであり、Microsoft Office (Word、Excel を含む) 専用です。 、PowerPoint など)は、一連の Java API を開発しました。現在、POI は Java 開発において Microsoft Office ドキュメントの作成、読み書きを行うための標準ライブラリの 1 つとなっており、多くの Java プログラムが Office ドキュメントの操作にこれを使用しています。
2. POI を使用して Word 文書を作成する基本プロセス
POI を使用して Word 文書を作成する前に、まず Word 文書を作成する基本プロセスを理解する必要があります。
POI が提供する XWPFDocument クラスを使用して、空の Word ドキュメントを作成します。
XWPFDocument doc = new XWPFDocument();
Word ドキュメント コンテンツの操作は、POI によって提供される XWPFParagraph および XWPFRun クラスを通じて実装されます。特に次のものが含まれます。
(1) 段落を作成します
XWPFParagraph para = doc.createParagraph();
(2) テキストを作成します
XWPFRun run = para.createRun(); run.setText("Hello World!");
提供された書き込みメソッドを使用しますXWPFDocument クラスを使用して Word ドキュメントをファイルに書き込みます。
FileOutputStream out = new FileOutputStream("output.docx"); doc.write(out); out.close();
3. HTML を Word ドキュメントに変換する
上記では、POI を使用して Word ドキュメントを作成する基本プロセスを簡単に紹介しました。以下では、POI を使用して HTML ページを Word ドキュメントに変換する方法を紹介します。
次に示すように、Java が提供する URLConnection クラスを使用して HTML ページのコンテンツを取得できます。
String urlStr = "http://www.baidu.com"; URL url = new URL(urlStr); URLConnection conn = url.openConnection(); InputStream is = conn.getInputStream(); BufferedReader br = new BufferedReader(new InputStreamReader(is)); String line = null; StringBuffer sb = new StringBuffer(); while((line = br.readLine()) != null){ sb.append(line); } String html = sb.toString();
#Word ドキュメントのコンテンツの作成
Document docHtml = Jsoup.parse(html);
XWPFDocument docx = new XWPFDocument();
Elements parags = docHtml.getElementsByTag("p");
Word 文書をディスクに書き込みます
for(Element p : parags){ XWPFParagraph paragraph = docx.createParagraph();// 新建一个段落 XWPFRun run = paragraph.createRun();// 在该段落中创建一个文本片段,即 XWPFRun run.setText(p.text());// 设置该文本片段的文字内容 }
OutputStream os = new FileOutputStream("output.docx"); docx.write(os); os.close();
以上がHTMLからWordへのポイの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。