Web ページをデザインするとき、Word から HTML 形式への変換、HTML から Markdown 形式への変換など、さまざまな形式の変換が必要になることがよくあります。 HTML 変換は一般的なニーズの 1 つです。この記事では、既存のツールを使用して HTML を他の形式に変換する方法を紹介します。
[テキスト]
1. HTML を Markdown に変換する
Markdown は、簡潔で読み書きしやすいテキスト形式で、現在最も人気のあるテキスト形式の 1 つです。技術文書作成言語。したがって、HTML を Markdown に変換する必要が頻繁に発生します。
これを実現するには多くの方法がありますが、次に示すのは比較的単純な方法であり、pandoc ツールを使用する必要があります。
pandoc は、複数の形式から複数の形式への変換をサポートするクロスプラットフォームのテキスト変換ツールです。特定の公式 Web サイトのダウンロード アドレス: https://pandoc.org/installing.html
コマンド ライン ツールを開き、次の場所に切り替えます。変換する必要がある HTML ファイルのディレクトリで、次のコマンドを実行します。
pandoc -s input.html -o output.md
ここで、input.html は変換するファイル名、output.md は出力 Markdown ファイルです。
バッチ変換が必要な場合は、次のコマンドを使用できます:
for i in *.html; do pandoc -s "$i" -o "${i%.html}.md"; done
このコマンドは、現在のディレクトリにあるすべての HTML ファイルを Markdown に変換します。出力ファイル名は元のファイルと同じです。ファイルであり、サフィックスは .md です。
2. HTML を LaTeX に変換する
LaTeX は、学術論文や科学論文などの作成に適した高品質の植字システムです。したがって、HTML を LaTeX に変換することも一般的なニーズです。
また、pandoc を使用して次のコマンドを実行する必要があります。
pandoc -s input.html -o output.tex
ここで、input.html は変換する必要があるファイル名、output.tex は出力 LaTeX ファイルです。
同様に、バッチ変換コマンドは次のとおりです:
for i in *.html; do pandoc -s "$i" -o "${i%.html}.tex"; done
3. HTML を他の形式に変換する
Markdown と LaTeX に加えて、Pandoc は他の多くの形式をサポートしています。 PDF、DOCX、EPUB、ODTなどの場合は、出力ファイル形式を変更するだけです。
pandoc -s input.html -o output.pdf pandoc -s input.html -o output.docx pandoc -s input.html -o output.epub pandoc -s input.html -o output.odt
[結論]
上記では、Pandoc を使用して HTML を他の形式に変換する方法を紹介しました。この方法により、作業効率が向上し、作業負荷が軽減され、編集性も向上します。オプション。変換プロセス中に少数の書式変更が発生するため、適切な調整と編集が必要になることに注意してください。
以上がHTML を他の形式に変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。