ホームページ > php教程 > php手册 > PHP を使用してプレーン テキストを Web ページに自動的に変換する

PHP を使用してプレーン テキストを Web ページに自動的に変換する

WBOY
リリース: 2016-06-21 09:00:36
オリジナル
1295 人が閲覧しました

  最近,我的一个老朋友向我打电话求助。他从事记者的职业有多年了,最近获得了重新出版他的很多早期专栏的权利。他希望把他的作品贴在Web上;但是他的专栏都是以纯文本文件的形式保存的,而且他既没有时间也不想去为了把它们转换成为Web页面而学习HTML的知识。由于我是他电话本里唯一一个精通计算机的人,所以他打电话给我看我是否能够帮帮他。

  “让我来处理吧,”我说:“一个小时以后再给我打电话。”当然了,当他几个小时以后打电话过来,我已经为他准备好了解决的方法。这需要用到一点点PHP,而我收获了他没完没了的感谢和一箱红酒。

  那么我在这一个小时里做了些什么呢?这就是本篇文章的内容。我将告诉你如何使用PHP来快速将纯ASCII文本完美地转换成为可读的HTML标记。

  首先让我们来看一个我朋友希望转换的纯文本文件的例子:

  Green for Mars!

  John R. Doe

  The idea of little green men from Mars, long a staple of science fiction, may soon turn out to be less fantasy and more fact.

  Recent samples sent by the latest Mars exploration team indicate a high presence of chlorophyll in the atmosphere. Chlorophyll, you will recall, is what makes plants green. It's quite likely, therefore, that organisms on Mars will have, through continued exposure to the green stuff, developed a greenish tinge on their outer exoskeleton.

  An interview with Dr. Rushel Bunter, the head of ASDA's Mars Colonization Project blah blah...

  What does this mean for you? Well, it means blah blahblah...

  Track follow-ups to this story online at http://www.mars-connect.dom/. To see pictures of the latest samples, log on to http://www.asdamcp.dom/galleries/220/

  相当标准的文本:它有一个标题、一个署名和很多段的文字。把这篇文档转换成为HTML真正需要做的是使用HTML的分行和分段标记把原文的布局保留在Web页面上。特殊的标点符号需要被转换成为对应的HTML符号,超链接需要变得可以点击。

  下面的PHP代码(列表A)就会完成上面所有的任务:

  列表A

  让我们来看看它是如何工作的:

以下是引用片段:
// set source file name and path
$source = "toi200686.txt";

// read raw text as array
$raw = file($source) or die("Cannot read file");

// retrieve first and second lines (title and author)
$slug = array_shift($raw);
$byline = array_shift($raw);

// join remaining data into string
$data = join('', $raw);

// replace special characters with HTML entities
// replace line breaks with

$html = nl2br(htmlspecialchars($data));

// replace multiple spaces with single spaces
$html = preg_replace('/ss+/', ' ', $html);

// replace URLs with elements
$html = preg_replace('/s(w+://)(S+)/', '
', $html);

// start building output page
// add page header
$output =<<< HEADER





HEADER;

// add page content
$output .= "

$slug
";
$output .= "

";
$output .= "

$html
";

// ページ フッターを追加
$output .=<<



FOOTER;

// ブラウザに表示します
echo $output;

// AND/OR

// 出力を新しい .html ファイルに書き込みます
file_put_contents(basename) ($source, substr($source, strpos($source, '.'))) . ".html", $output) または die("ファイルを書き込めません"); >
最初のステップは、純粋な ASCII ファイルを PHP 配列に読み取ることです。これは、ファイルの各行を数値インデックス付きの配列要素に変換する file() 関数を使用して簡単に実行できます。 🎜> 次に、タイトル行と著者行 (これらはファイルの最初の 2 行であると思います) が array_shift() 関数を通じて配列から抽出され、別の配列変数に配置され、以下のメンバーが文字列に連結されます。この文字列には、記事本文全体が含まれます。記事本文内の「'」、「<」、「>」などの特殊文字は、元の文字列を保持するために、対応する HTML 記号に変換されます。記事の形式、改行および段落は、nl2br() 関数によって HTML の

要素に変換され、置換された文字列はスペースに圧縮されます。記事の本文は正規表現を使用して検出され、要素で囲まれます。ページが Web ブラウザーで表示されると、URL がクリック可能なハイパーリンクに変換され、標準 HTML を使用して出力 HTML ページが作成されます。ルール 記事のタイトル、著者、本文は CSS スタイル ルールを使用してフォーマットされますが、ここで最終ページの外観を定義するために、グラフィック要素、色などを追加できます。


HTML ページが構築されたら、 file_put_contents() を使用して静的ファイルとして保存できます。分割され、新しく作成された Web ページに新しいファイル名 (filename.html という名前) が作成され、この Web ページを Web サーバーに公開したり、ディスクに保存したり、さらに編集したりできます。

注: このスクリプトを使用して HTML ファイルを作成し、ディスクに保存する場合は、ファイルが保存されるディレクトリに対する書き込み権限がスクリプトにあることを確認する必要があります。

ご覧のとおり、標準形式の ASCII プレーン テキスト データ ファイルがある場合は、PHP を使用して、それを使用可能な Web ページにかなり迅速に変換できます。すでに Web サイトがあり、そこに新しい Web ページを追加する予定がある場合、ページ ビルダーで使用されるテンプレートを調整して元の Web サイトの外観に合わせるのは非常に簡単です。ぜひ試してみてください!

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート