Dreamweaver システムは、一般的に使用される記事システムとしては比較的操作が簡単です。数ある機能の中でも収集システムは、収集領域の設定ミスや収集ルールの編集ミス、収集後の空白など、初心者にとっては頭の痛い問題かもしれません。今回は、起こりやすいトラブルについて詳しく解説していきます。
まず、バックグラウンドでログインし、[コレクション] -- [コレクション ノード管理] をクリックして、コレクション管理設定インターフェイスに入ります。
次の 2 つがあります。ここでのオプションの 1 つは、元のノードを変更する (主に、収集やその他の設定が不可能になった以前の設定エラーが原因) です。1 つは、ノード (ほとんどが新しいノード) を直接追加し、クリックして次のステップです。 「通常記事」を選択して確定します。
次に、ノード名を入力します (インポート中のエラーを避けるために、列に関連した名前にすることをお勧めします)。実際の名前を入力するだけです。次に最初のキーポイントは、ターゲットページのエンコーディングです。自分の Web ページではなく、ターゲット Web ページのコードを入力する必要があります。表示方法: 対象の Web サイトの任意のページを開き、空白スペースを右クリックし、ソース コードを表示します (通常、エンコードは最初の数行にあります)
次に入力します。リスト ルールの 1 つは、URL のバッチ生成です。一般に、強力なルールがある場合、または上から下まで収集する必要がある場合に適しています。たとえば、次の列をターゲットにします:
最初のページのリスト: http://youqubu.cn/tansuo/list_5_1.html
2 番目のページのリスト: http://youqubu.cn/tansuo /list_5_2.html。
このリスト ルールで最も重要なことは、類似点と相違点を見つけることです。類似点を埋め、一致する記号 (変数) で相違点を補います。実際、この比較から、 http://youqubu.cn/tansuo/list_5_ .html はすべて同じであることがわかり、変数は 1.2.3.4 になります。 。したがって、一致する URL は
http://youqubu.cn/tansuo/list_5_(*).html です。
#もう 1 つのリスト ルールは、リスト URL を手動で指定するもので、より一般的です。収集する必要があるすべてのアイテムのリストページに記入するだけです。 (特定のページだけを収集する場合や、より多くの変数を含むページを収集する場合に適しています)
注: 多くの Web サイトのコラムのホームページは、http://xxx.xx/xxx/ の形式で表示されます。以下の可変項目が欠落していることが判明しました。したがって、変数項目を見つける方法は、リストの次のページをクリックします。まだ不明な場合は、次のページをクリックしてください。リストの 2 ページ目と 3 ページ目を比較すると、次のステップでも変数項目を見つけることができます。 4.
このステップでは、リスト内の記事のすべてのアドレスを取得します。リスト ページからすべての記事ページのアドレスを取得する必要があります。 http://youqubu.cn/tansuo/list_5_1.html のリストを例として見てみましょう。リストの下の最初の記事のタイトルをコピーし、リスト ページの空白スペースを右クリックします。ソース コードを表示し、Ctrl F を押して検索し、コピーしたタイトルを貼り付け、ソース コード内の位置を見つけます。テキスト。実際、これには一定のルールがあります。次に、ソース コードのどの部分が一意で、リスト内のすべての記事のアドレスを含めることができるかを見つけます (注: 開始コードの検索はリストの最初の記事のタイトルから開始して上に進み、終了コードの検索は行う必要があります)リストの最初の記事のタイトルから開始する必要があります (下から見てください)。このソースコードからそれがわかります。開始コード:
下一步的缩略图我们可以选择不采集,因为织梦本身是会把第一张图片默认为缩略图的,这个看实际情况。下面是对网址的筛选:包含的意思是:这个步骤六选择的代码区间的文章网址只有包含了这部分才会被采集(这里有两种情况:1。譬如上面演示的地址,它是以超链接的形式,不是完整的网址,所以这种情况千万不要填写包含。2.就是列表涉及到多个链接的,比如标签这样的,最好填写包含,填写你想要的网址有的,不想要的网址没有的部分)。然后下一步。这边会列出因为上面填写的规则所采集到的列表页中文章的网址。如果是空白:我们可以先删除必须包含和不能包含,点击下一步测试,如果能采集到连接但是很乱,那就是你这步包含相关填错了;如果这样操作还是没有采集到东西,那就是“包含文章网址区域”这步填写错了。
分页规则也主要分两种:一种是直接填写默认代码:{path}{file}_{p}{ext} 然后选择分页列表规则(如下图)。 另一种是打开目标文章页,找到有上下几页的文章,右键查看源码,找到这部分代码,填写方式和文章页网址区域的方法一样,然后右边选择:全部列出的分页列表。(第二种方法要注意,因为涉及到多页,填写首尾代码的时候一定要多翻几张,然后查看源代码,把你认为共同的代码在多个页面查找下,因为可能出现你选择的代码在首页是可以找到的,在2.3四页后面就没有了,那就说明这个不是公用代码,你填上去也会导致采集不到分页的)
分页设置好后,我们主要设置标题规则和内容规则。时间规则和作者、来源规则这里不细说,这个不是所有人都需要的,这步谈到的规则都可以获取区间的方式得到内容或者填入固定的词语。首先是标题规则:我们以:http://youqubu.cn/tansuo/362.html。这个文章页来做说明。我们先复制标题名字,然后在源代码中查找。示例中查找我们可以发现这里有五个相同的部分,而且冲对比中发现,这个其实是有两种写法的。1.完全包含这个文字的代码区间,不带其他文字:
DedeCMS チュートリアル 列を参照してください。学ぶために!
以上がdedecms コレクション ルールの作成方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。