PHP 简易爬虫
Libérer: 2016-07-25 09:08:50
original
1041 Les gens l'ont consulté
- function get_urls($url)
- {
- $url_array=array();
- $the_first_content=file_get_contents($url);
- $the_second_content=file_get_contents($url);
- $pattern1 = "/http:\/\/[a-zA-Z0-9\.\?\/\-\=\&\:\+\-\_\'\"]+/";
- $pattern2="/http:\/\/[a-zA-Z0-9\.]+/";
- preg_match_all($pattern2, $the_second_content, $matches2);
- preg_match_all($pattern1, $the_first_content, $matches1);
- $new_array1=array_unique($matches1[0]);
- $new_array2=array_unique($matches2[0]);
- $final_array=array_merge($new_array1,$new_array2);
- $final_array=array_unique($final_array);
- for($i=0;$i {
- echo $final_array[$i]."
";
- }
- }
- get_urls("http://www.baidu.com");
复制代码
|
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31