社区学习工具库休闲

简体中文

首页 > Java > java教程 > Java 实例 - 网页抓取

Java 实例 - 网页抓取

黄舟

发布： 2017-01-20 11:58:43

原创

1394 人浏览过

以下实例演示了如何使用 net.URL 类的 URL() 构造函数来抓取网页：

/*
 author by w3cschool.cc
 Main.java
 */import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileWriter;import java.io.InputStreamReader;import java.net.URL;public class Main {
   public static void main(String[] args) 
   throws Exception {
      URL url = new URL("http://www.w3cschool.cc");
      BufferedReader reader = new BufferedReader
      (new InputStreamReader(url.openStream()));
      BufferedWriter writer = new BufferedWriter
      (new FileWriter("data.html"));
      String line;
      while ((line = reader.readLine()) != null) {
         System.out.println(line);
         writer.write(line);
         writer.newLine();
      }
      reader.close();
      writer.close();
   }}

登录后复制

以上代码运行输出结果为（网页的源代码，存储在当前目录下的 data.html 文件中）：

<!DOCTYPE html> <html> <head> <meta charset="UTF-8"/> 
<meta http-equiv="X-UA-Compatible" content="IE=11,IE=10,IE=9,IE=8"/>……

登录后复制

以上就是Java 实例 - 网页抓取的内容，更多相关内容请关注PHP中文网（m.sbmmt.com）！

相关标签：

Java ，网页抓取

来源：php.cn

上一篇：Java 实例 - 使用 Socket 连接到指定主机下一篇：java中ZXing 生成、解析二维码图片的小示例

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

从零开始打造自己的PHP框架的视频资料

2023-03-15 16:54:01
PHPMailer如何利用QQ邮箱完成邮件发送功能的实例分析

2023-03-15 12:26:02
php中关于IMAP如何收取邮件的方法介绍

2023-03-14 18:58:01
php如何快速实现数组去重的实例

2023-03-14 11:30:01
html中关于<a>标签的全部属性的使用总结

1970-01-01 08:00:00
php基础知识总结（新手入门必备）

2023-03-16 15:20:01
JavaScript中typeof的使用方法介绍

1970-01-01 08:00:00
JavaScript中confirm()方法的使用介绍

1970-01-01 08:00:00
HTML5 Placeholder属性的详情介绍

1970-01-01 08:00:00
ReactJS中表单的单选多选与反选的实现方法

1970-01-01 08:00:00

最新问题

如何让我的图像显示在页面的主显示屏上？我想做的是使用NASAAPI接收一些照片。然后在我的网页的缩略图和主显示屏上显示这些照片。我只是弄清楚为什么代码不从缩略图中获取图像并将其显示在页面上。我还使用HTML5及以上版本...

来自于 2024-04-06 15:33:12

0

1

433

返回（）；不适用于 1 条路线，但适用于几乎相同的路线我有2条路线，一条用于取消订阅，一条用于恢复，除非我遗漏了某些内容，否则两条路线除了名称/功能/网址之外都是相同的。当我取消恢复订阅时，我单击/resumeurl，它执行该功能，然...

来自于 2024-04-04 17:34:09

0

1

311

Scrapy：使用自定义列设置保存为 CSV 的指南所以基本上我正在从网络上抓取数据，并且我有一个项目文件导入到我的主蜘蛛文件中。现在，当我抓取数据并将其存储在容器中并将其另存为csv时，链接列最终总是成为csv中的第一列。如何设置...

来自于 2024-04-04 14:01:17

0

1

301

网页抓取：缺少 href 属性 - 需要模拟鼠标点击进行网页抓取吗？对于一个有趣的网络抓取项目，我想从ttps://www.nhl.com/stats/teams收集NHL数据。有一个可点击的Excel导出标签，我可以使用selenium和bs4找...

来自于 2024-04-04 10:32:06

0

1

3473

如何搜索标题并使用另一列来检查唯一性我在数据库中有一些抓取的产品数据，我想在我的网站上使用它们。我想编写一个查询，返回标题为“%EXAMPLE%”的所有项目，但仅包含唯一的产品。问题是我有1个项目的多行，并且我只想返...

来自于 2024-04-02 21:49:55

0

1

375

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1421109
php入门教程之一周学会PHP

4264711
JAVA 初级入门视频教程

2514970
小甲鱼零基础入门学习Python视频教程

506120
PHP 零基础入门教程

861218

最新下载

更多>

网站特效

网站源码

网站素材

前端模板