java 读取网页内容的实例详解

作者:lqh 时间:2023-11-27 22:38:11 

java 读取网页内容的实例详解


import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.*;

public class loadurl {
public static void main(String args[]) {
 String a = null;
 try {
  String url = "(这里替换成任意网页的网址)";
  BufferedReader in = new BufferedReader(new InputStreamReader(
    new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根据需要替换成要读取网页的编码
  while ((a = in.readLine()) != null) {
   System.out.println(a);
  }
 } catch (MalformedURLException e) {
 } catch (IOException e) {
 }
}
}

以上的代码程序是把一个网页的源代码,包括HTML与XML读取到JAVA的一个字符串String a中。

Java中字符串String类型的空间很大,基本能够容纳一个网页源代码的内容。

从网页读取内容同样是对于输入流的操作。

不同于标准的输入源,在:


BufferedReader in = new BufferedReader(new InputStreamReader(...))

InputStreamReader中输入System.in就可以。

此处的输入源应该为:


(new URL(url).openConnection().getInputStream(), "GB2312")

之后的操作与处理与载入标准输入源完全相同。

BufferedReader在JAVA中要求必须捕获IOException异常,而使用URL源除了必须引入java.net.*包之外,还必须捕获MalformedURLException异常。

如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

来源:http://blog.csdn.net/yongh701/article/details/39294071

标签:java,读取,网页
0
投稿

猜你喜欢

  • 三道java新手入门面试题,通往自由的道路--多线程

    2023-05-24 23:12:51
  • Javassist之一秒理解java动态编程

    2023-11-09 09:36:33
  • Flutter生命周期超详细讲解

    2022-12-31 04:45:57
  • Android 遍历SDCARD的文件夹并显示目录信息

    2021-06-01 21:49:04
  • java 配置MyEclipse Maven环境具体实现步骤

    2021-07-31 04:12:23
  • Java面试题冲刺第二十五天--并发编程3

    2023-09-11 04:40:10
  • Android在linux下刷机教程

    2023-09-03 17:21:04
  • Spring创建Bean的过程Debug的详细流程

    2023-02-09 23:55:37
  • JAVA基础之注解与反射的使用方法和场景

    2022-02-23 19:50:00
  • Flutter集成高德地图并添加自定义Maker的实践

    2022-07-11 21:32:49
  • Java中获取泛型类型信息的方法

    2022-06-30 16:06:34
  • SpringBoot @NotBlank错误的解决方案

    2023-01-12 20:05:59
  • Java多线程--让主线程等待所有子线程执行完毕在执行

    2022-09-14 01:21:34
  • 深入剖析java中的集合框架

    2022-04-27 18:48:16
  • java多种幻灯片切换特效(经典)

    2022-08-05 23:18:22
  • android实现滚动文本效果

    2022-02-02 16:49:36
  • 如何使用C#将Tensorflow训练的.pb文件用在生产环境详解

    2023-02-12 21:25:59
  • 基于Lucene的Java搜索服务器Elasticsearch安装使用教程

    2022-05-31 05:05:10
  • Android ViewPager实现无限循环轮播广告位Banner效果

    2023-06-26 22:02:29
  • C#读取文件MD5值的实现代码

    2021-10-08 18:01:39
  • asp之家 软件编程 m.aspxhome.com