求教大神关于java获取网页源码的问题 大神速来
发布网友
发布时间:2023-10-24 17:46
我来回答
共4个回答
热心网友
时间:2024-11-12 19:41
htmlparser.框架,是解析网页的。
htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或
提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为2.0。
毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。
无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
jsoup也是。
Java 程序在解析HTML 文档时,相信大家都接触过htmlparser 这个开源项目,我曾经在IBM DW
上发表过两篇关于htmlparser 的文章,分别是:从HTML中攫取你所需的信息 和扩展HTMLParser
对自定义标签的处理能力。但现在我已经不再使用htmlparser 了,原因是htmlparser 很少更新,但最重要的是有了jsoup 。
热心网友
时间:2024-11-12 19:42
因为很多IE帮我们完成了很多事情,比如执行一些JS函数,有些页面你使用java抓取,也许就一个页面,但是用IE浏览就不一定,或许有跳转,获取执行了js函数改变了网页内容,,用java抓取网页内容,要分析IE浏览这个页面的所有动作才行
热心网友
时间:2024-11-12 19:42
把页面源码拿出来追问邮箱多少 我发过去
热心网友
时间:2024-11-12 19:43
对方加密了