问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

用java实现提取指定网页中的表格数据?

发布网友 发布时间:2022-04-25 07:16

我来回答

5个回答

热心网友 时间:2023-11-06 07:00

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.rows(i).cells(j).innerText)
}
}
}
//-->
</SCRIPT>
<BODY>

<FORM METHOD=POST ACTION="" name="myform">

<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>

</BODY>
</HTML>

热心网友 时间:2023-11-06 07:00

在网页数据采集的时候,我们往往要经过这几个大的步骤:
①通过URL地址读取目标网页
②获得网页源码
③通过网页源码抽取我们要提取的目的数据
④对数据进行格式转换,获得我们需要的数据。

热心网友 时间:2023-11-06 07:00

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.rows(i).cells(j).innerText)
}
}
}
//-->
</SCRIPT>
<BODY>

<FORM METHOD=POST ACTION="" name="myform">

<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>

</BODY>
</HTML>

热心网友 时间:2023-11-06 07:00

在网页数据采集的时候,我们往往要经过这几个大的步骤:
①通过URL地址读取目标网页
②获得网页源码
③通过网页源码抽取我们要提取的目的数据
④对数据进行格式转换,获得我们需要的数据。

热心网友 时间:2023-11-06 07:01

你这种想法如果侦查自己开发的网站还可以,但是如果你监察别人的网站,除非你能拿到源代码,否则你根本实现不了,因为你连table的id都拿不到你怎么去获取数据啊,
LZ如果真想实现这功能,就随便找个有源代码的商城的自己先跑着,然后你再做程序就完全可以实现你像要的功能了。

热心网友 时间:2023-11-06 07:02

搞网站入侵啊 !
你的想法很好
但是你的数据库结构怎么设计?你怎么侦测别人网站更新?你如何知道别人网页的div标签名?

热心网友 时间:2023-11-06 07:01

你这种想法如果侦查自己开发的网站还可以,但是如果你监察别人的网站,除非你能拿到源代码,否则你根本实现不了,因为你连table的id都拿不到你怎么去获取数据啊,
LZ如果真想实现这功能,就随便找个有源代码的商城的自己先跑着,然后你再做程序就完全可以实现你像要的功能了。

热心网友 时间:2023-11-06 07:02

搞网站入侵啊 !
你的想法很好
但是你的数据库结构怎么设计?你怎么侦测别人网站更新?你如何知道别人网页的div标签名?

热心网友 时间:2023-11-06 07:02

想法是好的,只是这个实现过程。。。

热心网友 时间:2023-11-06 07:00

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.rows(i).cells(j).innerText)
}
}
}
//-->
</SCRIPT>
<BODY>

<FORM METHOD=POST ACTION="" name="myform">

<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>

</BODY>
</HTML>

热心网友 时间:2023-11-06 07:00

在网页数据采集的时候,我们往往要经过这几个大的步骤:
①通过URL地址读取目标网页
②获得网页源码
③通过网页源码抽取我们要提取的目的数据
④对数据进行格式转换,获得我们需要的数据。

热心网友 时间:2023-11-06 07:01

你这种想法如果侦查自己开发的网站还可以,但是如果你监察别人的网站,除非你能拿到源代码,否则你根本实现不了,因为你连table的id都拿不到你怎么去获取数据啊,
LZ如果真想实现这功能,就随便找个有源代码的商城的自己先跑着,然后你再做程序就完全可以实现你像要的功能了。

热心网友 时间:2023-11-06 07:02

搞网站入侵啊 !
你的想法很好
但是你的数据库结构怎么设计?你怎么侦测别人网站更新?你如何知道别人网页的div标签名?

热心网友 时间:2023-11-06 07:02

想法是好的,只是这个实现过程。。。

热心网友 时间:2023-11-06 07:00

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.rows(i).cells(j).innerText)
}
}
}
//-->
</SCRIPT>
<BODY>

<FORM METHOD=POST ACTION="" name="myform">

<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>

</BODY>
</HTML>

热心网友 时间:2023-11-06 07:02

想法是好的,只是这个实现过程。。。

热心网友 时间:2023-11-06 07:00

在网页数据采集的时候,我们往往要经过这几个大的步骤:
①通过URL地址读取目标网页
②获得网页源码
③通过网页源码抽取我们要提取的目的数据
④对数据进行格式转换,获得我们需要的数据。

热心网友 时间:2023-11-06 07:01

你这种想法如果侦查自己开发的网站还可以,但是如果你监察别人的网站,除非你能拿到源代码,否则你根本实现不了,因为你连table的id都拿不到你怎么去获取数据啊,
LZ如果真想实现这功能,就随便找个有源代码的商城的自己先跑着,然后你再做程序就完全可以实现你像要的功能了。

热心网友 时间:2023-11-06 07:02

搞网站入侵啊 !
你的想法很好
但是你的数据库结构怎么设计?你怎么侦测别人网站更新?你如何知道别人网页的div标签名?

热心网友 时间:2023-11-06 07:00

把下面代码复制到文本文档中,然后将文本文档改成".html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--

//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+document.all.oTabless.rows.length+'个tr')
for (i=0; i < document.all.oTabless.rows.length; i++) {
//循环每个tr里的td
for (j=0; j < document.all.oTabless.rows(i).cells.length; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+document.all.oTabless.rows(i).cells(j).innerText)
}
}
}
//-->
</SCRIPT>
<BODY>

<FORM METHOD=POST ACTION="" name="myform">

<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>

</BODY>
</HTML>
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
日本最厉害的神叫什么?形象又是什么样的? 我是1995年的,我是几岁上的小学啊? 95年大学毕业于哪一年几月份 1995年生的孩子几岁上小学,中学,高中 叶罗丽时辰砂兑换码大全 叶罗丽精灵梦礼包哪里领 礼包领取兑换地址大全 叶罗丽彩妆公主怎么玩_叶罗丽彩妆公主玩法大全 叶罗丽小游戏大全(叶罗丽小游戏大全换装游戏) 港式碗仔翅的烹饪秘诀有哪些呢? ...三个月的机械键盘有一些键失灵了 用回以前的键盘普通键盘就可以用... java中怎么将json数据中的一段提取出来? java程序中怎样从数据库的一张表中随机提取几条数据? JAVA语句实现提取数据库中的数据 JAVA抽取范围内的数值 java中如何提取指定的数据? 用java代码实现Access数据抽取 详解,谢谢! 在JAVA中如何从集合中提取数据 在java中怎么取出数组中的数据 java怎么随机抽取多个不重复的字符串数据 Java怎么用随机抽取数据库的数据 java怎么把数据库里的数据提取出来 java怎么使用随机抽取数组里的数据? java如何提取指定数据? 电脑上设置时间 ipadpro不用的时候需要关机吗 学习地理要学会哪些东西? 高考地理要考好需要掌握哪些 小高考地理 高考的地理一般考哪方面的内容?重点把握哪些内容? 高考必背的地理地图 如何把这个网站中的数据用JAVA代码提取出来 java 从字符串提取数据 如何用JAVA提取文本文档的多个数据 JAVA中从一个数组中提取数据,插入到另一个数组的方法是什么? java连接mysql,并随机抽取数据库中的一些记录并显示出来? java 中 提取 括号里的数据 ipad不关机好不好 信用卡还款宽限期3天是怎么算的 信用卡三天宽限期怎么算 抖音卡卡直播间卖的是真货吗 斗鱼三骚的卡卡在哪直播 房间号是多少什么时间段直播 斗鱼卡卡去哪里直播了 斗鱼卡卡直播间 卖衣服的卡卡的直播间是多少 ipad在不用的时候需要关机吗 全民TV卡卡房间号介绍 卡卡还在斗鱼直播吗 斗鱼直播卡卡为什么被封 现在从那能看到斗鱼卡卡的直播?现在在斗鱼找不到卡卡了 斗鱼球王卡卡现在还直播吗 万佳卡卡在哪里直播?