发布网友 发布时间:2022-11-28 22:20
共1个回答
热心网友 时间:2023-10-24 11:21
不知道您使用的是什么软件,火车头我用过。采集同样的内容,可以有多种方法,关键是你建立一个规则。比如说我要采集文章的。那我有两种办法可以完成,要看你所采集的网站是什么样的一种结构。比如我可以先采集到新闻的列表页,然后通过1级采集则采集到所以的新闻内容页,然后通过筛选规则,把网页里有用的内容(如:标题,内容,来源等等)保存到数据库中,这个过程你需要先分析所采集的新闻内容页的HTML代码,然后才能建立好过滤规则,这样就可以让采集软件自动完成你采集任务了