六年专注于网络推广、网络营销研究

  • 首页
  • SEO工具
  • 火车头采集器按顺序采集小说章节怎样实现?实际经验哦!

作者:淘小白2018-12-25 13:58分类: SEO工具

火车头采集小说,可以按照小说章节采集,可以按照整本进行采集,其实主要的问题还是在发布格式上,首先要明确发布格式才能进行规则的指定,要不然采集下来发布错误也是很让人头疼的。


小说站点可以采集网页,也可以采集公众号,都可采集,主要看目标在哪里!今天分享下如何按照小说章节进行采集:


1、列表页为初始网址,根据列表页的变化规则进行设置,如果不知道有多少章,可以多设置几页,然后进行测试。


2、列表页中获取章节网址,通过列表页的源码可以采集到;


3、章节内容页进行采集标题内容等所需内容;


4、如果想在列表页获取缩略图简介或者作者等信息,需要vip火车头版本,或者采用破解版进行采集。破解版采集https的有故障,曾多次遇到,不知是自己本地电脑的原因,还是火车头破解版自身的问题。


5、如果想按照顺序采集,采集整本小说,需要获取第一章的地址,然后在分页中抓取分页网址,抓取下去即可。

火车头小说采集.png

6、重要:发布格式,需要什么样的格式,这个很重要,根据格式才可以选用哪种采集方式。


7、本人遇到头疼的问题:如果是按照章节进行发布,顺序标签需要带阿拉伯数字,这种会很头疼的,错误率也较高,需要一个较好或者完整的章节数字替换文件,进行批量替换,很多章节顺序命名千差万别,有着极高的自定义样式,乱七八糟


20191203更新:

针对有些程序需要,章节按照如下样式顺序排列,方可导入成功,请采用这种方法进行采集《火车头采集小说教程批量多本采集教程

1.txt

2.txt

3.txt

4.txt

... ...


作者出微信公众号小说采集规则,网页小说站采集规则,联系QQ1290654348

温馨提示如有转载或引用以上内容之必要,敬请将本文链接作为出处标注,谢谢合作!

已有 0/19475 人参与



微信扫一扫,加我好友