排行榜 统计
  • 建站日期:2017-05-20
  • 文章总数:139 篇
  • 评论总数:482 条
  • 分类总数:26 个
  • 最后更新:昨天 21:08

火车头采集 QQdie 实例教程

本文阅读 4 分钟
广告

应会员要求。写一篇火车头采集 qqdie 文章的教程。

首先找到我们要采集的文章页,也就是 https://qqdie.com/archives/

1. 采集网址及分页网址

首先来看一下分页结构

可以清楚看到分页格式为:https://qqdie.com/archives/list_xx.html xx 就是第几页。

弄清楚之后我们打开火车头,没有的可以在我博客搜索下载,新建一个任务,添加一个采集网址规则,如下图填入。一共39页,所以项数39。注意因为这里的第一页指向有点问题,所以这里首项填2。点击添加,在点击完成。

接下来我们要抓取分级列表,也就是每一页的每个 item 的网址,先去看看网址长啥样,可以看到结构都是 /archives/xxx.html。

同时为了锁定我们要选择的 item 的范围,我们可以看看这些 item 前后有什么唯一性的节点,也就是找怎么来定位 这些 item 的代码,我们可以看到,前面有一个

<div class="news-conten-list">后面有一个 <div class="page"> ,都是唯一性的节点,搜不出来第二个,所以我们就用这两段代码去定位我们要的 item。

接下来点击第一步中的多级网址获取--->添加,按照如下规则填写,选定区域就是我们刚刚分析的那两个节点,结果网址格式也按照我们刚刚分析的填写。填完了记得保存一下。

然后点击测试网址采集,如果你跟我一样采集到下面这些网址,那么就成功了。有些同学如果采集不了,可以尝试装一下火车头采集HTTPS的修复插件。

解决火车头采集器无法采集HTTPS的办法

2. 采集内容

价格: 10.00 元
VIP会员价格:5.00元终身会员免费
温馨提示:登录付款后可永久阅读隐藏的内容。 付费可读
原创文章,作者:gogobody ,如若转载,请注明出处:https://www.ijkxs.com/393.html
-- 展开阅读全文 --
最新阿里云盘福利码2021收集最全整理
« 上一篇 03-22
Joe 主题 6.xx 增加顶部下拉隐藏,并显示文章标题
下一篇 » 03-28
广告

发表评论

V注册会员 L评论等级
R3 条回复
  1. avatar夏目贵志VLv.2 说道:

    还是V9界面适合我啊,7.6的 我用了贼不习惯。

    1. avatargogobodyVLv.5 说道:

      @夏目贵志

      买不起v9,win10最新的又用不了破解

      1. avatar夏目贵志VLv.2 说道:

        @gogobody

        我V9免费版本用的很舒服啊。基本够用。
        win10 需要1819版本才行o(╥﹏╥)o

没有更多评论了
作者信息
热门文章
标签TAG
热评文章