偶然机会,遇上使用火车头采集器采集内容时候需要获取当前页面的URL地址,于是记录下操作:
火车头 v9:
1、在采集字段中添加链接字段
2、数据获取方式设置“从源码中获取数据”
3、数据来源设置:“从默认页》网页地址中”
4、提取方式:设置“正则提取”,正则表达式:
^(?<content>[\s\S]*?)$
火车头 v7:
偶然机会,遇上使用火车头采集器采集内容时候需要获取当前页面的URL地址,于是记录下操作:
火车头 v9:
1、在采集字段中添加链接字段
2、数据获取方式设置“从源码中获取数据”
3、数据来源设置:“从默认页》网页地址中”
4、提取方式:设置“正则提取”,正则表达式:
^(?<content>[\s\S]*?)$
火车头 v7:
之前