我的账户
火车采集

教育培训在线课程

亲爱的游客,欢迎!

已有账号,请

如尚未注册?

您还未设置本版块规则说明文字,如需设置,请登陆后台论坛栏目,在该板块设置下方填写本版块规则。
  • 0

    今日发帖

  • 329

    本版主题

添加起始网址-单条网址添加 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
起始网址一般是我们采集的入口地址,经常用列表页地址来做为起始页地址, 如下图单条网址添加只要把 ...
53 0 2018-12-27
添加起始页地址之批量/多页 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
这个方法可以一次添加多个地址,这多个地址之间只能有一个变化的部分,并且是按照等差或者等比,或者是字母 ...
76 0 2018-12-27
添加起始地址之文本导入 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
也可以把txt文本里面的地址导入到采集器里面,这里注意一下,文本里面的地址是一行一个,然后按照下图点 ...
68 0 2018-12-27
添加多级网址之自动获取网址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
自动获取http://faq.locoy.com/网址是采集器的默认选项。自动获取http://faq.locoy.com/网址的原理是采集器 ...
60 0 2018-12-27
采用前后截取方式采集网页源代码内容 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
比如我要采集的是这个网址http://gaokao.chsi.com.cn/sch/schoolInfoMain--schId-1.dhtml中的学校名称:北 ...
67 0 2018-12-27
采用正则提取的方式采集网页源代码的内容 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
正则提取其实就是用[参数]来代替源码中你想要采集的数据,然后把它匹配出来的。具体来看个例子:比如我们要 ...
72 0 2018-12-27
在原网页的源码中可以找到下载地址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
只要在原网页的源代码中找到这个下载地址并可以在网页中找到个唯一的标识符进行判断,我们就可以使用采集器 ...
69 0 2018-12-27
添加多级网址之手动填写链接地址规则 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
一、原理 手动填写链接地址规则原理是编写脚本规则,去和源代码里的内容匹配,获取到自己设置的参数即可 ...
65 0 2018-12-27
原网页源代码中没有下载的文件地址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
这种文件下载是在源文件找不到它的地址而需要利用抓包工具fidder,找出它隐藏的真时地址,然后利用多页的原 ...
53 0 2018-12-27
火车采集器全部功能教程
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
百度网盘下载地址:http://locoy.com/CInfo/howtostart.html
116 0 2018-12-25
2012在线培训教程
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
培训内容:采集器的安装,整体介绍及采集网址,列表页规则,培训人客服小陈: 培训视频下载:http://vide ...
85 0 2018-12-25
文字教程
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
文字教程请查看功能列表:http://faq.locoy.com/qc-7.html
102 0 2018-12-25
fiddler使用实例之----------获取cookie!!!! attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
有的网站要登录才能采集,就是要采集器获取到登录后网站cookie 才能采集 ,或者是写发布模块要用到抓包 ...
113 0 2018-12-25
如何把本地浏览器信息复制到采集器里面 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
有的时候,我们发现在浏览器里能看到的内容,或者某个浏览器能看到,比如火狐能看到但是ie看不到 ,再或者 ...
110 0 2018-12-25
fiddler使用实例之----------查找隐藏的真实地址!!!! attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
这个教程讲解下如何用fddler ,找到页面的真是地址同样也是可以找到页面隐藏的内容, 两者原理是一样的, ...
118 0 2018-12-25
获取更新远程采集规则功能讲解 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
火车采集器最新版本v8 新增了 “获取更新远程采集器规则”这个功能。 这个功能的用处是什么呢? ...
100 0 2018-12-25
网易新闻评论接口 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
网易新闻评论内容的采集是比较复杂的,因为全部是js控制 数据传输,新闻页还好,可以直接看到新闻标题和新 ...
141 0 2018-12-25
【火车人】火车头采集器 v7视频教程
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
高清下载地址: http://115.com/file/bexo6mmh youku在线视频 http://v.youku.com/v_show/id_ ...
82 0 2018-12-25
火车采集器UBB设置视频教程 attachment
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
新版本的随机用户名,ubb等操作都放在了数据构造部分,用户通过数据构造对发布前的数据再进行处理 该视 ...
108 0 2018-12-25
多任务,多线程运行 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-25 21:45
火车采集器可以多线程多任务进行工作,这样可以加快采集速度,但是也要考虑到自己电脑硬件以及网络情况,应 ...
94 0 2018-12-25

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

最新发布
推荐课程
一周热帖排行最近7x24小时热帖
关注我们
火车采集专注教育培训

客服电话:400-123-4567

客服邮箱:776886721@qq.com

周一至周五 8:00-18:00

火车采集网站是助你走向成功的垫脚石

火车采集追求原创 - 引领行业人才培养!( 豫ICP备17002439号 )

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.