我的账户
火车采集

教育培训在线课程

亲爱的游客,欢迎!

已有账号,请

如尚未注册?

您还未设置本版块规则说明文字,如需设置,请登陆后台论坛栏目,在该板块设置下方填写本版块规则。
  • 0

    今日发帖

  • 329

    本版主题

利用起始网址设置的时间样式采集报纸数据 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
比如网址 http://epaper.hf365.com/jrshb/html/2013-08/30/node_4.htm 明天会变成2013-09/01,这种都是和当 ...
68 0 2018-12-27
post可转化get的方式 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
顺便给各路达人再教一个知识, 如果POST的数据比较短, 可以尝试强制为get获取 http://www.ah-inter.com/Ht ...
54 0 2018-12-27
页面跳转的处理 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
比如这个页面:http://www.meilishuo.com/u/EJmJr7/1831883317/11111111?refer_type=&expr_alt=b&frm=out_p ...
67 0 2018-12-27
假如需要采集的网站有2种页面格式如何处理? attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
例如采集下面个地址 http://bj.zufang.sina.com.cn/detail/23661567/ http://bj.zufang.sina.com.cn/de ...
76 0 2018-12-27
如何把采集到的复杂的html标签替换为简单的格式 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
最常见的情况就是我们采集dz系统做的论坛,有图片的时候,它的图片代码都非常的复杂,比如我们论坛http://b ...
74 0 2018-12-27
当前任务设置每次最多采集数量为5,因此其它的可采集的数据将在下次运行时采集 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
运行任务的时候,发现每次采集的条数是固定的,比如下图提示: 这个是因为你在规则里面设 ...
70 0 2018-12-27
怎么能够进一步提高采集数据的速度
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
影响采集速度的因素有很多,常见的有自己的网络速度,运行电脑的硬件配置,以及采集的网站的响应速度和规则 ...
71 0 2018-12-27
获取网页内容失败,重试中请求默认页 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
如果能正常访问的网站,采集器提示“获取网页内容失败,重试中请求默认页”,那么可能是网速慢,没有采集的 ...
68 0 2018-12-27
导出或收集采集的网址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
根据自己的需要导出要采集的网址。
69 0 2018-12-27
添加起始网址中其它网址格式网址的添加 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
有的用户在实际使用中,他需要采集的网址如果用批量/多页的方式只可以改一个变量, 但是他实际是有两个或 ...
78 0 2018-12-27
下载路径设置简易说明 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
一、在任务规则第四步,设置好文件(图片)需要保存的地方! 二、设置好文件(图片)的路径, ...
70 0 2018-12-27
获取当前网页地址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:35
77 0 2018-12-27
文章采集实例 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
通过采集腾讯新闻为例来说明采集器采集的原理和过程采集地址是:http://news.qq.com/newssh/shwx/shehuiwan ...
77 0 2018-12-27
无极限多页采集 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
采集总是会遇到要使用多页的时候,一般只要一级多页,偶尔多页下面还有多页,采集器现在能处理无限极多页, ...
71 0 2018-12-27
采集大量数据量 如何提高采集速度
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
以下给出了此问题的 几点解决方案,可根据个人情况稍作调整采集方案: 1、调整采集线程 和时间间隔,调整方 ...
76 0 2018-12-27
关于采集器运行时CPU占用特别高的原因及解决办法 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
程序中使用大量的复杂计算后,CPU的占用将会升高。如果是采集器占用CPU居高不下,那说明用户写的采集规则有 ...
66 0 2018-12-27
设置了文件保存目录,下载的图片等附件没有保存到指定的目录中 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
如下图我们在规则的文件保存及部分高级设置那里,设置了所有文件保存文件夹: 在我们第二步采 ...
67 0 2018-12-27
错误信息:没有探测到文件的真实地址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
当你规则里面有图片或者其他文件需要下载的时候,提示下图错误: 添加下载时出错,没有探测文件的 ...
72 0 2018-12-27
分页的内容采集不到怎么办 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:34
1,第一种情况是分页设置不对 参考教程:http://faq.locoy.com/q-710.html 2,第二种情况是内容分页 ...
70 0 2018-12-27
添加起始网址之RSS地址采集功能 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:33
只要给采集器提供RSS地址,采集器就能把内容页地址提取出来,在添加“起始地址” 选择“Rss”选项,把rss地 ...
73 0 2018-12-27

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

最新发布
推荐课程
一周热帖排行最近7x24小时热帖
关注我们
火车采集专注教育培训

客服电话:400-123-4567

客服邮箱:776886721@qq.com

周一至周五 8:00-18:00

火车采集网站是助你走向成功的垫脚石

火车采集追求原创 - 引领行业人才培养!( 豫ICP备17002439号 )

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.