我的账户
火车采集

教育培训在线课程

亲爱的游客,欢迎!

已有账号,请

如尚未注册?

您还未设置本版块规则说明文字,如需设置,请登陆后台论坛栏目,在该板块设置下方填写本版块规则。
  • 0

    今日发帖

  • 329

    本版主题

如何获取网址里的全部内容 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:37
按照上图设置规则,就不管网页源代码是何种格式,都会把里面的内容全部采集到。 ...
81 0 2018-12-27
设置浏览器代理 ,和window窗口认证 的采集设置 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:37
有的网址是需要设置浏览器代理 ,和window窗口认证,才可以登录采集 比如设置如下 那么采集器里 需要在这 ...
81 0 2018-12-27
循环采集图片标签 与 创建多个标签分别采集图1,图2... attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:37
循环采集图片标签 与 创建多个标签分别采集图1,图2... 例如我们采集 http://www.ggg.cn/game/233007/ 里的 ...
93 0 2018-12-27
正则提取标签之 (?<content>[\s\S]*?)的语法讲解 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:37
以此网址为列 http://tieba.baidu.com/p/2376714043 采集 标题、时间、邮箱 来讲解 标题我们需要采集 ...
69 0 2018-12-27
您设置的某个标签不得重复,该网址没有被保存 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:37
您设置的某个标签不得重复,该网址没有被保存 出现这个问题,是因为 您设置的某个标签不得重复 导致的 如 ...
84 0 2018-12-27
利用多页,实现在原网页部分采集区域内采集 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
这是一个神奇的功能,利用多页实现在原网页部分采集区域内采集,或者循环采集 比如您要采集网址 http://pro ...
79 0 2018-12-27
采集网址重复中检测网址重复的问题 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
当提示如上图的时候,您可以通过清空网址和清空内容来重新运行采集。详情看教程 http://faq.locoy.com/q-9 ...
77 0 2018-12-27
8.3自动升级成功后,仍提示升级..
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
解决办法:采集器退出 运行 \System\Updater 升级即可
73 0 2018-12-27
清空内容,运行规则 提示 Reading from the stream has failed attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
如图提示的时候,请检查您的本地数据库是否连接成功。 本地数据库连接说明 详情 http://faq.locoy.com/q-6 ...
73 0 2018-12-27
通过发布导出采集网址
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
只要模板中添加上[标签:PageUrl]就可以了。
81 0 2018-12-27
我做了cdn 加速现在火车头发布变成很慢 而且发布失败特多 你们有什么办法应对吗?
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
重定向 hosts文件
68 0 2018-12-27
使用html排除不掉的html标签如何除去 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
如果在数据处理这一步选择了“Html标签过滤”,这里排除的html标签是那些格式简单的标签,比如标签是
76 0 2018-12-27
数据排除过滤,替换为空 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
比如要在内容字段 排除 掉这段话
   导读:
72 0 2018-12-27
任务配置批量修改工具 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
扩展——任务配置批量修改工具 任务配置批量修改工具:这个工具可以快速批量的修改软件里的其他规则 一些配 ...
79 0 2018-12-27
使用 [随机文件名] 生成固定长度文件 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
在淘宝等一些网站系统上,要求生成的图片名称为固定的32位长度。这时使用火车采集器的时间生成的网址,有可 ...
79 0 2018-12-27
如何获取当前采集页的地址 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
如下图勾选“从网址中采集” 提取数据方式选择“正则提取”,表达式写“^(?[\s\S]*?)$” ...
70 0 2018-12-27
如何设置采集的范围 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
点击“切换到无限极多页规则编辑模式”如下图: 打开后: 就可以设置采集区域了。这个界面 ...
161 0 2018-12-27
任务数据批量处理工具 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
扩展——火车采集器——任务数据批量处理工具 需要什么操作,就相应选择,最后执行。 ...
79 0 2018-12-27
自定义标签 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
72 0 2018-12-27
随机插入关键词 attach_img
by不忘初心
最后发表: 不忘初心 @ 2018-12-27 21:36
需要插入的关键词或者语句写到文本里面,并且文本编码必须是utf8,如何把文本编码设置为utf8看下图: ...
73 0 2018-12-27

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

最新发布
推荐课程
一周热帖排行最近7x24小时热帖
关注我们
火车采集专注教育培训

客服电话:400-123-4567

客服邮箱:776886721@qq.com

周一至周五 8:00-18:00

火车采集网站是助你走向成功的垫脚石

火车采集追求原创 - 引领行业人才培养!( 豫ICP备17002439号 )

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.