软件简介
八爪鱼采集器是一款网页数据采集器,能够对各种不同类型的网页进行大量的数据采集工作,八爪鱼采集器官方版类型涵盖广泛,金融类、交易类、社交网站、电商商品等的网站数据都能够被规范性的采集下来,并且可以被导出。
软件特色
云采集
5000台云服务器,24*7高效稳定采集,结合API可无缝对接内部系统,定期同步爬取数据
智能防封
自动破解多种验证码,提供全球最大代理IP池,结合UA切换,可有效突破封锁,顺利采集数据
全网适用
眼见即可采,不管是图片电话,还是贴吧论坛,支持所有业务渠道的爬虫,满足各种采集需求
海量模板
内置数百个网站数据源,全面覆盖多个行业,只需简单设置,就可快速准确获取数据
简单易用
无需再学爬虫编程技术,简单三步就可以轻松抓取网页数据,支持多种格式一键导出,快速导入数据库
稳定高效
分布式云集群服务器和多用户协作管理平台的支撑,可灵活调度任务,顺利爬取海量数据
使用方法
第一步
打开客户端,选择简易模式和相应的网站模板
第二步
预览模板的采集字段、参数设置和示例数据
第三步
设置对应的参数,保存运行完成数据采集
常见问题解答
问题八爪鱼采集器能采集别人的后台数据吗?
不能采集,后台数据需要有后台访问权限,正规的采集软件不会提供此类侵权服务。但您可以采集自己的后台数据。
问题八爪鱼能采集QQ号码、邮箱、电话号码之类的吗?
能采集,任何你在网页上能看见的数据都可以采集,八爪鱼采集器内置的规则市场中也有很多此类规则可下载,无需配置,运行规则就可以提取到这些数据。
怎么判断八爪鱼采集器能采集哪些信息呢?
简单来说,你能在网页上看到的信息,八爪鱼采集器均能进行采集,具体采集规则需要你自行设置或从规则市场内下载。
配置采集流程时,有时候左键点击一个链接,弹出选项的时候网页会自动跳转,如何避免网页自动跳转?
个别使用脚本控制跳转的网页可能会在点击左键的时候跳转, 给配置带来不便, 解决办法是使用右键单击, 左右键单击网页都会弹出选项,没有任何区别。右键点击一般可以避免自动跳转的问题。
八爪鱼采集器安装成功后无法启动怎么办?
如果首次安装成功后启动提示“Windows正在配置八爪鱼采集器,请稍后”,并且之后出现提示“安装时发生严重错误”,并且您的电脑上有360安全卫士等类似软件正在运行,则可能是因为360等杀毒软件错误的删除了八爪鱼运行所需要的文件,请退出360等杀毒软件,重新安装八爪鱼采集器即可
更新日志
Bug修复(紧急修复8.0.14版本中问题)
解决本地采集中部分网站会在新窗口弹出网页的问题
解决自定义配置中重新编辑任务有些步骤XPath不显示的问题