火车采集器企业版7.6 绿色免费版-强大实用的网络数据信息挖掘软件
[ 建站工具 // 2014-06-30 ]
我们知道采集就是把别人网站上的信息直接照搬到我们自己的网站上,这样可为我们刚开起来的网站丰富下内容,看起来网站才像个网站。如何采集别人的内容呢?这是初学者都难操作,有的更难理解的一个问题。
火车采集器是一款专业的网络数据采集/信息挖掘处理软件,通过灵活的配置,可以很轻松迅速地从网 页上抓取结构化的文本、图片、文件等资源信息,可编辑筛选处理后选择发布到网站后台,各类文件或其他数据库系统中。被广泛应用于数据采集挖掘、垂直搜索、 信息汇聚和门户、企业网信息汇聚、商业情报、论坛或博客迁移、智能信息代理、个人信息检索等领域,适用于各类对数据有采集挖掘需求的群体。
企业版 和 免费版 功能对比:
软件功能区别 |
免费版 |
个人版 |
标准版 |
旗舰版 |
企业版 |
|
V8版本新增项 | ||||||
自定义语法生成网址 | √ | √ | √ | √ | √ | |
下载ftp中的文件 | × | √ | √ | √ | √ | |
发布扩展 | × | × | √ | √ | √ | |
更新远程采集规则 | × | × | √ | √ | √ | |
POST采网址文本搜索 | × | × | √ | √ | √ | |
网盘上传 | × | × | × | √ | √ | |
二级代理页面缓存 | × | × | × | √ | √ | |
增加EXCEL数据导入 | × | × | √ | √ | √ | |
标签处理运行C#代码 | × | × | × | √ | √ | |
V7版本新增项 | ||||||
无限级多页采集 | √ | √ | √ | √ | √ | |
任务队列运行管理功能 | √ | √ | √ | √ | √ | |
无限级分组任务管理,任务回收站功能 | √ | √ | √ | √ | √ | |
RSS地址采集功能 | √ | √ | √ | √ | √ | |
列表页分页采集获取功能 | √ | √ | √ | √ | √ | |
列表页附加参数获取功能 | √ | √ | √ | √ | √ | |
列表页及标签XPath可视化提取功能 | √ | √ | √ | √ | √ | |
标签纯正则替换功能 | √ | √ | √ | √ | √ | |
Http接口查看运行情况[注2] | √ | √ | √ | √ | √ | |
导出记录为单个或多个Txt、html 文件[注1] | √ | √ | √ | √ | √ | |
标签间自由组合功能 | × | √ | √ | √ | √ | |
针对标签内容继续发送Http请求功能 | × | √ | √ | √ | √ | |
无限级列表网址采集 | 最多两级 | √ | √ | √ | √ | |
从Http头信息中获取数据 | × | √ | √ | √ | √ | |
标题内容正文提取功能 | × | × | √ | √ | √ | |
Aspx列表分页自识别 | × | × | √ | √ | √ | |
多网站站群式web发布 | × | × | √ | √ | √ | |
导出记录为Word格式 | × | × | √ | √ | √ | |
导出所有记录为Excel格式 | × | × | √ | √ | √ | |
随机二级Http代理服务器 | × | × | × | √ | √ | |
下载的图片自动加增强型水印功能 | × | × | × | √ | √ | |
Ocr识别(图片转化为文字) | × | × | × | √ | √ | |
Http接口管理采集器运行[注2] | × | × | × | × | √ | |
Mongodb数据库保存数据 | × | × | × | × | √ | |
主从服务器分布式采集[注2] | × | × | × | × | × | |
V2010版功能项 | ||||||
多任务,多线程运行 | √ | √ | √ | √ | √ | |
多页采集,内容分页采集功能 | √ | √ | √ | √ | √ | |
标签循环采集 | √ | √ | √ | √ | √ | |
下载图片文件 | √ | √ | √ | √ | √ | |
列表缩略图及列表页标签采集 | √ | √ | √ | √ | √ | |
自动提取内容缩略图 | √ | √ | √ | √ | √ | |
正则使用,自定义规则获取网址 | √ | √ | √ | √ | √ | |
支持网站登录采集 | √ | √ | √ | √ | √ | |
网页及地址编码自动识别 | √ | √ | √ | √ | √ | |
网页压缩,跳转采集 | √ | √ | √ | √ | √ | |
自定义User-Agent,模仿蜘蛛采集 | √ | √ | √ | √ | √ | |
支持使用代理服务器采集数据 | √ | √ | √ | √ | √ | |
自动摘要,自动拼音 | √ | √ | √ | √ | √ | |
html标签排除 | √ | √ | √ | √ | √ | |
采集记录筛选 | √ | √ | √ | √ | √ | |
任务运行日志 | √ | √ | √ | √ | √ | |
自动提取内容第一张图 | √ | √ | √ | √ | √ | |
WEB在线发布模块编辑修改 | √ | √ | √ | √ | √ | |
使用post方法获得采集网址 | √ | √ | √ | √ | √ | |
随机文件夹保存下载文件 | √ | √ | √ | √ | √ | |
文件下载续传 | √ * | √ | √ | √ | √ | |
数据库发布模块编辑器 | √ * | √ | √ | √ | √ | |
ACCESS数据库保存数据 | √ | √ | √ | √ | √ | |
迅雷和FlashGet的地址解密 | × | √ | √ | √ | √ | |
增强型定时自动运行采集功能[注1] | × | √ | √ | √ | √ | |
命令行启动程序 | × | √ | √ | √ | √ | |
本地任务数据编辑再发布功能 | × | √ | √ | √ | √ | |
任意格式文件下载功能 | × | √ | √ | √ | √ | |
使用FTP自动上传文件到网站 | × | √ | √ | √ | √ | |
简体繁体互转功能 | × | √ | √ | √ | √ | |
Sqlite数据库保存数据 | × | √ | √ | √ | √ | |
MySql数据库保存数据 | × | × | √ | √ | √ | |
SqlServer数据库保存数据 | × | × | √ | √ | √ | |
文件自动上传到网站 | × | × | √ | √ | √ | |
自动获取tag,生成中文关键词 | × | × | √ | √ | √ | |
全局敏感词替换&近义词替换 | × | × | √ | √ | √ | |
PHP编程插件 | × | × | √ | √ | √ | |
C#外部编程插件 | × | × | × | √ | √ | |
采集数据后直接发布或导入数据库 | × | × | × | √ | √ | |
技术服务列表 |
免费版 |
个人版 |
标准版 |
旗舰版 |
企业版 |
|
商业用户QQ群支持 | × | √ | √ | √ | √ | |
电话,E-mail支持 | × | √ | √ | √ | √ | |
企业QQ/MSN支持 | × | × | √ | √ | √ | |
免费定制采集任务规则 | × | × | × |
√1个 |
√8个[注4] |
|
免费定制Web或数据库发布模块 | × | × | × |
√1个 |
√2个 |
|
免费网络培训基本的采集、发布功能 | × | × | × |
× |
√1次 |
|
免费定制免登录发布接口 | × | × | × |
× |
× |
|
免费定制编程插件 | × | × | × |
× |
× |
|
软件功能小幅修改 | × | × | × |
× |
× |
|
软件厂商OEM定制 | × | × | × |
× |
× |
|
国内主要大中型城市上门培训(一次) | × | × | × |
× |
× |
|
专属技术客服 | × | × | × |
× |
× |
|
7*24小时响应 | × | × | × |
× |
× |
|
全自动采集代维护服务 | × | × | × |
× |
× |
|
全自动发布代维护服务 | × | × | × |
× |
× |
|
绑定电脑 |
× |
一台 |
一台 |
一台 |
十台 可免费更换五次 |
|
升级服务年限 |
不限 |
两年[注3] |
两年 |
两年 |
两年 |
|
价格(不带发票) |
¥0 |
¥260 |
¥660 |
¥800(机器码) ¥990(加密狗) ¥1190(旗舰自助授权版) |
¥4800(10授权+1加密狗) |
|
价格(含税价) |
¥0 |
¥290 |
¥722 |
¥874(机器码) ¥1080(加密狗) ¥1295(旗舰自助授权版) |
¥5184 |
|
备注说明: |
相关阅读:
Discuz X3.1门户文章、论坛在线发布模块-网站建设内容采集利器(火车头采集教程)
相关文件下载地址:
官网:访问
软件性质:免费