WordPress 免费采集插件 长腿蜘蛛-CTspider
CTspider(长腿蜘蛛) 插件特性
「长腿蜘蛛-CTspider」是一个全自动采集插件几乎可采集任何网站,设置轻而易举,只需要设置定向采集网址,通过CSS选择器精准识别采集区域,包括(内容,摘要,TAG,缩略图,自定义字段等…)然后自动检测抓取网页内容,文章去重,更新发布,这个过程全自动完成,无需人工干预。
版本简介
「长腿蜘蛛-CTspider」从V2.0版本发生了翻天覆地的变化,重构了底层,优化了业务逻辑,全新的UI一目了然,功能模块设置更为清晰,让新手也可以轻松上手。
支持版本
WordPress支持4.0+ 到最新版本
CTspider V2.0 只支持PHP7.0+以上版本, 由于部分代码加密对PHP 7.2 的适配会有问题,尽量使用PHP7.0-7.1
如何安装
使用WordPress插件上传页安装即可。
如FTP上传,请使用二进制上传。
插件特性
CTspider共有8个功能模块
基本设置
项目名称
更新时间
字符集选择
随机IP(减少ip被封的几率)
多线程任务
多线程任务数量设置
列表设置
多任务URL采集
区域选择器(定位更准确)
列表缩略图采集
自定义缩略图采集属性
自定义添加来源网址字段
文章设置
CSS精准的标题匹配规则
CSS多规则内容匹配(包括:TAG,摘要,特色图片,发布时间,内容自定义属性)
定向测试URL规则
正文分页采集(v2.2新增)
全功能发布设置
支持多分类选择
支持作者选择
支持发布状态选择
支持图片附件下载选择
支持TAG标签选择 或 WordPress标签库智能匹配
支持TAG属性设定
支持摘要自动选择
支持文章图片自动生成特色图索引选择
强大的内容过滤模块
支持内容CSS选择器定向删除和索引删除
支持HTML标签定向过滤和索引过滤
支持HTML属性过滤(让内容更加纯净)
支持特例标签设置 (v2.1新增)
内容替换模块
支持标题关键字替换
支持内容关键字替换
支持标题或内容前后插入自定义文本
自定义样式style
支持给任意HTML元素添加 class 或 style 属性
支持定向或索引选择
翻译伪原创模块
支持百度翻译 [支持28种语言实时互译,每月享200万字符免费服务](v2.3新增)