本工具是基于兴趣及代码研究所创作,严禁用于商业用途及任何不法用途。本代码完全免费,严禁任何人将本代码用于出售及其它类似商业行为。
94采集器是一款非常受欢迎的可用于linux或者windows双平台的采集系统。相对于关关只能在Windows上运行来说,太香了。
但是94采集器也有一些缺点,比较代码全是中文,中文函数,中文变量,中文类,非常难以理解。另外就是采集效率上,94是比较容易内存溢出的,导致动辄卡死。另外在对比的效率以及加书的效率上来说,都有不小的问题。
但94的优点同样不少,前文说的跨平台是其一大优势。94兼容的系统比较多也是一大优势;另外,因为python本身库比较多,实现类似cloudflare 5秒盾这样的突破就变得轻而易举。
鉴于对这么优秀的系统的兴趣,对其进行了一系列的修改优化,主要从以下几个方面
- 代码重写,摒弃中文,代码执行效率更高。
- 采集代码优化,不再会有内存溢出卡死等现象。
- 对比算法重写,使用高效简洁的对比算法,准确率更高,速度也更快。
- 增加了动态代理功能,可定时切换代码,不用再担心被封ip了。
- 增加了索引更新功能,会将采集内容定时更新到全文索引,搜索再也不用查库了。
- 增加了自动更新功能,用户点击网站的报错时,采集器自动从源中寻找章节更新。
以下是系统截图
本系统免费分享给对爬虫技术有兴趣的朋友,为防止泛滥,所以只限Vip用户组下载。
请大家自行研究,不要分发。
再次申明,此代码仅供研究技术使用,严禁用于不法用途,违者后果自负。
发表回复
要发表评论,您必须先登录。