您现在的位置是:网站首页ν水淼软件(破)水淼软件(破)

水淼·万能文章采集器

作者头像 YLM 2021-10-20 15:48:36 收藏 浏览 地址已载()次 【加QQ群620332298 编号:2021102022230

简介依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。只需输入关键词,就能采集到微信文章、今日头条、一点资讯、百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎新闻和网页;可批量关键词全自动采集。"

水淼·万能文章采集器

软件介绍

水淼软件出品的一款万能文章采集软件,可以只需输入关键字就能采集各种网页和新闻,还可以采集指定列表页(栏目页)的文章。

注意:微信引擎限制严格,采集线程数请设置为1个,否则非常容易出验证码。

功能特点:

1. 依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
2. 只需输入关键词,就能采集到微信文章、今日头条、一点资讯、百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎新闻和网页;可批量关键词全自动采集。
3. 可定向采集指定网站栏目列表下的所有文章(如百度经验、百度贴吧),智能化匹配,无需编写复杂规则。
4. 文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
5. 史上最简单智能文章采集器,更多特点一试就知!

问题集锦:

采集设置的黑名单错误
[采集设置]里面输入黑名单时,如果最后有空行存在,就会导致关键词采集功能有搜索数量显示而无实际采集过程的问题。

升级记录(2021年10月19日):

2.15.0.0:URL采集文章面板的精确标签新增模糊匹配功能;新增计划任务功能,可以设定多个时间点,到点自动开始采集(当前被显示面板的开始采集)。
2.15.1.0:修复微信采集失败问题。
2.15.2.0:修复360网页和新闻的部分问题。
2.15.3.0:搜索引擎读取增加超时50秒设置;尝试修复部分情况下关键词采集崩溃的问题。
2.15.5.0:采集文章URL列表,新增来路设置;更新谷歌镜像地址。
2.15.8.0:修复百度网页搜索时间设置失效问题并取消百度新闻时间设置(已不支持);微信采集时增加正文最少字数的设置支持(原先只有自动识别的可以设置字数,而微信是内置精确标签的所以不能设置字数,现在可以了);【文章查看】切换显示时增加自动刷新目录树;关键词采集正文字数不足时补充提示设置的字数值
2.15.9.0:修复360新闻采集失败问题。
2.15.10.0:修复微信采集失败问题。
2.15.11.0:因有道翻译失效且无法更新,故新增百度翻译;其他更新
2.16.0.0:关键字采集文章新增今日头条、一点资讯等自媒体平台
2.16.1.0:修复上次升级导致的采集分页功能异常
2.16.2.0:修复今日头条图片链接问题;微信增加登录采集。
2.16.3.0:修复设置采集篇数时容易出现无法继续采集下一个关键词的问题。
2.17.0.0:修复谷歌无法采集的问题(仍需翻墙);修复百度转译失效问题(更改为搜狗转译,翻译效果最好的人工智能翻译引擎)。
2.17.1.0:对今日头条增加了尝试次数,并且自动线程为1,以避免被限制
2.17.1.1:尝试修复关键词采集出现的数组错误问题
2.17.2.0:修复上次升级导致的采集错误
2.17.3.0:修复百度网页改动无法采集的问题
2.17.5.0:2018年5月24日源码丢失补写,并修复微信和今日头条无法采集的问题(本版本谷歌采集暂时失效。如需使用请使用2.17.3.0版本并翻墙)
2.17.6.0:修复微信文章没有采集到标题的问题
2.17.7.0:修复一点资讯因改动采集失败问题;修复谷歌采集;其他更新
2.18.0.0:修复微信和今日头条采集
2.18.1.0:修复微信采集
2.18.2.0:修复微信采集
2.18.3.0:修复列表页采集一些问题;修复转译
2.18.5.0:修复微信采集,增加联网读取采集指令以方面后续动态更新
2.19.0.0:修复今日头条采集
3.0.0.0:修复多项关键词采集文章功能,包括微信,搜狗,雅虎,谷歌,一点资讯等,其中微信容易验证
3.0.1.0:修复搜狗转译
3.0.2.0:修复百度新闻采集不正常的问题
3.0.3.0:修复今日头条正文自动识别失败问题
3.0.5.0:修复一点资讯采集断掉的问题;修复转译
3.0.6.0:尝试修复百度网页部分关键词判断验证码错误的问题;修复转译
3.0.7.0:尝试修复谷歌部分情况翻墙也不能采集的问题,且将每次谷歌采集数量设定为50;
3.0.8.0:修复搜狗转译;修复计划任务列表页采集功能弹出信息框导致阻止计划执行的问题
3.0.9.0:修复搜狗和谷歌转译;增强头条采集;去除微信采集;其他更新
3.1.0.0:修复微信采集
3.2.0.0:升级谷歌内核浏览器用于登录和验证,有效提高通过能力。
3.2.1.1:采集url和文章使用API读取以解决部分网站读取不了的问题。
3.2.2.0:尝试修复百度连续弹出假的验证的问题。
3.2.3.0:尝试修复百度连续弹出假的验证的问题;尝试修复关键词采集偶发性错误退出问题。
3.2.5.2:针对百度的假验证问题,增加三种采集模式进行尝试。
3.2.5.3:修复弹出0个提示框的问题;更换图标。
3.2.6.0:修复今日头条采集;修复360网页采集。
3.2.8.0:改进今日头条采集较慢的问题;标题前加搜索词的格式改进为5个符号随机隔开,并增加内容也插入搜索词(随机1-3次)。
3.2.10.0:标题加搜索词新增多个选项。
3.3.0.0:修复微信验证无效的问题;尝试修复百度验证无效的问题
3.3.1.0:修正设定篇数时记忆历史标题的计数问题。
3.3.2.0:修正上次升级导致的百度采集模式的内部异常逻辑;去除采集设置里的搜狗翻译,默认只有谷歌翻译。
3.3.3.0:修正部分https网站无法读取的问题;修复谷歌转译引擎的一些问题。
3.3.3.3:修正个别情况下设定采集篇数计数不准问题。
3.5.0.0:增加知乎链接自动识别正文功能;删掉文章来源多余空行;增加百度验证自动等待并关闭功能;采集文章URL增加来路地址;访问命令全面调整;其他变更(PS:采集微信的话必须在打开的浏览器界面的右上角登录才能减少验证和增加采集数量)。
3.5.1.0:去除了知乎无视最少字数的例外操作。
3.5.2.0:修复了上次升级导致的转译错误的问题。
3.5.5.0:修复百度新闻改动采集不了的问题;等。
3.6.0.0:修复今日头条采集不了的问题。
3.6.1.0:修复必应采集问题。
3.6.2.0:修复采集文章URL时个别网站对Cookie敏感而无法采集的问题。
3.6.2.1:补上丢失的管理员权限问题。
3.6.3.1:修复微信采集(先登录微信,如果弹出验证屡次无效,点击停止采集再重新开始就好了)。
3.6.5.0:修复长期存在的在多线程下解析代码偶发错误问题;增加验证时清除缓存选项;修改【采集文章URL列表】的部分描述文字,修改【关键词采集文章】的界面参数间隔;其他。
3.6.6.0:修复搜狗网页采集设置篇数时遇到个别网站容易死循环的问题。
3.6.7.0:改进今日头条采集响应速度;增加今日头条采集模式切换(2和3)。
3.6.8.0:修正软件识别代码跳转时如果遇到注释代码会错误跳转的问题(典型如腾讯网)。
3.7.0.0:修复头条对之前采集ua设置的屏蔽,将头条采集栏目设置为资讯;更换浏览器新版本node.dll文件;改进缓存清除机制。
3.7.1.0:增加对知乎zhuanlan的采集支持。
3.7.5.0:关键词采集异常退出并重新运行后软件支持提示是否继续上次采集进度;【采集文章URL列表】支持登录采集(登录位置在【根据URL列表采集文章】右下角);【根据URL列表采集文章】的原始网页选项,支持可以设置标题识别为URL(开始采集时按下Ctrl键,可以保存到url原始路径)。
3.7.6.0:修复了头条采集,但是实测采集一段时间后头条就不返回内容了。
3.7.7.0:修复谷歌语言混乱的问题。
3.7.8.2:指定网址采集增加采集过的网址自动删除选项;尝试修复采集头条容易崩溃的问题,并且因为改进而提升单篇采集速度,所以指定头条网址采集时需要设置下间隔秒5,避免采集过快被限制。

很赞哦!()

站点信息
  • 文章统计:374条
  • QQ 群:扫描加入,开通会员
  • QQ扫描加入,开通会员