RSS订阅 加入收藏  设为首页
捕鱼王
当前位置:首页 > 捕鱼王

捕鱼王:裁判文书网数据竟被商家标价售卖

时间:2019/8/2 18:56:20  作者:  来源:  浏览:0  评论:0
内容摘要: 记者在某网络商城中看到,有标注来自湖南、广东、山东等多地的商家均声称出售裁判文书网的数据,其中不少商家声称其数据量超6000万条。而据裁判文书网公开数据显示,目前裁判文书网上公开的文书总量为7395万多篇,如果商家所称的数量属实,则商家能够提供绝大多数已经公开的文书数据。  不...
        记者在某网络商城中看到,有标注来自湖南、广东、山东等多地的商家均声称出售裁判文书网的数据,其中不少商家声称其数据量超6000万条。而据裁判文书网公开数据显示,目前裁判文书网上公开的文书总量为7395万多篇,如果商家所称的数量属实,则商家能够提供绝大多数已经公开的文书数据。

  不少声称能够出售裁判文书网数据的商家在商品文字描述中称,其数据是通过“网络爬虫”的方式获取的。所谓“网络爬虫”,又称网页蜘蛛、网页机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。相当于一个自动访问网页并进行相关操作的小机器人。

  北青报记者注意到,尽管每名商家均在商品页面标示称,其数据售价为0.1元至1元,但每名商家均在文字描述中表示,数据的售价并不以标示为准,而是需要“私聊”获取。

  一名售卖裁判文书数据的商家说,购买裁判文书数据的买家所需要的数据量从几千篇到几千万篇不等,有的买家是因为无法打开裁判文书网而不得不来求助于数据卖家,“还有很多学生买数据用于论文写作,这种情况几千条就够了,商用的话可能需要几百万条甚至上千万条。”商家还称,每个月他们能接到四五个文书数据采集的订单,而价格和买家需要的数据量有关,“几百万条数据大概要几千块钱,现在加密技术很严格,所以要贵一些。”

  “爬虫”系统

  曾致正常用户无法访问

  北青报记者了解到,部分技术机构通过网络爬虫系统获取裁判文书网数据的行为,已经给裁判文书网正常用户的访问带来了不便。不少网友曾在网上发帖称,自己搜索裁判文书时,常常遭遇裁判文书网网站显示因为系统原因,无法查询的情况。

  对此,最高人民法院在其官网回应网友对于裁判文书网运行慢、故障频繁等情况时表示,由于中国裁判文书网公开文书数量和影响力不断增加,访问用户数不断增长。同时,2018年5月初以来,大量技术公司通过爬虫系统无限制并发访问非法获取裁判文书数据,造成网站负荷过大,大量正常用户请求堵塞,访问出现速度慢或部分页面无法显示等现象。

  今年5月,最高人民法院信息中心主任许建峰在接受媒体采访时表示:“中国裁判文书网目前每天的访问量可以达到几千万的量级,其中还包括数据爬虫的攻击,我们的中心服务器承受着巨大压力。”

  “我们每时每刻都在监控着它的应用情况,希望遇到问题立即采取措施,但是的确还不能完全跟得上步子,所以会出现停网维护运营的情况。”许建峰说,最高法已成立了专门的运维保障团队去维护管理中国裁判文书网,也将在技术与人力上投入更多的力量。

上一篇:没有了
下一篇:捕鱼王:八桂走活新棋局
相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (捕鱼王)