APP下载

网络爬虫背后的黑灰产业链

2024-09-24陈晓梅

检察风云 2024年17期

几名年轻人合伙开办网络科技公司,通过研发爬虫软件从他人网站或平台爬取房源信息,并利用这些信息发展客户、非法盈利。最终,其中二人被法院以犯非法获取计算机信息系统数据罪判刑罚金。

研发网络爬虫非法爬取信息

温某某、贾某某、任某(另案处理)都精通计算机信息技术。2011年6月16日,三人联手在北京通州区注册成立北京益思尔科技有限公司(以下简称“益思尔公司”)。工商登记信息显示,益思尔公司的经营范围包括技术推广服务、计算机系统服务、软件设计、基础软件服务以及零售计算机软件及辅助设备、通信设备等。

事实上,益思尔公司成立后不久,公司就开始涉足房源信息供给业务。对于房产中介从业人员(以下简称“房产中介”)而言,获取第一手有价值的房源信息是拓展中介业务的首要前提,只有手头有了更多的房源才能为客户提供更多选择,从而提高二手房的成交率。针对这一现实的市场需求,益思尔公司决定从事为房产中介提供房源信息的信息服务业务。但房源信息从哪儿来呢?温某某等三人想到了一个捷径,就是通过技术手段从现有的互联网房源信息平台获取房源信息并提供给房产中介赚取利润。

那么,如何从现有的互联网房源信息平台获取房源信息呢?温某某等三人想到了通过使用数据抓取程序(俗称“网络爬虫”)来爬取相关信息的方法。2013年,温某某等三人共同研发成功了一款名为“iHos”的软件,该软件是通过采用代理IP、设置UA参数等技术手段,使用数据抓取程序爬取“ke.com(贝壳网)”“1ianjia.com(链家)”“5i5j.com(我爱我家)”等网站发布的图片、VR影像、文字等公开房源信息,向使用该软件的用户提供房源上下架及房价变动提醒、一键提取网页素材、发布房源信息等服务。

温某某供述称,iHos爬取的目标网站主要是58同城、链家、安居客等网站,其模块中的“楼盘情报”和“房源管理”中的第二个功能(即:经纪人输入指定的网址读取资源)都是通过爬虫技术实现的。

iHos之所以能成功爬取一些相关网站公开的房源信息,是因为被侵权的网站没有设置反爬虫程序。随着时间的推移,温某某发现,贝壳找房(北京)科技有限公司(以下简称“贝壳北京公司”)等公司所属“贝壳找房”小程序端口设置了反爬虫程序,于是他便萌生了研发能对付拥有反爬虫策略的新爬虫软件的想法。

据温某某供述,2021年前后,其经研究发现,带有反爬虫策略的“贝壳找房”小程序端口是有算法签名的,这个算法签名就是用来校验前端请求的合法性,如果不破解这个算法签名,爬虫就没有办法爬取到数据。

之后,温某某用抓包的方法抓到了小程序发回来的数据包,通过分析该数据包研究其算法签名的逻辑,他竟然将其成功破解了。温某某供述,其破解“贝壳找房”微信小程序端口的签名验证策略,就是为了能够使用爬虫程序来爬取微信小程序端口的数据。

就这样,温某某于2021年初成功研发了“每天找房”软件,并于当年2月底上线运行。该软件通过破解贝壳北京公司“贝壳找房”微信小程序的端口验签算法技术防护措施、使用代理IP、修改UA参数等手段,利用网络爬虫程序非法获取贝壳北京公司微信小程序端口、网页端口的数据并获得房源具体房间号,再通过该软件将房号提供给其对接公司的房产中介人员,从而非法获利。

招揽客户:侵犯苦主数据权益

由于运营范围辐射全国,益思尔公司遂在各地发展代理、吸引客户。该公司在全国各地都有销售人员,北京、上海、武汉、南京、成都、沈阳等城市由公司自己的销售人员做推广,其他城市则由代理销售。按照益思尔公司规定,公司销售人员直接参与的直营销售,销售人员按销售额的30%到35%提成,但没有底薪;代理销售的,iHos和“每天找房”都是由公司与代理公司按照四六比例分成。

按照益思尔公司规定,销售人员在推进这两款产品时,必须直接上门向房产中介人员推销,且必须查验对方系房产从业人员身份才能开通业务。公司还明确要求“每天找房”不得向被抓取信息的公司的门店销售这两款产品。温某某供述称,这样做的目的是防止被侵权公司发现其爬取他人信息的这种行为。

警惕网络爬虫研发背后非法获取计算机信息系统数据的行为(图文无关)

据查,iHos分为钻石版和精英版,钻石版的费用为240元/季度、400元/半年;精英版的费用为270元/季度、450元/半年。温某某供述称,iHos软件一个月能进账40万元到52万元,“每天找房”一个月能进账18万元到25万元。相关证据显示,截至2021年9月案发,iHos在全国各地已发展用户144636个,充值金额4029.73万余元。“每天找房”共有普通用户1676个,充值金额294.31万余元,查询楼号次数87141次。

温某某表示,其电脑里有一个电子表格,表格里有每个销售每个月的销售业绩以及公司所发放的分成。iHos项目去掉销售的工资、房租、服务器托管等开销之后计为利润。利润的70%拿出来,一部分用来发给刘某作为工资,剩下来的钱由温某某和贾某某平分;利润的30%作为分红,其中7%作为温某某和贾某某的奖金,剩下的23%由温某某与贾某某、任某三个人平分。“每天找房”的收入去掉必要的成本以及客户还没消费的钱之后计为利润,这些利润是温某某和贾某某平分的。

东窗事发,双双获刑

温某某、贾某某于2021年9月24日被抓获归案,后分别于2021年11月、2023年3月被取保候审,2023年11月被逮捕。

据了解,非法获取计算机信息系统数据罪,是指行为人违反国家法律规定,侵入普通计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,情节严重的行为。非法获取计算机信息系统数据罪的客观方面表现为两种行为模式:即“侵入系统”+“获取数据”行为模式或者“采用其他技术手段”+“获取数据”行为模式。法院经审理认为:本罪的构成要件首先是数据获取手段具有违法性。行为人获取数据时必须采取侵入行为或类似侵入行为。本案中,温某某等人为非贝壳北京公司旗下的房产中介从业人员提供了非法使用贝壳北京公司数据的便利,进一步侵害了正常购买数据使用权限的房产中介公司的权益,损害了不特定社会公众的经济权益,严重影响和干扰了正常的社会经济管理秩序,符合非法获取计算机信息系统数据罪的构成要件。

2023年11月2日,江苏省常州市武进区人民法院作出一审判决:以非法获取计算机信息系统数据罪,分别判处被告人温某某有期徒刑3年6个月,并处罚金人民币20万元;判处被告人贾某某有期徒刑3年,缓刑4年,并处罚金人民币20万元;责令将被告人贾某某已退违法所得予以没收,上缴国库;责令将被告人温某某、贾某某尚未退出的违法所得人民币208.52万余元予以继续追缴。

一审宣判后,温某某不服,提起上诉。常州市中级人民法院受理后,依法组成合议庭,于2024年1月26日公开开庭审理了本案。2024年4月2日,法院公布本案二审裁定结果:驳回上诉,维持原判。

(本文谢绝转载)

编辑:黄灵 yeshzhwu@foxmail.com

以案释法

在互联网领域,“爬虫抓取”一般指抓取众多公开网站网页上数据的相关技术。它按照一定的规则,模拟浏览器向服务器发送请求,获取并分析网页资源,提取有用的数据。本案益思尔公司在温某某等人的策划下,通过案涉爬虫软件获取有关房源信息后,针对目标房产中介开展营销活动。尽管提供的数据中不包含房主的信息及联系方式,但房屋中介通常可以通过其提供的软件,抓取目标网站或平台上的物业公司或开发商信息,从而获取房主的联系方式及房源匹配信息。益思尔公司通过技术手段非法获取贝壳北京公司的真实房源地址信息的行为,严重侵犯了该公司的网络数据权益,导致该公司及其加盟公司直接遭受经济损失。综上,上述行为符合非法获取计算机信息系统数据罪的构成要件。