数据战争的意外:hiQ vs 微软LinkedIn

2017-12-08 10:03:11 admin 38


文/麻策律师


hiQ:  让我爬你家数据。

领英:滚,不让你爬!

hiQ:小气鬼!

领英:(沏好技术围墙),看你怎么爬?

hiQ:好吧,那我去法院告你。

领英:呃……


经典:hiQ vs.微软LinkedIn


日前,美国联邦一位“陈”法官作出一项令人意外的裁定,临时禁止微软旗下的LinkedIn公司不得采取法律或技术措施限制第三方公司爬取其网站上的公开数据


LinkedIn公司目前拥有5亿用户,微软公司在2016年12月以262亿美元进行了收购。在LinkedIn网站上,用户可以自行选择注册不同等级的隐私保护体系,包括完全公开,对联系人公开,关系网公开等,如果用户选择完全公开信息,则其资料可以向LinkedIn以外的人士公开。另外,LinkedIn允许例如Google在内的全网搜索引擎收录信息。


图片关键词

图:领英隐私权政策


而我们故事的主人公——hiQ公司,它的商业模式完全建立在对LinkedIn用户的数据分析之上,因为这家公司认为LinkedIn是职业关系网领域内的绝对支配者。hiQ公司为市场提供两类产品:一是为雇主分析哪些员工存在高离职风险的“监控者服务”,二是提供个体技能拥有者信息的技能地图。所以,如果没有LinkedIn的数据,就不会有hiQ公司。


看着这个“寄生虫”,LinkedIn满心不悦。于是,2017年5月,领英向hiQ发函要求停止未经授权的数据抓取行为,同时还通过技术手段阻止hiQ获取相关数据。其实早先,LinkedIn就已经对使用机器程序从LinkedIn网站提取用户资料的行为提出了近百起诉讼,并认为这类收集用户资料的行为相当于黑客攻击。


一般人基本会认怂了,但是,hiQ公司竟然向法院提出了诉讼。于是乎双方在法庭上大战了三个回合。例如hiQ公司是否违反美国CFAA(《计算机欺诈与滥用法》)规定的“未经授权或超越授权进入计算机系统以获取信息……须承担民事或刑事责任”,是否违反加州宪法言论自由,是否违反加州《反不正当竞争法》(UCL)等。


法院最终裁定的结果是:1.被告领英(LinkedIn)公司不得阻止hiQ公司进入、复制并使用LinkedIn网站的公开信息,亦不得采取法律或技术措施进行阻碍,若有则必须在24小时内称除;2.在临时禁制令期间,被告LinkedIn公司须撤回并禁止再向hiQ公司发送禁止其使用数据的法律声明(实际共4项)。


福利:「网络法实务圈」微信公众号后台回复关键词 LinkedIn裁决书获得美国法院裁定书完整版全文。


数据“霸权”


19世纪最为重要的资源是媒炭,促成工业革命的肇始;20世纪最为抢手的资源是石油,它保障了电气时代的持续;21世纪最重要的其实不是人才,而是数据资源,因为这是打开大数据和智能时代的钥匙。


这里会有一个很微妙的状况,例如一般而言从便于推广的角度出发,每一个网站都在争夺目前网络流量的入口之一:搜索引擎,希望自己网站的数据或信息能被各类搜索蜘蛛所收录(甚至跟踪搜索算法并对网站进行SEO优化),但一旦自身的垂直行业数足瞳够支撑生态,又希望让搜索引擎走开,例如使用robots.txt协议,全网https、点击或流量监控等,从而防止已方数据被人抓取。因为数据实在太重要了。


从以往白菜价的用户资源到现在成本越来越高的获客价,让互联网公司每一个用户的获取都显得困难十足,更不用说通过运营提高粘度并留存。但不管怎么说,数据沉淀的好处已然显现,阿里通过数据分析进行用户画像从而开拓出类如芝麻信用等新商业形态,百度得以在庞大的数据中进行人工智能和无人驾驶的探寻。


互联网的作用就像是人类语言的两个作用,促进交流以及阻碍交流。在大数据面前,互联网已经从原初的开放变成一个越来越封闭的空间,一个庞大的互联网生态圈总是孤芳自赏,这似乎并不是互联网之福。


所以,数据“霸权”事件层出不穷,类似于hiQ vs.LinkedIn案件,数据资源的争夺战争早已在全世界悄然铺开。苹果应用商店中的所有应用中收费需要向苹果支付30%的提成;谷歌滥用其市场支配地位,在搜索结果中推广自主比较购物服务被罚天价24.2亿欧元;百度起诉奇虎360违反“Robots协议”爬取数据纠纷,顺丰和菜鸟对物流数据的争夺,京东和天天快递数据接口之争,以及最近的华为和微信的数据搜集之争,都会成为经典。


图片关键词

图:重罚谷歌的女人


在hiQ vs.LinkedIn案件中,hiQ在获得裁定后还发表了一通言论,认为公共数据必须保持公共,互联网的创新不应受到数据囤积公司不正当的竞争和限制。该案法院也做了一个“痛苦的决择”,在两方均有伤害的情况下,法益该如何衡平——毕竟hiQ会因为数据干涸而结束商业创新,而用户又可能因为数据的公开收集而面临隐私的威胁。


所以相信,数据市场会是一个独立的,可由反垄断法所确认的“相关市场”,另外,正在修订的竞争法中,“市场相对优势地位”也将会是一个不错的利器。



数据“所有权”


数据产权问题如何解决,至今为止,这仍是一个世界性难题。2017刚修订的《民法总则》第一百二十七条规定,法律对数据、网络虚拟财产的保护有规定的,依照其规定。虽然等到这个“法律”的出台估计仍需要年数,不过法律确实给数据披上了“权利”的外衣了。


从另一个角度来看,数据到底是不是一定要具有所有权的属性呢?共享社会似乎就在我们面前,共享宝马、共享单车、共享住宿、共享充电宝、共享办公等层出不穷,如果到了共享穷尽的那一天,还要产权作甚?谁愿意被产权所绑架?刘强东所称的共产主义社会就要来了,其本意似乎也在于产权制度快归于消亡了。


数据的真正价值应当是“流通”,但如何合规流通正在眼下需要解决的问题。不管是《网络安全法》还是《个人信息和重要数据出境安全评估办法 (征求意见稿) 》,本意上并不是限制数据流通,而是保护个人信息安全以及网络安全。而其中最为重要基础的底层规则是“个人信息授权”,任何个人信息的收集和使用,都须获得个人授权,包括概括授权和单项授权。而用户授权本身却不代表用户对其信息享有“所有权”。


以华为和微信的数据搜集纠纷为例。一个很有意思的现象是硬件商也开始收集用户数据了,而在以往,这些事情却往往都只是网络运营者的“专利”。在此纠纷中,华为荣耀Magic手机将扫描用户数据,根据微信聊天内容自动加载地址、天气、时间等信息,而腾讯认为华为私自获取属于腾讯的数据,且侵犯了微信用户隐私。


图片关键词


假设用户是享有数据的所有权的,那华为通过用户使用手机时的授权,在法益上能够读取用户的任何信息,这类授权和用户打开微信在华为门口排队将微信记录给华为看没有根本区别,因为所有权是法益中最顶级的权利,微信在内的数据的使用权益是不能对抗用户的所有权的,这用《物权法》可以解释。


但是,当用户不享有数据所有权的情况下(目前就是如此),用户的数据权益和微信的数据权益(收集和维护成本付出)似乎应当是同一层级的权利,无位阶之分。单单的用户授权华为其实并不合规,因为用户数据的运营商是微信,没有微信就没有用户数据,根据《网络安全法》微信作为海量数据的网络运营者(甚至是关键信息基础设施运营者)有义务管控信息,此其一;其二,在数据共享模式下,司法实践遵循三重授权原则,即用户授权微信获取-平台授权第三方获取-用户再授权第三方获取。所以,华为在本案中似乎并没有多少胜算的底气。


数据的“产权”制度,一定程度上是影响数据抓取行为的定性的。hiQ vs.LinkedIn案件中,hiQ认为用户已经选择全部公开数据,那其就可以加以利用,而至于说hiQ收集信息后再转使用,甚至下一方再转使用的问题,似乎就没有再提出了,这无疑是一个迷局。而LinkedIn所称的为了保护用户隐私其实也是纯扯淡,毕竟他们还给很多搜索引擎开了数据后门以允许这些公司抓取用户信息的。


不管hiQ vs.LinkedIn案件最终的结果如何,该案对数据合规使用的思路,提出了非常有意思的思路,值得大家探讨。网络法实务圈刚刚开通了原创保护和留言功能,大家来拍砖、来吐槽呗!


垦丁:我们只专注网络法。


电话咨询
项目案例
服务范围
QQ客服