12

2018.11

数据造假,不只捅了马蜂窝

作者:谢譞

10月21日,一篇名为《估值175亿的马蜂窝竟是一座僵尸和水军构成的鬼城?》的文章指出,经过乎睿数据分析,马蜂窝的点评、游记和问答内容大量抓取了携程、美团等竞争网站的数据,同时存在点评账号身份矛盾、时间错位等现象,涉嫌数据抄袭和造假,一时间引起舆论热议。10月22日,马蜂窝对该文章做出回应,并起诉乎睿数据公司、丁子睿名誉侵权。

这篇文章捅的不只是马蜂窝,更曝光了整个互联网行业的灰色地带。在此之前,新浪微博起诉脉脉、小红书投诉大众点评、360搬运B站视频等事件屡屡发生,水军和爬虫早已不是新闻,甚至在专业人士看来,马蜂窝涉嫌的数据抄袭和造假手段,只是互联网企业创业初期为了积累用户口碑数据和商业价值习以为常的潜规则。

不仅是旅游行业,水军势力早已渗透粉丝关注量、视频播放量、文章阅读量、网店销量等方方面面。在大数据时代,数据决定流量,流量影响资本,流量为王的价值导向催生了互联网行业的数据造假产业链,而平台方在平台环境和融资、品牌影响力之间的抉择,往往只是利益的取舍。从爬虫公司、网络公关团队、营销公司、黑产、底层发帖者到纵容数据造假的平台方,利益链条上的每个环节都应该为破坏互联网行业的健康生态负责。


数据造假的根源,在于互联网行业缺乏完善的业绩评价标准,一味追求用户活跃度、交易额等数据量的固化思维。数据造假导致劣币驱逐良币,破坏了互联网行业的竞争规则,使投资方失去了评估商业价值的依据,难以作出明智的决策,更辜负了用户对平台质量和口碑信息的信赖,正向评价机制无法发挥其应有的价值。近日爱奇艺声明正式关闭显示前台播放量,以综合用户讨论量、互动量、多维度播放类指标的内容热度取而代之,可以说是突破“唯数据量论”,追求综合客观的评判标准的一次探索。想要从源头遏制数据造假的不正之风,需要建立更多角度,更科学的评估体系。

数据造假屡禁不止,也暴露了法律制度层面的缺失。大数据时代数据信息成为互联网企业核心资产,但对于数据信息的保护机制却没有形成明确的法律框架。《反不正当竞争法》中尽管增加了利用技术手段在互联网领域实施不正当竞争行为的规定,但只是概括性的条款,并未进行细化。数据抓取涉及用户个人信息保护、平台数据权利和信息技术进步等多方面利益的权衡,社交平台在使用他人获取的信息时是否违反商业道德、构成不正当竞争,亟待法律划清明确的界限。将于2019年实施的《电子商务法》明确规定“电子商务经营者不得以虚构交易、编造用户评价等方式进行虚假或者引人误解的商业宣传,欺骗、误导消费者”,或许可以为规范数据竞争提供制度保障。

乎睿数据质疑马蜂窝无论是否暗藏内幕,都是互联网行业假数据堆砌而成的虚假繁荣的轰然崩塌,被拉下马的马蜂窝不是第一个,也必定不是最后一个。这是一场关系我们未来是要活在水军、造假、抄袭中,还是回报诚信、保护真话之中的战役,在扑朔迷离的真相面前,我们不只是吃瓜群众,更应该做勇敢地揭穿皇帝的新装的人。


编辑:liushujun