临近年底科技新闻已经少了许多,全中国都在陆续放假,事情少了,所以能看到的话题几乎都是围绕春节红包的。
今天还是迎来了羊年最后一次撕逼:今日头条和艾瑞(详见钛媒体报道《因数据纠纷,今日头条和艾瑞两家的 Boss 撕起来了》)。
在数据这件事情上,中国的数据机构与企业之间,或者企业与企业之间一直都处于这样的状态:一份报告出炉,某项指标第一、第二、第三之类的排序明确之后,企业要么会质疑数据机构统计数据的方法、结果或者动机,要么质疑竞争对手与数据机构『合作』进而导致数据不公平。
最令人印象深刻的案例是UC浏览器和QQ浏览器之间的『数据之争』,俞永福某次看到数据之后同样表示震怒,拍桌子指责某数据机构和腾讯,并找一堆媒体去澄清自己才是移动浏览器老大…这两家关于谁是移动浏览器『老大』的争夺,持续了两三年,现在倒还好,大家都不屑于去争了。
类似的争议还发生在搜索、电商、地图、视频、音乐、输入法、应用分发、外卖、电影票、机票诸多业务之中…如果一个领域没有数据之争,只有两种可能:一是这个行业太小了,数据机构报告都不屑于出;二是这个行业差距太大了,你看过谁去跟微信或手Q争社交老大吗?
不过,行业差距大并不意味着不会有数据之争,君不见搜索引擎领域,百度、搜狗和360的市场份额总是有『几本账』吗?
为什么互联网企业这么在乎数据呢?运动员需要裁判。
数据证明自己的实力,这会影响到公司融资、股价,会影响到广告主投放决策…就是说,数据事关利益。但一个公司,哪怕是大公司,自己站出来说有多少数据,总会有人来质疑你:每一次阿里巴巴双十一结束后的数据总会有人说里面有多少是刷的,小米每一次公布手机销量之后都会有人说里面有多少水分……这就需要『第三方中立、权威、专业』机构来证言了,所以就诞生了『第三方数据咨询机构』这个商业模式。
为什么数据机构与企业之间的纠纷一直不停歇呢?原因主要在这里:
第一,数据机构的结果如何得来的本身不够透明。
说某家公司市场份额这么多,使用时长这么多,是如何得出结论的?如果是抽样调查,样本选择是否科学;如果是自动化工具,覆盖用户是否足够大,原始数据和数据统计过程是否有漏洞…这些都是企业可能会质疑的点,所以数据源来自哪里,如何统计的,方法论,都要足够透明,经得起第四方、第五方的检验才有说服力。
第二,机构要数据与企业商业机密之间的矛盾。
第三方机构如果想要基于原始数据而不是抽样调研去做报告,就必须想办法拿到数据。但是,这些数据在企业或者少数平台手里,例如Android系统、友盟开发者平台,这些平台也在基于数据做报告或者不做报告,不大可能分享给第三方机构。现在数据机构为了做报告也开发了接口,但企业不一定愿意接入。
在移动互联网时代,数据统计更难了,大家都知道的『信息孤岛效应』,App是一个封闭的体系,它自己最清楚数据情况。如果涉及到交易额之类的机密数据就更难公开了。现在数据机构希望与企业合作去拿到数据,但企业因为自身考量又不一定开放数据出来,这就是矛盾。
一个形象的比喻就是,一个男人被『某机构』发布报告说你性能力不如另一个男人,但这个男人又不大可能或者不愿意证明给大家看,所以最后就只能嘴巴扯皮了……
第三,假如数据开放出来,又有一个『刷数据』问题。
在微信公众账号没有开放『阅读数』的时候,是没有『刷阅读数』这门生意的,现在有了。同样,App Store上有庞大的刷榜生意。如果榜单和数据会影响利益,就会有人去给数据注水。所以就算某数据机构拿到了各个应用的全量数据,这些数据究竟有没有水分,企业究竟有没有给自己的数据注水,又是一个大家要扯皮的事情,而这一点,企业是永远无法自证清白的。
第四、不同机构数据指标口径严重不统一的问题。
在过去一年发生了许多大公司合并案例,并且经常出现合并之后,两家公司市场份额加起来大于100%甚至200%的情况…这是因为之前两家公司可能找了不同的数据机构做报告,并且,这些报告采取了不同口径:有的统计的是渗透率,有的是用户市场份额,有的是活跃用户份额…总之,五花八门的指标让人眼花缭乱。精细化的统计并不是没有必要,但很多时候数据机构是为了给企业做一份能够拿到『第一』的报告而努力设计指标,结果就是,A企业用数学去跟B企业比语文,大家根本就不是在对比同一个指标。『第一』『第二』『第三』已经让企业着魔了……但这也是没有办法的事情,因为市场需要。
有企业不Care数据吗?当然是有的,比如苹果,你去做一份报告说它在智能手机排名最后一位,人家也不Care;再比如微信,它说日活跃是多少,也没多少人会质疑。这些企业没有『数据』的烦恼,处在一个很安逸的状态。但大部分企业都是要努力奋斗,去追逐数据和名次,所以当张一鸣说『以后都不会给数据机构给钱』时,有人说张一鸣何必呢,毕竟今日头条还没到微信这个level——但今日头条自认为到了,张一鸣说『我们自己就是数据公司,我们更清楚行业数据』。
数据机构和企业之间的问题很多是无法解决的,例如『数据注水』问题,再就是企业为何要把数据给到机构审计?当然,像指标口径统一、统计方法论更透明这类问题,是可以解决的,只是利益攸关,也没那么容易。
我想这个问题最切合实际的,还是要靠数据机构自律,如果只有一家数据机构,行业的选择太少,但如果有许多数据机构,如果你数据总是不靠谱,品牌没了、数据也没人信了,大家会选择去相信有品牌的数据机构。就好像电影评奖,为什么大家信任奥斯卡?因为它有自己的品牌,人们相信它。
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这些都不是准确的数据,又何必那么较真呢!
都想数据有利于自己,至少不会损害自己的利益