如何识别你看到的数据是否可信？

腾讯数据总监：运营人员必须掌握的APP基础数据分析体系 2016-05-28 点击：次

文/常宁

国内科技圈里从来不缺热点,今天张三李四掐架,明天就是王五马六开撕.而这些也总是给媒体或者自媒体提供源源不断的写作话题.节前,最热的当属今日头条和艾瑞针对数据真实性问题进行的各种舆论较量.

对于事实真相到底是什么,除了双方公司当事人,恐怕没有任何第三方了解真正内幕.所以,媒体甚至自媒体对此事的解读多少都有些臆断,谁对谁错也并非哪方声音高哪方就取胜.所以,我们如果针对此事本身一直聒噪不停的话,那是最没有意义的.

这篇文章并不会针对这件事本身而妄加解读,而希望聊聊跟数据调查有关的那些事儿.

一、“做数据”这份职业,其实是个良心活

先讲个故事.

某个研究机构接到了某家户外广告公司的委托,希望调查一下某城市的户外广告效果情况,主要包括人群接触、注目率等情况.这家公司之所以做这个调查,是因为他们希望通过“比较好的”数据说服更多的广告主投放他家的户外广告,所以他们希望先摸摸底,看看自家户外广告的效果到底如何.

调查到的结果不能说不尽人意,但情况也并未像这家公司预估的那么好.于是,这家公司提出了某些要求,希望把这些能说服客户的“关键数据”做的漂亮一些.但是,被委托的某家研究机构的负责人断然拒绝了,理由是:可以在报告中不展示对该公司不好的数据,但不能故意篡改数据,这是基本的职业道德底线.

我对这位负责人更加尊敬,Ta的话我铭记在心,并且在我日后的任何调查研究项目中,我也要求自己以这样的“无形道德”严格对待和分析数据,否则良心会着实不安.

有人说,真有这个道德存在吗？或许你不信,但真正热爱并敬重数据调查这份职业的人,即便没有人监督,内心时刻都有这样一根线牵引自己.

可能,并无这份道德感存在于心的人,才会怀疑“道德”的存在,才会嘲笑“科学、客观、严谨的态度”是说给别人听的.

当然,国际上或国内的某些数据调查公司可能会因为客户的要求或压力,或者因为金钱利益关系,而存在“定制化数据”的行为（为了某个目的而专门做出的某些调查数据,真实性值得怀疑）.

这样的例子不是没有,国外曾经因为婴儿的一次性纸尿裤冲击了尿布市场而历经了多年的数据大战,首先是管理尿布市场的协会发布纸尿裤的各种危害数据,影响纸尿裤的销量,之后,纸尿裤公司又委托第三方数据公司发布调查数据,表明环保和安全性.这样的大战经历了数年.可以说,此时数据已无客观和真实性可言,而是承载着太强的目的性.数据成了达到目的的工具,而非数据原本的样子.

所以,不能怪罪数据,而应斥责那些利用非事实数据或编造扭曲数据而达到某些目的的人,他们丢失了“做数据”应该操守的最基本最重要的道德!

也许会有人嗤之一笑,哪里高谈什么道德？

还是那句话,真正热爱并敬重数据调查和数据分析这份职业的人,内心有着强烈的道德感,并且对数据既敬畏又谨慎不盲从.

在给学生讲数据调查和数据分析这门课的时候,我会十分严肃的强调,数据调查应遵守方法上的“科学性”,数据分析上的“客观性”,既要尊重和接受数据本身所呈现的结果,又不能完全盲目的依赖数据.这是我的恩师秉承并教给我们的“良心”,我也希望这样告诫学生.