数据陷阱:油腻的统计学1

千夫所指:因“搞数”而生

Posted by 刘政永Dmer on July 28, 2020

时下已经是所谓的数字化和大数据时代很多年了,统计学的地位愈发显赫,用途愈发深广,而对之的批评或负面情绪也日益高涨。

对于如此现象,用一句电视剧里常说的话—此事牵涉甚广,那么本文就来理上一理。

美国著名作家马克吐温曾言:Facts are stubborn things, but statistics are pliable.

说白了,就是如果事实摆在面前,那也没什么可说的,但如果是统计数字呢,可发挥的,真就多了去了。

因“搞数”而生

在现象界,由于万物不同,也似乎世事无常,针对各种具体的目的,是需要比较和对照的,统计学也就是在这样的背景下出现的, 意在为人们的生活提供确定性指导。

尽管统计学为人类社会的发展发挥了巨大的正面效用,但人们一提起统计学或统计数字,往往蕴含复杂的意味。

比如,经常会在网络上看到大家谈论统计数字时,有如下内容的议论:

统计学是不好的

统计数字是谎言

统计学是无用的

统计数字不是事实

统计量是编造的

统计学是为失败者准备借口的

很有意思吧。这到底发生了什么?为什么许多人对一个学科领域竟然如此厌恶。

看下韦氏词典对统计学的定义,其仅仅是“处理大量数字数据的收集、分析、解释和呈现的数学分支”。

如此看来,这明明就是一个工具学科啊,可这么多人对该领域持如此消极的态度,原因究竟何在呢?

本文转载于知乎海数据实验室。