数据陷阱:油腻的统计学2

千夫所指:四大罪证

Posted by 刘政永Dmer on July 29, 2020

四大罪证

统计怎么就那么难学

01第一个原因,太难了。

对于不少工作,学习和或生活经常接触统计学的人而言,经常会抱怨:即使是描述统计学和推断统计学(descriptive and inferential statistics)中最基本的概念,也很难正确的理解,总觉得什么地方不对,更别提给人解释了。

许多糊里糊涂的大学新生都承认,在准备每次统计学课程的考试时,着实艰辛。

更麻烦的是,即使许多行业科学家居然也说不清楚p值到底是什么。而小白碰到统计学时,基本如读天书无二。

02专家也常犯错

第二个对统计学和相关工作意见大的原因竟然是:即使是所谓的专家,在严谨的工作态度下,也会误用统计工具和相关的技术,而且还不在少数,包括笔者自己在内。

统计学领域陷阱数不胜数,难以避免。

当我们看到专家也会时常做出不正确的决定时,真有想把眼前的桌子掀翻的心情,尤其在最需要专家指点迷津的时候。

而这多少会令人陷入不可知论的情绪困境中。

03统计数字与骗子

统计仇恨背后的第三个原因是,经常有人拿着一堆数字,来为他们自己的目的服务,而逻辑或是事实上的支持关系,却所言无多,这种行为其实已经构成撒谎。

前面已经提到,即使是在马克·吐温时代的人也意识到了这一点。

当今有一些相当受欢迎的指导书籍,写作主题就是关于如何用统计数字来行诡诈的事情。

不得不说,这种行为够缺德的。

04冷血杀手

最后,第四个原因是,统计数据通常被认为是冷漠和无情的,说的好听是中立和超然,因为很多统计数子都是生活中的,与人息息相关,而这些数字经常表现得好像跟人没什么关系。

而人一旦被统计数字标签化,比如年龄,分数,甚至是颜值,等等,就好像被诅咒了一样,心里说不出的那种不舒服。

没有人希望“成为一个统计数字”,因为这会等同于成为一个不幸情况的受害者,被一个单独的、没有名字的、没有面孔的数字被永远隐藏在匿名之中。想到此处,是挺冷的。

本文转载于知乎海数据实验室。