引言
十九世纪英国的著名思想家John Henry Newman曾言“Calculation never made a hero”,calculation本义是计算,这里的意思应该是从慎重考虑、仔细思考这个角度出发,指考虑太多容易错失良机。所以这一句话一般译为“举棋不定永远成不了英雄”。可见,计算还是必要的,只不过不应该过度,正如孔夫子所说:过犹不及。
社会发展,之所以要数字化,其中一个重要的原因是为了可以计算,而计算,在数理科学背景下,则意味着高效,这自然少不了数学的加持—用得好了,至少可以事半功倍;用得不好,尤其是贸然乱用,则会招致不同程度的麻烦,甚至灾难。
如何计算数据
臭名昭著的例子有很多,比如1999年9月23日,美国发射的火星气候轨道侦测器(Mars Climate Orbiter)1号解体,原因是错误的飞行轨迹使它过于接近这颗红色星球,导致承受的大气压力过大。 事后发现,这个错误的根本原因非常可笑:由洛克希德·马丁公司( Lockheed Martin)提供的一个计算推进器发射的软件所用的物理单位是非国际单位—磅力秒(pound-force second),而与其对接的由美国宇航局提供的另一个读取这个结果的软件,其所用的单位是牛顿秒(newton seconds)。一磅力等于4.45牛顿,可见计算误差很大。
这类案例提醒我们,犯错无处不在,而且很容易出现计算错误。很多人承认,这确是人们经常跌落的陷阱。
每当对数据进行数学处理时,都会进行计算。一些常规的例子包括: 1.对数量进行不同层次的汇总,如对时间分组——每周、每月或每年的数量 2.将数据中的数量与其他数量分开以产生不同单位或相同单位的比较 3.使用比例或百分比 4.从一种度量单位到另一种度量单位的转换
如果你觉得这些计算很简单,肯定不会犯错误的话,那么你太高估自己了。 我在很多情况下都踩过这个坑,也看到其他很多人,包括一些老手,一次又一次掉进去,也挺可悲的。 相信很多数据从业者也都有类似的体会。本系列文章将把更高级的计算留到后面的章节,这里先从最基本的开始。
本文转载于知乎海数据实验室。