人类与数据认知的浪漫简史
2020-10-10 by uino 11.9K 技术分享

人类总不会寂寞,因为生命是进步的,是天生的。

——鲁迅

傲寒荐书(微信号:aohandushu)《 任正非与乔布斯,科技与人性》的文章中,提到任正非在2018年9月29日某公司公共关系战略纲要汇报会上的论述 ** “需求是人性的持续激活与成长”**。任总当然立意深远,笔者尝试从数据认知的视角,还原一部在不同时代人类对数据认知需求持续演进的浪漫简史,并希望可以引发对下一代数据认知方式的探索。

01、数据认知重要吗?

随着5G在今年6月6日中国的正式发放商用牌照,相信接下来会极大促进智慧城市、无人驾驶、工业孪生等等物联网场景,伴随而来的就是更加海量的数据,就连公司楼下食堂的张阿姨,都在打饭之余跟我们聊大数据对哪种菜哪天该炒多少有帮助。然而当数据量和场景复杂到一定程度,无论是机器学习还是边缘计算等技术,都是让机器可以读懂这些海量数据,我们面临的囧境是机器懂了这些数据可是人还看不懂。如果对以上描述感触还不是很深的话,让我们一起花30秒的时间来看一下19世纪著名的爱因斯坦谜题:

**题面:**有5种不同颜色的5栋房子。在每栋房子里分别住着5个国籍的人。这5个房主喝着不同的饮品。抽着5种不同牌子的烟。每人都养着不同的宠物。

**问题:**谁养鱼?

提示:

1.英国人住在红色的房子里。

2.瑞典人养狗。

3.丹麦人喝茶。

4.绿色房子在白色房子的左边。

5.绿色房子的主人喝咖啡。

6.抽Pall Mall烟的人养鸟。

7.黄色房子的主人抽Dunhill烟。

8.住在中间房子里的人喝牛奶。

9.挪威人住在第一栋房子里。

10.抽Blend烟的住在养猫人的隔壁。

11.养马的人住在抽Dunhill烟的人隔壁。

12.抽Blue master烟的人喝啤酒。

13.德国人抽Prince烟。

14.挪威人住在蓝色房子隔壁。

15.抽Blend烟的邻居喝水。

没错,可能你读到这里就已经有了解题思路,只要再花一点时间就解开这个著名的谜题。如此多的数据涌入我们脑海中,在如今这个快节奏的时代,如果没办法在30秒内做出正确的决策,可能就意味着巨大的损失,更不用说或许30秒才把信息读完,也就是人类数据认知需求与现有数据认知方式成为了一个主要矛盾。读史可以明智,也可以让我们从历史长河的规律中寻找一些解决矛盾的思路。

02、石器时代——结绳

时光退回到公元前5000年左右的新石器时代,人类文明之初就对数据认知产生了需求,此时结绳计数的方法已经被人类所运用。结绳计数是远古时代人类摆脱时空限制记录数据、进行信息传播的手段之一,它发生在文字出现之前的漫长年代里。即用不同粗细的绳子,在上面结成不同距离的结,结又有大有小,每种结法、距离长短以及绳子粗细表示不同的意思。“结绳时代”表现简单,但在远古的场景需求中也够用了。这个阶段开启了人类用数据(小石头、小绳结)去记录和衡量的历史,开始认识“数据”的意义,这种进步直接促进了劳动力交换的产生,可以说“数据”开启了疯狂原始人的飞速“进化”。这个时代的数据一目了然,数据的价值以最本质、最直接的方式呈现。

03、青铜时代——符号

时光继而来到公元前3000年左右,人类已经崭露头角,开始替上帝接管这颗蓝色星球,人口数量迅速增长,明确且富有含义的信息交流需求,催生了文字、数字等信息载体的出现,标志着人们进入了“符号时代”。在这个阶段人类终于有了完整的“数据”表达规则,再也不用为打了一箩筐野果找不到那么长的绳子打结计数而烦恼了,这种数据认知方式的进步是革命性的,就像由1G的模拟信号到2G的数字信号一样,而“符号标记”的产生标志着人类即将进入文明时代。

这个时间区域和青铜时代有高度重合,数字代表着权威,传递着来自九五至尊的皇权和上天的旨意。周易八卦天干地支等代表着数据所能呈现的最为高深和复杂的信息。(PS: 关于数字,我们熟知的是古印度发明,经阿拉伯人推广到世界,其实另一种说法是数字起源于我国,史书中讲中天皇君兄弟十三人,号曰天灵,其中一人发明了数字,继而又发明了天干、地支。发明数字:零、一、二、三、四、五、六、七、八、九、十、廿、卅、卌、百、千、万。)

04、白银时代——图表

时光调回1855年,在争夺巴尔干半岛控制权的克里米亚战争中,英国军队同时与俄军、疾病两线作战。作为一位护士,你如何说服将军们投钱在医院和医疗设施上,而不是枪炮弹药?

伟大的Florence Nightinggale(南丁格尔)用一副图完成了以上壮举,这幅图就是闻名于世的南丁格尔玫瑰图,它于1858年递交到维多利亚女王手中,即使在快两百年后的今天,玫瑰图依然被广泛使用。而这幅图带来的变革并不是由于它如玫瑰花般漂亮的外形,而是它用简单而直观的形式传递出被人的直觉所忽略的重要信息;为了解释这个原因,降低英国士兵死亡率,玫瑰图展示了那些可预防疾病(蓝色表示死于可预防的疾病、红色表示死于战争伤害、灰色表示死于其它原因)导致的惊人死亡数字,它扭转了“直接战争伤亡是战士死亡率最主要因素”这种原有的错误认知。人类自此正式进入了借助图表挖掘数据信息的时代。

此后,纽约街角咖啡馆里的报纸上已经出现了柱状图示的民调结果,越来越多的人开始通过螺旋图来认识斐波那契数列,甚至法国工人工会以及公益人士的宣传海报都开始使用图表共存的形式去提高感染力……图表揭示数据和原理的方式开始伴着第二次工地革命的前奏曲风靡盛行。

05、黄金时代——主题

第二次和第三工业革命在短短一百年间已经让人类成为了这颗蓝色星球的绝对霸主。用来承载信息和知识的数据呈指数级暴增,新千年后人类正式迈入“大数据”时代,用大海形容数据早已经毫不为过了。原有的人类处理数据、理解数据的方式也已失去了意义。强如人类也开始在数据的浩海面前望洋兴叹。即便牛顿在世估计面对几百张表,几千万行数据也只能束手无策……但是任正非说“需求是人性的持续激活与成长”,只要人类有数据利用的需求,就永远不会束手就擒、坐以待毙。数据挖掘、数据可视正是人类面对大数据时代给出的回答。

“随着大数据成为我们生活的一部分,我们应该开始从一个比以前更大更全面的角度来理解事物。” 《大数据时代》作者维克托•迈尔用这句话来形容数据可视化方面可以实现的方向。没错,单一维度的数据在我们大数据时代已经显得相形见绌了,当多层数据再次聚合后,将会呈现出更高一个层面的信息,人们的需求进入了“主题时代”。

06、未来时代——未知

人类生产、生活及治理的数据基础和信息环境正在得到大幅加强及显著改善,移动互联网和物联网持续普及部署,智能终端和传感器加速应用渗透,人、机、物逐步交互融合,与经济增长和社会发展相关的各项活动已启动全面数字化进程,呈现出从被动到主动、从碎片到连续、从单一分离到综合协同的三大转变,源源不断地产生着呈现爆炸式增长态势的海量数据,蕴含着巨大的价值和潜力。

当下,万物互联的场景让移动通讯技术进入了5G时代,人类可读懂的海量数据到第五代技术形式又是什么呢?也许这一次,人类真的需要开启上帝视角,创造一个崭新的世界。这一次,也许人类需要将数据与场景融合,也许需要将数据与空间、时间融合,也许需要将数据与艺术融合,也许需要将数据与控制融合,也许需要将数据与人类自己融合**;**也许,时间会给出答案,因为生命是进步的。