数据之美
2021-01-06李金昌
□ 李金昌
数据在很多人眼里可能并不算啥,但对于我们统计人而言,她就犹如自己生养的孩子,怎么看怎么亲、怎么瞧怎么美!那么,数据究竟美在哪?
首先,数据之美,美在她有“数”。虽然如今广义的数据是指一切被记录的事实,但她的第一特征依然是数字。哪怕是非结构化数据,最终处理分析的结果还是要尽量将其表示为数字。基于十个阿拉伯数字和十进位制数学体系所产生的每一串数字,都如同跳跃的音符,既千变万化又万变不离其宗,奥妙无穷。所以,人类社会除了有文字,还有数字,并且它无需翻译全球通用。尽管我们所处的这个世界极其复杂,但几乎所有的事物和现象,都可以用数字来标示。这种标示的结果,即数字与现实的结合,就成为了数据。无论是单个数据还是一组数据或是整张表、整幅图的数据,都蕴含着事物基于数字的规律和生命,都显示着数字附于事物的活力与灵性。
其次,数据之美,美在她有“据”。数据,乃有根据之数。凡为数据者必须真实,这是由其自身的本质属性决定的。也因有了这样的数,才使我们遇到问题时有据可查、有踪可追、有源可溯。尽管数据首先表现为数字,但数字并不是天然就成为数据,因为数据来自现实,而数字可以抽象。一字之差,天壤之别。而虚构的数字根本就不是数据,它只是没有内容的符号而已。为了客观反映事物的数量特征,从统计调查到统计整理再到统计分析,每一个数据都获之不易,来不得半点虚假。正因为她是真实的,所以数据之美,其实就是她所要反映的事物之美。事物之美,天造地设,容不得玷污与扭曲,我们的任务就是用数据把它表现出来以供人们欣赏与认识。大千世界,没有什么比“真实”更美的东西了!如果说数字之美在于数理,那么数据之美就在于真实。因此,怎样把事物之美尽量客观地用数据表现出来,就成为了我们统计人终身为之奋斗的目标。
三,数据之美,美在她有“道”。人类需要数据,因为数据是一种特殊的语言,尽管她自身不会说话,但却以统计指标、统计表和统计图的方式记载着历史、刻画着当今、预示着未来。每一个数据都有来处,每一个数据都有称谓,每一个数据都有意义。如实反映事物的本质特征,是数据的天然使命,也是她的生存之道。老子曰:道可道,非常道。统计学就是要用有内涵有意义有称谓的数据去说清楚、道明白我们所关注事物的内在本质及其变化规律,以达到通常所说的定量与定性相统一。当然,要做到这一点极其困难,因为事物的发展变化充满着不确定性,而且人类对自然和社会的认识还十分有限,所以,尽管我们力求数据准确,但她所表明的道依然不一定就是事物的恒常之道。然而,不断精准、不断积累的数据,会不断逼近事物的真相。因此,统计学的任务就是不断发展和完善数据收集、整理和分析的方法,以让数据更加接近事物的真相。人类社会发现到今天,有成功的经验,有失败的教训,但都逃不过数据的眼睛。不管我们知道不知道,任何事物任何时刻任何方面的唯一数据就在那里,不以人的意志为转移。所以,拥有数据,就意味着拥有了认识事物的密码,也就意味着拥有了最宝贵的要素资源。
数据在哪里,道理就在哪里。“请把数据摆到桌面上来”,是著名统计学家皮尔逊在与他人就“父母酗酒是否会影响子女健康”这一问题争辩时反复强调的一句话。大数据时代,我们可以选用的数据大为增加,但类型也更为复杂,不确定性也有新的变化。我们要主动求变、积极应对,珍惜和利用一切可用的数据,让她发挥更大的作用、展现更美的风姿!
数据之美乃大美也。大美无言,君子好逑。