回到正确面对“大数据”的轨道

发稿时间:2014-06-11 00:00:00   来源:《中国社会科学报》   作者:于丹

  与“大数据”相关联的科学问题是什么?在科学问题是什么都不明确的情况下,大笔科研经费投向“大数据”研究,大批“大数据”中心和基地在火热建设,这些现象的存在更像是在搞冒进,而不是进行科学研究。因此,“大数据”的负面作用要远大于其正面作用。

  目前业界和学界对“大数据”这一概念的定义是:数据量的规模大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。这里的“数据”是一个广义的概念,包括数据、图像、视频、文字等讯息。

  如果按上述定义来理解“大数据”,那么有些学者提出的“大数据‘是一个过度包装的概念’、‘是个伪命题’”的说法就很容易理解了。我们现在经常遇到并且很容易处理的几百兆的数据,在20世纪90年代就称得上“大数据”了,因为那时的PC机配有40兆的硬盘便属于高配置,当时几百兆的数据连存贮都做不到,更谈不上处理。因此,所谓的“大数据”只是一个相对概念,随着计算机硬件技术、计算机科学和统计科学的发展,今天的“大数据”也许10年或20年后就是大学生普通作业题中所用到的一般数据了。

  尽管如此,“大数据”的正面作用是不可否认的。由于数据规模爆炸式增长,以及大数据的特点——Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(真实性),对计算机工程、计算机科学和统计科学提出了新的挑战。正是这些挑战,促使计算机工程、计算机科学和统计科学等领域的数据处理的理论、方法和技术得到快速发展。

  在看到“大数据”正面作用的同时,我们更应该看到其负面作用。无论是计算机科学还是统计学领域的学者,如果今天还没有做有关“大数据”的课题,会被认为落伍了。今天以“大数据”为主题的跟风、炒作比比皆是,例如以“大数据”为主题的学术会议数不胜数,“大数据”中心或基地风起云涌,网络上与“大数据”相关的条目数以亿计。似乎“大数据”是21世纪第一个被发现的“金矿”,吸引了大批淘金者。而很多有关“大数据”的说法,如“人类已进入大数据时代”,“大数据”之于经济社会发展的作用以“革命性意义”,甚至把“大数据”的作用与第一、二次工业革命相提并论,“大数据”明显地被用来进行商业炒作。这样看来,“大数据”不仅不是什么金矿,更像是一个吸金的黑洞。我们永远不要忘记美国通过“冷战”拖垮苏联的教训,尽管“大数据”问题没有严重到“冷战”的程度,但其前兆已经显现。

  与“大数据”相关联的科学问题是什么?在科学问题是什么都不明确的情况下,大笔科研经费投向“大数据”研究,大批“大数据”中心和基地在火热建设,这些现象的存在更像是在搞冒进,而不是进行科学研究。因此,“大数据”的负面作用要远大于其正面作用。今天的“大数据”更像是我国20世纪80年代刚刚建立的股票市场,一开市会吸引一批投资者,同时也吸引更多投机者。

  大浪淘沙,理性必然最终回归。无论业界还是学界,在政府相关机构的正确引导下,随着时间的推移,必将回到正确面对“大数据”的轨道上来。■