今天,我们已经生活在一个由网络信息技术参与构建的世界里。不论一个人喜欢还是厌恶,其工作和生活都越来越离不开网络信息技术所带来的一切,这已经是不争的现实。这个现实也清楚地表现在学术研究方面。那么,这个势不可挡的技术进步与史学研究有什么关系呢?
在今天所有的学术分支中,史学可以说是最古老的学科了。经过数千年的发展,史学到今天已成为一个高度专业化的学科。由于有长期形成的专业化的学术体系,过去史学工作者做研究很少使用新科技,像今天飞速发展的网络信息技术这样的高科技,更是少有人问津。
一个最古老的学科和一种最新的科技,二者似乎是风马牛不相及的。使用网络信息技术研究历史,一些学者觉得是中看不中用,也有一些学者觉得这是时代潮流,应当努力追赶。不管看法有多大分歧,对于所有史学工作者来说,怎样把握网络信息技术与史学研究之间的关系,都是一个绕不过去的问题。
使用网络信息技术研究历史是大势所趋
网络信息技术为史学研究带来了巨大便利。利用这种新技术所创造的新资源,研究者可以突破原有时间、空间的局限,在短时间内占有更多的研究资料;同时,这种新技术还为史学研究提供了新方法、新思路,可以使研究者开辟新的研究领域、进行更为科学的研究。
史学是一门科学,正如马克思和恩格斯所说:“我们仅仅知道一门唯一的科学,即历史科学。”史学研究必须以史实为基础。马克思说得很清楚:“研究必须充分地占有材料,分析它的各种发展形式,探寻这些形式的内在联系。只有这项工作完成以后,现实的运动才能适当地叙述出来”。因此,充分占有材料(即史料)是进行历史研究的基础。但是,如何充分占有史料却是一个问题。在史料有限的古代,做历史研究时“读万卷书”就能够充分占有史料了。但在今天,情况发生了巨大变化,一个人读书万卷已经远远不够了。
最近几十年,出现了史无前例的“史料大爆炸”,即可以利用的史料以不可想象的速度急剧增加。我国本是历史文献大国,现存各种文献资料数量巨大,仅仅只是收藏在图书馆和档案馆中的明清历史档案,就以数千万件计。这些明清史的第一手资料具有极为重要的史料价值,但是过去只有少数学者能够接触这些文献中非常小的部分。最近20年来,这些文献的数字化迅速展开。以中国第一历史档案馆为例,馆藏清代档案文献达1000余万件,2005年底该馆正式启动《清代档案文献数据库》重点档案文献数字化项目,使得这些以前“养在深闺人未识”的文献能够展现在所有学者面前。除了国家资助的项目,许多私营机构也在大力开展历史文献的数字化工作,其所收文献数量都很惊人。
大量散落在民间的历史文献,也包含许多重要史料。在过去20多年中,一些机构开始收集这些文献。例如,山西大学中国社会史研究中心在过去20多年中,收集了大量20世纪中期集体化时期山西农村的第一手资料,总数达1500万件以上。贵州清水江中下游地区近年来也发现了近400多年来的大量民间契约和交易记录,有专家推测其总数可能多达30余万件。像这样的第一手史料,对于历史研究来说极为重要。现在这些史料也正在数字化,一旦完成,我们将看到一大批从未见过的全新史料。
“史料大爆炸”带来的结果是,无人能够自夸读遍天下书。即使一个学者过目成诵,要读遍现在已经建成的任何一个大型数据库中的书,也是很难做到的。法国年鉴学派代表人物勒高夫说:“历史学今天正经历着一场‘资料革命’,这一革命与新史学有着千丝万缕的关系”。史料的革命必将引起研究方法的革命。这在网络信息技术突飞猛进和研究方法推陈出新、层出不穷的今天,显得尤为突出。
史学研究如何使用网络信息技术
在过去20多年中,历史文献的数字化工作取得了重大进展,已经建成一些历史文献数据库,而更高级、更专业的数据库建设也在积极推进之中。这些网络信息技术所带来的成果,为我们的史学研究带来了很大便利。不过,许多史学工作者虽然认同这一点,但是觉得无从下手,因此不敢尝试。事实上,网络信息技术在史学研究中的运用有多种方法,研究者可以根据自己研究课题的需要采用不同的方法,以充分利用网络信息技术提供的丰富资源。
网络信息技术运用于历史文献数据库建设,最初的工作是将文献扫描后上网,供读者使用。在此基础上,又增加了检索功能,使这些文献能够方便地检索。用这两种方法建立的数据库,实际上是传统图书馆的发展和扩大,在台湾被称为“数位典藏”。数位典藏虽然作用很大,但它是被动的。对使用者来说,数据库中存储的大量文献数据除了检索,难以被更充分地使用。为了克服这个弊端,后来又兴起了“数码人文”,即建立的数据库不仅能实现资料检索,而且还能为研究者提供一个观察历史事件发生的环境,呈现出资料之间的脉络关系,以弥补史料本身存在的不足。在使用这种“数码人文”数据库时,只要输入一个搜索词,检索成果将是一个有意义的文件集,为使用者提供各种方法以观察其中的脉络。总之,网络信息技术提供的这些成果,使研究者能够更好地利用数字资源进行人文研究。
史学工作者可以根据自己研究的课题,采用不同的方法来使用不同的数据库。例如,对于许多研究者来说,最简单的方法就是使用可检索的历史文献数据库,用检索的方法从海量的文献中搜寻自己所需要的史料,然后对多种史料进行筛选和比对,得到那些最可靠的史料,进而通过综合找出这些史料之间的内部联系。有学者谈道,自己为研究《红楼梦》与曹雪芹家世及其本人经历之间的关系,用了几年时间查阅了近百亿字的各种史料,从中挖掘出大批过去不为人知的史料,以此为基础进行研究,从而得出了若干新的结论。他之所以能够如此高效地查阅文献,就是得益于可检索的历史文献数据库。否则,依靠传统的方法,用100年工夫也未必能够遍览这些文献。
史学工作者还可以利用更高级、更专业的数据库进行自己的课题研究。经过学界多年努力,现在已经建成一些可供历史研究使用的专业数据库。这些专业数据库和仅仅只提供关键词检索的历史文献数据库不同,其中的信息已经过加工,可以直接使用。比如,北京大学中国古代史研究中心、哈佛大学费正清中心和台湾“中央研究院”历史语言研究所合作建设的“中国历代人物传记资料库”(China Biographical Database Project,简称CBDB),就是这样一个数据库。经过10年努力,到今天该数据库已经收入了37万古代历史人物的传记资料。它在数据结构上更加复杂和精细,将历史事件转化为结构化数据,数据架构由人物、亲属、非亲属社会关系、社会区分、入仕途径、宦历、地址、著述等部分构成。通过对这种结构化数据的提取、分析,研究者可以对历史人物进行群体研究,能够得到相关人物、事件的空间分布以及复杂的社会关系网络。
如果条件具备,史学工作者还可以依照自己研究课题的需要,进一步建立课题专用数据库,以此为依据进行相关研究。比如,有研究团队把l949—2002年北京大学和苏州大学全部近8万名学生学籍卡中的信息建成一个数据库,开展中国大学生来源研究,以此为基础写成了《无声的革命》一书。依据这些数据得出的结论,已经受到各界的重视。
以上这些都表明,史学工作者不仅应当使用网络信息技术,而且可以使用好网络信息技术。
技术应用要不断改进,史学工作者要与时俱进
2015年12月,中国史研究杂志社和上海大学历史系联合主办了“传承与开启:大数据时代下的历史研究”国际学术研讨会。海内外110余位专家学者围绕“数据库的建设与使用”“大数据与史学研究”“大数据在历史研究中的技术问题”“大数据时代下的人文关怀”等议题展开了深入研讨。这表明国内史学工作者对于使用网络信息技术研究历史在认识和运作上都有了长足进步。不过我们也要看到,尽管这方面工作已经取得重要进展,但要更加普遍地使用网络信息技术开展史学研究,还有很长的路要走。这有两方面的原因:
第一,由于史学的特殊性,建设专业、完备和易于使用的历史文献数据库,目前还处于起步阶段。已建成的历史文献数据库数量有限,而且其中只有一部分可以检索全文。能够直接使用的专业数据库,数量更是寥寥可数,而且还存在一些问题。
第二,使用已经建成的各种数据库来研究历史,现在还处于尝试阶段。一些学者过分迷信现有数据库提供的信息,认为有了数据库,史学研究中的问题就很容易解决。这种看法显然过于乐观。统计学家达莱尔·哈夫和新闻学教授查尔斯·塞费在他们各自撰著的《统计数字会撒谎》和《数字是靠不住的》这两本有名的书中,就明确反对过分依赖数据。
网络信息技术正在改变史学研究的现状和未来。然而,如同电脑不可能取代人脑,网络信息技术也不可能取代史学工作者的主观思考、取代史学研究的基本理论与方法。更好使用网络信息技术研究历史,要求史学工作者积极投身于这一工作,充分发挥主导作用,改进相关技术的应用。这样,不仅自己不会落后于时代,而且相关技术手段也会不断完善,从而更好地服务于史学研究。40年前,巴勒克拉夫就指出:史学发展的最大敌人在于史学家自己,因为“当前在历史学家当中的一个基本趋势是保守主义”“历史学家不会心甘情愿地放弃他们的积习并且对他们工作的基本原理进行重新思考”。因此,关键是史学工作者要与时俱进,张开双臂拥抱新技术,把最古老的学科和最新的科技完美地结合起来,把史学研究带入一个新时代。■
(作者为北京大学历史学系教授)