【光明青年论坛】
编者按
计算机和互联网技术的发展,极大改变了人文学科的研究范式、教学手段与成果呈现方式。数字人文就是数字技术和人文学科互动下诞生的新兴学术领域,在文献数字化基础上,以文本挖掘、量化统计、地理信息系统、社会网络分析、可视化等为代表的数字人文方法给历史学带来了很大变化,也逐渐成为我国史学界的关注热点。尽管认识尚有差异,但数字时代已然来临,人文学科面临着如何数字化的问题。本刊组织几位作为数字人文引入历史学科的见证者、参与者和推动者的青年学者,围绕数字人文与历史学发展这一主题进行研讨,从理念到方法再到实践,回顾数字人文引入历史学的历程和得失,展望未来的新可能,以期对深化相关研究与探讨有所助益。
与谈人
彭凯翔 河南大学经济学院教授
潘威 云南大学历史地理研究所副研究员
赵思渊 上海交通大学历史系副教授
主持人
申斌 广东省社会科学院历史与孙中山研究所助理研究员
1
技术与思维:数字人文与史学的不期而遇
主持人:数字人文从本质上说究竟是一种技术工具,还是一种思维方式呢?如果是前者,那么我们应该坚持学科本位,用数字人文技术来解决自身问题。但如果数字人文是一种因应于数字化时代的思维方式,那么它将会给史学等传统人文学科带来哪些深刻影响呢?
潘威:在我看来,数字人文集中体现了计算机科学对人类思维方式的影响。目前,对数字人文较为主流的定义为:以计算机、互联网等信息化工具为主要手段,通过数字化、可视化、量化等处理方法,对人文社科问题进行研究的方向或者领域。
数字人文作为新兴交叉领域,不同学科、不同领域、抱有各自具体目的的学者进入这一领域后,产生不同的看法很正常。数字人文的本质应当是更偏向一种思维方式,因为技术体系不能脱离具体的研究问题而存在,至于它是否会颠覆性重构传统人文学科,我认为不能简单地回答“是”或“否”。作为学术研究而言,传承与变革往往同时存在于我们的工作之中。数字人文如果仅仅是用另一种表达方式重复已有的认识,那注定发展空间有限。但如果说一定会颠覆传统研究,也不可能。比如,在历史自然地理研究方面,“黄河八百年安流期”“唐代气候特征”“明清小冰期与中国历史走向”等,都是长期被关注的重大课题,需要信息化技术的支持,数字人文如果能推动这些传统问题的解决,其生命力才能更为持久。
彭凯翔:数字人文首先是一种技术工具,但它的确会影响看问题的方式——尤其是研究议题的选择。因为每一种工具都有自己处理起来最有效率的问题,可以把这些问题推到学术前沿,甚至成为“一代之学术”。就数字人文而言,它一方面是将人文学科的文本、图像等信息以数字化的方式储存及利用,通过“E考据”等方式提高传统人文学科研究的效率;但更具革命性的方面在于,它将信息聚合在一起,进行归类、编码、匹配等处理,使信息转化为可比或可关联的数据,最终让研究者能够从信息中发现或检验某些趋势、某些关系,为我们从更高维度、以更贯通的方式解释信息提供了契机。在传统的学科划分里,人文学科更偏重特定信息的诠释,而对通过趋势、因果关系等来进行理论探讨关注不够。数字人文有助于打破这一划分,促进社会科学、自然科学与人文学科的交叉,解决一些难点问题(如制度变迁、环境变迁等)中的数据“瓶颈”。如果说历史学原本就有一些和社会科学、自然科学交叉性较强的分支(如经济史、历史地理等),数字人文给这些分支的发展提供了新机遇,比如提供了更有趣的呈现方式。
赵思渊:我感觉对人文学科来说,数字人文首先改变了研究环境。从迄今为止数字人文的发展来看,特别是在历史学领域,多数个案研究的核心议题、提问仍然来自历史学的传统话题,甚至研究方法也未必超出原本以量化或结构化方法处理史料的方法论。换言之,历史学总是以史料学为基础的,这一点不论任何时代都不会发生变化。不过,数字人文的确改变了整理、分析史料的工作环境,也令一个历史学家所能处理的史料规模达到前所未有的程度。数字人文要面对不同人文学科传统和多种区域文化传统,这意味着数字人文本身可以有多重理解,有不同的研究脉络。
主持人:今天的历史学教学、研究、大众传播等都在不同程度上处于数字人文环境下,数字人文是怎样一步一步介入史学研究的具体过程呢?
潘威:我认为,数字人文最初被引入史学领域还是出于提高工作效率的目的,减轻学者在查阅、检索庞杂史料时的劳动强度,其实这也将是数字人文长期发挥作用的方向。在计算机普及之前,学者的工作很大程度上依赖图书馆,个人工作必须适应公共资料管理方式;计算机的普及为建立学者个人资料管理体系提供了可能;高性能个人计算机和互联网的成熟进一步降低了构建个性化资料管理体系的资金成本和人力成本。数字人文进入史学领域很重要的一个契机,就是顺应了史学研究中对个性化信息管理的需求。今后,史学研究更需要跨越学科领域、跨越学者单位,形成复合型的、模块化的研究团队,数字人文进一步深入史学就需适应这一趋势,在发展个性化资料管理体系的基础上,形成基于互联网的“资料交互网络”。
彭凯翔:数字人文最核心的理念是对信息进行系统归类、编码,而不限于数字化。如果这样来理解的话,中国传统文献中的类书、谱牒之属,可谓先声。但真正给这种工作提供动力,是来自近代社会科学、自然科学的需要。以20世纪前期的国内史学为例,传统史学工作者的谱录编纂固然活跃,但更能反映风气之变的当属有社会科学关怀的汤象龙、梁方仲等学者对经济史料的表格化整理,以及气象学家竺可桢将文字记录转化为历史气候数据等工作。20世纪中期以后,一些国家级的工程又振其余绪,如谭其骧主编《中国历史地图集》,中华书局《二十四史》点校中的人名和地名标注,中央气象局组织绘制的《全国近五百年旱涝分布图》等。至于相对格式化、规模化的地方志、族谱等史料,海内外学者也在20世纪中期前后就开始不懈耕耘,爬梳其中的农业、人口等方面资料,并尝试进行数据化。
最近20多年,由于计算机和互联网的普及,文献的存储与利用逐步电子化,于是产生了数字人文的提法。存储与利用形式的改变固然影响面极广,但如果没有20世纪以来对史料的编码化处理作基础,今天的数字人文或许就仅仅是数字化,而不能真正实现数据化,也难以产生我们所看到和期待的深刻影响。
赵思渊:就数字人文与中国史领域结合而言,项洁主编的《数字人文研究》丛书出版(2010—2016)可能是一个值得关注的事件。此后中文历史学界有关数字人文的讨论逐年增加,以“大数据”或“数字人文”为主题的会议,在2015年之后也显著增加。
就历史学内部来说,历史地理是最早自觉引入各种数字技术的领域,这与历史地理学的研究特色分不开。而经济史领域因为处理量化资料,也很早就引入统计分析软件,并且建设数据库。不过,对中国古代经济史来说,进一步开发适用的数字人文工具也存在一些困难。虽然传统中国史料中也包含大量经济相关的数字,但要把这些数字转化为可分析的数据面临诸多瓶颈。仅就最基本的价格与度量两类数字来说,银两有多种不同的成色、计重,各类货物的称重、体积也都有各种不同的表示方法。如果这些数字不能进行统一的换算,就很难应用现有的数字人文工具进行分析。当然,这也推动我们去思考如何结合史料与研究主题的特性,开发有针对性的数字人文工具。
2
超越检索:数字人文在历史学应用的新进展
主持人:目前,不少历史学者对数字人文的认识还停留在文献题录和史料全文检索数据库层面,对量化历史数据库、历史地理信息系统、文本挖掘、社会网络分析等了解不深。诸位可否结合具体工作介绍一下数字人文在史学研究应用中的新进展呢?
潘威:对于我所从事的历史自然地理研究而言,环境和社会信息都非常复杂,要呈现其关系就更为困难,建立一种能够清晰呈现自然与社会关系、辅助我进行决策的工作环境非常必要。2016年,我们提出了“数字历史河流”概念,其核心是实现“历史时期地表水文过程及人文因素影响机制模拟方法”,对这一理念的试验是“数字历史黄河”平台,包含6个方面:高精度的三维微地貌,水利工程与地形模型的融合方案,河道三维形态的复原,地表水历史时期的运动过程模拟与展示,历史时期的降雨特征重建,历史时期河流—水利管理方式。而“数字历史黄河”作为“数字历史河流”理念的实践,不仅是一个展现历史时期黄河河道时空变化的可视化成果,而且是专业历史资料管理平台+一个专题数据集+一系列历史信息分析和展示功能,是将地理信息系统、工程建模、水文模拟、文本结构分析、社会网络分析等多种技术手段进行融合的一个尝试,同时,也是对既有黄河历史研究中资料体系的重大突破,我们所使用的史料有相当一部分是前人未曾使用过的新史料。目前,这一平台已经建设了“清代水环境数据库”“清代河工用银数据库”“清代河务官僚数据库”和“民国黄河上中游水利工程数据库”等。我们计划让这一平台提供一种工作环境,这一环境以三维方式展现历史时期黄河的水利工程营建场景和运作场景,包括历史时期的水文环境、水利工程三维模型、国家管理制度的可视化等主要组成部分,使用者可以在这一虚拟环境中“观察”曾经发生的黄河故事,也可以通过调整要素(比如增高堤防、抬高水位、增加民夫数量等)重新思考历史记录中的黄河水患和工程营造的过程。
彭凯翔:对历史的理解可以通过对历史事实按一定的时空关系排比叙述来建构,但无论是时间上的先后关系还是空间上的区域范畴,本身都不足以构成因果性的解释。另一种理解历史的方式是,将它视为多个变量相互影响产生的一个过程,史料则是这个过程给观测者呈现出来的某些记录(或样本)。在后一种方式里,每条记录都在某种程度上向我们透露变量间的关系,而我们则要努力拼合记录中的信息,来找出变量间最可能的关系。为此,就需要将历史记录结构化,把样本中的信息分解为若干变量的取值或编码,形成数据库。在以往的历史数据库建设中,较常见的是将原本就是数据形式的史料进行汇编或电子化。汤象龙、梁方仲等对财政、粮价等数据的整理工作,王业键主持整理的清代粮价数据库,近年来吴松弟主持的海关数据整理等,均属此类。也有的数据库是对原始数据进行某种处理后得到的,如曹树基研究团队中的人口数据建立在考辨史料、分析制度背景的基础上,中央气象局的历史灾害数据则根据文字记录进行灾害等级的编码。近年来的一大进展是越来越多的人物、制度等方面非数值但结构化较高的史料得到整理,形成了《中国历代人物传记数据库》《明清人名权威资料库》《辽宁多代人口数据库》《清代缙绅录数据库》等成果。
与此同时,近20年来,一个突出的现象是经济学者介入了历史数据库工作。他们一方面将历史学家已整理的数据按时空单元匹配起来,形成多变量的数据库,另一方面也对一些未结构化的史料进行整理,建立新的数据库。以我参与建设的利率史数据库、刑科题本借贷案件数据库为例,都需要对各种形式的文本史料进行结构化编码,产生出包含数十个定性与数值变量的数据库,并尽量将每条数据的时空单元精确到年—府县级,以便具体研究时能和灾害、粮价等其他数据进行匹配。另外,还有一些近代史料,本身已是数据库,但结构太复杂,它们作为数据库的价值也需要在社会科学工作者的努力下才能更好发挥。
主持人:那么诸位认为未来数字人文还可能对史学研究有哪些重大改变呢?
潘威:如同当年“数字地球”与“信息高速公路”理念为历史地理信息化的起步提供了基础条件一般,“大数据”和“移动互联网”也为历史地理信息化的进一步发展准备好了必要条件。但要将这一机遇转化为实际的创新还有很多问题需要解决。最重要的就是营造好技术创新环境,数字人文建设需要经费、场地、设备、培训,这些都需要投入,也需要加强管理。至于具体技术方面,“人工智能”是可以预见的一项具有重大意义的创新,目前,包括我们“数字历史黄河”在内的多个海内外团队都在摸索其应用方式。
彭凯翔:史学界的数字人文目前还较少应用人工智能和云计算。人工智能也可以理解成人工+智能。史料的数字化直到现在主要还是依靠人工,也通过人工在文本识别、点校、标注等方面提供了堪称海量的数据积累,为迈向智能提供了很好的基础。云计算是和人工智能相辅助的。相信将来我们不仅能够在互联网上方便地查阅史料,还能利用人工智能来更有效地找出我们真正需要的史料。另外,目前民间文献的数字化还很不够。对于内在结构较特殊的账簿、族谱等史料的数字化,学界恐怕还要做不少探索,一旦民间文献的数据库工作铺开,中国史研究乃至社会科学研究都可能发生惊人的变化。
3
审视与期许:从史学学科传统展望数字人文的未来
主持人:任何一种技术、方法都有其适用对象、适用限度,须与其他研究方法技术相配合。数字人文热之下,更需要我们回到历史学学科传统进行冷静的审视与反思,以更好地发挥数字人文的作用。请就此谈谈看法。
潘威:传统与现代结合是我一贯的主张,否则研究工作就成了“无源之水”,技术方案自然也就“无的放矢”。就我个人的经验和认识而言,数字人文只是改变了历史叙述的方式,辅助研究者进行史料辨析、建立因果链条等,数字人文并不能代替研究者的决策地位。至于历史感的形成和升华还是需要依托传统方式,阅读、写作、经历、田野考察等才能真正培养历史感,数据库、地理信息系统等技术手段能够使这些方法的运作更为有效,但无法从根本上改变历史感的培养方式。
彭凯翔:研究人员在面对更加大量的数字化文献时,的确可能会在文本的咀嚼上不够从容,但并不意味着后者不重要。事实上,如果要对史料进行结构化编码的话,就需要对史料的体裁、笔法、制度背景等有系统的把握,这些都离不开考据上的积累。所以,现在构建新的历史数据库,同样也要在史料辨析上先下足功夫,所谓“越多人工,越多智能”。另外,历史学的传统本身有多元性,专门史等分支的交叉性一直就很强。只是,历史学者在最近的交叉研究中受技术等限制,往往局限于史料或数据提供者的角色,这是有必要矫正的,交叉研究不应仅是用其他学科比较华丽的技术重新印证已有的解释,而是要让历史学也从中开拓新领域,得到新发展。
赵思渊:如前所述,我始终还是相信,数字人文不会改变历史学所关切的根本议题。但数字人文的确改变了历史学家面对历史文献的方式,只是这种改变在历史上也不止一次发生过。对历史学家来说,也许当下更需要思考的是将来如何面对原生数字化史料,尽管以数字人文处理传统史料是当前较为活跃的领域。此外,数字人文对历史学的影响不仅在于研究方面,也在于教学以及面对公众的方式,可视化、人机交互等都是显著的变化。这些变化不仅意味着如何讲述历史,也将改变历史研究成果发布中学者与读者之间的关系。
主持人:数字人文是一个系统工程,想要持续、健康发展,必须在原始资料的收藏与提供者(档案馆、图书馆、博物馆等)、资料的加工者与数字人文产品的提供者(商业公司、收藏机构、科研机构、研究者)、数字人文产品的使用者(研究者、公众)之间形成良性互动与循环。其中,研究者兼有需求方和供给方双重角色。诸位可否从这两种不同角色来谈谈对数字人文产品提供者有什么期待以及数字人文基础设施建设所面临的问题与可能的解决途径呢?
潘威:这个问题非常值得讨论,从需求方而言,我们希望各级档案管理部门能够提供资料查阅和使用方面的便利。从数字人文的研制方而言,我认为最重要的是建立有战斗力的工作团队,特别是在史学研究机构推行实验室建设。如果能有更多高校重视“数字人文”实验室建设,将其纳入学校统一的实验室管理体系,实验室管理方式和运营方式的改变将会极大改善数字人文的科研环境。
彭凯翔:目前在高校利用较多的是商业化的数字人文产品,主要形式是全文数据库和可检索的图像数据库。不过,这些产品对于深度的数字人文研究而言,还有不小的改进空间。例如,检索效率不是太高,通常不支持跨库的检索,检索结果的存取亦受很多限制,这些都不利于进行大样本的研究。一种比较彻底的改进思路是为某些数字产品提供主流数据分析软件的应用程序编程接口,让有需要的用户可以自主调用。当然,配套的版权规范也要跟上。而方志、族谱等基础史料的数据化,其工作量既非某一团队或机构所能胜任,其受益方也是整个学界,最好有国家层面的协调机制。
赵思渊:这里可能有几个不同层次的问题需要考虑。第一,数字人文也是互联网浪潮的一部分,开放,更开放,应当是数字人文发展中的追求方向。第二,对于历史学来说,如果我们将数字人文理解为研究环境的转变的话,这种转变的驱动力既可以是研究者个人,也可以是公藏机构与学术单位,还可以是商业机构。数字人文产品的供给必然是多元的,如果能够形成一些通用标准,对更多的研究者是有利的。比如说,各个数据平台之间是否能够设置通用的数据接入、转换接口,或者在开放获取方面达成一些共识。第三,数字人文的确可能为学者与公藏机构的合作带来新的可能性。我们已经看到,数字人文的发展为公藏机构拓展自身的研究领域打开了新的空间。在这个新的空间中,学者与公藏机构唯有紧密合作才可能有新的创获。进一步说,馆藏资源的价值与影响力,将更多由关联研究所决定,而不仅是资源本身是否稀缺。
-专家点评
王涛(南京大学历史学院教授、数字史学研究中心主任):作为历史学者,我们也要用历史的眼光看待当前数字人文方兴未艾的现实。从历史的维度来看,历史学研究领域出现方法的更新、观念的变革,都是非常正常的事情。这不仅让历史学获得不断发展的动力,延续其生命力,而且能够让历史学的面目变得更加鲜活多样。比如赵思渊提到数字人文的技术储备可以带来历史书写的改变,就是数字人文提供的各种可能性之一。
虽然当下数字人文成了一个非常流行的概念,但它也只是一种路径而已,不能代表历史学研究的全部内容。数字人文不谋求取代,也没有能力颠覆整个传统历史学科的方法论与问题域。哪怕是作为个体的历史学研究者,是积极拥抱数字人文,还是恪守传统方法论,都是一种合理的个人选择。所以,在很长的一段时期,数字人文与传统历史学将和平相处。不过,我们也需要意识到,不管是主动还是消极地看待数字人文,它作为一种方法与一种理念将长期存在,甚至会以愈加弥散的方式影响到历史学的方方面面。所以,我们始终要用一种探索的、开放的心态去看待数字人文。探索性与开放性也正是数字人文的应有之义。为此,数字人文的后半场需要落实到对年轻学子的教育层面。当然,数字人文的教育不单纯是让学生掌握某种技能,真正核心的竞争力是数字素养,一种能够触及灵魂的对新生事物的好奇心,这才能充分调动年轻一代的研究热情,让更多具有原创性的历史成果面世。
胡恒(中国人民大学清史研究所副教授、数字人文研究中心研究员):数字人文被引入历史学的时间虽然不长,但近年来相关机构不断设立,学术活动日趋火爆,这时更需冷眼看热潮,方可行稳致远。数字人文对传统史学而言,不是颠覆重构,而是如虎添翼。一些历史学者对数字人文存在的非议,特别是在史料收集与考证方面,严格来说,是将数字人文较为狭隘地理解为检索工具所致。数字人文对历史学的助力,不仅是技术工具的外部冲击,而且也是历史学科发展的“内部理路”所致。
回归“宏大叙事”。近40年来,史学研究碎片化日益突出,学界已有较多反思,并不断呼吁要重建历史学的“宏大叙事”。但这种回归应是在新的高度、方法上的再回归。这一进程并非易事,它需要理论思想的驾驭,但数字人文亦将成为重要工具,帮助我们更好地嫁接起碎片化的经验研究与富有想象力的结构研究之间的有机联系,将整体与个案、定性与定量相结合,催生新的宏大叙事。
强化“问题导向”。当今世界正不断面临超越地域、国家和学科的重大问题,仅靠单一学科显然无法有效回应时代和社会需求,未来学术发展应该以问题为导向,打破学科壁垒。数字人文为历史学的这一转向提供了新的可能,它在人文科学、社会科学与自然科学间建立起互联互通的平台,并在这一融合中以历史学的人文特性改善技术的工具化取向,亦将大大扩大历史学的学科影响。
培养“文理兼通”人才。我国学生多自高中时代即已文理分科,历史学从文科生中选拔,大学以后多数高校又不够重视对历史学学生数学和技术方面的熏陶,导致人才培养中知识结构单一。数字人文为历史学从人才选拔、人才培养和就业取向上以文理兼通的复合型人才培养为导向提供了新的可能。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。