文汇报头版头条谈数字人文与智慧数据
发布日期:2019-07-15  浏览次数:

智慧数据进入“人类文化遗产保护”让梦想照进现实

文汇报7月14日头版头条《名家访谈》发表对王晓光教授的采访。

链接如下:http://wenhui.sumg.com.cn/html/2019-07/14/content_813828.html   

 ■嘉宾:王晓光(武汉大学数字人文研究中心主任)

 ■采访:樊丽萍(本报记者)

  

  前有巴西国家博物馆,后有巴黎圣母院,半年间两场无情的大火吞噬了两大世界知名地标建筑,一批记录人类文明的历史瑰宝也在大火中荡然无存,损失无法估量。掩面叹息之余,很多人都在追问,现代信息技术已如此昌隆,人类文化遗产可有更妥善的保存方法,让它们得以“永生”?


  随着良渚古城遗址成功“入遗”,中国世界遗产总数增至55处,位居世界第一。如何更好地保护和传承文化遗产,愈显重要。武汉大学数字人文研究中心主任王晓光教授日前接受本报记者专访时表示,在业界,“数字人文”正越来越热。“很多积淀、记录人类文明的成果碍于时空限制,至今仍被锁在各大博物馆。随着数字人文的崛起和日渐普及,这一切将会改变。”


  令人期待的不仅是文博、古籍研究等领域,王晓光说,作为一个交叉学科和一种全新研究方法,数字人文将对古老的人文学科产生不可估量的影响,还会生发出一种全新思维方式——人文计算思维。


  从“数字敦煌”窥见数字人文的美好前景


  人文学科插上“数字”羽翼后将如何翱翔?比想象更有说服力的是实践。作为敦煌研究院“数字敦煌”项目国际咨询委员会委员,王晓光深度参与了这一数字人文项目实践。


  “在敦煌,很多石窟里留有残破的壁画。而传统的敦煌学,绝大多数研究史料都是以文字或图片等形式存在。”王晓光介绍,借助数字化团队近年来的工作,目前已有200多个洞窟完成了高清扫描,这直接为敦煌学研究开启了全新窗口。


  比如,通过二维图像与三维模型结合,原本在敦煌石窟壁画上的平面佛像随即变成一尊栩栩如生的立体佛像。王晓光说,在数字化技术的支撑下,不仅能三维重塑某个石窟里的某一尊特定佛像,在完成所有数据积累后,还可检索出所有洞窟里总共出现了多少尊这样的佛像、他们的左邻右舍是谁、分别在怎样的场景下出现等关键信息。


  在王晓光看来,所谓“数字人文”不仅是指在人文研究领域各种数字资源的使用,同时也指人文学科研究所涉及的各种数字化工具,以及由数字基础设施建设而引发的新兴人文学科问题。


  新工具和新方法让人文学者透视历史、发现未知


  不少传统的人文学者,对数字技术多少有些抵触情绪。有学者倾向于认为,人文学科以人及人的价值为主要研究对象,与以计算为基础的工具理性之间格格不入。但王晓光认为,近年来,人文科学研究的最大亮点或变数,正是因为数字化技术的出现。


  数字人文的运用,正让学者告别繁复的资料收集,转向高层次的知识发现,研究效率迅速提升。当然,这也需要人文学者掌握一些新的研究工具和研究方法。


  “传统的人文学者似乎从不会考虑用建模去开展研究。建模仿佛是数学、经济学研究者的工具。但在数字人文研究领域,建模就是一种必须掌握的方法。”王晓光说。


  以文学研究为例。假设整个18世纪英国小说有2万本,一位学者以此为研究对象,穷其一生研究其中某几位作家所写的几十本小说,依然难以完整、宏观地描述那段横跨百年的文学发展趋势。而借助全新的主题建模,计算机可以很快“读”完2万本小说,给出不一样的结论。“简单地说,运用遥读分析、主题建模、文本挖掘等方法,研究者相当于同时拥有了一副超大视野的广角镜和目光深邃的透视镜,用以把握整个18世纪英国小说创作的完整图景。”当然,广角镜和透视镜是否管用,还取决于学者的学术目标与工具是否匹配。


  在学术界,另一个具有代表性的数字人文研究实践,就是北京大学中国古代史研究中心、美国哈佛大学费正清中国研究中心和我国台湾“中央研究院”历史语言研究所合作建设的“中国历代人物传记资料库”数据库项目,目前入库的中国历史人物数量已达四五十万,而且还在不断增加。


  该数据库的研究目标是要把中国历史上的代表性人物“一网打尽”,并进行结构化处理。数据库建成后,人文学者仿佛有了一双“火眼金睛”,能够一目百年甚至千年,通过搜索一下子找到几十万篇文献中记录的某些线索。


  而在国际上,随着视觉分析等数字新技术运用到人文图像领域,很多人眼看不到的隐秘信息逐渐被发现,像是打开了一座沉睡的知识宝库。


  王晓光介绍,英国伦敦大学学院学者在研究达·芬奇的一份手稿时,发现达·芬奇在手稿上曾画过一只小狗,然后擦掉了。从画作来看,由于小狗被完全擦掉了,肉眼是看不见的,但经由高光谱分析技术,这只小狗被“发现”了。


  由此再联想到书法研究、绘画研究,可以预见,随着更多数字人文技术的运用,未来还将有更多“未知”等待着研究者们去开启。


  “智慧数据”将为人文学科带来新的资源保障


  “数据科学正在成为所有现代科学的基础性学科。”王晓光说,在人文领域,随着传统文献资源数字化,一切文献都可能成为可计算的数据。在计算思维模式下,未来人文研究的研究范式将发生转变——不仅凭脑袋思考问题,还要借助全新工具挖掘数据。


  “过去,人文学者主要依赖于阅读纸质或电子文献,有时虽然耗费了大量时间,却发现真正有意义的信息并非海量数据,而是更高等级的智慧数据。”王晓光说,这将是人文学科需要开拓的全新领域,即让数字资源组织水平更高,“我们要做的,不仅是把传统文献简单地数字化,而且要在文献内部的知识点之间建立跨域链接,通过语义出版,形成一个可见、可操作和可信的数据网络,即语义网。”


  如果这些关键工作得以实现,在高级的知识组织状态下,“智慧数据”就会形成,就能为数字时代人文学科的繁荣发展提供强有力的资源支撑与服务保障。


Copyright © 2011 武汉大学 信息资源研究中心