上一篇
放大+  缩小-   默认o

以数字人文驱动古籍整理研究的创造性转化和创新性发展

刘 石

习近平总书记在文化传承发展座谈会上强调:“只有全面深入了解中华文明的历史,才能更有效地推动中华优秀传统文化创造性转化、创新性发展,更有力地推进中国特色社会主义文化建设,建设中华民族现代文明。”这一重要论述意蕴深远,内涵深刻。

要想全面深入了解中华文明的历史,20万种传世古籍是一笔宝贵的财富。它们是源远流长、博大精深的中华文明信息与中国文化基因的载体,是中华民族思想的表达、精神的追求、智慧的结晶。传世古籍这笔财富要利用好,首先要研究好;要研究好,首先要整理、保护和传承好。我国古籍整理的历史与古籍一样悠久,孔子就整理过六经,人们称他为思想家、教育家,也称他为文献学家。两千多年来,古籍的整理和研究不仅是历代学人孜孜矻矻的名山事业,也是中华优秀传统文化传承和传播的前提与基础。

党中央历来重视古籍的整理与传承,早在1981年,就以中共中央文件的名义下发过《关于整理我国古籍的指示》。习近平总书记在此次座谈会前,也专程前往中国国家版本馆中央总馆考察,并指示要千方百计保护好留存下来的这些瑰宝,将古籍整理和传承的重要性提到“把我们这个世界上唯一没有中断的文明继续传承下去”的位置。

计算机科学的发展使得大数据时代不期而至,针对古籍工作,党和国家从时代发展和文化建设需要出发,及时颁布了相关的政策和文件。2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,明确提出“推进古籍数字化”。

中国古籍数字化已有至少40年的历史,但相对于20万种古籍来说,得到数字化的尚属很小一部分,《意见》提出“建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程”,正当其时,非常重要。

但更重要的是,技术的发展倒逼着我们提出更高和更激荡人心的目标。随着计算机深度学习能力、文本挖掘等大数据技术和人工智能的快速发展,古籍在继续数字化的同时,应该开始向知识化转变。“积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级”,《意见》中的这段表述,充分体现了国家对于古籍数字化领域发展前沿的深刻把握,对于利用现代科技手段促进古籍整理与研究的高度关切,具有重要的前瞻性和方向性,更值得重视。

数字化和知识化的最大区别,就是前者仅可提供简单的字符串检索,后者是基于所有存世古籍的关系性、结构化、知识再生型的超大数据库,简单地讲,就是使用大数据、人工智能、自然语言处理等相应技术手段,开发适合不同古籍类型的文本分析模型和工具,借助过往一切古典学的研究成果,周密地设定主题词表,专业地提取各种实体,多维度地构建不同实体间的关系,对文献进行深层组织和知识管理,形成体系化的“中国古典知识库”。这是一个基于全部存世古籍、关乎中国古典知识整体的宏大构想,它的建设,意义重大。

首先,将促进古籍整理和利用的转型升级。大数据技术带来文献生产方式的创革、文本形态的新变和文献获取方式的拓展,使得抄印本和电子化时代被日渐穷尽的文献,因为数据化、知识化而重新变得不可穷尽。同时,将以往被分裂和隔绝的事物重新连接,可以最大程度地促进文献的关联与知识的发现,改变我们对文献、知识的认识路径和把握尺度,催生一种新型的文献学。

其次,将促进学术研究、知识生产的迭代更新。传统的文献获取方式和阅读条件下的众多学术工作,比如文本校笺、年谱编纂、资料汇辑、史实考据等,每一种都需要耗费学者的大量心血乃至平生精力,今后在知识库作为学术研究平台的环境下,将会变得轻而易举从而退出学术主流,代之而起的是层出不穷的更大尺度、更小粒度和更多维度的知识生产、文化创造和随之呈现的新视野、新观点以及新方法。

再次,将促进人文学科思维和范式的发展变化。机器学习与人工智能、数据与文本挖掘、社会网络与地理信息系统、统计学习与主题模型等数字工具革新和技术应用,“数据驱动、实证优先”的大数据思维,必然促成人文学术从片面性到整体性、从因果性到相关性、从解释性到求是性的重心偏向,给人文学者带来认知方式、学术理念和研究范式的发展变化,其意义就远不限于古籍学术一隅,而是辐射至以历史文化为对象的整体人文学术研究了。

在西方国家,数字人文的概念产生得比较早,数据库和知识库的建设也进展得比较快。进入人工智能时代,群智创新将为人文学科带来新的发展活力,知识语料库构建更成为一种创新潮流,人文学科的创新模式和创新中心将随之发生改变和转移。值得重视的是,海外也在关注中国基本文献数据库和中华传统文化大模型的建设,这不仅涉及古籍整理研究和中国传统文化研究的自主推进,也关乎文化自信和文化安全。

可喜的是,近年来国内数字人文的发展也正呈加速之势,从事数字人文工作的学者尤其是年轻学者日多,多家高校和研究机构成立数字人文中心,学术交流频繁,学术成果递增。2020年1月,大陆第一家《数字人文》杂志由清华大学与中华书局联合创刊,第一个数字人文门户网站在清华大学建成。2023年4月,“数字人文”进入教育部最新版“普通高等学校本科专业目录”。与此同时,与古籍整理研究相关的历史人文智慧数据平台、知识服务平台正在涌现,中国的数字人文正在形成自己的体系特色。

在今天,文化的传承和创新离不开突飞猛进的科学技术。大数据时代,数字人文的快速发展给悠久而辉煌的传统古籍整理研究提供了突破性变革的巨大机遇。用数字化的技术手段、方法和与之相应的理念整理古籍,发扬学术,传承文化,赓续文脉,成为时代交付我们这一代人的历史使命。我们要趁势而为,进一步拓展视野、提高站位,在推动中华优秀传统文化创造性转化、创新性发展的实践中,在以中国式现代化全面推进中华民族伟大复兴的进程中,为建设中华民族现代文明作出应有的贡献。

(作者系全国古籍整理出版规划领导小组成员、清华大学人文学院教授)

2023-09-05 刘 石

1 1 经济日报 content_280434.html 1 <p> 以数字人文驱动古籍整理研究的创造性转化和创新性发展 </p> /enpproperty-->