
运用中国古典数字工程所搜集到的史料,目前已匯编多本古籍出版。(记者卢素梅摄)

大陆作家钱锺书(第二排左一)生前偕同夫人杨绛(前排左一)与中国古典数字工程团队的成员们合影。(栾贵明提供)

钱锺书小檔案
以《围城》一书享誉华人圈的大陆着名作家钱锺书,生前积极推动「中国古典数字工程」,将古籍文字数位化,经过近30年的时间,已建成库量6.8亿字的古典文献数据库,不但找到孔子、老子、孙子等古圣先贤散佚在各古籍中的言论,同时也找到燧人氏等人物真实存在的文字记载,进而将华夏文明从上下5000年,推进到上下6500年。
自1984年钱锺书的女儿钱瑗从英国留学回到大陆后,对父亲提起英国学者运用电脑研究莎士比亚戏剧,只要一个指令就可调出剧中人物、情节等比较,让钱锺书兴起透过数位化来整理多如汗牛的中国古籍的念头。
汉字平台 建4大库
在钱锺书建议下,中国社会科学院成立计算机研究室,积极推动中国古籍电子数位化事业,并由栾贵明、田奕等人负责推动。据指出,钱锺书将此工程设定为汉字平台,为了尊重古籍原貌,採用繁体字并建立人名库、日历库、地名库及作品库等四大库。
参与出书的新世界出版社编委会副主任张世林指出,此一文字数位化工程目前已完成宋朝以前全部文献数据,并且对辽、金、元、明、清的文献资料也进行了大量的採集,将陆续生成《中国歷史日历》、《中国人名大典》等集大成的古籍整理丛书。
以《中国歷史日历》为例,中国歷史上1262位帝王为编辑线索,有形诸文字记载的上起燧人氏,下迄清末宣统帝,共计6477年,这也让华夏文明增加了约1500年。该工程即将出版的《太古帝王集》、《太古臣民集》、《皇甫谧集》在文献给予有力的支持和补充。
助理接手 推动工程
中国人名歷史大辞典中所记载的人名才6万名,中国古籍文字数位化工程已搜集到40万名人名。「子曰」不止《论语》的1.6万字,经数据库检索确认为16万字;而《老子集》也从传统的5千言,扩增到5万言。
古籍文字数位化工程在上世纪80年代可谓第一波,包括台湾中央研究院等中外学术机构都考察过。但栾贵明团队因与中国社科院理念不合,双方在2000年中止合作关系。随后,栾贵明等人另起炉灶,但是有长达7、8年完全独力支撑,直到最近才获得大陆政府重视,并透过人民出版社与之合作而获得资金挹注,可望让此一工程在3至5年内获得基本完成。