中央文史館館員陳力推動“漢典重光”項目,讓20萬頁中國古籍“數字化回歸”

2021-05-21 11:26
來源: 新華網等
作者:

  

  中國古籍擁有非常龐大且復雜的知識體系,包括甲骨簡牘、敦煌遺書、宋元善本、明清精槧、拓本輿圖、少數民族文獻等等。所涉及的范圍也是極其廣泛,有應對自然災害、流行疫病、經濟波動、政治斗爭、外交危機、氣候變遷等的經驗,有戰爭、瘟疫、地震、洪澇災害、病蟲害等方面的經驗總結,還有醫療、中藥、養生、家具、服飾、飲食文化等生活經驗。

  因邦交、貿易、戰亂等,歷史上中國古籍時有出海,近代以來,戰爭和動蕩更加劇了古籍的損毀和流散。據不完全估計,散居海外的中國古籍超過40萬部、400萬冊。

  這些古籍不能運回中國,那就用數字化手段讓古籍的內容“回家”。

  2019年,阿里巴巴和四川大學提出“數字化回歸”設想,四川大學歷史文化學院副院長王果與中央文史研究館館員陳力牽線搭橋,溝通北美、歐洲、日韓等地藏書機構,最后獲得加州大學伯克利分校支持,達成共識,將伯克利東亞圖書館的中文古籍善本逐步數字化。

  加州大學伯克利分校的東亞圖書館是全美三大東亞圖書館之一,中文藏書量排名全美第三,90萬冊藏書里四成都是中文書,還有不少甲骨文和拓片。

  阿里巴巴公益基金會、四川大學、美國加州大學伯克利分校、中國國家圖書館、浙江圖書館合作開展了“漢典重光”項目,旨在尋覓流散海外的中國古籍并將其數字化、公共化,讓普通人也能親近古籍,通過古籍與先賢對話,與優秀傳統文化對話。

  為將伯克利提供古籍的掃描圖片和編目數據全部文字化,阿里達摩院技術團隊與四川大學專家聯手研發出一套全新的古籍識別系統,以97.5%的準確率完成對20萬頁古籍的整體識別。目前,該系統已能批量識別百本古籍,并沉淀覆蓋3萬多字的古籍字典。比起專家錄入,這套人機交互的識別系統將效率提升近30倍。隨著古籍識別規模的擴增,機器還會自我進化,不斷提升準確率和效率。

  2021年5月18日下午,中國海外古籍“數字化回歸”項目“漢典重光”平臺在北京中國科技館正式發布。

  “漢典重光”平臺稱,首批20萬頁古籍已完成數字化,公眾可通過該平臺翻閱、檢索古籍。本次首批數字化的20萬頁古籍中,包含40余種珍貴宋元刻本、寫本,如宋刻本《後村居士集》、北宋《金粟山大藏經》寫本;明清至民國時期著名學者錢謙益、翁方綱、王韜的抄本、稿本;著名藏書樓嘉業堂、密韻樓的抄本,還有命運多舛的清文瀾閣《四庫全書》零本等,很多都是消失多年后重回公眾視線的珍本。

  據了解,達摩院、四川大學、美國加州大學伯克利分校、中國國家圖書館、浙江圖書館將繼續投入人力、物力,擴大古籍數字化回歸的數量,讓所有蒙塵的古籍重煥新生。

  達摩院院長張建鋒表示,阿里計劃將這套技術工具連同古籍數字化平臺一并捐贈,交由權威公共機構長期運營,最終將成為一個開放的網絡平臺,供大眾檢索學習。

  與古籍打了一輩子交道的陳力說,典籍是中華文明的傳承載體,更是人類世界的公共財產,希望有更多力量參與中國古籍的保護和傳承,讓更多普通人有機會接觸古籍、使用古籍,讓所有蒙塵的古籍重煥新生,讓書寫在古籍里的文字活起來。

漢典重光古籍數字化平臺

文瀾閣版《宋百家詩存》(卷七)

  (綜合新華網、中新網、北京日報報道)

相關鏈接

010090110030000000000000011100001211166025
一级A做爰片免费视频_免费黄片视频在线观看2018 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>