古籍,承載厚重的歷史和文化。中國古籍一直面臨數(shù)字化程度低、以文本形式進(jìn)行數(shù)字化的古籍?dāng)?shù)量少、難以檢索等問題。數(shù)據(jù)顯示,我國現(xiàn)存古籍有20萬種,據(jù)不完全統(tǒng)計(jì),其中有數(shù)字化掃描影像的已經(jīng)有8萬種,而實(shí)現(xiàn)文本數(shù)字化的僅有3-4萬種左右。這對于古籍內(nèi)容檢索和開展研究造成了不便。古籍?dāng)?shù)字化,是保護(hù)和合理利用古籍的方向。
昨日,字節(jié)跳動(dòng)宣布向北大教育基金會(huì)提供捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”的工作,研發(fā)古籍?dāng)?shù)字化平臺,利用智能技術(shù)加速中華古籍資源的數(shù)字化建設(shè),向全社會(huì)提供公益化服務(wù)。
據(jù)了解,該實(shí)驗(yàn)室將調(diào)動(dòng)國內(nèi)外的相關(guān)力量,在三年內(nèi)完成一萬種精選古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄。提供開放、體驗(yàn)良好的閱讀服務(wù)和基本文本庫,并借助知識圖譜等技術(shù)幫助學(xué)者高效檢索和利用古籍中的信息。
同時(shí),項(xiàng)目也將推出結(jié)合OCR、句讀、實(shí)體識別和知識圖譜等技術(shù)構(gòu)建的一站式自動(dòng)古籍智能化整理平臺,并對社會(huì)大眾免費(fèi)開放,便于收藏機(jī)構(gòu)、研究者、相關(guān)專業(yè)的師生和廣大古籍愛好者自行完成古籍?dāng)?shù)字化工作,加快整個(gè)行業(yè)數(shù)字化古籍資料的效率。
“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”重視傳承中華傳統(tǒng)文化,希望將平臺建設(shè)成為開放、共享、可對古籍進(jìn)行充分檢索利用的信息平臺,以應(yīng)對這些古籍保護(hù)與利用中的挑戰(zhàn)。希望通過公益捐贈(zèng),支持北大的古籍?dāng)?shù)字化成果全面轉(zhuǎn)化為社會(huì)服務(wù)。讓更多的研究者、愛好者以更高效、便利的方式獲取古籍里蘊(yùn)藏的豐富知識。
文化傳承是字節(jié)跳動(dòng)公益重點(diǎn)關(guān)注的領(lǐng)域。2021年6月17日,字節(jié)跳動(dòng)聯(lián)合中國文物保護(hù)基金會(huì),在國家圖書館成立古籍保護(hù)專項(xiàng)基金,初期啟動(dòng)資金人民幣1000萬元,用于修復(fù)《永樂大典》“湖”字冊等105冊(件)珍貴古籍、培養(yǎng)100名修復(fù)人才等項(xiàng)目。據(jù)了解,這些修復(fù)的古籍也將逐步引入古籍?dāng)?shù)字化平臺。
字節(jié)跳動(dòng)公益還發(fā)起“尋找古籍守護(hù)人計(jì)劃”,邀請專家學(xué)者、文化名人、抖音創(chuàng)作者通過知識講解、說書、繪畫等形式傳播古籍內(nèi)容,普及古籍知識,傳播古典文化。