數(shù)智技術(shù)融媒手段 讓珍貴古籍觸手可及


中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時(shí)間:2023-02-13





  兩個(gè)古籍?dāng)?shù)據(jù)庫于2月8日在國家圖書館同步發(fā)布:一個(gè)是“《永樂大典》高清影像數(shù)據(jù)庫”,一個(gè)是“《國家珍貴古籍名錄》知識庫”。


  兩個(gè)庫均為全國古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組“2021年度國家古籍?dāng)?shù)字化工程專項(xiàng)經(jīng)費(fèi)資助項(xiàng)目”,已于2022年11月順利結(jié)項(xiàng),讀者可免費(fèi)登錄使用。這次,國家圖書館、北京大學(xué)和字節(jié)跳動(dòng)合作,為古籍?dāng)?shù)字人文建設(shè)提供了一個(gè)合作樣板。


  多項(xiàng)技術(shù)實(shí)現(xiàn)古籍傳承與創(chuàng)造性利用


  《永樂大典》是明成祖(朱棣)永樂年間編纂的一部大型百科全書,其副本目前僅發(fā)現(xiàn)有400余冊800余卷及部分零葉存世,總數(shù)不及原書的4%。國家圖書館共收藏《永樂大典》224冊,占存世《永樂大典》的一半以上。


  為完整保存和全面?zhèn)鬟_(dá)《永樂大典》相關(guān)信息,國家圖書館委托國家圖書館出版社進(jìn)行《永樂大典》高清數(shù)據(jù)庫項(xiàng)目的制作,后者于2021年12月委托北京大學(xué)數(shù)字人文研究中心承擔(dān)該項(xiàng)目的設(shè)計(jì)與研發(fā)工作。該研究中心以北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室為基地,整合學(xué)校和字節(jié)跳動(dòng)雙方力量,建成了《永樂大典》高清影像數(shù)據(jù)庫。


  項(xiàng)目第一輯收錄國家圖書館藏《永樂大典》四十冊、七十五卷的內(nèi)容,共涉及14個(gè)韻部、17個(gè)韻字、1800部書,除呈現(xiàn)《永樂大典》高精圖像、整體風(fēng)貌及相關(guān)知識外,還嘗試對部分大典內(nèi)容做了知識標(biāo)引示范,為后續(xù)《永樂大典》的知識體系化、利用智能化進(jìn)行探索。


  北京大學(xué)數(shù)字人文研究中心主任王軍表示,這一數(shù)據(jù)庫在互聯(lián)網(wǎng)環(huán)境下以可交互、可視化的方式向大眾傳播古籍知識,它展現(xiàn)了以數(shù)字人文手段實(shí)現(xiàn)古籍活化的技術(shù)路徑,實(shí)現(xiàn)了古籍的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性應(yīng)用。


  國家圖書館(國家古籍保護(hù)中心)聯(lián)合北京大學(xué)數(shù)字人文研究中心研發(fā)的“《國家珍貴古籍名錄》知識庫”,包含了已批準(zhǔn)公布的六批《國家珍貴古籍名錄》,還收錄了《國家珍貴古籍名錄圖錄》中包含的書影圖像、說明文字內(nèi)容。該項(xiàng)目綜合應(yīng)用現(xiàn)有數(shù)字人文的多項(xiàng)技術(shù),將珍貴古籍名錄書目數(shù)據(jù)重構(gòu)為知識庫,以多維度知識圖譜、GIS等多種可視化形式展示歷史時(shí)空構(gòu)架下書與書、書與人、人與人之間的多維關(guān)系。


  推進(jìn)古籍?dāng)?shù)字化需多方合力


  2022年,中共中央辦公廳、國務(wù)院辦公廳發(fā)布《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》。其指出,要深入推進(jìn)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展,加強(qiáng)古籍搶救保護(hù)、整理研究和出版利用,促進(jìn)古籍事業(yè)發(fā)展,為實(shí)現(xiàn)中華民族偉大復(fù)興提供精神力量。


  長期從事相關(guān)工作,王軍對古籍?dāng)?shù)字化也有一些感悟。他指出,古籍活化利用的關(guān)鍵,在于“數(shù)據(jù)加工+學(xué)術(shù)保障+設(shè)計(jì)轉(zhuǎn)化”,即需要圖書館的開放理念、高校的學(xué)術(shù)轉(zhuǎn)化和企業(yè)的研發(fā)與傳播平臺攜手。


  參與此次合作的字節(jié)跳動(dòng)方相關(guān)負(fù)責(zé)人建議,可以通過行業(yè)共建,引入更多學(xué)術(shù)資源,并以百科、圖文、短視頻、直播、數(shù)字讀物、VR交互等多種形態(tài)進(jìn)行內(nèi)容導(dǎo)讀,不斷完善數(shù)字環(huán)境下古籍保護(hù)與傳承的生態(tài)體系建設(shè)。圖書館是古籍收藏和保護(hù)機(jī)構(gòu),高校是教學(xué)和研究機(jī)構(gòu),出版社是出版和發(fā)行單位,互聯(lián)網(wǎng)可以作為古籍活化和傳播的平臺,四者都是鏈條上的關(guān)鍵環(huán)節(jié)。


  北京大學(xué)信息管理系主任張久珍提到了目前大熱的聊天機(jī)器人ChatGPT。在古籍?dāng)?shù)字化工作中,人工智能也將成為新常態(tài)。假如讓類似的人工智能學(xué)習(xí)浩如煙海的中華歷史典籍,它能成為一個(gè)擁有中華智慧的“人”嗎,如果大家跟它聊天會(huì)怎樣?“我們古籍?dāng)?shù)字化的目標(biāo)還可以定得更高一些。”張久珍說。


  在她看來,ChatGPT還存在一些硬傷和短板。比如它的回答看似邏輯嚴(yán)密工整,但是論點(diǎn)欠缺專業(yè)性,論據(jù)無法溯源,這可能是因?yàn)閿?shù)據(jù)源權(quán)威性存在問題,數(shù)據(jù)基礎(chǔ)建得不夠好。“這也給古籍?dāng)?shù)字化提了一個(gè)醒,一定要從一開始就重視中華古籍的數(shù)字基礎(chǔ)設(shè)施建設(shè)?!睆埦谜湔f。


  “數(shù)字化和智能化的信息環(huán)境使得千余年來基于紙本傳播和利用知識的方式發(fā)生根本性變革。將中華典籍遷移到數(shù)字環(huán)境下,用數(shù)智技術(shù)挖掘古籍資源所蘊(yùn)含的文化價(jià)值、用融媒體手段呈現(xiàn)典籍的精神魅力,是當(dāng)代人義不容辭的歷史責(zé)任?!北本┐髮W(xué)副校長王博這樣感嘆。(張蓋倫)


  轉(zhuǎn)自:科技日報(bào)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點(diǎn)視頻

前兩個(gè)月工業(yè)經(jīng)濟(jì)穩(wěn)定恢復(fù),企業(yè)利潤同比繼續(xù)保持增長 前兩個(gè)月工業(yè)經(jīng)濟(jì)穩(wěn)定恢復(fù),企業(yè)利潤同比繼續(xù)保持增長

熱點(diǎn)新聞

熱點(diǎn)輿情

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964