全球今熱點(diǎn):北大攜字節(jié)跳動(dòng)推出古籍?dāng)?shù)字化平臺(tái),搭建免費(fèi)開放的“智能圖書館”

              2022-10-11 19:34:17    來源:中國經(jīng)濟(jì)網(wǎng)


              (資料圖片僅供參考)

              10月11日,由“北京大學(xué)—字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”研發(fā)的古籍?dāng)?shù)字化平臺(tái)“識(shí)典古籍”測試版正式上線。目前,該平臺(tái)涵蓋390部經(jīng)典古籍,主要來自《四部叢刊》,共計(jì)3000多萬字,即日起向公眾免費(fèi)開放。未來三年,“識(shí)典古籍”將陸續(xù)完成一萬種古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄,屆時(shí)將全部免費(fèi)開放。

              “識(shí)典古籍”項(xiàng)目負(fù)責(zé)人現(xiàn)場講解

              據(jù)了解,上述實(shí)驗(yàn)室系今年3月北京大學(xué)與字節(jié)跳動(dòng)合作成立,將人工智能技術(shù)應(yīng)用于古籍資源的智能化整理。“識(shí)典古籍”平臺(tái)上線,即是雙方合作的最新進(jìn)展。

              當(dāng)前,中國的古籍?dāng)?shù)字化還處于初級(jí)階段,面臨技術(shù)難度高、資金缺口大、人才緊張等難點(diǎn)。相關(guān)資料顯示,現(xiàn)存的20多萬種古籍中,只有8萬種完成影像數(shù)字化掃描,近4萬種完成文本數(shù)字化。據(jù)專家統(tǒng)計(jì),從1949年到2019年,國內(nèi)共修復(fù)整理出版古籍近3.8萬種,要將現(xiàn)存古籍全部修復(fù)整理出來,可能需要300年時(shí)間;若利用人工智能技術(shù)輔助修復(fù)整理,大概二三十年就能完成。

              活動(dòng)相關(guān)海報(bào)

              據(jù)“識(shí)典古籍”項(xiàng)目負(fù)責(zé)人介紹,該平臺(tái)當(dāng)前主要使用了三種技術(shù),包括文字識(shí)別、自動(dòng)標(biāo)點(diǎn)和命名實(shí)體識(shí)別。文字識(shí)別技術(shù),是對古籍的影印版文字進(jìn)行單個(gè)切分,再進(jìn)行文字識(shí)別和順序識(shí)別。自動(dòng)標(biāo)點(diǎn)技術(shù),是通過序列標(biāo)注的方式對古籍自動(dòng)進(jìn)行標(biāo)點(diǎn)劃分。命名實(shí)體識(shí)別技術(shù),則是通過序列標(biāo)注識(shí)別文本中的人名、地名、書籍、時(shí)間、官職等信息。據(jù)悉,目前行業(yè)內(nèi)OCR識(shí)別準(zhǔn)確率平均為93%至94%,“識(shí)典古籍”的準(zhǔn)確率為96%至97%。

              與其他古籍?dāng)?shù)字化平臺(tái)相比,“識(shí)典古籍”具有自身的特點(diǎn),頁面簡潔,瀏覽流暢,提供影印底本作為參照,還具備主題詞檢索和繁簡體轉(zhuǎn)換功能,便于專業(yè)研究人員、廣大古籍愛好者使用。同時(shí),“識(shí)典古籍”書目將持續(xù)更新,后續(xù)將上線手機(jī)移動(dòng)版。

              “識(shí)典古籍”網(wǎng)頁截圖

              未來,“識(shí)典古籍”將向全社會(huì)開放古籍閱讀檢索研究能力,還將實(shí)現(xiàn)全自動(dòng)整理校對,更高效地實(shí)現(xiàn)存量古籍全部數(shù)字化。同時(shí),平臺(tái)也鼓勵(lì)擁有文獻(xiàn)的學(xué)者自行上傳文獻(xiàn),用戶甚至可參與再創(chuàng)作和再闡釋,助力古籍文化傳承和研究。

              一年多來,字節(jié)跳動(dòng)在古籍修復(fù)和活化上也有所進(jìn)展。此前,字節(jié)跳動(dòng)資助國家圖書館定向修復(fù)的珍貴古籍104冊件,現(xiàn)已完成50多冊件,包括一批稀有的樣式雷圖檔。在活化方面,抖音平臺(tái)推出“尋找古籍守護(hù)人”計(jì)劃,旨在激勵(lì)創(chuàng)作者通過音樂、說書、繪畫、復(fù)原美食等形式,普及古籍知識(shí)、演繹古籍內(nèi)容,讓古籍鮮活起來。

              關(guān)鍵詞: 字節(jié)跳動(dòng)

              上一篇:
              下一篇:

              熱點(diǎn)話題

              熱點(diǎn)推薦

              頭條

              ? 亚洲中文久久精品无码1| 亚洲日韩中文字幕日韩在线| 亚洲国产高清美女在线观看 | 亚洲性无码AV中文字幕| 国产亚洲精品无码专区| 亚洲精品美女网站| 亚洲av福利无码无一区二区| 亚洲欧洲专线一区| 精品亚洲A∨无码一区二区三区| 亚洲国产成人久久精品99| 7777久久亚洲中文字幕蜜桃| 亚洲人成在线观看| 亚洲中文久久精品无码ww16| 亚洲av无码专区在线观看亚| 亚洲最大在线视频| 亚洲人成影院77777| 狠狠色伊人亚洲综合网站色| 亚洲熟妇无码一区二区三区| 亚洲AV无码精品国产成人| 国产成人不卡亚洲精品91| 亚洲永久在线观看| 亚洲人成人网站18禁| 日本亚洲欧美色视频在线播放| 成人伊人亚洲人综合网站222| 亚洲大成色www永久网址| 亚洲色无码专区一区| 无码一区二区三区亚洲人妻| 香蕉视频亚洲一级| 亚洲欧美日韩中文高清www777| 亚洲heyzo专区无码综合| 国产精品久久久久久亚洲小说| 亚洲精品无码专区久久同性男| 亚洲欧洲精品成人久久曰| 国产亚洲欧美在线观看| 亚洲视频一区二区| 亚洲国产成人片在线观看无码 | 亚洲黄网在线观看| 激情亚洲一区国产精品| 久久精品国产亚洲av麻豆色欲 | 国产精品亚洲玖玖玖在线观看| 色婷婷亚洲一区二区三区|