我國科研人員發(fā)布古籍大語言模型

記者日前從南京農(nóng)業(yè)大學(xué)了解到,該校信息管理學(xué)院王東波教授團(tuán)隊與中華書局古聯(lián)公司研發(fā)的古籍大語言模型近日上線。

“我們請它以‘金陵’為主題,生成一首詩。”王東波演示模型的智能作詩功能,輸入指令后,模型不久就給出了反饋。除了智能作詩、斷句翻譯,該模型還能實現(xiàn)詞法分析、實體識別、關(guān)系提取、文本摘要等功能。

“普通讀者想閱讀古籍文獻(xiàn)并不容易,要克服繁體、豎版、沒有句讀等困難?!蓖鯑|波說,團(tuán)隊自2013年起為《四庫全書》等古籍添加人工標(biāo)注,積累了規(guī)模超過20億字的精加工語料數(shù)據(jù),這為該古籍大語言模型提供了語料數(shù)據(jù)基礎(chǔ)。

據(jù)了解,該古籍大語言模型是國家社科基金重大項目“中國古代典籍跨語言知識庫構(gòu)建及應(yīng)用研究”的重要成果。下一步,南京農(nóng)業(yè)大學(xué)與中華書局古聯(lián)公司計劃將模型的應(yīng)用場景推廣到古籍整理、數(shù)字文娛等領(lǐng)域。

“期待模型能進(jìn)一步推動古籍智能化研究與跨學(xué)科人才培養(yǎng)有機(jī)結(jié)合,讓公眾既能接觸到前沿的人工智能技術(shù),又能積累傳統(tǒng)文化知識?!蓖鯑|波表示。(記者秦華江、陳席元)

德州新聞網(wǎng)版權(quán)與免責(zé)聲明:

①凡本網(wǎng)注明“來源:德州新聞網(wǎng)”的所有作品,版權(quán)均屬于德州新聞網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源: 德州新聞網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

②凡本網(wǎng)注明“來源:XXX(非德州新聞網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。

③鑒于本網(wǎng)發(fā)布稿件來源廣泛、數(shù)量較多,如因作者聯(lián)系方式不詳或其它原因未能與著作權(quán)擁有者取得聯(lián)系,著作權(quán)人發(fā)現(xiàn)本網(wǎng)轉(zhuǎn)載了其擁有著作權(quán)的作品時,請主動與本網(wǎng)聯(lián)系,提供相關(guān)證明材料,我網(wǎng)將及時處理。