波多野结衣家庭教师在线播放_熟妇人妻无乱码中文字幕真矢织江_波多野结衣50连登视频_www.av91_亚洲第一中文av_91成人综合网_日韩无套无码精品_日韩欧美猛交xxxxx无码_男人天堂a在线_www.好吊操_日韩伦理在线免费观看_男人的天堂狠狠干

用戶(hù)登錄投稿

中國(guó)作家協(xié)會(huì)主管

“識(shí)典古籍”邂逅人工智能 古籍走入“尋常百姓家”
來(lái)源:北京日?qǐng)?bào)  | 李濛  2024年03月15日07:56

應(yīng)該如何閱讀古籍?人們通常認(rèn)為,閱讀古籍要選擇合適的版本,了解歷史背景知識(shí),借助注釋和工具書(shū),對(duì)照其他相關(guān)文獻(xiàn),才能更好地體會(huì)古籍的獨(dú)特之處。然而,事實(shí)上,“找不到、不會(huì)用、讀不懂”是人們閱讀古籍時(shí)面臨的常見(jiàn)情況。

隨著人工智能技術(shù)的發(fā)展,這些問(wèn)題正在慢慢解決。近日,在字節(jié)跳動(dòng)研發(fā)的“識(shí)典古籍”數(shù)字化平臺(tái)上,讀者多了“古籍智能助手”的選項(xiàng)——選中讀不懂的古文原文點(diǎn)擊“問(wèn)AI”,就可以看到這句話(huà)的翻譯,并可以用日常說(shuō)話(huà)的方式,讓智能助手總結(jié)文本內(nèi)容,提出可供參考的研究問(wèn)題。

可以看到,古籍智能助手降低了古籍的閱讀門(mén)檻,讓流傳千百年的寶貴文獻(xiàn)走入尋常百姓家。事實(shí)上,以古籍智能助手為代表的人工智能工具還有更長(zhǎng)遠(yuǎn)的價(jià)值——在讓更多讀者親近古籍的同時(shí),為古籍?dāng)?shù)字化工作帶來(lái)了機(jī)遇,“我們所處的新時(shí)代,有可能實(shí)現(xiàn)文化典籍永久保護(hù)和傳承。”業(yè)內(nèi)人士表示。

識(shí)典古籍相關(guān)海報(bào)

讓大模型更會(huì)檢索

在字節(jié)跳動(dòng)看來(lái),古籍智慧助手上線(xiàn)有賴(lài)于近年來(lái)人工智能技術(shù)的爆發(fā)式發(fā)展。

2022年3月,字節(jié)跳動(dòng)向北大教育基金會(huì)提供捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開(kāi)放實(shí)驗(yàn)室”的工作。彼時(shí),字節(jié)跳動(dòng)計(jì)劃研發(fā)古籍?dāng)?shù)字化平臺(tái),利用智能技術(shù)加速中華古籍資源的數(shù)字化建設(shè),向全社會(huì)提供公益化服務(wù)。如今,“識(shí)典古籍”數(shù)字化平臺(tái)已上線(xiàn),免費(fèi)開(kāi)放古籍超過(guò)2900部。目前“識(shí)典古籍”平臺(tái)為方便用戶(hù)的檢索和閱讀,已上線(xiàn)了全文和分類(lèi)檢索、字典、古籍譯文、命名實(shí)體查閱百科等功能。

然而,“識(shí)典古籍”數(shù)字化平臺(tái)研發(fā)團(tuán)隊(duì)發(fā)現(xiàn),雖然平臺(tái)內(nèi)輔助工具繁多,但是用戶(hù)的需求依然沒(méi)有被精準(zhǔn)滿(mǎn)足——“找不到、不會(huì)用”成為用戶(hù)使用古籍閱讀工具時(shí)的一大難關(guān)。

“大模型技術(shù)發(fā)展以后,我們開(kāi)始自然而然地思考,對(duì)于用戶(hù)來(lái)說(shuō),利用人工智能,以對(duì)答的方式和數(shù)字化平臺(tái)進(jìn)行交互,會(huì)不會(huì)是更好的體驗(yàn)?”“識(shí)典古籍”數(shù)字化平臺(tái)產(chǎn)品經(jīng)理汪晴表示,“我們希望為研究和檢索古籍提供便利。”

基于在OCR(文字識(shí)別技術(shù))、自然語(yǔ)言處理、知識(shí)圖譜等技術(shù)領(lǐng)域的積累,以及互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)與研發(fā)優(yōu)勢(shì),研發(fā)團(tuán)隊(duì)很快對(duì)古籍智能助手有了初步的設(shè)想:打造一款能夠幫助用戶(hù)檢索、閱讀,甚至深入挖掘古籍知識(shí)的工具。

然而,古籍智能助手只是一個(gè)具有實(shí)驗(yàn)性的新事物,當(dāng)初的期待想要落地還需要長(zhǎng)久地摸索。研發(fā)團(tuán)隊(duì)首先想到的是利用大模型為用戶(hù)帶來(lái)額外的驚喜。于是,經(jīng)過(guò)了多輪的磨合和探索,字節(jié)跳動(dòng)研發(fā)團(tuán)隊(duì)決定將研發(fā)的重點(diǎn)放在檢索增強(qiáng)生成技術(shù)上。

“識(shí)典古籍”數(shù)字化平臺(tái)產(chǎn)品負(fù)責(zé)人王宇介紹,檢索增強(qiáng)生成技術(shù)是通過(guò)檢索不同資料來(lái)源,獲得所需上下文,來(lái)“增強(qiáng)”大模型生成答案的質(zhì)量。比如從古籍?dāng)?shù)據(jù)庫(kù)里檢索古籍資料,讓獲得的上下文更加相關(guān)。在關(guān)鍵詞檢索之外,研發(fā)團(tuán)隊(duì)還開(kāi)發(fā)了語(yǔ)義檢索,讓智能助手在回答時(shí)能參考到雖然文字不一樣、但含義相關(guān)的相關(guān)古籍段落。

這也讓古籍智能助手和市場(chǎng)中已有的通用大模型形成了差異。“古籍智能助手并不是靠前期訓(xùn)練時(shí)使用的數(shù)據(jù)和知識(shí)進(jìn)行解答,而是實(shí)時(shí)調(diào)動(dòng)較新的專(zhuān)業(yè)數(shù)據(jù)庫(kù),這是通用大模型難以做到的。”汪晴說(shuō),“我們希望古籍智能助手是具備專(zhuān)業(yè)度的。”

增強(qiáng)問(wèn)答準(zhǔn)確性

古籍智能助手的研發(fā)也并非一帆風(fēng)順。對(duì)于字節(jié)跳動(dòng)研發(fā)團(tuán)隊(duì)來(lái)說(shuō),最大的難點(diǎn)莫過(guò)于大模型會(huì)產(chǎn)生錯(cuò)誤和“幻覺(jué)”。

產(chǎn)生“幻覺(jué)”幾乎是大語(yǔ)言模型的“通病”。有學(xué)者曾指出,這種“幻覺(jué)”是指人工智能會(huì)生成貌似合理連貫,但同輸入問(wèn)題意圖不一致、同世界知識(shí)不一致、與現(xiàn)實(shí)或已知數(shù)據(jù)不符合或無(wú)法驗(yàn)證的內(nèi)容。

有專(zhuān)家認(rèn)為,從技術(shù)原理上看,人工智能“幻覺(jué)”多由于人工智能對(duì)知識(shí)的記憶不足、理解能力不足、訓(xùn)練方式固有的弊端及模型本身技術(shù)的局限性導(dǎo)致。而現(xiàn)階段,大模型產(chǎn)生錯(cuò)誤“幻覺(jué)”的情況難以完全消除。

然而,在古籍領(lǐng)域,基于文言文可能出現(xiàn)的閱讀障礙,由大模型產(chǎn)生的錯(cuò)誤和“幻覺(jué)”讓用戶(hù)更加難以分辨。但是即便如此,字節(jié)跳動(dòng)研發(fā)團(tuán)隊(duì)依然希望能盡可能減少“幻覺(jué)”,并讓用戶(hù)在希望追求準(zhǔn)確性的時(shí)候,能夠進(jìn)行查證。

相關(guān)負(fù)責(zé)人表示,為了減少大模型產(chǎn)生的“幻覺(jué)”,團(tuán)隊(duì)付出了巨大的努力:一方面,古籍智能助手使用了檢索增強(qiáng)生成技術(shù),這樣就要求大模型根據(jù)從數(shù)據(jù)庫(kù)和字典中檢索到的、有一定可靠性的資料作答,在一定程度上限制了大模型產(chǎn)生“幻覺(jué)”;另一方面,研發(fā)團(tuán)隊(duì)正在嘗試在生成的答案后附加原文鏈接,這樣對(duì)于寫(xiě)作等場(chǎng)合,用戶(hù)就可以方便地去原文查證并且做出自己的判斷。不僅如此,在古籍智能助手的界面,研發(fā)團(tuán)隊(duì)還設(shè)置了“回答由人工智能生成,請(qǐng)注意查證”的提示詞。

“古籍智能助手的作用是提升查閱古籍的效率。它代替不了專(zhuān)業(yè)的學(xué)術(shù)判斷和閱讀積累,但我們希望它能為使用古籍的人節(jié)約時(shí)間、開(kāi)拓新的思路。”王宇表示。

在減少大模型“幻覺(jué)”的基礎(chǔ)上,古籍智能助手最終還是上線(xiàn)與用戶(hù)見(jiàn)面。在“識(shí)典古籍”數(shù)字化平臺(tái),當(dāng)用戶(hù)選中古籍中的文字并點(diǎn)擊“問(wèn)AI”,或者輸入問(wèn)題時(shí),古籍智能助手首先會(huì)對(duì)用戶(hù)提出的問(wèn)題進(jìn)行意圖判斷,如果回答這個(gè)問(wèn)題需要利用字典中的條目或者古籍?dāng)?shù)據(jù)庫(kù)搜索結(jié)果作為上下文,智能助手會(huì)獲取相關(guān)的上下文,然后通過(guò)大語(yǔ)言模型綜合總結(jié)并給出回復(fù)。

汪晴稱(chēng),古籍智能助手上線(xiàn)幾周后得到了較好的反饋。“很多用戶(hù)通過(guò)智能助手去理解句子含義,幫助用戶(hù)實(shí)現(xiàn)了從‘不懂’到‘懂’的跨越。不僅如此,展示參考引用的功能也受到了用戶(hù)的好評(píng)。雖然目前古籍智能助手還無(wú)法將參考引用完全展示,但依然有用戶(hù)表示對(duì)發(fā)現(xiàn)之前忽略的知識(shí)有幫助。”

讓古老經(jīng)典“活”起來(lái)、傳下去

雖然古籍智能助手已經(jīng)上線(xiàn)運(yùn)行,但是研發(fā)團(tuán)隊(duì)并沒(méi)有停下探索的腳步。汪晴表示,在功能方面,正在計(jì)劃逐步為古籍助手提供更多的工具,比如是否能從百科資料中檢索答案,是否能和一些更加專(zhuān)業(yè)的數(shù)據(jù)庫(kù)進(jìn)行合作。“我們也希望用戶(hù)能夠多使用和反饋,為后續(xù)優(yōu)化提供建議,通過(guò)實(shí)踐和應(yīng)用來(lái)打磨出好的產(chǎn)品。”

在汪晴看來(lái),這種探索為閱讀古籍的用戶(hù)提供了便利,也拉近了公眾和古籍之間的距離,讓經(jīng)典更加觸手可及。“這也是古籍智能助手給‘識(shí)典古籍’數(shù)字化平臺(tái)帶來(lái)的較為突出的價(jià)值。”

業(yè)內(nèi)普遍認(rèn)為,將大模型和人工智能引入古籍保護(hù)領(lǐng)域是時(shí)代帶來(lái)的便利。今年全國(guó)兩會(huì)期間,有委員表示,中國(guó)是全球擁有古籍最多的國(guó)家,國(guó)內(nèi)現(xiàn)存漢文古籍300萬(wàn)部,散落在海外的古籍超過(guò)40萬(wàn)部,已完成數(shù)字化的古籍7.4萬(wàn)部。

可以看到,還有大量的古籍被束之高閣。不僅如此,對(duì)于古籍來(lái)說(shuō),修復(fù)的速度遠(yuǎn)遠(yuǎn)趕不上老化的速度,古籍?dāng)?shù)字化迫在眉睫。

對(duì)此,王宇認(rèn)為,大規(guī)模解決古籍?dāng)?shù)字化的問(wèn)題只能等待技術(shù)進(jìn)步,而近十年,大模型和人工智能的飛速發(fā)展剛好為加速實(shí)現(xiàn)全部古籍?dāng)?shù)字化帶來(lái)了技術(shù)條件。

“如果現(xiàn)存古籍全部數(shù)字化,那么我國(guó)古籍保護(hù)就邁上了一個(gè)新臺(tái)階,古籍滅失的可能性就大幅降低了。這對(duì)于賡續(xù)中華文脈,將是一個(gè)了不起的貢獻(xiàn)。”有學(xué)者表示。 

波多野结衣家庭教师在线播放_熟妇人妻无乱码中文字幕真矢织江_波多野结衣50连登视频_www.av91_亚洲第一中文av_91成人综合网_日韩无套无码精品_日韩欧美猛交xxxxx无码_男人天堂a在线_www.好吊操_日韩伦理在线免费观看_男人的天堂狠狠干
久久亚洲成人| 在线精品福利| 欧美日韩一二三四| 国产丝袜一区| 日韩视频二区| 久久青草久久| 国产欧美一区二区三区米奇| 国产手机视频一区二区| 日韩高清三区| 亚洲欧美日韩视频二区| 日韩中文在线电影| а√天堂8资源在线| 久久av网站| 欧美一区二区三区久久精品| 亚洲综合不卡| 9色国产精品| 国产精品7m凸凹视频分类| 不卡一二三区| 成人精品天堂一区二区三区| 亚洲永久av| 久久精品成人| 理论片午夜视频在线观看| 成人精品视频| 福利一区二区| 91精品国产91久久久久久黑人| sm捆绑调教国产免费网站在线观看| 国产高清精品二区| 里番精品3d一二三区| 精品欧美日韩精品| 日韩一区亚洲二区| 只有精品亚洲| 日韩精品导航| 日韩国产欧美在线视频| 日本中文字幕一区二区视频| 日本免费在线视频不卡一不卡二| 日韩高清在线不卡| 国产日韩免费| 日韩中文首页| 日韩在线观看一区二区| 日本午夜精品久久久久| 国产精品www.| 久久美女性网| 日韩av一二三| 日韩欧美一区免费| 久久www成人_看片免费不卡| 欧美视频一区| 激情中国色综合| 精品欧美久久| 国产日韩欧美一区| 成人午夜国产| 欧美久久久网站| 神马久久午夜| 伊人久久大香伊蕉在人线观看热v| 免费亚洲婷婷| 婷婷综合亚洲| 国产精品免费精品自在线观看| 日产精品一区| 日韩久久99| 亚洲五月婷婷| 里番精品3d一二三区| 六月丁香综合| 日韩精品影视| 免费在线播放第一区高清av| 丝袜美腿亚洲色图| 日韩精品欧美| 国产免费播放一区二区| 久久激情网站| 国产一区二区三区成人欧美日韩在线观看 | 国内在线观看一区二区三区| 不卡视频在线| 欧美二三四区| 99riav1国产精品视频| 国产亚洲精品美女久久| 好吊日精品视频| 国产一区二区三区精品在线观看| 伊人久久亚洲美女图片| 久久亚洲道色| 欧美日韩国产探花| 欧美成人基地 | 在线亚洲免费| 国产高清不卡| 久久av影院| 久久国产三级| 亚洲人www| 亚洲欧美日韩视频二区| 久久精品播放| 久久激情一区| 亚洲特级毛片| 亚洲国内欧美| 99久久99视频只有精品| 久久久久久色| 国产综合激情| 青青国产91久久久久久| 亚洲男人在线| 日韩中文字幕麻豆| 久久福利毛片| 天堂成人国产精品一区| 亚洲一区二区三区四区五区午夜| 天堂av在线| se01亚洲视频 | 国产精品毛片在线| 亚洲视频综合| 99视频一区| 首页国产欧美久久| 伊人精品久久| 国产亚洲精品精品国产亚洲综合| 婷婷五月色综合香五月| 日韩不卡一二三区| 久久国内精品| 久久一区国产| 日韩欧美视频专区| 欧美日韩国产免费观看视频| 中文一区二区| 日韩欧美中文字幕电影| 日韩精品国产欧美| 国产精品观看| 欧美天堂视频| 视频一区欧美日韩| 国产精品日本一区二区不卡视频| 在线人成日本视频| 99视频一区| 国产精品欧美三级在线观看| 毛片不卡一区二区| 国产精品美女| 国产高清不卡| 青青久久av| 亚洲欧美日韩视频二区| 91精品国产自产精品男人的天堂 | 亚洲涩涩在线| 久久国产成人| 激情综合五月| 中文在线不卡| 久久三级毛片| 一本色道久久精品| 国产高清日韩| 激情91久久| 久久精品女人| 美美哒免费高清在线观看视频一区二区 | 国产成人精品亚洲线观看| 久久精品国产99久久| 欧美一区精品| 欧美亚洲国产激情| 美女精品久久| 亚洲理论在线| 日韩av免费| 日本精品国产| 神马日本精品| 欧美国产三级| 日本欧洲一区二区| 日韩精品诱惑一区?区三区| 亚洲久草在线| 国产一区久久| 福利一区二区三区视频在线观看| 久久午夜视频| 国产99亚洲| 高清日韩欧美| 国产精品久久国产愉拍| 人人精品人人爱| 黄色日韩精品| 欧美日韩中文字幕一区二区三区| 久久国产三级| 欧美另类中文字幕| 日日夜夜免费精品| 亚洲在线电影| 红桃视频国产一区| 久久亚洲精品中文字幕蜜潮电影| 高清一区二区| 精品免费视频| 麻豆一区二区99久久久久| 日韩激情一二三区| 日韩视频一二区| 日本成人中文字幕| 日韩国产一二三区| 91精品国产自产在线丝袜啪| 蜜臀av亚洲一区中文字幕| 视频福利一区| 日韩欧美字幕| 麻豆精品蜜桃| 九九久久婷婷| 日韩精品一二区| 天海翼亚洲一区二区三区| 一区二区国产精品| 婷婷综合成人| 青草av.久久免费一区| 国产午夜一区| 免费视频一区二区三区在线观看| 精品精品99| 国产精品多人| 欧美黄页在线免费观看| 麻豆精品一区二区综合av| 国产伦一区二区三区| 国产精品色在线网站| 久久久久久自在自线| av免费不卡国产观看| 久久影视一区| 日韩中文字幕亚洲一区二区va在线 | 国产日韩欧美三区| 高清不卡一区| 美女久久久久| 亚洲少妇一区|