8月15日,由上海世紀(jì)出版集團(tuán)規(guī)劃設(shè)計(jì)、上海辭書(shū)出版社研發(fā)運(yùn)營(yíng)的聚典數(shù)據(jù)開(kāi)放平臺(tái)在滬發(fā)布2.0版。聚典數(shù)據(jù)開(kāi)放平臺(tái)是一款基于傳統(tǒng)工具書(shū)的創(chuàng)新型互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)產(chǎn)品,整合《漢語(yǔ)大詞典》《大辭?!贰队h大詞典》等權(quán)威工具書(shū)內(nèi)容,為數(shù)字閱讀中的知識(shí)查檢需求提供有效解決方案。
自2020年8月正式運(yùn)行以來(lái),聚典數(shù)據(jù)開(kāi)放平臺(tái)已經(jīng)匯聚了近200種優(yōu)質(zhì)工具書(shū)、430多萬(wàn)個(gè)詞條、近7億字的數(shù)據(jù)內(nèi)容,成為我國(guó)目前庫(kù)藏詞條量最大、覆蓋學(xué)科較為完備、服務(wù)場(chǎng)景廣泛的工具書(shū)數(shù)據(jù)開(kāi)放平臺(tái)。
聚典數(shù)據(jù)開(kāi)放平臺(tái)已與學(xué)習(xí)強(qiáng)國(guó)、微信讀書(shū)、百度百科、掌閱、起點(diǎn)讀書(shū)等40多個(gè)應(yīng)用開(kāi)展了深度合作,累計(jì)為4000多萬(wàn)用戶(hù)提供了超過(guò)10億次的知識(shí)查檢服務(wù),其中海外用戶(hù)500多萬(wàn)。其“開(kāi)放、賦能”的數(shù)據(jù)服務(wù)模式受到上下游企業(yè)的廣泛認(rèn)可,先后入選全國(guó)新聞出版深度融合發(fā)展創(chuàng)新案例、國(guó)家新聞出版署數(shù)字出版優(yōu)質(zhì)平臺(tái)遴選計(jì)劃。
2.0版多方面升級(jí)迭代
發(fā)布會(huì)上,上海辭書(shū)出版社黨委書(shū)記、社長(zhǎng)秦志華對(duì)聚典數(shù)據(jù)開(kāi)放平臺(tái)2.0版的迭代升級(jí)情況作了介紹。
秦志華介紹典數(shù)據(jù)開(kāi)放平臺(tái)2.0版情況
秦志華首先回顧了聚典數(shù)據(jù)開(kāi)放平臺(tái)3年來(lái)的發(fā)展歷程。在內(nèi)容建設(shè)方面,“聚典平臺(tái)”以《漢語(yǔ)大詞典》《現(xiàn)代漢語(yǔ)大詞典》為漢語(yǔ)字詞知識(shí)基礎(chǔ)、以《辭海》《大辭?!窞榘倏浦R(shí)基礎(chǔ),逐步拓展到《哲學(xué)大辭典》《教育大辭典》《心理學(xué)大辭典》《中藥大辭典》等各學(xué)科領(lǐng)域?qū)I(yè)性工具書(shū),和《英漢大詞典》《漢英大詞典》等雙語(yǔ)工具書(shū),并進(jìn)一步擴(kuò)充了《中國(guó)古今地名對(duì)照大詞典》《中國(guó)歷史紀(jì)年表》等專(zhuān)題知識(shí)數(shù)據(jù)。詞條數(shù)量也從初步搭建時(shí)的37萬(wàn)個(gè)詞條到現(xiàn)在的430余萬(wàn)個(gè),基本覆蓋了古今中外的通用知識(shí),并構(gòu)建了云端工具書(shū)數(shù)據(jù)倉(cāng)庫(kù),一站式數(shù)據(jù)服務(wù)體系基本實(shí)現(xiàn)。在這樣的前提下,聚典平臺(tái)的應(yīng)用場(chǎng)景快速拓展,用戶(hù)數(shù)量也不斷提升。
“查檢更有效、體驗(yàn)更友好、服務(wù)更智能、對(duì)接更順暢?!?秦志華用20個(gè)字概括聚典數(shù)據(jù)開(kāi)放平臺(tái)此次迭代升級(jí)的原因。
聚典作為鏈接上下游的內(nèi)容聚合中臺(tái),既會(huì)接收到來(lái)自上游出版社提供的海量?jī)?nèi)容數(shù)據(jù),也會(huì)接收到來(lái)自下游合作方做出的各項(xiàng)反饋。如何讓合作方更便捷地接入聚典平臺(tái),如何讓用戶(hù)更快地選中待查字詞,如何識(shí)別到用戶(hù)的切詞缺漏,如何為用戶(hù)提供智能推薦等,都成為平臺(tái)亟待解決的問(wèn)題。
新發(fā)布的聚典數(shù)據(jù)開(kāi)放平臺(tái)2.0版運(yùn)用最新的人工智能技術(shù),對(duì)430多萬(wàn)條工具書(shū)數(shù)據(jù)進(jìn)行系統(tǒng)梳理和重組,從內(nèi)容端大幅擴(kuò)充詞條數(shù)量;梳理用戶(hù)行為,應(yīng)用智能技術(shù),實(shí)現(xiàn)查檢詞條與庫(kù)藏知識(shí)的智能關(guān)聯(lián),自動(dòng)識(shí)別取詞差錯(cuò)并更正推送;完善自動(dòng)化對(duì)接流程,從初期的API調(diào)用到SDK包,再到如今加入智能推薦,實(shí)現(xiàn)數(shù)據(jù)分發(fā)的技術(shù)升級(jí)。
秦志華舉例,在使用聚典數(shù)據(jù)開(kāi)放平臺(tái)搜索“朱元璋”這個(gè)詞條時(shí),搜索結(jié)果和字典上相同,顯示“即‘明太祖’”,用戶(hù)還需進(jìn)一步搜索“明太祖”才能得到詳細(xì)釋義。通過(guò)平臺(tái)的優(yōu)化,如今用2.0版搜索這個(gè)詞條,會(huì)在“即‘明太祖’”的基礎(chǔ)上,提供明太祖的釋義,有效解決了傳統(tǒng)系統(tǒng)帶來(lái)的問(wèn)題。
義項(xiàng)過(guò)濾和增補(bǔ)也是2.0版進(jìn)行的重要調(diào)整。聚典平臺(tái)已整合了近200種工具書(shū),不同詞典會(huì)收錄同名詞條,2.0版通過(guò)AI技術(shù)分析平臺(tái)中同名詞條的釋義,如義項(xiàng)內(nèi)容一致,就挑選最權(quán)威、最全面的一條內(nèi)容給到用戶(hù);如不一致,就會(huì)增補(bǔ)不同義項(xiàng),將每個(gè)詞條的義項(xiàng)盡可能全部匯總起來(lái)提供給用戶(hù)。例如,“首都”一詞,6本詞典都與《辭?!返摹笆锥肌贬屃x一致,都是指一個(gè)國(guó)家最高行政機(jī)關(guān)所在地,而《第二次世界大戰(zhàn)百科詞典》中的“首都”則是指盟軍反攻緬甸的作戰(zhàn)計(jì)劃之一。這樣就形成關(guān)于“首都”的兩個(gè)義項(xiàng)推送給用戶(hù)。
秦志華表示,2.0版進(jìn)一步提升用戶(hù)體驗(yàn)、提升查得率、拓展數(shù)據(jù)類(lèi)型、提升對(duì)接效率,更好地滿(mǎn)足了各類(lèi)數(shù)字閱讀場(chǎng)景下的知識(shí)查檢需求。
大幅提高讀者網(wǎng)絡(luò)閱讀體驗(yàn)
發(fā)布會(huì)上,起點(diǎn)讀書(shū)、得到電子書(shū)、七貓小說(shuō)等運(yùn)營(yíng)方代表分享了與聚典數(shù)據(jù)開(kāi)放平臺(tái)合作的實(shí)際案例。
閱文集團(tuán)起點(diǎn)讀書(shū)總經(jīng)理梅仁杰介紹,起點(diǎn)讀書(shū)中的作者,不少是對(duì)中國(guó)傳統(tǒng)文化有深刻研究的白金大神作家,他們的小說(shuō)中難免會(huì)出現(xiàn)一些生僻字,在不影響閱讀體驗(yàn)的情況下便利地查詢(xún)?cè)~意,對(duì)讀者十分重要。
梅仁杰發(fā)言中
“起點(diǎn)讀書(shū)接入了聚典的服務(wù)后,實(shí)現(xiàn)了‘屏幕取詞,釋義立現(xiàn)’,還能雙語(yǔ)互譯、古今對(duì)照,這樣讀者可以在不打斷閱讀體驗(yàn)的同時(shí),即刻獲知精確的釋義,感受到作者的用詞精妙,更暢快淋漓的體會(huì)到閱讀的樂(lè)趣?!?/p>
梅仁杰舉例,近期起點(diǎn)讀書(shū)一本出圈作品《道詭異仙》融合了很多傳統(tǒng)文化中的民俗怪談、奇聞異志,因此經(jīng)常會(huì)出現(xiàn)一些俚語(yǔ)方言與來(lái)自古文化、古民俗中的生僻字,這些生僻字查詢(xún)比例都很高,“比如‘巴虺’(huǐ),意思為巴蛇,是《山海經(jīng)》中記載的中國(guó)古代神話傳說(shuō)中的巨蛇。這個(gè)‘虺’字用戶(hù)的查詢(xún)次數(shù)就接近2萬(wàn)次?!畠畱颉╪uó)的‘儺’也被查詢(xún)了1萬(wàn)多次。很多用戶(hù)也紛紛在章段評(píng)中分享,‘看小說(shuō)學(xué)語(yǔ)文,讀網(wǎng)文識(shí)漢字’,氛圍非常熱鬧。”
得到電子書(shū)2022年5月正式和聚典數(shù)據(jù)開(kāi)放平臺(tái)合作,為用戶(hù)提供閱讀過(guò)程中的中英文字詞查詢(xún)服務(wù)。
張璐莎發(fā)言中
電子書(shū)負(fù)責(zé)人張璐莎表示,此前得到電子書(shū)也與搜索平臺(tái)合作,提供簡(jiǎn)單的詞典服務(wù),但信息來(lái)源于網(wǎng)絡(luò),全面性和準(zhǔn)確度都不高。他們尋求專(zhuān)業(yè)詞類(lèi)工具書(shū)主辦方合作,又存在成本高、推進(jìn)過(guò)程漫長(zhǎng)的問(wèn)題。
“聚典正好能提供我們需要的服務(wù),這個(gè)平臺(tái)收錄了《辭海》《漢語(yǔ)大詞典》《英漢大詞典》等多種工具書(shū),內(nèi)容豐富、可靠,技術(shù)實(shí)現(xiàn)上也很方便,可以直接提供接口調(diào)用。收費(fèi)標(biāo)準(zhǔn)也很友好?!?nbsp;張璐莎說(shuō)。
如今聚典平臺(tái)成為得到用戶(hù)閱讀的重要工具?!昂蠡谶@么晚才發(fā)現(xiàn)這個(gè)功能?!庇脩?hù)張閑經(jīng)喜歡歷史文物與考古,過(guò)去遇到生僻字需要復(fù)制下來(lái)去百度搜索,如今,“直接電子書(shū)里選定字詞然后使用詞典功能,讀音詞意就出來(lái)了”。用戶(hù)“巧克力”也在看完一本英文版《哈利·波特》后發(fā)表評(píng)論,說(shuō)這是自己“平生第一次認(rèn)認(rèn)真真看一本英文書(shū)”,“詞典功能真的很喜歡,省去了手翻字典或者打單詞的環(huán)節(jié)。”
鄒芹發(fā)言中
“七貓小說(shuō)”是一個(gè)免費(fèi)閱讀網(wǎng)文的平臺(tái)。上海七貓文化傳媒有限公司公共事務(wù)經(jīng)理鄒芹分享,平臺(tái)上傳統(tǒng)文化背景的小說(shuō)很多,也有一批忠實(shí)閱讀者,“傳統(tǒng)文化通常包含大量的知識(shí)、價(jià)值觀和傳統(tǒng)習(xí)俗,數(shù)字詞典檢索提供了一個(gè)方便的途徑,使人們能夠輕松地訪問(wèn)和學(xué)習(xí)傳統(tǒng)文化的內(nèi)容;里面提供詳細(xì)的、權(quán)威的解釋、定義和例句,能夠幫助人們更好地理解傳統(tǒng)文化的含義和背景,加深人們對(duì)傳統(tǒng)文化的認(rèn)識(shí)?!?/p>
七貓?jiān)?022年接入聚典數(shù)據(jù)開(kāi)放平臺(tái)至今,為閱讀用戶(hù)提供了近2000萬(wàn)次查詢(xún)服務(wù),平均每天有10萬(wàn)+的用戶(hù)有查詞典的需求,“讀者可以即查即用,釋義直接在閱讀頁(yè)面顯示,不需要跳轉(zhuǎn)別的應(yīng)用,極大滿(mǎn)足用戶(hù)對(duì)知識(shí)查驗(yàn)的需求、也提升了讀者的數(shù)字閱讀體驗(yàn)。”
發(fā)布會(huì)上,上海世紀(jì)出版集團(tuán)黨委書(shū)記、董事長(zhǎng)黃強(qiáng)等為聚典數(shù)據(jù)開(kāi)放平臺(tái)的優(yōu)秀合作伙伴頒獎(jiǎng),上海辭書(shū)出版社與全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)、中國(guó)新聞出版?zhèn)髅郊瘓F(tuán)等簽訂合作協(xié)議。
毛文濤發(fā)言中
上海世紀(jì)出版集團(tuán)黨委委員、副總裁毛文濤作會(huì)議總結(jié)時(shí)表示,上海世紀(jì)出版集團(tuán)將繼續(xù)大力推進(jìn)聚典數(shù)據(jù)開(kāi)放平臺(tái)創(chuàng)新發(fā)展,使聚典繼續(xù)堅(jiān)守“數(shù)據(jù)服務(wù)”的產(chǎn)品定位、堅(jiān)持“為閱讀賦能、為學(xué)習(xí)賦能、為搜索賦能”的使命追求,不斷拓展應(yīng)用場(chǎng)景、創(chuàng)新應(yīng)用模式,朝著“成為數(shù)字時(shí)代的文化基礎(chǔ)設(shè)施”努力奮斗。