<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 科技新聞機(jī)器人亮相,人工智能還能為科學(xué)交流做些什么

          科技新聞機(jī)器人亮相,人工智能還能為科學(xué)交流做些什么

          作者: 時(shí)間:2019-08-16 來(lái)源:科技日?qǐng)?bào) 收藏

          近日,一款看起來(lái)挺有文化的上線了。它叫,由中國(guó)科學(xué)報(bào)社和北京大學(xué)科研團(tuán)隊(duì)共同研發(fā)。

          本文引用地址:http://www.ex-cimer.com/article/201908/403811.htm

          寫(xiě)的不是普通的稿子,而是中文科學(xué)新聞。據(jù)中國(guó)科學(xué)報(bào)副總編輯、項(xiàng)目負(fù)責(zé)人張明偉介紹,以論文英文摘要為基礎(chǔ),能夠快速寫(xiě)出中文科學(xué)新聞底稿,然后由專(zhuān)業(yè)人士和報(bào)社的編輯進(jìn)行把關(guān)和信息完善,幫助科學(xué)家以中文方式快速獲取全球高水平英文論文中的最新科研進(jìn)展。

          小柯的作品已經(jīng)上線。的觸角,也在伸向各個(gè)領(lǐng)域。

          小柯:一個(gè)盡職的摘要翻譯轉(zhuǎn)寫(xiě)者

          記者發(fā)現(xiàn),7月5日,小柯機(jī)器人發(fā)出第一篇稿子,截止至8月14日記者統(tǒng)計(jì)時(shí),小柯機(jī)器人共發(fā)稿350篇。初期更新時(shí)間距論文發(fā)表時(shí)間間隔一個(gè)月左右,現(xiàn)在可以做到當(dāng)天或隔天更新,每天更新幾到二十幾篇左右不等。所選論文來(lái)自生命科學(xué)等領(lǐng)域,涉及《自然》《細(xì)胞》《新英格蘭醫(yī)學(xué)雜志》等期刊。

          記者對(duì)照分析了小柯作品《單細(xì)胞測(cè)序揭示冠狀動(dòng)脈疾病保護(hù)機(jī)制》及其英文原文。新聞中,小柯先對(duì)論文主題、研究單位以及發(fā)表期刊進(jìn)行簡(jiǎn)單介紹,后接英文原文摘要的翻譯,大致反映原文內(nèi)容;翻譯時(shí)會(huì)對(duì)原文進(jìn)行適當(dāng)?shù)恼Z(yǔ)句簡(jiǎn)化,同時(shí)在對(duì)專(zhuān)業(yè)詞語(yǔ)的翻譯上也使用了如“血管平滑肌細(xì)胞”“保護(hù)性纖維帽”等專(zhuān)業(yè)表述。

          不過(guò),這也不全是小柯的功勞,因?yàn)楦寮l(fā)出前,還有人工審校這一步驟。北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬(wàn)小軍團(tuán)隊(duì)負(fù)責(zé)小柯的系統(tǒng)總體設(shè)計(jì)與聯(lián)合技術(shù)攻關(guān)。 他告訴記者,目前機(jī)器翻譯系統(tǒng)的性能很大程度上依賴于其所使用的訓(xùn)練數(shù)據(jù),即平行語(yǔ)料。目前的平行語(yǔ)料多為新聞?wù)Z料,因此訓(xùn)練得到的機(jī)器翻譯模型對(duì)于日常新聞的翻譯效果較好。但學(xué)術(shù)文獻(xiàn)(比如生物學(xué)術(shù)論文)與日常新聞在用詞造句等方面都有較大差別,機(jī)器翻譯系統(tǒng)對(duì)于學(xué)術(shù)文獻(xiàn)翻譯的效果并不理想。

          這一次,他們通過(guò)融合領(lǐng)域知識(shí)進(jìn)行語(yǔ)句智能篩選,選擇適合大眾理解的語(yǔ)句,并基于語(yǔ)句簡(jiǎn)化提升語(yǔ)句翻譯質(zhì)量?!坝⑽膶W(xué)術(shù)論文摘要適合專(zhuān)業(yè)科研人員閱讀,但摘要中的語(yǔ)句并不都適合寫(xiě)到科學(xué)新聞中面向大眾傳播,因此需要結(jié)合科學(xué)報(bào)編輯提供的先驗(yàn)知識(shí),采用計(jì)算機(jī)算法對(duì)語(yǔ)句進(jìn)行篩選,保留適合進(jìn)行大眾新聞傳播的語(yǔ)句?!比f(wàn)小軍說(shuō)。

          涉及到語(yǔ)言和文字的地方,自然語(yǔ)言處理都能發(fā)揮作用

          研發(fā)小柯用了半年時(shí)間,萬(wàn)小軍表示,和一般相比,一個(gè)好的跨語(yǔ)言科技新聞需要進(jìn)行兩次重要的信息轉(zhuǎn)換過(guò)程:一次是不同語(yǔ)言的轉(zhuǎn)換,將英文文本轉(zhuǎn)換為中文文本;另一次是語(yǔ)言風(fēng)格的轉(zhuǎn)換,將學(xué)術(shù)型文字表達(dá)轉(zhuǎn)換為大眾能夠接受的通俗文字表達(dá)?!斑@兩次轉(zhuǎn)換都具有較大的挑戰(zhàn)性,目前并沒(méi)有完全解決。后續(xù)還需要進(jìn)一步積累數(shù)據(jù),調(diào)整算法模型,才能取得更好的效果?!?/p>

          接下來(lái),團(tuán)隊(duì)還將繼續(xù)優(yōu)化小柯,讓他寫(xiě)出的科學(xué)新聞內(nèi)容更豐富,表達(dá)更生動(dòng)。

          當(dāng)然,翻譯撰寫(xiě)科技新聞稿件,只是自然語(yǔ)言處理等技術(shù)在學(xué)術(shù)交流中所能大顯身手的領(lǐng)域之一。

           “基本上,只要人類(lèi)交流和工作過(guò)程中涉及到語(yǔ)言和文字的地方,自然語(yǔ)言處理技術(shù)都有可能發(fā)揮作用?!比f(wàn)小軍說(shuō),在科研論文寫(xiě)作過(guò)程中,可以借助自然語(yǔ)言處理技術(shù)幫助推薦參考文獻(xiàn),并自動(dòng)生成related work等章節(jié)的文字;業(yè)界也有工作嘗試基于自然語(yǔ)言處理技術(shù)自動(dòng)編撰圖書(shū)?!拔覀€(gè)人也接觸到很多很有意思也很有挑戰(zhàn)的應(yīng)用需求,但可惜的是不少需求都無(wú)法基于目前的自然語(yǔ)言處理技術(shù)進(jìn)行實(shí)現(xiàn)。自然語(yǔ)言處理技術(shù)還需要進(jìn)一步的發(fā)展和突破,我相信在未來(lái)將有更多的用武之地?!?nbsp;



          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();