<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > Facebook宣布全面轉(zhuǎn)為神經(jīng)網(wǎng)絡(luò)人工智能翻譯

Facebook宣布全面轉(zhuǎn)為神經(jīng)網(wǎng)絡(luò)人工智能翻譯

作者：時(shí)間：2017-08-08 來源：雷鋒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　語言翻譯是一股能夠讓人們組建群體和使世界更加緊密的力量。它可以幫助人們與在海外居住的家庭成員聯(lián)系起來，或者可以更好地了解講不同語言的人們的觀點(diǎn)。通過使用機(jī)器翻譯，自動(dòng)翻譯文章和評論，以打破語言障礙，使得世界各地的人們可以相互溝通。

本文引用地址：http://www.ex-cimer.com/article/201708/362718.htm

　　

　　即便體量大如Facebook，想要為20億使用的用戶創(chuàng)造無縫、高精確的翻譯體驗(yàn)也是很困難的，這需要同時(shí)考慮上下文、俚語、打字錯(cuò)誤、縮寫和語意。為了繼續(xù)提高翻譯質(zhì)量，Facebook團(tuán)隊(duì)最近宣布從基于短語的機(jī)器翻譯模型切換到基于神經(jīng)網(wǎng)絡(luò)的翻譯模型，來支持所有的后端翻譯系統(tǒng)。每個(gè)翻譯系統(tǒng)每天翻譯超過2000個(gè)翻譯方向和45億個(gè)翻譯。這些新模型能夠提供更準(zhǔn)確和更流暢的翻譯體驗(yàn)，改善了人們在使用Facebook時(shí)，閱讀由非常用語言撰寫的內(nèi)容時(shí)的閱讀體驗(yàn)。雷鋒網(wǎng)(公眾號：雷鋒網(wǎng))AI科技評論根據(jù)Facebook文章對相關(guān)情況編譯介紹如下。

　　使用上下文

　　Facebook以前使用的基于短語的統(tǒng)計(jì)技術(shù)確實(shí)有效，但它們也有局限性?；诙陶Z的翻譯系統(tǒng)的一個(gè)主要缺點(diǎn)是它們將句子分解成單個(gè)單詞或短語，因此在生成翻譯時(shí)，他們每次只能考慮幾個(gè)單詞。這種方法導(dǎo)致當(dāng)翻譯具有明顯不同字詞排序的語言時(shí)會(huì)出現(xiàn)翻譯困難的情況。為了彌補(bǔ)這個(gè)問題并構(gòu)建神經(jīng)網(wǎng)絡(luò)系統(tǒng)，F(xiàn)acebook開始使用一種被稱為序列到序列LSTM(longshort-termmemory)的循環(huán)神經(jīng)網(wǎng)絡(luò)。這種網(wǎng)絡(luò)可以考慮源語句的整個(gè)上下文以及到目前為止生成的一切內(nèi)容，以創(chuàng)建更準(zhǔn)確和流暢的翻譯。這樣當(dāng)遇到例如在英語和土耳其語之間翻譯字詞排列不同時(shí)，可以重新排序。當(dāng)采用基于短語的翻譯模型從土耳其語翻譯到英語時(shí)，獲得以下翻譯：

　　

　　與基于神經(jīng)網(wǎng)絡(luò)的從土耳其語到英語的翻譯相比較：

　　

　　當(dāng)使用新系統(tǒng)時(shí)，與基于短語的系統(tǒng)相比，BLEU平均相對增長了11%-BLEU是廣泛使用的用于判斷所有語言的機(jī)器翻譯準(zhǔn)確性的度量標(biāo)準(zhǔn)。

　　處理未知詞

　　在許多情況下，源語句中的單詞在目標(biāo)詞匯表中并沒有直接對應(yīng)的翻譯。當(dāng)發(fā)生這種情況時(shí)，神經(jīng)系統(tǒng)將為未知詞生成占位符。在這種情況下，可以利用注意機(jī)制在源詞和目標(biāo)詞之間產(chǎn)生的軟校準(zhǔn)，以便將原始的源詞傳遞到目標(biāo)句子。然后，從培訓(xùn)數(shù)據(jù)中構(gòu)建的雙語詞典中查找該詞的翻譯，并替換目標(biāo)語句中的未知詞。這種方法比使用傳統(tǒng)字典更加強(qiáng)大，特別是對于嘈雜的輸入。例如，在從英語到西班牙語的翻譯中，可以將“tmrw”(明天)翻譯成“ma?ana”。雖然增加了一個(gè)詞典，BLEU得分只有小幅的改善，但是對于使用Facebook的人而言評分更高了?！　≡~匯量減少

　　典型的神經(jīng)機(jī)器翻譯模型會(huì)計(jì)算目標(biāo)詞匯中所有單詞的概率分布。在這個(gè)分布中包含的字?jǐn)?shù)越多，計(jì)算所用的時(shí)間越多。通過使用一種稱為詞匯減少的建模技術(shù)，可以在訓(xùn)練和推理時(shí)間上彌補(bǔ)這個(gè)問題。通過詞匯減少，可以將目標(biāo)詞匯中最常出現(xiàn)的單詞與給定句子的單個(gè)單詞的一組翻譯候選相結(jié)合，以減少目標(biāo)詞匯的大小。過濾目標(biāo)詞匯會(huì)減少輸出投影層的大小，這有助于更快的計(jì)算，而且不會(huì)使過大的降低質(zhì)量。

　　調(diào)整模型參數(shù)

　　神經(jīng)網(wǎng)絡(luò)幾乎通常具有可調(diào)參數(shù)，可以通過這些參數(shù)調(diào)節(jié)和控制模型的學(xué)習(xí)速度。選擇超參數(shù)的最佳集合對于性能是非常有幫助的。然而，這對于大規(guī)模的機(jī)器翻譯提出了重大的挑戰(zhàn)，因?yàn)槊總€(gè)翻譯方向是由其自己的一組超參數(shù)的唯一模型表示。由于每個(gè)模型的最優(yōu)值可能不同，因此必須分別對每個(gè)系統(tǒng)進(jìn)行調(diào)整。Facebook團(tuán)隊(duì)在數(shù)月內(nèi)進(jìn)行了數(shù)千次端對端翻譯實(shí)驗(yàn)，利用FBLearnerFlow平臺(tái)對超參數(shù)進(jìn)行微調(diào)，如學(xué)習(xí)率，注意力類型和總體大小。這些超參數(shù)對一些系統(tǒng)有重大影響。例如，僅基于調(diào)優(yōu)模型超參數(shù)，就可以看到從英語到西班牙語系統(tǒng)的BLEU相對值提高了3.7%。

　　用Caffe2縮放神經(jīng)機(jī)器翻譯

　　過渡到神經(jīng)系統(tǒng)的挑戰(zhàn)之一是讓模型以Facebook上的信息規(guī)模所需的速度和效率運(yùn)行。因此Facebook團(tuán)隊(duì)在深入學(xué)習(xí)框架Caffe2中實(shí)現(xiàn)了翻譯系統(tǒng)。由于它的靈活性，因此能夠在GPU和CPU平臺(tái)上進(jìn)行訓(xùn)練和推理，來調(diào)整翻譯模型的性能。

　　關(guān)于培訓(xùn)，該團(tuán)隊(duì)實(shí)施了內(nèi)存優(yōu)化，如blob回收和blob重新計(jì)算，這有助于更大批量的培訓(xùn)，并更快地完成培訓(xùn)。關(guān)于推理，該團(tuán)隊(duì)使用專門的向量數(shù)學(xué)庫和權(quán)重量化來提高計(jì)算效率?，F(xiàn)有模式的早期基準(zhǔn)表明，支持2000多個(gè)翻譯方向的計(jì)算資源將會(huì)非常高。然而，Caffe2的靈活性和該團(tuán)隊(duì)使用的優(yōu)化模型使計(jì)算提高了2.5倍的效率，因而能夠?qū)⑸窠?jīng)機(jī)器翻譯模型應(yīng)用到實(shí)際中去。

　　該團(tuán)隊(duì)還遵循在機(jī)器翻譯中常用的在解碼時(shí)使用波束搜索的做法，以根據(jù)模型改進(jìn)對最可能輸出的句子的估計(jì)。利用Caffe2中的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)抽象的一般性來實(shí)現(xiàn)波束搜索，直接作為單個(gè)前向網(wǎng)絡(luò)計(jì)算，這樣就實(shí)現(xiàn)了快速有效的推理。

　　在這項(xiàng)工作的過程中，該團(tuán)隊(duì)還開發(fā)了RNN構(gòu)建塊，如LSTM，乘法集成LSTM和注意。這項(xiàng)技術(shù)將作為Caffe2的一部分分享出來，并為研究和開源社區(qū)提供學(xué)習(xí)素材。

　　正在進(jìn)行的工作

　　Facebook人工智能研究(FAIR)團(tuán)隊(duì)最近發(fā)表了使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行機(jī)器翻譯的研究。Facebook代碼團(tuán)隊(duì)與FAIR密切合作，在不到三個(gè)月的時(shí)間里，完成了將這項(xiàng)技術(shù)從研究到首次投入生產(chǎn)系統(tǒng)中使用的流程。他們推出了從英文到法文和從英文到德文翻譯的CNN模型，與以前的系統(tǒng)相比，BLEU的質(zhì)量提升分別提高了12.0%(+4.3)和14.4%(+3.4)。這些質(zhì)量改進(jìn)讓該團(tuán)隊(duì)看到CNN將成為一個(gè)令人興奮的新發(fā)展道路，后面他們還將將繼續(xù)努力，利用CNN推出更多的翻譯系統(tǒng)。

　　目前機(jī)器翻譯剛剛開始使用更多的翻譯語境。神經(jīng)網(wǎng)絡(luò)開辟了許多與添加更多上下文相關(guān)的發(fā)展方向，以創(chuàng)建更好的翻譯，例如伴隨文章文本的照片。

　　該團(tuán)隊(duì)也開始同時(shí)探索可以翻譯許多不同語言方向的多語種模式。這將有助于解決與特定語言對相關(guān)的每個(gè)系統(tǒng)的微調(diào)的挑戰(zhàn)，并且還可以通過共享培訓(xùn)數(shù)據(jù)為某些翻譯方向帶來質(zhì)量提高。

　　對Facebook而言，完成從短語到神經(jīng)機(jī)器翻譯的過渡，是一個(gè)里程碑，代表了為所有人提供他們常用語言下的更優(yōu)質(zhì)的Facebook體驗(yàn)。他們還將繼續(xù)推進(jìn)神經(jīng)機(jī)器翻譯技術(shù)，目的是為Facebook上的每個(gè)人提供人性化的翻譯。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Facebook 神經(jīng)網(wǎng)絡(luò)

評論

相關(guān)推薦

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

sasa541867 | 2007-09-02

冗余度TT-VGT機(jī)器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制

設(shè)計(jì)方案冗余 TT-VGT 機(jī)器人的神經(jīng)網(wǎng)絡(luò) 適應(yīng) 控制 | 2009-09-04

從NN神經(jīng)網(wǎng)絡(luò)理解隱空間

智能計(jì)算 202303 神經(jīng)網(wǎng)絡(luò) 隱空間 AIGC | 2023-03-24

基于神經(jīng)網(wǎng)絡(luò)的配料系統(tǒng)PID控制器

資源下載 PID PID控制器神經(jīng)網(wǎng)絡(luò) 配料系統(tǒng) | 2007-12-28

別再用VGG了！一文帶你看透 RepVGG怎么重鑄VGG榮光

智能計(jì)算 VGG 神經(jīng)網(wǎng)絡(luò) 人工智能 RepVGG | 2024-04-25

蘋果M4系列芯片將在今年年底推出，增加神經(jīng)網(wǎng)絡(luò)引擎核心

手機(jī)與無線通信蘋果 M4 芯片神經(jīng)網(wǎng)絡(luò) AI | 2024-04-16

基于神經(jīng)網(wǎng)絡(luò)PID控制的柔性微機(jī)器人系統(tǒng)

資源下載 PID PID控制神經(jīng)網(wǎng)絡(luò) 機(jī)器人系統(tǒng) | 2007-12-28

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

設(shè)計(jì)方案一種基于人工神經(jīng)網(wǎng)絡(luò) 遙感圖像條帶方法 | 2009-09-03

基于改進(jìn)的神經(jīng)網(wǎng)絡(luò)油田配電網(wǎng)諧波預(yù)測研究

設(shè)計(jì)方案神經(jīng)網(wǎng)絡(luò) 配電網(wǎng) | 2016-02-26

8成消費(fèi)者購物季將撒更多錢

消費(fèi)電子 Meta Facebook | 2022-09-19

特斯拉FSD能否打破自動(dòng)駕駛的默認(rèn)偏見？

汽車電子 202406 特斯拉 FSD 自動(dòng)駕駛 ADAS 神經(jīng)網(wǎng)絡(luò) | 2024-05-23

適用于手語采集與輸入的智能手套及翻譯系統(tǒng)

202308 手勢識別 ESP32 彎曲傳感器 SVM 神經(jīng)網(wǎng)絡(luò) | 2023-08-24

一種基于人工神經(jīng)網(wǎng)絡(luò)的遙感圖像去條帶方法

sasa541867 | 2007-09-08

智能控制理論與方法

資源下載智能控制模糊控制神經(jīng)網(wǎng)絡(luò) | 2007-02-09

焦?fàn)t集氣管壓力模糊神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)

設(shè)計(jì)方案焦?fàn)t 氣管壓力模糊神經(jīng)網(wǎng)絡(luò) 控制系統(tǒng) | 2009-09-04

愚人節(jié)十大惡搞網(wǎng)站出爐 Facebook勉強(qiáng)進(jìn)前十

wxy_88kl | 2008-04-01

Nvidia 征服了最新的 AI 測試

智能計(jì)算 GPU 神經(jīng)網(wǎng)絡(luò) LLM MLPerf 基準(zhǔn)測試英偉達(dá) | 2024-06-26

谷歌行政總廚跳槽Facebook

wxy_88kl | 2008-04-08

米爾入門級i.MX6UL開發(fā)板的神經(jīng)網(wǎng)絡(luò)框架ncnn移植與測試

智能計(jì)算米爾 i.MX6UL 開發(fā)板 ncnn移植嵌入式神經(jīng)網(wǎng)絡(luò) | 2023-02-17

蘋果發(fā)布DeepPCR機(jī)器學(xué)習(xí)算法：加速神經(jīng)網(wǎng)絡(luò)的推理和訓(xùn)練

蘋果 DeepPCR 機(jī)器學(xué)習(xí) 算法神經(jīng)網(wǎng)絡(luò) | 2023-12-20

眼底造影圖像分割算法的研究與對比

設(shè)計(jì)方案眼底造影圖像閾值分割法神經(jīng)網(wǎng)絡(luò) | 2015-09-07

神經(jīng)網(wǎng)絡(luò)PID在電機(jī)調(diào)速中的應(yīng)用

資源下載 PID 神經(jīng)網(wǎng)絡(luò) 電機(jī)調(diào)速 | 2007-12-27

人工智能推動(dòng)神經(jīng)網(wǎng)絡(luò)技術(shù)開發(fā)熱潮

智能計(jì)算人工智能神經(jīng)網(wǎng)絡(luò) | 2023-03-05

BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及在Matlab中的實(shí)現(xiàn)

資源下載 The MathWorks Matlab BP神經(jīng) 神經(jīng)網(wǎng)絡(luò) | 2007-12-30

arm 新手問題：用arm可以實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)算法對數(shù)據(jù)的實(shí)時(shí)處理么

jackwang | 2006-09-17

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();