<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 業(yè)界動態(tài) > 中國AI又奪一冠!依圖刷榜全球聲紋識別挑戰(zhàn)賽,刷新紀(jì)錄,大比分奪魁

          中國AI又奪一冠!依圖刷榜全球聲紋識別挑戰(zhàn)賽,刷新紀(jì)錄,大比分奪魁

          作者:魚羊 時間:2019-09-12 來源:量子位 收藏

          本文經(jīng)新媒體量子位(公眾號 ID: Qbit)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

          本文引用地址:http://www.ex-cimer.com/article/201909/404744.htm

          中國軍團,繼續(xù)刷新全球AI各項競賽。

          這一次,是全球聲紋識別競賽;這一次,是獨角獸。

          VoxCeleb說話人識別挑戰(zhàn)賽,簡稱VoxSRC,近日正式公布結(jié)果。


          在這場匯聚了中外語音領(lǐng)域頂級高手的挑戰(zhàn)賽中,(logicworld)以絕對領(lǐng)先優(yōu)勢斬獲冠軍。

          而且挑戰(zhàn)賽比拼內(nèi)容,正是當(dāng)前語音識別領(lǐng)域最高精尖的“聲紋識別”賽道。

          之前已經(jīng)展示了視覺感知、語音識別和語義理解等方面的不俗實力。

          現(xiàn)在,依圖則進一步用一個前沿技術(shù)領(lǐng)域的全球冠軍,展示了其技術(shù)深度之外,在廣度方面的開拓。

          真是依圖出沒,氣勢洶涌。

          依圖又奪何冠?

          VoxSRC,由來自牛津大學(xué),斯坦福國際研究院和麻省理工的學(xué)者組織舉辦。

          參賽者包括約翰霍普金斯大學(xué)、法國國家信息與自動化研究所、日本電氣(NEC)等傳統(tǒng)豪強,也有中國的清華大學(xué),天津大學(xué),中山大學(xué),依圖科技,平安科技等學(xué)校企業(yè)。

          選手都有備而來,比拼直接而激烈。

          指紋識別,人臉識別已經(jīng)被大眾所熟知,但同樣作為生物信息識別的一種——聲紋識別(即說話人識別),目前還是技術(shù)挑戰(zhàn)的前沿,常在科幻電影中出現(xiàn),也常被語音AI公司當(dāng)展望談及。

          聲紋識別權(quán)威評判標(biāo)準(zhǔn)不多,但真正檢驗技術(shù)的,VoxCeleb說話人識別挑戰(zhàn)賽可能算一個。

          其主要考核,是運用AI技術(shù)如何能夠從自然語音中識別出說話人。

          比賽采用的訓(xùn)練數(shù)據(jù)集為VoxCeleb2,由牛津大學(xué)發(fā)起提供。這一數(shù)據(jù)集中的音頻全部采集自YouTube,場景包括明星紅地毯、名人演講、真人節(jié)目訪談以及大型體育解說等,包含了5994位名人的超過一百萬條語音。

          這些名人涉及不同的性別,種族,口音,職業(yè)和年齡,并且音頻中存在各種各樣的背景噪聲,包括環(huán)境突發(fā)噪聲、背景人聲、笑聲、回聲,室內(nèi)噪聲和錄音設(shè)備噪聲等等。

          比賽的測試集則全部沒有標(biāo)注,屬于“盲測”,保證了競賽的公平與公正。

          面對如此挑戰(zhàn),想讓AI準(zhǔn)確提取聲學(xué)特征、說話人特征,并實現(xiàn)準(zhǔn)確的識別匹配,并非易事。

          在發(fā)表于Interspeech 2018的論文中,VoxCeleb2的作者牛津大學(xué)Visual?。牵澹铮恚澹簦颍。牵颍铮酰饘嶒炇矣?xùn)練出的ResNet-50達到了3.95%的等錯誤率(EER),超越了當(dāng)時的基線方法。

          而就在這場比賽中,依圖不僅大幅刷新該紀(jì)錄,將EER壓縮至0.98%,還超出第二名(1.42%)一個身位,以絕對優(yōu)勢奪冠。

          毫無疑問,這是一次技術(shù)實力的肌肉展示。

          但如果熟悉依圖業(yè)務(wù),就可能忍不住想得更多。

          依圖參與全球聲紋識別競賽,又怎會是為了刷榜而刷榜?

          技術(shù)“冗余”,增強場景化落地

          從聲紋識別本身來說,作為生物識別技術(shù)的一種,應(yīng)用前景原本就非常廣闊。

          在個人信息加密領(lǐng)域,更能發(fā)揮重要的作用。

          作為一種生物識別解決方案,聲紋識別在金融等對個人信息安全有高要求的行業(yè)當(dāng)中,也能夠提供更高的安全性,強化風(fēng)控能力。

          此外作為智能語音應(yīng)用落地的更大挑戰(zhàn),聲紋識別的攻堅,對于性別年齡畫像、語種方言識別,進而做到真正的語音交互千人千面,都是繞不過去的核心問題。

          而且隨著AI在各行各業(yè)的場景化落地越來越普遍,技術(shù)冗余,針對不同問題提供不同解決方案,也在成為AI公司競爭力的核心要求。

          在各項技術(shù)上有實力、有儲備,才能發(fā)展、落地更全面。

          也就意味著,AI公司下一階段發(fā)展,深度和廣度,都得兼?zhèn)洹?/span>

          AI公司的深度&廣度

          這或許也是依圖目前發(fā)展開拓的背后思路。

          之前,依圖被人熟知,更多是“CV四小龍”的并稱,強調(diào)其在視覺領(lǐng)域的地位。

          依圖也確實在多項視覺國際比拼中斬獲冠軍。比如依圖連續(xù)三年參加美國國家標(biāo)準(zhǔn)技術(shù)局(NIST)人臉識別供應(yīng)商測試(FVRT),連續(xù)三次斬獲冠軍。

          在安防、金融和醫(yī)療領(lǐng)域,依圖的AI視覺能力,也贏得了真實業(yè)務(wù)場景的認(rèn)可。

          但2018年以來,依圖開始展現(xiàn)出強大的“泛化”能力,開始將AI技術(shù)打通,并迅速在拓展領(lǐng)域取得核心突破。

          在語音領(lǐng)域,其語音識別算法在全球最大的開源中文數(shù)據(jù)庫AISHELL-2上字錯率僅3.71%,大幅刷新紀(jì)錄。

          在NLP方面,依圖聯(lián)合廣州婦女兒童醫(yī)療中心等機構(gòu),將自然語言處理(NLP)技術(shù)應(yīng)用于兒科疾病診斷,成果登上《自然·醫(yī)學(xué)》(Nature?。停澹洌椋悖椋睿澹@也創(chuàng)下中國AI醫(yī)學(xué)的新紀(jì)錄。

          其后更令業(yè)界震動的是,依圖低調(diào)部署研發(fā),完成了自主AI芯片“求索”的流片、發(fā)布并商用,以“算法即芯片”理念,提出智能密度的新理論,為AI場景化落地,提供坐標(biāo)參考系。

          最近一次,由工信部、公安部及網(wǎng)信辦三部委指導(dǎo)主辦的“中國人工智能高峰論壇”上,依圖AI芯片不僅獲得了AI創(chuàng)新之星,依圖也在首屆多媒體信息識別競賽中,于11個任務(wù)中,斬獲10個A級,為所有參賽者中奪冠最多。

          所以,依圖路徑、依圖模式,也是時候值得更多討論了。

          這種模式在科技創(chuàng)業(yè)的歷史中并不陌生。先有垂直深度,然后平臺化遷移,打造技術(shù)更為全面、應(yīng)用更加廣泛的大平臺。

          但在AI歷程中,這樣既要保證深度又有兼顧廣度的事情,依圖之外,還無人做到。

          所以聲紋之冠,或許還不是依圖實力的全部。

          依圖之路,也值得上下求索。

          你說呢?




          關(guān)鍵詞: AI 依圖

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();