<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 業(yè)界動(dòng)態(tài) > 搜狗聽寫,現(xiàn)在是錄音筆硬件的“操作系統(tǒng)”了

          搜狗聽寫,現(xiàn)在是錄音筆硬件的“操作系統(tǒng)”了

          作者:郭一璞 時(shí)間:2019-08-29 來源:量子位 收藏

          本文經(jīng)AI新媒體量子位(公眾號(hào) ID: QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

          本文引用地址:http://www.ex-cimer.com/article/201908/404248.htm

          Google把安卓做成了操作系統(tǒng),讓其他手機(jī)廠商也能用這樣的系統(tǒng),融入安卓的生態(tài)。

          微軟把Windows做成了操作系統(tǒng),讓各種PC廠商都能接入,融入Windows生態(tài)。

          也要這樣做了。

          在手機(jī)和PC之外,瞄準(zhǔn)了錄音筆這個(gè)硬件行業(yè),并正式將聽寫能力開放給業(yè)界,萬城集團(tuán)、索尼、愛國(guó)者、紐曼是第一批吃螃蟹的合作伙伴。

          也就是說,日后如果你購買搜狗和這四家廠商中任意一家接入了搜狗聽寫能力的錄音筆硬件產(chǎn)品,都可以使用同樣的交互方式來使用它,并且都可以借助搜狗聽寫能力,實(shí)現(xiàn)語音轉(zhuǎn)文字、同聲傳譯、文本編輯能功能。

          并且,對(duì)于這幾家廠商來說,也不需要專門做適配,而是可以直接實(shí)現(xiàn)自動(dòng)適配了。

          這幾乎等于一個(gè)操作系統(tǒng)了。

          打通搜狗輸入法,還能在線編輯

          這個(gè)操作系統(tǒng)的具體功能,主要包括以下幾項(xiàng):

          語音轉(zhuǎn)寫:語音轉(zhuǎn)成文字,識(shí)別準(zhǔn)確率95%。背后搜狗的語音識(shí)別技術(shù)訪問量達(dá)到了每日6億次。

          搜狗輸入法:接入搜狗輸入法,以及背后的用戶賬號(hào),用戶在輸入法中常用的個(gè)性化詞庫也可以用在語音識(shí)別里,常用的專業(yè)詞匯、人名地名都可以被識(shí)別。

          多端同步編輯:無論在PC、安卓還是iOS上,用戶都可以同步錄音和轉(zhuǎn)寫的文字,進(jìn)行編輯。由于配備了聲紋識(shí)別能力,轉(zhuǎn)寫的文字可以自動(dòng)區(qū)分出說話人的角色,而不是直接呈現(xiàn)沒有人物區(qū)分、不分段的一大片文字。另外,如果有轉(zhuǎn)寫不確定的部分,搜狗聽寫服務(wù)會(huì)提供多個(gè)可能的詞匯備選,不用手動(dòng)一個(gè)字一個(gè)字的人工刪改。

          云存儲(chǔ)服務(wù):用戶的錄音和轉(zhuǎn)寫都能保存在云端。

          接入手機(jī)、PC端

          除了錄音筆之外,在移動(dòng)端和PC端也可以使用搜狗聽寫服務(wù)。

          手機(jī)端的搜狗錄音助手App,就介入了轉(zhuǎn)寫同傳能力,面向藍(lán)牙協(xié)議開放。

          而在PC端,即使是沒有接入搜狗聽寫的的錄音筆,如果連到電腦的USB接口上,用戶也可以用PC端的搜狗輸入法管理錄音筆中的錄音,提供轉(zhuǎn)寫服務(wù)。

          而且,當(dāng)連接到PC時(shí),由于打開時(shí)使用的是你自己的搜狗輸入法賬號(hào),像朋友的名字、行業(yè)詞匯、喜歡的動(dòng)漫主角這些特殊詞匯都存儲(chǔ)在自己的賬號(hào)里,因此轉(zhuǎn)錄的時(shí)候,轉(zhuǎn)錄結(jié)果也會(huì)貼近你的詞庫。

          舉個(gè)例子說,如果你是《長(zhǎng)安十二時(shí)辰》的粉絲,平常使用輸入法有寫過劇中的相關(guān)詞匯,語音轉(zhuǎn)文字的時(shí)候,AI系統(tǒng)就能夠聽出“伏火雷”;

          如果你是是機(jī)器學(xué)習(xí)研究者,那么你一定經(jīng)常使用輸入法寫相關(guān)的技術(shù)名詞,語音轉(zhuǎn)文字的時(shí)候,系統(tǒng)就可以分辨出“卷積神經(jīng)網(wǎng)絡(luò)”。

          因此,即使是同一段錄音,由不同人的賬戶來轉(zhuǎn)寫,得到的結(jié)果可能也是不同的。

          另外,語音轉(zhuǎn)文字的速度也有保證,一個(gè)小時(shí)的錄音,大約要5分鐘就能轉(zhuǎn)寫完。

          開放服務(wù),而非技術(shù)

          在開放搜狗聽寫能力的發(fā)布會(huì)上,搜狗與萬城集團(tuán)、索尼、愛國(guó)者、紐曼成立了“AI創(chuàng)新聯(lián)盟”。在搜狗CTO楊洪濤看來,錄音筆這個(gè)產(chǎn)品,單純提供錄音功能,20年來都沒有改進(jìn),而用戶拿到錄音后去聽、去記的過程,更是繁瑣的很。

          因此,借助語音識(shí)別技術(shù),結(jié)合搜狗輸入法,提供更豐富的服務(wù),可以突破錄音筆這個(gè)行業(yè)的天花板,在企業(yè)會(huì)議、學(xué)習(xí)培訓(xùn)、媒體采訪、寫作記事等領(lǐng)域充分提供服務(wù)。

          簡(jiǎn)單來說,原來你覺得整理錄音太麻煩,還不如現(xiàn)場(chǎng)記,因此不會(huì)購買錄音筆;但如果整理錄音的過程變簡(jiǎn)單,能讓你更方便的整理老板在會(huì)上的講話、老師在課上講的知識(shí)點(diǎn),或者直接用語音輸入來寫作,這樣,你就會(huì)選擇入手一支錄音筆。

          行業(yè)的天花板,被升高了。

          不過,讓合作伙伴的產(chǎn)品也能用上搜狗的聽寫能力,為什么不選擇直接做一個(gè)開發(fā)者平臺(tái),讓全部的開發(fā)者都能接入API來實(shí)現(xiàn)呢?

          “開放的是服務(wù),不是技術(shù)”,楊洪濤這樣說。

          在他看來,市面上的語音識(shí)別API已經(jīng)相當(dāng)多了,搜狗不希望再去做一個(gè)開放平臺(tái),而是利用搜狗的優(yōu)勢(shì),提供具備產(chǎn)業(yè)價(jià)值和商業(yè)價(jià)值的服務(wù)。

          而這,也是搜狗將聽寫服務(wù)與搜狗輸入法中的用戶定制詞庫連接起來的原因。

          最后,除了聽寫能力之外,搜狗公司AI交互技術(shù)中心總經(jīng)理王硯峰表示,未來搜狗的AI分身、變聲、同傳等在行業(yè)內(nèi)有競(jìng)爭(zhēng)力的、能提供完整服務(wù)體驗(yàn)的能力都會(huì)逐步開放。



          關(guān)鍵詞: 搜狗

          評(píng)論


          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();