語音識別 文章 進入語音識別技術(shù)社區(qū)
新一代語音識別:可徹底改變車內(nèi)體驗的技術(shù)
- 語音識別是設(shè)備對語音命令做出響應(yīng)的能力,它實現(xiàn)了對各種設(shè)備的免提控制。該技術(shù)最早的應(yīng)用是自動電話系統(tǒng)和醫(yī)療聽寫軟件?,F(xiàn)在,在汽車和智能手機中語音識別技術(shù)有了更廣泛的應(yīng)用,比如蘋果的Siri和特斯拉汽車中的語音命令都采用了先進的語音識別技術(shù)。在汽車中,語音助手的非常大好處是,它可以讓駕駛員的眼睛始終盯著道路,而手一直放在方向盤上,同時還能獲得安全且免提的車內(nèi)體驗,包括接打電話、選擇電臺、設(shè)置導航或播放音樂等?,F(xiàn)在,車載語音助手已成為大多數(shù)車輛的標準功能。汽車語音助手的興起汽車語音助手是一種語音識別控制系統(tǒng),
- 關(guān)鍵字: 語音識別 生物識別 人工智能
美光高性能內(nèi)存與存儲,推動 AI 豐富殘障人士生活體驗
- 美光云計算高級業(yè)務(wù)發(fā)展經(jīng)理 Eric Booth 90 歲的祖母患有嚴重的聽力障礙,即使佩戴助聽器也很難聽清別人在說什么。Eric 注意到,她需要湊近講話者,識別他們的唇語,努力理解他們的話語。而當多人進行交談時,她常常會感到迷茫。Eric 萌生了一個想法:為何不用祖母的智能手機幫她來“傾聽”呢?他打開手機的記事簿功能,按下麥克風按鈕,向她展示了手機如何將他的話轉(zhuǎn)錄成屏幕上的文字。他表示:“我的祖母非常興奮,笑得合不攏嘴,她現(xiàn)在可以參與到從前無法進行的對話中。”這也讓我們看到了該技術(shù)如何切實改善了言語、語
- 關(guān)鍵字: 語音識別 生成式AI 機器學習 內(nèi)存
基于Infineon SoC藍牙CYW20835之智能遙控器方案
- 1.藍牙智能遙控器的應(yīng)用介紹:遙控器的發(fā)展,從紅外遙控器,到2.4G RF 遙控器,再到現(xiàn)在的藍牙的遙控器;從機械的上下左右按鍵式遙控器,到現(xiàn)在像鼠標一樣順滑的運動感應(yīng)遙控器,再到帶語音控制遙控;遙控器的發(fā)展,也是隨著科技的進步和智能設(shè)備的發(fā)展而不斷更新發(fā)展;2. 各種遙控器的原理;紅外遙控器原理:通過紅外二極管,發(fā)射38Khz載波的紅外信號;接收端通過紅外接收頭,接收紅外信號,并解碼得到遙控器的控制命令;運動感應(yīng)遙控器原理:通過感應(yīng)使用者手的運動來控制屏幕的光標移動;通過不同的手勢來發(fā)射控制命令;通過M
- 關(guān)鍵字: 英飛凌 藍牙 BT 遙控器 紅外信號 傳感器 語音識別 2.4g 語音遙控 cyw20835
大聯(lián)大品佳集團推出基于MediaTek產(chǎn)品的亞馬遜智能物聯(lián)網(wǎng)語音識別方案
- 2022年9月8日,致力于亞太地區(qū)市場的領(lǐng)先半導體元器件分銷商---大聯(lián)大控股近日宣布,其旗下品佳推出基于聯(lián)發(fā)科(MediaTek)Filogic 130A(MT7933)芯片的亞馬遜智能物聯(lián)網(wǎng)語音識別方案。圖示1-大聯(lián)大品佳基于MediaTek產(chǎn)品的亞馬遜智能物聯(lián)網(wǎng)語音識別方案的展示板圖語言是人與人之間傳遞和獲取信息的重要方式,隨著語音識別技術(shù)的發(fā)展,這種交互方式也被應(yīng)用到了人與機器之間。可以說語音識別技術(shù)是實現(xiàn)人工智能的關(guān)鍵突破口之一。在后疫情時代,對抗疫情散播的非接觸式設(shè)備得到了廣泛的發(fā)展,而語音識
- 關(guān)鍵字: 大聯(lián)大品佳 MediaTek 亞馬遜 語音識別
微軟197億美元完成對Nuance的收購 目標不止在于語音識別市場
- 語音交互是未來人機交互的重要入口,甚至極大可能成為最常見的入口,會普遍性的替代當前主流的鍵盤交互方式,所以成為語音識別和合成技術(shù)這幾年是幾大巨頭的必爭之地。從前幾年各家紛紛入局智能音箱可見一斑。日前,微軟方面宣布已完成對語音技術(shù)公司Nuance Communications的收購,并且該收購總計花費為197億美元。據(jù)悉,Mark Benjamin將繼續(xù)擔任Nuance首席執(zhí)行官,并向微軟云計算和企業(yè)部負責人Scott Guthrie匯報。在去年4月,微軟方面就公布了這一收購計劃,而當時的價格為160億美元
- 關(guān)鍵字: 微軟 Nuance 收購 語音識別
賽昉科技重磅發(fā)布全球首款基于RISC-V人工智能視覺處理平臺 ——驚鴻7100
- 近日- RISC-V處理器IP供應(yīng)商賽昉科技有限公司,發(fā)布全球首款基于RISC-V的人工智能視覺處理平臺——驚鴻7100。“驚鴻”一詞取自成語“驚鴻一瞥”,語義雙關(guān):“驚鴻7100”的推出,不僅驚艷了世界,還以它優(yōu)異的性能,造福于世界。該平臺是全球首款基于RISC-V集深度學習、圖像處理、語音識別、機器視覺為一體的多功能平臺,由賽昉科技獨立自主開發(fā),可廣泛應(yīng)用于自動駕駛、智能無人機、公共安全、交通管理、智能家電、視覺掃地機器人、工業(yè)機器人等智能應(yīng)用領(lǐng)域?!绑@鴻7100”的出現(xiàn),標志著RISC-V在智能音視
- 關(guān)鍵字: 驚鴻7100 RISC-V指令集 深度學習 圖像處理 語音識別 機器視覺
美媒:人工智能實現(xiàn)“聞聲識人” 但遠未達到完美
- 美媒稱,人工智能(AI)現(xiàn)在可以做到只參考一小段音頻,就能生成一個人面部的數(shù)字圖像。
- 關(guān)鍵字: 人工智能 語音識別 神經(jīng)網(wǎng)絡(luò)
ZLG深度解析語音識別技術(shù)
- 語音識別已成為人與機器通過自然語言交互重要方式之一,本文將從語音識別的原理以及語音識別算法的角度出發(fā)為大家介紹語音識別的方案及詳細設(shè)計過程?! ≌Z言作為人類的一種基本交流方式,在數(shù)千年歷史中得到持續(xù)傳承。近年來,語音識別技術(shù)的不斷成熟,已廣泛應(yīng)用于我們的生活當中。語音識別技術(shù)是如何讓機器“聽懂”人類語言?本文將為大家從語音前端處理、基于統(tǒng)計學語音識別和基于深度學習語音識別等方面闡述語音識別的原理。 隨著計算機技術(shù)的飛速發(fā)展,人們對機器的依賴已經(jīng)達到一個極高的程度。語音識別技術(shù)使得人與機器通過自然語言
- 關(guān)鍵字: ZLG 語音識別
近十年人工智能21個子領(lǐng)域高引學者
- AMiner節(jié)選了和人工智能相關(guān)的21個子領(lǐng)域,每個子領(lǐng)域選擇1-2個頂級會議或者期刊,根據(jù)這些會議和期刊上近10年發(fā)表論文的引用情況(根據(jù)Goolge Scholar)生成了高引學者列表,僅供參考。
- 關(guān)鍵字: 人工智能 語音識別 物聯(lián)網(wǎng)
人工智能語音識別發(fā)展起飛,進一步帶動MEMS麥克風的需求
- 據(jù)麥姆斯咨詢介紹,人工智能(AI)語音識別發(fā)展起飛,進一步帶動MEMS麥克風的需求,然而在這波需求的背后,不僅是MEMS麥克風本身的規(guī)格需要提升,就連生產(chǎn)制程的良率要求,也成為廠商關(guān)注的焦點。 鑫創(chuàng)科技市場營銷部經(jīng)理曾建統(tǒng)表示,AI語音發(fā)展趨勢規(guī)格目前呈現(xiàn)兩極化的發(fā)展,針對較于成熟的消費型應(yīng)用產(chǎn)品(如手機、筆電與耳機),現(xiàn)有的MEMS麥克風性能皆已可滿足其應(yīng)用需求,但另一方面,對于MEMS麥克風的靈敏度、 收音與抗噪有更高要求的AI應(yīng)用(如智能音箱類型產(chǎn)品),則對MEMS麥克風技術(shù)規(guī)格要求更嚴苛
- 關(guān)鍵字: 人工智能 語音識別
我國工業(yè)機器人產(chǎn)量占全球1/3,核心零部件自主研發(fā)能力提升
- 機器人是“制造業(yè)皇冠頂端的明珠”,其研發(fā)、制造、應(yīng)用是衡量一個國家科技創(chuàng)新和高端制造業(yè)水平的重要標志。第一財經(jīng)記者從相關(guān)部門獲悉,2018年,全球機器人市場規(guī)模將達298.2億美元,年均增長率超過15%?! ∧壳?,我國機器人產(chǎn)業(yè)發(fā)展如何?第一財經(jīng)記者從今天在南京開幕的世界智能制造大會現(xiàn)場了解到,2017年,我國工業(yè)機器人產(chǎn)量超過13萬臺,約占全球產(chǎn)量1/3。其中,我國核心零部件和控制系統(tǒng)自主研發(fā)能力增強,涌現(xiàn)了一批創(chuàng)新型機器人企業(yè)。比如,哈工大機器人集團自主研發(fā)出國內(nèi)首款具有完全自主知識產(chǎn)權(quán)的精密擺線
- 關(guān)鍵字: 工業(yè)機器人 語音識別
語音識別的金礦在發(fā)展中國家
- 據(jù)國外媒體報道,雖然人工智能機器人和自動駕駛汽車可能成為未來的頭條新聞,但谷歌搜索負責人本·戈麥斯(Ben Gomes)表示,技術(shù)領(lǐng)域的下一個重大飛躍將是語音服務(wù)的進步。戈麥斯表示,更好地理解通用語言對互聯(lián)網(wǎng)的未來發(fā)展至關(guān)重要?! 「犒溗拐f:“語音識別和對語言的理解是未來搜索和信息的核心。但是有很多難題,比如理解引用語是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在語音服務(wù)角度,這只是其面臨的數(shù)以百萬計的問題之一?! ?月24日是谷歌成立二十周年之際,而戈麥斯在接受《衛(wèi)報》采訪時發(fā)表了
- 關(guān)鍵字: 谷歌,語音識別
語音識別介紹
與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別是一門交叉學科。近二十年來,語音識別技術(shù)取得顯著進步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別技術(shù)將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。
語音識別聽寫機在一些領(lǐng)域的應(yīng)用被美國新聞界 [ 查看詳細 ]
關(guān)于我們 -
廣告服務(wù) -
企業(yè)會員服務(wù) -
網(wǎng)站地圖 -
聯(lián)系我們 -
征稿 -
友情鏈接 -
手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國際技術(shù)信息咨詢有限公司
京ICP備12027778號-2 北京市公安局備案:1101082052 京公網(wǎng)安備11010802012473
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國際技術(shù)信息咨詢有限公司
京ICP備12027778號-2 北京市公安局備案:1101082052 京公網(wǎng)安備11010802012473