<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 汽車電子 > 業(yè)界動(dòng)態(tài) > 新一代語音識(shí)別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

新一代語音識(shí)別：可徹底改變車內(nèi)體驗(yàn)的技術(shù)

作者：時(shí)間：2024-07-18 來源：貿(mào)澤電子

英飛凌汽車電子生態(tài)圈
- 掃碼關(guān)注
  獲取最新最全汽車電子
  技術(shù)方案與實(shí)用技巧

收藏

語音識(shí)別是設(shè)備對(duì)語音命令做出響應(yīng)的能力，它實(shí)現(xiàn)了對(duì)各種設(shè)備的免提控制。該技術(shù)最早的應(yīng)用是自動(dòng)電話系統(tǒng)和醫(yī)療聽寫軟件?，F(xiàn)在，在汽車和智能手機(jī)中語音識(shí)別技術(shù)有了更廣泛的應(yīng)用，比如蘋果的Siri和特斯拉汽車中的語音命令都采用了先進(jìn)的語音識(shí)別技術(shù)。

本文引用地址：http://www.ex-cimer.com/article/202407/461152.htm

在汽車中，語音助手的非常大好處是，它可以讓駕駛員的眼睛始終盯著道路，而手一直放在方向盤上，同時(shí)還能獲得安全且免提的車內(nèi)體驗(yàn)，包括接打電話、選擇電臺(tái)、設(shè)置導(dǎo)航或播放音樂等。現(xiàn)在，車載語音助手已成為大多數(shù)車輛的標(biāo)準(zhǔn)功能。

汽車語音助手的興起

汽車語音助手是一種語音識(shí)別控制系統(tǒng)，它允許駕駛員用語音控制車輛的功能和特征，比如用于車輛的氣候控制、娛樂設(shè)置、導(dǎo)航和其他功能，還可用于免提通話和發(fā)送短信。

本田是最早在汽車中使用語音識(shí)別技術(shù)的汽車制造商之一，該公司于2004年提供了一種語音導(dǎo)航系統(tǒng)，主要用于音頻、DVD和車內(nèi)環(huán)境控制的語音命令和控制功能。隨著時(shí)間的推移，汽車中的語音識(shí)別技術(shù)有了較大改進(jìn)，如今，汽車中的語音識(shí)別技術(shù)已經(jīng)能夠準(zhǔn)確解釋駕駛員的命令并執(zhí)行較復(fù)雜的操作。

早在2022年3月，大眾汽車就已選擇將Cerence公司的語音AI Cerence Drive 2.0系統(tǒng)集成到大眾高爾夫8 GTI中，所使用的Cerence Drive 2.0系統(tǒng)于2021年推出，它將自然語言理解和文本到語音技術(shù)等功能整合到一個(gè)堆棧中，使得汽車語音識(shí)別系統(tǒng)有了較高的響應(yīng)速度。Siri、Alexa、Maluuba和Cotana等虛擬語音助手的日益普及，為我們的生活提供了便利，人們也因此更加習(xí)慣通過語音進(jìn)行車內(nèi)控制的各種新興應(yīng)用。自動(dòng)駕駛汽車的出現(xiàn)更是有力推動(dòng)了汽車語音識(shí)別系統(tǒng)的發(fā)展。

根據(jù)Precedence research的數(shù)據(jù)，2023年，全球汽車語音識(shí)別系統(tǒng)市場(chǎng)價(jià)值為28.9億美元，預(yù)計(jì)到2032年將超過約111.7億美元，在2023年至2032年的預(yù)測(cè)期內(nèi)，復(fù)合年增長(zhǎng)率將達(dá)到16.20%。

目前，語音識(shí)別系統(tǒng)市場(chǎng)的市場(chǎng)參與者正在大力投資生物識(shí)別和人工智能技術(shù)，在未來幾年將為汽車識(shí)別系統(tǒng)市場(chǎng)提供更多增長(zhǎng)機(jī)會(huì)。

圖片.png

2022年至2032年汽車語音識(shí)別系統(tǒng)市場(chǎng)發(fā)展趨勢(shì)（圖源：Precedence research）

來自Vynz research的分析結(jié)果表明，2023年，汽車語音識(shí)別市場(chǎng)的價(jià)值為28.1億美元，預(yù)計(jì)到2030年將達(dá)到68.7億美元，在2025年至2030年的預(yù)測(cè)期內(nèi)的復(fù)合年增長(zhǎng)率為16.41%。

兩家機(jī)構(gòu)的預(yù)測(cè)數(shù)據(jù)非常接近，從中我們也可以看出整個(gè)行業(yè)對(duì)汽車語音識(shí)別市場(chǎng)抱有的良好預(yù)期。

汽車創(chuàng)新中的語音識(shí)別技術(shù)

近年來，語音識(shí)別技術(shù)徹底改變了消費(fèi)者與汽車的互動(dòng)方式，從個(gè)性化的語音交互到提高安全性和整體用戶體驗(yàn)的免提操作，語音技術(shù)已成為推動(dòng)汽車創(chuàng)新的催化劑。

特斯拉（Tesla）基于上下文的語音命令的實(shí)現(xiàn)代表著汽車語音識(shí)別技術(shù)在應(yīng)用上有了重大突破，這項(xiàng)技術(shù)可以讓用戶更直觀地與他們的Tesla汽車進(jìn)行互動(dòng)。

例如，用戶可以直接說出自己的目的地，車輛就會(huì)為你規(guī)劃出行車路線圖，簡(jiǎn)化了導(dǎo)航過程。此外，該系統(tǒng)還能夠理解先前命令的上下文，具備復(fù)雜的自然語言理解能力，比如通過語音調(diào)整車內(nèi)溫度設(shè)置。這一能力展現(xiàn)出增強(qiáng)車載語音控制系統(tǒng)的潛力，也證明了投資先進(jìn)語音識(shí)別技術(shù)的重要性。

對(duì)于車載語音助手來說，獲得準(zhǔn)確而清晰的語音信號(hào)始終是一個(gè)重大挑戰(zhàn)。道路和風(fēng)噪以及多個(gè)人使用語音設(shè)備可能會(huì)干擾語音識(shí)別的準(zhǔn)確率。目前的車載語音識(shí)別系統(tǒng)大多使用了波束成形技術(shù)，該技術(shù)使用一維“到達(dá)方向”參數(shù)對(duì)聲音場(chǎng)景進(jìn)行建模。

然而，在汽車等封閉空間中，聲波往往會(huì)從窗戶和面板上反彈，因此，在建模之前還需要部署一個(gè)麥克風(fēng)陣列用來接收從數(shù)百個(gè)方向到達(dá)的語音信號(hào)。如今，語音識(shí)別的準(zhǔn)確性已經(jīng)顯著提高，在包含數(shù)萬個(gè)單詞的詞匯表中，錯(cuò)誤率可降至5%左右。

語音控制為控制現(xiàn)代汽車上復(fù)雜人機(jī)接口（HMI）功能提供了一種安全方便的解決方案。開發(fā)人員利用機(jī)器學(xué)習(xí) (ML) 和語音建模的強(qiáng)大功能，使用定制命令和多個(gè)喚醒詞將本地語音控制功能添加到汽車語音助手等應(yīng)用中。

NXP擁有一系列語音控制和通信軟件和系統(tǒng)解決方案，為人對(duì)人和人對(duì)機(jī)器的語音應(yīng)用提供高質(zhì)量、可靠的嵌入式語音處理。其產(chǎn)品組合中的新成員——智能語音技術(shù) (VIT)，是一種全面的先進(jìn)語音控制軟件解決方案，可作為MCUXpresso軟件開發(fā)套件 (SDK) 中的現(xiàn)成軟件庫(kù)。VIT軟件基于先進(jìn)的深度學(xué)習(xí)和語音識(shí)別技術(shù)，提供了完整的遠(yuǎn)場(chǎng)音頻前端（AFE），支持多達(dá)三個(gè)麥克風(fēng)、一個(gè)始終開啟的喚醒詞引擎和一個(gè)語音命令引擎，以及生成客戶定義的喚醒詞和語音命令模型的在線工具。

如前所述，實(shí)現(xiàn)可靠的設(shè)備端語音控制并不是一件容易的事，開發(fā)人員還需要選擇高性能信號(hào)處理硬件平臺(tái)以及相應(yīng)的語音處理軟件，包括AFE波束成形器、單獨(dú)的喚醒詞引擎和語音命令引擎等。VIT軟件可在基于Arm Cortex-M7和M33、Cadence Xtensa HiFi4和Fusion F1內(nèi)核的NXP i.MX邊緣處理平臺(tái)上使用。目前，支持VIT的i.MX 跨界MCU平臺(tái)包括：

? i.MX RT500 MCU（配備M33、DSP和GPU內(nèi)核）

? i.MX RT600 MCU（配備M33和DSP內(nèi)核）

? i.MX RT1060 MCU（配備M7內(nèi)核）

? i.MX RT1160 MCU（配備M7和M4內(nèi)核）

? i.MX RT1170 MCU，搭載1 GHz MCU（配備M7和M4內(nèi)核）

其中，i.MX RT500跨界MCU是雙核微控制器，采用Arm Cortex-M33核和Cadence Xtensa Fusion F1 DSP，專為低功耗應(yīng)用而設(shè)計(jì)。i.MX RT500 Cortex-M33內(nèi)核的運(yùn)行頻率高達(dá)275MHz，包括兩個(gè)協(xié)處理器，可提供更高的性能。Fusion DSP的運(yùn)行頻率高達(dá)275MHz。該系列提供豐富的外設(shè)、嵌入式安全性和超低功耗，具有高達(dá)5MB SRAM和兩個(gè)FlexSPI，每個(gè)FlexSPI具有32KB緩存。

另一款i.MX RT1170跨界MCU集成了Arm Cortex-M7和Arm Cortex-M4內(nèi)核，具有實(shí)時(shí)性能和高度集成。i.MX RT1170 Cortex-M7的運(yùn)行頻率高達(dá)1GHz，Cortex-M4的運(yùn)行頻率達(dá)到400MHz，同時(shí)具有2MB片上RAM。

這款實(shí)時(shí)MCU提供各種存儲(chǔ)器接口和豐富的連接接口，包括3個(gè)支持TSN/AVB技術(shù)的高速以太網(wǎng)接口以及UART、SPI、I2C、USB和3個(gè)CAN-FD接口。此外，i.MX RT1170還增強(qiáng)了內(nèi)置安全，包括安全啟動(dòng)和加密引擎。

圖片.png

支持VIT軟件的NXP i.MX RT1170跨界MCU系統(tǒng)框圖（圖源：NXP）

汽車語音識(shí)別技術(shù)的四大挑戰(zhàn)

語音識(shí)別技術(shù)已經(jīng)存在很長(zhǎng)時(shí)間了，盡管汽車語音助手的受歡迎程度穩(wěn)步上升，但在實(shí)施和開發(fā)語音識(shí)別技術(shù)時(shí)我們很可能遇到以下四個(gè)挑戰(zhàn)：

1. 準(zhǔn)確性的挑戰(zhàn)

語音識(shí)別系統(tǒng)（SRS）的準(zhǔn)確性必須很高才具有實(shí)用和商業(yè)價(jià)值。根據(jù)近期的一項(xiàng)調(diào)查，73%的受訪者聲稱準(zhǔn)確性不高是采用語音識(shí)別技術(shù)的主要障礙。在試圖提高語音識(shí)別模型的準(zhǔn)確性時(shí)，背景噪聲帶來的影響非常大。

解決方法可以從三個(gè)方面入手：一是在開發(fā)模型之前了解用戶的使用環(huán)境，然后選擇一個(gè)聲源方向性好的麥克風(fēng)；二是利用線性降噪濾波器如高斯濾波器來平抑噪聲；三是構(gòu)建一個(gè)去噪算法，以便在輸入/輸出聲音時(shí)對(duì)信號(hào)進(jìn)行平滑處理。

2. 語言、口音和方言覆蓋率的挑戰(zhàn)

目前，沒有一種SRS可以覆蓋所有的語言、方言和口音?？朔@一挑戰(zhàn)的一個(gè)有效方法是擴(kuò)展數(shù)據(jù)集。只有足夠多的數(shù)據(jù)集才能為SRS提供AI/ML模型訓(xùn)練。

3. 數(shù)據(jù)隱私和安全的挑戰(zhàn)

人的語音記錄可以被用作他們的生物特征數(shù)據(jù)。因此，許多人對(duì)使用語音識(shí)別技術(shù)持猶豫不決的態(tài)度。這個(gè)問題目前沒有更好的解決辦法，企業(yè)唯一能做的就是盡可能保持應(yīng)用的透明度，并允許用戶通過設(shè)置選項(xiàng)來限制數(shù)據(jù)收集。

4. 成本和部署的挑戰(zhàn)

開發(fā)和實(shí)施SRS是一個(gè)成本高昂且持續(xù)不斷的過程。如果SRS需要覆蓋各種語言、口音和方言，則需要訓(xùn)練一個(gè)大型數(shù)據(jù)集。在此過程中，數(shù)據(jù)收集過程需要大量的資金，訓(xùn)練模型需要有強(qiáng)大的算力支持，高質(zhì)量的麥克風(fēng)價(jià)格非常昂貴。隨著汽車語音識(shí)別系統(tǒng)市場(chǎng)需求的不斷上升，預(yù)計(jì)語音識(shí)別系統(tǒng)的價(jià)格在未來會(huì)逐步下降。

未來展望

Capgemini Research Institute 的研究數(shù)據(jù)顯示，2022年，77%的消費(fèi)者使用了汽車語音助手進(jìn)行娛樂和導(dǎo)航，超過60%在駕駛時(shí)使用過語音助手的人在購(gòu)買決策中考慮了汽車語音助手的可用性。

語音人工智能（AI）的崛起使得汽車變得更加自主、更加個(gè)性化，消費(fèi)者對(duì)使用語音人工智能來提高駕駛體驗(yàn)的興趣越來越大。目前，語音控制系統(tǒng)大多是一套基本的命令。當(dāng)對(duì)話式人工智能出現(xiàn)后，這些系統(tǒng)將能夠理解多種形式的對(duì)話，并與用戶之間開展多功能的和自然的互動(dòng)。其中，精確的語音交互技術(shù)將是技術(shù)改進(jìn)的重點(diǎn)。一個(gè)高集成度、功能齊全的汽車語音助手可以提供準(zhǔn)確的語音識(shí)別，有助于實(shí)現(xiàn)汽車語音識(shí)別從小眾到廣泛采用的轉(zhuǎn)變。

將ChatGPT集成到梅賽德斯-奔馳汽車公司的車輛中是汽車行業(yè)使用語音技術(shù)的重大進(jìn)步。數(shù)字語音助手為制造商提供了一個(gè)增強(qiáng)用戶體驗(yàn)的機(jī)會(huì)，并根據(jù)駕駛員的要求為新的服務(wù)和收入機(jī)會(huì)提供了平臺(tái)。預(yù)計(jì)到2028年，全球銷售的新車中將有近90%搭載語音助手。

汽車行業(yè)一直是專利創(chuàng)新的熱土?；ヂ?lián)汽車的興起、人工智能（AI）、機(jī)器學(xué)習(xí)（ML）和自然語言處理（NLP）等技術(shù)的日益完善，進(jìn)一步推動(dòng)了汽車領(lǐng)域的創(chuàng)新活動(dòng)。Global Data在關(guān)于汽車創(chuàng)新的報(bào)告中指出，僅在過去三年，汽車行業(yè)就有超過170萬項(xiàng)專利申請(qǐng)和授權(quán)。語音技術(shù)的進(jìn)步為汽車行業(yè)改善用戶的駕駛體驗(yàn)開辟了新的機(jī)會(huì)。從個(gè)性化語音交互到免提操作，語音技術(shù)已成為汽車創(chuàng)新的關(guān)鍵要素。

來源：貿(mào)澤電子

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 語音識(shí)別 生物識(shí)別 人工智能

評(píng)論

相關(guān)推薦

簡(jiǎn)單人工智能的溫度控制電路

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制 | 2009-07-06

未來的人工智能世界：技術(shù)與人文的和諧還是斗爭(zhēng)？

藍(lán)盒子 | 2007-09-11

落后于OpenAI怪居家辦公怪員工不努力谷歌前CEO：我說錯(cuò)了，收回這番話

智能計(jì)算 OpenAI 谷歌人工智能 | 2024-08-15

人工智能歷史

Lamborghini | 2011-03-15

指紋芯片F(xiàn)CD4A14的原理及應(yīng)用

資源下載愛特梅爾公司指紋芯片 FCD4A14 生物識(shí)別指紋傳感器 | 2007-02-16

仿人機(jī)器人

資源下載仿人機(jī)器人傳感器人工智能 | 2007-04-19

人工智能與機(jī)器人

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇機(jī)器人人工智能 | 2015-01-19

STC-人工智能二維生命探測(cè)儀

renazan2000 | 2013-01-14

電視機(jī)智能聲控選合系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

資源下載語音識(shí)別彩電遙控智能聲控選臺(tái) | 2007-02-16

馬斯克：大模型Grok 2測(cè)試版即將發(fā)布

智能計(jì)算馬斯克大模型 Grok 2 測(cè)試版人工智能 xAI | 2024-08-13

生物識(shí)別技術(shù)原理解析

dolphin | 2014-06-12

【電動(dòng)車和能效亮點(diǎn)】LG新能源利用人工智能技術(shù)革新電池設(shè)計(jì)

電源與新能源 LG新能源人工智能電池設(shè)計(jì) | 2024-08-01

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

具有人工智能的溫度控制電路圖

設(shè)計(jì)方案具有人工智能溫度控制電路圖 | 2012-07-24

越南：加強(qiáng)半導(dǎo)體、人工智能等領(lǐng)域高素質(zhì)人才培養(yǎng)

國(guó)際視野越南半導(dǎo)體人工智能人才培養(yǎng) | 2024-08-28

新研究：人工智能可能會(huì)讓拉美工作崗位減少多達(dá)5%

智能計(jì)算人工智能拉美工作崗位減少 | 2024-08-01

全球晶圓代工市場(chǎng)分析：中芯國(guó)際蟬聯(lián)第三

EDA/PCB 晶圓代工中芯國(guó)際人工智能臺(tái)積電 | 2024-08-23

4 調(diào)用 Google 語音識(shí)別

視頻 Android Wear 圖靈機(jī)器人 Google 語音識(shí)別 | 2015-07-07

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模已接近6000億元

智能計(jì)算人工智能 | 2024-09-09

知情人士：特斯拉FSD在美事故影響了在華審批

汽車電子特斯拉 FSD 駕駛輔助小鵬人工智能 | 2024-08-21

具有人工智能的溫度控制電路設(shè)計(jì)

設(shè)計(jì)方案具有人工智能溫度控制電路設(shè)計(jì) | 2012-07-24

JavaScript語音識(shí)別庫(kù)-Julius

視頻 JavaScript 語音識(shí)別 Julius | 2015-07-07

生物簽名認(rèn)證為生物識(shí)別市場(chǎng)帶來新機(jī)遇

liujt_ic | 2003-04-09

有簡(jiǎn)單人工智能的溫度控制電路圖

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制電路圖 | 2010-09-01

人形工業(yè)機(jī)器人的現(xiàn)狀與未來：我們?yōu)槭裁匆l(fā)展人形工業(yè)機(jī)器人？

機(jī)器人工業(yè)機(jī)器人人形機(jī)器人人工智能 | 2024-09-06

語音識(shí)別在遙控系統(tǒng)中的應(yīng)用設(shè)計(jì)

資源下載語音識(shí)別 DTW FED FRED 學(xué)習(xí)型遙控器 | 2007-04-19

座艙大模型為啥成了雞肋？

汽車電子智能座艙人工智能 AI | 2024-09-02

本科畢業(yè)設(shè)計(jì)：一種基于發(fā)育思想的語音識(shí)別系統(tǒng)實(shí)現(xiàn)

資源下載語音識(shí)別人工智能自主式機(jī)器發(fā)育思想自組織映射網(wǎng)絡(luò) 簡(jiǎn)單反饋神經(jīng)網(wǎng)絡(luò) | 2007-04-19

有簡(jiǎn)單人工智能的溫度控制電路

設(shè)計(jì)方案簡(jiǎn)單人工智能溫度控制 | 2009-09-01

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();