<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 音樂識別鎖軟硬件完整方案

音樂識別鎖軟硬件完整方案

作者：時間：2017-06-04 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

緒論

本文引用地址：http://www.ex-cimer.com/article/201706/348701.htm

隨著人們生活質(zhì)量的提高，對生活各面都提出了更高的要求。家居安全成了人們關注的問題。同時，鑰匙的遺失或失竊成為了普通鑰匙的最大弊端。由此人們急需一種更方便，更安全的門鎖系統(tǒng)。無疑，聲紋識鎖是目前最好的考慮。但由于人聲易被拷貝，整個鎖價格昂貴，所以沒法在普通家庭進行推廣。另外，一把語音鎖只能由一個人開啟，不適合家庭等需要多成員的場所使用。于是，作者另辟蹊徑，發(fā)明了音紋識別鎖，用音樂來開鎖。它幾乎完全具有聲紋識別鎖的所有功能。同時，它造價低廉，方便攜帶。只要記住音樂的片段，就可以用音樂播放設備進行開啟。完全不怕丟失，如果想把鑰匙“配”給其它人，只需要告訴他音樂的片段的信息就可以了，使用起來非常方便。

一，音樂識別實現(xiàn)過程介紹

本文介紹的音樂電子門鎖是一種在單片機上實現(xiàn)的與文本有關的身份確認系統(tǒng)。該系統(tǒng)主要由語音識別模塊、電磁鐵以及門鎖等部分組成。在訓練時，音樂通過音頻接口進入音樂信號采集前端電路，由音樂信號處理電路對采集的音樂信號進行特征化和音樂處理，提取音樂音紋的個性特征參數(shù)并進行存儲，形成音紋參數(shù)數(shù)據(jù)庫（母版）。在識別時，將待識別音樂與音紋參數(shù)數(shù)據(jù)庫進行匹配，通過輸出電路控制電磁鐵的通斷，最終實現(xiàn)對門鎖的控制。

圖1

由框架圖1可以看出，此識別過程的安全性有4個保證點。第一個是在輸入密鑰的時候，直接輸入數(shù)字信號，無法被竊聽。剩下的3個保證點分別是三次音樂識別過程。識別三段音樂，這三段音樂可以是一首歌中的音樂，也可以分別來自不同的音樂，不確定性加強了。同時，此識別過程需要三段音樂同時識別成功最后才能成功，每次識別都需要按鍵，音樂的精準度有了保障。采用不同的按鍵輸入，按鍵順序隨時改變，因此，從某種意義上來講又成為了一種密碼。因此，如果想拿出一個存滿音樂的mp3或者就只是一首歌來逐個的試出打開鎖的密碼音樂，那樣無異于大海撈針。

（母版聲紋密碼）

（聲紋鑰匙）

此圖可直觀的看出，聲紋信息不一致，因此無法識別！

二，音紋識別與聲紋識別的比較

生物識別技術是利用人體生物特征進行身份認證的一種技術，是目前公認的最為方便與安全的識別技術。在生物識別領域中，聲紋識別，也稱為說話人識別，以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目，并且日益成為人們?nèi)粘Ｉ詈凸ぷ髦兄匾移毡榈陌踩J證方式。聲紋識別技術是一種根據(jù)說話人語音波形中反映說話人生理和行為特征的語音參數(shù)，自動識別說明人身份的技術。隨著技術應用范圍的擴大，聲紋識別的應用暴露出一些難以克服的缺點，比如同一個人的聲音具有易變性，易受身體狀況、年齡、情緒等的影響；比如不同的麥克風和信道對識別性能有影響；比如環(huán)境噪音對識別有干擾；比如多人混合說話的情形下人的聲紋特征不易提取，等等。最新實踐表明，聲紋識別出現(xiàn)了一個很大的漏洞：聲紋信息可被高保真錄音設備提取。這個缺點直接影響了聲紋識別技術的安全性。

音紋識別與身紋識別最大的區(qū)別就是前者用音樂做密碼，要求用戶按照自己的喜好，往音紋識別系統(tǒng)中輸入特定的音樂片段，音紋模型被精確地建立。以后的識別將會以此段音樂為母版，進行音紋比對。如果被識別的音紋能與母版相匹配則識別成功。由于音樂片段是通過音頻接口直接在識別系統(tǒng)與音樂播放器中進行傳輸，傳輸?shù)氖菙?shù)字信號，因此不會有外界聲音的影響，與使用者的身體狀況沒有任何關系，可以達到較好的識別效果。同時，由于音樂傳播的隱蔽性，音紋密碼不會被外部錄音設備獲取，保證了音紋識別系統(tǒng)安全性。

因此，音紋識別技術，它克服了以上所有聲紋識別具有的缺點。同時，音紋識別的應用有一些特殊的優(yōu)勢：(1)蘊含音紋特征的語音獲取方便、快捷，音紋提取可利用任何音樂載體完成，因此使用者的接受程度也高；(2)獲取音樂的識別成本低廉，使用簡單，一個音頻接口即可，在使用通訊設備時更無需額外的錄音設備；(3)適合遠程身份確認，只需要一個手機就可以通過網(wǎng)路(通訊網(wǎng)絡或互聯(lián)網(wǎng)絡)實現(xiàn)遠程登錄；(4)音紋辨認和確認的算法復雜度低；……等等。這些優(yōu)勢音預示著音紋識別，這種全新的識別模式必將成為身份識別技術中另一具有發(fā)展?jié)摿Φ募夹g。

圖2

三，算法原理

音紋識別算法原理框圖如圖2所示。

（一）預處理

1，去噪

對音頻接口輸入的數(shù)字信號；將含噪的音樂信號通過去噪處理，得到干凈的音樂信號后并通過預加重技術濾除低頻干擾，尤其是50Hz或60Hz的工頻干擾，提升語音信號的高頻部分，而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。

2，端點檢測

本系統(tǒng)采用音樂信號的短時能量和短時過零率進行端點檢測。音樂信號的采樣頻率為8kHz，每幀數(shù)據(jù)為20ms，共計160個采樣點。每隔20ms計算一次短時能量和短時過零率。通過對音樂信號的短時能量和短時過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀，最后保留對求取基音等特征參數(shù)非常有用的濁音信號。

3，特征提取

在音樂信號預處理后，接著是特征參數(shù)的提取。特征提取的任務就是提取音樂信號中表征音樂的基本特征。特征必須能夠有效地區(qū)分不同的音樂，同時要求特征參數(shù)計算簡便，最好有高效快速算法，以保證識別的實時性。

（1）音樂特殊性的保證

此識別技術可以采用任何格式的音樂，這也是此系統(tǒng)最大的優(yōu)點之一。每一段音樂記錄了不同演唱者的聲紋信息，以及音樂的音色、調(diào)性、節(jié)拍、音高、音長、音量、速度和持續(xù)時間等特定的信息。在此基礎上，又可以進一步提取旋律、和聲、節(jié)奏等復雜特征。這些信息，就像人類的聲紋特征一樣，有著特殊性，于是謂之為音紋。此識別技術識別音樂基本特征和復雜特征在內(nèi)的音樂信息并且利用模糊分類器識別出每一個樂段所帶有的密碼。為了提高系統(tǒng)的識別率，在本系統(tǒng)中最好選擇調(diào)子起伏較大，音色比較特別的音樂。

（2）參數(shù)提取的比較

通過線性預測分析得到的參數(shù)。包括線性預測系數(shù)（LPC）以及由線性預測導出的各種參數(shù)，如線性預測倒譜系數(shù)（LPCC）、部分相關系數(shù)、反射系數(shù)、對數(shù)面積比、LSP線譜對、線性預測殘差等。根據(jù)前人的工作成果和實際測試比較，LPCC參數(shù)不但能較好地反饋聲道的共振峰特性，具有較好地識別效果，而且可以用比較簡單的運算和較快的速度求得。此外，人們還通過對不同特征參數(shù)量的組合來提高實際系統(tǒng)的性能。當各組合參量間相關性不大時，會有較好的效果，因為它們分別反映了音樂信號的不同特征。在計算機平臺的仿真實驗中，通過各種參數(shù)的實際比較，采用MFCC參數(shù)比采用LPCC參數(shù)有更好的識別效果。但在SPCE061A平臺上做實時處理時，與LPCC系統(tǒng)相比，MFCC系數(shù)計算有兩個缺點：一是計算時間長；二是精度難以保證。由于MFCC系統(tǒng)的計算需要FFT變換和對數(shù)操作，影響了計算的動態(tài)范圍；要保證系統(tǒng)識別的實時性，就只有犧牲參數(shù)精度。而LPCC參數(shù)的計算有遞推公式，速度和精度都可以保證，識別效果也滿足實際需要。本系統(tǒng)采用了基音周期和線性預測倒譜系數(shù)（LPCC）共同作為音樂識別的特征參數(shù)。

（3）LPCC參數(shù)的提取

基于線性預測分析的倒譜參數(shù)LPCC可以通過簡單的遞推公式由線性預測系數(shù)求得。遞推公式如下：

其中p為LPC模型的階數(shù)，也是模型的極點個數(shù)。

（4）LPC模型階數(shù)p的確定

為使模型假定更好地符合語音產(chǎn)生模型，應該使LPC模型的階數(shù)p與共振峰個數(shù)相吻合。通常一對極點對應一個共振峰，10kHz采樣的音樂信號通常有5個共振峰，取p=10，對于8kHz采樣的音樂信號可取p=8。此外為了彌補音樂片段中存在的零點以及其他因素引起的偏差，通常在上述階數(shù)的基礎上再增加兩個極點，即分別是p=12和p10。實驗表明，選擇LPC分析階數(shù)p=12，對絕大多數(shù)音樂信號的聲道模型可以足夠近似地逼近。P值選得過大雖然可以略微改善逼近效果，但也帶來一些負作用，一方面是加大了計算量，另一方面有可能增添一些不必要的細節(jié)。

（5）線性預測系數(shù)的求取

自相關解法主要有杜賓（Durbin）算法、格型（Lattice）算法和舒爾（Schur）算法等幾種遞推算法。其中在杜賓算法是目前最常用的算法，而且在求取LPC系數(shù)時計算量也量小，本系統(tǒng)采用該遞推算法。

4，基音參數(shù)的提取

基音估計的方法很多，主要有基于短時自相關函數(shù)和基于短時平均幅度差函數(shù)（AMDF）等基音估計方法。

（1）基于短時自相關函數(shù)的基音估計

（2）短時自相關函數(shù)在基音周期的整數(shù)倍位置存在較大的峰值，只要找出第一最大峰值的位置就可以估計出基音周期。

（3）基于短時平均幅度差函數(shù)（AMDF）的基音估計

基于短時平均幅度差函數(shù)（AMDF）在基音周期的整數(shù)倍位置存在較大的谷值，找到第一最大谷值的位置就可以估計出基音周期。這種方法的缺點是當語音信號的幅度快速變化時，AMFD函數(shù)的谷值深度會減小，從而影響基音估計的精度。

實際上第一最大峰（谷）值點的位置有時并不能與基音周期吻合，第一最大峰（谷）值點的位置與短時窗的長度有關且會受到共振峰的干擾。一般窗長至少應大于兩個基音周期，才可能獲得較好的估計效果。音樂中最長基音周期值約為20ms，本系統(tǒng)在估計基音周期時窗長選擇40ms。為了減小共振峰的影響，首先對語音進行頻率范圍為[60,900]Hz的帶通濾波。因為最高基音頻率為450Hz，所以將上限頻率設為900Hz可以保留語音的一、二次諧波，下降頻率為60Hz是為了濾除50Hz的電源干擾。

以上幾種方法都是對語音信號本身求相應的函數(shù)。本系統(tǒng)采用的基音估計方法是：首先對帶通濾波后的短時語音信號進行線性預測，求取預測殘差；再對殘差信號求自相關函數(shù)，找出第一最大峰值點的位置，即得到該段語音的基音估計值。實驗表明，通過殘差求取的基音軌跡比直接通過語音求取的基音軌跡效果更好，如圖2所示。圖2中橫坐標為語音幀數(shù)，縱坐標為8000/f，其中f為基音頻率。

5，模式匹配

目前針對各種特征參數(shù)提出的模式匹配方法的研究越來越深入。典型的方法有：矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動態(tài)時間規(guī)整（DTW）方法和人工神經(jīng)網(wǎng)絡方法。

這些方法都有各自的優(yōu)點和缺點。其中DTW算法對于較長音樂的識別，模板匹配運算量太大，但對短音樂（有效音樂長度低于3s）的識別既簡單又有效，而且并不比其他方法識別率低，特別適用于短語音、與文本有關的音樂識別系統(tǒng)。本系統(tǒng)采用端點松馳兩點的（DTW）算法，端點松馳引起的計算量增加并不大，還可以放松對端點檢測的精度要求。

動態(tài)時間規(guī)整（DTW）算法基于動態(tài)規(guī)劃的思想，解決了音樂不同時期音質(zhì)長短、音速不一樣的匹配問題。DTW算法用于計算兩個長度不同的模板之間的相似程度，用失真距離表示。假設測試模板和參考模板分別用T和R表示，按時間順序含有N幀和M幀的語音參數(shù)（本系統(tǒng)為12維LPCC參數(shù)），失真距離越小，表示T、R越接近。把測試模板的各個幀號n=1～N在一個二維直角坐標系中的橫軸上標出，把參考模板的各幀號m=1～M在縱軸上標出，如圖3所示。通過這些表示幀號的整數(shù)坐標畫出縱橫線即形成網(wǎng)絡，網(wǎng)格中的每一個交叉點（n,m）表示測試模板中某一幀與參考模式中某一幀的交會點，對應兩個向量的歐氏距離。DTW算法可以歸結為尋找一條通過此網(wǎng)格中若干交叉點的路徑，使得該路徑上節(jié)點的距離和（即失真距離）為最小。對于端點松弛的情況，路徑搜索原理相同，只是增加了搜索路徑。

（二）硬件系統(tǒng)

音紋電子門鎖系統(tǒng)的核心是音樂識別模塊。包括按鍵輸入、音樂信號采集、音樂信號處理、FLASH存儲擴展、揚聲器輸出、控制輸出以及LCD模組等。音樂識別模型的原理框圖如圖4所示。其核心為音樂信號處理。

音樂識別模塊各組成部分完成的功能如下：

（1）按鍵輸入部分：共有數(shù)字鍵、訓練鍵、刪除鍵、確認鍵和取消鍵等按鍵，用于密碼輸入時的各項操作。其中訓練鍵為隱藏部分，在外部無法直接看到。采用不同的按鍵輸入，按鍵順序隨時改變，因此，從某種意義上來講又成為了一種密碼。

（2）語音信號采集部分：特定語音芯片

（3）FLASH存儲擴展部分：用于存儲音樂的個性特征參數(shù)參考模板。

（4）揚聲器輸出部分：揚聲器

（5）控制輸出部分：用單片機I/O口控制門鎖控制電機。

（6）LCD模組部分：用以顯示系統(tǒng)的工作狀態(tài)，以及操作提示。

（三）工作模式

音樂識別模塊有三種工作模式：訓練模式、認證模式，這兩種模式都可通過工作模式按鍵選擇。

（1）訓練模式，音樂的聲音通過音頻線進入語音信號采集前端電路。第一次語音輸入時，由單片機對采集的語音信號進行處理，提取音樂的個性特征參數(shù)，并存儲到外擴的FLASH內(nèi)，形成音樂特征參數(shù)模板。每個密碼可以進行三次訓練，第二語音輸入時，提取的個數(shù)特征參數(shù)與由第一次語音輸入形成的特征參數(shù)模板進行匹配，在匹配距離小于模板更新閾值時，將音樂特征參數(shù)模板更新為兩次特征參數(shù)的平均值。第三次語音輸入時，提取的個性特征參數(shù)與由第一、二次語音輸入形成的特征參數(shù)模板進行匹配，在匹配距離小于模板更新閾值時，將音樂特征參數(shù)模板更新為三次特征參數(shù)的平均值，形成最后的該音樂的特征參數(shù)模板。訓練模式只有識別程序的擁有者可見。

（2）認證模式，同樣通過音頻線錄入音樂的聲音，再由單片機對采集的語音信號進行處理，將提取的音樂特征參數(shù)與存儲在外擴FLASH內(nèi)的特征參數(shù)模板進行匹配，匹配距離小于認證閾值時，通過認證；然后再判斷匹配距離是否小于認證模式下的模板更新閾值，決定是否對模板進行更新。

另外，由于單片機的可重復編程功能，如果有必要，此音紋識別系統(tǒng)可以再加入密碼輸入等安全認證措施。但考慮到本音紋識別本身具有較高的安全性，加入密碼輸入沒有太大的意義，在這里我們并沒有加入此功能。

（四）總結

音紋識別不僅使用方便，安全，而且還具有以下特性：用戶接受程度高，由于不涉及隱私問題，用戶無任何心理障礙；聲音輸入設備造價低廉，而其他生特識別技術的輸入設備通常造價昂貴。與聲紋識別，利用虹膜、指紋和人臉等技術的門鎖相比，基于單片機構建的語音電子門鎖系統(tǒng)具有成本低、使用方便、保密性好等優(yōu)點。經(jīng)大量實驗測試表明，該系統(tǒng)性能穩(wěn)定、識別效果好。下一步將進行更多功能的，以及算法的完善。為此技術尋找除了鎖之外的其它更廣泛的用途。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： 音紋識別 LPC SPCE061A 單片機

評論

相關推薦

干貨｜必看的單片機知識

單片機計算機存儲器微處理器仿真器 | 2023-11-29

用AT89C2051單片機實驗合弦樂

設計方案 AT89C2051 單片機實驗弦樂 | 2009-07-06

《AVR單片機C語言庫》

資源下載 ATMEL C語言庫單片機 AVR系列 | 2007-12-04

MSP430 電表解決方案

視頻 TI MSP430 MSP430 電表單片機 | 2009-10-16

《ATmega8原理及應用手冊》

資源下載 ATMEL 原理與應用單片機 ATmega系列 | 2007-12-04

16位語言函數(shù)工具庫

資源下載 MicroChip 語言函數(shù) 單片機 PIC | 2007-11-23

MSP430單片機TIMER_A在產(chǎn)品設計中的應用

jackwang | 2002-05-14

瑞薩單片機技術概述

視頻 Renesas 單片機 | 2011-06-13

[轉帖]從Cygnal C8051F看8位單片機發(fā)展之路

hpnet | 2002-05-25

傾情奉獻：MSP430匯編指令集(中文)，詳解帶實例!

資源下載 TI 匯編指令集單片機 MSP430 程序實例 | 2007-11-22

介紹采用 nanoWatt XLP技術的超低功耗系列單片機

視頻 Microchip 電池 nanoWatt XLP 低功耗單片機休眠電流 | 2011-03-03

Microchip推出PIC18-Q24 系列單片機，為增強代碼安全性設置新標準

嵌入式系統(tǒng) Microchip PIC18-Q24 單片機 | 2023-12-07

采用ESP8266的創(chuàng)意時鐘擺件

嵌入式系統(tǒng) ESP8266 ESP12 單片機時鐘DIY | 2024-01-29

單片機模塊——OLED模塊

EDA/PCB 單片機 OLED PCB | 2024-05-27

語音合成芯片T6668和單片機8031的接口電路圖

設計方案語音合成芯片 T6668 單片機接口電路圖 | 2009-07-06

FPGA比單片機厲害嗎？

嵌入式系統(tǒng) FPGA 單片機 | 2024-06-13

Microchip推出AVR DU系列USB單片機，支持增強型代碼保護和高達15W 的功率輸出

嵌入式系統(tǒng) Microchip AVR DU USB單片機單片機 MCU | 2024-04-10

創(chuàng)維數(shù)碼5000系列彩電開關電源（AN單片機）電路

設計方案創(chuàng)維數(shù)碼系列彩電開關電源單片機電路 | 2009-07-06

利用PIC12C508單片機來實現(xiàn)加密狗技術[轉帖]

hpnet | 2002-05-19

單片機獨立看門狗和窗口看門狗的區(qū)別

嵌入式系統(tǒng) 單片機 MCU 看門狗 | 2024-07-22

Microchip推出PIC18-Q24系列單片機,為增強代碼安全性設置新標準

嵌入式系統(tǒng) Microchip 單片機 MCU 代碼安全 | 2023-11-28

AVR 單片機專欄，資料下載！之二

jackwang | 2002-05-24

Stm32-使用TB6612驅動電機及編碼器測速

嵌入式系統(tǒng) stm32 單片機嵌入式硬件 | 2024-04-09

MSP430x2xx4xx系列

視頻 TI 單片機 MSP430F47 MSP430F2 MSP430 MSP430F4 | 2009-10-19

長虹R2118A型彩電開關電源(LA單片機)電路

設計方案長虹 R2118A 彩電開關電源單片機電路 | 2009-07-06

用單片機制作的純正弦波逆變電源電路

設計方案單片機制作正弦波逆變電源電路 | 2009-07-06

AVR 單片機專欄，資料下載！

jackwang | 2002-05-24

超低功率高性能新一代產(chǎn)品MSP430F5xx

視頻 TI 單片機 mps430 | 2009-10-16

單片機語言C51應用實戰(zhàn)集錦

資源下載單片機 C51 | 2007-11-21

GD32F103替換STM32F103需要注意的地方

嵌入式系統(tǒng) GD32F103 STM32F103 單片機 | 2024-01-29

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();