基于ARM 和Linux的字符采集與識別系統(tǒng)
識別算法:
線性判別分析( L inearity D istinct ion Analysis,LDA)是有效的特征抽取方法之一, 廣泛用于人臉識別和字符識別等領域[ 6] 。其基本思想是選擇使F isher準則函數達到極值的一組矢量作為最佳投影方向, 樣本在該矢量集上投影后, 達到最大的類間離散度和最小的類內離散度。為找到投影軸, 應最大化類間離散矩陣Sb 和類內離散矩陣Sw 的比值:
類間離散矩陣Sb 和類內離散矩陣Sw 的定義為
其中, c表示為模式的類別數; j 表示為第j 類的均值(其概率為pj ); 0 為全部樣本均值; xji 為第j 類模式i的h維向量; nj 是第j 類的樣本數; N 是所有樣本數。j 和0 定義為:
最優(yōu)化問題可以通過Sb 和Sw 的特征值的求解而獲得。如果在樣本離散矩陣中非目標樣本占有比重較大, LDA 并不能保證找到最優(yōu)子空間。LDA 的最優(yōu)分類標準并不一定對分類準確性最優(yōu), 有可能使得已經分開的鄰近類引起不必要的重迭。本文采用一種新的加權LDA 方法( ILDA ), 其計算S^b 和S^w 方法如下:
顯然, 如果( )是個常數, 在投影方向上, S^b和S^w 分別等同Sb 和Sw。如果每一類的( )是不同的, 這將對臨近類的重迭樣本的分類產生影響??梢钥闯? 如果 ij較大, 則( )較小。
實驗樣本取自手寫體通用數據庫UC I, 在Bhattacharyya距離( BD)分類器下對加權線性判別分析與相應的算法進行實驗比較和分析, 取得較好的識別性能, 證實了該方法提取的特征的有效性。
3.結束語
本文采用嵌入式Linux 和ARM 處理器軟硬件平臺, 利用C IS傳感器配合運動平臺實現了圖像的采集和存儲, 為嵌入式字符識別系統(tǒng)構建了一個圖像采集平臺。在字符識別的應用方面, 探討了廣泛應用的手寫數字識別算法, 在已有的線性判別分析算法基礎上, 提出了一種改進的加權線性判別分析算法, 并對該算法進行了實驗驗證, 獲得了較好的識別率。
評論