設(shè)計(jì)方案推薦:基于ATMEGAl28的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

2013-09-24 17:04 來(lái)源:互聯(lián)網(wǎng) 作者:和靜

0 引言

傳統(tǒng)的人機(jī)交互依靠復(fù)雜的鍵盤(pán)或按鈕來(lái)實(shí)現(xiàn),隨著科技的發(fā)展,一些新型的人機(jī)交互方式也隨之誕生,帶給人們?nèi)碌捏w驗(yàn)。基于語(yǔ)音識(shí)別的人機(jī)交互方式是目前熱門(mén)的技術(shù)之一。但是語(yǔ)音識(shí)別功能算法復(fù)雜、計(jì)算量大,一般在計(jì)算機(jī)上實(shí)現(xiàn),即使是嵌入式方面,多數(shù)方案也需要運(yùn)算能力強(qiáng)的ARM或DSP,并且外擴(kuò)RAM、FLASH等資源,增加了硬件成本,這些特點(diǎn)無(wú)疑限制了語(yǔ)音識(shí)別技術(shù)的應(yīng)用,尤其是嵌入式領(lǐng)域。

本系統(tǒng)采用的主控MCU為Atmel公司的ATMEGA128,語(yǔ)音識(shí)別功能則采用ICRoute公司的單芯片LD3320。LD3320內(nèi)部集成優(yōu)化過(guò)的語(yǔ)音識(shí)別算法,無(wú)需外部FLASH,RAM資源,可以很好地完成非特定人的語(yǔ)音識(shí)別任務(wù)。

1 整體方案設(shè)計(jì)

1.1 語(yǔ)音識(shí)別原理

在計(jì)算機(jī)系統(tǒng)中,語(yǔ)音信號(hào)本身的不確定性、動(dòng)態(tài)性和連續(xù)性是語(yǔ)音識(shí)別的難點(diǎn)。主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論,原理如圖1所示。

1

語(yǔ)音識(shí)別通常需要兩個(gè)階段完成。第一階段是訓(xùn)練,主要是提取語(yǔ)音特征,用戶(hù)往往需要進(jìn)行幾次語(yǔ)音訓(xùn)練,經(jīng)過(guò)預(yù)處理和特征提取后獲得相應(yīng)特征參數(shù)。第二階段是識(shí)別,識(shí)別過(guò)程就是將輸入的語(yǔ)音特征參數(shù)和模型庫(kù)中的參數(shù)進(jìn)行相似性比較,最后輸出匹配度最高的特征參數(shù)完成識(shí)別過(guò)程。

2 硬件電路設(shè)計(jì)

硬件框架如圖2所示,電路主要由主控制器電路和語(yǔ)音識(shí)別電路組成。ATMEGA128控制LD3320語(yǔ)音識(shí)別電路,輸出結(jié)果由ATMEGA128處理,然后通過(guò)總線(xiàn)來(lái)控制不同的設(shè)備。

2

2.1 控制器電路

控制器選用Atmel公司生產(chǎn)的ATMEGA128芯片,采用先進(jìn)的RISC結(jié)構(gòu),內(nèi)置128 KB FLASH,4 KB SRAM,4 KB E2PROM等豐富資源。該芯片是業(yè)界高性能、低功耗的8位微處理器,并在8位單片機(jī)市場(chǎng)有著廣泛應(yīng)用。

1 2 3 4 > 
人機(jī)交互 語(yǔ)音識(shí)別 ATMEGAl28

相關(guān)閱讀

暫無(wú)數(shù)據(jù)

一周熱門(mén)