- 相關(guān)推薦
基于DSP的聲控電子記事本的設(shè)計與實現(xiàn)
摘要:一種基于DSP芯片的語音識別和數(shù)字錄音系統(tǒng)。在該系統(tǒng)中,DSP(單片ADSP2185)完成語音識別和數(shù)字錄音功能,MCU完成用戶界面處理。該系統(tǒng)可以實現(xiàn)語音名片(電路號碼、工作單位、地址等)存儲及聲控查詢、記事錄音及聲控回放、日歷、簡單計算器等功能。語音識別及語音編解碼技術(shù)經(jīng)過幾十年的發(fā)展,已經(jīng)日趨成熟,步入實用化階段。語音識別技術(shù)已開始應用于電話查詢服務、智能玩具、PDA、家用電器、通信、工業(yè)控制、語言學習等應用領(lǐng)域;其于碼激勵線性預測(CELP)技術(shù)的語音編解碼算法也因其音質(zhì)好,壓縮比大而在通信和數(shù)字錄音設(shè)備中獲得了廣泛應用。
語音輸入方式與手寫輸入方式相比,具有操作簡便、查找方便、識別準確率高等優(yōu)點。省去了大量的輸入時間,降低了信息檢索的復雜度。本文所介紹的聲控電子記事本系統(tǒng)將語音識別和語音編解碼在同一片DSP芯片上實現(xiàn),用語音方式代替其它方式進行信息輸入,提高了系統(tǒng)的靈活性。
1 系統(tǒng)功能
·可存200張語音名片,每張語音名片包含四條信息:姓名、電話號碼、工作單位、備注;聲控查找語音名片信息,用戶只需口述所要查找人的姓名,即可獲得電話號碼、工作單位、備注等信息,同時電話號碼顯示在液晶顯示屏上。
·具有雙音多頻(DTMF)撥號功能,用戶用聲控查找到電話號碼并顯示在液晶屏上之后,只需輕觸一個撥號鍵,即可通過普通電話機的話筒實現(xiàn)快速自動撥號。
·數(shù)字錄音,每段錄音加語音標識;聲控放音,在放音時只需口述所要語音段的語音標識即可自動找到該段錄音并加放,累計錄音時間達兩個半小時以上。
·具有方便的編輯功能,增加、刪除語音名片,增加、刪除數(shù)字錄音段。
2 系統(tǒng)構(gòu)成
本文所介紹的聲控電子記事本系統(tǒng),是在定點16位DSP芯片上實現(xiàn)的,它包含特定人孤立詞語音識別算法和代數(shù)碼本激勵線性預測(ACELP)語音編解碼算法數(shù)(MFCC)為語音特征、以動態(tài)時間規(guī)劃(DTW)為模板匹配算法,對于普通詞條,識別率達到了99%以上。用于“錄音”功能的ACELP算法是該碼率下性能優(yōu)異的編解碼算法,雖然算法復雜度較高,但共重建語音質(zhì)量的平均主觀評測分數(shù)(MOS分)達到了4.0,非常接近于壓縮前的分數(shù)4.3。
如圖1所示,系統(tǒng)由MCU實現(xiàn)總線控制,接受外部鍵盤輸入,并在液晶屏上顯示信息。在本系統(tǒng)中,語音充當大部分人機界面的角色,盡量省去復雜的鍵盤操作,而且用語音提示或語音回放代替一部門液晶文字提示。由于語音要經(jīng)過DSP處理,所以MCU需要與DSP經(jīng)常交換信息,以便實現(xiàn)友好的操作界面。
2.1 DSP
DSP(ADSP2185)是整個硬件系統(tǒng)的信號處理中心,完成語音識別、訓練、編解碼,進行片內(nèi)RAM及外部FLASH存儲芯片的數(shù)據(jù)管理與調(diào)度,并向主控芯片MCU提供簡潔的命令與反饋信息。ADSP2185是Analog Devices公司的產(chǎn)品,其主要性能如下:
·運算速度為50MIPS,且均為高效的單周期指令。
·提供了80Kbyte的片內(nèi)RAM,其中32Kbyte為數(shù)據(jù)RAM,48Kbyte為程序RAM。
·最大可支持4Mbyte的外部存儲區(qū),用于存儲數(shù)據(jù)或程序。
·提供對字節(jié)存儲區(qū)(BM)與片內(nèi)RAM區(qū)之間的DMA方式支持。
·提供兩上可編程、全雙工、自動進行收發(fā)緩沖區(qū)操作的串行口。
2.2 MCU
MCU(KS57C2316)是SAMSUNG公司生產(chǎn)的性價比較高的一種CMOS四位單片機,可以一次性編程,適于小批量生產(chǎn),被廣泛地應用于家用電器的控制,它具有強大的I/O功能。其主要性能如下:
·ROM為16K×8 bit;RAM為512×4 bit
·40個I/O引腳
·多至16位數(shù)字LCD顯示
——32個段,4個公共端引腳
這些性能保證了系統(tǒng)主控能力,而且能夠提供靈活的外部接口,適于做進一步的改進和改造。計算器等附加功能可以直接由MCU完成。
2.3 數(shù)據(jù)FLASH存儲器
數(shù)據(jù)FLASH存儲器KM29U64000是SAMSUNG公司的產(chǎn)品,它可在3伏電壓下低功耗工作,存貯量大、價位低、速度快、存儲數(shù)據(jù)掉電后可保持而不會丟失。其主要性能指標如下:
·存儲單元陣列為(8M 256K)×8bit;數(shù)據(jù)寄存器(512 16)×8bit
·頁寫入為(512 16)Byte;塊擦除為(8K 256)Byte
·命令/地址/數(shù)據(jù)復用I/O端口
·可靠的CMOS Floating-Gate技術(shù),耐受一百萬次寫入/擦除,數(shù)據(jù)維持時間為10年
·命令寄存器操作
【基于DSP的聲控電子記事本的設(shè)計與實現(xiàn)】相關(guān)文章:
基于DSP的擴頻電臺基帶模塊的設(shè)計與實現(xiàn)03-18
基于ADI TigerSHARC DSP的OFDM收發(fā)信機的設(shè)計與實現(xiàn)03-30
基于USB與DSP的指紋識別系統(tǒng)的設(shè)計實現(xiàn)03-19
DNP3.0在基于DSP的FTU中的實現(xiàn)03-18
基于DSP的智能座椅系統(tǒng)的設(shè)計03-07
基于ESMTP的電子郵件發(fā)送程序的設(shè)計與實現(xiàn)11-16
基于幀的實時話音變換技術(shù)與DSP實現(xiàn)03-07