最新計算機畢業(yè)設計開題報告的論文
一、課題研究背景
1.國內外的研究現(xiàn)狀
目前國內外實現(xiàn)的手語識別系統(tǒng)主要分為基于傳感器的系統(tǒng)識別和基于圖像處理的識別系統(tǒng)。利用傳感器識別的系統(tǒng)就是利用空間加速度和角速度這兩個參數(shù)來進行的,當信息量比較大時,能更方便的獲取到數(shù)據(jù);缺點是需要在手臂上裝置大量裝置在表達上帶來了不便性;趫D像的視覺識別是用攝像機采集手勢信息進行識別的技術。這種方式的優(yōu)點是動作的識別更加自然,缺點是圖像處理識別時容易受到環(huán)境的干擾。
手勢識別領域的研究在國外要比國內早,國內最早開始研究手勢手語的識別是哈工大團隊提出了將多種手勢識別算法融合的方法,這種方法在分類時特征和模型的參數(shù)都很少,但這種技術對手語手勢的識別在那個年代取得了良好的識別效果,通過將神經(jīng)網(wǎng)絡和 HMM 算法相結合,使系統(tǒng)對簡單靜態(tài)手語的識別率達到百分之八十以上。隨著技術的發(fā)展,人們將GMM模型運用到手
語識別系統(tǒng)中,通過這種方法對手語識別得到的結果更好。2009 年,南開大學的李國峰等人研發(fā)了基于MEMS加速度傳感器的簡單輸入系統(tǒng),該系統(tǒng)也為自熱的人機交互研究開啟了新理念。2011年華中師范大學團隊開始了基于加速度傳感器手語識別研究,對預設的八種手勢進行識別,其識別率達到了85.3%.2013年,清華研究團隊利用SEMG信號去識別手臂和手指動作采用多電極陣列獲取SEMG信號,雖然實用性不是很強,識別率不是很高,但是在該領域的探索研究,做出了大量的探索工作。2014年,由于傳感器的手勢識別領域的快速發(fā)展,國內學者張欣和陳勛等人將傳感器技術與生理信號相互結合,構建了手勢識別系統(tǒng)的遠程醫(yī)療系統(tǒng),該系統(tǒng)研發(fā)為識別領域注入了新的血液,使得國內對相關領域的研究更加熱衷起來。
2.課題研究的意義
根據(jù)世衛(wèi)組織最近的一項報道表明,在全球有6億多的殘疾人,其中就聾啞人占殘疾人口的10%.截止到2013年末,中國殘疾人的數(shù)量已經(jīng)占到全國總人口數(shù)的百分之六,是世界上殘疾人最多的國家。在這些殘疾人當中,具有聽力障礙的人占33%,人數(shù)大約為2780萬,這些人中只有少部分人只有聽力或語言障礙,而大多數(shù)人完全失去了與健康人類正常溝通的能力,手語則是它們唯一的交流方式。對于健康的人們來說,除一些專業(yè)人士外大部分人并不能理解手語的含義,那么將手語轉換成聲音和圖像并被人們輕易理解就變得很有實用價值。這將清除它們與社會交流的障礙為它們融入到有聲世界提供了很大的幫助。手勢手語是將人體產(chǎn)生的動作賦予了特定的含義且高度的結構化后的集中體現(xiàn)。
.它主要是由人的手勢決定也會有一些面部表情進行輔助,因此我們要對手語進行識別,首先必須要弄清手勢含義,目前很多對手語的識別是依靠計算機視頻識別來實現(xiàn)的。自上世紀九十年代以來,計算機技術得到迅猛發(fā)展已經(jīng)深入到生活的方方面面之中影響迅速擴大,而且在日常生活中多模態(tài)接口技術已經(jīng)變得越來越普遍。雖然傳統(tǒng)鼠標和鍵盤隨著計算機技術飛速發(fā)展而變得越來越先進,但是由于人的需求也在發(fā)生著很大的變化,這些傳統(tǒng)設備也逐漸凸顯出了它們的局限性,在虛擬現(xiàn)實和人機交互上這種限制是有著明顯的表現(xiàn)。人機交互中手勢是輸入和輸出的非常重要的方式,所以手勢識別是多模式接口技術的一個重要部分。
隨著技術的不斷革新,用戶對傳統(tǒng)計算機的要求已經(jīng)不僅僅局限在便利性和人機交互的方面,導致傳統(tǒng)設備在人機互動方面已經(jīng)無法滿足用戶的需求。而手勢識別就是解決高人工智能領域的局限性問題的,它作為多模式人機接口技術已成為當前計算機技術繼續(xù)深入研究的方向,能使通信在人機交互界面技術上使用的更加自然和諧,手勢識別最接近的就是手語識別,對它的研究涉及心理學、人工智能、計算機視覺等多領域的學科研究,而且作為日常生活中溝通的一種方式已開始受到大批專家和學者的關注,并在手勢識別研究方向開始投入大量科研經(jīng)費和精力,由于手勢手臂本身較為復雜而且它的時間和空間差異使得手勢識別已經(jīng)成為一個具有挑戰(zhàn)性的多學科交叉融合的研究課題。
二、課題研究內容
1.手勢的表示
手勢表示通常是利用手勢模型和模型參數(shù)來表示的,所以在識別手勢的時候首先要要對手勢建模,識別是根據(jù)手勢表示內容而選取手勢特征量與模型匹配,由于環(huán)境文化和地區(qū)的不同會導致了手勢的差異,可能會有使用不同的表達方式,所以手勢通常是一個不太明確的概念,有時手勢表達的含義在不同情景下承載的信息是不同的。比如不同地區(qū)表示暫停的時候是左手在上右手在下,而其它地方可能就是右手在上左手在下。
本文設計的關鍵是對手勢的建模訓練,尤其是對待識別的手勢的確定。具體的應用決定了采用什么樣的手勢模式,只有建立準確的手勢模型才能利用算法進行對識別到的手勢做出正確反饋。通常手勢建模和手勢識別所使用到的方法是相異的,采集手勢特征數(shù)據(jù)的方法也不一樣。目前基于數(shù)據(jù)手套的特征捕獲方法是比較常用的采集數(shù)據(jù)信息的方式,通過選擇相應的識別算法實現(xiàn)手勢的識別反饋。
2.常用手勢識別算法分析
2.1人工神經(jīng)網(wǎng)絡算法
這種算法還具有抗干擾能力和容錯性強識別速度快等優(yōu)點,它能把預處理和識別的過程同時進行處理。在目前的識別領域中,運用的比較多的神經(jīng)網(wǎng)絡是誤差反向傳播神經(jīng)網(wǎng)絡(簡稱網(wǎng)絡)。 BP 神經(jīng)網(wǎng)絡結構圖算法是一種有監(jiān)督式的學習算法,它由三部分構成輸入層、中間層(也叫隱藏層)和輸出層,其中的輸入層和輸出層的神經(jīng)元節(jié)點是固定的數(shù)目,兩層之間存在從輸入層到輸出層的前饋連接和輸出層至輸入層的反饋連接,只有隱藏層的神經(jīng)元是可以自由定義的。
在人際交互識別領域中應用神經(jīng)網(wǎng)絡算法進行手勢的識別時首先需要有自己的數(shù)據(jù)庫系統(tǒng),再對采集到的手勢數(shù)據(jù)序列進行算法的訓練,使用訓練好的網(wǎng)絡去識別輸入的手勢數(shù)據(jù)信息數(shù)據(jù)的含義即達到識別手勢的目的,識別到后經(jīng)由計算處理以實現(xiàn)人機交互的目的。神經(jīng)網(wǎng)絡的優(yōu)點是抗干擾性和容錯能力強,缺點是訓練量比較大,擴充性不強對時序建模能力差,無法有效處理動作的速率帶來的問題。
2.2動態(tài)時間規(guī)整
動態(tài)時間規(guī)整曾是語音識別的一種主流方式,它是一種將時間歸整與距離測度結合起來的非線性正則化的技術,算法是建立一套科學的時間校準匹配路徑將測試模式和參考模式建立起聯(lián)系的算法。
DTW的算法主要利用的動態(tài)編程技術(Dynamic Programming, DP)去實現(xiàn),它的算法實現(xiàn)是將全局的優(yōu)化分化成眾多的局部最優(yōu)化。所以在使用算法的時候需要將各局部最優(yōu)化,已達到全部的最優(yōu)化。
在DTW算法中由于容易實現(xiàn)和數(shù)據(jù)的訓練簡單等優(yōu)點被用在語音識別中廣泛應用,但在手勢識別領域由于其運算量太大和較弱的抗噪能力,很難達到對手勢識別的實時性的要求。
2.3特征選擇
手勢識別本質上是對手勢進行多分類任務,在實際的實驗測試過程中,能夠準確區(qū)分手部狀態(tài)是進行手勢識別任務的前提條件,且對后續(xù)的分類以及檢測等任務的精準度至關重要。
比如在進行圖像識別過程中,對拍攝到的圖像進行特征提取是判別手勢的第一步,特征性質的優(yōu)劣是后續(xù)進行圖像信息處理的關鍵,對采集到的數(shù)據(jù)進行特征提取,提取過程中如果特征過于簡單就會造成對圖像信息的提取不全,導致最后的判別精確度較低的問題不能滿足手勢識別對人體手勢識別高精確度的要求,而如果不考慮提取到的特征維度問題,容易造成數(shù)據(jù)維度災難現(xiàn)象即產(chǎn)生大量的特征數(shù)據(jù)使計算機無法短時間進行處理,這樣不能滿足手勢識別對于現(xiàn)場實時性的要求。
因為在三維空間中執(zhí)行的手勢是動態(tài)的,采集到的加速度和姿態(tài)角的數(shù)據(jù)也是實時變化的,所以對于手勢識別的數(shù)據(jù)是由內嵌在手套中的兩個六軸陀螺儀加速度傳感器產(chǎn)生的,當手部移動時會產(chǎn)生加速度,角速度姿態(tài)角等實時數(shù)據(jù)信息,處理器通過對傳感器識別的運動數(shù)據(jù)進行采集計算最終識別手勢的動作。
三、實驗結果測試與分析
1.實驗手勢
本章主要內容是根據(jù)前面內容進行試驗,通過實驗驗證可穿戴智能手套翻譯器能夠使用改進型的識別算法提高手勢的識別率和識別精度。
為驗證嵌入式系統(tǒng)對手勢手語識別的可行性,在進行試驗時候從準備好的手勢模型中各取四個進行手勢識別試驗。開始手勢表達時要按箭頭的方向做軌跡,同時要求一次性完成動作,不能在動作執(zhí)行時有停頓,做完每一個手勢都要停頓一定時間。
2.實驗過程及數(shù)據(jù)統(tǒng)計
本文所采取的實驗方法及過程如下:
首先,實驗所用的手勢模板是已經(jīng)定義好了的手勢集合,實驗時從中選取定義好的手勢集。
其次,從手勢集合中選取部分手勢進行算法識別,在這個過程中逐漸將訓練樣本數(shù)量由少到多增加,觀察樣本數(shù)量對識別率的影響。
最后,使用改進型算法對手勢進行識別,同樣將樣本數(shù)量逐漸增多,觀察樣本數(shù)量對手勢識別率的影響,將兩種算法識別的結果進行對比,比較識別率。
整個識別的流程通常是由以下幾步完成的:系統(tǒng)的初始化、檢測動作的狀態(tài)是否開始、記錄數(shù)據(jù)集、檢測動作是否結束,模型對比和識別結果,實驗的流程圖如圖所示。
識別動作時最重要的是準確判斷手勢的開始時刻,因為每一個手勢動作通常可能會連續(xù)擺動來表達含義,所以在進行動作識別時需要采集傳感器信息加速度的變化去判斷是否為開始信號,過程是傳感器采集到數(shù)據(jù)時判斷是否開始,若是開始信號則開始轉換數(shù)據(jù)進行對手勢的識別,當傳感器停止傳輸數(shù)據(jù)時則表動作結束同時語音播放。
根據(jù)實驗結果可知手勢識別率總體上是隨著樣本的訓練次數(shù)增加有微量上升,因此再一次增加樣本的訓練次數(shù)進行實驗對比,來確認訓練的樣本數(shù)對識別率的影響,分別選用經(jīng)過次和次訓練的手勢,總體上手勢的識別率是隨著樣本訓練次數(shù)的增加而略有提升,不過達到一定程度之后識別率就基本保持了穩(wěn)定。
四、研究步驟:
x年x月-x年x月,收集資料,建立模型
x年x月-x年x月,開發(fā)軟件
x年x月-x年x月,教學試驗,評價修改
x年x月-x年x月,擴大試驗,歸納總結
五、參考文獻
[1]李強,張然,鮑國東,姜海燕。聾人大學生心理健康狀況及相關因素分析[J].中國特殊教育,2004,02:69-72.
[2]陸德陽。殘疾人與近代中國殘疾人事業(yè)的發(fā)展[J] .齊魯學刊,2012,06:55-58.
[3]王丹蕾,聶桂平。手語翻譯設備的發(fā)展現(xiàn)狀及未來趨勢[J].設計,2016,(19):115-117.
[4]晶茹,劉麗娜。商務溝通中口譯人員的跨文化意識培養(yǎng)[J].學周刊,2017,01:217-219.
[5]賈建鋒,潘夢佳,馬可心。發(fā)達國家本科招生制度經(jīng)驗借鑒與啟示--基于美國、英國和日本的多案例研究[J].重慶理工大學學報(社會科學),2016,11:118-125.
[6]李金,宋陽,梁洪。語言殘障患者醫(yī)療輔助系統(tǒng)設計[A].中國儀器儀表學會。第九屆全國信息獲取與處理學術會議論文集Ⅱ[C].中國儀器儀表學會,2011:4.
[7]孟繁玲。我國手語翻譯專業(yè)教育的現(xiàn)狀、問題及對策[J].中州大學學報,2013,(03):87-90.
[8]劉卓璇。國內聾人高校課堂手語翻譯問題與對策[J].中州大學學報,2014,(06):61-63.
[9]賈建鋒,潘夢佳,馬可心。發(fā)達國家本科招生制度經(jīng)驗借鑒與啟示--基于美國,英國和日本的多案例研究[J].重慶理工大學學報(社會科學),2016,11:118-12.
[10]HUANG G,BAI Z,KASUN L, et al.Local receptive fields based extremelearning machine[J].IEEE Computational Intelligence Magazine,2015,10(2):18-29.
[11]王衛(wèi)民,賀冬春。自然手語翻譯器系統(tǒng)設計和實現(xiàn)[J].無線互聯(lián)科技,2015,(15):41-42.
【最新計算機畢業(yè)設計開題報告的論文】相關文章:
畢業(yè)設計(論文)開題報告12-04
貿易畢業(yè)設計(論文)開題報告12-06
畢業(yè)設計(論文)開題報告格式12-11
畢業(yè)設計(論文)開題報告要求03-23
畢業(yè)設計開題報告論文題目03-09
最新的論文開題報告模板02-20
畢業(yè)設計(論文)開題報告書寫方法12-04
建筑工程畢業(yè)設計論文開題報告11-27
- 相關推薦