淺議自然語言信息處理的智能化應(yīng)用
論文關(guān)鍵詞:自然處理 語言 人工智能
論文摘要:自然語言信息處理是人機(jī)交互的關(guān)鍵技術(shù),已得到高速的發(fā)展。論文首先簡單的論述了該技術(shù)的起源以及發(fā)展,然后重點研究了該技術(shù)在文本和語音方面的廣泛應(yīng)用?梢灶A(yù)測隨著技術(shù)的進(jìn)一步發(fā)展,自然語言信息處理技術(shù)將被應(yīng)用到更加廣泛的領(lǐng)域。
一、引言
近年來隨著計算機(jī)技術(shù)和人工智能的快速發(fā)展,自然語言信息處理技術(shù)已取得了長足的發(fā)展。于此同時人們在快速信息檢索、語言翻譯、語音控制等方面的需求越來越迫切。如何將自然語言處理中取得的研究成果應(yīng)用于文本、語音等方面已成為目前應(yīng)用研究的一個關(guān)鍵。論文將從自然語言信息處理的基礎(chǔ)出發(fā),系統(tǒng)的論述它在語音和文本方面的廣泛應(yīng)用。
二、自然語言信息處理技術(shù)簡介
自然語言信息處理技術(shù)產(chǎn)生于上個世紀(jì)40年代末期,它是通過采用計算機(jī)技術(shù)來對自然語言進(jìn)行加工處理的一項技術(shù)。該技術(shù)主要是為了方便人與計算機(jī)之間的交流而產(chǎn)生的。由于計算機(jī)嚴(yán)密規(guī)范的特性與自然語言的靈活多變使得自然語言處理技術(shù)較復(fù)雜。通過多年的發(fā)展,該項技術(shù)已取得了巨大的進(jìn)步。其處理過程可歸納為:語言形式化描述、處理算法設(shè)計、處理算法實現(xiàn)和評估。其中,語言形式化描述就是通過對自然語言自身規(guī)律進(jìn)行研究,進(jìn)而采用的方法將其描述出來,以便于計算機(jī)處理,也可認(rèn)為是對自然語言進(jìn)行數(shù)學(xué)建模。處理的算法設(shè)計就是將數(shù)學(xué)形式化描述的語言變換為計算機(jī)可操作、控制的對象。處理算法實現(xiàn)和評估就是通過程序設(shè)計語言(如C語言)將算法實現(xiàn)出來,并對其性能和功能進(jìn)行評估。它主要涉及到計算機(jī)技術(shù)、數(shù)學(xué)(主要是建模)、學(xué)、語言學(xué)等多個方面。
三、智能應(yīng)用
通過多年的研究,自然語言信息處理技術(shù)已經(jīng)取得了巨大的進(jìn)步,特別是在應(yīng)用方面。它主要被應(yīng)用于文本和語音兩個方面。
。ㄒ唬┳匀徽Z言信息處理在文本方面的智能應(yīng)用
在文本方面,自然語言處理技術(shù)主要應(yīng)用在語言翻譯、字符識別、文本信息過濾、信息檢索與重組等方面。其中,語言自動翻譯是一個十分重要并具有極大現(xiàn)實意義的項目。它涉及到計算機(jī)技術(shù)、數(shù)學(xué)建模技術(shù)、學(xué)以及語言學(xué)等多個方面的學(xué)科。通過近些年的努力已得到了一定的發(fā)展。自然語言處理技術(shù)已在多個方面提升了翻譯的效率和準(zhǔn)確性。如自然語言處理中的語言形態(tài)分析與歧義分析對翻譯技術(shù)來說十分重要,可以很好的處理翻譯中的多意現(xiàn)象和歧義問題,從而提高翻譯的準(zhǔn)確性。字符識別具有廣泛的商業(yè)應(yīng)用前景,它是模式識別的一個分支。字符識別的主要過程可分為預(yù)處理、識別以及后期處理。目前,字符識別已得到了廣泛的應(yīng)用,并且效果良好,但還存在識別不準(zhǔn)確的問題,其主要問題就出在合理性上,其中后期處理就涉及到采用詞義或語料庫等對識別結(jié)果進(jìn)行合理性驗證,通過該技術(shù)就能很好的解決識別不準(zhǔn)確的問題,當(dāng)出現(xiàn)識別不準(zhǔn)確、出現(xiàn)多個識別結(jié)果時可以通過合理性驗證技術(shù)高效的過濾掉異常選項,從而實現(xiàn)快速、準(zhǔn)確的識別。目前自然語言信息處理技術(shù)在文本方面應(yīng)用最廣的就是文本檢索。通過采用自然語言信息處理技術(shù),一方面能快速分析用戶輸入信息并進(jìn)行準(zhǔn)確理解為檢索提供更加準(zhǔn)確的關(guān)鍵詞,并且可以擴(kuò)展檢索輸入的范圍,讓其不僅僅局限在文本輸入方面,如采用語音輸入或基于圖像的輸入;另一方面,通過采用自然語言信息處理技術(shù)可以對搜索到的信息進(jìn)行處理讓用戶獲取的是更加有效、準(zhǔn)確的信息而不是海量的信息源(如許多網(wǎng)頁)。因為將自然語言處理技術(shù)與文本重組技術(shù)相結(jié)合就可以極大的提高檢索的效果,縮小答案的范圍,提高準(zhǔn)確性。當(dāng)然,還可以提高檢索的效率。目前,在中文全文檢索中已得到了廣泛的應(yīng)用,并且效果良好。
如果能進(jìn)一步的研究自然語言信息處理技術(shù),將能實現(xiàn)信息的自動獲取與重組,這樣將能實現(xiàn)自動摘要生成、智能文本生成、文件自動分類與自動整理。若能進(jìn)一步結(jié)合人工智能技術(shù),將能實現(xiàn)規(guī)律探索、自動程序設(shè)計、智能決策等諸多方面的應(yīng)用。這樣可以減輕人類的工作強(qiáng)度,讓我們從繁瑣的基礎(chǔ)工作中走出來,擁有更多思考的時間,從而能更加有效的推動技術(shù)的進(jìn)步。
(二)自然語言信息處理在語音方面的智能應(yīng)用
在語音方面,自然語言處理技術(shù)主要應(yīng)用在自動同聲傳譯、機(jī)器人聊天系統(tǒng)、語音挖掘與多媒體挖掘以及特定人群智能輔助系統(tǒng)等方面。其中,自動同聲傳譯主要涉及到語音建模、識別以及語言翻譯等方面,采用自然語言處理技術(shù)可以對自動同聲傳譯的每個方面都能得到提高,最直接的`部分就是語言翻譯部分,同時還可能涉及到語音與文本的轉(zhuǎn)換。特別是在語音和文本的轉(zhuǎn)換方面,目前在中文出來中出現(xiàn)的一個問題是音似問題,即音似字不同的情況,對這種情況如果能采用自然語言處理技術(shù)來對其進(jìn)行校驗,將能提高其轉(zhuǎn)換的效果,從而提高轉(zhuǎn)換的質(zhì)量和準(zhǔn)確性。機(jī)器人聊天系統(tǒng)涉及到更加廣泛的內(nèi)容,如自動回答系統(tǒng)。在機(jī)器人聊天系統(tǒng)中不可避免的涉及到語音與文本的轉(zhuǎn)換、自動回答以及邏輯推理,通過自然語言處理技術(shù)將能在意義理解、邏輯推理和知識應(yīng)用等方面得到明顯提高,從而使得應(yīng)答的速度和回復(fù)的針對性和準(zhǔn)確性等方面都得到一定的提高,從而提高聊天系統(tǒng)的應(yīng)用性。在語音挖掘與多媒體挖掘方面,自然語言處理技術(shù)的應(yīng)用主要體現(xiàn)在增強(qiáng)意義理解和提高檢索速度這兩個方面。通過該技術(shù)一方面能根據(jù)準(zhǔn)確的獲取語音所包含的意義,從而為搜集信息提供基礎(chǔ)。同時,由于采用該技術(shù)也有助于數(shù)據(jù)挖掘中的對相關(guān)信息的檢索和歸納。
隨著人工智能、計算機(jī)視覺等技術(shù)的快速發(fā)展、自然語言處理技術(shù)將能應(yīng)用于諸如自動場景解說系統(tǒng)等。也就是自然語言處理技術(shù)再結(jié)合圖像理解技術(shù)和邏輯推理技術(shù),就能準(zhǔn)確的描述當(dāng)前場景發(fā)生了什么事情,如果能和上一個場景進(jìn)行比較就能及時的描述場景的變化,并通過有效的組織就能實現(xiàn)對場景的自動描述。再進(jìn)一步利用人工智能技術(shù)、知識庫及語音生成技術(shù)就能實現(xiàn)場景的自動解說,甚至能實現(xiàn)如自動足球運動這樣快速場景變換的解說。同時,還能對特定人群提供輔助,如為盲人提供輔助的系統(tǒng),幫助盲人識別物體以及其他的一些幫助。也可以應(yīng)用于語音控制,語音控制目前也具有廣泛的需求,可以應(yīng)用在很多方面,將自然語言處理技術(shù)、語音建模技術(shù)、計算機(jī)技術(shù)以及控制技術(shù)相結(jié)合就能實現(xiàn)語音控制,甚至能應(yīng)用于工廠的智能控制和。
四、結(jié)論
近年來自然語言處理獲得了巨大的發(fā)展,其關(guān)鍵技術(shù)也獲得了突破。該技術(shù)所開發(fā)的新技術(shù)能對文本處理與語音業(yè)務(wù)處理產(chǎn)生廣泛而深遠(yuǎn)的影響。目前,可以肯定的是自然語言處理技術(shù)能對文本處理與語音處理在建模、識別、理解方面將產(chǎn)生極大的作用,甚至可以預(yù)測隨著該技術(shù)的進(jìn)一步發(fā)展,將對多媒體技術(shù)及應(yīng)用起到重大的作用。如果經(jīng)過進(jìn)一步的開發(fā),該技術(shù)將能對目前控制方式產(chǎn)生較大的影響。
參考文獻(xiàn):
[1]王丁,李向宏,王鑫.機(jī)器翻譯轉(zhuǎn)換生成研究[J].信息技術(shù),2002,6:68-70
[2]周會平,王挺,陳火旺.漢英翻譯系統(tǒng)IcENT的中間語言設(shè)計[J].計算機(jī)研究與發(fā)展,2000,37,3:336-343
[3]侯志霞,曹軍.自然語言處理的發(fā)展概況及前景展望[J].山東教學(xué),2003,5:53-55
【淺議自然語言信息處理的智能化應(yīng)用】相關(guān)文章: