- 相關(guān)推薦
基于H.323協(xié)議的音頻混合方案設(shè)計的論文
摘 要:本文根據(jù)H.323協(xié)議,分析了多點處理單元(MCU)的組成,包括多點控制器(MC)和多點處理器(MP)。并在詳細(xì)的分析了音頻多點處理器后,提出了只對滿足條件的m個信道的音頻進(jìn)行音頻混合的方案,有效的刻服了現(xiàn)在比較流行的平均調(diào)整權(quán)重算法的音頻混合方案所產(chǎn)生的缺陷和不足,大大提高了系統(tǒng)對音頻混合的效果。
關(guān)鍵詞:H.323協(xié)議;音頻混合;設(shè)計
近年來,由于網(wǎng)絡(luò)技術(shù)的快速發(fā)展為IP網(wǎng)絡(luò)實現(xiàn)多媒體通信提供了基礎(chǔ)條件,IPTV、視頻會議、多媒體遠(yuǎn)程教育等寬帶網(wǎng)絡(luò)應(yīng)用成為熱點。而視頻會議在實用化方面取得了迅速的發(fā)展,功能也己由原先單純的電視會議功能發(fā)展成遠(yuǎn)程教學(xué)系統(tǒng)、遠(yuǎn)程監(jiān)控系統(tǒng)、遠(yuǎn)程醫(yī)療系統(tǒng)等多方面的綜合業(yè)務(wù)。
1、多點控制單元(MCU)
H.323協(xié)議在邏輯上可以分為四個組成實體:終端(Terminal)、網(wǎng)關(guān)(Gateway)、網(wǎng)守(Gatekeeper)、多點控制單元(MCU)。
多點控制單元用于支持三個以上端點設(shè)備的會議。在H.323系統(tǒng)中,一個多點控制單元由一個多點控制器(MC)和幾個多點處理器(MP)組成,但也可以不包含MP。多點控制器處理終端間的H.245控制信息,從而決定它對視頻和音頻通常的處理能力。在必要情況下,多點控制器還可以判斷哪些視頻流和音頻流需要多播,以控制會議系統(tǒng)使用的資源。
視頻會議中,在集體討論和自由發(fā)言的情況下,可能會有多個與會者同時發(fā)言。為了使每個與會者能同時聽到其他所有發(fā)言者的聲音,采用了音頻混合技術(shù)。音頻混合單元從各個終端取得音頻信號,經(jīng)過混合編碼后再發(fā)送到各終端。該技術(shù)的引入使得各終端在接收多個發(fā)言人的音頻信號時,在帶寬占用和信號處理方面,與接收單一發(fā)言人的音頻信號相比,不會增加任何額外負(fù)擔(dān)。
為了實現(xiàn)音頻信號混合功能,系統(tǒng)必須具備語音信號編解碼和音頻碼流轉(zhuǎn)換功能。H.323要求所有終端必須支持G.711語音標(biāo)準(zhǔn),而對G.722,G.728,G.723.1和G.729標(biāo)準(zhǔn)則是可選擇的。對于能夠提供高速帶寬環(huán)境的網(wǎng)絡(luò),為了保證語音的高質(zhì)量,可以采用速率較高的編碼方式,如G.711, G.722;對于遠(yuǎn)程接入系統(tǒng),由于帶寬昂貴,則可以采用碼率較低的編碼方式,如G.723.1。相應(yīng)地,MCU必須支持以上各種語音編碼標(biāo)準(zhǔn)。
音頻混合單元要求輸入的各路語音信息屬于同一種編碼,但實際應(yīng)用中由于各個終端選用的編碼器可能不同,因而發(fā)往MCU的音頻碼流也可能不同。為了解決這個矛盾,必須在混音之前先進(jìn)行碼流轉(zhuǎn)換,將不同的碼流轉(zhuǎn)換成同一種編碼,再送入音頻混合處理單元。
2、音頻混合方案設(shè)計
在實際應(yīng)用中,如果與會人數(shù)只有兩人,則只要保證通信是全雙工的,就可以正常地進(jìn)行會議,而無須進(jìn)行混音。如果與會人數(shù)超過3人,則需要采用混音或者轉(zhuǎn)發(fā)機(jī)制。
轉(zhuǎn)發(fā)機(jī)制有兩種策略:其一,將其他端點的數(shù)據(jù)都轉(zhuǎn)發(fā)給一個端點;其二,按照約定的某種規(guī)則選出一路進(jìn)行轉(zhuǎn)發(fā),也就是常見的“話筒傳遞”模式。這兩種模式雖然可以滿足一定層面的需求,但都存在明顯的缺陷。前者會增加網(wǎng)絡(luò)的傳輸負(fù)擔(dān)和端點的處理負(fù)擔(dān),后者在多人會議的討論中有明顯的反應(yīng)慢效果差的缺陷。如果與會者希望能夠進(jìn)行比較頻繁的切換發(fā)言或者討論,則會出現(xiàn)明顯的斷續(xù)和切換失效等情況。
而實時混音則能很好地解決這些問題。實際應(yīng)用中,一般的混音方案都會采用時域疊加作為基本的處理手段。但是根據(jù)前面的分析可知,由于數(shù)字音頻信號存在量化上限和下限的問題,則因疊加運算肯定會造成結(jié)果溢出。通常的處理手段是進(jìn)行溢出檢測,然后再進(jìn)行飽和運算,即超過上限的結(jié)果被置為上限值,超過下限的值置為下限值。這種運算本身破壞了語音信號原有的時域特征,從而引入了噪聲。這就是在某些系統(tǒng)中會出現(xiàn)爆破聲和語音不連續(xù)現(xiàn)象的原因。同時,隨著參與混音的人數(shù)增加,出現(xiàn)溢出的頻率也不斷上升,所以這類方法存在一個上限,而且這個上限值很低,實驗證明,一般在4個終端參與混音時其結(jié)果就有很多噪音和斷續(xù),無法分辨語流了。
3、音頻混合方案的改進(jìn)設(shè)計
直接將各路音頻流算術(shù)相加得到音頻混合信號,其優(yōu)點是簡單且易于實現(xiàn)。經(jīng)測試,在輸入語音流少于4路時,能清晰地分辨各路語音信號。但系統(tǒng)仍存在問題。
在前述方法的基礎(chǔ)上稍作改進(jìn)可得到另一類混音設(shè)計方法,即將各路音頻碼流解碼后,先對解碼語音信號作一定程度的衰減,再進(jìn)行算術(shù)相加。一般是在各路語音上乘以一個衰減因子1/n,其中n為進(jìn)入混音器的語音流數(shù)目。這種方法能絕對保證相加后的語音信號不會溢出,而且對原算法的修改極少,極易實現(xiàn)。但是它存在的關(guān)鍵問題是,當(dāng)進(jìn)入混音器的語音流數(shù)較多時,各路語音信號的衰減程度都比較大,混音的結(jié)果是所有信號都比較弱,無法突出重點,嚴(yán)重時可能所有聲音都聽不清楚。
實現(xiàn)這一改進(jìn)策略時,仍然是在每個語音通道上綁定一個解碼器,負(fù)責(zé)該路語音的解碼,但無需再綁定編碼器。系統(tǒng)中最多同時存在m+l個編碼器,其中m個分配給m路被選中的語音通道,另一個分配給音頻混合信號S,對S編碼后的碼流發(fā)送到所有未被選中的終端和廣播終端。由于解碼器的運算復(fù)雜度遠(yuǎn)小于編碼器,因此系統(tǒng)的計算負(fù)荷大大降低。改進(jìn)后的混音器只選取音量最大的m路進(jìn)行混音,其余信號被衰減,合理選擇m的值,不僅使會議發(fā)言重點得以突出,與會者能獲得最重要的發(fā)言信息,而且一般情況下都不會發(fā)生溢出情況。這一改進(jìn)措施同時解決了前述兩種方法所存在的問題和缺陷。
某個編碼器在由一個語音通道轉(zhuǎn)而分配給另一個語音通道時,必須先進(jìn)行初始化(G.711a/u除外)。必須注意,要盡量減少編碼器和語音通道之間對應(yīng)關(guān)系的改變。
4、結(jié)束
本文在研究了H.323協(xié)議的基礎(chǔ)上,研究了MCU的音頻混合模型,并詳細(xì)闡述了音頻混合方案,為了過濾混合時的嘈音和增加臨場感,提出了音頻混合方案的改進(jìn)方案。
【基于H.323協(xié)議的音頻混合方案設(shè)計的論文】相關(guān)文章:
利用光纜解決音頻信號傳輸問題的論文04-25
論文課題研究方案設(shè)計06-04
基于問題導(dǎo)引的探究式教學(xué)研究論文08-03
基于遺忘理論的英語移動學(xué)習(xí)模型探究的論文05-20
基于單片機(jī)監(jiān)控系統(tǒng)的研究畢業(yè)論文06-14
高;旌鲜浇虒W(xué)法探討論文04-21
高職院校基于問題模式的高等數(shù)學(xué)教學(xué)的研究論文05-06
口腔醫(yī)學(xué)教育基于問題的學(xué)習(xí)教學(xué)模式論文05-07