基于H.323協(xié)議的音頻混合方案設(shè)計的論文

時間：2023-02-14 02:58:15 其他類論文我要投稿

相關(guān)推薦

　　摘要：本文根據(jù)H.323協(xié)議，分析了多點處理單元（MCU）的組成，包括多點控制器（MC）和多點處理器（MP）。并在詳細(xì)的分析了音頻多點處理器后，提出了只對滿足條件的m個信道的音頻進(jìn)行音頻混合的方案，有效的刻服了現(xiàn)在比較流行的平均調(diào)整權(quán)重算法的音頻混合方案所產(chǎn)生的缺陷和不足，大大提高了系統(tǒng)對音頻混合的效果。

基于H.323協(xié)議的音頻混合方案設(shè)計的論文

　　關(guān)鍵詞：H.323協(xié)議；音頻混合；設(shè)計

　　近年來，由于網(wǎng)絡(luò)技術(shù)的快速發(fā)展為IP網(wǎng)絡(luò)實現(xiàn)多媒體通信提供了基礎(chǔ)條件，IPTV、視頻會議、多媒體遠(yuǎn)程教育等寬帶網(wǎng)絡(luò)應(yīng)用成為熱點。而視頻會議在實用化方面取得了迅速的發(fā)展，功能也己由原先單純的電視會議功能發(fā)展成遠(yuǎn)程教學(xué)系統(tǒng)、遠(yuǎn)程監(jiān)控系統(tǒng)、遠(yuǎn)程醫(yī)療系統(tǒng)等多方面的綜合業(yè)務(wù)。

　　1、多點控制單元(MCU)

　　H.323協(xié)議在邏輯上可以分為四個組成實體:終端(Terminal)、網(wǎng)關(guān)(Gateway)、網(wǎng)守(Gatekeeper)、多點控制單元(MCU)。

　　多點控制單元用于支持三個以上端點設(shè)備的會議。在H.323系統(tǒng)中，一個多點控制單元由一個多點控制器(MC)和幾個多點處理器(MP)組成，但也可以不包含MP。多點控制器處理終端間的H.245控制信息，從而決定它對視頻和音頻通常的處理能力。在必要情況下，多點控制器還可以判斷哪些視頻流和音頻流需要多播，以控制會議系統(tǒng)使用的資源。

　　視頻會議中，在集體討論和自由發(fā)言的情況下，可能會有多個與會者同時發(fā)言。為了使每個與會者能同時聽到其他所有發(fā)言者的聲音，采用了音頻混合技術(shù)。音頻混合單元從各個終端取得音頻信號，經(jīng)過混合編碼后再發(fā)送到各終端。該技術(shù)的引入使得各終端在接收多個發(fā)言人的音頻信號時，在帶寬占用和信號處理方面，與接收單一發(fā)言人的音頻信號相比，不會增加任何額外負(fù)擔(dān)。

　　為了實現(xiàn)音頻信號混合功能，系統(tǒng)必須具備語音信號編解碼和音頻碼流轉(zhuǎn)換功能。H.323要求所有終端必須支持G.711語音標(biāo)準(zhǔn)，而對G.722，G.728，G.723.1和G.729標(biāo)準(zhǔn)則是可選擇的。對于能夠提供高速帶寬環(huán)境的網(wǎng)絡(luò)，為了保證語音的高質(zhì)量，可以采用速率較高的編碼方式，如G.711, G.722;對于遠(yuǎn)程接入系統(tǒng)，由于帶寬昂貴，則可以采用碼率較低的編碼方式，如G.723.1。相應(yīng)地，MCU必須支持以上各種語音編碼標(biāo)準(zhǔn)。

　　音頻混合單元要求輸入的各路語音信息屬于同一種編碼，但實際應(yīng)用中由于各個終端選用的編碼器可能不同，因而發(fā)往MCU的音頻碼流也可能不同。為了解決這個矛盾，必須在混音之前先進(jìn)行碼流轉(zhuǎn)換，將不同的碼流轉(zhuǎn)換成同一種編碼，再送入音頻混合處理單元。

　　2、音頻混合方案設(shè)計

　　在實際應(yīng)用中，如果與會人數(shù)只有兩人，則只要保證通信是全雙工的，就可以正常地進(jìn)行會議，而無須進(jìn)行混音。如果與會人數(shù)超過3人，則需要采用混音或者轉(zhuǎn)發(fā)機(jī)制。

　　轉(zhuǎn)發(fā)機(jī)制有兩種策略：其一，將其他端點的數(shù)據(jù)都轉(zhuǎn)發(fā)給一個端點；其二，按照約定的某種規(guī)則選出一路進(jìn)行轉(zhuǎn)發(fā)，也就是常見的“話筒傳遞”模式。這兩種模式雖然可以滿足一定層面的需求，但都存在明顯的缺陷。前者會增加網(wǎng)絡(luò)的傳輸負(fù)擔(dān)和端點的處理負(fù)擔(dān)，后者在多人會議的討論中有明顯的反應(yīng)慢效果差的缺陷。如果與會者希望能夠進(jìn)行比較頻繁的切換發(fā)言或者討論，則會出現(xiàn)明顯的斷續(xù)和切換失效等情況。

　　而實時混音則能很好地解決這些問題。實際應(yīng)用中，一般的混音方案都會采用時域疊加作為基本的處理手段。但是根據(jù)前面的分析可知，由于數(shù)字音頻信號存在量化上限和下限的問題，則因疊加運算肯定會造成結(jié)果溢出。通常的處理手段是進(jìn)行溢出檢測，然后再進(jìn)行飽和運算，即超過上限的結(jié)果被置為上限值，超過下限的值置為下限值。這種運算本身破壞了語音信號原有的時域特征，從而引入了噪聲。這就是在某些系統(tǒng)中會出現(xiàn)爆破聲和語音不連續(xù)現(xiàn)象的原因。同時，隨著參與混音的人數(shù)增加，出現(xiàn)溢出的頻率也不斷上升，所以這類方法存在一個上限，而且這個上限值很低，實驗證明，一般在4個終端參與混音時其結(jié)果就有很多噪音和斷續(xù)，無法分辨語流了。

　　3、音頻混合方案的改進(jìn)設(shè)計

　　直接將各路音頻流算術(shù)相加得到音頻混合信號，其優(yōu)點是簡單且易于實現(xiàn)。經(jīng)測試，在輸入語音流少于4路時，能清晰地分辨各路語音信號。但系統(tǒng)仍存在問題。

　　在前述方法的基礎(chǔ)上稍作改進(jìn)可得到另一類混音設(shè)計方法，即將各路音頻碼流解碼后，先對解碼語音信號作一定程度的衰減，再進(jìn)行算術(shù)相加。一般是在各路語音上乘以一個衰減因子1/n，其中n為進(jìn)入混音器的語音流數(shù)目。這種方法能絕對保證相加后的語音信號不會溢出，而且對原算法的修改極少，極易實現(xiàn)。但是它存在的關(guān)鍵問題是，當(dāng)進(jìn)入混音器的語音流數(shù)較多時，各路語音信號的衰減程度都比較大，混音的結(jié)果是所有信號都比較弱，無法突出重點，嚴(yán)重時可能所有聲音都聽不清楚。

　　實現(xiàn)這一改進(jìn)策略時，仍然是在每個語音通道上綁定一個解碼器，負(fù)責(zé)該路語音的解碼，但無需再綁定編碼器。系統(tǒng)中最多同時存在m+l個編碼器，其中m個分配給m路被選中的語音通道，另一個分配給音頻混合信號S，對S編碼后的碼流發(fā)送到所有未被選中的終端和廣播終端。由于解碼器的運算復(fù)雜度遠(yuǎn)小于編碼器，因此系統(tǒng)的計算負(fù)荷大大降低。改進(jìn)后的混音器只選取音量最大的m路進(jìn)行混音，其余信號被衰減，合理選擇m的值，不僅使會議發(fā)言重點得以突出，與會者能獲得最重要的發(fā)言信息，而且一般情況下都不會發(fā)生溢出情況。這一改進(jìn)措施同時解決了前述兩種方法所存在的問題和缺陷。

　　某個編碼器在由一個語音通道轉(zhuǎn)而分配給另一個語音通道時，必須先進(jìn)行初始化(G.711a/u除外)。必須注意，要盡量減少編碼器和語音通道之間對應(yīng)關(guān)系的改變。

　　4、結(jié)束

　　本文在研究了H.323協(xié)議的基礎(chǔ)上，研究了MCU的音頻混合模型，并詳細(xì)闡述了音頻混合方案，為了過濾混合時的嘈音和增加臨場感，提出了音頻混合方案的改進(jìn)方案。

【基于H.323協(xié)議的音頻混合方案設(shè)計的論文】相關(guān)文章：

利用光纜解決音頻信號傳輸問題的論文04-25

論文課題研究方案設(shè)計06-04

基于問題導(dǎo)引的探究式教學(xué)研究論文08-03

基于遺忘理論的英語移動學(xué)習(xí)模型探究的論文05-20

基于單片機(jī)監(jiān)控系統(tǒng)的研究畢業(yè)論文06-14

高�；旌鲜浇虒W(xué)法探討論文04-21

高職院校基于問題模式的高等數(shù)學(xué)教學(xué)的研究論文05-06

口腔醫(yī)學(xué)教育基于問題的學(xué)習(xí)教學(xué)模式論文05-07

淺談基于學(xué)習(xí)對象理論的教學(xué)資源庫研究的論文06-22

基于藝術(shù)展覽的公共文化服務(wù)體系建設(shè)論文04-19

久久久久无码精品,四川省少妇一级毛片,老老熟妇xxxxhd,人妻无码少妇一区二区

基于H.323協(xié)議的音頻混合方案設(shè)計的論文