實時混音的實現

時間：2024-06-23 00:12:18 計算機畢業(yè)論文我要投稿

相關推薦

實時混音的實現

摘要本文主要討論多路聲音實時混疊的實現方法，以及實現過程中對一些特殊情況的處理。關鍵詞 Wave 混音混音器?

1.引言?

　　將多個Wave文件或多路Wave數據同時在Wave設備上輸出，就可同時聽到多個不同的聲音，達到混音的效果。如果是將多個不同端點的話音數據經局域網絡傳輸到達某一個端點再經該端點的Wave設備輸出，就能同時聽到多個人的話音，從而實現局域網絡中多方的話音交談。?

　　在網絡上實現話音交談，特別強調實時性，要盡量保證話音的平滑、連續(xù)，因此為了保證話音數據連續(xù)，減少話音數據存儲帶來的延時，在具體實現中，話音的錄制和播放都不采用文件的形式，錄制和播放的話音數據都存在緩沖區(qū)中。在Windows系統中，一般情況下，高層Wave接口函數無法直接播放緩沖區(qū)中的話音數據，而必須用底層函數來實現，常用的是Windows API中的Wave函數。將Wave數據在Wave設備上輸出使用的是WaveOutWrite函數，但是該函數不支持多路Wave數據的同時播放，為了能達到多路Wave數據同時播放的效果，對緩沖區(qū)中多路Wave數據進行必要的預處理后，再提交給Wave輸出設備播放。實現原理如圖1所示。?

圖1 多路Wave混音的實現原理

2.實現原理?

　　實時地混音，就是將多路Wave數據進行相互疊加處理到另一個目的緩沖區(qū)，最終將該目的的緩沖區(qū)提交給Wave輸出設備。?

將每一路Wave數據作為一個單獨通道，分別從每個通道取一數據片段，把取得的幾個數據片段相互疊加，然后存進另外一個目的緩沖區(qū)中。為了便于處理，緩沖區(qū)通常采用數組的形式存放Wave數據。

如果話音數據，采用采樣頻率1025Hz，8位單聲道的數據格式，那么一秒的話音數據量為11025個字節(jié)。?

為了達到實時的效果，目的緩沖區(qū)通常都設置比較小，大約可存放1/8秒的話音數據量，對于前述的話音格式，目的緩沖區(qū)的大小為11025/8＝1375個字節(jié)。?

下面具體看一下Wave數據以數組形式存放時的混音過程。如圖2所示。

圖2 多路Wave數據的疊加過程

假設有4路Wave數據，目的緩沖區(qū)的大小為1378，混音子函數調用為 Mixer(lpDest,rgpCDdata,4,1378)。?

下面給出混音子函數的實現。其中l(wèi)pDest為目的緩沖區(qū)，rgWaveSrc為多路Wave數據源，iNumWaves為Wave數據源的通道數，wLen為目的緩沖區(qū)長度。?

Void mixit(LPSAMPLE lpDest,LPSAMPLE rgWaveSrc［］，intiNumWaves,WORDwLen)?

{?int,,iSum;?

WORD ctr;

ctr=0?

While(wLen)?

iSum=128;/?*靜音時數值為128?*/?

for(I=0;I＜iNumWaves;I )?

iSum=iSum *(rgWaveSrc［］ ctr)-128;?

PEG(int)0,iSum,(int)225);/*對轉換結果處理?*/?

*lpDest =iSum;?

ctr ;?

wLen--;?

}

注意一點的是對于單聲道數據一個字節(jié)表示一個采樣值，采樣值在0-255之間，各個通道的對應Wave數據相加后，就會溢出，還需要將相加結果轉換成0-255之間的數值。?

　　將該目的緩沖區(qū)中的Wave數據經WaveOutWrite函數輸出，就能同時聽到四個不同的聲音，當Wave輸出設備播放完目的緩沖區(qū)中的數據便返回，請求用戶提供更多的Wave輸出數據，因為Wave輸出設備只能輸出提交給它的Wave數據；另外，對Wave數據進行混音還需要一定的時間，因此當提交一個目的緩沖區(qū)中的數據給Wave輸出設備后，就必須馬上混疊另一段Wave數據來提交給Wave輸出設備，作為下一個輸出的數據緩沖區(qū)，避免聲音輸出的中斷，后一個目的緩沖區(qū)提交后被輸出設備放入輸出隊列中，當第一個目的緩沖區(qū)中輸出完畢后再輸出它的數據，當輸出設備在輸出第二個目的緩沖區(qū)的數據時，又能將第三段數據混合進第一個目的緩沖區(qū)中，然后重新提交，直到提交完所有的Wave數據，那時就將停止輸出。在實際應用中目的緩沖區(qū)的數要多個，一般為3至4個，圖3給出了混音、提交的完整過程。

3 混音、提交過程

3.特殊情況的處理?

上面討論了混音及播放的一般過程，但在實際應用中，還需要到對一些特殊情況進行處理。

●各通道中待混音的Wave數據長度不同。?

...

圖4 各通道中的Wave數據長度不同

這種情況是指當前要混音的某一通道中的聲音片段數據比Wave混音器所定義的緩沖區(qū)長度要小，這時該路被采樣的聲音沒有足夠的數據與Wave混音器中的數據相混疊。?

對于這種情況，采用以下的方法可以有效地解決，主要包括三步：?

a) Wave混音器在混音前首先判斷是否有這種情況出現，如果出現，Wave混音器必須確定該Wave通道中所能被采樣的數據長度；?

b) 按照該通道所能被采樣的數據長度，將該路的數據與其它多個通道中的數據相混疊存入Wave混音器的目的緩沖區(qū)中；?

c) 停止對該通道Wave數據的采樣混疊處理，只采樣混疊其它通道中的Wave數據，存入Wave混音器目的緩沖區(qū)的余下部分。?

因為在接下來的采樣混音過程還會出現相同的情況，所以必須重復上述a-c的步驟，直到Wave混音器的緩沖區(qū)填充完畢或再沒有可填充的數據為止。這時將該Wave混音器的目的緩沖區(qū)提交給Wave輸出設備。?