- 相關推薦
鍵控技術的數(shù)字實現(xiàn)與發(fā)展
鍵控技術的數(shù)字實現(xiàn)與發(fā)展
我們知道傳統(tǒng)視頻領域中的鍵控技術的本質(zhì)就是應用視頻開關控制圖象的 "摳"和"填"。"摳"就是利用前景物體輪廓作為遮擋控制電平將背景畫面的顏色沿該輪廓線摳掉,使背景變成黑色。"填"就是將所要疊加的視頻信號填到被摳掉的無圖象區(qū)域,而最終生成前景物體與疊加背景合成的圖象,如圖1所示。在這個處理過程中,依賴于前景物體所產(chǎn)生的遮擋輪廓信號,作為外鍵信號輸入,背景圖象中輸出像素的鍵值為0%,而前景物體輸出像素的鍵值為100%。這種傳統(tǒng)處理方式存在的缺陷是對于前景物體的軟邊,比如頭發(fā)絲,會產(chǎn)生蘭色鑲邊,就是我們通常說的"蘭溢出"(blue spill)。
在早期的視頻領域要想很好的解決"蘭溢出"的發(fā)生,很好的保留前景圖象的細節(jié),或者是針對半透明前景物體作鍵處理,是一件很難做到的事情。但是在數(shù)字視頻領域里,由于引入多種數(shù)字色鍵處理方式,使得我們基本上走出了此類困惑。本文將介紹幾種數(shù)字色鍵的處理方法,并且與傳統(tǒng)方法進行一些比較,希望能使讀者可以對數(shù)字鍵控技術有更多的認識。
1傳統(tǒng)鍵控原理
由于人體膚色的原因,傳統(tǒng)的鍵控處理中背景畫面的顏色一般選擇
高飽和度的蘭色和綠色,所需的門控開關信號稱為鍵控信號或鍵信號,鍵信號由作為鍵源的視頻信號通過鍵處理器產(chǎn)生。一個鍵開關信號在有鍵信號(鍵值為100%)的時候背景圖像通不過,讓前景圖像通過,沒有鍵信號(鍵值為0%)的時候讓背景圖像通過,而前景圖像通不過,根據(jù)不同的前景圖象視頻所獲得的,并因此控制視頻切換開關的鍵信號的頻率,大約在幾十Hz--幾MHz。如此一個模擬色鍵處理的結果即是我們通常所說的"扣像"。
圖2 為傳統(tǒng)鍵控處理原理示意圖。
傳統(tǒng)鍵信號波形是前后沿很陡的矩形脈沖信號,在合成輸出圖像時
前景物體與背景畫面的分界處有鋸齒、抖動和突變現(xiàn)象,使人感到生硬和不自然,還存在分界處彩色閃爍和有幕布色鑲邊等現(xiàn)象。另外,對于自然景物中的半透明物體作為合成圖像前景圖像時,其后面的背景圖像應該是部分地透明,但是在傳統(tǒng)色鍵處理時,任何瞬間其鍵信號所控制的視頻切換開關不是接通就是斷開,鍵信號只有兩種取值,不是高電平就是低電平,因此傳統(tǒng)色鍵合成圖像中前景圖像不是全透過就是全不透過其后的背景圖像,這與我們?nèi)粘R姷降淖匀痪坝^是不同的,效果十分生硬與缺乏真實感的,我們稱之為硬色鍵。在硬色鍵中,鍵信號為高電平時視頻開關接通,前景圖像全透過其后的背景圖像,鍵信號為低電平時視頻開關切斷,前景圖像全不透過其后的背景圖像。
2數(shù)字視頻領域的鍵控技術
數(shù)字色鍵主要使用數(shù)字格式的視頻做鍵處理,而不是建立一個新的技術概念。首先分別介紹數(shù)字鍵控處理中涉及的相關概念及技術。
2.1相關概念
(1)深度鍵(depth-key)
深度鍵不是鍵技術,它根本是解決主持人與三維虛擬場景的前后遮擋關系,以確定鍵或非鍵。
深度鍵的概念是由三維實時虛擬演播室技術引入的,與傳統(tǒng)的鍵控技術不同,目前市場出現(xiàn)的三維實時虛擬演播室產(chǎn)品中,合成圖象的真實性主要表現(xiàn)在可以產(chǎn)生一個縱深方向的信息(即Z軸方向的參數(shù)值,稱為Z值),它不象二維處理時所用的層技術,是一種基于三維畫面的混合技術,稱為深度鍵(depth-key)。
虛擬演播室的出現(xiàn),對傳統(tǒng)色鍵技術提出了更高的要求,為了使同一節(jié)目中的主持人、實物道具和虛擬背景之間可以相互動態(tài)遮擋,實現(xiàn)主持人在虛擬或?qū)嶋H物體后方或前方行走,要求色鍵具有縱深方向的信息,即虛擬攝象機到每個像素的距離。使用傳統(tǒng)的色鍵技術,將主持人從蘭色幕布中提取出來的同時產(chǎn)生一個前景遮擋信號即鍵信號,然后通過深度鍵發(fā)生器求出色鍵的深度值。深度鍵發(fā)生器有兩種:一種是將物體分成有限數(shù)目的分層級;另一種是將像素分成等級的像素級。在分層級深度鍵中,物體被分別歸類到數(shù)目有限的幾個深度層中,因此演員在虛擬場景中的位置無法連續(xù)變化。而在像素級深度鍵中,構成虛擬場景中的每一個像素都有相應的Z軸深度值。因此演員在虛擬場景中的位置可以連續(xù)變化。
目前,獲得深度鍵的方法大致有兩種:一種靠近似判斷的方法得出。它是用近似的方法判斷出前景主持人和攝象機的相對距離,并且用這個值作為整個前景的深度值。如果主持人移動,那么這個值也將改變。
通過對合成畫面上每個像素Z值的計算和實際內(nèi)容的需要用手控方式?jīng)Q定前景主持人和虛擬背景的相對關系,這種方法實現(xiàn)起來比較容易,缺陷是逼真度差,而且對主持人的要求較高。另一種獲得Z值的方法是采用"自動主持人跟蹤系統(tǒng)"。它主要是由一個固定在主持人身上的紅外發(fā)射器和一套安裝在演播室墻上的紅外接收裝置完成。它可以準確定位出主持人的三維位置,自動識別主持人和虛擬背景的相對位置關系。
(2)數(shù)字色鍵
數(shù)字色鍵與模擬色鍵的最大不同在于它可以在數(shù)字領域的1千6百萬種顏色中任選一種,這1千6百萬種顏色得自計算機的32位機器字長,其中有8位專門用于表示每一種顏色的256種明暗(灰度)變化(即下文提到的ALPHA鍵),另外的24位可以表示224種(約為1千6百萬種)顏色。當然這是由計算機的處理能力得出的,并不代表自然界真實存在的顏色,有很大一部分為非法色。模擬色鍵在做扣像時,可以不分級的連續(xù)選擇無數(shù)色作為鍵出色,通常選擇高飽和度的蘭或綠色。高質(zhì)量的數(shù)字色鍵針對畫面的三個分量(Y,B-Y,R-Y)的每一路進行處理,并分別產(chǎn)生一個線性鍵。這種將一個色鍵分為三個鍵來處理的方法,可以允許保留更多的圖象細節(jié)。
由于色鍵處理是針對背景畫面的某一種顏色分量進行鍵出覆蓋,因此鍵源信號的質(zhì)量高低決定了鍵信號的質(zhì)量。為了對色度信號做盡可能細的區(qū)分,帶寬的保證是必不可少的。眾所周知,模擬或數(shù)字分量的NTSC或PAL制全電視信號的帶寬為6MHz,而在ITU-601數(shù)字分量演播室標準內(nèi),采用對Y,(R-Y),(B-Y)3個信號分量分別編碼的方式,取樣頻率為13.5 MHz,取樣結構為4:2:2,假如以10bit 作為量化比特數(shù),其編碼后的總碼率R=10*(13.5 6.75 6.75)=270M
【鍵控技術的數(shù)字實現(xiàn)與發(fā)展】相關文章:
談數(shù)字IC設計技術08-25
如何通過內(nèi)部控制實現(xiàn)企業(yè)持續(xù)性發(fā)展05-21
酒店管理的數(shù)字化發(fā)展論文(精選8篇)09-30
淺談傳統(tǒng)美術與數(shù)字美術的發(fā)展及其類型論文04-15
企業(yè)知識管理的實現(xiàn)技術和工具的電商論文05-02
計算機技術應用與發(fā)展05-01
納米復合材料技術發(fā)展及前景03-10