TMS320C62X DSP的混合編程研究

時(shí)間：2024-08-27 02:29:48 理工畢業(yè)論文我要投稿

相關(guān)推薦

摘要：目前，Ｃ語言和匯編語言的混合編程已經(jīng)在ＴＩ公司的ＴＭＳ３２０Ｃ６２Ｘ上成為一種最流行的編程方法。闡述了基于ＴＭＳ３２０Ｃ６２Ｘ的Ｃ語言和匯編語言混合編程應(yīng)遵循的接口規(guī)范以及并行匯編代碼的編寫。給出了一個(gè)基于ＴＭＳ３２０Ｃ６２Ｘ的運(yùn)動(dòng)補(bǔ)償?shù)幕旌暇幊淘O(shè)計(jì)實(shí)例。

ＴＭＳ３２０Ｃ６２Ｘ是美國(guó)德州儀器公司?ＴＩ?的新一代高性能定點(diǎn)數(shù)字信號(hào)處理器（ＤＳＰ）芯片�；冢模樱械能浖O(shè)計(jì)問題，就是采用編程語言進(jìn)行算法實(shí)現(xiàn)并使程序效率盡量滿足實(shí)時(shí)性要求。ＴＩＤＳＰ的軟件設(shè)計(jì)可以采用匯編語言、高級(jí)語言?Ｃ／Ｃ＋＋?以及Ｃ語言與匯編語言的混合編程。完全采用匯編語言編程復(fù)雜性高、開發(fā)周期長(zhǎng)，而完全采用Ｃ語言編程則程序的執(zhí)行效率相對(duì)較低，不能滿足實(shí)時(shí)性的要求。為了設(shè)計(jì)出性價(jià)比最好、開發(fā)周期較短、比較復(fù)雜的ＤＳＰ系統(tǒng)，可以采用混合語言編程，把Ｃ語言和匯編語言的優(yōu)點(diǎn)有效地結(jié)合起來。Ｃ語言和匯編語言的混合編程有三種形式：在編寫Ｃ語言代碼中插入?yún)R編語句?只需在匯編語句兩邊加上雙引號(hào)和括號(hào)，在括號(hào)前面加上標(biāo)識(shí)ａｓｍ，如ａｓｍ?“匯編語句”?；在編寫Ｃ代碼的過程中調(diào)用內(nèi)聯(lián)函數(shù)?ＴＭＳ３２０Ｃ６２Ｘ中有一些直接映射為內(nèi)聯(lián)的Ｃ６０００指令的特殊函數(shù)，內(nèi)聯(lián)函數(shù)用前下劃線?＿?表示，使用時(shí)同調(diào)用Ｃ語言的庫函數(shù)一樣調(diào)用它，如ｂ＝＿ｎａｓｓｅｒｔ?Ｎ＞＝１０?；匯編代碼以Ｃ代碼可以調(diào)用的函數(shù)出現(xiàn)。本文采用第三種形式。為了使程序代碼的執(zhí)行具有盡可能高的執(zhí)行效率，本文將著重點(diǎn)放在并行匯編代碼的編程，而不是線性匯編代碼的編程。

１Ｃ語言與匯編語言混合編程的接口規(guī)范和標(biāo)準(zhǔn)

用Ｃ語言編寫的代碼中核心代碼常常只是整個(gè)程序代碼的５％，但是卻占用了整個(gè)程序約９５％的執(zhí)行時(shí)間。對(duì)這些核心代碼采用匯編語言編寫，可以大大提高代碼的執(zhí)行效率，而Ｃ語言程序可以象調(diào)用Ｃ程序的一個(gè)函數(shù)那樣去調(diào)用這個(gè)匯編函數(shù)。為了實(shí)現(xiàn)Ｃ語言和匯編語言的混合編程，需要注意一些規(guī)定的接口規(guī)范和標(biāo)準(zhǔn)。

（１）采用Ｃ語言和匯編語言混合編程時(shí)，ＴＭＳ３２０Ｃ６２Ｘ定義了一套嚴(yán)格的寄存器規(guī)則。這個(gè)寄存器規(guī)則表明了編譯器如何使用這些寄存器以及在函數(shù)調(diào)用過程中如何保護(hù)這些寄存器。

調(diào)用函數(shù)保護(hù)了寄存器Ａ０～Ａ９和Ｂ０～Ｂ９，這就使得在編寫匯編程序的時(shí)候可以任意的使用這幾個(gè)寄存器而不需保護(hù)它們。但當(dāng)使用到寄存器Ａ１０～Ａ１５或Ｂ１０～Ｂ１５的時(shí)候，則必須自行對(duì)它們進(jìn)行保護(hù)。長(zhǎng)型、雙精度型或者是長(zhǎng)雙精度型的數(shù)據(jù)對(duì)象要放在一個(gè)奇／偶寄存器對(duì)（如Ａ１：Ａ０）里，奇數(shù)寄存器存放著數(shù)據(jù)的符號(hào)位、指數(shù)位和最高有效位，而偶數(shù)寄存器則存放著低有效位。

在默認(rèn)情況下，Ａ３用作返回結(jié)構(gòu)指針寄存器，Ｂ３用作被調(diào)用函數(shù)返回地址寄存器，Ａ１５用作幀指針寄存器，Ｂ１４用作數(shù)據(jù)頁指針寄存器，Ｂ１５用作堆棧指針寄存器。這些寄存器在被調(diào)用的匯編函數(shù)中用到時(shí)都要進(jìn)行保護(hù)。

（２）調(diào)用函數(shù)將參數(shù)傳遞到被調(diào)用函數(shù)中，前十個(gè)參數(shù)將被從左到右依次放入寄存器Ａ４、Ｂ４、Ａ６、Ｂ６、Ａ８、Ｂ８、Ａ１０、Ｂ１０、Ａ１２和Ｂ１２，如果傳遞的參數(shù)是長(zhǎng)型、雙精度型或者是長(zhǎng)雙精度型，則將參數(shù)依次放入寄存器組Ａ５：Ａ４、Ｂ５：Ｂ４、Ａ７：Ａ６等，并將剩下的變量按相反的順序放在堆棧里。注意，如果傳遞的參數(shù)是一個(gè)結(jié)構(gòu)類型的參數(shù)，則傳遞的是該結(jié)構(gòu)類型的地址。

（３）如果在Ｃ／Ｃ＋＋調(diào)用函數(shù)中做了正確的函數(shù)返回聲明，則被調(diào)用的匯編函數(shù)可以返回有效值。如果返回值是整型或３２位的浮點(diǎn)型，則放在寄存器Ａ４中返回；如果返回值是雙精度或是長(zhǎng)雙精度型，則放在Ａ５：Ａ４中返回；如果返回值是一個(gè)結(jié)構(gòu)類型，則將其結(jié)構(gòu)的地址放在Ａ３中返回。

（４）編譯器為所有的外部對(duì)象指定一個(gè)鏈接時(shí)的名字。當(dāng)寫匯編語言代碼時(shí)，必須用與這個(gè)名字相同的名字。對(duì)于只在匯編語言模塊中用到的變量的標(biāo)識(shí)符，不能從下劃線開始。任何一個(gè)在匯編語言中聲明的對(duì)象都要使其在Ｃ／Ｃ＋＋中是可訪問的，那么在匯編語言中必須用．ｄｅｆ或．ｇｌｏｂａｌ將其聲明為外部變量。同樣在匯編語言中要引用Ｃ／Ｃ＋＋函數(shù)或?qū)ο髸r(shí)，必須用．ｒｅｆ或．ｇｌｏｂａｌ將Ｃ／Ｃ＋＋對(duì)象聲明，這將產(chǎn)生一個(gè)在匯編語言函數(shù)中沒有定義的由鏈接器辨識(shí)的外部引用。

還有一些細(xì)節(jié)也需要注意，如中斷子程序必須把該子程序?qū)⒁玫降乃屑拇嫫鬟M(jìn)行入棧處理；除了全局變量的初始化外，匯編語言的模塊不得因?yàn)槿魏文康亩褂茫悖椋睿椋舳�；匯編代碼的結(jié)束需用指令Ｂ．ｓ２Ｂ３將程序執(zhí)行從被調(diào)用函數(shù)返回到Ｃ語言調(diào)用函數(shù)中。

２并行匯編代碼的編寫

Ｃ６０００的匯編代碼格式如下：

標(biāo)號(hào)：并行標(biāo)記 ?條件寄存器?指令助記符功能單元操作數(shù) ；注釋。如：

ＬＤＷ　．Ｄ２ ?Ｂ４，Ｂ２

｜｜ ?Ａ１?ＳＨＬ．Ｓ２ＸＡ４，Ｂ４；用到了交叉數(shù)據(jù)通道

ＴＭＳ３２０Ｃ６２Ｘ片內(nèi)有８?jìng)€(gè)并行的處理單元，分為相同的兩組。其體系結(jié)構(gòu)采用超長(zhǎng)指令字（ＶＬＩＷ）結(jié)構(gòu)，一個(gè)指令包里的８條并行指令可同時(shí)分配到８?jìng)€(gè)處理單元并行運(yùn)行。這種一個(gè)指令包里有８條指令并行執(zhí)行也給并行匯編代碼的編寫帶來很多要考慮的問題?具體如下：　

（１）ＴＭＳ３２０Ｃ６２Ｘ指令的執(zhí)行可以用延遲間隙來說明。延遲間隙在數(shù)量上等于從指令的源操作數(shù)被讀取到執(zhí)行的結(jié)果可以被訪問所用的指令周期。如對(duì)于乘法指令（ＭＰＹ），源操作數(shù)從第ｉ個(gè)周期被讀取，則其計(jì)算結(jié)果在第（ｉ＋２）個(gè)周期才可用。

（２）使用相同功能單元的兩條指令不能被安排為并行指令。

（３）使用同一條交叉通路的兩條指令不能被安排在同一個(gè)執(zhí)行指令包中，這是因?yàn)閺募拇嫫鹘MＡ～Ｂ或者從Ｂ～Ａ都只有一條交叉通路�！　�

?４?將數(shù)據(jù)讀入到（或存儲(chǔ)自）相同寄存器組的兩條讀（寫）指令不能被安排在同一個(gè)執(zhí)行包中。

?５?每一個(gè)執(zhí)行包里只能允許每一寄存器組處理一個(gè)長(zhǎng)定點(diǎn)類型數(shù)據(jù)。

?６?在一個(gè)指令周期內(nèi)對(duì)同一寄存器讀取多于四次是不允許的，但條件寄存器不在此限制之列。在一個(gè)指令周期內(nèi)，不能同時(shí)存在兩條寫入同一寄存器的指令，只有在寫操作不是在同一個(gè)指令周期發(fā)生時(shí)，才可以將具有同一目的地址的兩條指令安排并行。

３基于ＴＭＳ３２０Ｃ６２Ｘ的運(yùn)動(dòng)補(bǔ)償?shù)幕旌暇幊淘O(shè)計(jì)實(shí)例

運(yùn)動(dòng)補(bǔ)償是ＭＰＥＧ－４標(biāo)準(zhǔn)中的一種重要算法。運(yùn)動(dòng)補(bǔ)償是指根據(jù)運(yùn)動(dòng)矢量在參考幀中找出參考?jí)K。如果運(yùn)動(dòng)矢量的Ｘ分量和Ｙ分量都是整象素長(zhǎng)度，則直接在參考幀中找出參考?jí)K。如果為半象素長(zhǎng)度，則需要通過內(nèi)插運(yùn)算計(jì)算出參考?jí)K，計(jì)算出的參考?jí)K需要加上解碼得出的誤差塊才能得到當(dāng)前參考?jí)K。本文給出了運(yùn)動(dòng)矢量的Ｘ分量和Ｙ分量都是整象素長(zhǎng)度時(shí)的運(yùn)動(dòng)補(bǔ)償方法。根據(jù)運(yùn)動(dòng)矢量

TMS320C62X DSP的混合編程研究

【TMS320C62X DSP的混合編程研究】相關(guān)文章：

DOS下DSP播音的編程03-03

LabVIEW與MATLAB混合編程03-19

基于DSP的數(shù)控二維橢圓及圓插補(bǔ)算法簡(jiǎn)化編程研究11-22

FFT算法的研究與DSP實(shí)現(xiàn)03-07

通過JTAG口對(duì)DSP外部Flash存儲(chǔ)器的在線編程03-26

混合動(dòng)力汽車混合度設(shè)計(jì)方法研究03-07

JDBC數(shù)據(jù)庫編程的研究03-15

TMS320C32 DSP的中斷編程方法及BOOT功能實(shí)現(xiàn)03-18

混合身份共犯研究03-21

久久久久无码精品,四川省少妇一级毛片,老老熟妇xxxxhd,人妻无码少妇一区二区

TMS320C62X DSP的混合編程研究