TI通信開發(fā)套件NDK
2.1 NDK開發(fā)套件的高效率設(shè)計
為了加速其高檔DSP的網(wǎng)絡(luò)化進(jìn)程,TI公司結(jié)合其C6000系列芯片推出了TCP/IP NDK (Network Developer’s Kit)開發(fā)套件。
NDK主要的組件包括:(1)支持TCP/TP協(xié)議棧程序庫。其中主要包含的庫有:支持TCP/IP網(wǎng)絡(luò)工具的庫,支持TCP/IP協(xié)議棧與DSP/BIOS平臺的庫,網(wǎng)絡(luò)控制以及線程調(diào)度的庫(包括協(xié)議棧的初始化以及網(wǎng)絡(luò)相關(guān)任務(wù)的調(diào)度)(2)示范程序。其中主要包括DHCP/Telnet客戶端,HTTP/數(shù)據(jù)服務(wù)器示范等。(3)支持文檔 包括用戶手冊、程序員手冊和平臺適應(yīng)手冊。
NDK采用緊湊的設(shè)計方法,實現(xiàn)了用較少的資源耗費來支持TCP/IP。從實用效果看,NDK僅用200~250K程序空間和95K數(shù)據(jù)空間即可支持常規(guī)的TCP/IP服務(wù),包括應(yīng)用層的telnet、DHCP、HTTP等。為了最大限度地減少資源消耗,TI為其NDK采用了許多特殊的技巧,重要的有:(1)UDP socket和RAW socket不使用發(fā)送或接收緩沖區(qū);(2)TCP socket使用發(fā)送緩沖區(qū),接收緩沖區(qū)依配置文件而定;(3)低層驅(qū)動程序與協(xié)議棧之間通過指針傳遞數(shù)據(jù),不對包進(jìn)行復(fù)制拷貝;4、設(shè)置專門的線程清除存儲器中的碎片和檢查存儲器泄露。因此,NDK很適合目前嵌入式系統(tǒng)的硬件環(huán)境,是實現(xiàn)DSP聯(lián)網(wǎng)通信的重要支撐工具。
NDK的軟件開發(fā)環(huán)境是TI的開發(fā)工具CCS(code composer studio)。它包含有實時操作系統(tǒng)DSP/BIOS和主機(jī)與目標(biāo)板之間的實時數(shù)據(jù)交換軟件RTDX。
2.2 NDK的配置和使用
在CCS下使用NDK需要在以下幾點上做特別處理:
(1)設(shè)置DSP/BIOS
PRD設(shè)置主時鐘。硬件抽象層的時鐘驅(qū)動需要一個100ms啟動一次的PRD函數(shù)作為主時鐘,函數(shù)名是llTimerTick()。
HOOK為TCP/IP協(xié)議棧設(shè)置保存的空間。OS庫的任務(wù)調(diào)度模塊需要調(diào)用hook來保存和調(diào)用TCP/IP協(xié)議棧的環(huán)境變量指針,這兩個hook函數(shù)是NDK_hookInit() 和 NDK_hookCreate()。
(2)包含文件和庫文件
請注意編譯時需要包含庫文件和文件路徑,一般默認(rèn)為c:\ti\c6000\ndk\inc
(3)CCS工程編譯時的鏈接順序
CCS一般按照特定的順序來鏈接目標(biāo)函數(shù)和庫文件,NDK是對這個鏈接順序很敏感的,錯誤的順序可以導(dǎo)致重復(fù)定義符號甚至不正確執(zhí)行等錯誤。為避免這個情況,可以在CCS里選擇Link Order"-> "build options對話框,將文件按照一定順序添加并且將庫文件添置到連接順序的最后,推薦的順序為:NETCTRL.LIB,HAL_xxx.LIB,NETTOOL.LIB,STACK.LIB和OS.LIB。
在初始化啟動協(xié)議棧之前,要為其分配一塊工作內(nèi)存(SDRAM),命令是_mmBulkAllocSeg( EXTERN1 )。還要調(diào)用fdOpenSession()來初始化文件指針向量表,否則創(chuàng)建socket的時候?qū)⒊霈F(xiàn)錯誤。
我們將發(fā)送/接收設(shè)置定義為一個任務(wù),在創(chuàng)建任務(wù)句柄以前,我們應(yīng)該用NC_SystemOpen()打開網(wǎng)絡(luò)功能并進(jìn)行設(shè)置,在系統(tǒng)關(guān)閉前也要進(jìn)行相應(yīng)的處理。
使用NDK提供的socket API函數(shù)需要注意下面一些問題:(1)NDK中對socket API 通過一個文件指針接口與操作系統(tǒng)相連接,因此要調(diào)用文件指針向量表初始化和關(guān)閉函數(shù)對文件系統(tǒng)進(jìn)行相應(yīng)操作。(2)NDK中并沒有提供windows API中強(qiáng)大的select函數(shù),但是可以用fdselect實現(xiàn)一些相應(yīng)的工程。可以相互對應(yīng)得API函數(shù)還有NDK中的fdclose 和標(biāo)準(zhǔn)的close, NDK中的fderror和標(biāo)準(zhǔn)的errno.(3) NDK提供了很多網(wǎng)絡(luò)工具的支持的函數(shù),比如和DNS相關(guān)的一些函數(shù),可以代替標(biāo)準(zhǔn)API中的getpeername, gethostname等。另外還有關(guān)于IGMP的一些函數(shù)可以用來支持組播,但是只支持作為組播用戶,不能支持作為組播服務(wù)器。
3.NDK傳輸UDP數(shù)據(jù)包效率測試及性能分析
3.1測試平臺結(jié)構(gòu)
我們研究了在NDK下CPU對UDP數(shù)據(jù)包發(fā)送接收的效率,這個測試分成兩部分:一部分是測試從DM642向PC機(jī)發(fā)送UDP數(shù)據(jù)包時,在不同的傳輸速率和不同的L2 cache大小時的CPU占用率,另一部分是測試DM642接收從PC機(jī)發(fā)送來數(shù)據(jù)包時,在不同的傳輸速率和不同的L2 cache大小時的CPU占用率。我們所使用的工具是在CCS下的NDK提供的socket API函數(shù)和在visual studio下提供的winsocket API。圖4是測試環(huán)境的示意圖。
圖4:NDK測試環(huán)境示意圖
3.2 測試平臺的配置和實現(xiàn)
由于接收和發(fā)送程序十分相似,我們僅以發(fā)送程序舉例。創(chuàng)建發(fā)送數(shù)據(jù)的程序為一個任務(wù),在DSP/BIOS中,任務(wù)對象就是被TSK模塊管理的線程。TSK模塊根據(jù)任務(wù)的優(yōu)先級和當(dāng)前的執(zhí)行狀態(tài)動態(tài)的調(diào)度。DSP/BIOS總共有15個任務(wù)優(yōu)先級可以使用,并且提供了一組函數(shù)來操縱任務(wù)對象,包括建立、刪除、設(shè)置任務(wù)對象。任何任務(wù)對象都處于下面幾種狀態(tài)之一:運(yùn)行態(tài),就緒態(tài),阻塞態(tài),終止態(tài)。
在這個工程中,我們在網(wǎng)絡(luò)控制的程序中進(jìn)行任務(wù)的創(chuàng)建,圖5是創(chuàng)建任務(wù)的流程圖:
圖5:傳輸任務(wù)創(chuàng)建流程圖
其中創(chuàng)建任務(wù)的語句為:TaskCreate( tsk_udp, "udp_video", 5, 0x1000, peer_addr , 12345, 12345 )。理論上,可以通過設(shè)置兩個task的方法來增加數(shù)據(jù)傳輸?shù)乃俾剩亲⒁膺@兩個task應(yīng)該用不同的端口進(jìn)行傳送。任務(wù)調(diào)度的應(yīng)用程序為:
static void tsk_udp( IPN IPAddr, int PeerPort , int LocalPort)
{ ……
// 創(chuàng)建 socket
s = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);
……
// 設(shè)置要綁定的地址端口屬性
bzero( &sin1, sizeof(struct sockaddr_in) );
sin1.sin_family = AF_INET;
sin1.sin_len = sizeof( sin1 );
sin1.sin_port = htons(LocalPort);
//綁定IP地址和端口
if( bind( s, (PSA) &sin1, sizeof(sin1) ) < 0 )
{ goto exit_tsk;}
//設(shè)定目的地址端口屬性
bzero( &sin1, sizeof(struct sockaddr_in) );
sin1.sin_family = AF_INET;
sin1.sin_len = sizeof( sin1 );
sin1.sin_addr.s_addr = IPAddr;
sin1.sin_port = htons(PeerPort);
……
// 分配工作緩沖區(qū)
if( !(pBuf = mmBulkAlloc( 1024 )) )
{goto exit_tsk;}
// 一下開始發(fā)送數(shù)據(jù)
for(;;)
{ // 填充發(fā)送數(shù)據(jù)的緩沖區(qū)
*(int*)pBuf=send_udp_count++
// 發(fā)送數(shù)據(jù)
if( sendto( s, pBuf, 1000, 0, &sin1, sizeof(sin1) ) < 0 )
{ goto exit_tsk;//break;}
// 清空數(shù)據(jù)區(qū)
mmZeroInit( pBuf, (uint)test );
//設(shè)置發(fā)送數(shù)據(jù)率
TaskSleep(8); // 1Mbit/s
}
……
}
測試?yán)锩嬗袃蓚關(guān)鍵參數(shù)需要設(shè)置,一個是發(fā)送(接收)的數(shù)據(jù)率和DM642內(nèi)部第二級緩存的大小。收發(fā)的數(shù)據(jù)率可以通過改變?nèi)蝿?wù)掛起的時間間隔長度來改變。系統(tǒng)函數(shù)TaskSleep(n)表示每隔n毫秒執(zhí)行一次發(fā)送,我們設(shè)定每次發(fā)送1000 Byte的數(shù)據(jù),這樣TaskSleep(8)表示1Mbit/s的傳輸速率,TaskSleep(4)表示2Mbit/s的傳輸速率,以此類推。
而L2 cache大小的改變可以通過以下語句來設(shè)置:
CACHE_setL2Mode(CACHE_64KCACHE)表示設(shè)置了64K L2 Cache;CACHE_setL2Mode(CACHE_128KCACHE)表示設(shè)置了128K L2 Cache,以此類推。
3.3 測試結(jié)果和性能分析
我們在DM642評估版上,采用標(biāo)準(zhǔn)的recvfrom函數(shù)進(jìn)行數(shù)據(jù)接收,以無連接的UDP協(xié)議與windows PC進(jìn)行相互傳輸。對不同傳輸速率和不同大小的二級緩存下CPU的占用率進(jìn)行了比較。
CPU占用率=空閑周期可完成的低優(yōu)先級任務(wù)/ 執(zhí)行傳輸任務(wù)時可完成的低優(yōu)先級任務(wù)
其中接收和發(fā)送數(shù)據(jù)均設(shè)為每次1000 Byte,評測結(jié)果在下面四個圖表里面顯示出來。
傳輸速率(Mbit/s) |
64KCache |
128KCache |
256KCache |
0.4 |
0.29 |
0.21 |
0.19 |
0.8 |
0.58 |
0.45 |
0.38 |
2 |
1.1 |
1.02 |
0.96 |
4 |
2.64 |
2.26 |
1.88 |
8 |
5.11 |
4.38 |
3.64 |
16 |
9.86 |
8.25 |
6.89 |
表1:由DM642發(fā)送UDP數(shù)據(jù)包的CPU占用率(%)
圖6:DM642發(fā)送UDP數(shù)據(jù)包CPU占用率比較圖
傳輸速率(Mbit/s) |
64KCache |
128KCache |
256KCache |
0.4 |
0.2 |
0.13 |
0.14 |
0.8 |
0.35 |
0.28 |
0.27 |
2 |
0.82 |
0.7 |
0.67 |
4 |
1.62 |
1.34 |
1.34 |
8 |
3.65 |
2.69 |
2.68 |
表2:由DM642 UDP數(shù)據(jù)包的CPU占用率(%)
圖7:DM642接收UDP數(shù)據(jù)包CPU占用率比較圖
從上面的比較可以看出 DM642發(fā)送和接收數(shù)據(jù)包時的CPU占用率均隨著網(wǎng)絡(luò)傳輸速率的增加而提高,而且基本上呈線性關(guān)系。因為收發(fā)數(shù)據(jù)是對數(shù)據(jù)簡單的搬移,它的復(fù)雜度是隨著數(shù)據(jù)的增加而線性增長的,在高速緩存一定得情況下CPU的占用率線性增加。
而第二級緩存的大小對CPU的占用率也有影響,一般而言是L2 cache越大,CPU占用率越小,而且隨著收發(fā)數(shù)據(jù)率的變大而顯得更加明顯,這個得益于DM642兩級緩存的工作原理和強(qiáng)大的DMA功能。
L2 cache增大帶來的另一個影響是CPU片內(nèi)存儲容量的減少,使得片內(nèi)能放下的代碼段和數(shù)據(jù)段就比較少,這樣反而會減緩程序的運(yùn)行速度,這在處理復(fù)雜的編解碼程序,數(shù)據(jù)段和代碼段比較多時尤為明顯,這就需要程序員根據(jù)實際情況統(tǒng)籌安排合理配置。
4.總結(jié)與展望
為了研究在嵌入式芯片上進(jìn)行高速多媒體通信的可行性,本文討論了TI DM642上NDK設(shè)計的原理,并進(jìn)行了與PC機(jī)實時數(shù)據(jù)通信的測試。測試表明TI公司推出的NDK套件在DM642芯片上實現(xiàn)了高效率的TCP/IP傳輸協(xié)議,即使高達(dá)16Mbit/s的傳輸速率,CPU的占用率也不到10%,這使得它完成多路的視頻傳輸也綽綽有余,這是DM642能夠廣泛應(yīng)用于各種多媒體通信設(shè)備和終端的有力保證。再配合DM642芯片強(qiáng)大的多媒體處理功能,使得其在多媒體通信市場上有廣闊的前景。值得我們?nèi)パ芯亢完P(guān)注。