123,123,123

基于驱动程序的协议栈设计

日期： 2009-06-11

作者：谢雪松胡长阳

關(guān)鍵詞： 协议栈协议层应用程序实时操作系统数据结构

　　摘　要： 提出一種新的協(xié)議棧設(shè)計(jì)思路——基于驅(qū)動(dòng)程序的協(xié)議棧設(shè)計(jì)，在對(duì)比傳統(tǒng)的協(xié)議棧設(shè)計(jì)方式——基于任務(wù)的協(xié)議棧設(shè)計(jì)的基礎(chǔ)上，說(shuō)明了此種方法的優(yōu)勢(shì)所在，并給出了協(xié)議棧設(shè)計(jì)的基本框架
　　關(guān)鍵詞： 設(shè)備驅(qū)動(dòng) 協(xié)議驅(qū)動(dòng) 操作任務(wù) 協(xié)議棧

　　基于驅(qū)動(dòng)程序的協(xié)議棧設(shè)計(jì)，相比于傳統(tǒng)的基于任務(wù)的協(xié)議棧設(shè)計(jì)來(lái)說(shuō)有兩點(diǎn)好處：(1)效率更高；(2)對(duì)于有多個(gè)協(xié)議棧的系統(tǒng)來(lái)說(shuō)，有更大的兼容性。
1 基于任務(wù)的方式
　　在我們比較兩種設(shè)計(jì)方式的技術(shù)細(xì)節(jié)之前，我們必須了解它們。傳統(tǒng)的設(shè)計(jì)方式包括將協(xié)議棧置于實(shí)時(shí)操作系統(tǒng)或內(nèi)核之上，但是大多數(shù)實(shí)時(shí)操作系統(tǒng)不提供網(wǎng)絡(luò)互連的框架。所以，協(xié)議棧的設(shè)計(jì)者們不得不利用實(shí)時(shí)操作系統(tǒng)提供的機(jī)制——Task。圖1說(shuō)明了如何利用任務(wù)來(lái)實(shí)現(xiàn)一個(gè)三層間通信的協(xié)議。每一層被作為一個(gè)單獨(dú)的任務(wù)，外加任務(wù)間通信機(jī)制負(fù)責(zé)傳送數(shù)據(jù)和控制包上下通過(guò)協(xié)議棧，程序設(shè)計(jì)者負(fù)責(zé)定義層與層之間的接口和一個(gè)應(yīng)用程序接口(API)，以利于應(yīng)用程序員傳送和接收數(shù)據(jù)。

　　在這里存在幾個(gè)效率不高的來(lái)源：首先，正如圖1中點(diǎn)線(xiàn)所說(shuō)明的，當(dāng)包在應(yīng)用程序、上層的通信協(xié)議，以及網(wǎng)絡(luò)接口的設(shè)備驅(qū)動(dòng)程序之間交換時(shí)，下層的操作系統(tǒng)正忙于上下文切換，每一次實(shí)時(shí)操作系統(tǒng)掛起其中一個(gè)任務(wù)，恢復(fù)執(zhí)行另一個(gè)任務(wù)，時(shí)間都浪費(fèi)在存取任務(wù)上下文中，考慮到每一個(gè)包無(wú)論是發(fā)還是收，都要通過(guò)協(xié)議棧的每一層，上下文切換的確造成了巨大的浪費(fèi)。另外，當(dāng)數(shù)據(jù)和控制包在應(yīng)用程序任務(wù)和網(wǎng)絡(luò)接口之間流動(dòng)時(shí)，包含此類(lèi)信息的緩沖區(qū)必然重復(fù)在任務(wù)間通信隊(duì)列加入或刪除。然而，這個(gè)系統(tǒng)開(kāi)銷(xiāo)是很大的，這本身是由于系統(tǒng)在隊(duì)列操作時(shí)必然包括需與中斷和上下文切換隔離的臨界區(qū)。因此，不僅時(shí)間浪費(fèi)于隊(duì)列操作，而且整個(gè)系統(tǒng)對(duì)一些重要的事件例如中斷的響應(yīng)變得延遲。
2 基于驅(qū)動(dòng)程序的方法
　　另外一種選擇是將協(xié)議棧各層置于實(shí)時(shí)操作系統(tǒng)之中，圖2說(shuō)明了基于此種方案，同樣的三層間通信協(xié)議是如何實(shí)施的。兩者之間的顯著區(qū)別在于：各個(gè)協(xié)議層是作為驅(qū)動(dòng)程序模塊，而不是任務(wù)來(lái)實(shí)現(xiàn)的。

　　另外一個(gè)改變?cè)谟冢簠f(xié)議棧之上還有一個(gè)網(wǎng)絡(luò)服務(wù)模塊。加入這個(gè)模塊的目的在于將與協(xié)議無(wú)關(guān)的網(wǎng)絡(luò)特性抽象化。也就是說(shuō)，它將應(yīng)用程序設(shè)計(jì)者用來(lái)在協(xié)議棧間收發(fā)數(shù)據(jù)的應(yīng)用程序接口(API)標(biāo)準(zhǔn)化，例如：你的嵌入式系統(tǒng)可能需要同時(shí)支持基于調(diào)制解調(diào)器接口的PPP連到一臺(tái)遠(yuǎn)程計(jì)算機(jī)和一個(gè)紅外接口用來(lái)與本地計(jì)算機(jī)通信。然而程序設(shè)計(jì)者不必為兩個(gè)事件各自編程，它只需用網(wǎng)絡(luò)服務(wù)模塊提供API與其它計(jì)算機(jī)進(jìn)行通信，唯一的區(qū)別在于通過(guò)哪個(gè)網(wǎng)絡(luò)接口而已。
　　基于驅(qū)動(dòng)程序方式的一個(gè)顯著優(yōu)點(diǎn)就在于上下文切換的次數(shù)僅僅是基于控制臺(tái)應(yīng)用程序的函數(shù)，并不基于協(xié)議層的數(shù)量。這樣一來(lái)就可以減少實(shí)時(shí)操作系統(tǒng)保存和恢復(fù)任務(wù)上下文的次數(shù)，因而空出時(shí)間作更有意義的事，例如執(zhí)行應(yīng)用程序代碼。
　　另一個(gè)好處在于，數(shù)據(jù)和控制信息更簡(jiǎn)單的在層與層之間傳輸，因?yàn)樗械膮f(xié)議層都處于同一個(gè)上下文中，所以相關(guān)的數(shù)據(jù)結(jié)構(gòu)自動(dòng)地為上下層所接受，結(jié)果你不必把他們?cè)谌蝿?wù)間隊(duì)列中傳送，由此產(chǎn)生的是，同時(shí)也避免了那些臨界區(qū)系統(tǒng)由此可改進(jìn)中斷和優(yōu)先級(jí)任務(wù)的響應(yīng)時(shí)間。
3 緩沖區(qū)拷貝
　　緩沖區(qū)拷貝效率不高的第一個(gè)潛在因素在于：當(dāng)數(shù)據(jù)在層與層之間傳輸時(shí)，數(shù)據(jù)緩沖區(qū)的分配、拷貝和釋放，這與協(xié)議棧的結(jié)構(gòu)無(wú)關(guān)，僅與緩沖區(qū)本身的結(jié)構(gòu)有關(guān)。
　　一般來(lái)說(shuō)，有兩種常用的方式用于協(xié)議棧層與層之間傳送數(shù)據(jù)，如圖3所示。然而，這兩種方式均有缺陷，我們假設(shè)，應(yīng)用層有一些數(shù)據(jù)需要傳送，通常我們把它稱(chēng)作消息，消息需被送至協(xié)議棧的最底層，因?yàn)樵诰彌_區(qū)中沒(méi)有多余的空間來(lái)存放頭尾信息，而協(xié)議層必須給數(shù)據(jù)本身加上頭尾信息，協(xié)議層或分配一個(gè)足夠大的緩沖區(qū)得以容納消息本身和頭尾信息，或分配兩個(gè)小緩沖區(qū)，一個(gè)用于頭信息，一個(gè)用于尾信息，然后用指針將三個(gè)緩沖區(qū)鏈接起來(lái)。

　　眾所周知，每一層加入自己的頭尾信息源于上一層傳來(lái)的信息。因此，一個(gè)包在自上而下通過(guò)網(wǎng)絡(luò)時(shí)，必須重復(fù)這一個(gè)過(guò)程許多次，時(shí)間被消耗于內(nèi)存的分配之中(而自下而上則好得多，因?yàn)橄聦拥念^尾信息可以被上層忽略)。這種拷貝方式同時(shí)伴隨著越來(lái)越大的消息，釋放老緩沖區(qū)。鏈接方式雖然不涉及多余的拷貝，但是卻將傳輸包的設(shè)備驅(qū)動(dòng)程序代碼復(fù)雜化。

　　另一種替代的方式與基于設(shè)備驅(qū)動(dòng)程序的方式相當(dāng)吻合，如圖4所示。每次當(dāng)協(xié)議棧創(chuàng)建或改變時(shí)，網(wǎng)絡(luò)服務(wù)模塊執(zhí)行一個(gè)查詢(xún)以確定整個(gè)協(xié)議棧的頭、尾信息和最大傳輸單元要求，這樣一來(lái)當(dāng)應(yīng)用程序向協(xié)議棧發(fā)消息時(shí)，網(wǎng)絡(luò)服務(wù)模塊相應(yīng)地分配一些足夠大容納整個(gè)協(xié)議棧頭尾信息的緩沖區(qū)，每一層僅僅將頭尾信息填充至這些緩沖區(qū)，而不需內(nèi)存分配或拷貝，這一機(jī)制對(duì)于性能有顯著的改善。
　　重傳緩沖區(qū)另一個(gè)效率不高的原因在于，協(xié)議層提供確認(rèn)與重傳機(jī)制，一個(gè)可靠的協(xié)議層的實(shí)現(xiàn)通常包括為每個(gè)包分配一個(gè)重傳緩沖區(qū)，將包的內(nèi)容拷貝至重傳緩沖區(qū)中。如果遠(yuǎn)程系統(tǒng)的同一層確認(rèn)了正確接收，重傳緩沖區(qū)將被釋放，然而，如果一個(gè)“NACK”發(fā)生，協(xié)議層重傳緩沖區(qū)的內(nèi)容，同時(shí)再分配一個(gè)重傳緩沖區(qū)，拷貝內(nèi)容至重傳緩沖區(qū)。
　　如果已經(jīng)發(fā)出的包可以被協(xié)議層標(biāo)記為“Unmarked”或“Reserved”的話(huà)，上述機(jī)制就可被取消，這種情況僅保存一個(gè)指針而不拷貝。當(dāng)設(shè)備驅(qū)動(dòng)程序完成傳送包并試圖釋放緩沖區(qū)，緩沖區(qū)系統(tǒng)確認(rèn)此緩沖區(qū)保留，并不釋放包，僅僅將它標(biāo)記為“已傳輸”，當(dāng)相應(yīng)的協(xié)議層收到確認(rèn)(ACK)之后，就把包去掉標(biāo)識(shí)，并且釋放緩沖區(qū)，通過(guò)把這一特性固化至網(wǎng)絡(luò)服務(wù)模塊中，整個(gè)協(xié)議棧的效率將大大提高。
4 細(xì)節(jié)
　　任何合理的基于驅(qū)動(dòng)程序的協(xié)議棧都會(huì)包含相似的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)和控制原語(yǔ)及模塊函數(shù)。下面介紹一下細(xì)節(jié)數(shù)據(jù)結(jié)構(gòu)，以下是一些可能用到的數(shù)據(jù)結(jié)構(gòu)。
　　(1) 設(shè)備入口提供實(shí)時(shí)操作系統(tǒng)和某一特殊的協(xié)議模塊的管道；
　　(2) 驅(qū)動(dòng)程序靜態(tài)變量對(duì)于每一協(xié)議層僅分配一次，不管協(xié)議層下的網(wǎng)絡(luò)接口有多少，它是協(xié)議層的全局存儲(chǔ)區(qū)域；
　　(3) 邏輯單位靜態(tài)變量?jī)H基于接口分配，所以如果你有一個(gè)設(shè)備驅(qū)動(dòng)程序控制兩個(gè)接口，就應(yīng)有兩個(gè)邏輯單位靜態(tài)變量，但是僅有一個(gè)驅(qū)動(dòng)程序變量和一個(gè)設(shè)備條目數(shù)據(jù)結(jié)構(gòu)；
　　(4) 路徑變量基于應(yīng)用程序?qū)f(xié)議的調(diào)用，僅分配一次。
　　基于上述四種定義，協(xié)議中的各種數(shù)據(jù)應(yīng)被定義為最合適的類(lèi)型，被選定的數(shù)據(jù)結(jié)構(gòu)應(yīng)當(dāng)基于這個(gè)變量如何被使用：是被協(xié)議狀態(tài)機(jī)所使用，還是接口或是應(yīng)用程序，例如，一個(gè)特定的網(wǎng)絡(luò)接口芯片在內(nèi)存中的基址就應(yīng)定義為邏輯單位靜態(tài)變量。
5 函數(shù)
　　如果你正開(kāi)發(fā)不止一個(gè)協(xié)議棧，編寫(xiě)一系列通用的函數(shù)會(huì)有幫助，表1、表2描述了一些基于驅(qū)動(dòng)程序的協(xié)議?？蚣艿臄?shù)據(jù)和控制傳輸原語(yǔ)及參數(shù)。

參考文獻(xiàn)
1 Curt Schwaderer.A Driver－Based Approach to Protocol Stack Design. Embedded Systems Programming,1999;12 (9)
2 Bill Gatliff.An introduction to Protocol Stack Design.IEEE Software Design,1998;4

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：aet@chinaaet.com。

基于驱动程序的协议栈设计

日期： 2009-06-11

作者：谢雪松 胡长阳

相關(guān)內(nèi)容

作者：谢雪松胡长阳