糾結(jié)了好多天,終于弄懂了B440X的處理。 上篇講到通過(guò)中斷,最終網(wǎng)卡調(diào)用了b44_rx()來(lái)接收?qǐng)?bào)文
對(duì)這個(gè)函數(shù)中的一些參數(shù),可以這樣理解: bp->rx_cons – 處理器處理到的緩沖區(qū)號(hào) bp->rx_pending – 分配的緩沖區(qū)個(gè)數(shù) bp->rx_prod – 當(dāng)前緩沖區(qū)的最后一個(gè)緩沖號(hào)
這里要參數(shù)B440X的手冊(cè)了解下寄存器的作用: #define B44_DMARX_ADDR 0x0214UL /* DMA RX Descriptor Ring Address */ #define B44_DMARX_PTR 0x0218UL /* DMA RX Last Posted Descriptor */ #define B44_DMARX_STAT 0x021CUL /* DMA RX Current Active Desc. + Status */ 僅b44_rx()來(lái)說(shuō),B44_DMARX_ADDR儲(chǔ)存了環(huán)形緩沖的基地址,B44_DMARX_PTR存儲(chǔ)了環(huán)形緩沖最后一個(gè)緩沖區(qū)號(hào),這兩個(gè)寄存器都由處理來(lái)設(shè)置;B44_DMARX_STAT儲(chǔ)存了狀態(tài)及網(wǎng)卡當(dāng)前處理到的緩沖區(qū)號(hào),這個(gè)寄存器只能由網(wǎng)卡來(lái)設(shè)置。
網(wǎng)卡中DMA也很重要: 在網(wǎng)卡初始化階段,b44_open() -> b44_alloc_consistent() bp->rx_buffers = kzalloc(size, gfp); // size = B44_RX_RING_SIZE * sizeof(struct ring_info) bp->rx_ring = ssb_dma_alloc_consistent(bp->sdev, size, &bp->rx_ring_dma, gfp); // size = DMA_TABLE_BYTES rx_ring是DMA映射的虛擬地址,rx_rind_dma是DMA映射的總線(xiàn)地址,這個(gè)地址將會(huì)寫(xiě)入B44_DMARX_ADDR寄存器,作為環(huán)形緩沖的基地址。 bw32(bp, B44_DMARX_ADDR, bp->rx_ring_dma + bp->dma_offset); 稍后在rx_init_rings() -> b44_alloc_rx_skb() mapping = ssb_dma_map_single(bp->sdev, skb->data,RX_PKT_BUF_SZ,DMA_FROM_DEVICE); 將rx_buffers進(jìn)行DMA映射,并將映射地址存儲(chǔ)在rx_ring中 dp->addr = cpu_to_le32((u32) mapping + bp->dma_offset); // dp是rx_ring中一個(gè)
DMA的大致流程: 不準(zhǔn)確,但可以參考下大致意思
網(wǎng)卡讀取B44_DMARX_ADDR與B44_DMARX_STAT寄存器,得到下一個(gè)處理的struct dma_desc,然后根據(jù)dma_desc中的addr找到報(bào)文緩沖區(qū),通過(guò)DMA處理器將網(wǎng)卡收到報(bào)文拷貝到addr地址處,這個(gè)過(guò)程CPU是不參與的。
prod – 網(wǎng)卡[硬件]處理到的緩沖區(qū)號(hào) prod = br32(bp, B44_DMARX_STAT) & DMARX_STAT_CDMASK; prod /= sizeof(struct dma_desc); cons = bp->rx_cons; 根據(jù)上面分析,prod讀取B44_DMARX_STAT寄存器,存儲(chǔ)網(wǎng)卡當(dāng)前處理到的緩沖區(qū)號(hào);cons存儲(chǔ)處理器處理到的緩沖區(qū)號(hào)。
while (cons != prod && budget > 0) { 處理報(bào)文當(dāng)前時(shí)刻網(wǎng)卡接收到的所有報(bào)文,每處理一個(gè)報(bào)文cons都會(huì)加1,由于是環(huán)形緩沖,因此這里用相等,而不是大小比較。
struct ring_info *rp = &bp->rx_buffers[cons]; struct sk_buff *skb = rp->skb; dma_addr_t map = rp->mapping; skb和map保存了當(dāng)關(guān)地址,下面在交換緩沖區(qū)后會(huì)用到。
ssb_dma_sync_single_for_cpu(bp->sdev, map,RX_PKT_BUF_SZ,DMA_FROM_DEVICE); CPU取得rx_buffer[cons]的控制權(quán),此時(shí)網(wǎng)卡不能再處理該緩沖區(qū)。
rh = (struct rx_header *) skb->data; len = le16_to_cpu(rh->len); …. len -= 4; CPU取得控制權(quán)后,取得報(bào)文頭,再?gòu)膱?bào)文頭取出報(bào)文長(zhǎng)度len,len-=4表示忽略了最后4節(jié)字的CRC,從這里可以看出,B440X網(wǎng)卡驅(qū)動(dòng)不會(huì)檢查CRC校驗(yàn)。而每個(gè)報(bào)文數(shù)據(jù)最前面添加了網(wǎng)卡的頭部信息struct rx_header,這里是28字節(jié)。
struct sk_buff *copy_skb; b44_recycle_rx(bp, cons, bp->rx_prod); copy_skb = netdev_alloc_skb(bp->dev, len + 2); copy_skb作為傳送報(bào)文的中間量,在第三句為其分配了len + 2的空間(為了IP頭對(duì)齊,稍后提到)。b44_recycle_rx()函數(shù)很關(guān)鍵,它作了如下工作: 1. 將緩沖區(qū)號(hào)cons賦值給緩沖區(qū)號(hào)rx_prod; 2. rx_buffers[cons].skb = NULL 3. 將緩沖區(qū)號(hào)rx_prod控制權(quán)給網(wǎng)卡 簡(jiǎn)單來(lái)說(shuō),就是將cons號(hào)緩沖區(qū)交由CPU處理,而用rx_prod號(hào)緩沖區(qū)代替其給網(wǎng)卡使用。 a. b44_recycle_rx前 b. b44_recycle_rx后 以起始狀態(tài)為例,緩沖區(qū)rx_ring分配了512個(gè),但rx_buffers僅分配了200個(gè),此時(shí)cons = 0,rx_prod = 200。執(zhí)行b44_recycle_rx()后,網(wǎng)卡處理緩沖區(qū)變?yōu)?/span>1~200,而0號(hào)緩沖區(qū)交由CPU處理,將報(bào)文拷貝,并向上送至協(xié)議棧。注意rx_ring和rx_buffer是不同的。 這樣做的好處在于,不用等待CPU處理完0號(hào)緩沖區(qū),網(wǎng)卡的緩沖區(qū)數(shù)保持200,而不會(huì)減少,這也是rx_pending = 200的原因所在。
skb_reserve(copy_skb, 2); skb_put(copy_skb, len); 關(guān)于skb的操作自己去了解,這里skb_reserve()在報(bào)文頭部保留了兩個(gè)字節(jié),我們知道鏈路層報(bào)頭是14字節(jié),正常IP報(bào)文會(huì)從14字節(jié)開(kāi)始,這樣就不是4字節(jié)對(duì)齊了,所以在頭部保留2字節(jié),使IP報(bào)文從16字節(jié)開(kāi)始。
skb_copy_from_linear_data_offset(skb, RX_PKT_OFFSET,copy_skb->data, len); skb = copy_skb; CPU將報(bào)文從skb拷貝到copy_skb中,跳過(guò)了網(wǎng)卡報(bào)頭的額外信息,因?yàn)檫@部分信息在上層協(xié)議站是沒(méi)用的,所以去掉。在函數(shù)開(kāi)始時(shí)說(shuō)過(guò)skb是保存了cons號(hào)的地址,因?yàn)樵?/span>b44_recycle_rx()后cons號(hào)不再引用skb指向的空間,而僅由skb引用,這樣便可以向上層傳送,而不用額外復(fù)制。
netif_receive_skb(skb); received++; budget--; next_pkt: bp->rx_prod = (bp->rx_prod + 1) & (B44_RX_RING_SIZE - 1); cons = (cons + 1) & (B44_RX_RING_SIZE - 1); netif_receive_skb()將報(bào)文交由上層協(xié)議棧處理,這是下一節(jié)的內(nèi)容,然后CPU處理下一個(gè)報(bào)文,rx_prod和cons各加1,它們代表的含義開(kāi)頭有說(shuō)明。
如此循環(huán),直到cons == prod,此時(shí)網(wǎng)卡收到的報(bào)文都已被CPU處理,更新變量:
bp->rx_cons = cons; bw32(bp, B44_DMARX_PTR, cons * sizeof(struct dma_desc));
|
|
來(lái)自: 杰的個(gè)人圖書(shū)館 > 《kernel》