<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 模擬技術 > 設計應用 > PCI Express橋接 PCI 的讀取性能

          PCI Express橋接 PCI 的讀取性能

          作者:Tundra Semiconductor(騰華半導體)公司產(chǎn)品營銷經(jīng)理 Craig Downing 時間:2008-09-24 來源:中電網(wǎng) 收藏

            Express 是目前 PC 集及的普遍互連標準。盡管之前的PCI標準由PCIe所取代,但 FPGA 和I/O設備仍使用 PCI。當前基于 的設計均采用未集成 PCIe 接口的組件,因此若要升級系統(tǒng),需使用 PCIe 橋接器。例如,PCIe橋接器將用于采用I/O設備的視頻錄音機,通過PCI連接至具有PCIe 端口的

          本文引用地址:http://www.ex-cimer.com/article/88325.htm

            在系統(tǒng)中添加橋接器將會帶來一定的設計難題,本文旨在研究通常受引入橋接器影響的 讀取性能問題,以及相應的解決方法。

            引入橋接器帶來的性能挑戰(zhàn)

            PCI 總線上的設備主要依賴有關系統(tǒng)從主機讀取大量的數(shù)據(jù)。PCI I/O 設備通常控制系統(tǒng)中的數(shù)據(jù)移動,并將讀寫循環(huán)傳入主機內(nèi)存。例如,主機處理器可通過寫入外圍設備上的寄存器設置外圍設備中的 DMA,即可設置和配合數(shù)據(jù)移動,但為了專注于其他任務,處理器會將自身從數(shù)據(jù)移動中刪除。然后,外圍設備將讀取或?qū)懭霐?shù)據(jù)以服務 DMA。在其他時間,處理器可讀取狀態(tài)信息并寫入寄存器以進行控制。通常,此通信量不會涉及高帶寬,且不會對系統(tǒng)整體性能帶來重大影響。

            對于安全數(shù)字視頻錄像機(DVR)等嵌入式處理系統(tǒng),將捕獲并壓縮視頻數(shù)據(jù),通過磁盤控制器寫入磁盤存儲器,且磁盤控制器通過 PCI 總線讀取主機內(nèi)存中的數(shù)據(jù)即可實現(xiàn)上述結(jié)果。

            從 PCI 外圍設備寫入橋接器通常傳送至內(nèi)部寫入緩沖器,以解決橋接器帶來的內(nèi)在性能影響。然而,PCIe 橋產(chǎn)品需要重試外圍設備,直至它從主機內(nèi)存中獲得所需的數(shù)據(jù)。這通常意味著試圖讀取許多小型 PCIe 數(shù)據(jù)包,從而增加時延。通過使用分割式傳輸方式,PCI-X 協(xié)議可避免此問題,但傳統(tǒng)的 PCI 協(xié)議并不具備此特點。此外,一些 PCI 設備在收到一條或兩條數(shù)據(jù)緩沖行后就自動釋放總線,這將成為 PCI 讀取的性能挑戰(zhàn)。

            例如,在使用嵌入式 DVR 的普通情況下(圖1),系統(tǒng)需要將持續(xù)的壓縮視頻數(shù)據(jù)流寫入磁盤,以便存儲及隨后檢索或分析。在此系統(tǒng)中,一個或多個磁盤控制器(SATA 控制器)將讀取系統(tǒng)主內(nèi)存中的視頻數(shù)據(jù),以存儲在相關磁盤陣列。上述系統(tǒng)還可以令以太網(wǎng)控制器等其他外部設備共享 PCI 總線。

            如上所述,引入 PCI 橋接器可能導致性能下降。此讀取性能如下所示(參考圖 2):

           

            1.SATA 設備"A"開始從主內(nèi)存讀取。橋接器從內(nèi)存中預取數(shù)據(jù)。然后,SATA設備"A"讀取部分預取數(shù)據(jù)。

            2.SATA 設備"B"開始從主內(nèi)存讀取。橋接器從內(nèi)存中預取數(shù)據(jù)。然后,SATA設備"B"讀取部分預取數(shù)據(jù)。

            3.SATA設備后續(xù)讀取將要求橋接器丟棄緩沖的數(shù)據(jù),并從主內(nèi)存中重取數(shù)據(jù)。

            在此示例中,第 3 步會在讀取事務之間帶來重大時延,從而極大影響讀取性能。對讀取性能的實際影響,可能指實現(xiàn)的性能比直接使用 PCI 總線最初實現(xiàn)的性能下降許多倍。由于總線斷開及多次重試和重取數(shù)據(jù)后,將持續(xù)讀取數(shù)據(jù),導致總線效率受到重大影響。此過程如圖 3 所示。

           

            查看說明實際數(shù)據(jù)讀取點的 PCI_TRDYn(PCI 目標準備)軌跡可看到,首次讀取(第 3 步)與下次讀取(第 6 步)之間存在較大間隔。這意味著視頻數(shù)據(jù)寫入磁盤的最大速度大幅降低,從而限制了系統(tǒng)的性能。在此情況下,最大程度地提高寫入視頻數(shù)據(jù)的速度對于最終產(chǎn)品至關重要--可存儲監(jiān)測最高質(zhì)量視頻所需的諸多信道。

            解決問題 - 短期高速緩存

            Tundra 的 PCI Express橋接器(Tsi381、Tsi382和 Tsi384)具有短期高速緩存 (STC) 的功能,可有助于克服上述性能難題。短期高速緩存允許在最初 PCI 讀取循環(huán)期間從相關 PCI Express 設備中預取數(shù)據(jù),并臨時存儲在橋接器中以便在后續(xù)讀取循環(huán)期間迅速周轉(zhuǎn)。當所要求的設備停止此事務時,在后續(xù)過程中讀取的數(shù)據(jù)不會立即丟棄。

            與最初情況相比,它對性能的改變比較大,以一個采用 Tsi381 橋接器的嵌入式 DVR 系統(tǒng)為例(參考圖4)。在此情況下,啟用 STC 后,后續(xù)讀取不會延遲,原因是有關讀取仍保留在 Tsi381 的高速緩沖存儲器中,且橋接器在首次讀取后無需從內(nèi)存中重新讀取數(shù)據(jù),可確保有效地使用總線。

           

            啟用STC前后PCI 總線的計時見圖5,它可清楚地反映出性能的差異。在此示例中,系統(tǒng)執(zhí)行每臺設備32位的讀取,兩臺設備無STC時執(zhí)行2次讀取的相同期間,在使用STC后可進行7次讀取??梢姡谑褂肧TC的情況下,系統(tǒng)的整體吞吐性能可提高三倍以上。對于通過一臺設備執(zhí)行讀取的系統(tǒng)而言,性能將獲得更大的提高。

           

            Tundra PCI Express 橋接器可確保開發(fā)人員調(diào)整下列其他參數(shù),從而進一步調(diào)諧系統(tǒng): 調(diào)整數(shù)據(jù)保留在高速緩沖存儲器內(nèi)的時間。此特點確保設計人員丟棄過期的數(shù)據(jù)并預取從前過期的數(shù)據(jù)。 調(diào)整 PCI 讀取預取長度。從理論上而言,橋接器不得預取比PCI外圍設備通常所需的更多的數(shù)據(jù),設計人員可根據(jù)通常預期的傳輸長度設置此參數(shù)。

            根據(jù)系統(tǒng)設計及設備的狀況,設計人員可調(diào)整預取長度及短期高速緩存丟棄計時器,以提高整體性能或關鍵性能。

            總結(jié)

            使用PCIe橋接器將有助于解決由PCI轉(zhuǎn)向 PCIe帶來的設計難題。PCI 外圍設備開始的讀取將產(chǎn)生額外的延時,這通常對系統(tǒng)的整體性能帶來重大影響。Tsi381及其他Tundra PCIe橋接器的功能集允許開發(fā)人員調(diào)諧橋接器,從而優(yōu)化系統(tǒng)性能。利用短期高速緩存,這些橋接器可輕松消除 PCI讀取相關的性能瓶頸。

          linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();