在高精度時(shí)間間隔測(cè)量中隔離位誤碼率突發(fā)事件
發(fā)現(xiàn)、識(shí)別和隔離罕見定時(shí)事件(rare timing event)、競(jìng)爭(zhēng)狀態(tài)和非確定性抖動(dòng)效應(yīng)通常十分困難。隨著業(yè)界采用各種經(jīng)驗(yàn)規(guī)則和近似方法來判斷設(shè)計(jì)方案的統(tǒng)計(jì)特性何時(shí)達(dá)到“足夠好”的水平,這一點(diǎn)在今天變得尤為突出。更重要的是,這個(gè)問題還很容易掩蓋潛在的重大設(shè)計(jì)缺陷。本文介紹一個(gè)簡(jiǎn)單的案例研究,它不注重理論分析,而是嘗試展示如何通過逐周期的波形分析來大幅提高工程人員的能力,使他們對(duì)罕見事件更加了解,進(jìn)而捕捉這些罕見事件并分析其實(shí)質(zhì),隔離其來源。
我們需要測(cè)試串行數(shù)據(jù)流的組成,它們與高性能數(shù)字視頻應(yīng)用中的信號(hào)有些類似。我們采用HP 8133A精密數(shù)字信號(hào)發(fā)生器和取樣速率達(dá)20GSa/sec的安捷倫54855A實(shí)時(shí)示波器來激勵(lì)和捕捉一系列單次數(shù)字波形。8133A發(fā)生器廣泛用來產(chǎn)生數(shù)字信號(hào)流和時(shí)鐘。這種脈沖發(fā)生器的一些新款型功能更強(qiáng),為用戶對(duì)已知數(shù)字信號(hào)進(jìn)行精密抖動(dòng)測(cè)量提供了最大的裕度。圖1顯示了8133A的抖動(dòng)測(cè)試性能,在ASA公司的M1上測(cè)量時(shí),小于800fs RMS。
可以想象,當(dāng)某天發(fā)現(xiàn)8133A產(chǎn)生類型稍有不同的測(cè)量結(jié)果時(shí),我們會(huì)有多么驚訝。圖2中左側(cè)圖形是一個(gè)很不尋常的結(jié)果,數(shù)據(jù)信號(hào)中的規(guī)則抖動(dòng)應(yīng)當(dāng)與右側(cè)圖形相似才對(duì)。
實(shí)際上,我們?cè)谧畛跻约斑M(jìn)行的所有研究取樣中從未見過這種“四模式”柱狀圖。這個(gè)柱狀圖是如此罕見,以至于在使用眼圖和柱狀圖進(jìn)行數(shù)百次取樣(經(jīng)歷好幾天時(shí)間)和查找之后,我們?cè)僖矝]有見到過與之相似的柱狀圖。當(dāng)我們決心要找到和顯示同樣的柱狀圖,并為此做出了一番精心策劃的努力之后,對(duì)它的看法也相應(yīng)發(fā)生了改變。
不過,假設(shè)在研究試驗(yàn)中偶然捕捉到了類似“四模式”柱狀圖的一個(gè)瞬時(shí)、單次出現(xiàn)的波形取樣。果真如此,可能會(huì)想:“嗯,這可真是怪事,一定是哪兒出錯(cuò)了,才會(huì)出現(xiàn)這種情況!”之后,我們很可能按下“運(yùn)行/停止”按鈕再次取樣,特別是當(dāng)覺得自己的設(shè)備吞吐率高、更新快速、非常令人滿意時(shí)。由于上面的“四模式”柱狀圖實(shí)際上是一個(gè)罕見事件時(shí),因此下一個(gè)以及下幾百個(gè)取樣幾乎肯定不會(huì)再出現(xiàn)類似的結(jié)果。
事實(shí)上,在查找過程中我們一直沒有發(fā)現(xiàn)這種“四模式”柱狀圖。當(dāng)我們認(rèn)識(shí)到自己遇到的問題時(shí),我們就必搜索這個(gè)圖形。但是,在搜索之前,我們必須知道它確實(shí)存在。而且,由于罕見事件如此稀少,捕捉它們的最佳途徑就是一開始就秉持正確的態(tài)度。
了解罕見事件
在ASA公司,我們很少認(rèn)為統(tǒng)計(jì)方法能夠幫助找到罕見定時(shí)或抖動(dòng)事件。我們相信罕見事件要比人們想象的普通得多。罕見事件有多種不同的形式,有些真正是非常難得發(fā)生一次的差錯(cuò),其他的是一些長周期事件,有些是以短時(shí)突發(fā)形式發(fā)生的。我們也了解所有測(cè)試設(shè)備的一些基本局限,人們應(yīng)該具備相應(yīng)的洞察力,可以理解測(cè)試設(shè)備表明的有關(guān)罕見事件的意義。本文后面將簡(jiǎn)要概述一下測(cè)試設(shè)備的部分局限性。實(shí)時(shí)、逐周期的波形捕捉要遠(yuǎn)比欠采樣方法好得多,我們傾向于取樣一次隨即就對(duì)它進(jìn)行分析;而不是大量取樣,再通過運(yùn)用測(cè)量算法對(duì)波形數(shù)據(jù)進(jìn)行處理來得出結(jié)果。我們相信,查找罕見定時(shí)事件成功的一半在于如何設(shè)計(jì)查找方法。
發(fā)現(xiàn)罕見事件
不過,如何才能發(fā)現(xiàn)這種稍縱即逝的“四模式”柱狀圖呢?我們?cè)诖袛?shù)據(jù)流上測(cè)量RjDj。無論是RjDj數(shù)值本身,還是眼圖或波形都無法識(shí)別出這個(gè)罕見錯(cuò)誤。在一次連續(xù)取樣過程中觀察M1時(shí),注意到有時(shí)單次采樣的Rj/Dj/Tj數(shù)值突然“跳動(dòng)”一個(gè)相當(dāng)大的幅度,即使累加了 100次采樣之后仍然如此。這種現(xiàn)象非常特別,因?yàn)楸粶y(cè)系統(tǒng)據(jù)信是非常穩(wěn)定的。這個(gè)現(xiàn)象也在收斂指示器上得到了證實(shí),它們一直顯示處于收斂狀態(tài),只在罕見情況下才出現(xiàn)發(fā)散。這種現(xiàn)象令我們感到奇怪,測(cè)量儀器告訴我們發(fā)生了問題。
起初,我們分析肯定是自己在測(cè)量時(shí)出錯(cuò)了,但在使用新的54850系列示波器時(shí),感覺和使用8133A一樣。而這種示波器性能非常優(yōu)秀,不可能自己產(chǎn)生這種現(xiàn)象。一定是軟件中有什么錯(cuò)誤!但是,我們什么也沒找到,于是開始審視自己的測(cè)量方法,但是也沒有找到想象中的錯(cuò)誤。我們嘗試再次進(jìn)行測(cè)量,卻無法復(fù)現(xiàn)先前的結(jié)果。
我們利用M1的“記錄到磁盤”特性,記錄下了20分鐘左右過程中進(jìn)行的500次連續(xù)取樣所獲得的帶時(shí)間標(biāo)記的數(shù)據(jù)。同時(shí),利用M1的Rj/Dj ASM(針對(duì)特定應(yīng)用的測(cè)量)屏幕上的“保存”功能,將每次取樣的Rj/Dj/Tj值保存到了一個(gè)文本文件。這個(gè)文本文件被加載到Excel,根據(jù)取樣序號(hào)繪出了Rj/Dj/Tj曲線,如圖3所示。Tj圖至少顯示出了三個(gè)明顯的“跳變”,對(duì)應(yīng)的取樣序號(hào)約為63、106和280。
這時(shí),我們開始意識(shí)到出現(xiàn)了一些奇怪的情況。毫無道理,Tj的值會(huì)在一次取樣中劇烈增加,一定是數(shù)據(jù)中出現(xiàn)了什么問題。
識(shí)別罕見事件
利用M1 的“自動(dòng)加載”特性和早前保存的時(shí)間標(biāo)記數(shù)據(jù),我們可以按多種視圖查看數(shù)據(jù),以便了解在兩次取樣之間它們是如何改變的,或者有無改變。查看信號(hào)沿抖動(dòng)柱狀圖時(shí),我們發(fā)現(xiàn)某些取樣的柱狀圖分布形狀與其他大部分取樣顯著不同,參見本文前面的頭兩幅柱狀圖。找到那些特定的取樣后,發(fā)現(xiàn)它們正是使Tj值發(fā)生跳變的那幾個(gè)取樣。
這時(shí),我們開始把這三個(gè)事件看作罕見定時(shí)事件。我們認(rèn)識(shí)到在500個(gè)取樣中只發(fā)現(xiàn)3了個(gè)奇怪的取樣,而且每個(gè)取樣記錄了大約3萬個(gè)周期的波形,總共有約1500萬個(gè)周期的波形信息。顯然,這是一個(gè)虛假事件,如果不是罕見事件的話。但它不是那種經(jīng)過15天數(shù)據(jù)傳輸之后才出現(xiàn)一個(gè)位誤碼的罕見事件。另外一點(diǎn)需要注意的是,柱狀圖的形狀很不相同,表明不止一位數(shù)據(jù)出現(xiàn)異常,而是有一系列數(shù)據(jù)位都發(fā)生了錯(cuò)位。這次錯(cuò)誤不是一個(gè)單獨(dú)的錯(cuò)誤,而是偶然出現(xiàn)的一組錯(cuò)誤。更專業(yè)的表述是,這次錯(cuò)誤看來是罕見的、偶然性的和突發(fā)性的。
考察問題取樣數(shù)據(jù)所繪出的信號(hào)沿抖動(dòng)圖和脈寬抖動(dòng)圖中的尖峰位置時(shí),可發(fā)現(xiàn)以下二者的位置之間有著很強(qiáng)的關(guān)聯(lián)性:1. 已知跳變位置;2. 與問題取樣相關(guān)的篩選信號(hào)沿抖動(dòng)中的明顯變化。殘差與平均單位間隔時(shí)間的影響并不是根本性的。通過這個(gè)分析,有關(guān)M1的疑問基本上被排除了。因此我們得到的結(jié)論是,在發(fā)生跳變的取樣位置上很可能確實(shí)存在BER突發(fā)。
分離罕見事件
為了確定上述特性是確實(shí)存在于信號(hào)本身,還是M1或示波器所帶來的,我們用不同的示波器、不同的脈沖發(fā)生器和不同的抖動(dòng)分析工具進(jìn)行了很多次測(cè)試。結(jié)果表明,只有這個(gè)特定的信號(hào)發(fā)生器表現(xiàn)出了“跳變”的特性。這給了我們很大信心,問題應(yīng)當(dāng)出在信號(hào)源本身,或是某種環(huán)境因素對(duì)信號(hào)源產(chǎn)生了影響。
由此可見,一個(gè)簡(jiǎn)單的方法就是將脈沖發(fā)生器與其所在的環(huán)境隔離開來。事實(shí)上,多年來ASA公司已經(jīng)發(fā)現(xiàn)有許多環(huán)境不適合進(jìn)行精確的定時(shí)和抖動(dòng)測(cè)量。一些日常的辦公環(huán)境會(huì)成為引起位誤碼的來源。有時(shí),這些環(huán)境問題會(huì)影響信號(hào)發(fā)送源,就象本例中的情況一樣。大多數(shù)時(shí)候,它們影響的是接收器。
我們并不關(guān)心是8133A脈沖發(fā)生器對(duì)耦合進(jìn)來的環(huán)境因素過于敏感,還是儀器本身產(chǎn)生了錯(cuò)誤。我們關(guān)心的是,到現(xiàn)在可以推斷,我們多年來一直信賴的標(biāo)準(zhǔn)脈沖發(fā)生器看來至少容易受到一些(內(nèi)部或外部)激勵(lì)所引起的BER突發(fā)的影響。這是一個(gè)首先需要抓住的事實(shí)。
發(fā)現(xiàn)罕見事件的其他方法
發(fā)現(xiàn)罕見事件的方法很多。最常用的方法就是讓示波器以無限制持續(xù)模式整晚運(yùn)行。這樣有可能在眼圖或柱狀圖中捕獲一些蛛絲馬跡。當(dāng)然,我們同樣也有可能忽略這些數(shù)據(jù)。歸根到底,人們不可能真正知道在整個(gè)夜晚期間環(huán)境中到底發(fā)生了什么情況。更重要的是,許多示波器,尤其是那些不執(zhí)行逐周期波形取樣并在屏幕上顯示取樣存儲(chǔ)器中每一個(gè)周期數(shù)據(jù)的那些儀器,要以小于100波形/秒的更新速率在寬度為兩個(gè)周期的時(shí)間窗口中發(fā)現(xiàn)一個(gè)罕見事件(如10-12 BER)不是一件容易的事情,即使連續(xù)工作10小時(shí)也未必能做到。而且就算捕捉到了罕見事件,“四模式”柱狀圖又表明了誤碼來源的什么信息呢?回顧一下,現(xiàn)在已經(jīng)得到了“四模式”柱狀圖,但仍然無法確定僅憑這個(gè)柱狀圖本身能表明問題起源的任何信息。不過它確實(shí)表明出現(xiàn)了問題。
如果用PRBS波形通過硬件或軟件方式來進(jìn)行同步,有些示波器可以追溯錯(cuò)誤圖案的位置。這種方法使用方便,但實(shí)際上它只適用于示波器能夠與信號(hào)發(fā)生器進(jìn)行同步的激勵(lì)/響應(yīng)應(yīng)用。這種系統(tǒng)無法用于實(shí)時(shí)設(shè)計(jì)中的真實(shí)數(shù)據(jù)。另外,使用PRBS信號(hào)源來調(diào)試設(shè)備對(duì)于查找由確定性時(shí)不變錯(cuò)誤(如符號(hào)之間的干擾)引起的誤碼可能非常有幫助。但是,重復(fù)性的PRBS圖案測(cè)試對(duì)于實(shí)時(shí)信號(hào)并不足夠,除非采用一個(gè)很長的PRBS圖案,并且使用一個(gè)既能查看確定性時(shí)不變定時(shí)錯(cuò)誤又能查看非確定性時(shí)變定時(shí)錯(cuò)誤的實(shí)時(shí)示波器來捕捉這個(gè)圖案。一種理想的方法是使用一臺(tái)實(shí)時(shí)示波器和一個(gè)長PRBS圖案或一個(gè)由實(shí)際設(shè)計(jì)環(huán)境中部件的實(shí)時(shí)應(yīng)用所產(chǎn)生的實(shí)時(shí)隨機(jī)數(shù)據(jù)流。
我們本來可以利用一個(gè)位誤碼率測(cè)試器(BERT)來幫助表征異常現(xiàn)象,它們對(duì)表征設(shè)計(jì)非常有益,但也非常昂貴(即使租用一個(gè)月也是代價(jià)不菲)。而且,雖然我們知道通過這種方法可以判定系統(tǒng)是否存在一些問題,但位誤碼率數(shù)值又表明了什么信息呢?位誤碼率測(cè)試器確實(shí)具有許多優(yōu)秀的功能可用來表征多種不同情形下的位誤碼率,但是在實(shí)踐中,我們很少看見系統(tǒng)設(shè)計(jì)人員用它來對(duì)設(shè)計(jì)方案進(jìn)行調(diào)試。
本文小結(jié)
本文介紹了很多技巧,特別是在罕見事件的捕捉方面。首先,發(fā)現(xiàn)一個(gè)特殊的柱狀圖、一個(gè)無法解釋的測(cè)量結(jié)果,或者一個(gè)統(tǒng)計(jì)上的罕見曲線之后,你應(yīng)該立即停止正在進(jìn)行的工作,并相信它是真實(shí)的。不要再次按下示波器的“運(yùn)行/停止”按鈕,希望消除這個(gè)現(xiàn)象。相反,你應(yīng)該立即將波形保存到硬盤。這有可能是一個(gè)罕見事件。其次,在這個(gè)例子中,不考慮抖動(dòng)特征中的非確定性現(xiàn)象可能是不對(duì)的。BER突發(fā)不是某種容易通過一次重復(fù)測(cè)試來表征的現(xiàn)象。第三,有些方法會(huì)忽略罕見事件,如欠采樣、等時(shí)波形捕捉、完全只注意RjDj的數(shù)值大小而忽視其在時(shí)間上的收斂性等,這些方法都會(huì)掩蓋潛在的罕見事件。
本例中的BER突發(fā)是在比較凈化的環(huán)境中發(fā)現(xiàn)的。在實(shí)時(shí)應(yīng)用中,很少會(huì)有凈化的環(huán)境。實(shí)際系統(tǒng)的電路板上有許多不確定的抖動(dòng)和虛假電子信號(hào)。ASA公司發(fā)現(xiàn),許多工程人員使用堆疊式裝置而希望產(chǎn)生或測(cè)量皮秒級(jí)的定時(shí),這是不切實(shí)際的。
某些部件對(duì)于虛假外部激勵(lì)的影響具有較好的耐受性??上Ш苌儆胁考O(shè)計(jì)人員(甚或使用這些零部件的系統(tǒng)設(shè)計(jì)人員)花時(shí)間來了解外部虛假激勵(lì)的敏感性,這可能會(huì)給系統(tǒng)設(shè)計(jì)人員帶來后續(xù)的問題。
回頭再看,幾乎所有工具都可能遇到這些錯(cuò)誤,任何方法也都可能發(fā)生這些錯(cuò)誤。重要的是,在本例中,M1的幾項(xiàng)功能幫助我們更加迅速地掌握到了罕見事件的實(shí)質(zhì)。首先,我們采用了一種非統(tǒng)計(jì)的方法。M1的RjDj提取法建立在逐周期數(shù)據(jù)分析的基礎(chǔ)之上,它使非確定性BER的效果得以迅速地呈現(xiàn)出來。其次,我們使用M1的抖動(dòng)頻域視圖來將取樣轉(zhuǎn)化到頻域,以了解問題采樣中是否有任何頻率分量導(dǎo)致誤碼發(fā)生。本例中雖然沒有出現(xiàn)這種情況,但在其他情況下,這是另一項(xiàng)特別有用的調(diào)試工具。再次,M1的“記錄到磁盤”功能以及全新的“自動(dòng)加載”特性也對(duì)分析極其有用。新的RjDj文本保存特性也是如此。最后,在本例的調(diào)試過程中,通過繪出各個(gè)周期的RjDj曲線和觀察RjDj的收斂/發(fā)散情況來查看RjDj值的跳變情況也非常重要。相對(duì)任何欠取樣方法而言,實(shí)時(shí)、逐周期的取樣并不是一個(gè)微不足道的優(yōu)點(diǎn)?;谶@一分析,我們強(qiáng)烈推薦你采用M1,這不僅是為了表征串行數(shù)據(jù)設(shè)計(jì)方案,同時(shí)也是了解和調(diào)試它的需要。
作者:Greg Walz
產(chǎn)品市場(chǎng)經(jīng)理
Amherst Systems Associates
Email: greg_walz@amherst-systems.com
評(píng)論