国产亚洲精品AA片在线观看,丰满熟妇HD,亚洲成色www成人网站妖精,丁香五月天婷婷五月天男人天堂

新聞中心

EEPW首頁 > 測試測量 > 設(shè)計應(yīng)用 > 升維打擊!用示波器排查CAN的各種錯誤幀

升維打擊!用示波器排查CAN的各種錯誤幀

作者: 時間:2025-02-13 來源:硬件筆記本 收藏

本文引用地址:http://www.ljygm.com/article/202502/466904.htm


摘要:CAN的BusOff源于錯誤幀的積累,而錯誤幀這個東西,是一個接收節(jié)點(diǎn) 認(rèn)為數(shù)據(jù)有誤 故意打斷通信,好讓發(fā)送節(jié)點(diǎn)感知到 并重發(fā)報文的設(shè)計。注意這里邊有個“我覺得你有病”的認(rèn)知陷阱,讓CAN的診斷變得近似玄學(xué)。本文分享一種用CAN波形的幅度和脈寬信息來精確定位錯誤幀來源的方法,來自知乎的大燈。

我們先從基礎(chǔ)的講起。CAN節(jié)點(diǎn)的電路一般如下圖所示,MCU內(nèi)置了CAN控制器用來將MCU的數(shù)據(jù)封裝為CAN幀格式,同時它也負(fù)責(zé)CAN幀的校驗和錯誤幀的處理。控制器封裝好的邏輯報文經(jīng)TX RX送到CAN收發(fā)器,將邏輯信號轉(zhuǎn)變?yōu)檎嬲目偩€差分波形。


一、CAN物理層

也就是CAN收發(fā)器干了啥?


一個典型的雙節(jié)點(diǎn)CAN網(wǎng)絡(luò)的物理層等效電路如上圖,兩顆120Ω終端電阻并聯(lián)呈現(xiàn)總線電阻60Ω。黑框里是A、B兩個節(jié)點(diǎn)的CAN收發(fā)器(Transceiver),它只負(fù)責(zé)電平轉(zhuǎn)換。當(dāng)總線靜默時,收發(fā)器內(nèi)部的2.5V電源經(jīng)15KΩ電阻把CAN-H和CAN-L都拉到2.5V,總線這個狀態(tài)稱之為隱性。當(dāng)節(jié)點(diǎn)A想要驅(qū)動總線的時候(TX=0),它同時把內(nèi)部的上下兩個MOS管導(dǎo)通,整個網(wǎng)絡(luò)的電流流向:節(jié)點(diǎn)A的5V電源經(jīng)二極管、24Ω、兩顆終端電阻并聯(lián)、24Ω、二極管回到節(jié)點(diǎn)A的地,總線這個狀態(tài)稱之為顯性。上的電壓實(shí)際上就是終端電阻的分壓。從節(jié)點(diǎn)B來看,CAN-H就變成3.5V,CAN-L變成1.5V,拉出了總線 H - L = 2V 的差分電壓,大于0.7V的判斷閾值,節(jié)點(diǎn)B就認(rèn)為收到了一個顯性(RX=0)。大家可以算一下分壓值以增強(qiáng)記憶,后邊會用到。

反直覺知識點(diǎn)①總線無人驅(qū)動時,也就是各個節(jié)點(diǎn)都隱性時,CAN標(biāo)準(zhǔn)定義這時的TX/RX邏輯電平為1;總線有節(jié)點(diǎn)驅(qū)動顯性,也就是主動拉開差分電壓的時候,對應(yīng)TX/RX端邏輯電平0,這個1/0的反邏輯類似I2C等OC門的驅(qū)動邏輯,努力適應(yīng)一下。這么做我猜有兩個原因:一是對地邏輯的抗擾能力強(qiáng)一些,NPN載流能力強(qiáng)&回流路徑短;二是為了數(shù)學(xué)上的嚴(yán)謹(jǐn)性:1x1x1x1...1x0 = 0,任意節(jié)點(diǎn)驅(qū)動顯性0,那總線就是顯性0;所有節(jié)點(diǎn)隱性1,總線才是隱性1。但這樣的反邏輯帶來一個問題是,電路設(shè)計時需要尤其注意上下電時序,上電/休眠/喚醒過程中千萬不要出現(xiàn)MCU已下電(TX拉低)但CAN收發(fā)器還供5V電的情況。如果實(shí)在難以避免,可以試試單3.3V的CAN收發(fā)器MAX3051,它不需要5V電源,邏輯電和驅(qū)動電共用同一路3.3V,肯定不會出現(xiàn)電源時序問題。

反直覺知識點(diǎn)②:理論上CAN_L短地,或 CAN_H短路12V,因60Ω終端電阻的存在,隱性時CAN-H與CAN-L之間基本還是重合的,顯性時也能正常拉開壓差,能維持正常通信,只不過丟包率可能會大一點(diǎn)。大家可以算算總線電壓,很容易診斷這個問題。另外,如果你看到CAN的通信電壓不是以2.5V為中心對稱的,也有可能是多個CAN線交叉錯接,比如CAN1_L錯接到了CAN2_L上。

反直覺知識點(diǎn)③:一個CAN網(wǎng)絡(luò)里,120Ω終端電阻1~4顆都能工作,少了的話 離終端電阻遠(yuǎn)的節(jié)點(diǎn) 抗擾度會差,多了的話 顯性差分電壓可能無法觸發(fā)閾值。

反直覺知識點(diǎn)④:除了線路的最遠(yuǎn)端,任何稍長的CAN分支都可以加1K~4.7K的支線電阻,跑點(diǎn)電流來改善抗擾度。只要分支別太長,大致1Mbps以內(nèi)的任何總線其終端電阻都是跑電流增強(qiáng)抗擾的,不涉及真正的阻抗或者反射抑制,雙絞的要求也不是特別嚴(yán)格。

二、CAN鏈路層

也就是CAN控制器干了啥?

回顧完物理層,咱來看鏈路層,CAN幀的標(biāo)準(zhǔn)格式。當(dāng)發(fā)送節(jié)的MCU將TX由1變0的時候,CAN收發(fā)器將CAN-H拉高&CAN-L拉低,接收節(jié)點(diǎn)收到了H-L>0.7V的壓差后,接收節(jié)點(diǎn)的CAN收發(fā)器RX輸出由1變0。下圖是一個節(jié)點(diǎn)接收到CAN波形后解碼出的RX邏輯。


一幀報文里邊有比較關(guān)鍵的幾段:仲裁段、控制段 、 數(shù)據(jù)段、CRC段、ACK段

仲裁段中的大部分是CAN報文的ID,起名為“仲裁”其實(shí)是因為這一段有優(yōu)先級仲裁的功能:假設(shè)A、B兩個節(jié)點(diǎn)在同一時刻搶發(fā)報文,節(jié)點(diǎn)A要發(fā)二進(jìn)制ID為001的報文,B要發(fā)010。當(dāng)A、B節(jié)點(diǎn)都在發(fā)第一位的顯性0的時候,總線會同時被兩個節(jié)點(diǎn)驅(qū)動顯性,A、B節(jié)點(diǎn)回讀總線也都是顯性,相互之間還意識不到對方的存在。當(dāng)節(jié)點(diǎn)A發(fā)到第二位的0,節(jié)點(diǎn)B發(fā)到第二位的1的時候,總線只有節(jié)點(diǎn)A驅(qū)動顯性0,節(jié)點(diǎn)B不驅(qū)動 卻發(fā)現(xiàn)總線被別人驅(qū)動了,此時節(jié)點(diǎn)B會認(rèn)為CAN線上有比自己這幀010優(yōu)先級更高的數(shù)據(jù),節(jié)點(diǎn)B就會主動停發(fā),讓節(jié)點(diǎn)A獨(dú)占總線發(fā)完。之后節(jié)點(diǎn)B懷揣著這幀數(shù)據(jù)再次參與總線優(yōu)先級的仲裁。

反直覺知識點(diǎn)①:CAN作為一個對等網(wǎng)絡(luò),沒有主從關(guān)系,報文全部廣播,節(jié)點(diǎn)本身也沒有優(yōu)先級概念,只有報文ID的優(yōu)先級。可以這么理解:CAN節(jié)點(diǎn)是“由事件驅(qū)動的”,比如剎車制動器,它能發(fā)高優(yōu)先級的“剎車被踩下”的報文,也會發(fā)低優(yōu)先級的“剎車油位正?!钡膱笪?,這些報文根據(jù)ID的大小在總線上自由競爭優(yōu)先級,而不是剎車制動器這個節(jié)點(diǎn)的話語權(quán)一定高。這個特性就要求設(shè)計人員提前規(guī)劃好所有報文優(yōu)先級和周期(即“通信矩陣”)才能保證整個CAN網(wǎng)絡(luò)如期運(yùn)轉(zhuǎn)。如果你的CAN網(wǎng)絡(luò)有大量雷同節(jié)點(diǎn),節(jié)點(diǎn)又只有一幀報文,那么ID數(shù)大(優(yōu)先級低)的節(jié)點(diǎn)一定會在總線繁忙或干擾重發(fā)的時候"插不上話",可以試試把時間戳融合到ID里邊,確保各節(jié)點(diǎn)的新數(shù)據(jù)優(yōu)先級最高,舊數(shù)據(jù)自然會被仲裁掉。

反直覺知識點(diǎn)②:在A、B節(jié)點(diǎn)同時驅(qū)動第一個顯性0的時候,總線被兩個節(jié)點(diǎn)同時驅(qū)動,電壓會顯著高于2V。上會看到在仲裁段的頭部有明顯的電平凸臺,后續(xù)節(jié)點(diǎn)A搶占總線之后電壓會回歸正常的2V。

反直覺知識點(diǎn)③:各個節(jié)點(diǎn)的時鐘同步是把每個bit做16~20份的數(shù)字切片來實(shí)現(xiàn)的,這個切的份數(shù)不建議太多或太少。詳細(xì)機(jī)制請參閱 ZLG致遠(yuǎn)電子的這篇:CAN同步機(jī)制,你真的了解嗎?

控制段中有幾個控制位,這里拿幾個常用的舉例。IDE位為擴(kuò)展ID的指示。如果IDE位為隱性1,就會在后邊再續(xù)上18位的ID,共11+18=29位長度。比如0x9E就是個11位長度的ID,0x0151就是個29位的ID。R0位是CAN里邊的預(yù)留位,在CAN-FD里被用作FD幀格式的標(biāo)志位FDF,這一位為隱性1就會按FD的幀格式解碼后續(xù)報文。DLC指示了后邊的數(shù)據(jù)段的長度,例如1000表示后續(xù)會有8個Byte長度的數(shù)據(jù)。CAN-FD協(xié)議只在數(shù)據(jù)段會切換成高速率,比如2Mbps/8Mbps,前后其他段的速率保持500kbps不變。

反直覺知識點(diǎn)①:CAN與CAN-FD除了數(shù)據(jù)段波特率的不同,幀格式也有區(qū)別,CAN-FD多了一些控制位。比如FDF(也叫EDL)位用來指示是否按FD幀格式解碼,BRS位用來指示是否需要切換高波特率,也就是說,一個FD幀可以全程500kbps不切速率的。

反直覺知識點(diǎn)②:CAN控制器的標(biāo)準(zhǔn)ISO11898-1里要求接收方不解讀R0位的顯隱性,所以CAN的控制器無法過濾FD幀。標(biāo)準(zhǔn)CAN網(wǎng)絡(luò)里邊一旦出現(xiàn)FD幀會因為多了BRS、ESI等控制位被認(rèn)為是格式錯誤。同樣的,因為CAN 2.0時代R0/FDF幀無意義,也有一些設(shè)備把發(fā)送出去的CAN幀的R0位錯誤地置了隱性1,這樣的設(shè)備在CAN網(wǎng)絡(luò)里一切正常,但若進(jìn)入CAN-FD網(wǎng)絡(luò)就會被解讀成FD幀,進(jìn)而因為缺少BRS、ESI等控制位被認(rèn)為是格式錯誤。所以,CAN-FD并不是真的向下兼容CAN,因為舊時代的CAN設(shè)備并沒有判別R0/FDF位的能力,一旦它進(jìn)入FD網(wǎng)絡(luò)就會瘋狂地打斷通信。

反直覺知識點(diǎn)③:DLC的長度,在CAN標(biāo)準(zhǔn)里DLC可以是0000~1000之間的二進(jìn)制值,可以用8421的算法直接計算出數(shù)據(jù)長度。而在CAN-FD中,1001~1111之間的值則被解讀為離散的12,16,20,24,32,48,64byte。

CRC段對于從幀頭到Data結(jié)束之間的數(shù)據(jù),CAN協(xié)議使用了CRC15這個比較特別的多項式計算校驗,有興趣的可以手算CRC試試。CAN-FD根據(jù)數(shù)據(jù)長度的不同使用了CRC17和CRC21,這里暫不做展開。

ACK段是由收到該幀的CAN節(jié)點(diǎn)回復(fù)的確認(rèn)(Acknowledge)。注意 發(fā)送節(jié)點(diǎn)在ACK位一定發(fā)的是隱性1,由接收節(jié)點(diǎn)回應(yīng)顯性0,雙方無縫銜接才在總線上呈現(xiàn)出一個完整的CAN報文。

反直覺知識點(diǎn)①:總線上任何節(jié)點(diǎn) 只要認(rèn)為這個幀的結(jié)構(gòu)正確,都會在ACK位回顯性0,不管需不需要這一幀的ID和數(shù)據(jù)。為什么不需要的節(jié)點(diǎn)也會回ACK?因為等MCU算完會造成這一位的延遲,攪亂總線時序,不如只保障鏈路層本身的格式正確,純芯片數(shù)字邏輯實(shí)現(xiàn)無延遲。嗯,90年代的總線要求不要太高。

反直覺知識點(diǎn)②:發(fā)送節(jié)點(diǎn)若發(fā)現(xiàn)自己這一幀沒有ACK回應(yīng),它也會認(rèn)為總線出錯,重發(fā)16次后進(jìn)入Passive error狀態(tài),有興趣的自行研究一下,這里不做展開。

三、真實(shí)CAN波形

來看一個兩節(jié)點(diǎn)案例:若節(jié)點(diǎn)A發(fā)送0x9E報文到總線,從節(jié)點(diǎn)B收到的總線波形和邏輯側(cè)波形如下:


黃線為CAN-H,綠線為CAN-L,藍(lán)線為節(jié)點(diǎn)B的邏輯側(cè)RX,紫線為節(jié)點(diǎn)B的邏輯側(cè)TX??梢钥吹?,作為接收方的節(jié)點(diǎn)B,總線拉差分電壓拉出顯性的時候,收發(fā)器將RX拉0給到MCU。在節(jié)點(diǎn)B想要回應(yīng)ACK的時候,MCU將TX拉0,CAN收發(fā)器在總線上拉出了一個歪斜的顯性(歪斜是因為測量點(diǎn)的寄生電感影響)。RX在ACK位置的0,是收發(fā)器TX=0驅(qū)動總線顯性之后 回讀到的0。

再看一個比較真實(shí)的車上波形,CAN網(wǎng)絡(luò)上大于4個節(jié)點(diǎn):


黃色是CAN_H,高電平表示顯性0,綠色是我們掛這個節(jié)點(diǎn)的邏輯側(cè)TX,低電平表示顯性0。箭頭A~D是一幀完整的CAN報文,箭頭A ~ B這個過程中,我們掛示波器的這個節(jié)點(diǎn)和另一個節(jié)點(diǎn)正在進(jìn)行優(yōu)先級仲裁,根據(jù)我們之前講到的物理層的分壓原理,兩個節(jié)點(diǎn)同時驅(qū)動電壓會高一截。在箭頭C這個bit 該節(jié)點(diǎn)想發(fā)隱性1但發(fā)現(xiàn)總線是顯性0,那就說明有另外的節(jié)點(diǎn)在發(fā)送更高優(yōu)先級的報文,我們這個節(jié)點(diǎn)會主動退出發(fā)送,成為接收節(jié)點(diǎn),并在箭頭D點(diǎn)校驗成功后回應(yīng)ACK,等待報文結(jié)束后這個節(jié)點(diǎn)再次參與總線仲裁,成功搶占總線如E點(diǎn)所示。

注意波形高度,在箭頭A~B之間,差分電壓略高于2V,這是正常現(xiàn)象,說明有兩個節(jié)點(diǎn)同時驅(qū)動總線顯性,但從邏輯看,因為H-L>0.7V所以都為顯性0,純數(shù)字邏輯的CAN控制器在箭頭A~B之間還感知不到對方的存在,箭頭C點(diǎn)之后才感知得到;而在箭頭D點(diǎn),因為除了發(fā)送節(jié)點(diǎn)之外的所有節(jié)點(diǎn)都在同時驅(qū)動ACK,所以總線電壓比箭頭A~B之間的雙節(jié)點(diǎn)驅(qū)動 電壓更高。

四、錯誤幀

終于到了錯誤幀,注意,錯誤幀不是由哪個節(jié)點(diǎn)發(fā)出的,而是由某個接收節(jié)點(diǎn)認(rèn)為總線錯誤,故意驅(qū)動總線打斷發(fā)送方,在總線上呈現(xiàn)為一個錯誤幀。也就是說錯誤幀 一定是由 一個發(fā)送節(jié)點(diǎn)和至少一個 認(rèn)為發(fā)送方有錯的節(jié)點(diǎn) 共同形成的。

五、位填充

位填充規(guī)則是CAN協(xié)議的靈魂,簡單來講就幾個字:逢五補(bǔ)一。當(dāng)發(fā)送節(jié)點(diǎn)想要發(fā)連續(xù)5個bit的顯性0的數(shù)據(jù),會故意插入一個無意義的隱性1;當(dāng)出現(xiàn)連續(xù)5個bit的隱性1,會故意插入一個無意義的顯性0,如下圖的紫色bit。如果發(fā)送節(jié)點(diǎn)漏填了這個0/1,或者這個0/1被干擾成了1/0,接收節(jié)點(diǎn)就會判定為“填充錯誤”,向總線上輸出“主動錯誤標(biāo)志”——連續(xù)六個顯性0,故意破壞這一幀報文,發(fā)送節(jié)點(diǎn)感知到總線錯誤之后停止發(fā)送這一報文的后續(xù)部分。你說巧妙不巧妙?連續(xù)6個顯性0本身就是破壞“逢五補(bǔ)一”規(guī)則的,被拿來當(dāng)錯誤標(biāo)志回給發(fā)送節(jié)點(diǎn)。


假如原始數(shù)據(jù)是0x00,二進(jìn)制0000 0000,發(fā)送節(jié)點(diǎn)發(fā)到0000 0的時候發(fā)送節(jié)點(diǎn)會先插一個1,再發(fā)后續(xù)的000,成為0000 01000,共9bit長度,接收節(jié)點(diǎn)也會在第5bit的0之后預(yù)期一個無效的1,解碼時摳掉。

假如原始數(shù)據(jù)是0000 0100,第六位自帶1,發(fā)送節(jié)點(diǎn)發(fā)到00000的時候也會先插一個1,再發(fā)后續(xù)的100,成為0000 01100,共9bit長度

六、回讀確認(rèn)

發(fā)送節(jié)點(diǎn)發(fā)送了0或1的時候,會回讀確認(rèn)總線是否和自己的發(fā)送相符,比如在仲裁段搶優(yōu)先級失敗就會等下一幀再發(fā);如果發(fā)到了數(shù)據(jù)段,按理說此時總線應(yīng)該只有自己,發(fā)著發(fā)著突然發(fā)現(xiàn)回讀的0/1與自己發(fā)的不同,比如受到了干擾,發(fā)送節(jié)點(diǎn)就會輸出“主動錯誤標(biāo)志”——連續(xù)6bit顯性0,來主動拋棄后續(xù)報文,同時讓接收節(jié)點(diǎn)知道我這一幀有誤。

在這時,接收節(jié)點(diǎn)收到第6bit顯性0的時候,因違背逢五補(bǔ)一的位填充規(guī)則,也會往總線上輸出“主動錯誤標(biāo)志”,所以會在總線上看到連續(xù)12bit的顯性0,前6個來自發(fā)送節(jié)點(diǎn),后6個來自接收節(jié)點(diǎn)。

正常情況來說,總線上的顯性不應(yīng)該>5bits=10us。那么用示波器設(shè)置>11us的脈寬觸發(fā)模式就很容易定位錯誤幀的位置,不一定要用解碼示波器。

七、升維打擊

CAN網(wǎng)絡(luò)的幅度和電流可以為我們提供更多維度的信息,此所謂升維打擊。

我們先來看一個正常幀,我們叫它節(jié)點(diǎn)A吧,它內(nèi)部有終端電阻,藍(lán)線為H-L的差分電壓,紫線是我們節(jié)點(diǎn)A的CAN-H引腳電流,輸出為正,輸入為負(fù)。


先看藍(lán)色的總線電壓波形,從0x83到END之間是一幀正常波形,注意看幀頭有多級臺階,幀尾ACK位置也特別高,這是正常的,可以理解 當(dāng)多個節(jié)點(diǎn)同時驅(qū)動總線就會導(dǎo)致60Ω終端電阻上的分壓高于2V。從這些臺階來看,可以判斷出網(wǎng)絡(luò)上至少有5個節(jié)點(diǎn)。為啥?先看報文中部的幅度,這肯定是只有一個節(jié)點(diǎn)搶占總線之后的波形,往前有兩級臺階,可以認(rèn)為A、B、C三個節(jié)點(diǎn)同時搶占總線出現(xiàn)了第一個高臺,然后節(jié)點(diǎn)C優(yōu)先級仲裁失敗退出總線,A、B節(jié)點(diǎn)繼續(xù)搶占出現(xiàn)了第二個臺階,之后節(jié)點(diǎn)A成功搶占到了總線優(yōu)先級,發(fā)送中間的數(shù)據(jù)。最后的ACK位比3節(jié)點(diǎn)驅(qū)動的第一個bit更高,說明至少有4個節(jié)點(diǎn)在驅(qū)動ACK,再加上節(jié)點(diǎn)A,網(wǎng)絡(luò)上至少有5個節(jié)點(diǎn)。

再看紫色的電流波形,已知節(jié)點(diǎn)A自己有終端電阻,外邊有另一顆終端電阻。波形中部的數(shù)據(jù)區(qū)肯定是節(jié)點(diǎn)A在驅(qū)動總線,差分電壓流經(jīng)外邊的終端電阻形成回路,所以我們在節(jié)點(diǎn)A的引腳上觀察到了輸出的正向電流;往前一個電壓臺階的位置,電流為0,是A、B兩個帶終端電阻的節(jié)點(diǎn)在驅(qū)動總線,所以總線電壓拉開了但電流仍是無進(jìn)無出的;再往前一個臺階,A、B、C三個節(jié)點(diǎn)驅(qū)動,節(jié)點(diǎn)C的電流流入A、B的終端電阻,所以在節(jié)點(diǎn)A的引腳上測到了輸入的負(fù)向電流;然后幀尾的ACK位置,至少有4個節(jié)點(diǎn)同時驅(qū)動,流入終端電阻A和B的負(fù)向電流更大了。

八、錯誤幀實(shí)戰(zhàn)

這是一個兩節(jié)點(diǎn)網(wǎng)絡(luò),一個節(jié)點(diǎn)發(fā),另一個節(jié)點(diǎn)收,兩方都有終端電阻,發(fā)送節(jié)點(diǎn)用的是TJA1042,接收節(jié)點(diǎn)用的是單3.3V收發(fā)器MAX3051。在幀頭就發(fā)生了錯誤,這種錯誤幀一般源于時鐘偏差或采樣點(diǎn)過小。

我們將示波器的差分探頭和電流探頭掛在接收端,下圖黃色為H-L的差分電壓,藍(lán)色為接收節(jié)點(diǎn)的輸出電流,RX為收發(fā)器將H-L差分電壓轉(zhuǎn)換出的邏輯波形,MCU內(nèi)部的CAN控制器會根據(jù)RX的0/1來解讀總線。TX為接收節(jié)點(diǎn)的發(fā)送邏輯,MCU將TX拉低的時候收發(fā)器會往總線上驅(qū)動顯性。


我們已知500kbps的每個bit寬2us,注意上圖紫線TX在2 ~ 4箭頭之間出現(xiàn)了連續(xù)2us * 6=12us的顯性0,說明我們掛示波器的這個接收節(jié)點(diǎn)在此刻往外輸出了一個“主動錯誤標(biāo)志”,那一定是接收節(jié)點(diǎn)在此之前認(rèn)為總線出現(xiàn)了錯誤。我們來往前看,箭頭1~2之間總線差分電壓和RX邏輯側(cè)都只有10us/2us=5bit的顯性0,幀前邊都是長隱性1,這能有什么錯?一個可能是我們碰到了傳說中的過載幀,這個東西本應(yīng)該很少見了;另一個可能是接收節(jié)點(diǎn)把對方來的正確報文認(rèn)成了錯的,這10us被接收節(jié)點(diǎn)認(rèn)成了6bit,錯誤的采樣點(diǎn)+硬同步(幀頭對齊)做得稀爛的國產(chǎn)MCU更容易出現(xiàn)這樣的幀頭報錯。

不管哪種,我們推演一下看看是否符合我們的理論,在箭頭2~3之間發(fā)送節(jié)點(diǎn)應(yīng)該是想發(fā)送一個隱性,但這時接收節(jié)點(diǎn)已經(jīng)覺得不對開始發(fā)“主動錯誤標(biāo)志”,將總線拉成了顯性。然后發(fā)送節(jié)點(diǎn)讀到這一bit自己想發(fā)送隱性但總線是顯性,所以。。。仲裁區(qū)搶優(yōu)先級失敗退出總線,,,怎么可能,之前有6個連續(xù)顯性呢,所以發(fā)送節(jié)點(diǎn)因違反“逢五補(bǔ)一”在箭頭3~5也輸出“主動錯誤標(biāo)志”。所以就成了黃色總線波形的7個bit的“凸”型,中間的凸臺的位置總線被兩個節(jié)點(diǎn)驅(qū)動,電壓高起一個臺階。

再注意一個細(xì)節(jié),凸臺的左肩膀和右肩膀高度不一樣,左肩膀是接收節(jié)點(diǎn)MAX3051驅(qū)動的電平,它比 右肩膀TJA1042的驅(qū)動能力弱一些,總線電平低一點(diǎn)。這個特性可以用來區(qū)分總線上的不同設(shè)備。

藍(lán)色線,是接收節(jié)點(diǎn)的輸出電流。箭頭1~2之間的負(fù)向電流為發(fā)送節(jié)點(diǎn)驅(qū)動總線,差分電壓流經(jīng)接收節(jié)點(diǎn)內(nèi)部的終端電阻帶來的負(fù)電流;箭頭2~3之間的正電流是接收節(jié)點(diǎn)驅(qū)動的主動錯誤的第一個bit;后邊3~4的凸臺兩個節(jié)點(diǎn)都在驅(qū)動顯性 但對應(yīng)的電流也是負(fù)的,這是因為發(fā)送節(jié)點(diǎn)的驅(qū)動能力強(qiáng)過接收節(jié)點(diǎn),整個網(wǎng)絡(luò)電流還是由發(fā)送節(jié)點(diǎn)灌入接收節(jié)點(diǎn);再往后4~5的負(fù)電流是發(fā)送端驅(qū)動接收節(jié)點(diǎn)的終端電阻的電流。

下圖我標(biāo)出了兩個節(jié)點(diǎn)的輸出bit流,紅框是“主動錯誤標(biāo)志”。


仍然是這個兩節(jié)點(diǎn)網(wǎng)絡(luò),仍然是這個稀爛的國產(chǎn)MCU,我們來看這個錯誤幀是怎么個情況:


這一幀的DLC=0x01,也就是只有1byte數(shù)據(jù),數(shù)據(jù)區(qū)之后就是CRC區(qū),我們的“主動錯誤標(biāo)志”就發(fā)生在這個區(qū),觀察又沒有填充錯誤,那就是我們掛示波器這個接收節(jié)點(diǎn)認(rèn)為發(fā)送節(jié)點(diǎn)出現(xiàn)了CRC錯誤。但我們看到黃線在“主動錯誤標(biāo)志”中間出現(xiàn)了凹坑,意味著發(fā)送節(jié)點(diǎn)還是想繼續(xù)發(fā)隱性,并不認(rèn)為自己有錯,直到發(fā)現(xiàn)這一位被“主動錯誤標(biāo)志”覆蓋為顯性才感知到位錯誤后拋棄后續(xù)報文。

原因最后定位到:過小的采樣點(diǎn)+過大的再同步補(bǔ)償寬度SJW讓時鐘誤差逐步積累,這顆國產(chǎn)MCU的重同步又做得稀爛,把正常報文錯讀了一位導(dǎo)致算CRC錯誤。最后通過調(diào)整采樣點(diǎn)和SJW寬度減少了這種錯誤的出現(xiàn)頻次,得到正常波形如下:


我們再試著從差分波形來分析一個錯誤幀:


錯誤發(fā)生在CRC區(qū),我們放大一下,看看各節(jié)點(diǎn)都發(fā)生了啥:


從每一個臺階往前畫12us的方框,得到每個節(jié)點(diǎn)輸出的“主動錯誤標(biāo)志”,分析可知:這是一幀節(jié)點(diǎn)B發(fā)送的報文,節(jié)點(diǎn)A認(rèn)為它的CRC算錯了,節(jié)點(diǎn)C湊了個熱鬧,三者一起形成了這個12bits長的“主動錯誤標(biāo)志”。那,節(jié)點(diǎn)A為什么會認(rèn)為CRC有錯呢?大概率是因為之前的數(shù)據(jù)讀錯了一位。這么好的波形也能讀錯?是的,我們無法判斷節(jié)點(diǎn)A所在的位置波形有多差,可能分支上沒有終端電阻振鈴很大呢?我們只能相信節(jié)點(diǎn)A不會亂搞。另外,采樣點(diǎn)偏差會導(dǎo)致節(jié)點(diǎn)對噪聲額外地敏感。

九、CAN-FD錯誤排查

來看一個A B C三節(jié)點(diǎn)CAN-FD錯誤幀的案例,節(jié)點(diǎn)C發(fā),節(jié)點(diǎn)A、B收:黃色是H-L的差分電壓,綠色是節(jié)點(diǎn)B的邏輯TX。0x0677和0x0176是兩個錯誤幀。FD區(qū)波特率設(shè)置為2Mbps。


放大0x0176幀的細(xì)節(jié):


  • 標(biāo)尺A B之間時間長度約0.8us,由一個2Mbps FD bit的0.5us + 一個CAN-FD的TDC(300ns)組成。

  • 之后出現(xiàn)了6個FD bit(0.5us*6=3000ns)的連續(xù)顯性位,電平高度與之前相同,之后有連續(xù)2usx6=12us的顯性。

  • 在標(biāo)尺B線后12us位置出現(xiàn)了一個電壓跌落的小小的下降臺階,見下下圖。

綜上三條,認(rèn)為節(jié)點(diǎn)C所在位置干擾過大/分支線路過長,節(jié)點(diǎn)C自己回讀↓下圖↓框出的bit位失敗,自己往總線上輸出“主動錯誤標(biāo)志”(連續(xù)6bit=2usx6=12us的顯性),其他設(shè)備在接收到第6個CAN-FD的bit=0.5usx6=3us的時候就讀到了錯誤(違反FD速率的“逢五補(bǔ)一”規(guī)則),也往總線上疊加2us*6=12us的主動錯誤標(biāo)志。然后,12us時節(jié)點(diǎn)C的主動錯誤標(biāo)志先結(jié)束,其他節(jié)點(diǎn)的主動錯誤在2usx6+0.5usx6=15us后結(jié)束。至此,錯誤幀形態(tài)完成。

“逢五補(bǔ)一”這條規(guī)則是跟隨波特率變化的,6個連續(xù)的高波特率0或1都會觸發(fā)填充錯誤。但填充錯誤之后輸出的“主動錯誤標(biāo)志”是500kbps波特率的6bit,固定長度12us。



再來一個案例:CAN-FD采樣點(diǎn)設(shè)置出錯導(dǎo)致節(jié)點(diǎn)B把節(jié)點(diǎn)A發(fā)送的CAN-FD報文當(dāng)CAN來解析出錯。

黃色CAN_H,綠色CAN_L,藍(lán)色L-H反向差分電壓,紫線為節(jié)點(diǎn)B邏輯RX,青線為節(jié)點(diǎn)B邏輯TX。


注意看0x00前后的數(shù)據(jù)段,這一段是CAN-FD的2Mbps速率,節(jié)點(diǎn)B因為采樣點(diǎn)設(shè)置錯誤讀錯了BRS這一波特率轉(zhuǎn)換標(biāo)志,仍按照標(biāo)準(zhǔn)的500kbps去解析節(jié)點(diǎn)A的2Mbps速率的數(shù)據(jù),對RX信號2us一個采樣我用黃色箭頭標(biāo)出來了,可以看到這恰好是6個連續(xù)顯性0,違反“逢五補(bǔ)一”的規(guī)則,故而接收節(jié)點(diǎn)B在箭頭2~4之間發(fā)“主動錯誤標(biāo)志”,打斷總線通信,告知發(fā)送節(jié)點(diǎn)你發(fā)錯了。箭頭2~3之間,發(fā)送節(jié)點(diǎn)A恰好也要發(fā)顯性,所以節(jié)點(diǎn)A此時還沒感覺到不對。箭頭3之后,節(jié)點(diǎn)A想要拉隱性,電壓出現(xiàn)一個坑,卻發(fā)現(xiàn)總線還是顯性,此時節(jié)點(diǎn)A判斷出現(xiàn)了“位錯誤”,開始輸出“主動錯誤標(biāo)志”,想告知接收方放棄我這一幀報文。箭頭4的位置節(jié)點(diǎn)B釋放“主動錯誤標(biāo)志”,箭頭5的位置節(jié)點(diǎn)A釋放“主動錯誤標(biāo)志”。

如果數(shù)據(jù)比較巧,恰好能滿足逢五補(bǔ)一的規(guī)則,那這種錯誤形態(tài)會在發(fā)送很多數(shù)據(jù)之后才會出現(xiàn),但最晚也會被CRC攔截:


補(bǔ)充知識:CAN-FD網(wǎng)絡(luò)各個節(jié)點(diǎn)的采樣點(diǎn)必須完全相同,高速率導(dǎo)致對時序敏感很多,這一點(diǎn)與CAN網(wǎng)絡(luò)容許一個范圍顯著不同。上邊這一幀的BRS位怎么讀錯的呢?再一次違反直覺:CAN-FD的采樣點(diǎn)影響發(fā)送節(jié)點(diǎn)的驅(qū)動波形!用示波器可以輕松量出FD的采樣點(diǎn)位置。

看下圖,CAN-FD報文的控制段中的BRS位(Bit Rate Switch)明顯是短于前邊的FDF、R0位的,采樣點(diǎn)不匹配的話很容易讀錯。因為-FD的速率翻轉(zhuǎn)是在這一bit的采樣點(diǎn)位置發(fā)生的。比如采樣點(diǎn)80%的2Mbps CAN-FD網(wǎng)絡(luò),BRS這一位的寬度為2us80%+0.5us20%=1.7us,而不是2us。接收節(jié)點(diǎn)的采樣點(diǎn)如果設(shè)置大于85%就會錯過整個BRS位(2us*85%=1.7us),從而導(dǎo)致如上的BRS位讀錯的問題。


以上,就是示波器升維破解CAN錯誤幀/BusOff的經(jīng)驗分享,總結(jié)一下:

  • 結(jié)合已知ID是哪個節(jié)點(diǎn)發(fā)的先驗信息,逐個拔掉非終端節(jié)點(diǎn),示波器觀察“主動錯誤標(biāo)志”,就能模糊定位錯誤源頭;

  • 如果能引出敏感設(shè)備的TX,哪個節(jié)點(diǎn)認(rèn)為哪個節(jié)點(diǎn)出了什么錯就會非常清晰明了;

  • 其次,測量CAN的輸出電流也能清楚地定位誰在驅(qū)動“錯誤標(biāo)志”,進(jìn)而找到故障點(diǎn);

  • 如果上述難以實(shí)現(xiàn),以12us間隔拆分“錯誤標(biāo)志”的電壓臺階,也能定位大部分錯誤原因;

  • 額外關(guān)注單bit寬度的電壓臺階,能排除部分節(jié)點(diǎn);




關(guān)鍵詞: CAN總線 測試測量 示波器

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉