看门狗原理
?原文地址:https://blog.csdn.net/u012803067/article/details/59058186
最近需要在板子上加上一塊WatchDog,以確保在系統(tǒng)出錯時自動重啟,所以看了一些在嵌入式系統(tǒng)中使用看門狗的資料,現(xiàn)在總結(jié)如下:
一、看門狗原理
? ? 在產(chǎn)品化的嵌入式系統(tǒng)中,為了使系統(tǒng)在異常情況下能自動復(fù)位,一般都需要引入看門狗。
? ? 看門狗其實就是一個可以在一定時間內(nèi)被復(fù)位的計數(shù)器。當(dāng)看門狗啟動后,計數(shù)器開始自動計數(shù),經(jīng)過一定時間,如果沒有被復(fù)位,計數(shù)器溢出就會對CPU產(chǎn)生一個復(fù)位信號使系統(tǒng)重啟(俗稱“被狗咬”)。系統(tǒng)正常運行時,需要在看門狗允許的時間間隔內(nèi)對看門狗計數(shù)器清零(俗稱“喂狗”),不讓復(fù)位信號產(chǎn)生。如果系統(tǒng)不出問題,程序保證按時“喂狗”,一旦程序跑飛,沒有“喂狗”,系統(tǒng)“被咬”復(fù)位。
? ? 這就好比你的身邊有一只時刻饑餓的狗,你不按時給它肉吃,它就會吃你的肉,你被吃了......掛了,投胎轉(zhuǎn)世,徹底重新做人了。不幸的是來世你還得喂狗-_-!!
二、看門狗的種類
? ? 在現(xiàn)在的嵌入式系統(tǒng)中主要可以分為兩種類型的看門狗:
? ??1、CPU內(nèi)部自帶的看門狗:此類看門狗一般是將一個芯片中的定時器來作為看門狗,通過程序的初始化,寫入初值,設(shè)定溢出時間,并啟動定時器。程序按時對定時器賦初值(或復(fù)位),以免被咬。這種看門狗是可以被禁用的(只要停止這個定時器即可),好比對那只要咬你的狗來個“葵花點穴手”。大部分CPU都內(nèi)置看門狗,硬件原理可參考各芯片數(shù)據(jù)手冊。
???優(yōu)點:可以通過程序改變溢出時間;可以隨時禁用
? ?缺點:需要初始化;如果程序在初始化、啟動完成前跑飛或在禁用后跑飛,看門狗就無法復(fù)位系統(tǒng),這樣看門狗的作用就沒有了,系統(tǒng)恢復(fù)能力降低。
???2、獨立的看門狗芯片:這種看門狗主要有一個用于喂狗的引腳(一般與CPU的GPIO相連)和一個復(fù)位引腳(與系統(tǒng)的RESET引腳相連),如果沒有在一定時間內(nèi)改變喂狗腳的電平,復(fù)位引腳就會改變狀態(tài)復(fù)位CPU。此類看門狗一上電就開始工作,無法禁用。現(xiàn)在常用的芯片有:CAT705/CAT706、IMP706等等,溢出時間在1.6秒左右。 硬件原理可以參考各芯片數(shù)據(jù)手冊和《基于Linux的嵌入式系統(tǒng)全程喂狗策略》。
??優(yōu)點:無須配置,上電即用。無法禁用,系統(tǒng)必須按時喂狗,系統(tǒng)恢復(fù)能力高。
??缺點:無法靈活配置溢出時間,無法禁用,靈活性降低。
------------------------------------------------?
00001.?
? ? 當(dāng)然還有所謂的軟件看門狗,這其實是也是一種監(jiān)控軟件。
00002.?
00003.?
? ? ?一些重要的程序,必須讓它一直跑著;而且還要時時關(guān)心它的狀態(tài)——不能讓它出現(xiàn)死鎖現(xiàn)象。(當(dāng)然,如果一個主程序會出現(xiàn)死鎖,肯定是設(shè)計或者編程上的失誤。首要做的事是Debug。)但如果時間緊迫可以用軟件看門狗,暫時應(yīng)急。
00004.?
00005.?
? ? 這種監(jiān)控軟件運行不出現(xiàn)界面窗口,具有一定的隱蔽性;它定時判斷目標(biāo)進(jìn)程是否運行在當(dāng)前系統(tǒng)中,如果沒有則啟動目標(biāo)進(jìn)程;判斷目標(biāo)進(jìn)程是否“無響應(yīng)”,如果是則終止目標(biāo)進(jìn)程;如果目標(biāo)進(jìn)程“無響應(yīng)”的次數(shù)超過一定的數(shù)量,則重啟整個系統(tǒng)。它的目的也是復(fù)位,但是它主要市復(fù)位進(jìn)程,實在不行才復(fù)位CPU。
00006.?
00007.?
? ? 這種軟件屬于監(jiān)控軟件,不在本文的敘述范圍之內(nèi)。
00008.?
------------------------------------------------?
三、看門狗的選擇
??? ?在一般的民用產(chǎn)品,對系統(tǒng)的穩(wěn)定性沒有太高要求的場合,可以使用內(nèi)置看門狗,可以簡化軟件開發(fā)和硬件成本。
? ? 在工控產(chǎn)品和對系統(tǒng)的穩(wěn)定性有較高要求的關(guān)鍵場合,基本都選用硬件獨立看門狗,確保系統(tǒng)在面對嚴(yán)重錯誤時的恢復(fù)能力。增加了硬件成本,稍微加大了軟件的開發(fā)難度(必須確保在正常情況下的不斷喂狗)。
----------------------------------------------------------
四、在bootloader下的使用
? ?如果是CPU內(nèi)置的看門狗,一般在這階段可以禁用,所有沒什么特殊的操作。
但是如果是獨立的看門狗芯片就必須喂了。或者為了保險,你在bootloader中就啟動了看門狗,也得喂了。
? ?bootloader有很多,基本原理都是一樣的,喂狗的過程也基本一樣,在這里以uboot為例講解如何喂狗。
u-boot的運行分為以下幾個階段:
00001.?
最早的簡單初始化,代碼重定位的自拷貝階段
00002.?
00003.?
系統(tǒng)詳細(xì)初始化階段
00004.?
00005.?
控制臺階段(如果使用了自動啟動,則跳過)
00006.?
00007.?
OS內(nèi)核拷貝(可能帶有解壓過程),跳入操作系統(tǒng)
00008.?
(待完善)
五、在Linux下使用
? ? ?在bootloader加載了內(nèi)核之后,系統(tǒng)就開始由Linux內(nèi)核接管。而喂狗的工作自然也開始由內(nèi)核來承擔(dān)。在bootloader將控制權(quán)給內(nèi)核之后,時間上可以分為以下幾個部分:
00001.?
內(nèi)核自解壓階段(壓縮內(nèi)核才有:zImage或bzImage)
00002.?
00003.?
內(nèi)核啟動到看門狗驅(qū)動加載之前
00004.?
00005.?
看門狗驅(qū)動加載后到根文件系統(tǒng)啟動前
00006.?
00007.?
根文件系統(tǒng)啟動后到看門狗守護(hù)進(jìn)程啟動前
00008.?
00009.?
看門狗守護(hù)進(jìn)程啟動后
00010.?
?
? ? 對于使用CPU內(nèi)置的看門狗,在1~4階段,看門狗一般都沒有啟動,無需喂狗。只有在看門狗守護(hù)進(jìn)程啟動后,由守護(hù)進(jìn)程打開看門狗,并根據(jù)配置文件監(jiān)控其他進(jìn)程的狀態(tài)來開始喂狗。如果被監(jiān)控進(jìn)程出現(xiàn)不可修復(fù)的問題,守護(hù)進(jìn)程停止喂狗,CPU復(fù)位。
? ? 對于獨立的看門狗芯片,系統(tǒng)一上電就必須不斷喂狗,接過bootloader的接力棒繼續(xù)喂狗。
? ? 首先在第1階段,內(nèi)核的自解壓一般時間較長,必須在自解壓的循環(huán)過程中加入喂狗代碼(可能還要是匯編形式的)。一旦在這過程中跑飛,就不會喂狗,CPU復(fù)位。
? ?在第2階段,這段時間一般不會很長,可以不用喂狗。但是這也和你的內(nèi)核有關(guān),如果在這個階段正好有比較耗時的模塊啟動的話,你可以在這個模塊的初始化函數(shù)或者比較耗時的循環(huán)和等待中添加喂狗代碼。具體在哪些模塊中加,要嘗試啟動幾次就知道了,靠實驗和經(jīng)驗。
? ?在看門狗驅(qū)動加載時,一般會在模塊初始化代碼中喂一次狗。
? ?在第3階段,和第2階段類似,如果在這個階段正好有比較耗時的模塊啟動的話,你可以在這個模塊的初始化函數(shù)或者比較耗時的循環(huán)和等待中添加喂狗代碼。但是在根文集系統(tǒng)掛載時,根據(jù)文件系統(tǒng)的性質(zhì)和大小,可能需要在文件系統(tǒng)代碼中添加喂狗指令。
? ?第4階段是一個比較耗時的階段,一般會在系統(tǒng)啟動腳本中添加一些簡單的喂狗的shell命令,例如:“echo V > /dev/watchdog”,加的位置根據(jù)系統(tǒng)的啟動過程而異。
? ?在第5階段,一切都由看門狗守護(hù)進(jìn)程來實現(xiàn)喂狗了。
?
-----------------------------------------------------------------------------
內(nèi)核看門狗的框架分析
(待續(xù))
------------------------------------------------------------------------------
其實對于看門狗在Linux系統(tǒng)中的使用還有一種形式是雙狗:
在內(nèi)核中用內(nèi)核線程硬件的看門狗,這個硬件看門狗的作用在于保證內(nèi)核宕機時可以復(fù)位。
在內(nèi)核產(chǎn)生軟件看門狗,用守護(hù)進(jìn)程或者需要監(jiān)控的進(jìn)程去喂狗,這個看門狗保證關(guān)鍵進(jìn)程可以復(fù)位。
推薦參考資料:
? ? 看門狗驅(qū)動:
? ? ?linux/drivers/watchdog :其中包含所有看門狗驅(qū)動:
? ? ? watchdog_core.c、watchdog_dev.c和watchdog_dev.h是內(nèi)核看門狗的框架核心,看門狗的驅(qū)動當(dāng)然最好是在這個框架下編寫比較好。但是好像其中的驅(qū)動并不都只這樣。、
? ? ?linux/Documentation/watchdog/watchdog-kernel-api.txt 內(nèi)核看門狗框架API說明文檔
? ???內(nèi)核看門狗驅(qū)動官網(wǎng)????
? ?《ARM-Linux驅(qū)動--Watch Dog Timer(看門狗)驅(qū)動分析》(沒有使用內(nèi)核看門狗框架)
---------------------------------------------------------------------------
看門狗守護(hù)進(jìn)程:
? ? 源碼下載:http://www.ibiblio.org/pub/Linux/system/daemons/watchdog/
總結(jié)
- 上一篇: 2022美赛C题 F奖思路分享
- 下一篇: 操作失败,错误为 0x00000bcb