當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ARM7、ARM9和ARM11的区别

發(fā)布時間：2024/1/1 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了 ARM7、ARM9和ARM11的区别小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1. 時鐘頻率的提高
雖然內(nèi)核架構(gòu)相同，但ARM7處理器采用3級流水線的馮·諾伊曼結(jié)構(gòu);而ARM9采用5級流水線的哈佛結(jié)構(gòu),ARM11為8級流水線哈弗結(jié)構(gòu)(從arm9開始都采用了哈弗結(jié)構(gòu))。增加的流水線設(shè)計提高了時鐘頻率和并行處理能力。5級流水線能夠?qū)⒚恳粋€指令處理分配到5個時鐘周期內(nèi)，在每一個時鐘周期內(nèi)同時有5個指令在執(zhí)行。在常用的芯片生產(chǎn)工藝下，ARM7一般運行在100MHz左右，而ARM9則至少在200MHz以上.ARM11首先推出350M~500MHz時鐘頻率的內(nèi)核，目前上升到1GHz時鐘頻率。

2 指令周期的改進
指令周期的改進對于處理器性能的提高有很大的幫助。性能提高的幅度依賴于代碼執(zhí)行時指令的重疊，這實際上是程序本身的問題。對于采用最高級的語言，一般來說，性能的提高在30％左右。

3.MMU(內(nèi)存管理單元）
ARM7一般沒有MMU(內(nèi)存管理單元），（ARM720T有MMU）。
ARM9一般是有MMU的,ARM9940T只有MPU,不是一個完整的MMU。

ARM11當(dāng)然也有MMU的。
這一條很重要，MMU單元是大型操作系統(tǒng)必需的硬件支持，如LINUX;WINCE等。這就是說，ARM7一般只能運行小型的實時系統(tǒng)如UCOS-II,eCOS等，而ARM9無此限制，一般的操作系統(tǒng)都可以移植。其實即使ARM720T能支持LINUX;WINCE等系統(tǒng)，也鮮有人用，因為以ARM7的運行速度跑這種大型操作系統(tǒng)，實在有點吃力。再者兩者的應(yīng)用領(lǐng)域明顯不同，也無此必要。

下面兩個圖：架構(gòu)一幕了然。

4. 在從ARM7到ARM9，ARM11的平臺轉(zhuǎn)變過程中，有一件事情是非常值得慶幸的，即ARM9，ARM11能夠地向后兼容ARM7上的軟件；并且開發(fā)人員面對的編程模型和架構(gòu)基礎(chǔ)也保持一致。

下面圖是一些特征比較：

http://blog.csdn.net/muge0913/article/details/7350789

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

ARM7是馮諾依慢結(jié)構(gòu),三級流水線結(jié)構(gòu)
ARM9、ARM11是哈佛結(jié)構(gòu)，5級流水線結(jié)構(gòu)，所以性能要高一點。
ARM9和ARM11大多帶內(nèi)存管理器，跑操作系統(tǒng)好一點，ARM7適合裸奔。

我們慣稱的 ARM9系列中又存在ARM9與ARM9E兩個系列，其中ARM9 屬于ARM v4T架構(gòu)，典型處理器如ARM9TDMI和ARM922T；而ARM9E屬于ARM v5TE架構(gòu)，典型處理器如ARM926EJ和ARM946E。因為后者的芯片數(shù)量和應(yīng)用更為廣泛，所以我們提到ARM9的時候更多地是特指ARM9E系列處理器(主要就是ARM926EJ和ARM946E這兩款處理器)。下面關(guān)于ARM9的介紹也是更多地集中于ARM9E。

ARM7處理器和ARM9E處理器的流水線差別

對嵌入式系統(tǒng)設(shè)計者來說，硬件通常是第一考慮的因素。針對處理器來說，流水線則是硬件差別的最明顯標(biāo)志，不同的流水線設(shè)計會產(chǎn)生一系列硬件差異。讓我們來比較一下ARM7和ARM9E的流水線，如圖1。

可以看到ARM9E從ARM7的3級流水線增加到了5級，ARM9E的流水線中容納了更多的邏輯操作，但是每一級的邏輯操作卻變得更為簡單。比如原來 ARM7的第三級流水，需要先內(nèi)部讀取寄存器、然后進行相關(guān)的邏輯和算術(shù)運算，接著處理結(jié)果回寫，完成的動作非常復(fù)雜；而在ARM9E的5級流水中，寄存器讀取、邏輯運算、結(jié)果回寫分散在不同的流水當(dāng)中，使得每一級流水處理的動作非常簡潔。這就使得處理器的主頻可以大幅度地提高。因為每一級流水都對應(yīng) CPU的一個時鐘周期，如果一級流水中的邏輯過于復(fù)雜，使得執(zhí)行時間居高不下，必然導(dǎo)致所需的時鐘周期變長，造成CPU的主頻不能提升。所以流水線的拉長，有利于CPU主頻的提高。在常用的芯片生產(chǎn)工藝下，ARM7一般運行在100MHz左右，而ARM9E則至少在200MHz以上。

ARM9E處理器的存儲器子系統(tǒng)

像ARM926EJ 和ARM946E這兩個最常見的ARM9E處理器中，都帶有一套存儲器子系統(tǒng)，以提高系統(tǒng)性能和支持大型操作系統(tǒng)。如圖2所示，一個存儲器子系統(tǒng)包含一個 MMU(存儲器管理單元)或MPU(存儲器保護單元)、高速緩存(Cache)和寫緩沖(Write Buffer)；CPU通過該子系統(tǒng)與系統(tǒng)存儲器系統(tǒng)相連。

高速緩存和寫緩存的引入是基于如下事實，即處理器速度遠遠高于存儲器訪問速度；如果存儲器訪問成為系統(tǒng)性能的瓶頸，則處理器再快也是浪費，因為處理器需要耗費大量的時間在等待存儲器上面。高速緩存正是用來解決這個問題，它可以存儲最近常用的代碼和數(shù)據(jù)，以最快的速度提供給CPU處理(CPU訪問Cache不需要等待)。

圖2：復(fù)雜處理器內(nèi)部的存儲器子系統(tǒng)。

MMU則是用來支持存儲器管理的硬件單元，滿足現(xiàn)代平臺操作系統(tǒng)內(nèi)存管理的需要；它主要包括兩個功能：一是支持虛擬/物理地址映射，二是提供不同存儲器地址空間的保護機制。一個簡單的例子可以幫助我們理解MMU的功能，

如圖3，在一個操作系統(tǒng)下，程序開發(fā)人員都是在操作系統(tǒng)給定的API和編程模型下開發(fā)程序；操作系統(tǒng)通常只開放一個確定的存儲器地址空間給用戶。這樣就帶來一個直接的問題，所有的應(yīng)用程序都使用了相同的存儲器地址空間，如果這些程序同時啟動的話(在現(xiàn)在的多任務(wù)系統(tǒng)中這是非常常見的)，就會產(chǎn)生存儲器訪問沖突。那操作系統(tǒng)是如何來避免這個問題的呢？

操作系統(tǒng)會利用MMU硬件單元完成存儲器訪問虛擬地址到物理地址的轉(zhuǎn)換。所謂虛擬地址就是程序員在程序中使用的邏輯地址，而物理地址則是真實存儲器單元的空間地址。MMU通過一定的規(guī)則，可以把相同的虛擬地址映射到不同的物理地址上去。這樣，即使有多個使用相同虛擬地址的程序進程啟動，也可以通過MMU調(diào)度把它們映射到不同的物理地址上去，不會造成系統(tǒng)錯誤。

圖3：MMU的功能和作用。

MMU 處理地址映射功能之外，還能給不同的地址空間設(shè)置不同的訪問屬性。比如操作系統(tǒng)把自己的內(nèi)核程序地址空間設(shè)置為用戶模式下不可訪問，這樣的話用戶應(yīng)用程序就無法訪問到該空間，從而保證操作系統(tǒng)內(nèi)核的安全性。MPU與MMU的區(qū)別在于它只有給地址空間設(shè)置訪問屬性的功能而沒有地址映射功能。

Cache以及MMU等硬件單元的引入，給系統(tǒng)程序員的編程模型帶來了許多全新的變化。除了需要掌握基本的概念和使用方法之外，下面幾個針對系統(tǒng)優(yōu)化的點既有趣又重要：

1、系統(tǒng)實時性考慮

因為保存地址映射規(guī)則的頁表(Page Table)非常龐大，通常MMU中只是存儲器了常用的一小段頁表內(nèi)容，大部分頁表內(nèi)容都存儲于主存儲器里面；當(dāng)調(diào)用新的地址映射規(guī)則時，MMU可能需要讀取主存儲器來更新頁表。這在某些情況下會造成系統(tǒng)實時性的丟失。比如當(dāng)需要執(zhí)行一段關(guān)鍵的程序代碼時，如果不巧這段代碼使用的地址空間不在當(dāng)前MMU的頁表處理范圍里面，則MMU首先需要更新頁表，然后完成地址映射，接著才能相應(yīng)存儲器訪問；整個地址譯碼過程非常長，給實時性帶來非常大的不利影響。所以一般來說帶MMU和Cache的系統(tǒng)在實時性上不如一些簡單的處理器；不過也有一些辦法能夠幫助提高這些系統(tǒng)的實時效率。

一個簡單的辦法是在需要的時候關(guān)閉MMU和Cache，這樣就變成一個簡單處理器了，可以馬上提高系統(tǒng)實時性。當(dāng)然很多情況下這不可行；在ARM的MMU和 Cache設(shè)計中，有一個鎖定的功能，就是說你可以指定某一塊頁表在MMU中不會被更新掉，某一段代碼或數(shù)據(jù)可以在Cache中鎖定而不會被刷新掉；程序員可以利用這個功能來支持那些實時性要求最高的代碼，保證這些代碼始終能夠得到最快的響應(yīng)和支持。

2、系統(tǒng)軟件優(yōu)化

在嵌入式系統(tǒng)開發(fā)中，很多系統(tǒng)軟件優(yōu)化的方法都是相同和通用的，多數(shù)情況下這種規(guī)則也適用于ARM9E架構(gòu)上。如果你已經(jīng)是一個ARM7的編程高手，那么恭喜你，以前你掌握的優(yōu)化方法完全可以用在新的ARM9E平臺上，但是會有一些新的特性需要你加倍注意。最重要的便是Cache的作用，Cache本身并不帶來編程模型和接口的變化，但是如果我們考察Cache的行為，就能夠發(fā)現(xiàn)對于軟件優(yōu)化，Cache是有比較大的影響的。

Cache 在物理上就是一塊高速SRAM，ARM9E的Cache組織寬度(cache line)都是4個word(也就是32個字節(jié))；Cache的行為受系統(tǒng)控制器控制而不是程序員，系統(tǒng)控制器會把最近訪問存儲器地址附近的內(nèi)容復(fù)制到 Cache中去，這樣，當(dāng)CPU訪問下一個存儲器單元的時候(這個訪問既可能是取指，也可能是數(shù)據(jù))，可能這個存儲器單元的內(nèi)容已經(jīng)在Cache里了，所以CPU不需要真的到主存儲器上去讀取內(nèi)容，而直接讀取Cache高速緩存上面的內(nèi)容就可以了，從而加快了訪問的速度。從Cache的工作原理我們可以看到，其實Cache的調(diào)度是基于概率的，CPU要訪問的數(shù)據(jù)既可能在Cache中已經(jīng)存在(Cache hit)，也可能沒有存在(Cache miss)。在Cache miss的情況下，CPU訪問存儲器的速度會比沒有Cache的情況更壞，因為CPU除了要從存儲器訪問數(shù)據(jù)以外，還需要處理Cache hit或miss的判斷，以及Cache內(nèi)容的刷新等動作。只有當(dāng)Cache hit帶來的好處超過Cache miss帶來的犧牲的時候，系統(tǒng)的整體性能才能得到提高，所以Cache的命中率成為一個非常重要的優(yōu)化指標(biāo)。

根據(jù)Cache行為的特點，我們可以直觀地得到提高Cache命中率的一些方法，如盡可能把功能相關(guān)的代碼和數(shù)據(jù)放置在一起，減少跳轉(zhuǎn)次數(shù)；跳轉(zhuǎn)經(jīng)常會引起 Cache miss。保持合適的函數(shù)大小，不要書寫太多過小的函數(shù)體，因為線性的程序執(zhí)行流程是最為Cache友好的。循環(huán)體最好放置在4個word對齊的地址，這樣就能保證循環(huán)體在Cache中是行對齊的，并且占用最少的Cache行數(shù)，使得被多次調(diào)用的循環(huán)體得到更好的執(zhí)行效率。

性能和效率的提升

前面介紹了ARM9E相比于ARM7性能上的提高，這不僅表現(xiàn)在ARM9E有更快的主頻、更多的硬件特性上面，還體現(xiàn)在某些指令的執(zhí)行效率上面。執(zhí)行效率我們可以用CPU的時鐘周期數(shù)(Cycle)來衡量；運行同一段程序，ARM9E的處理器可以比ARM7節(jié)省大約30%左右的時鐘周期。

效率的提高主要來自于ARM9E對于Load-Store指令執(zhí)行效率的增強。我們知道在RISC架構(gòu)的處理器中，程序中大約有30%的指令是Load- Store指令，這些指令的效率對系統(tǒng)效率的貢獻是最明顯的。ARM9E中有兩個因素幫助提高Load-Store指令的效率：

1)ARM9內(nèi)核是哈佛架構(gòu)，擁有獨立的指令和數(shù)據(jù)總線；相對應(yīng)，ARM7內(nèi)核是指令和數(shù)據(jù)總線復(fù)用的馮?諾依曼架構(gòu)。

2)ARM9的5級流水線設(shè)計把存儲器訪問和寄存器寫回放在不同的流水上面。

兩者結(jié)合，使得在指令流的執(zhí)行過程中每個CPU時鐘周期都可以完成一個Load或Store指令。下面的表格比較了ARM7和ARM9處理器之間的Load -Store指令。從中可以看出所有的Store指令A(yù)RM9比ARM7省1個周期，Load指令可以省2個周期(在沒有互鎖的情況下，編譯工具能夠通過編譯優(yōu)化消除大多數(shù)的互鎖可能)。

綜合各種因素，ARM9E處理器擁有非常強大的性能。但是在實際的系統(tǒng)設(shè)計中，設(shè)計人員并不總是把處理器性能開到最大，理想情況是把處理器和系統(tǒng)運行頻率降低，使得性能剛好能滿足應(yīng)用需求；達到節(jié)省功耗和成本的目的。在評估系統(tǒng)能夠提供的處理器能力過程中，DMIPS指標(biāo)被很多人采用；同時它也被廣泛應(yīng)用于不同處理器間的性能比較。

但是用DMIPS來衡量處理器性能存在很大的缺陷。 DMIPS并非字面上每秒百萬條指令的意思，它是一個測量 CPU運行一個叫Dhrystone的測試程序時表現(xiàn)出來的相對性能高低的一個單位(很多場合人們也習(xí)慣用MIPS作為這個性能指標(biāo)的單位)。因為基于程序的測試容易受到惡意優(yōu)化的干擾，并且DMIPS指標(biāo)值的發(fā)布不受任何機構(gòu)的監(jiān)督，所以使用DMIPS進行評估時要慎重。例如對Dhrystone測試程序進行不同的編譯處理，在同一個處理器上運行也可以得出差別很大的結(jié)果，如圖4中是ARM926EJ在32位0等待存儲器上運行測試程序的結(jié)果。ARM一直采用比較保守的值作為CPU的DMIPS標(biāo)稱值，如ARM926EJ是1.1DMPS/MHz。

圖4：不同測試條件下ARM926EJ處理器的DMIPS值。

DMIPS 另外一個缺點是不能測量處理器的數(shù)字信號處理能力和Cache/MMU子系統(tǒng)的性能。因為Dhrystone測試程序不包含DSP表達式，只包含一些整型運算和字符串處理，并且測試程序偏小，幾乎可以完整地放在Cache里面運行而無需與外部存儲器進行交互。這樣就難以反映處理器在一個真實系統(tǒng)中的真正性能。

一種值得鼓勵的評估方法是站在系統(tǒng)的角度看問題，而不僅僅拘泥于CPU本身；而系統(tǒng)性能評估最好的測試向量就是用戶應(yīng)用程序或相近的測試程序，這是用戶所需的最真實的結(jié)果。

ARM9E處理器的DSP運算能力

伴隨應(yīng)用程序的多樣化和復(fù)雜化，諸如多媒體、音視頻功能在嵌入式系統(tǒng)里面也是全面開花。這些應(yīng)用需要相當(dāng)?shù)腄SP處理能力；如果是在傳統(tǒng)的RISC架構(gòu)上實現(xiàn)這些算法，所需的資源(頻率和存儲器等)會非常不經(jīng)濟。ARM9E處理器一個非常重要的優(yōu)勢就是擁有輕量級的DSP處理能力，以非常小的成本(CPU增加功能需要增加硬件)換來了非常實用的DSP性能。

因為CPU的DSP能力并不直接反映在像DMIPS這樣的評測指標(biāo)中，同時像以前的ARM7處理器中也沒有類似的概念；所以這一點對所有使用ARM9E處理器進行開發(fā)的人來說，都是需要注意的一個要點。

ARM9E的DSP擴展指令如表2所示，主要包括三個類型。

1)單周期的16x16和32x16 MAC操作，因為數(shù)字信號處理中甚少32位寬的操作數(shù)，在32位寄存器中可以對操作數(shù)分段運算顯得非常有用。

2)對原有的算術(shù)運算指令增加了飽和處理擴展，所謂飽和運算，就是當(dāng)運算結(jié)果大于一個上限或小于一個下限時，結(jié)果就等于上限或是下限；飽和處理在音頻數(shù)據(jù)和視頻像素處理中普遍使用，現(xiàn)在一條單周期飽和運算指令就能夠完成普通RISC指令“運算-判斷-取值”這一系列操作。

3)前導(dǎo)零(CLZ)運算指令，提高了歸一化和浮點運算以及除法操作的性能。

以流行的MP3解碼程序為例。整個解碼過程中前端的三個步驟是運算量最大的，包括比特流的讀入(解包)、霍夫曼譯碼還有反量化采樣(逆變換)。ARM9E的 DSP指令正好可以高效地完成這些運算。以44.1 KHz@128 kbps碼率的MP3音樂文件為例，ARM7TDMI需要占用20MHz以上的資源，而ARM926EJ則只要小于10MHz的資源

在從ARM7到ARM9的平臺轉(zhuǎn)變過程中，有一件事情是非常值得慶幸的，即ARM9E能夠完全地向后兼容ARM7上的軟件；并且開發(fā)人員面對的編程模型和架構(gòu)基礎(chǔ)也保持一致。但是畢竟ARM9E中增加了很多新的特性，為了充分利用這些新的資源，把系統(tǒng)性能優(yōu)化好，需要我們對ARM9E做更多深入地了解。

http://www.pvontek.com/JiShu/ZhuBan/171.html

------------------------------------------------------------------------------------------------------------------------------------------------------------

"目前市場上出現(xiàn)很多ARM11的6410開發(fā)板，而且賣的很熱門。針對很多人不知道6410開發(fā)板跟ARM9的具體區(qū)別的問題，我把自己的看法給大家講一下：

我之前有用過ARM9開發(fā)板S3C2440的，最近公司買了塊S3C6410的開發(fā)板，感覺上來講真的很不一樣。它們的區(qū)別總體來說有這么幾點：

1. 首先是主頻，2440開發(fā)板是400M的，而6410開發(fā)板是667M的，據(jù)說還有高達800M的呢；

2. 操作系統(tǒng)上最大區(qū)別是2440開發(fā)板支持WINCE5.0的操作系統(tǒng)"~而6410開發(fā)板支持WINCE6.0的系統(tǒng)，另外6410還支持Linux2.6，Android，Ubuntu三個系統(tǒng)；

3.ARM11的6410開發(fā)板有MPEG-4/H.264/VC-1的視頻編解碼; 2D/3D圖形加速，TV輸出等，而ARM9的2440不支持；

4.ARM11的6410開發(fā)板支持2路SD/MMC4.0卡和符合CF3.0規(guī)范高速CF卡，而ARM9的2440不能同時支持這么多，一般就支持一個SD卡；

5.帶有IDE接口，支持WINCE6.0系統(tǒng)下掛載PATA硬盤；

6.可以擴展更大的容量，增加更多的接口，串口上面就是比ARM9多1－2個，還有多了紅外接口，高速USB接口，S-VIDEO接口等等。

以上的不同我僅僅是研究了立宇泰電子公司的開發(fā)板而得出的，我們公司從44B0開始就用他們家產(chǎn)品，資料上面很齊全，服務(wù)也一直很到位。大家可以參考下

http://blog.csdn.net/muge0913/article/details/6144709

總結(jié)

以上是生活随笔為你收集整理的ARM7、ARM9和ARM11的区别的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

区别

上一篇： Sendiio测评 Facebook和邮
下一篇：晶体管静态参数测试仪系统能测 IGB

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

ARM7、ARM9和ARM11的区别

總結(jié)