prfm预加载指令使用说明
生活随笔
收集整理的這篇文章主要介紹了
prfm预加载指令使用说明
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
只是實(shí)踐經(jīng)驗(yàn),沒(méi)有理論,不一定正確
prfm pldl1keep, [x0, #256]- 放在 ld1 [x0] 前面 0~8 條指令
- #256 表示把 x0+256 的內(nèi)容放進(jìn) L1 cache
- ldp 也適用
- (經(jīng)驗(yàn))不寫(xiě) offset 不如寫(xiě)個(gè) #128
- (經(jīng)驗(yàn))pldl1strm 似乎沒(méi)啥意思,也沒(méi) pldl1keep 快
- (經(jīng)驗(yàn))x0 ~ x0+256 的內(nèi)容也會(huì)進(jìn)來(lái)
- (經(jīng)驗(yàn))load 128bit 用 #128,256bit或更多用 #256
- (經(jīng)驗(yàn))避免 pld a,pld b,load a,load b 順序,可能相互干擾
- (經(jīng)驗(yàn))提前太多會(huì)失效
- (經(jīng)驗(yàn))適合連續(xù)讀
- 放在 ld1 [x0] 前面 N 條指令,N 盡量大些
- #256 表示把 x0+256 的內(nèi)容放進(jìn) L2 cache
- ldp 也適用
- (經(jīng)驗(yàn))不寫(xiě) offset 不如寫(xiě)個(gè) #128
- (經(jīng)驗(yàn))pldl2strm 效果稍好于 pldl2keep
- (經(jīng)驗(yàn))x0 ~ x0+256 的內(nèi)容也會(huì)進(jìn)來(lái)
- (經(jīng)驗(yàn))load 128bit 用 #128,256bit 用 #256
- (經(jīng)驗(yàn))讀很多數(shù)據(jù),用不同 offset 連續(xù)兩次 pldl2strm
- (經(jīng)驗(yàn))后面不要對(duì)同位置再 pldl1keep,會(huì)變慢
- (經(jīng)驗(yàn))適合提前準(zhǔn)備要跳到很遠(yuǎn)的地方讀,比如換 channel
總結(jié)
以上是生活随笔為你收集整理的prfm预加载指令使用说明的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: transformer bert 入门
- 下一篇: TypeScript类型声明书写