Android开机速度优化(第三篇)
參考地址:https://www.jianshu.com/p/6dba42c022a9
問題描述
開機時間相對參考機過慢,大約慢15s左右。Android 系統7.0。
問題分析
開機問題涉及的層次較多,大致有bootloader-->kernel-->Zygote-->PMS-->AMS-->Launcher
可以借助bootchart來分析,也可以直接通過log分析。不幸的是本項目機器因未知原因導致無法抓取到bootchart。
幸好在我瀏覽源碼時發現了一個神器perfboot工具。具體在system/core/init/perfboot.py。
運行該命令需要在源碼編譯環境下。詳細請參考源碼文件,此處不做過多介紹。
使用命令:
./perfboot.py --iterations=5 --interval=30 -v --output=/data/My_Doc/Performance/Bugs/bootup_op_4200151/J5D_UE.tsv
獲取問題機與參考機的開機數據。生成下圖
上圖X軸是開機啟動過程中的一些重要節點。Y軸是開機時間。
詳細說明下X軸上各個節點表征的含義。
|boot_progress_start|系統進入用戶空間,標志著kernel啟動完成,本例中可以看出kernel啟動耗時30s左右
|:---
|boot_progress_preload_start|Zygote啟動
|boot_progress_preload_end|Zygote結束
|boot_progress_system_run|SystemServer ready,開始啟動Android系統服務,如PMS,APMS等
|boot_progress_pms_start|PMS開始掃描安裝的應用
|boot_progress_pms_system_scan_start|PMS先行掃描/system目錄下的安裝包
|boot_progress_pms_data_scan_start|PMS掃描/data目錄下的安裝包
|boot_progress_pms_scan_end|PMS掃描結束
|boot_progress_pms_ready|PMS就緒
|boot_progress_ams_ready|AMS就緒
|boot_progress_enable_screen|AMS啟動完成后開始激活屏幕,從此以后屏幕才能響應用戶的觸摸,它在WindowManagerService發出退出開機動畫的時間節點之前,而真正退出開機動畫還會花費少許時間,具體依賴animation zip 包中的desc.txt。wm_boot_animation_done才是用戶感知到的動畫結束時間節點
|sf_stop_bootanim|SF設置service.bootanim.exit屬性值為1,標志系統要結束開機動畫了,可以用來跟蹤開機動畫結尾部分消耗的時間
|wm_boot_animation_done|開機動畫結束,這一步用戶能直觀感受到開機結束
通過上圖可以直觀的看到問題機在進入boot_progress_start節點之前相對參考機耗時較多。而這之前主要涉及bootloader和kernel。
bootloader 優化
這一塊沒有接觸過,交給底層同事優化。大概說下抓取log的方式.
adb shell cat /proc/bootmsg > bootmsg.txt.
從log里底層同事發現是bootimg簽名有問題,更詳細的分析,自己對這塊真心不懂,總結不出幫助性的意見。
kernel層優化
kernel的優化先check一遍config的配置,kernel中config的配置種類繁多,就算是工作幾年的kernel工程師也不一定能清楚每一個config值的作用。Android提供了一個基礎配置表。
可以用腳本:kernel/scripts/kconfig/merge_config.sh來生成一份config文件。具體用法戳這
拿生成的config文件和當前項目中的config做對比,同時也對比參考機的config文件。對比的時候可以用一個現成的工具kernel/scripts/diffconfig來比較。
綜合比較后的結果,本地一點點調試,查找資料。最終去掉了如下config:
這里說下config的配置有y,n,m,m表示編譯成模塊,不編譯進內核。不配置的話相當于n。
CONFIG_DEBUG_INFO 不能去掉, 會引起CTS不過。由于config的的各項值可能散落在kernel的不同文件中,我們可以單獨編譯下kernel,然后去out目錄下查看obj/KERNEL_OBJ/.config 文件,這里面的配置項是完全的。
kernel關閉掉一些debug開關后。在新版本上復測結果如下:
優化lk和kernel后這里提下如何看kernel的log,
開機后用命令:adb shell dmesg > dmesg.txt抓取Log
log里面搜關鍵字"Bootloader start count"-->LK 啟動
“Bootloader end count”-->LK 結束
"Kernel MPM timestamp"-->bootloader運行完成
通過對bootloader和kernel的優化,直接減少了14s左右的開機時間,可以看到優化的效果還是比較明顯的。
frameworks層優化
用命令: adb logcat -b events|grep boot我們過濾出啟動階段的主要事件。
01-01 13:38:52.139 391 391 I boot_progress_start: 15452 01-01 13:38:53.329 391 391 I boot_progress_preload_start: 16641 01-01 13:38:56.675 391 391 I boot_progress_preload_end: 19989 01-01 13:38:57.020 1729 1729 I boot_progress_system_run: 20333 01-01 13:38:57.824 1729 1729 I boot_progress_pms_start: 21137 01-01 13:38:58.865 1729 1729 I boot_progress_pms_system_scan_start: 22179 01-01 13:39:08.852 1729 1729 I boot_progress_pms_data_scan_start: 32166 01-01 13:39:08.907 1729 1729 I boot_progress_pms_scan_end: 32221 01-01 13:39:10.109 1729 1729 I boot_progress_pms_ready: 33422 01-01 13:39:12.557 1729 1729 I boot_progress_ams_ready: 35871 01-01 13:39:15.189 1729 1782 I boot_progress_enable_screen: 38503 01-01 13:39:17.973 290 321 I sf_stop_bootanim: 41287 01-01 13:39:18.887 1729 1961 I wm_boot_animation_done: 42201結合對比圖看,boot_progress_enable_screen之前問題機跟對比機各個節點耗時相差不大。在這里說明下,Android M上啟動階段到boot_progress_enable_screen就結束了,而Android N上還多了sf_stop_bootanim和wm_boot_animation_done兩個事件。這也就是圖-優化kernel后棕紅色的線條到boot_progress_enable_screen就沒有延生的原因,因為它表示的參考機,而參考機正好是Android M系統。
從log的時間戳可以看出:
boot_progress_enable_screen--->花費2s左右的時間到達sf_stop_bootanim--->花費1s多時間到達wm_boot_animation_done。多出來的兩個過程總共多花接近4s的時間。
我們要重點看下這個過程發生了什么,為什么會多出來這近4s時間。
1.先看下boot_progress_enable_screen出現的位置。
它在frameworks/base/services/core/java/com/android/server/am/ActivityManagerService.java
2.sf_stop_bootanim出現的位置。
它在frameworks/native/services/surfaceflinger/SurfaceFlinger_hwc1.cpp。
這里特別說明下SurfaceFlinger_hwc1.cpp是SurfaceFlinger.cpp的升級版,它支持HWC 2.0,使用的是SurfaceFlinger.cpp還是SurfaceFlinger_hwc1.cpp跟平臺選擇相關。
3.wm_boot_animation_done出現的位置。
frameworks/base/services/core/java/com/android/server/wm/WindowManagerService.java
找到了3個節點出現的位置,現在再來分析如何將這3個節點串聯起來。
1-->2過程: AMS的enableScreenAfterBoot調用WMS的enableScreenAfterBoot方法,在WMS中的enableScreenAfterBoot會繼續調用內部方法performEnableScreen,該方法內部判斷開機動畫如果沒有停止,就調用SurfaceFlinger去停止開機動畫
這里的FIRST_CALL_TRANSACTION實際上就是BOOT_FINISHED。
frameworks/native/include/gui/ISurfaceComposer.h
surfaceFlinger.transact發出的調用請求會被ISurfaceComposer處理。
frameworks/native/libs/gui/ISurfaceComposer.cpp
這里的bootFinished就是SurfaceFlinger_hwc1.cpp定義的bootFinished()方法,最終來到了第2個節點sf_stop_bootanim。
為了驗證上述調用過程,我們添加上打印調用棧的log看看輸出。
上述log也印證了之前的分析,至此1-->2的過程算是通了。在來看2-->3過程,在3節點出現之前還有一次判斷:
if (!mForceDisplayEnabled && !checkBootAnimationCompleteLocked()) {if (DEBUG_BOOT) Slog.i(TAG_WM, "performEnableScreen: Waiting for anim complete");return; }這里系統需要去檢測開機動畫是否還在播放,
private boolean checkBootAnimationCompleteLocked() {if (SystemService.isRunning(BOOT_ANIMATION_SERVICE)) {mH.removeMessages(H.CHECK_IF_BOOT_ANIMATION_FINISHED);mH.sendEmptyMessageDelayed(H.CHECK_IF_BOOT_ANIMATION_FINISHED,BOOT_ANIMATION_POLL_INTERVAL);return false;}return true; }BOOT_ANIMATION_SERVICE是在初始化SurfaceFlinger時啟動的。
frameworks/native/services/surfaceflinger/SurfaceFlinger_hwc1.cpp
順藤摸瓜來到了BootAnimation,前面分析過在SurfaceFlinger的bootFinished方法中將"service.bootanim.exit"置為了1,這個設置在BootAnimation就被讀取了。
frameworks/base/cmds/bootanimation/BootAnimation.cpp
跟蹤到這2-->3過程也就通暢了。在理清了該過程的調用邏輯后,問題也浮出了水面。原來之前的同事在解決一個開機進桌面出現黑屏問題時,在checkExit內部人為delay了幾秒的時間...
在排查log時還發現下面的錯誤:
01-01 15:55:23.506 1865 1865 E BitmapFactory: Unable to decode stream: java.io.FileNotFoundException: /data/system/users/0/wallpaper_orig (No such file or directory)adb shell 進入手機發現確實沒有/data/system/users/0/wallpaper_orig文件。
會不會是是wallpaper異常導致消耗時間多余呢?
為了清晰debug在過濾下log
adb logcat -b all|grep -E "Wallpaper may change|haveWall|sf_stop_bootanim|boot_progress_enable_screen"
輸出如下log:
01-02 12:13:03.814 1851 2082 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:04.865 1851 2082 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:06.986 1851 2006 I boot_progress_enable_screen: 40388 01-02 12:13:06.988 1851 2082 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:07.052 1851 2006 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:07.056 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:07.184 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:08.049 1851 2082 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:08.066 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:08.067 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:08.071 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:08.072 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:08.076 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=false wallEnabled=true haveKeyguard=true 01-02 12:13:09.894 1851 2082 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:09.908 1851 3413 V WindowManager: Wallpaper may change! Adjusting 01-02 12:13:10.178 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=true wallEnabled=true haveKeyguard=true 01-02 12:13:10.186 292 3736 I sf_stop_bootanim: 43587 01-02 12:13:10.191 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=true wallEnabled=true haveKeyguard=true 01-02 12:13:10.196 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=true wallEnabled=true haveKeyguard=true 01-02 12:13:10.397 1851 2082 I WindowManager: ******** booted=true msg=false haveBoot=false haveApp=false haveWall=true wallEnabled=true haveKeyguard=true然后在做實驗push一個wallpaper_orig到指定目錄,BitmapFactory的錯誤雖然不見了。然而對于縮短時間并沒有什么卵用。
看來不是這個異常沒有拖慢開機速度。但我注意到
這段log中haveWall=true之前一直都是haveWall=false,haveWall表示系統Window已經成功加載好了Wallpaper。Log中不斷的輸出
WindowManager: Wallpaper may change! Adjusting
這里究竟為什么Wallpaper會不斷的Adjusting呢?看起來一旦Wallpaper調整好就會將haveWall置true。
追蹤了下該句log在代碼中的位置:
frameworks/base/services/core/java/com/android/server/wm/WindowManagerService.java
這個checkWaitingForWindowsLocked表示是否需要等待系統Windows就緒。被同在WindowManagerService類中的performEnableScreen方法調用
public void performEnableScreen() {// Don't enable the screen until all existing windows have been drawn.if (!mForceDisplayEnabled && checkWaitingForWindowsLocked()) {return;} }從注釋看performEnableScreen執行的是激活屏幕動作,然而在此之前需要等待系統必要的windows已經被畫好了,也就是說我屏幕一旦激活了,繪制好的windows就能馬上顯示出來。否則performEnableScreen直接就退出了。
而performEnableScreen又是被同在WindowManagerService類中enableScreenAfterBoot方法調用。大致的調用過程如下:
AMS打印出boot_progress_enable_screen---->調用WMS的enableScreenAfterBoot--->調用WMS的performEnableScreen--->調用WMS的checkWaitingForWindowsLocked檢查是否可以Enable Screen,因為Wallpaper沒有準備好,因此checkWaitingForWindowsLocked返回了true,進而導致performEnableScreen直接返回,沒有去執行本來要做的Enable Screen動作。
WindowManager: Wallpaper may change! Adjusting
是在下面的code打印出來的。
frameworks/base/services/core/java/com/android/server/wm/WindowSurfacePlacer.java
debug調用棧如下:
1-01 21:18:30.572 2912 2962 W System.err: java.lang.Exception: print stack 01-01 21:18:30.573 2912 2962 W System.err: at com.android.server.wm.WindowManagerService.checkWaitingForWindowsLocked(WindowManagerService.java:5841) 01-01 21:18:30.574 2912 2962 W System.err: at com.android.server.wm.WindowManagerService.performEnableScreen(WindowManagerService.java:5905) 01-01 21:18:30.575 2912 2962 W System.err: at com.android.server.wm.WindowManagerService$H.handleMessage(WindowManagerService.java:8390) 01-01 21:18:30.576 2912 2962 W System.err: at android.os.Handler.dispatchMessage(Handler.java:102) 01-01 21:18:30.577 2912 2962 W System.err: at android.os.Looper.loop(Looper.java:154) 01-01 21:18:30.578 2912 2962 W System.err: at android.os.HandlerThread.run(HandlerThread.java:61) 01-01 21:18:30.578 2912 2962 W System.err: at com.android.server.ServiceThread.run(ServiceThread.java:46)這塊沒有檢查出多余的操作,沒繼續check了。
經過以上分析后修改代碼,最終問題機的開機速度達到了參考機的標準。性能問題是一個持續挖掘改善的過程,開機過程中還能優化的地方肯定還有。
debug 技術說明
匯總下分析該問題時,匯集的一些debug技術。
- java代碼中打印堆棧 Slog.d("azhengye", "Stack=="+new RuntimeException("azhengye debug").fillInStackTrace()); 
 或者new Exception("print stack").printStackTrace(); 然后log中搜索"System.err:"
- c++ debug: 為了在native查看函數調用??梢栽谛枰牡胤教砑尤缦麓a。 
 #include <utils/CallStack.h>
 android::CallStack stack;
 stack.update();
 String8 strtemp = stack.toString("");
 ALOGD("\t%s", strtemp.string());
 過濾出的log還需要用arm-linux-androideabi-addr2line轉行下,好在有現成的腳本幫我們做這件事,這里一并貼出來。
在源碼編譯的imge文件夾下執行上面的腳本,調試 SF 的bootFinished就用的該腳本,下面是個輸出例子。
01-02 01:38:13.305 477 3072 D azhengye : #00 pc 000059b9 /system/bin/bootanimation 01-02 01:38:13.305 477 3072 D azhengye : #01 pc 00006515 /system/bin/bootanimation 01-02 01:38:13.305 477 3072 D azhengye : #02 pc 0000591f /system/bin/bootanimation 01-02 01:38:13.305 477 3072 D azhengye : #03 pc 000054f1 /system/bin/bootanimation 01-02 01:38:13.305 477 3072 D azhengye : #04 pc 0000e349 /system/lib/libutils.so 01-02 01:38:13.305 477 3072 D azhengye : #05 pc 000473d3 /system/lib/libc.so 01-02 01:38:13.305 477 3072 D azhengye : #06 pc 0001a0c9 /system/lib/libc.so ------------------------------------------------------------------------------------ python panic.py /data/My_Doc/Performance/boot_c_log read file ok BootAnimation.cpp:534 android::BootAnimation::checkExit() BootAnimation.cpp:972 android::BootAnimation::playAnimation(android::BootAnimation::Animation const&) BootAnimation.cpp:870 android::BootAnimation::movie() BootAnimation.cpp:452 android::BootAnimation::threadLoop() Threads.cpp:751 android::Thread::_threadLoop(void*) pthread_create.cpp:198 (discriminator 1)__pthread_start(void*) clone.cpp:41 (discriminator 1)__start_thread- 堆棧dumpadb shell kill -3 <pid> 
輸出的trace會保存在 /data/anr/traces.txt文件中。這個需要注意,如果沒有 /data/anr/這個目錄 或/data/anr/traces.txt這個文件,需要手工創建一下,并設置好讀寫權限。如果是native thread的堆棧打印,可能需要修改dalvik/vm/Thread.cpp的dumpNativeThread方法。
- debuggerd coredump 這個是開始分析問題查資料找到的debug方法,不過自己沒有實踐,僅作記錄參考。
 debuggerd是android的一個daemon進程,負責在進程異常出錯時,將進程的運行時信息dump出來供分析。debuggerd生成的coredump數據是以文本形式呈現,被保存在 /data/tombstone/ 目錄下,它可以在不中斷進程執行的情況下打印當前進程的native堆棧。使用方法是:
debuggerd -b <pid>
這可以協助我們分析進程執行行為,也可以用來定位native進程中鎖死或錯誤邏輯引起的死循環的代碼位置。
總結
各家廠商都會定制不同的開機行為,因此沒有一個固定的方法能fix所有的開機問題,但通過本文我們總結分析該類問題的套路,那就是關注boot階段的各個event事件,先量化出開機慢在哪里,然后在去針對性的優化。
源碼真的是個寶庫,多讀吧。
作者:小草凡
鏈接:https://www.jianshu.com/p/6dba42c022a9
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯系作者獲得授權并注明出處。
總結
以上是生活随笔為你收集整理的Android开机速度优化(第三篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: [转帖]从 2G 到 5G,手机上网话语
- 下一篇: 王峰十问Nervos联合创始人王宁宁:缘
