Android系统启动-init篇
基于Android 6.0的源碼剖析, 分析Android啟動過程進程號為1的init進程的工作內容
/system/core/init/Init.h /system/core/init/Init.cpp /system/core/init/Init_parser.h /system/core/init/Init_parser.cpp /system/core/init/Signal_handler.h /system/core/init/Signal_handler.cpp一、概述
init是Linux系統中用戶空間的第一個進程,進程號為1。Kernel啟動后,在用戶空間,啟動init進程,并調用init中的main()方法執行init進程的職責。對于init進程的功能分為4部分:
- 分析和運行所有的init.rc文件;
- 生成設備驅動節點; (通過rc文件創建)
- 處理子進程的終止(signal方式);
- 提供屬性服務。
主方法main()
下面展示main()方法的骨干邏輯:
int main(int argc, char** argv) {...klog_init(); //初始化kernel logproperty_init(); //創建一塊共享的內存空間,用于屬性服務signal_handler_init(); //初始化子進程退出的信號處理過程property_load_boot_defaults(); //加載/default.prop文件start_property_service(); //啟動屬性服務器(通過socket通信)init_parse_config_file("/init.rc"); //解析init.rc文件//執行rc文件中觸發器為 on early-init的語句action_for_each_trigger("early-init", action_add_queue_tail);//執行rc文件中觸發器為 on init的語句action_for_each_trigger("init", action_add_queue_tail);//執行rc文件中觸發器為 on late-init的語句action_for_each_trigger("late-init", action_add_queue_tail);while (true) {if (!waiting_for_exec) {execute_one_command();restart_processes();}int timeout = -1;if (process_needs_restart) {timeout = (process_needs_restart - gettime()) * 1000;if (timeout < 0)timeout = 0;}if (!action_queue_empty() || cur_action) {timeout = 0;}epoll_event ev;//循環 等待事件發生int nr = TEMP_FAILURE_RETRY(epoll_wait(epoll_fd, &ev, 1, timeout));if (nr == -1) {ERROR("epoll_wait failed: %s\n", strerror(errno));} else if (nr == 1) {((void (*)()) ev.data.ptr)();}}return 0; }二、信號處理
在init.cpp的main()方法中,通過signal_handler_init()來初始化信號處理過程。
1. 初始化signal句柄
signal_handler.cpp
【1-1】signal_handler_init
void signal_handler_init() {//創建信號SIGCHLD的機制int s[2];// 調用一對已連接好的socket(socketpair是syscall命令)if (socketpair(AF_UNIX, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, 0, s) == -1) {ERROR("socketpair failed: %s\n", strerror(errno));exit(1);}signal_write_fd = s[0];signal_read_fd = s[1];//當捕獲信號SIGCHLD,則寫入signal_write_fdstruct sigaction act;memset(&act, 0, sizeof(act));act.sa_handler = SIGCHLD_handler; 【見流程1-2】//SA_NOCLDSTOP使init進程只有在其子進程終止時才會受到SIGCHLD信號act.sa_flags = SA_NOCLDSTOP;sigaction(SIGCHLD, &act, 0);reap_any_outstanding_children(); 【見流程2-1】//對于handle_signal 【見流程2-3】register_epoll_handler(signal_read_fd, handle_signal); //【見流程4】 }每個進程在處理其他進程發送的signal信號時都需要先注冊,當進程的運行狀態改變或終止時會產生某種signal信號,init進程是所有用戶空間進程的父進程,當其子進程終止時產生SIGCHLD信號,init進程調用信號安裝函數sigaction(),傳遞參數給sigaction結構體,便完成信號處理的過程。
【1-2】SIGCHLD_handler
static void SIGCHLD_handler(int) {//向signal_write_fd寫入1,直到成功為止if (TEMP_FAILURE_RETRY(write(signal_write_fd, "1", 1)) == -1) {ERROR("write(signal_write_fd) failed: %s\n", strerror(errno));} }【1-3】handle_signal
static void handle_signal() {char buf[32];//讀取signal_read_fd數據,放入bufread(signal_read_fd, buf, sizeof(buf));reap_any_outstanding_children(); 【見流程3-1】 }- SIGCHLD_handler:向signal_write_fd寫入1;
- handle_signal:讀取signal_read_fd數據,放入buf;
3. 循環處理子進程
signal_handler.cpp
【2-1】reap_any_outstanding_children
static void reap_any_outstanding_children() {while (wait_for_one_process()) { 【見流程2-2】} }【2-2】wait_for_one_process
static bool wait_for_one_process() {int status;//等待任意子進程,如果子進程沒有退出則返回0,否則則返回該子進程pid。pid_t pid = TEMP_FAILURE_RETRY(waitpid(-1, &status, WNOHANG));if (pid == 0) {return false;} else if (pid == -1) {ERROR("waitpid failed: %s\n", strerror(errno));return false;}service* svc = service_find_by_pid(pid); //根據pid查找到相應的servicestd::string name;if (!svc) {return true;}//當flags為RESTART,且不是ONESHOT時,先kill進程組內所有的子進程或子線程if (!(svc->flags & SVC_ONESHOT) || (svc->flags & SVC_RESTART)) {kill(-pid, SIGKILL);}//移除當前服務svc中的所有創建過的socketfor (socketinfo* si = svc->sockets; si; si = si->next) {char tmp[128];snprintf(tmp, sizeof(tmp), ANDROID_SOCKET_DIR"/%s", si->name);unlink(tmp);}//當flags為EXEC時,釋放相應的服務if (svc->flags & SVC_EXEC) {INFO("SVC_EXEC pid %d finished...\n", svc->pid);waiting_for_exec = false;list_remove(&svc->slist);free(svc->name);free(svc);return true;}svc->pid = 0;svc->flags &= (~SVC_RUNNING);//對于ONESHOT服務,使其進入disabled狀態if ((svc->flags & SVC_ONESHOT) && !(svc->flags & SVC_RESTART)) {svc->flags |= SVC_DISABLED;}//禁用和重置的服務,都不再自動重啟if (svc->flags & (SVC_DISABLED | SVC_RESET)) {svc->NotifyStateChange("stopped"); //設置相應的service狀態為stoppedreturn true;}//服務在4分鐘內重啟次數超過4次,則重啟手機進入recovery模式time_t now = gettime();if ((svc->flags & SVC_CRITICAL) && !(svc->flags & SVC_RESTART)) {if (svc->time_crashed + CRITICAL_CRASH_WINDOW >= now) {if (++svc->nr_crashed > CRITICAL_CRASH_THRESHOLD) {android_reboot(ANDROID_RB_RESTART2, 0, "recovery");return true;}} else {svc->time_crashed = now;svc->nr_crashed = 1;}}svc->flags &= (~SVC_RESTART);svc->flags |= SVC_RESTARTING;//執行當前service中所有onrestart命令struct listnode* node;list_for_each(node, &svc->onrestart.commands) {command* cmd = node_to_item(node, struct command, clist);cmd->func(cmd->nargs, cmd->args);}//設置相應的service狀態為restartingsvc->NotifyStateChange("restarting");return true; }另外:通過getprop | grep init.svc?可查看所有的service運行狀態。狀態總共分為:running, stopped, restarting
3. 注冊epoll句柄
signal_handler.cpp
void register_epoll_handler(int fd, void (*fn)()) {epoll_event ev;ev.events = EPOLLIN; //可讀ev.data.ptr = reinterpret_cast<void*>(fn);//將fd的可讀事件加入到epoll_fd的監聽隊列中if (epoll_ctl(epoll_fd, EPOLL_CTL_ADD, fd, &ev) == -1) {ERROR("epoll_ctl failed: %s\n", strerror(errno));} }4. 處理子進程的終止
當init子進程退出時,會產生SIGCHLD信號,并發送給init進程,通過socket套接字傳遞數據,調用到wait_for_one_process()方法,根據是否是oneshot,來決定是重啟子進程,還是放棄啟動。
三、rc文件語法
rc文件語法是以行尾單位,以空格間隔的語法,以#開始代表注釋行。rc文件主要包含Action、Service、Command、Options,其中對于Action和Service的名稱都是唯一的,對于重復的命名視為無效。
1. 動作Action
Action: 通過trigger,即以 on開頭的語句,決定何時執行相應的service。
- on early-init; 在初始化早期階段觸發;
- on init; 在初始化階段觸發;
- on late-init; 在初始化晚期階段觸發;
- on boot/charger: 當系統啟動/充電時觸發,還包含其他情況,此處不一一列舉;
- on property:<key>=<value>: 當屬性值滿足條件時觸發;
2. 服務Service
服務Service,以 service開頭,由init進程啟動,一般運行于另外一個init的子進程,所以啟動service前需要判斷對應的可執行文件是否存在。init生成的子進程,定義在rc文件,其中每一個service,在啟動時會通過fork方式生成子進程。
例如:?service servicemanager /system/bin/servicemanager代表的是服務名為servicemanager,服務的路徑,也就是服務執行操作時運行/system/bin/servicemanager。
3. 命令Command
下面列舉常用的命令
- class_start <service_class_name>: 啟動屬于同一個class的所有服務;
- start <service_name>: 啟動指定的服務,若已啟動則跳過;
- stop <service_name>: 停止正在運行的服務
- setprop <name> <value>:設置屬性值
- mkdir <path>:創建指定目錄
- symlink <target> <sym_link>: 創建連接到<target>的<sym_link>符號鏈接;
- write <path> <string>: 向文件path中寫入字符串;
- exec: fork并執行,會阻塞init進程直到程序完畢;
- exprot <name> <name>:設定環境變量;
- loglevel <level>:設置log級別
4. 可選操作Options
Options是Services的可選項,與service配合使用
- disabled: 不隨class自動啟動,只有根據service名才啟動;
- oneshot: service退出后不再重啟;
- user/group: 設置執行服務的用戶/用戶組,默認都是root;
- class:設置所屬的類名,當所屬類啟動/退出時,服務也啟動/停止,默認為default;
- onrestart:當服務重啟時執行相應命令;
- socket: 創建名為/dev/socket/<name>的socket
- critical: 在規定時間內該service不斷重啟,則系統會重啟并進入恢復模式
default:?意味著disabled=false,oneshot=false,critical=false。
所有的Service里面只有servicemanager ,zygote ,surfaceflinger這3個service有onrestart關鍵字來觸發其他service啟動過程。
//zygote可觸發media、netd重啟 service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-serverclass mainsocket zygote stream 660 root systemonrestart write /sys/android_power/request_state wakeonrestart write /sys/power/state ononrestart restart mediaonrestart restart netd//servicemanager可觸發healthd、zygote、media、surfaceflinger、drm重啟 service servicemanager /system/bin/servicemanagerclass coreuser systemgroup systemcriticalonrestart restart healthdonrestart restart zygoteonrestart restart mediaonrestart restart surfaceflingeronrestart restart drm//surfaceflinger可觸發zygote重啟 service surfaceflinger /system/bin/surfaceflingerclass coreuser systemgroup graphics drmrpconrestart restart zygote四、創建Zygote
在init.zygote.rc文件中,zygote服務定義如下:
service zygote /system/bin/app_process -Xzygote /system/bin --zygote --start-system-serverclass mainsocket zygote stream 660 root systemonrestart write /sys/android_power/request_state wakeonrestart write /sys/power/state ononrestart restart mediaonrestart restart netd通過Init_parser.cpp完成整個service解析工作,此處就不詳細展開講解析過程,該過程主要是創建一個名”zygote”的service結構體,一個socketinfo結構體(用于socket通信),以及一個包含4個onrestart的action結構體。
Zygote服務會隨著main class的啟動而啟動,退出后會由init重啟zygote,即使多次重啟也不會進入recovery模式。zygote所對應的可執行文件是/system/bin/app_process,通過調用pid =fork()創建子進程,通過execve(svc->args[0], (char**)svc->args, (char**) ENV),進入App_main.cpp的main()函數。故zygote是通過fork和execv共同創建的。
流程如下:
而關于Zygote重啟在前面的信號處理過程中講過,是處理SIGCHLD信號,init進程重啟zygote進程,更多關于Zygote內容見Zygote篇。
五、屬性服務
當某個進程A,通過property_set()修改屬性值后,init進程會檢查訪問權限,當權限滿足要求后,則更改相應的屬性值,屬性值一旦改變則會觸發相應的觸發器(即rc文件中的on開頭的語句),在Android Shared Memmory(共享內存區域)中有一個_system_property_area_區域,里面記錄著素有的屬性值。對于進程A通過property_get()方法,獲取的也是該共享內存區域的屬性值。
property_service.cpp
void property_init() {//用于保證只初始化_system_property_area_區域一次if (property_area_initialized) {return;}property_area_initialized = true;if (__system_property_area_init()) {return;}pa_workspace.size = 0;pa_workspace.fd = open(PROP_FILENAME, O_RDONLY | O_NOFOLLOW | O_CLOEXEC);if (pa_workspace.fd == -1) {ERROR("Failed to open %s: %s\n", PROP_FILENAME, strerror(errno));return;} }在properyty_init函數中,先調用init_property_area函數,創建一塊用于存儲屬性的共享內存,而共享內存是可以跨進程的。
關于加載的prop文件
通過load_all_load_all_propsprops()方法,加載以下:
對于屬性:
- setprop ctl.start bootanim 查看開機動畫;
- setprop ctl.stop bootanim 關閉開機動畫;
- setprop ctl.start pre-recovery 進入recovery模式。
總結
以上是生活随笔為你收集整理的Android系统启动-init篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SSD: how to optimize
- 下一篇: Android系统启动-zygote篇