Linux系统二进制bin文件操作的10种方法
二進(jìn)制文件是我們幾乎每天都需要打交道的文件類型,但很少人知道他們的工作原理。這里所講的二進(jìn)制文件,是指一些可執(zhí)行文件,包括你天天要使用的 Linux 命令,也是二進(jìn)制文件的一種。
Linux 系統(tǒng)給我們提供了非常多用于分析二進(jìn)制文件的工具,不管你在 Linux 下從事的是何種工作,知道這些工具也會(huì)讓你對(duì)你的系統(tǒng)更加了解。
在本文中,將介紹幾種最常用的用于分析二進(jìn)制文件的工具及命令,這些工具在大部分發(fā)行版里可以直接使用,如果不能直接用的話,可以自行安裝。
??file??
?
file 命令用于分析文件的類型。
如果你需要分析二進(jìn)制文件,可以首先使用 file 命令來切入。我們知道,在 Linux 下,一切皆文件,但并不是所有的文件都具有可執(zhí)行性,我們還有各種各樣的文件,比如:文本文件,管道文件,鏈接文件,socket文件,等等。
在對(duì)一個(gè)文件進(jìn)行分析之前,我們可以首先使用 file 命令來分析它們的類型。當(dāng)然除此之外,我們還可以看到一些其它信息。
$?file?/bin/pwd /bin/pwd:?ELF?64-bit?LSB?executable,?x86-64,?version?1?(SYSV),?dynamically?linked?(uses?shared?libs),?for?GNU/Linux?2.6.32,?BuildID[sha1]=0d264bacf2adc568f0e21cbcc9576df434c44380,?stripped?
?ldd??
?
ldd 命令可以用于分析可執(zhí)行文件的依賴。
我們使用 file 命令來分析一個(gè)可執(zhí)行文件的時(shí)候,有時(shí)候可以看到輸出中有?dynamically linked?這樣的字眼。這個(gè)是啥意思呢?
大部分程序,都會(huì)使用到第三方庫(kù),這樣就可以不用重復(fù)造輪子,節(jié)約大量時(shí)間。最簡(jiǎn)單的,我們寫C程序代碼的話,肯定會(huì)使用到?libc?或者?glibc?庫(kù)。當(dāng)然,除此之外,還可能使用其它的庫(kù)。
那我們?cè)谑裁辞闆r下需要分析程序的依賴庫(kù)呢?有一個(gè)場(chǎng)景大家肯定經(jīng)歷過。你去你同事那邊拷備他寫好的程序放到自己的環(huán)境下運(yùn)行,有時(shí)候可能會(huì)跑不起來。當(dāng)然跑不起來的原因可能很多,但其中一個(gè)原因可能就是缺少對(duì)應(yīng)的依賴庫(kù)。
這時(shí)候,ldd 就派上用場(chǎng)了。它可以分析程序需要一些什么依賴庫(kù),你只要把對(duì)應(yīng)的庫(kù)放在對(duì)應(yīng)的位置就可以了。
$?ldd?/bin/pwdlinux-vdso.so.1?=>??(0x00007ffeb73e5000)libc.so.6?=>?/lib64/libc.so.6?(0x00007f908b321000)/lib64/ld-linux-x86-64.so.2?(0x00007f908b6ef000)?
?ltrace??
?
ltrace的功能是能夠跟蹤進(jìn)程的庫(kù)函數(shù)調(diào)用。
我們可以使用 ldd 命令來找到程序的依賴庫(kù),但是,一個(gè)庫(kù)里少則幾個(gè),多則幾千個(gè)函數(shù),怎么知道現(xiàn)在程序調(diào)用的是什么函數(shù)呢?
ltrace?命令就是用來做這個(gè)事的。在下面的例子里,我們可以看到程序調(diào)用的函數(shù),以及傳遞進(jìn)去的參數(shù),同時(shí)你也可以看到函數(shù)調(diào)用的輸出。
$?ltrace?/bin/pwd __libc_start_main(0x401760,?1,?0x7ffff6524cc8,?0x404a00?<unfinished?...> getenv("POSIXLY_CORRECT")????????????????????????=?nil strrchr("/bin/pwd",?'/')?????????????????????????=?"/pwd" setlocale(LC_ALL,?"")????????????????????????????=?"en_US.utf8" bindtextdomain("coreutils",?"/usr/share/locale")?=?"/usr/share/locale" textdomain("coreutils")??????????????????????????=?"coreutils" __cxa_atexit(0x4022f0,?0,?0,?0x736c6974756572)???=?0 getopt_long(1,?0x7ffff6524cc8,?"LP",?0x606d00,?nil)?=?-1 getcwd(nil,?0)???????????????????????????????????=?"" puts("/home/alvin"/home/alvin )??????????????????????????????=?12 free(0x22bc030)??????????????????????????????????=?<void> exit(0?<unfinished?...> __fpending(0x7f3048865400,?0,?64,?0x7f3048865eb0)?=?0 fileno(0x7f3048865400)???????????????????????????=?1 __freading(0x7f3048865400,?0,?64,?0x7f3048865eb0)?=?0 __freading(0x7f3048865400,?0,?2052,?0x7f3048865eb0)?=?0 fflush(0x7f3048865400)???????????????????????????=?0 fclose(0x7f3048865400)???????????????????????????=?0 __fpending(0x7f30488651c0,?0,?3328,?0xfbad000c)??=?0 fileno(0x7f30488651c0)???????????????????????????=?2 __freading(0x7f30488651c0,?0,?3328,?0xfbad000c)??=?0 __freading(0x7f30488651c0,?0,?4,?0xfbad000c)?????=?0 fflush(0x7f30488651c0)???????????????????????????=?0 fclose(0x7f30488651c0)???????????????????????????=?0 +++?exited?(status?0)?+++?
??strace??
?
strace 命令可以用于追蹤程序運(yùn)行過程中的系統(tǒng)調(diào)用及信號(hào)。
通過上面的介紹,我們知道 ltrace 命令是用來追蹤函數(shù)調(diào)用的。strace 命令類似,但它追蹤的是系統(tǒng)調(diào)用。何為系統(tǒng)調(diào)用?簡(jiǎn)單說就是我們可以通過系統(tǒng)調(diào)用與內(nèi)核進(jìn)行交互,完成我們想要的任務(wù)。
例如,如果我們想在屏幕上打印某些字符,可以使用 printf 或 puts 函數(shù),而這兩個(gè)都是 libc 的庫(kù)函數(shù),在更底層,他們都是調(diào)用 write 這個(gè)系統(tǒng)調(diào)用。
$?strace?-f?/bin/pwd execve("/bin/pwd",?["/bin/pwd"],?[/*?24?vars?*/])?=?0 brk(NULL)???????????????????????????????=?0xbc9000 mmap(NULL,?4096,?PROT_READ|PROT_WRITE,?MAP_PRIVATE|MAP_ANONYMOUS,?-1,?0)?=?0x7f918ba69000 access("/etc/ld.so.preload",?R_OK)??????=?-1?ENOENT?(No?such?file?or?directory) open("/etc/ld.so.cache",?O_RDONLY|O_CLOEXEC)?=?3 fstat(3,?{st_mode=S_IFREG|0644,?st_size=38684,?...})?=?0 mmap(NULL,?38684,?PROT_READ,?MAP_PRIVATE,?3,?0)?=?0x7f918ba5f000 close(3)????????????????????????????????=?0 open("/lib64/libc.so.6",?O_RDONLY|O_CLOEXEC)?=?3 read(3,?"\177ELF\2\1\1\3\0\0\0\0\0\0\0\0\3\0>\0\1\0\0\0\20&\2\0\0\0\0\0"...,?832)?=?832 fstat(3,?{st_mode=S_IFREG|0755,?st_size=2156160,?...})?=?0 mmap(NULL,?3985888,?PROT_READ|PROT_EXEC,?MAP_PRIVATE|MAP_DENYWRITE,?3,?0)?=?0x7f918b47b000 mprotect(0x7f918b63e000,?2097152,?PROT_NONE)?=?0 mmap(0x7f918b83e000,?24576,?PROT_READ|PROT_WRITE,?MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE,?3,?0x1c3000)?=?0x7f918b83e000 mmap(0x7f918b844000,?16864,?PROT_READ|PROT_WRITE,?MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS,?-1,?0)?=?0x7f918b844000 close(3)? ………… +++?exited?with?0?+++?
?hexdump??
?
hexdump 命令用來查看二進(jìn)制文件的 16 進(jìn)制編碼,但實(shí)際它能查看任何文件,而不限于二進(jìn)制文件。
一個(gè)二進(jìn)制文件,如果你直接使用文本編輯器打開的話,將看到一堆亂碼。這時(shí)候,你就可以使用 hexdump 命令來查看它的內(nèi)容了。
hexdump 的顯示格式是:左邊是字節(jié)序號(hào),中間是文件的 16 進(jìn)制編碼,如果是可打印字符的話就會(huì)顯示在右邊。
通過使用這個(gè)命令,我們就可以大概知道這個(gè)二進(jìn)制文件里面有什么內(nèi)容,后面要做什么處理就比較方便了。
$?hexdump?-C?/bin/pwd?|?head 00000000??7f?45?4c?46?02?01?01?00??00?00?00?00?00?00?00?00??|.ELF............| 00000010??02?00?3e?00?01?00?00?00??17?19?40?00?00?00?00?00??|..>.......@.....| 00000020??40?00?00?00?00?00?00?00??50?7a?00?00?00?00?00?00??|@.......Pz......| 00000030??00?00?00?00?40?00?38?00??09?00?40?00?1e?00?1d?00??|....@.8...@.....| 00000040??06?00?00?00?05?00?00?00??40?00?00?00?00?00?00?00??|........@.......| 00000050??40?00?40?00?00?00?00?00??40?00?40?00?00?00?00?00??|@.@.....@.@.....| 00000060??f8?01?00?00?00?00?00?00??f8?01?00?00?00?00?00?00??|................| 00000070??08?00?00?00?00?00?00?00??03?00?00?00?04?00?00?00??|................| 00000080??38?02?00?00?00?00?00?00??38?02?40?00?00?00?00?00??|8.......8.@.....| 00000090??38?02?40?00?00?00?00?00??1c?00?00?00?00?00?00?00??|8.@.............|?
??strings??
strings 命令可以用來打印二進(jìn)制文件中可顯示的字符。
什么是可顯示字符?簡(jiǎn)單說你在顯示器上看到的字符都是可顯示字符,比如:abcABC,.:。
我們知道,一個(gè)二進(jìn)制文件里面的內(nèi)容很多是非顯示字符,所以無法直接用文本處理器打開。程序在被開發(fā)的時(shí)候,我們經(jīng)常會(huì)加一些調(diào)試信息,比如:debug log, warn log, error log,等等。這些信息我們就可以使用 strings 命令看得到。
$?strings?/bin/pwd?|?head /lib64/ld-linux-x86-64.so.2 libc.so.6 fflush strcpy __printf_chk readdir setlocale mbrtowc strncmp optind?
??readelf??
?
readelf 一般用于查看 ELF 格式的文件信息。
ELF(Executable and Linkable Format)即可執(zhí)行連接文件格式,是一種比較復(fù)雜的文件格式,但其應(yīng)用廣泛。當(dāng)你使用 file 命令發(fā)現(xiàn)某個(gè)文件是 ELF 文件時(shí),你就可以使用 readelf 命令來讀取這個(gè)文件的信息。
$?readelf?-h?/bin/pwd ELF?Header:Magic:???7f?45?4c?46?02?01?01?00?00?00?00?00?00?00?00?00Class:?????????????????????????????ELF64Data:??????????????????????????????2's?complement,?little?endianVersion:???????????????????????????1?(current)OS/ABI:????????????????????????????UNIX?-?System?VABI?Version:???????????????????????0Type:??????????????????????????????EXEC?(Executable?file)Machine:???????????????????????????Advanced?Micro?Devices?X86-64Version:???????????????????????????0x1Entry?point?address:???????????????0x401917Start?of?program?headers:??????????64?(bytes?into?file)Start?of?section?headers:??????????31312?(bytes?into?file)Flags:?????????????????????????????0x0Size?of?this?header:???????????????64?(bytes)Size?of?program?headers:???????????56?(bytes)Number?of?program?headers:?????????9Size?of?section?headers:???????????64?(bytes)Number?of?section?headers:?????????30Section?header?string?table?index:?29?
?objdump??
?
objdump是用查看目標(biāo)文件或者可執(zhí)行的目標(biāo)文件的構(gòu)成的GCC工具。
我們知道,程序在開發(fā)完成之后,需要經(jīng)過編譯,才可以生成計(jì)算機(jī)可以識(shí)別的二進(jìn)制文件。我們寫的代碼計(jì)算機(jī)不能直接執(zhí)行,需要編譯成匯編程序,計(jì)算機(jī)才能依次執(zhí)行。
objdump 命令可以讀取可執(zhí)行文件,然后將匯編指令打印出來。所以如果你想看懂 objdump 的結(jié)果,你就需要有一些匯編基礎(chǔ)才可以。
$?objdump?-d?/bin/pwd?|?head/bin/pwd:?????file?format?elf64-x86-64Disassembly?of?section?.init:0000000000401350?<.init>:401350:???????48?83?ec?08?????????????sub????$0x8,%rsp401354:???????48?8b?05?6d?5c?20?00????mov????0x205c6d(%rip),%rax????????#?606fc8?<__ctype_b_loc@plt+0x205878>40135b:???????48?85?c0????????????????test???%rax,%rax?
??nm??
?
nm命令主要是列出目標(biāo)文件的符號(hào)(說白了就是一些函數(shù)和全局變量等)。
如果你編譯出來的程序沒有經(jīng)過 strip ,那么 nm 命令可以挖掘出隱含在可執(zhí)行文件中的重大秘密。它可以幫你列出文件中的變量及函數(shù),這對(duì)于我們進(jìn)行反向操作具有重大意義。
下面我們通過一小段簡(jiǎn)單的程序來講解 nm 命令的用途。在編譯這個(gè)程序時(shí),我們加上了-g?選項(xiàng),這個(gè)選項(xiàng)可以使編譯出來的文件包含更多有效信息。
$?cat?hello.c? #include?<stdio.h>int?main()?{printf("Hello?world!");return?0; } $? $?gcc?-g?hello.c?-o?hello $? $?file?hello hello:?ELF?64-bit?LSB?executable,?x86-64,?version?1?(SYSV),?dynamically?linked?(uses?shared?libs),?for?GNU/Linux?2.6.32,?BuildID[sha1]=3de46c8efb98bce4ad525d3328121568ba3d8a5d,?not?stripped $? $?./hello? Hello?world!$? $?$?nm?hello?|?tail 0000000000600e20?d?__JCR_END__ 0000000000600e20?d?__JCR_LIST__ 00000000004005b0?T?__libc_csu_fini 0000000000400540?T?__libc_csu_initU?__libc_start_main@@GLIBC_2.2.5 000000000040051d?T?mainU?printf@@GLIBC_2.2.5 0000000000400490?t?register_tm_clones 0000000000400430?T?_start 0000000000601030?D?__TMC_END__ $??
gdb??
?
gdb 就是所謂的 GNU debugger。
gdb 大家或多或少都有聽說過。我們?cè)谑褂靡恍?IDE 寫代碼的時(shí)候,可以進(jìn)行打斷點(diǎn)、步進(jìn)、查看變量值等方式調(diào)試,其實(shí)這些 IDE 底層調(diào)用的也是 gdb 。
對(duì)于 gdb 的用法,可以寫很多,本文就暫且不深入了。下面先演示一小段 gdb 最基礎(chǔ)的功能。
$?gdb?-q?./hello Reading?symbols?from?/home/flash/hello...done. (gdb)?break?main Breakpoint?1?at?0x400521:?file?hello.c,?line?4. (gdb)?info?break Num?????Type???????????Disp?Enb?Address????????????What 1???????breakpoint?????keep?y???0x0000000000400521?in?main?at?hello.c:4 (gdb)?run Starting?program:?/home/flash/./hello?Breakpoint?1,?main?()?at?hello.c:4 4???????????printf("Hello?world!"); Missing?separate?debuginfos,?use:?debuginfo-install?glibc-2.17-260.el7_6.6.x86_64 (gdb)?bt #0??main?()?at?hello.c:4 (gdb)?c Continuing. Hello?world![Inferior?1?(process?29620)?exited?normally] (gdb)?q $?
??
總結(jié)
以上是生活随笔為你收集整理的Linux系统二进制bin文件操作的10种方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QPS、TPS、PV、UV、GMV、IP
- 下一篇: Linux中3个文件查找相关命令