開始調(diào)試之前,必須用程序中的調(diào)試信息編譯要調(diào)試的程序。這樣,gdb 才能夠調(diào)試所使用的變量、代碼行和函數(shù)。如果要進行編譯,請在 gcc(或 g++)下使用額外的 '-g' 選項來編譯程序:
gcc -g eg.c -o eg |
在 shell 中,可以使用 'gdb' 命令并指定程序名作為參數(shù)來運行 gdb,例如 'gdb eg';或者在 gdb 中,可以使用 file 命令來裝入要調(diào)試的程序,例如 'file eg'。這兩種方式都假設(shè)您是在包含程序的目錄中執(zhí)行命令。裝入程序之后,可以用 gdb 命令 'run' 來啟動程序。
如果一切正常,程序?qū)?zhí)行到結(jié)束,此時 gdb 將重新獲得控制。但如果有錯誤將會怎么樣?這種情況下,gdb 會獲得控制并中斷程序,從而可以讓您檢查所有事物的狀態(tài),如果運氣好的話,可以找出原因。為了引發(fā)這種情況,我們將使用一個 示例程序:
代碼示例 eg1.c
#include int wib(int no1, int no2) { int result, diff; diff = no1 - no2; result = no1 / diff; return result; } int main(int argc, char *argv[]) { int value, div, result, i, total; value = 10; div = 6; total = 0; for(i = 0; i < 10; i++) { result = wib(value, div); total += result; div++; value--; } printf("%d wibed by %d equals %d\n", value, div, total); return 0; } |
這個程序?qū)⑦\行 10 次 for 循環(huán),使用 'wib()" 函數(shù)計算出累積值,最后打印出結(jié)果。
在您喜歡的文本編輯器中輸入這個程序(要保持相同的行距),保存為 'eg1.c',使用 'gcc -g eg1.c -o eg1' 進行編譯,并用 'gdb eg1' 啟動 gdb。使用 'run' 運行程序可能會產(chǎn)生以下消息:
Program received signal SIGFPE, Arithmetic exception. 0x80483ea in wib (no1=8, no2=8) at eg1.c:7 7 result = no1 / diff; (gdb) |
gdb 指出在程序第 7 行發(fā)生一個算術(shù)異常,通常它會打印這一行以及 wib() 函數(shù)的自變量值。要查看第 7 行前后的源代碼,請使用 'list' 命令,它通常會打印 10 行。再次輸入 'list'(或者按回車重復(fù)上一條命令)將列出程序的下 10 行。從 gdb 消息中可以看出,第 7 行中的除法運算出了錯,程序在這一行中將變量 "no1" 除以 "diff"。
要查看變量的值,使用 gdb 'print' 命令并指定變量名。輸入 'print no1' 和 'print diff',可以相應(yīng)看到 "no1" 和 "diff" 的值,結(jié)果如下:
(gdb) print no1 $5 = 8 (gdb) print diff $2 = 0 |
gdb 指出 "no1" 等于 8,"diff" 等于 0。根據(jù)這些值和第 7 行中的語句,我們可以推斷出算術(shù)異常是由除數(shù)為 0 的除法運算造成的。清單顯示了第 6 行計算的變量 "diff",我們可以打印 "diff" 表達式(使用 'print no1 - no2' 命令),來重新估計這個變量。gdb 告訴我們 wib 函數(shù)的這兩個自變量都等于 8,于是我們要檢查調(diào)用 wib() 函數(shù)的 main() 函數(shù),以查看這是在什么時候發(fā)生的。在允許程序自然終止的同時,我們使用 'continue' 命令告訴 gdb 繼續(xù)執(zhí)行。
(gdb) continue Continuing. Program terminated with signal SIGFPE, Arithmetic exception. The program no longer exists. |
為了查看在 main() 中發(fā)生了什么情況,可以在程序代碼中的某一特定行或函數(shù)中設(shè)置斷點,這樣 gdb 會在遇到斷點時中斷執(zhí)行。可以使用命令 'break main' 在進入 main() 函數(shù)時設(shè)置斷點,或者可以指定其它任何感興趣的函數(shù)名來設(shè)置斷點。然而,我們只希望在調(diào)用 wib() 函數(shù)之前中斷執(zhí)行。輸入 'list main' 將打印從 main() 函數(shù)開始的源碼清單,再次按回車將顯示第 21 行上的 wib() 函數(shù)調(diào)用。要在那一行上設(shè)置斷點,只需輸入 'break 21'。gdb 將發(fā)出以下響應(yīng):
(gdb) break 21 Breakpoint 1 at 0x8048428: file eg1.c, line 21. |
以顯示它已在我們請求的行上設(shè)置了 1 號斷點。'run' 命令將從頭重新運行程序,直到 gdb 中斷為止。發(fā)生這種情況時,gdb 會生成一條消息,指出它在哪個斷點上中斷,以及程序運行到何處:
Breakpoint 1, main (argc=1, argv=0xbffff954) at eg1.c:21 21 result = wib(value, div); |
發(fā)出 'print value' 和 'print div' 將會顯示在第一次調(diào)用 wib() 時,變量分別等于 10 和 6,而 'print i' 將會顯示 0。幸好,gdb 將顯示所有局部變量的值,并使用 'info locals' 命令保存大量輸入信息。
從以上的調(diào)查中可以看出,當(dāng) "value" 和 "div" 相等時就會出現(xiàn)問題,因此輸入 'continue' 繼續(xù)執(zhí)行,直到下一次遇到 1 號斷點。對于這次迭代,'info locals' 顯示了 value=9 和 div=7。
與其再次繼續(xù),還不如使用 'next' 命令單步調(diào)試程序,以查看 "value" 和 "div" 是如何改變的。gdb 將響應(yīng):
(gdb) next 22 total += result; |
再按兩次回車將顯示加法和減法表達式:
(gdb) 23 div++; (gdb) 24 value--; |
再按兩次回車將顯示第 21 行,wib() 調(diào)用。'info locals' 將顯示目前 "div" 等于 "value",這就意味著將發(fā)生問題。如果有興趣,可以使用 'step' 命令(與 'next' 形成對比,'next' 將跳過函數(shù)調(diào)用)來繼續(xù)執(zhí)行 wib() 函數(shù),以再次查看除法錯誤,然后使用 'next' 來計算 "result"。
現(xiàn)在已完成了調(diào)試,可以使用 'quit' 命令退出 gdb。由于程序仍在運行,這個操作會終止它,gdb 將提示您確認。
由于我們想要知道在調(diào)用 wib() 函數(shù)之前 "value" 什么時候等于 "div",因此在上一示例中我們在第 21 行中設(shè)置斷點。我們必須繼續(xù)執(zhí)行兩次程序才會發(fā)生這種情況,但是只要在斷點上設(shè)置一個條件就可以使 gdb 只在 "value" 與 "div" 真正相等時暫停。要設(shè)置條件,可以在定義斷點時指定 "break <line number> if <conditional expression>"。將 eg1 再次裝入 gdb,并輸入:
(gdb) break 21 if value==div Breakpoint 1 at 0x8048428: file eg1.c, line 21. |
如果已經(jīng)在第 21 行中設(shè)置了斷點,如 1 號斷點,則可以使用 'condition' 命令來代替在斷點上設(shè)置條件:
(gdb) condition 1 value==div |
使用 'run' 運行 eg1.c 時,如果 "value" 等于 "div",gdb 將中斷,從而避免了在它們相等之前必須手工執(zhí)行 'continue'。調(diào)試 C 程序時,斷點條件可以是任何有效的 C 表達式,一定要是程序所使用語言的任意有效表達式。條件中指定的變量必須在設(shè)置了斷點的行中,否則表達式就沒有什么意義!
使用 'condition' 命令時,如果指定斷點編號但又不指定表達式,可以將斷點設(shè)置成無條件斷點,例如,'condition 1' 就將 1 號斷點設(shè)置成無條件斷點。
要查看當(dāng)前定義了什么斷點及其條件,請發(fā)出命令 'info break':
(gdb) info break Num Type Disp Enb Address What 1 breakpoint keep y 0x08048428 in main at eg1.c:21 stop only if value == div breakpoint already hit 1 time |
除了所有條件和已經(jīng)遇到斷點多少次之外,斷點信息還在 'Enb' 列中指定了是否啟用該斷點??梢允褂妹?'disable <breakpoint number>'、'enable <breakpoint number>' 或 'delete <breakpoint number>' 來禁用、啟用和徹底刪除斷點,例如 'disable 1' 將阻止在 1 號斷點處中斷。
如果我們對 "value" 什么時候變得與 "div" 相等更感興趣,那么可以使用另一種斷點,稱作監(jiān)視。當(dāng)指定表達式的值改變時,監(jiān)視點將中斷程序執(zhí)行,但必須在表達式中所使用的變量在作用域中時設(shè)置監(jiān)視點。要獲取作用域中的 "value" 和 "div",可以在 main 函數(shù)上設(shè)置斷點,然后運行程序,當(dāng)遇到 main() 斷點時設(shè)置監(jiān)視點。重新啟動 gdb,并裝入 eg1,然后輸入:
(gdb) break main Breakpoint 1 at 0x8048402: file eg1.c, line 15. (gdb) run ... Breakpoint 1, main (argc=1, argv=0xbffff954) at eg1.c:15 15 value = 10; |
要了解 "div" 何時更改,可以使用 'watch div',但由于要在 "div" 等于 "value" 時中斷,那么應(yīng)輸入:
(gdb) watch div==value Hardware watchpoint 2: div == value |
如果繼續(xù)執(zhí)行,那么當(dāng)表達式 "div==value" 的值從 0(假)變成 1(真)時,gdb 將中斷:
(gdb) continue Continuing. Hardware watchpoint 2: div == value Old value = 0 New value = 1 main (argc=1, argv=0xbffff954) at eg1.c:19 19 for(i = 0; i < 10; i++) |
'info locals' 命令將驗證 "value" 是否確實等于 "div"(再次聲明,是 8)。
'info watch' 命令將列出已定義的監(jiān)視點和斷點(此命令等價于 'info break'),而且可以使用與斷點相同的語法來啟用、禁用和刪除監(jiān)視點。
在 gdb 下運行程序可以使俘獲錯誤變得更容易,但在調(diào)試器外運行的程序通常會中止而只留下一個 core 文件。gdb 可以裝入 core 文件,并讓您檢查程序中止之前的狀態(tài)。
在 gdb 外運行示例程序 eg1 將會導(dǎo)致核心信息轉(zhuǎn)儲:
$ ./eg1 Floating point exception (core dumped) |
要使用 core 文件啟動 gdb,在 shell 中發(fā)出命令 'gdb eg1 core' 或 'gdb eg1 -c core'。gdb 將裝入 core 文件,eg1 的程序清單,顯示程序是如何終止的,并顯示非常類似于我們剛才在 gdb 下運行程序時看到的消息:
... Core was generated by `./eg1'. Program terminated with signal 8, Floating point exception. ... #0 0x80483ea in wib (no1=8, no2=8) at eg1.c:7 7 result = no1 / diff; |
此時,可以發(fā)出 'info locals'、'print'、'info args' 和 'list' 命令來查看引起除數(shù)為零的值。'info variables' 命令將打印出所有程序變量的值,但這要進行很長時間,因為 gdb 將打印 C 庫和程序代碼中的變量。為了更容易地查明在調(diào)用 wib() 的函數(shù)中發(fā)生了什么情況,可以使用 gdb 的堆棧命令。
程序“調(diào)用堆棧”是當(dāng)前函數(shù)之前的所有已調(diào)用函數(shù)的列表(包括當(dāng)前函數(shù))。每個函數(shù)及其變量都被分配了一個“幀”,最近調(diào)用的函數(shù)在 0 號幀中(“底部”幀)。要打印堆棧,發(fā)出命令 'bt'('backtrace' [回溯] 的縮寫):
(gdb) bt #0 0x80483ea in wib (no1=8, no2=8) at eg1.c:7 #1 0x8048435 in main (argc=1, argv=0xbffff9c4) at eg1.c:21 |
此結(jié)果顯示了在 main() 的第 21 行中調(diào)用了函數(shù) wib()(只要使用 'list 21' 就能證實這一點),而且 wib() 在 0 號幀中,main() 在 1 號幀中。由于 wib() 在 0 號幀中,那么它就是執(zhí)行程序時發(fā)生算術(shù)錯誤的函數(shù)。
實際上,發(fā)出 'info locals' 命令時,gdb 會打印出當(dāng)前幀中的局部變量,缺省情況下,這個幀中的函數(shù)就是被中斷的函數(shù)(0 號幀)??梢允褂妹?'frame' 打印當(dāng)前幀。要查看 main 函數(shù)(在 1 號幀中)中的變量,可以發(fā)出 'frame 1' 切換到 1 號幀,然后發(fā)出 'info locals' 命令:
(gdb) frame 1 #1 0x8048435 in main (argc=1, argv=0xbffff9c4) at eg1.c:21 21 result = wib(value, div); (gdb) info locals value = 8 div = 8 result = 4 i = 2 total = 6 |
此信息顯示了在第三次執(zhí)行 "for" 循環(huán)時(i 等于 2)發(fā)生了錯誤,此時 "value" 等于 "div"。
可以通過如上所示在 'frame' 命令中明確指定號碼,或者使用 'up' 命令在堆棧中上移以及 'down' 命令在堆棧中下移來切換幀。要獲取有關(guān)幀的進一步信息,如它的地址和程序語言,可以使用命令 'info frame'。
gdb 堆棧命令可以在程序執(zhí)行期間使用,也可以在 core 文件中使用,因此對于復(fù)雜的程序,可以在程序運行時跟蹤它是如何轉(zhuǎn)到函數(shù)的。
除了調(diào)試 core 文件或程序之外,gdb 還可以連接到已經(jīng)運行的進程(它的程序已經(jīng)過編譯,并加入了調(diào)試信息),并中斷該進程。只需用希望 gdb 連接的進程標識替換 core 文件名就可以執(zhí)行此操作。以下是一個執(zhí)行循環(huán)并睡眠的 示例程序:
eg2 示例代碼
#include int main(int argc, char *argv[]) { int i; for(i = 0; i < 60; i++) { sleep(1); } return 0; } |
使用 'gcc -g eg2.c -o eg2' 編譯該程序并使用 './eg2 &' 運行該程序。請留意在啟動該程序時在背景上打印的進程標識,在本例中是 1283:
./eg2 & [3] 1283 |
啟動 gdb 并指定進程標識,在我舉的這個例子中是 'gdb eg2 1283'。gdb 會查找一個叫作 "1283" 的 core 文件。如果沒有找到,那么只要進程 1283 正在運行(在本例中可能在 sleep() 中),gdb 就會連接并中斷該進程:
... /home/seager/gdb/1283: No such file or directory. Attaching to program: /home/seager/gdb/eg2, Pid 1283 ... 0x400a87f1 in __libc_nanosleep () from /lib/libc.so.6 (gdb) |
此時,可以發(fā)出所有常用 gdb 命令??梢允褂?'backtrace' 來查看當(dāng)前位置與 main() 的相對關(guān)系,以及 mian() 的幀號是什么,然后切換到 main() 所在的幀,查看已經(jīng)在 "for" 循環(huán)中運行了多少次:
(gdb) backtrace #0 0x400a87f1 in __libc_nanosleep () from /lib/libc.so.6 #1 0x400a877d in __sleep (seconds=1) at ../sysdeps/unix/sysv/linux/sleep.c:78 #2 0x80483ef in main (argc=1, argv=0xbffff9c4) at eg2.c:7 (gdb) frame 2 #2 0x80483ef in main (argc=1, argv=0xbffff9c4) at eg2.c:7 7 sleep(1); (gdb) print i $1 = 50 |
如果已經(jīng)完成了對程序的修改,可以 'detach' 命令繼續(xù)執(zhí)行程序,或者 'kill' 命令殺死進程。還可以首先使用 'file eg2' 裝入文件,然后發(fā)出 'attach 1283' 命令連接到進程標識 1283 下的 eg2。
gdb 可以讓您通過使用 shell 命令在不退出調(diào)試環(huán)境的情況下運行 shell 命令,調(diào)用形式是 'shell [commandline]',這有助于在調(diào)試時更改源代碼。
最后,在程序運行時,可以使用 'set ' 命令修改變量的值。在 gdb 下再次運行 eg1,使用命令 'break 7 if diff==0' 在第 7 行(將在此處計算結(jié)果)設(shè)置條件斷點,然后運行程序。當(dāng) gdb 中斷執(zhí)行時,可以將 "diff" 設(shè)置成非零值,使程序繼續(xù)運行直至結(jié)束:
Breakpoint 1, wib (no1=8, no2=8) at eg1.c:7 7 result = no1 / diff; (gdb) print diff $1 = 0 (gdb) set diff=1 (gdb) continue Continuing. 0 wibed by 16 equals 10 Program exited normally. |
GNU 調(diào)試器是所有程序員工具庫中的一個功能非常強大的工具。在本文中,我只介紹了 gdb 的一小部分功能。要了解更多知識,建議您閱讀 GNU 調(diào)試器手冊。
- 您可以參閱本文在 developerWorks 全球站點上的 英文原文.
- GNU 調(diào)試器手冊
- 調(diào)試會話示例的 源代碼。
- 連接示例的 源代碼。