Linux下调试core dump的方式
这篇文章主要介绍"Linux下调试core dump的方式",在日常操作中,相信很多人在Linux下调试core dump的方式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Linux下调试core dump的方式"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
什么是core dump
对于程序,由于各种异常或者 bug,导致在运行过程中,并且在满足一定条件下,产生一个叫做 core 的文件。
通常情况下,core 文件会包含了,程序运行时的内存,寄存器状态,堆栈指针,内存管理信息还有各种函数调用堆栈信息等。
许多程序出错的时候,会产生一个 core 文件。通过工具分析这个文件,我们可以定位到,程序异常退出的时候对应的堆栈调用等信息。
打开 core dump 开关:ulimit -c unlimited
看一段有问题的代码:
#includeint main() { int *p=NULL; *p=0; printf("bad\n"); return 0; }
linux下编译和执行:
[root@VM-16-9-centos c++]# g++ -g main.cpp [root@VM-16-9-centos c++]# ./a.out Segmentation fault (core dumped) [root@VM-16-9-centos c++]# ls a.out core.1989 main.cpp
上述代码一看就有错误,执行会产生 core dump。但是在大型项目中,用肉眼就很难看了。下面说明一下 linux 下调试 core dump 方法。
dmesg+addr2line调试
先介绍 2 个 linux 命令:
dmesg ,一种程序,用于检测和控制内核缓冲。程序用来帮助用户,了解系统的启动信息,可以获得出错堆栈地址。
addr2line ,可以将指令的地址和可执行映像转换成文件名,函数名或源代码的工具。这种功能将跟踪地址转换成更有意义的内容来说很有用。
在调用 addr2line 工具时,要使用 -e 选项来指定可执行映像,使用 -f 选项可以告诉工具输出函数名。
linux下操作过程:
[root@VM-16-9-centos c++]# dmesg | grep a.out [ 212.330289] a.out[1946]: segfault at 0 ip 0000000000400571 sp 00007ffdf0aafbb0 error 6 in a.out[400000+1000] [ 227.437065] a.out[1989]: segfault at 0 ip 0000000000400571 sp 00007ffcfd01c8c0 error 6 in a.out[400000+1000] [root@VM-16-9-centos c++]# [root@VM-16-9-centos c++]# addr2line -e a.out 0000000000400571 /root/c++/main.cpp:6
先通过dmesg找到对应出错的地址,再用 addr2line -e 将地址解析到对应的代码行。
gdb调试
gdb 想必大家都有听说,Linux 下面一款常用的的调试工具。
gdb 编译器通常以 gdb 命令的形式在终端中使用,下面学习下常用调试选项。
bt :查看堆栈信息
i locals :查看当前程序栈的局部变量
i args :查看当前程序栈的参数
i catch :查看当前程序中栈帧的异常处理器
p a :打印变量的值
i register :查看当前寄存器的值
r :从运行程序至第一个断点,没有断点则一直运行完
quit :退出
gdb调试过程中,输入 r ,bt。r 是运行 a.out 文件,bt查看堆栈情况。
我们不需要执行 gdb a.out,这样就相当于重新运行了 a.out 文件。然而在实际开发中,有很多问题都是概率发生的,所以此方法不太实用。
linux下操作过程(省略部分 gdb 介绍信息):
[root@VM-16-9-centos c++]# gdb a.out core.1989 Reading symbols from /root/c++/a.out...done. [New LWP 1989] bCore was generated by `./a.out'. Program terminated with signal 11, Segmentation fault. #0 0x0000000000400571 in main () at main.cpp:6 6 *p=0; Missing separate debuginfos, use: debuginfo-install glibc-2.17-307.el7.1.x86_64 libgcc-4.8.5-44.el7.x86_64 libstdc++-4.8.5-44.el7.x86_64 (gdb) bt #0 0x0000000000400571 in main () at main.cpp:6 (gdb)
直接执行 gdb a.out core.1989,不用 r 命令避免程序重复执行。使用 bt 命令,可以看到程序出错代码行。
strace+addr2line调试
strace 是一个集诊断、调试、统计与一体的工具,我们可以使用strace,对应用的系统调用和信号传递的跟踪结果,来对应用进行分析,以达到解决问题,或者是了解应用工作过程的目的。
strace 的简单的用法就是,执行一个指定的命令,在指定的命令结束之后,它也就退出了。
在命令执行的过程中,strace 会记录和解析命令进程的所有系统调用,以及这个进程所接收到的,所有的信号值。
-c ,统计每一系统调用的所执行的时间,次数和出错的次数等
-p ,指定进程pid
-i ,输出系统调用的入口指针
linux 下操作过程(省略部分加载信息):
[root@VM-16-9-centos c++]# strace -i ./a.out [00007f79d3573847] munmap(0x7f79d3772000, 31038) = 0 [0000000000400571] --- SIGSEGV {si_signo=SIGSEGV, si_code=SEGV_MAPERR, si_addr=NULL} --- [????????????????] +++ killed by SIGSEGV (core dumped) +++ Segmentation fault [root@VM-16-9-centos c++]# addr2line -e a.out 0000000000400571 /root/c++/main.cpp:6
到此,关于"Linux下调试core dump的方式"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!