Intel CPU的BUG导致reboot起不来
admin 10年前 (2015-02-21) 4712浏览 0评论
这个BUG是我去年11月撞见的,早该写出来了。因为这个BUG造成的灾难后果远远超出我的想像。 当时的现象是某些机器重启后起不来,/var/log/message中有这样的信息: Nov 15 03:46:09 kernel: INFO: task s...
admin 10年前 (2015-02-21) 4712浏览 0评论
这个BUG是我去年11月撞见的,早该写出来了。因为这个BUG造成的灾难后果远远超出我的想像。 当时的现象是某些机器重启后起不来,/var/log/message中有这样的信息: Nov 15 03:46:09 kernel: INFO: task s...
admin 10年前 (2014-12-09) 4181浏览 0评论
久闻systemtap工具的大名,之前也断断续续的看过它的介绍,并且利用CentOS发行版自带的systemtap相关命令试用过几次,感觉还算不错。本文将介绍一下systemtap的安装,以及对应用程序的追踪示例,不过,在此之前,先描述一下syste...
admin 10年前 (2014-11-14) 4110浏览 0评论
一. 安装包: 1. crash(通过yum安装) 2. kernel-debuginfo-2.6.32-358.el6.x86_64.rpm 3. kernel-debuginfo-common-x86_64-2.6.32-358.el6.x86_...
admin 10年前 (2014-11-14) 7290浏览 0评论
故障描述: 报告某服务器出现故障,测试发现ssh和ping均不通,尝试ILO连接也失败(网页打不开)。 在准备使用ipmitool命令重启服务器时,服务器恢复正常,能够ssh登录。发现服务器前几分钟自动重启了。 为了尽快恢复故障,首先将应用服务启动起...
admin 11年前 (2014-07-01) 3458浏览 0评论
最近测试一个应用遇到问题:一旦压力略涨,应用的CPU就顶满。由于是多线程应用,直接就把系统的CPU耗完了。 本来想用gdb來调试的,结果gdb不给力,就在attach那里卡死,半天不动。后来想到了用perf来调试,果然找到了一处性能热点。修复热点以后...
admin 11年前 (2013-09-23) 3432浏览 0评论
简单说,strace是可以跟踪一个程序在做什么的命令。 一 它可以监控某个要执行的命令,比如平时最常见的ls命令: [root@localhost a]# strace ls execve(“/bin/ls”, [“...