Intel CPU的BUG导致reboot起不来
admin 10年前 (2015-02-21) 4695浏览 0评论
这个BUG是我去年11月撞见的,早该写出来了。因为这个BUG造成的灾难后果远远超出我的想像。 当时的现象是某些机器重启后起不来,/var/log/message中有这样的信息: Nov 15 03:46:09 kernel: INFO: task s...
admin 10年前 (2015-02-21) 4695浏览 0评论
这个BUG是我去年11月撞见的,早该写出来了。因为这个BUG造成的灾难后果远远超出我的想像。 当时的现象是某些机器重启后起不来,/var/log/message中有这样的信息: Nov 15 03:46:09 kernel: INFO: task s...
admin 10年前 (2014-11-14) 7268浏览 0评论
故障描述: 报告某服务器出现故障,测试发现ssh和ping均不通,尝试ILO连接也失败(网页打不开)。 在准备使用ipmitool命令重启服务器时,服务器恢复正常,能够ssh登录。发现服务器前几分钟自动重启了。 为了尽快恢复故障,首先将应用服务启动起...
admin 11年前 (2014-06-17) 10444浏览 0评论
有时候nginx运行很正常,但是会发现错误日志中依旧有报错connect() failed (111: Connection refused) while connecting to upstream. 一般情况下我们的upstream都是fastc...
admin 12年前 (2013-01-09) 11611浏览 0评论
一影院反应linux服务器总有时候自己重启,发生故障有2-3天了。接到反应之后 登录到服务器 开始排查 主板温度 CPU 温度 内存利用 等等都很正常。开始检查日志。 检查 last server $> last 正常重启的 会有 down 字...