记一次服务器故障遇到的坑

本文记录一次服务器排错操作和遇到的坑,为了之后遇到相同问题能快速解决。

今天一开发同事找到我说一台机器ubuntu的系统,从昨天下午开始SSH连接就一直断断续续的,严重影响工作。

试着通过SSH去连机器,果然一连上立马被断开,信息是the remote system refused the connection。第一个感觉是SSH出了问题;于是找了台和问题机器相同网段的机器去连,而一切正常。这就奇怪了,相同网段的没有问题,而不同网段的去连则会马上被断开。

按照以往的经验开始对路由、防火墙、SSH配置文件进行一一排查,结果都正常,而问题依然存在。这时我还绞尽脑汁继续围绕着SSH的问题排查,越发感觉自己遇到了假服务器。

这时开发同事的一句话提醒了我,“不止是SSH不行,而机器上的所有端口都不通”;立马意思到之前排除的方向都不对,有可能是机器IP冲突问题。立马找了个新IP替换了问题机器的IP,结果一切恢复正常。

那么到底是谁用了这个IP导致IP冲突呢,可以在同一网段的机器里使用arp-scan命令来查找,我之前也写过一篇文章《在Linux中发现IP地址冲突的方法》。

weinxin
聂扬帆博客
一个分享IT运维相关工作经验和实战技巧的个人博客

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: