博客 云MSP服务案例:某客户生产服务器CPU异常抖动

云MSP服务案例:某客户生产服务器CPU异常抖动

   数栈君   发表于 2023-02-15 10:45  296  0


问题背景


某日袋鼠云运维小哥进行例行运维巡检,通过监控视图发现客户应用服务器cpu使用率突然呈上升趋势。过专属服务群第一时间与业务方联系,与业务方确认是否有正在执行的定时任务,或者大范围拉取账单等业务操作。然而仔细分析了业务日志后,确认当时业务上并没有进行会消耗大量计算资源和网络资源的操作。


异常现象:

随着时间推移,运维人员收到不同应用系统主机系统资源占用过高的告警通知,但客户反馈业务上并没有受到明显影响,且处于业务低峰期。

进一步分析排查,发现异常实例cpu使用率,负载,网络流量,磁盘IO,TCP连接数都先后出现上升趋势,现象如下图:


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/feeb0c235ed8f20f5f04ca821f71a100..jpg

CPU使用率:持续10分钟维持在90%


系统平均负载:平均1分钟负载超过25


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/767cb5c561ffa7229a989e6bb15ed9b1..jpg

网络流量:持续10分钟高于日常水平


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/7be665753ee98d2f840f02ac49f2d873..jpg

磁盘IO:每秒写入的字节数迅速上升


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/912f183466ab32315ad4da188be69a56..jpg

TCP 连接数:established连接数持续10分钟上升


异常分析:

1) 在排除业务上并没有相关的异常操作后,运维人员进一步分析了系统是否有受到外部攻击通过阿里云云盾安全产品,确认基线检查及流量检测并无异常业务入口SLB入流出流也呈正常趋势可以排除受到外部攻击的可能


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/780de187b568c9aec02d9de4f609a1eb..jpg


2) 运维人员登录机器继续排查,连接服务器间接出现请求被拒绝的情况,提示connection reset by peer错误信息。


成功登入机器后发现有大量ssh登入链接。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/1edd9d488d33e615cb84db2f88684b3e..jpg


大量的sshd进程引起cpu占用过高。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/555e9165f90ffb27a7877cfbedaa2efe..jpg


异常处理:

经过上述分析,与业务方确认ssh 连接客户端是否为内部系统IP地址,最终定位异常实例被内网其他机器恶意破解,进行非法访问入侵。运维人员第一时间对异常实例进行恢复操作,包括关闭已建立的连接,清除可疑执行程序,修改sshd服务默认端口,重置服务器登录密码,调整安全组访问策略,检查服务器是否有其它后门等一些列安全加固操作后,主机性能恢复正常。



案例总结


从服务器安全防护的角度出发,应将业务部署在云上隔离的网络环境,并修改默认远程服务监听端口,按需开放安全组访问限制。如果业务部署早期未做相关规划,建议尽快迁移经典网络下的服务器到专有网络环境,同时需要定期对服务器进行体检及安全检查,以确保服务器安全。


  • 袋鼠云在大数据领域深耕7年,拥有丰富的大数据平台建设经验和成熟的产品体系,想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

    同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
下一篇:
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群