1. 云期刊首页
  2. 运维教程

Linux 系统的服务器带宽和CPU占用100%或跑高排查处理方法

使用云服务器 ECS 时,若出现服务的速度变慢,或 ECS 实例突然断开,可以考虑服务器带宽和 CPU 是否有跑满或跑高的问题。本教程以 CentOS 6.5 64 位操作系统中服务器带宽和CPU占用100%或跑高为例进行讲解。其它类型及版本操作系统配置可能有所差异,视具体情况排查处理。

如果您怀疑服务器被CC攻击了,请看教程:网页打开缓慢或打不开,您可能正在被CC攻击

如果您是windows系统的服务器,请看教程:Windows系统的服务器带宽和CPU占用100%或跑高排查处理方法

CPU 跑满或跑高的问题定位

若云服务器 ECS 的 CPU 持续跑高,会对系统的稳定性和业务运行造成影响。Linux 系统下,查看进程的常用命令如下:

  • ps -aux
  • ps -ef
  • top

Linux 系统中,通常使用 top 命令来查看系统的负载问题,并定位耗用较多 CPU 资源的进程。

操作步骤

  1. 通过控制台管理终端连接到 ECS 实例。说明:资源负载异常时,通常无法通过 SSH 进行远程连接,建议您通过控制台管理终端进行连接。
  2. 通过 top 命令查看系统当前的运行情况。
    1. top – 17:27:13 up 27 days, 3:13, 1 user, load average: 0.02, 0.03, 0.05
    2. Tasks: 94 total, 1 running, 93 sleeping, 0 stopped, 0 zombie
    3. %Cpu(s): 0.3 us, 0.1 sy, 0.0 ni, 99.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.1 st
    4. KiB Mem: 1016656 total, 946628 used, 70028 free, 169536 buffers
    5. KiB Swap: 0 total, 0 used, 0 free. 448644 cached Mem
    6. PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
    7. 1 root 20 0 41412 3824 2308 S 0.0 0.4 0:19.01 systemd
    8. 2 root 20 0 0 0 0 S 0.0 0.0 0:00.04 kthreadd

    针对负载问题,您只需关注回显的第一行和第三行信息,详细说明如下。

  • top 命令的第一行显示的内容 17:27:13 up 27 days, 3:13, 1 user, load average: 0.02, 0.03, 0.05 依次为 系统当前时间 、系统到目前为止已运行的时间当前登录系统的用户数量系统负载,这与直接执行 uptime 命令查询结果一致。
  • top 命令的第三行会显示当前 CPU 资源的总体使用情况,下方会显示各个进程的资源占用情况。

1、通过字母键 P,可以对 CPU 使用率进行倒序排列,进而定位系统中占用 CPU 较高的进程。

说明:通过字母键 M, 您可以对系统内存使用情况进行排序。如果有多核 CPU,数字键 1 可以显示每核 CPU 的负载状况。

2、通过 ll /proc/PID/exe 可以查看每个进程 ID 对应的程序文件。

CPU 跑满或跑高的分析处理

CPU 的跑满或跑高,在确认具体的进程结果后,针对异常的进程,您需要通过 top 命令将其终止;而对于 kswapd0 进程导致的内存不足等问题,您需要对系统进行规格的升级或程序的优化。

使用 top 直接终止 CPU 消耗较大的进程

您可以直接在 top 运行界面快速终止相应的异常进程。操作步骤如下:

1、若您想要终止某个进程,只需按下小写的 k 键。

2、输入想要终止的进程 PID (top 输出结果的第一列)。例如,若您想要终止 PID 为 86 的进程,输入 86 后按回车即可。

3、操作成功后,界面会出现类似 Send pid 86 signal [15/sigterm] 的提示信息。按回车确认即可。

kswapd0 进程占用导致 CPU 较高

操作系统都用分页机制来管理物理内存,系统会把一部分硬盘空间虚拟成内存使用。由于内存的速度要比磁盘快得多,所以系统要按照某种换页机制将不需要的页面换到磁盘中,将需要的页面调到内存中。

kswapd0 是虚拟内存管理中负责换页的进程,当服务器内存不足的时候 kswapd0 会执行换页操作,这个换页操作是十分消耗主机 CPU 资源的。操作步骤如下:

1、通过 top 命令查看 kswapd0 进程。

2、检查该进程是否持续处于非睡眠状态,且运行时间较长。若是,可以初步判定系统在持续地进行换页操作,kswapd0 进程占用了系统大量 CPU 资源。

1

3、您可以通过 free 、ps 等指令进一步查询系统及系统内进程的内存占用情况,做进一步排查分析。

4、针对系统当前内存不足的问题,您可以重启 Apache,释放内存。

说明:从长远的角度来看,您需要对内存进行升级。

带宽跑满或跑高的分析处理

对于正常进程导致的带宽跑满或跑高的问题,需要对服务器的带宽进行升级。对于异常进程,有可能是由于恶意程序问题,或者是部分 IP 恶意访问导致,也可能是服务遭到了 CC 攻击。

通常情况下,您可以使用 iftop 工具或 nethogs 查看流量的占用情况,进而定位到具体的进程。

使用 iftop 工具排查

1、在服务器内部安装 iftop 流量监控工具。

yum install iftop -y
2

2、服务器外网带宽被占满时,如果通过远程无法登陆,可通过阿里云终端管理进入到服务器内部,运行下面命令查看流量占用情况:

iftop -i eth1 -P

注意:-P 参数将会显示请求端口。执行 iftop -i eth0 -P 命令,可以查看通过服务器哪个端口建立的连接,以及内网流量。举例如下:

3

在上图中,您可以查看到流量高耗的是服务器上 53139 端口和 115.205.150.235 地址建立的连接。

3、执行 netstat 命令反查 53139 端口对应的进程。

netstat -tunlp |grep 53139

4

4、经反查,服务器上 vsftpd 服务产生大量流量,您可以通过停止服务或使用 iptables 服务来对指定地址进行处理,如屏蔽 IP 地址或限速,以保证服务器带宽能够正常使用。

使用 nethogs 进行排查

1、在服务器内部安装 nethogs 流量监控工具。

yum install nethogs -y

2、通过 nethogs 工具来查看网卡上进程级的流量信息,若未安装可以通过 yum、apt-get 等方式安装。举例如下:

  • 若 eth1 网卡跑满,执行命令 nethogs eth1。
  • 查看每个进程的网络带宽情况以及进程对应的 PID。
  • 确定导致带宽跑满或跑高的具体进程。5

3、若进程确定是恶意程序,可以通过执行 kill -TERM <PID> 来终止程序。

说明: 如果是 Web 服务程序,您可以使用 iftop 等工具来查询具体 IP 来源,然后分析 Web 访问日志是否为正常流量。日志分析可以使用 logwatch 或 awstats 等工具进行。

使用 Web 应用防火墙防御 CC 攻击

若您的服务遭受了 CC 攻击,请在 Web 应用防火墙控制台尽快开启 CC 安全防护。

  1. 登录 Web应用防火墙 控制台。
  2. 在 CC 安全防护中,启动状态按钮,并在模式中选择 正常6

云期刊旨在收集阿里云、腾讯云、百度云等云计算产品的行业资讯,最新优惠信息,提供代金券、优惠券领取,让用户以最低的价格购买服务器,享受优质的产品服务。云期刊提供免费服务器购买咨询,科技前沿资讯,互联网行业动态,软件开发及服务器运维教程,竭全力为用户提供优质服务。点击查看更多内容

本站所有内容,如有版权、侵权等问题,请及时联系本站做删除。发布者:云期刊,转载请注明出处:www.yunqikan.cn

发表评论

电子邮件地址不会被公开。 必填项已用*标注

联系我们

400-100-6858

在线咨询:点击这里给我发消息

邮件:drhxxkj@163.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code