[说清楚，说清楚！正常运行时间查看系统负载

最编程 2024-03-08 16:14:50

...

目录： （一）查看系统负载（二）uptime类比（三）系统负载的经验法则

（一）查看系统负载 (1.1)如果你的电脑很慢，或许你想查看一下，它的工作量是否太大了。在Linux系统中，我们一般使用uptime命令查看，我们在终端输入uptime命令，系统会返回一行信息。 (1.2)在图1-1这行信息的开始部分，其中第一个“10:17:35”表示的是当前时间；第二个“up 8 min”表示系统运行时间，说明此服务器连续运行了8分钟了；“2 users”表示当前系统登陆用户数。 (1.3)在图1-1这行信息的后半部分，显示“load average”，它的意思是系统的平均负载即任务队列的平均长度，后面有三个数字，我们可以从中判断系统负载是属于大还是属于小。而load average后的三个数字分别表示的是1分钟、5分钟、15分钟内系统的平均负载。当CPU完全空闲的时候，平均负载为0，当CPU工作量饱和的时候，平均负载为1，那么狠显然，load average的值越低，比如等于0.2或0.3，就说明电脑的工作量越小，系统负载比较轻。

（二）uptime类比 (2.1)判断系统负载是否过重，必须理解load average的真正含义。首先，我们假设最简单的情况，你的电脑只有一个CPU，所有的运算都必须由这个CPU来完成，那么我么可以把这个CPU想象成一座大桥，桥上只有一根车道，所有车辆都必须从这根车道上通过。系统负荷为0.0，意味着大桥上一辆车也没有；系统的负荷为0.5，意味着大桥上一半的路段有车；系统的负荷为1.0，意味着大桥上的所有路段都有车，也就是说大桥已经“满”了，但是必须注意的是，知道此时大桥还是能顺畅通行的；系统的负荷为1.7，意味着车辆太多了，大桥已经被占满了（100%），后面等着上桥的车辆为桥面车辆的70%。 (2.2)以此类推，系统负荷是2.0，意味着等待上桥的车辆与桥面的车辆一样多；系统的负荷是3.0，意味着等待上桥的车辆是桥面车辆的2倍。总之，当系统负荷大于1，后面的车辆就必须等待了，系统负荷越大，过桥等待的时间就越长。

（三）系统负载的经验法则 (3.1)1.0是系统负载的理想值吗？不一定，系统管理员往往会留有一点余地，当这个值达到0.7，就应当引起注意了，经验法则是这样的：当系统负载持续大于0.7，就要开始调查了，问题出在哪里，防止情况恶化；当系统负载持续大于1.0，你就必须手动寻找解决办法，把这个值降下来；当系统负载达到5.0，就表明你的系统有很严重的问题，长时间没有响应，或者接近死机了，你不应该让系统达到这个值。注意：此处的描述是经验值，如果服务器的CPU为1核心，则load average中的数值>=3则判断负载过高；如果服务器的CPU为4核心，则load average中的数值>=12则判断负载过高。即单核心，1分钟的系统平均负载不要超过3就可以，这个是经验值。 (3.2)芯片厂商往往在一个CPU内部，包含多个CPU核心，这被称为多核CPU。在系统负载方面，多核CPU与多CPU的效果类似，所以考虑系统负载的时候，必须要考虑这台主机有几个CPU，每个CPU有几个核心，然后把系统负载除以总的核心数即可。一般我们是通过以下的方式来查看主机的CPU核心数的： # cat /proc/cpuinfo---查看CPU的信息 # grep -c 'model name' /proc/cpuinfo---返回CPU的总核心数 (3.3)系统中load average一共返回三个平均值：1分钟系统负载、5分钟系统负载、15分钟系统负载。我们应该参考哪个值呢？如果只有1分钟的系统负载大于1.0，其他两个时间段都小于1.0，这表明只是暂时现象，问题不大；如果15分钟内，平均系统负载大于1.0，表明问题持续存在，不是暂时现象。所以，我们应该主要观察15分钟系统负载，将它作为电脑正常运行的指标。

—————— 本文至此结束，感谢阅读 ——————

上一篇：经典负载平衡器的实际操作演示。

下一篇： Xilinx® 7 系列 FPGA CLB 特色 (II)