监控 CPU、内存和 GPU 使用情况的最佳命令行工具
目录
- 1 HTOP — CPU, RAM
- 2 Glances — CPU, RAM, Disk I/O
- 3 Sensors — CPU(带温度)
- 4 Nvidia SMI — GPU
如果你现在认真做任何数据驱动的事情,那么强大的PC是必须拥有的。数据科学往往需要很多RAM,强化学习喜欢吃掉CPU,深度学习吞噬GPU。
在处理十分消耗资源的应用程序时,了解您的PC是否正在高效使用非常重要。
- 你的算法是否在CPU上遇到瓶颈?它可以使用更多核心吗?
- 你有足够的内存或你的内存使用量溢出到swap中(磁盘内存,非常慢)吗?
- 你的CPU或GPU运行得太热吗?英特尔CPU和Nvidia GPU在加热到一定温度后会受到速度限制
所有这些问题都需要考虑,因为它们会影响您处理数据科学和AI项目的速度。当您能够确切地看到您的软件使用了多少CPU,RAM和GPU时,由于您确切知道瓶颈的来源,因此更容易实现您的需求。
以下是用于监控CPU,RAM和GPU使用情况的4种最佳命令行工具的列表和展示。您可以将它们与进程并行使用,以查看其消耗和优化的资源(或仅升级您的PC)!
1 HTOP — CPU, RAM
HTOP是一个基于命令行的交互式系统监视器,用于查看PC上的运行进程。你可以把它想象成系统监视器GUI,唯一的优势:它在命令行上并用颜色编码!
在htop
输出的最顶部,您将看到每个CPU内核的百分比使用率,以及RAM和交换内存的总使用量。这非常适合查看您的程序是否正在使用所有内核以及多少内核。你也可以看看你是否达到了内存上限。
在此之下,htop
显示每个正在运行的进程的CPU,RAM和交换内存使用情况。它还会显示用于启动进程的命令。如果一个进程有多个线程,那么这些线程的RAM使用率被组合在一起,而CPU使用率是基于每个线程计算的,就像上面使用python3 main.py
的图片一样。
您可以使用简单的apt
命令安装htop
:
sudo apt install htop
然后在命令行输入htop
并按Enter
键运行它!
2 Glances — CPU, RAM, Disk I/O
Glances是一个用Python开发的免费软件,可用于监控系统的总CPU,RAM和磁盘I/O。
就像 htop 一样,您将看到系统上每个进程的总CPU和RAM使用情况。使用 glances 的好处是你可以看到很多硬盘/磁盘信息:
- 每个进程在那个磁盘上运行(最左侧)
- 有关每个磁盘的总容量和使用情况的信息(最左侧)
- 每秒对磁盘的读写大小,以字节为单位。这非常适合检查您的磁盘速度是否有瓶颈,因为HDD和SSD具有最大的读/写速度。
- 更详细的RAM统计信息,包括缓冲区和缓存
此外,统计信息可以自动写入磁盘或发送到远程服务器。
您可以使用简单的apt命令安装glances:
sudo apt install glances
然后在命令行中输入glances
并按下Enter键来运行它!
3 Sensors — CPU(带温度)
到目前为止,HTOP和Glances能够让我们深入了解CPU使用率,RAM和磁盘I/O,这对于发现任何瓶颈和提高代码效率都很重要。
但是热量怎么样?
像英特尔这样的CPU制造商在其处理器中建立了安全功能。如果CPU温度超过某个限制,其速度会受到限制以避免过热。
这可能会破坏程序的速度!我们可以看看htop,看到100%的CPU使用率并且认为一切都很好。与此同时,我们的CPU速度受到限制,更不用说对组件本身的物理损坏了。
要监视CPU的温度,可以使用名为Sensors的工具。
首次安装时,传感器将检测每个相关设备(处理器,风扇等)并准备测量温度。运行后,传感器应用程序可以测量每个CPU核心的温度以及所有风扇的速度。看看下面的输出!
使用下面的命令安装sensors
:
sudo apt-get install lm-sensors
然后检测所有设备,如下所示:
sudo sensors-detect
最后运行sensors以密切关注CPU的温度!
watch sensors
4 Nvidia SMI — GPU
最后,我们进入GPU!
与CPU类似,在GPU上测量的最重要的事情是使用情况和温度。幸运的是,我们可以使用单一工具进行这两项测量。
Nvidia有自己的工具来测量其GPU的使用和温度,称为Nvidia SMI;SMI代表系统管理界面。nvidia-smi工具在Linux上配备了NVIDIA GPU显示驱动程序,因此一旦你正确安装了GPU,你就可以开始使用它了。要运行它,只需输入watch nvidia-smi
并按Enter键。查看下面的示例输出!
如您所见,nvidia-smi向我们提供了许多有用的信息:
- GPU内存使用量(MB)
- 以瓦特为单位的GPU功耗
- GPU温度,以摄氏度为单位
- GPU风扇速度百分比
除了这些硬件统计信息之外,我们还获得了使用GPU的每个进程的列表,它们各自的内存使用情况,以及类型:C表示计算,G表示图形(显示)。
推荐阅读
-
监控 CPU、内存和 GPU 使用情况的最佳命令行工具
-
监控 CPU 负载、温度、内存和网络的 Raspberry Pi 工具 htop、速度计和 s-tui
-
实用的命令行工具指南:深入理解jps、jstack、jmap、jhat、jstat与hprof JVM 性能优化与监控方法" - jps: Java虚拟机进程状态工具 - 全面解读 - jstack: 一步步掌握堆栈跟踪工具 - 实战解析 - jmap & jhat: 内存映射与Java堆分析利器 - 详解篇 - jstat: JVM性能统计与监测工具 - 使用详解 - hprof: 堆/CPU性能剖析工具 - 深入学习指南
-
玩转Java底层:JMX详解 - jconsole与自定义MBean监控工具的实际应用与区别" 在日常JVM调优中,我们熟知的jconsole工具通过JMX包装的bean以图形化形式展示管理数据,而像jstat和jmap这类内建监控工具则由JVM直接支持。本文将以jconsole为例,深入讲解其实质——基于JMX的MBean功能,包括可视化界面上的bean属性查看和操作调用。 MBeans在jconsole中的体现是那些可观察的组件属性和方法,如上图所示,通过名为"Verbose"的属性能看到其值为false,同时还能直接操作该bean的方法,例如"closeJerryMBean"。 尽管jconsole给我们提供了直观的可视化界面,但请注意,这里的MBean并非固定不变,开发者可根据JMX提供的接口将自己的自定义bean展示到jconsole。以下步骤展示了如何创建并注册一个名为"StudyJavaMBean"的自定义MBean: 1. 首先定义接口`StudyJavaMBean`,接口需遵循MBean规范,即后缀为"MBean"且包含getter方法代表属性,如`getApplicationName`,和无返回值的setter方法代表操作,如`closeJerryMBean`。 ```java public interface StudyJavaMBean { String getApplicationName(); void closeJerryMBean(); } ``` 2. 编写接口的实现类`StudyJavaMBeanImpl`,实现接口中的方法: ```java public class StudyJavaMBeanImpl implements StudyJavaMBean { @Override public String getApplicationName() { return "每天学Java"; } @Override public void closeJerryMBean() { System.out.println("关闭Jerry应用"); } } ``` 3. 在代码中注册自定义MBean,涉及的关键步骤包括: - 获取平台MBeanServer - 定义ObjectName,指定唯一的MBean标识符 - 注册MBean到服务器 - 启动RMI连接器服务,以便jconsole能够访问 ```java public void registerMBean() throws Exception { // ... 具体实现省略 ... } ``` 实际运行注册后的MBean,您将在jconsole中发现并查看自定义bean的属性和调用相关方法。然而,这种方式相较于传统的属性/日志查看和HTTP接口,实用性相对有限,可能存在潜在的安全风险。但不可否认的是,JMX及其MBean机制对于获取操作系统信息、内存状态等关键性能指标仍然具有重要价值。例如: 1. **获取操作系统信息**:通过JMX MBean,可以直接获取到诸如CPU使用率、操作系统版本等系统级信息,这对于资源管理和优化工作具有显著帮助。
-
Linux下监控CPU和GPU温度的三款命令行工具