Skip to content

NVDIA 相关命令

设置Persistence Mode

sudo nvidia-smi -pm 1

设置功率与频率上限

sudo nvidia-smi -pl 280  # 限制显卡功率至280w
sudo nvidia-smi -lgc 300,1500 # 限制显卡频率范围
sudo nvidia-smi -rgc # 恢复设置

Tips

注意这些配置重启后会失效,要想重启后自动保存,可以写一个脚本并设置为开机启动

提取log

Nvidia论坛中提问可能用到

sudo nvidia-bug-report.sh
nvidia-debugdump --list

查看连接到服务器的 NVIDIA 设备

$ lspci | grep -i vga

查看在线显卡的 PCI Bus 地址

$ nvidia-smi -a | grep -i bus

查看特定 Bus Id 上的设备详细信息

$ sudo lspci -vv -s 3e:00.0

查看物理插槽的信息

在这里我们要使用 dmidecode 命令。使用该命令可以查询BIOS、系统、主板、处理器、内存、缓存等非常重要信息。

使用下面的命令打印 System Slot Information,也就是加上参数 -t 9

$ sudo dmidecode -t 9

其中 ID 对应插槽编号:

Tips

注意PCI SLOT 编码可能从1开始也可能从0开始,我遇到的情况是从1开始编号,参考资料2中从0开始编号**

我们也可以用下面的命令打印插槽与 PCI Bus 地址的对应关系:

$ sudo dmidecode -t 9 |awk '/ID:/ {id=$2} /Bus Address/ {print "Slot",id,"PCIe",$3}'