딥러닝

UMA node read from SysFS had negative value (-1)

ufris 2022. 1. 7. 10:47

successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero

 

gpu를 사용해 tensorflow를 돌릴 때 위와 같은 warning이 뜰 때가 있습니다

 

이에 대한 해결 방법은 우선 노드를 확인합니다

 

$ lspci | grep -i nvidia

$ /sys/bus/pci/devices

$ cat /sys/bus/pci/devices/0000\:06\:00.0/numa_node

빨간색 부분이 노드를 확인할 때 체크한 숫자와 매칭이 됩니다(빨간색 박스 부분)

 

노드와 연결이 되어 있지 않으면 -1로, 연결되어 있다면 0으로 프린트가 됩니다

 

$ echo 0 | sudo tee -a /sys/bus/pci/devices/0000\:06\:00.0/numa_node

위를 실행해 노드를 연결 시켜줍니다

 

$ cat /sys/bus/pci/devices/0000\:06\:00.0/numa_node

후에 다시 확인해보면 -1이었던 것이 0으로 바뀐 것을 볼 수 있습니다