亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

py3nvml實現GPU相關信息讀取的示例分析

發布時間:2022-01-17 11:13:22 來源:億速云 閱讀:129 作者:柒染 欄目:開發技術

py3nvml實現GPU相關信息讀取的示例分析,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

    在深度學習或者其他類型的GPU運算過程中,對于GPU信息的監測也是一個非常常用的功能。如果僅僅是使用系統級的GPU監測工具,就沒辦法非常細致的去跟蹤每一步的顯存和使用率的變化。如果是用profiler,又顯得過于細致,而且環境配置、信息輸出和篩選并不是很方便。此時就可以考慮使用py3nvml這樣的工具,針對于GPU任務執行的過程進行細化的分析,有助于提升GPU的利用率和程序執行的性能。

    技術背景

    隨著模型運算量的增長和硬件技術的發展,使用GPU來完成各種任務的計算已經漸漸成為算法實現的主流手段。而對于運行期間的一些GPU的占用,比如每一步的顯存使用率等諸如此類的信息,就需要一些比較細致的GPU信息讀取的工具,這里我們重點推薦使用py3nvml來對python代碼運行的一個過程進行監控。

    常規信息讀取

    一般大家比較常用的就是nvidia-smi這個指令,來讀取GPU的使用率和顯存占用、驅動版本等信息:

    $ nvidia-smi
    Wed Jan 12 15:52:04 2022
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.42.01    Driver Version: 470.42.01    CUDA Version: 11.4     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  Quadro RTX 4000     On   | 00000000:03:00.0  On |                  N/A |
    | 30%   39C    P8    20W / 125W |    538MiB /  7979MiB |     16%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    |   1  Quadro RTX 4000     On   | 00000000:A6:00.0 Off |                  N/A |
    | 30%   32C    P8     7W / 125W |      6MiB /  7982MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |    0   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                412MiB |
    |    0   N/A  N/A      2940      G   /usr/bin/gnome-shell               76MiB |
    |    0   N/A  N/A     47102      G   ...AAAAAAAAA= --shared-files       35MiB |
    |    0   N/A  N/A    172424      G   ...AAAAAAAAA= --shared-files       11MiB |
    |    1   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                  4MiB |
    +-----------------------------------------------------------------------------+

    但是如果不使用profile僅僅使用nvidia-smi這個指令的輸出的話,是沒有辦法非常細致的分析程序運行過程中的變化的。這里順便推薦一個比較精致的跟nvidia-smi用法非常類似的小工具:gpustat。這個工具可以直接使用pip進行安裝和管理:

    $ python3 -m pip install gpustat
    Collecting gpustat
      Downloading gpustat-0.6.0.tar.gz (78 kB)
         |████████████████████████████████| 78 kB 686 kB/s
    Requirement already satisfied: six>=1.7 in /home/dechin/.local/lib/python3.8/site-packages (from gpustat) (1.16.0)
    Collecting nvidia-ml-py3>=7.352.0
      Downloading nvidia-ml-py3-7.352.0.tar.gz (19 kB)
    Requirement already satisfied: psutil in /home/dechin/.local/lib/python3.8/site-packages (from gpustat) (5.8.0)
    Collecting blessings>=1.6
      Downloading blessings-1.7-py3-none-any.whl (18 kB)
    Building wheels for collected packages: gpustat, nvidia-ml-py3
      Building wheel for gpustat (setup.py) ... done
      Created wheel for gpustat: filename=gpustat-0.6.0-py3-none-any.whl size=12617 sha256=4158e741b609c7a1bc6db07d76224db51cd7656a6f2e146e0b81185ce4e960ba
      Stored in directory: /home/dechin/.cache/pip/wheels/0d/d9/80/b6cbcdc9946c7b50ce35441cc9e7d8c5a9d066469ba99bae44
      Building wheel for nvidia-ml-py3 (setup.py) ... done
      Created wheel for nvidia-ml-py3: filename=nvidia_ml_py3-7.352.0-py3-none-any.whl size=19191 sha256=70cd8ffc92286944ad9f5dc4053709af76fc0e79928dc61b98a9819a719f1e31
      Stored in directory: /home/dechin/.cache/pip/wheels/b9/b1/68/cb4feab29709d4155310d29a421389665dcab9eb3b679b527b
    Successfully built gpustat nvidia-ml-py3
    Installing collected packages: nvidia-ml-py3, blessings, gpustat
    Successfully installed blessings-1.7 gpustat-0.6.0 nvidia-ml-py3-7.352.0

    使用的時候也是跟nvidia-smi非常類似的操作:

    $ watch --color -n1 gpustat -cpu

    返回結果如下所示:

    Every 1.0s: gpustat -cpu                   ubuntu2004: Wed Jan 12 15:58:59 2022

    ubuntu2004           Wed Jan 12 15:58:59 2022  470.42.01
    [0] Quadro RTX 4000  | 39'C,   3 % |   537 /  7979 MB | root:Xorg/1643(412M) de
    chin:gnome-shell/2940(75M) dechin:slack/47102(35M) dechin:chrome/172424(11M)
    [1] Quadro RTX 4000  | 32'C,   0 % |     6 /  7982 MB | root:Xorg/1643(4M)

    通過gpustat返回的結果,包含了GPU的型號、使用率和顯存使用大小和GPU當前的溫度等常規信息。

    py3nvml的安裝與使用

    接下來正式看下py3nvml的安裝和使用方法,這是一個可以在python中實時查看和監測GPU信息的一個庫,可以通過pip來安裝和管理:

    $ python3 -m pip install py3nvml
    Collecting py3nvml
      Downloading py3nvml-0.2.7-py3-none-any.whl (55 kB)
         |████████████████████████████████| 55 kB 650 kB/s
    Requirement already satisfied: xmltodict in /home/dechin/anaconda3/lib/python3.8/site-packages (from py3nvml) (0.12.0)
    Installing collected packages: py3nvml
    Successfully installed py3nvml-0.2.7

    py3nvml綁定GPU卡

    有一些框架為了性能的最大化,在初始化的時候就會默認去使用到整個資源池里面的所有GPU卡,比如如下使用Jax來演示的一個案例:

    In [1]: import py3nvml
    
    In [2]: from jax import numpy as jnp
    
    In [3]: x = jnp.ones(1000000000)
    
    In [4]: !nvidia-smi
    Wed Jan 12 16:08:32 2022
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.42.01    Driver Version: 470.42.01    CUDA Version: 11.4     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  Quadro RTX 4000     On   | 00000000:03:00.0  On |                  N/A |
    | 30%   41C    P0    38W / 125W |   7245MiB /  7979MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    |   1  Quadro RTX 4000     On   | 00000000:A6:00.0 Off |                  N/A |
    | 30%   35C    P0    35W / 125W |    101MiB /  7982MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |    0   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                412MiB |
    |    0   N/A  N/A      2940      G   /usr/bin/gnome-shell               75MiB |
    |    0   N/A  N/A     47102      G   ...AAAAAAAAA= --shared-files       35MiB |
    |    0   N/A  N/A    172424      G   ...AAAAAAAAA= --shared-files       11MiB |
    |    0   N/A  N/A    812125      C   /usr/local/bin/python            6705MiB |
    |    1   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                  4MiB |
    |    1   N/A  N/A    812125      C   /usr/local/bin/python              93MiB |
    +-----------------------------------------------------------------------------+

    在這個案例中我們只是在顯存中分配了一塊空間用于存儲一個向量,但是Jax在初始化之后,自動占據了本地的2張GPU卡。根據Jax官方提供的方法,我們可以使用如下的操作配置環境變量,使得Jax只能看到其中的1張卡,這樣就不會擴張:

    In [1]: import os
    
    In [2]: os.environ["CUDA_VISIBLE_DEVICES"] = "1"
    
    In [3]: from jax import numpy as jnp
    
    In [4]: x = jnp.ones(1000000000)
    
    In [5]: !nvidia-smi
    Wed Jan 12 16:10:36 2022
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.42.01    Driver Version: 470.42.01    CUDA Version: 11.4     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  Quadro RTX 4000     On   | 00000000:03:00.0  On |                  N/A |
    | 30%   40C    P8    19W / 125W |    537MiB /  7979MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    |   1  Quadro RTX 4000     On   | 00000000:A6:00.0 Off |                  N/A |
    | 30%   35C    P0    35W / 125W |   7195MiB /  7982MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |    0   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                412MiB |
    |    0   N/A  N/A      2940      G   /usr/bin/gnome-shell               75MiB |
    |    0   N/A  N/A     47102      G   ...AAAAAAAAA= --shared-files       35MiB |
    |    0   N/A  N/A    172424      G   ...AAAAAAAAA= --shared-files       11MiB |
    |    1   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                  4MiB |
    |    1   N/A  N/A    813030      C   /usr/local/bin/python            7187MiB |
    +-----------------------------------------------------------------------------+

    可以看到結果中已經是只使用了1張GPU卡,達到了我們的目的,但是這種通過配置環境變量來實現的功能還是著實不夠pythonic,因此py3nvml中也提供了這樣的功能,可以指定某一系列的GPU卡用于執行任務:

    In [1]: import py3nvml
    
    In [2]: from jax import numpy as jnp
    
    In [3]: py3nvml.grab_gpus(num_gpus=1,gpu_select=[1])
    Out[3]: 1
    
    In [4]: x = jnp.ones(1000000000)
    
    In [5]: !nvidia-smi
    Wed Jan 12 16:12:37 2022
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.42.01    Driver Version: 470.42.01    CUDA Version: 11.4     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  Quadro RTX 4000     On   | 00000000:03:00.0  On |                  N/A |
    | 30%   40C    P8    20W / 125W |    537MiB /  7979MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    |   1  Quadro RTX 4000     On   | 00000000:A6:00.0 Off |                  N/A |
    | 30%   36C    P0    35W / 125W |   7195MiB /  7982MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |    0   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                412MiB |
    |    0   N/A  N/A      2940      G   /usr/bin/gnome-shell               75MiB |
    |    0   N/A  N/A     47102      G   ...AAAAAAAAA= --shared-files       35MiB |
    |    0   N/A  N/A    172424      G   ...AAAAAAAAA= --shared-files       11MiB |
    |    1   N/A  N/A      1643      G   /usr/lib/xorg/Xorg                  4MiB |
    |    1   N/A  N/A    814673      C   /usr/local/bin/python            7187MiB |
    +-----------------------------------------------------------------------------+

    可以看到結果中也是只使用了1張GPU卡,達到了跟上一步的操作一樣的效果。

    查看空閑GPU

    對于環境中可用的GPU,py3nvml的判斷標準就是在這個GPU上已經沒有任何的進程,那么這個就是一張可用的GPU卡:

    In [1]: import py3nvml
    
    In [2]: free_gpus = py3nvml.get_free_gpus()
    
    In [3]: free_gpus
    Out[3]: [True, True]

    當然這里需要說明的是,系統應用在這里不會被識別,應該是會判斷守護進程。

    命令行信息獲取

    nvidia-smi非常類似的,py3nvml也可以在命令行中通過調用py3smi來使用。值得一提的是,如果需要用nvidia-smi來實時的監測GPU的使用信息,往往是需要配合watch -n來使用的,但是如果是py3smi則不需要,直接用py3smi -l就可以實現類似的功能。

    $ py3smi -l 5
    Wed Jan 12 16:17:37 2022
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI                        Driver Version: 470.42.01                 |
    +---------------------------------+---------------------+---------------------+
    | GPU Fan  Temp Perf Pwr:Usage/Cap|        Memory-Usage | GPU-Util Compute M. |
    +=================================+=====================+=====================+
    |   0 30%   39C    8   19W / 125W |   537MiB /  7979MiB |       0%    Default |
    |   1 30%   33C    8    7W / 125W |     6MiB /  7982MiB |       0%    Default |
    +---------------------------------+---------------------+---------------------+
    
    +-----------------------------------------------------------------------------+
    | Processes:                                                       GPU Memory |
    | GPU        Owner      PID      Uptime  Process Name                   Usage |
    +=============================================================================+
    +-----------------------------------------------------------------------------+

    可以看到略有區別的是,這里并不像nvidia-smi列出來的進程那么多,應該是自動忽略了系統進程。

    單獨查看驅動版本和顯卡型號

    在py3nvml中把查看驅動和型號的功能單獨列了出來:

    In [1]: from py3nvml.py3nvml import *
    In [2]: nvmlInit()
    Out[2]: <CDLL 'libnvidia-ml.so.1', handle 560ad4d07a60 at 0x7fd13aa52340>
    In [3]: print("Driver Version: {}".format(nvmlSystemGetDriverVersion()))
    Driver Version: 470.42.01
    In [4]: deviceCount = nvmlDeviceGetCount()
       ...: for i in range(deviceCount):
       ...:     handle = nvmlDeviceGetHandleByIndex(i)
       ...:     print("Device {}: {}".format(i, nvmlDeviceGetName(handle)))
       ...:
    Device 0: Quadro RTX 4000
    Device 1: Quadro RTX 4000
    In [5]: nvmlShutdown()

    這樣也不需要我們自己再去逐個的篩選,從靈活性和可擴展性上來說還是比較方便的。

    單獨查看顯存信息

    這里同樣的也是把顯存的使用信息單獨列了出來,不需要用戶再去單獨篩選這個信息,相對而言比較細致:

    In [1]: from py3nvml.py3nvml import *
    In [2]: nvmlInit()
    Out[2]: <CDLL 'libnvidia-ml.so.1', handle 55ae42aadd90 at 0x7f39c700e040>
    In [3]: handle = nvmlDeviceGetHandleByIndex(0)
    In [4]: info = nvmlDeviceGetMemoryInfo(handle)
    In [5]: print("Total memory: {}MiB".format(info.total >> 20))
    Total memory: 7979MiB
    In [6]: print("Free memory: {}MiB".format(info.free >> 20))
    Free memory: 7441MiB
    In [7]: print("Used memory: {}MiB".format(info.used >> 20))
    Used memory: 537MiB

    如果把這些代碼插入到程序中,就可以獲悉每一步所占用的顯存的變化。

    看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

    向AI問一下細節

    免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

    AI

    泸西县| 信阳市| 鄂州市| 湘潭县| 望江县| 柏乡县| 岳普湖县| 古蔺县| 万载县| 黑河市| 徐闻县| 玛沁县| 鱼台县| 江华| 宜阳县| 香格里拉县| 双辽市| 旌德县| 平阴县| 新郑市| 叙永县| 射洪县| 海丰县| 罗田县| 望江县| 新巴尔虎右旗| 惠州市| 张家港市| 金华市| 宜兰市| 吴旗县| 年辖:市辖区| 黄平县| 舞钢市| 乌什县| 惠水县| 二连浩特市| 乌兰察布市| 重庆市| 通道| 阿尔山市|