为 NVIDIA RTX 虚拟工作站 (vWS) 安装驱动程序


如果您需要将 GPU 用于远程桌面上的硬件加速图形或用于游戏,则可以创建使用 NVIDIA RTX 虚拟工作站 (vWS)(以前称为 NVIDIA GRID)的虚拟工作站。

NVIDIA RTX 虚拟工作站 (vWS) 非常适合在云远程桌面上运行使用 Vulkan、OpenGL 或 Direct3D 等 API 的工作负载。

当您为虚拟工作站选择 GPU 时,Compute Engine 会向您的虚拟机添加一个 NVIDIA RTX 虚拟工作站 (vWS) 许可。如需详细了解价格,请参阅 GPU 价格

如需设置 NVIDIA RTX 虚拟工作站 (vWS),您需要执行以下操作:

  1. 创建启用了虚拟工作站的虚拟机。
  2. 安装虚拟工作站的驱动程序

创建虚拟工作站后,您可以使用远程桌面协议(例如 Teradici® PCoIP 或 VMware® Horizon View)连接到该工作站。

准备工作

  • 设置身份验证(如果尚未设置)。身份验证是通过其进行身份验证以访问 Google Cloud 服务和 API 的过程。如需从本地开发环境运行代码或示例,您可以按如下方式向 Compute Engine 进行身份验证。

    选择标签页以了解您打算如何使用本页面上的示例:

    控制台

    当您使用 Google Cloud 控制台访问 Google Cloud 服务和 API 时,无需设置身份验证。

    gcloud

    1. 安装 Google Cloud CLI,然后通过运行以下命令初始化 Google Cloud CLI:

      gcloud init
    2. 设置默认区域和可用区

    REST

    如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭据。

      安装 Google Cloud CLI,然后通过运行以下命令初始化 Google Cloud CLI:

      gcloud init

必需的 NVIDIA 驱动程序版本

对于在 Compute Engine 上运行的 NVIDIA RTX 虚拟工作站 (vWS),建议使用以下 NVIDIA 驱动程序版本:

  • 对于 L4 NVIDIA RTX 虚拟工作站 (vWS)
    • Linux:525.105 或更高版本
    • Windows:537.13 或更高版本
  • 对于 T4、P4 和 P100 NVIDIA RTX 虚拟工作站 (vWS)
    • Linux:470.63.01 或更高版本
    • Windows:471.68 或更高版本

为 NVIDIA RTX 虚拟工作站 (vWS) 安装驱动程序

在您的虚拟机上完成以下步骤。

  1. 对于 Linux 操作系统,请安装适用于您的 Linux 版本的构建工具。

    Debian/Ubuntu

    sudo apt install build-essential

    CentOS/RHEL

    sudo yum group install "Development Tools"

    SLES

    • SLES 12

      sudo zypper install -t pattern devel_basis
      sudo zypper install gcc8
    • SLES 15

      sudo SUSEConnect -p sle-module-development-tools/15/x86_64
      sudo zypper install gcc8 
  2. 对于 Linux 操作系统,请安装 Linux 内核标头。请参阅 Nvidia 文档中的验证系统是否已安装正确的内核标头和开发软件包

  3. 对于所有操作系统,请安装驱动程序。

    Linux

    1. 下载驱动程序。如需查看可在 Compute Engine 上使用的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序的完整列表,请参阅适用于 NVIDIA RTX 虚拟工作站 (vWS) 的驱动程序

      例如,如需下载 NVIDIA 550.54.14 驱动程序,请运行以下命令:

      curl -O https://storage.googleapis.com/nvidia-drivers-us-public/GRID/vGPU17.0/NVIDIA-Linux-x86_64-550.54.14-grid.run
      
    2. 启动安装程序。

      例如,如需启动 NVIDIA 550.54.14 驱动程序,请运行以下命令:

      sudo bash NVIDIA-Linux-x86_64-550.54.14-grid.run
    3. 在安装过程中,请选择以下选项:

      • 如果系统提示您安装 32 位二进制文件,请选择
      • 如果系统提示您修改 x.org 文件,请选择

    Windows Server

    1. 根据您的 Windows Server 版本,下载所需的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序。

      如需查看可在 Compute Engine 上运行的 Windows 虚拟机上使用的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序的完整列表,请参阅适用于 NVIDIA RTX 虚拟工作站 (vWS) 的驱动程序

    2. 运行安装程序,然后选择快速安装

    3. 安装完成后,重启虚拟机。重启后,您将断开与会话的连接。

    4. 使用 RDP 或 PCoIP 客户端重新连接到您的实例。

  4. 只有挂接了 T4 或 L4 GPU 的基于 Linux 的 NVIDIA RTX 虚拟工作站 (vWS) 才需要执行此步骤。

    如果您安装了 NVIDIA 510 或更高版本的驱动程序,则需要停用 GSP 固件。请参阅 Nvidia 文档中的停用 GSP 固件。完成此步骤时,请注意以下几点:

    • 使用 sudo 运行命令来创建和更新配置文件。
    • 如需重新启动虚拟机,您可以使用 sudo reboot停止和启动虚拟机

验证是否已安装驱动程序

Linux

运行以下命令:

nvidia-smi

该命令的输出类似于以下内容:

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.14              Driver Version: 550.54.14      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
| N/A   62C    P0             28W /   70W |       0MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

Windows Server

  1. 使用 RDP 或 PCoIP 客户端连接到您的 Windows 实例。

  2. 右键点击桌面,然后选择 NVIDIA 控制面板

  3. 在“NVIDIA 控制面板”的“帮助”菜单中,选择系统信息。这些信息会显示虚拟机正在使用的 GPU 以及驱动程序版本。

后续步骤