为 NVIDIA RTX 虚拟工作站 (vWS) 安装驱动程序


如果您需要将 GPU 用于远程桌面上的硬件加速图形或用于游戏,则可以创建使用 NVIDIA RTX 虚拟工作站 (vWS)(以前称为 NVIDIA GRID)的虚拟工作站。

NVIDIA RTX 虚拟工作站 (vWS) 非常适合在云远程桌面上运行使用 Vulkan、OpenGL 或 Direct3D 等 API 的工作负载。

为虚拟工作站选择支持可视化功能的 GPU后,您可以向虚拟机添加 NVIDIA RTX 虚拟工作站 (vWS) 许可。如需详细了解价格,请参阅 GPU 价格

如需设置 NVIDIA RTX 虚拟工作站 (vWS),您需要执行以下操作:

  1. 创建启用了虚拟工作站的虚拟机。
  2. 安装虚拟工作站的驱动程序

创建虚拟工作站后,您可以使用远程桌面协议(例如 Teradici® PCoIP 或 VMware® Horizon View)连接到该工作站。

准备工作

  • 如果您尚未设置身份验证,请进行设置。身份验证是通过其进行身份验证以访问 Google Cloud 服务和 API 的过程。如需从本地开发环境运行代码或示例,您可以选择以下任一选项向 Compute Engine 进行身份验证:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Install the Google Cloud CLI, then initialize it by running the following command:

      gcloud init
    2. Set a default region and zone.
    3. REST

      如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭据。

        Install the Google Cloud CLI, then initialize it by running the following command:

        gcloud init

      如需了解详情,请参阅 Google Cloud 身份验证文档中的使用 REST 时进行身份验证

建议的最低 NVIDIA 驱动程序版本

对于在 Compute Engine 上运行的 L4、T4、P4 和 P100 NVIDIA RTX 虚拟工作站 (vWS),建议根据应用所需的 NVIDIA 虚拟 GPU 软件使用以下 NVIDIA 驱动程序版本:

  • 对于 NVIDIA 虚拟 GPU 软件版本 17,我们建议使用以下最低 NVIDIA 驱动程序:
    • 对于 Linux 虚拟机:550.90.07
    • 对于 Windows 虚拟机:552.55
  • 对于 NVIDIA 虚拟 GPU 软件版本 16,我们建议使用以下最低 NVIDIA 驱动程序:
    • 对于 Linux 虚拟机:535.183.01
    • 对于 Windows 虚拟机:538.67

为 NVIDIA RTX 虚拟工作站 (vWS) 安装驱动程序

在您的虚拟机上完成以下步骤。

  1. 对于 Linux 操作系统,请安装适用于您的 Linux 版本的构建工具。

    CentOS/RHEL

    sudo yum group install "Development Tools"

    Debian/Ubuntu

    1. 安装构建工具。

      sudo apt update
      sudo apt install -y build-essential
      sudo apt install -y libvulkan1
    2. 如果您使用的是 Ubuntu 22.04,请更新 NVIDIA 驱动程序的 gcc 版本。

      sudo apt install -y gcc-12
      sudo apt install -y linux-headers-$(uname -r)
      sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
      sudo update-alternatives --config gcc

    SLES

    • SLES 12

      sudo zypper install -t pattern devel_basis
      sudo zypper install gcc8
    • SLES 15

      sudo SUSEConnect -p sle-module-development-tools/15/x86_64
      sudo zypper install gcc8
  2. 对于 Linux 操作系统,请安装 Linux 内核标头。请参阅 NVIDIA 文档中的验证系统是否已安装正确的内核标头和开发软件包

  3. 对于所有操作系统,请安装驱动程序。

    Linux

    1. 下载驱动程序。如需查看可在 Compute Engine 上使用的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序的完整列表,请参阅适用于 NVIDIA RTX 虚拟工作站 (vWS) 的驱动程序

      例如,如需下载 NVIDIA 550.127.05 驱动程序,请运行以下命令:

      curl -O https://storage.googleapis.com/nvidia-drivers-us-public/GRID/vGPU17.4/NVIDIA-Linux-x86_64-550.127.05-grid.run
      
    2. 启动安装程序。

      例如,如需启动 NVIDIA 550.127.05 驱动程序,请运行以下命令:

      sudo bash NVIDIA-Linux-x86_64-550.127.05-grid.run
    3. 在安装过程中,请选择以下选项:

      • 如果系统提示您安装 32 位二进制文件,请选择
      • 如果系统提示您修改 x.org 文件,请选择

    Windows Server

    1. 根据您的 Windows Server 版本,下载所需的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序。

      如需查看可在 Compute Engine 上运行的 Windows 虚拟机上使用的 NVIDIA RTX 虚拟工作站 (vWS) 驱动程序的完整列表,请参阅适用于 NVIDIA RTX 虚拟工作站 (vWS) 的驱动程序

    2. 运行安装程序,然后选择快速安装

    3. 安装完成后,重启虚拟机。重启后,您将断开与会话的连接。

    4. 使用 RDP 或 PCoIP 客户端重新连接到您的实例。

  4. 只有挂接了 T4 或 L4 GPU 的基于 Linux 的 NVIDIA RTX 虚拟工作站 (vWS) 才需要执行此步骤。

    如果您安装了 NVIDIA 510 或更高版本的驱动程序,则需要停用 GSP 固件。请参阅 Nvidia 文档中的停用 GSP 固件。完成此步骤时,请注意以下几点:

    • 使用 sudo 运行命令来创建和更新配置文件。
    • 如需重新启动虚拟机,您可以使用 sudo reboot停止和启动虚拟机

验证是否已安装驱动程序

Linux

运行以下命令:

nvidia-smi

该命令的输出类似于以下内容:

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.127.05             Driver Version: 550.127.05     CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  Tesla T4                       On  |   00000000:00:04.0 Off |                    0 |
| N/A   47C    P8             15W /   70W |       1MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

Windows Server

  1. 使用 RDP 或 PCoIP 客户端连接到您的 Windows 实例。

  2. 右键点击桌面,然后选择 NVIDIA 控制面板

  3. 在“NVIDIA 控制面板”的“帮助”菜单中,选择系统信息。这些信息会显示虚拟机正在使用的 GPU 以及驱动程序版本。

后续步骤