专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏

nvidia/gpu-feature-discovery Docker 镜像 - 轩辕镜像

gpu-feature-discovery
nvidia/gpu-feature-discovery
NVIDIA GPU特性发现工具镜像,用于识别和暴露GPU设备特性,自v0.6.0版本起需从NGC目录(nvcr.io/nvidia/gpu-feature-discovery)获取,原Docker Hub镜像不再更新。
1 收藏0 次下载activenvidia镜像
🚀专业版镜像服务,面向生产环境设计
中文简介版本下载
🚀专业版镜像服务,面向生产环境设计

NVIDIA GPU Feature Discovery 镜像文档

镜像概述

NVIDIA GPU Feature Discovery (GFD) 镜像为GPU特性发现工具,主要用于在Kubernetes环境中识别和暴露GPU设备的详细特性(如型号、内存、架构等),生成可用于调度的节点标签,辅助GPU资源的管理与分配。

重要迁移说明:自v0.6.0版本起,Docker Hub不再发布新镜像,所有版本需从NVIDIA NGC目录获取:nvcr.io/nvidia/gpu-feature-discovery。原Docker Hub镜像仅保留历史版本(v0.5.0及以下),且不再更新维护。

支持的标签及Dockerfile链接(历史版本)

以下为Docker Hub上的历史版本标签(均为v0.5.0及以下,不再更新):

  • v0.5.0 (Dockerfile)
  • v0.4.1 (Dockerfile)
  • v0.4.0 (Dockerfile)
  • v0.3.0 (Dockerfile)
  • v0.2.2 (Dockerfile)
  • v0.2.1 (Dockerfile)
  • v0.2.0 (Dockerfile)
  • v0.2.0-rc.1 (Dockerfile)
  • v0.1.0, 1.0.0-beta.1 (Dockerfile)
  • v0.0.0, 1.0.0-beta (Dockerfile)
  • 1.0.0-alpha (Dockerfile)

核心功能与特性

  • GPU特性识别:自动检测GPU设备型号、显存容量、架构代次(如Ampere、Volta)等关键特性。
  • 标签生成:将识别的GPU特性转换为Kubernetes节点标签(如nvidia.com/gpu.model=TeslaV100),用于Pod调度策略。
  • 兼容性:支持多种NVIDIA GPU架构及Kubernetes版本,与NVIDIA设备插件协同工作。
  • 轻量级设计:镜像体积小,资源占用低,适合作为DaemonSet在集群节点上运行。

使用场景

  • Kubernetes GPU资源调度:为集群管理员提供基于GPU特性的精细化调度能力,确保Pod部署在符合需求的GPU节点上。
  • GPU资源管理:通过暴露GPU详细信息,辅助监控和优化GPU资源利用率。
  • 多GPU型号集群:在混合GPU型号的集群中,实现按型号、性能等特性的差异化调度。

使用方法与配置说明

获取NGC镜像(推荐,v0.6.0及以上)

从NVIDIA NGC目录拉取最新镜像:

bash
docker pull nvcr.io/nvidia/gpu-feature-discovery:latest

如需指定版本(如v0.6.0):

bash
docker pull nvcr.io/nvidia/gpu-feature-discovery:v0.6.0
使用历史版本(Docker Hub,v0.5.0及以下)

注意:以下版本已不再更新,仅用于兼容性测试或历史环境。

拉取特定版本(如v0.5.0):

bash
docker pull nvidia/gpu-feature-discovery:v0.5.0
Kubernetes部署示例

通常以DaemonSet形式部署在集群节点,示例配置(需根据实际环境调整):

yaml
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: gpu-feature-discovery
  namespace: kube-system
spec:
  selector:
    matchLabels:
      app: gpu-feature-discovery
  template:
    metadata:
      labels:
        app: gpu-feature-discovery
    spec:
      tolerations:
      - effect: NoSchedule
        key: nvidia.com/gpu
        operator: Exists
      containers:
      - name: gpu-feature-discovery
        image: nvcr.io/nvidia/gpu-feature-discovery:latest  # 使用NGC镜像
        resources:
          limits:
            cpu: 50m
            memory: 50Mi
          requests:
            cpu: 50m
            memory: 50Mi
        volumeMounts:
        - name: output-dir
          mountPath: /etc/kubernetes/node-feature-discovery/features.d
        - name: device-dir
          mountPath: /dev/dri
          readOnly: true
      volumes:
      - name: output-dir
        hostPath:
          path: /etc/kubernetes/node-feature-discovery/features.d
          type: DirectoryOrCreate
      - name: device-dir
        hostPath:
          path: /dev/dri
配置参数

通过环境变量或命令行参数配置GFD行为,常用参数包括:

  • --mig-strategy:MIG(多实例GPU)策略,可选single(仅识别主设备)或mixed(识别所有MIG设备)。
  • --output:输出格式,默认生成节点标签。
  • --sleep-interval:特性检测间隔时间(秒),默认300秒。

详细参数可通过以下命令查看:

bash
docker run --rm nvcr.io/nvidia/gpu-feature-discovery:latest --help

参考链接

  • NGC镜像文档
  • GitHub项目主页
查看更多 gpu-feature-discovery 相关镜像 →
nvidia/k8s-device-plugin logo
nvidia/k8s-device-plugin
by nvidia
NVIDIA K8s设备插件镜像,用于在Kubernetes集群中部署设备插件,实现对NVIDIA GPU资源的管理与调度。
34100M+ pulls
上次更新:3 年前
nvidia/dcgm-exporter logo
nvidia/dcgm-exporter
by nvidia
用于Prometheus的NVIDIA GPU指标导出器
2450M+ pulls
上次更新:1 个月前
nvidia/cuda logo
nvidia/cuda
by nvidia
英伟达在GitLab仓库(gitlab.com/nvidia/cuda)提供的CUDA(并行计算平台)和cuDNN(深度神经网络加速库)镜像,为开发者提供了预配置的开发环境,支持高效进行并行计算应用开发、深度学习模型训练及推理任务,确保了环境的一致性和部署的便捷性,是构建基于英伟达GPU加速应用的重要资源。
1946100M+ pulls
上次更新:30 天前
nvidia/driver logo
nvidia/driver
by nvidia
NVIDIA官方驱动程序镜像,用于在容器环境中提供GPU驱动支持。
255M+ pulls
上次更新:4 年前
nvidia/opengl logo
nvidia/opengl
by nvidia
NVIDIA提供的OpenGL镜像,基于libglvnd,支持OpenGL应用运行与开发,需nvidia-docker 2.0,GPU隔离要求驱动390+,不正式支持显示系统(X11、Wayland)。
46500K+ pulls
上次更新:2 年前
nvidia/cudagl logo
nvidia/cudagl
by nvidia
NVIDIA官方提供的集成CUDA与OpenGL的Docker镜像,用于支持需要GPU加速的图形计算任务。
53500K+ pulls
上次更新:3 年前

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
nvidia/gpu-feature-discovery
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
提交工单
免费获取在线技术支持请 提交工单,官方QQ群:13763429 。
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
免费获取在线技术支持请提交工单,官方QQ群: 。
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.
轩辕镜像 官方专业版 Logo
轩辕镜像轩辕镜像官方专业版
首页个人中心搜索镜像
交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 13763429