|
这是尚未发布的文档。 SUSE® Virtual Clusters v1.2.0 (Dev). |
在SUSE虚拟集群中限制GPU资源
本指南帮助您使用SUSE Virtual Clusters的策略概念定义租户中的GPU限制。
|
这仅适用于`shared`模式。 |
创建一个VirtualClusterPolicy
首先在YAML文件中定义一个`VirtualClusterPolicy`(例如,gpu-policy.yaml),并将其应用到您的集群中。
apiVersion: k3k.io/v1beta1
kind: VirtualClusterPolicy
metadata:
name: quota-policy
spec:
quota:
hard:
requests.nvidia.com/gpu: 4
使用kubectl应用策略:
kubectl apply -f gpu-policy.yaml
该策略允许消耗4个GPU。
将策略附加到租户
通过为所需的名称空间添加注解来应用策略:
kubectl label namespace <namespace-name> policy.k3k.io/policy-name="quota-policy"
在名称空间中会自动创建资源配额.
跟踪GPU消耗
一旦在虚拟集群中创建了GPU工作负载(在共享模式下),它将消耗分配的一个GPU资源。
您可以使用`quota`命令跟踪消耗:
kubectl get quota -n testgpu
NAME REQUEST LIMIT AGE
k3k-quota-policy requests.nvidia.com/gpu: 0/4 4s
如果达到限制,用户尝试部署一个消耗GPU的新pod时,该pod将保持在`Pending`状态,状态如下:
Warning ProviderCreateFailed 1s ubuntu/pod-controller pods "cuda-vectoradd-default-sharedclustergpu-637564612d7665637-865e4" is forbidden: exceeded quota: k3k-quota-policy, requested: requests.nvidia.com/gpu=1, used: requests.nvidia.com/gpu=4, limited: requests.nvidia.com/gpu=4