漏洞概述 漏洞名称: GGUF dequantize kernel int truncation exposes uninitialized GPU memory in multi-tenant serving 漏洞描述: 在vLLM的GGUF反量化内核中,由于张量维度的整数截断,导致部分张量处理。输出张量被分配为全尺寸(未初始化内存),但反量化CUDA内核只处理截断的元素数量。未处理部分的输出张量保留了之前GPU内存中的内容。在多租户推理部署中,这些残留的GPU内存可能包含其他用户的推理数据,从而构成信息泄露。 影响范围 受影响版本: vLLM >= 0.5.5 修复版本: None 修复方案 修复代码: 在 中,将 函数指针类型的元素计数参数从 (32位)改为 。 具体修改: POC代码 其他信息 CVSS v4基础指标: - 可利用性指标: - 攻击向量: 网络 - 攻击复杂度: 低 - 攻击要求: 无 - 特权要求: 无 - 用户交互: 被动 - 脆弱系统影响指标: - 机密性: 低 - 完整性: 低 - 可用性: 无 - 后续系统影响指标: - 机密性: 无 - 完整性: 无 - 可用性: 无 CVE ID: CVE-2025-53923 弱点: - CWE-200 - CWE-461 贡献者: - Aviral2642 (Reporter) - russellb (Coordinator) - jperedaalgaiba (Remediation developer) 总结 该漏洞涉及vLLM在多租户推理服务中的信息泄露问题,通过整数截断导致未初始化的GPU内存暴露。修复方案是将相关函数指针的参数类型从 改为 ,以防止整数截断。