漏洞概述 漏洞名称: Arbitrary File Read via Percent-Encoded Path Traversal in nltk.data.find() / nltk.data.load() - Incomplete Fix of Issue #3504 in nltk/nltk CVE编号: CVE-2026-12243 漏洞类型: CWE-22: Path Traversal 严重程度: High (7.5) 受影响版本: 3.9.4 状态: Awaiting fix 披露奖金: $750 to $1050 修复奖金: $1875 发现者: davidaram 影响范围 NLP web applications: 允许用户通过名称选择语料库或模型的应用程序。 Jupyter notebooks: 处理用户提供的资源标识符的笔记本。 CLI tools: 接受NLTK资源路径作为参数的命令行工具。 可读取的文件包括: SSH keys 环境变量 应用程序配置 数据库凭证 进程可读的任何文件 修复方案 建议修复: 在正则表达式检查之前解码百分号编码。 概念验证 (POC) 代码 输出示例 关键代码路径 data.py L653: 在正则表达式检查之后解码 和 。 data.py L617: 检查字面量 ,但 在此点仍包含百分号编码字符。 data.py L57: `_UNSAFE_NO_PROTOCOL_RE = re.compile(r"(?::