一、 漏洞 CVE-2025-6211 基础信息
漏洞信息
                                        # run-llama/llama_index中的MD5哈希碰撞漏洞

## 漏洞概述
在 `run-llama/llama_index` 仓库中,`DocugamiReader` 类使用的 MD5 哈希算法生成文本块的 ID 时存在漏洞。这导致结构上不同的文本块在包含相同文本时产生哈希冲突,从而使一个文本块覆盖另一个文本块。

## 影响版本
- 版本 0.12.28 及之前的版本
- 该漏洞在版本 0.3.1 中被修复

## 细节
`DocugamiReader` 类使用 MD5 算法为文档片段生成唯一 ID。当结构不同的片段包含完全相同的文本时,会产生哈希冲突。这是由于 MD5 算法的特性导致的,使得生成的哈希值不唯一。

## 影响
- **数据丢失**:导致语义或法律上重要的文档内容丢失。
- **层级关系破坏**:破坏父级-子级片段的层级关系。
- **AI 输出错误**:导致 AI 输出出现不准确或虚构的结果。
                                        
提示
尽管我们采用了先进的大模型技术,但其输出仍可能包含不准确或过时的信息。
神龙会尽力确保数据准确,但也请结合实际情况进行甄别与判断。
神龙祝您一切顺利!
漏洞标题
MD5 Hash Collision in run-llama/llama_index
来源:美国国家漏洞数据库 NVD
漏洞描述信息
A vulnerability in the DocugamiReader class of the run-llama/llama_index repository, up to version 0.12.28, involves the use of MD5 hashing to generate IDs for document chunks. This approach leads to hash collisions when structurally distinct chunks contain identical text, resulting in one chunk overwriting another. This can cause loss of semantically or legally important document content, breakage of parent-child chunk hierarchies, and inaccurate or hallucinated responses in AI outputs. The issue is resolved in version 0.3.1.
来源:美国国家漏洞数据库 NVD
CVSS信息
N/A
来源:美国国家漏洞数据库 NVD
漏洞类别
预期行为违背
来源:美国国家漏洞数据库 NVD
漏洞标题
LlamaIndex 安全漏洞
来源:中国国家信息安全漏洞库 CNNVD
漏洞描述信息
LlamaIndex是LlamaIndex开源的一个 LLM 应用程序的数据框架。 LlamaIndex 0.12.28及之前版本存在安全漏洞,该漏洞源于使用MD5哈希生成文档块ID,可能导致哈希冲突。
来源:中国国家信息安全漏洞库 CNNVD
CVSS信息
N/A
来源:中国国家信息安全漏洞库 CNNVD
漏洞类别
其他
来源:中国国家信息安全漏洞库 CNNVD
二、漏洞 CVE-2025-6211 的公开POC
# POC 描述 源链接 神龙链接
三、漏洞 CVE-2025-6211 的情报信息