腾讯优图重磅开源Youtu-GraphRAG，实现图检索增

互联网 0 9

机器之心Pro 互联网资讯 发布于昨天 20:15

本条新闻为单纯事实消息的时事新闻，转载自机器之心Pro，版权归源站所有，如有侵权，烦请联系我们。

图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：

开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗时长，经济与时间成本高昂。
效果瓶颈：对复杂问答的解析精度有限，面临显著的效果瓶颈。
适配成本高：缺乏跨任务泛化能力，遇新领域需重新调整全链路，迁移成本高。

针对这些难题，腾讯优图实验室正式开源 Youtu-GraphRAG 框架，通过创新的算法优化，实现了成本和效果的双重突破！

论文标题：Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning
论文链接：https://arxiv.org/pdf/2508.19855

成本和效果的双重突破

在六个跨领域多语言基准测试中，Youtu-GraphRAG 展现出卓越性能：

大幅成本优化：相比同类最佳方案，构图成本节省 30%+；
显著精度提升：在复杂推理任务中获得最高 16%+ 的准确率提升；

这些结果标志着 GraphRAG 技术向落地可用的发展阶段迈进了重要的一步。

技术架构：三大创新构建垂直统一的完整方案

Youtu-GraphRAG 通过 Schema 连接两个智能体，在图构建、索引和检索上实现垂直统一和认知闭环，以领先的落地级图构建与推理能力推动 GraphRAG 进入新的阶段。

1. Schema 引导的层次化知识树构建

通过引入有针对性的实体类型、关系和属性类型，为图构建智能体提供精确约束，实现了跨领域知识的自主演化和高质量抽取。四层架构设计包括：

属性层：存储实体的属性信息
关系层：构建实体间的关系三元组
关键词层：建立关键词索引体系
社区层：形成层次化的高维度社区结构

2. 结构语义双重感知的社区检测

巧妙融合结构拓扑特征与子图语义信息，在复杂网络中提炼高维度知识加强推理总结能力，社区生成效果显著优于传统 Leiden 和 Louvain 算法。利用大模型进行社区摘要生成，实现更高层次的知识抽象。

3. 智能迭代检索机制

深度理解图 Schema，将复杂查询针对性地转换为符合图特征且可并行处理的子查询，通过迭代检索进一步提升思维链追溯与反思能力。

When & Why? 三大核心应用场景

推理与总结

完美解决需要多步推理的复杂问题，如深度关联分析、因果推理等场景。

知识密集型任务

高效处理依赖大量结构化知识的问题，如企业知识库问答、技术文档深度解析。

跨域扩展应用

轻松支持学术论文、个人知识库、私域 / 企业知识库等多个领域，最小化人工干预成本。

交互界面

快速启动：四步开箱智能复杂问答

第一步：获取项目代码

git clone https://github.com/TencentCloudADP/youtu-graphragcd youtu-graphrag

第二步：环境配置

1. 首先访问提供模型服务的平台，获取远程调用模型的凭证 API key。

2. 按照.env.example 格式创建配置文件，创建并复制 API key，`Youtu-GraphRAG` 项目的 `.env` 文件中的 llm 部分中设置。

cp .env.example .env# 配置 OpenAI 格式的 LLM API# LLM_MODEL=deepseek-chat# LLM_BASE_URL=https://api.deepseek.com# LLM_API_KEY=sk-xxxxxx

第三步：一键部署

docker build -t youtu_graphrag:v1 .# 启动 docker 容器docker run -d -p 8000:8000 youtu_graphrag:v1

第四步：体验交互

curl -v http://localhost:8000

访问 http://localhost:8000 即可体验完整的图增强推理服务，包括：

可视化知识图谱展示
交互式智能问答
实时推理路径追踪

企业级优势特性

统一配置管理

集中化参数管理：所有组件通过单一 YAML 文件统一配置
多环境无缝支持：轻松实现跨领域迁移部署

高性能架构

并行子问题处理：采用并行机制处理分解后的问题
迭代推理演进：逐步构建答案，提供清晰的推理轨迹
企业级扩展性：专为私域及企业级部署而设计

社区贡献与数据集

我们提供公平匿名数据集 AnonyRAG ，有效防范大语言模型预训练过程中的知识泄露问题，深度检验 GraphRAG 框架的检索性能。

我们致力于构建一个开放、灵活的知识图谱检索与推理框架。无论你是研究者、工程师，还是对知识图谱与 RAG 有兴趣的开发者，都可以在以下方向贡献：

新种子 Schema 开发：

设计并提交高质量的种子 Schema，帮助 GraphRAG 更好地理解不同数据类型。

示例：为医疗领域构建患者、药物、治疗方案的种子 Schema

自定义数据集集成:

在尽量减少对 Schema 的人工干预下，尝试集成新的开放数据集或行业数据集。

示例：

集成 WikiData、PubMed、arXiv 等开放数据集
集成企业内部文档或日志数据，并验证 Graphrag 的兼容性

特定领域的最佳实践应用案例

展示 GraphRAG 在某一领域的最佳实践，让社区更直观地了解其应用潜力。

示例：

金融领域：构建基于 Graphrag 的风险事件知识图谱
教育领域：集成课程大纲、作业与考试题库，辅助智能问答
科研领域：集成论文数据集，支持跨学科知识发现

立即体验

Youtu-GraphRAG 不仅代表了图检索增强生成技术的最新进展，更为企业级知识管理和智能问答系统设立了新的标杆。其突破性的成本效益比和精度提升，让高质量智能问答服务变得更加可及和可持续。

立即体验 Youtu-GraphRAG，开启智能问答的新篇章！

点赞 0 收藏(0)

0个评论

消灭零评论