type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
GraphRAG
以GraphRAG为例
基础概念
LPG:Labeled Property Graph
ref: 实体与实体之间由关系链接


借助LLM生成LPG
ref

- 命名实体识别:Named Entity Recognition
- 关系抽取:Relation Extraction
- 预设返回格式:设定LLM的输出格式,方便构建知识图谱
- 加入预警纠错的提示
- 特殊:Data Gleaning
- 反复询问LLM有没有要补充的,直到返回无的信号
- 相当于自补充和自纠错机制
- 最后的图谱形式:
- 每个chunk一个单独的实体关系链条
- 最后由机械程序自动拼合独立chunk为整体图谱graph(合并实体,堆叠信息)
- 终版:合并完成后交由LLM,再把堆叠的信息转化为自然语言
ref



GraphRAG一直保留着原文和graph之间的对应关系,方便后续查询query
优化算法
莱顿社区检测Leiden algorithm
- 算法原理:网络优化
- 跟GraphRAG的结合:
- 将密集区单独成块,然后发给LLM,生成一段总结性描述
- 该描述用于推理:从已知信息中借助逻辑工具,推理未知信息
ref

图谱示例
最终的层级结构:
从下往上⬆:精炼,框架
从上往下⬇:丰富,细节

存储
- 实体,关系,描述信息都作为单独的chunk文字片段,进行embedding,存入向量数据库
- 原文,也chunk,进行embedding,存入向量数据库
查询
- 跟普通RAG流程类似
- 将问题embedding
- 选择查询策略
- 查询某层或某几层的graph
- 将匹配信息与问题打包发给LLM
- 常用策略:
- Local Search:适用于从底层查起,细节丰富的问题
- Global Search:适用于从顶层查起,全局结构的问题
补充
- 费token,因为LLM全程参与
- 论文依据:
论文依据(将LLM加入到GraphRAG构建额流程中,感觉不靠谱,但效果以外的不错)ref:微软的论文
- Author:Frank
- URL:https://blog.fqqblog.com/2e7bd4d9052e81cea94cf3ef3953e5e3
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!

Knowledge Graph 