Lazy loaded image
技术分享
Lazy loaded imageKnowledge Graph
Words 537Read Time 2 min
2025-6-27
2026-1-13
type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
 

 

GraphRAG

以GraphRAG为例

基础概念

LPG:Labeled Property Graph

ref: 实体与实体之间由关系链接
notion image
 
notion image
 

借助LLM生成LPG

ref
notion image
 
  1. 命名实体识别:Named Entity Recognition
  1. 关系抽取:Relation Extraction
  1. 预设返回格式:设定LLM的输出格式,方便构建知识图谱
    1. 加入预警纠错的提示
  1. 特殊:Data Gleaning
    1. 反复询问LLM有没有要补充的,直到返回无的信号
    2. 相当于自补充和自纠错机制
  1. 最后的图谱形式:
    1. 每个chunk一个单独的实体关系链条
    2. 最后由机械程序自动拼合独立chunk为整体图谱graph(合并实体,堆叠信息)
    3. 终版:合并完成后交由LLM,再把堆叠的信息转化为自然语言
    4. ref
      a
      a
       
      b
      b
      c
      c
GraphRAG一直保留着原文和graph之间的对应关系,方便后续查询query
 
 
 
 
 

 

优化算法

莱顿社区检测Leiden algorithm

  1. 算法原理:网络优化
  1. 跟GraphRAG的结合:
    1. 将密集区单独成块,然后发给LLM,生成一段总结性描述
    2. 该描述用于推理:从已知信息中借助逻辑工具,推理未知信息
      1. ref
        notion image
 
 
 
 

 

图谱示例

最终的层级结构:
从下往上⬆:精炼,框架
从上往下⬇:丰富,细节
notion image
 
 
 
 
 

 

存储

  1. 实体,关系,描述信息都作为单独的chunk文字片段,进行embedding,存入向量数据库
  1. 原文,也chunk,进行embedding,存入向量数据库
 
 
 
 
 

 

查询

  1. 跟普通RAG流程类似
    1. 将问题embedding
    2. 选择查询策略
    3. 查询某层或某几层的graph
    4. 将匹配信息与问题打包发给LLM
 
 
  1. 常用策略:
    1. Local Search:适用于从底层查起,细节丰富的问题
    2. Global Search:适用于从顶层查起,全局结构的问题
 
 
 
 
 

 

补充

  1. 费token,因为LLM全程参与
  1. 论文依据:
    1. 论文依据(将LLM加入到GraphRAG构建额流程中,感觉不靠谱,但效果以外的不错)
      ref:微软的论文
      notion image
 
 
 
 

 
 
 
上一篇
深度学习_算法
下一篇
n8n