GraphRAG 的prompt整理

项目地址:https://github.com/microsoft/graphrag

通过项目初始化指令后:

python -m graphrag.index –init –root ./ragtest_frxxz_ds

发现会生成2个文件夹一个设置文档,本文对 prompt 文件夹中的内容进行探索研究,prompt 的文件夹中有 4 个 txt 文档分别是:

claim_extraction.txt–声明提取:从非结构化文档中提取结构化的数据单元

community_report.txt-社区反馈:持续性的获取信息和收集比对,展示信息对原有实体和数据的影响

entity_extraction.txt:实体及关系提取:提取文档中的实体,实体类型和实体间的关系对并进行描述

summarize_descriptions.txt:总结描述:将给定的一个或多个实体,以及一个或多个实体描述进行总结陈述。以第三人称视角,包括所有的信息描述

详细的文档见下方:

测试文档如下:

使用了 deepseek 作为 llm 模型,耗时 2 小时左右,消耗 2597 万 tokens

交互问答效果如下:


python -m graphrag.query –root ./ragtest_frxxz_ds –method global “我家儿子发烧37度了,是得了什么病呢?该怎么诊断?”

SUCCESS: Global Search Response: ### 儿童发烧37度的诊断与处理

发烧是儿童常见的症状之一,37度的体温虽然略高于正常,但可能并不严重。然而,为了确保孩子的健康,建议家长密切观察孩子的其他症状,并及时就医进行专业诊断和治疗。

#### 诊断步骤

1. **详细病史询问**:医生会询问孩子的病史,包括近期的生活习惯、接触史等,以帮助判断可能的病因。

2. **体格检查**:进行全面的体格检查,包括体温监测、心肺听诊等,以发现可能的异常体征。

3. **实验室和影像学检查**:根据需要,可能会进行血液检查、尿液检查、X光或超声检查等,以排除或确认特定的疾病。[Data: Reports (1820, 910, 188, 1833, 2084, 365, 633, 1656, 1475, 1631, 189, 1042, 1383, 923, 732, 1853, 954, 930, 1910, 921, 1038, 749, 1857, +more)]

#### 常见病因

发烧可能是由多种原因引起的,包括但不限于:

– **感染**:如病毒感染、细菌感染等。

– **免疫系统疾病**:如自身免疫性疾病。

– **其他疾病**:如代谢性疾病等。

#### 处理建议

1. **保持水分**:确保孩子充分补水,以防脱水。

2. **观察症状**:密切观察孩子是否有其他症状,如咳嗽、皮疹、呕吐等。

3. **及时就医**:如果发烧持续或伴有其他严重症状,应及时就医进行详细检查和治疗。

总之,虽然37度的发烧可能并不严重,但为了孩子的健康,建议家长及时就医,由专业医生进行全面的评估和诊断。[Data: Reports (1723, 1897, 1458, 1302, 1659, 677, 1495, 1012, 334, 1037, 968, 1998, 1701, 1990, 982, 764, 1447, 1388, 716, 1373, 1642, 1040, 759, 1150, 176, 900, 1985, 1152, 1048, 1724, 1872, 976, 785, 1509, 2031, 1588, 60, 1378, 1487, 1387, 1530, 687, 823, 681, 1735, 1712, 1806, 1832, 2008, 2024, 2039, 817, 846, 1025, 1030, 1138, 1180, 1264, 1371, 1491, 1936, 1030, 1025, 1138, 1180, 1264, 1371, 1491, 1936, +more)]

对比测试了其他的 llm

—–没有知识库 和 prompt工程支持——

doubao-lite-4k

doubao-pro-128k

spark4.0

deepseek-chat

Minimax abab6.5

moonshot-1-128k

glm-4-520

qwen-max-0403

个人感觉知识图谱加强的问答对于整体的理解还是更全面一些,会对关注的事项都进行整理归纳,进行解答,效果真的很不错。期待~~