认知图:1.以谓词作为概念
认知图:以谓词作为概念
文档定位:规范态(spec)。
§1 总览
1.1 输入与输出
输入:自然语言文本。
输出:unit 集合——以世界中持久成立的事实与逻辑骨架为内容的结构化记录。
1.2 范围
对象:自然语言可表达的认知。图像、肌肉记忆、现象意识不在内。
接受的信息损失:
- 表层语序——焦点、主题前置、口吻、被动主动、句末语气词;其承载的认知内容由命题态度族与修饰行表达;
- 叙述外壳——"谁说的 / 谁阐释" 等元话语,降级为修饰行
()[证据]。
1.3 系统部件
按以下层组成,后续章节依次定义:
| 层 | 章节 | 定义 |
|---|---|---|
| 节点 | §2 | unit 的最小构成单位,按是否承载信息二分 |
| 谓词 | §3 | unit 的关系类型,分结构 / 内容 / 修饰三类 |
| unit | §4 | 由主体 + 谓词 + 论元构成的最小结构单元 |
| 抽取原则 | §5 | 从原文到 unit 的转换约束 |
| 抽取流程 | §6 | 实施原则的操作步骤 |
| 查询 | §7 | 基于 unit 图的反向索引与遍历 |
1.4 记号约定
| 记号 | 含义 |
|---|---|
{X} |
可查询节点(承载信息) |
(X) |
不可查询节点(修饰、派生组合的一部分) |
() 空 |
修饰行回指占位 |
<X> |
模板 / schema 槽位(说明用,不出现在 unit 文本里) |
[谓词] |
谓词位 |
u_a / u_b / … |
段内局部 unit ID |
§2 节点
2.1 节点形态
节点是 unit 中的最小构成单位。出现位置:主体、谓词、论元、修饰行的值。同一节点全图唯一。
2.2 Queryability 标记
每个节点位置按是否承载信息二分:
| 标记 | 定义 |
|---|---|
{X} |
承载者:在文档所属域内,X 单独出现能稳定指向具体事物 / 概念 / 类,且关于 X 的事实是 non-trivial 且 non-vacuous 的 |
(X) |
非承载者:仅作修饰、描述或派生组合的一部分,不能独立承载信息 |
域相对性:标记按文档所属域判定,同一文档内一致。同一词在不同域可能不同——"图像" 在 CS 视觉域为 (图像),在艺术史域可能为 {图像}。
判别测试——任一通过 → {X},两者都不通过 → (X):
- 测试 A:关于 X 是否能说出三件 non-trivial 的事?
- 测试 B:原文中 X 去掉所有修饰后,是否仍可独立成句作主语?
判别示例:
| 词 | A | B | 标记 |
|---|---|---|---|
| 张三 | ✓(出生年、雇主、毕业院校) | ✓ | {张三} |
| 机器学习算法 | ✓(学习模式、监督性、典型成员) | ✓ | {机器学习算法} |
| 训练 | ✗(仅有定义) | 勉强 | (训练) |
| 非常 | ✗ | ✗ | (非常) |
| 图像数据集 | ✓(典型成员 ImageNet) | ✓ | {图像数据集} |
抽取时机:标记由 LLM 在 §6 步骤 4 逐节点直接判断。
2.3 非承载者参考
下表为常见非承载者的归纳,供抽取时校准直觉;非字符串匹配规则,具体标记仍由 §2.2 测试逐节点判断。
评价 / hedge 类(在任何域几乎不可能成为承载者):
| 类 | 成员 |
|---|---|
| 程度副词 | 非常 / 远远 / 十分 / 大大 / 极 / 更加 |
| 主观评价 | 重要 / 关键 / 优秀 / 完善 / 巨大 / 强大 / 著名 / 深刻 / 惊人 / 复杂 |
| 无锚比较 | 更高级 / 更强 / 更快 / 更好 / 越来越…(有明确基线则改写 {X}[大于]{Y}) |
| 量化 hedge | 大量 / 许多 / 一些 / 几乎 |
| 频率 / 模态 hedge | 通常 / 往往 / 可能 / 希望 / 推测 |
| 强调 / 指示 | 真正的 / 所谓的 / 这样 / 某种 / 任何 |
| 通用描述词 | 典型 / 具体 / 常规 / 普通 / 一般 / 基本 |
| 时代 hedge | 古老 / 过去 / 最近 / 近年(配具体时间则用 ()[发生时间]{1997}) |
通用角色名词(在 CS / ML 域 referent 过宽,需修饰特化):
| 类 | 成员 |
|---|---|
| 过程 / 行为 | 训练 / 测试 / 评估 / 验证 / 学习 / 推理 / 调优 / 处理 / 转换 |
| 主体 / 容器 | 模型 / 方法 / 系统 / 框架 / 架构 / 工具 / 平台 |
| 数据 / 输入输出 | 数据 / 样本 / 信息 / 内容 / 输入 / 输出 |
| 模态 | 图像 / 文本 / 视频 / 音频 / 信号 |
| 抽象属性 | 特征 / 属性 / 能力 / 功能 / 性质 / 状态 / 维度 |
| 流程结构 | 过程 / 阶段 / 步骤 / 操作 / 动作 / 结果 / 效果 |
| 选择 / 替代 | 方案 / 选择 / 替代方案 / 选项 / 候选 |
| 资源 / 环境 | 资源 / 环境 / 场景 |
§3 谓词
谓词本身为节点,可被细化、同义、否定。分三类:结构、内容、修饰。
3.1 结构谓词(封闭,6 个)
不描述世界事实,描述 unit / 节点间的关系。每条有特定查询语义。
| 谓词 | 含义 | 查询语义 |
|---|---|---|
同义 |
A 与 B 等价 / 可互换。覆盖命名别名、跨语言对照、定义性 identity | 派生 ≡ 索引;查询时节点合并 |
属于 |
X 是 Y 的真子类 | 沿继承闭包传递;Y 的全集断言适用于 X |
的 |
M[的]{B} 引入派生节点 {MB} |
不传递;派生节点上的特殊断言不推到 B |
相关于 |
A、B 共现且语义相关,但说不清逻辑关系 | 派生 ↔ 索引 |
negates |
两个谓词互为否定 | §5.IV 矛盾判定 |
被取代 |
旧 unit 被新 unit 取代 | 派生 ⇒ 索引;常态查询取末端 |
3.2 内容谓词
描述世界事实。按 family 归并——同 family 成员在认知层等价("应对" ≡ "处理" ≡ "解决"),下游遍历沿 同义 + 的 闭包找到所有变体;不同 family 不互通。
归并目标:表面可写 family 内任意同义动词,存储 / 查询时归并到基础成员。新成员通过 (新成员)[同义](基础成员) 入库。
3.2.1 单基础成员 family(family 内全部同义归并)
| family | 基础成员 | 同义成员 |
|---|---|---|
| 状态 / 属性 | 具有 |
是, 处于, 表现为 |
| 拥有 / 归属 | 拥有 |
占有, 持有 |
| 需求 | 需要 |
缺乏, 渴求, 要求 |
| 解决 | 应对 |
处理, 面对, 解决 |
| 通过 | 通过 |
借助, 利用, 经由 |
| 因果 | 导致 |
造成, 引起, 诱发 |
| 意图 / 目的 | 目的是 |
旨在, 为了, 借以 |
| 桥接(目的-手段-回应) | 实现 |
回应, 服务于, 满足 |
| 命题态度(信) | 认为 |
主张, 相信, 知道 |
| 命题态度(疑) | 怀疑 |
与 认为 通过 negates 关联 |
3.2.2 多基础成员 family(family 内沿不同轴向,不可彼此合并)
| family | 基础成员 | 用途 |
|---|---|---|
| 部分-整体 | 包括(整体→部分), 组成(部分→整体) |
与 属于 子类分类区分 |
| 位置 / 空间 | 位于, 邻近, 接触, 包围 |
空间关系 |
| 比较 / 程度 | 大于, 小于, 等于, 类似, 不同, 优于 |
两节点在某维度比较 |
| 时序 | 之前, 之后, 同时, 期间, 持续, 起始于, 终止于 |
命题 / 事件间时间关系(与修饰谓词 发生时间 不同) |
| 模态 | 必须, 应该, 可能, 可以 |
命题级模态修饰 |
| 数量变化 | 增加, 减少(带方向;同义吸收 加强 / 减弱 / 提升 / 降低 / 缩短 / 扩大 / 节省) |
主体在某维度的方向性变化;常配 ()[程度](X 倍 / 百分比) |
3.2.3 不冻结的 family(按原文动词保留)
动作 / 事件:默认改写为 具有 / 需要 / 属于(见 §5.II)。三种例外保留事件谓词,直接用原文动词("击败"、"提出"、"毕业于"、"获得"、"发表"):
- 归属 / 优先权是关注点(学术优先权、履历语境、机构产出统计);
- 命题态度在场;
- 历史事件。
信息处理子类:激发 / 编码 / 转换 / 重塑 / 分解 / 识别 / 触发 等描述大脑 / 神经系统 / ML 模型内部机制的动词,按原文保留。压成 [具有] X 能力 会丢失 "active processing 不是 static capability" 的语义。
3.2.4 常见动词归并参考
抽取者首次遇到下列表层动词时,按此归并:
| 表层动词 | 归并到 | 判别 |
|---|---|---|
| 借鉴 / 受...启发 / 源自 / 来自 | 起始于(时序) |
技术血统 / 概念溯源 |
| 启发 / 激发 / 推动 / 驱动 | 导致(因果) |
因果触发;agentive 语气不保留 |
| 采用 / 使用 / 引入 | 包括 / 通过 |
含 X 用 包括;"通过 X 实现 Y" 用 通过 |
| 结合 / 配合 / 协同 | 相关于 / 包括 |
平等结合 → 相关于;一方为整体 → 包括 |
| 模仿 / 复制 / 仿照 | 同义 / 起始于 |
结构复制 → 同义;设计血统 → 起始于 |
| 帮助 / 助力 / 辅助 | 实现 / 导致 |
落地状态节点 → 实现;后果 → 导致 |
| 提升 / 加强 / 缩短 / 节省 / 加速 | 增加 / 减少 |
数量变化 family,带方向 |
| 减弱 / 衰减 / 放缓 | 减少 |
同上 |
| 涉及 / 覆盖 / 跨越 | 包括 |
整体→部分 |
3.2.5 [实现] 辨别
实现 是桥接 family 基础成员,但易被误用为万能桥。
{S}[实现]{A} 中 A 的形态 |
正确归属 | 改写示例 |
|---|---|---|
| 状态 / 能力 / 解决方案节点 | 桥接(保留 实现) |
{基于 GAN 模型}[实现]{源域到目标域转换} |
| 与 S 同质的对象 / 事件节点(A "就是" S 的别名) | [同义] |
{DQN}[实现]{RL 与 DL 整合} → {DQN}[同义]{RL 与 DL 整合} |
| 已发生的具体后果 / 度量结果 | [导致] 或 [属于] |
{DQN}[实现]{Atari 专家级} → {DQN}[导致]{Atari 专家级表现} |
判别:去掉 [实现],问 "S 把这个状态 / 能力落地了吗?"——是 → 桥接;否 → 改写。
3.3 修饰谓词(开放,约 17 个基础成员)
出现在 ()[修饰谓词](值) 行,给主 unit 附加上下文。主语统一为上一条主 unit。
| 类别 | 基础成员 | 含义 |
|---|---|---|
| 来源 | 证据(= 出处) |
事实来自谁 / 哪篇论文(叙述外壳标准着陆点) |
| 时空 | 发生时间, 地点 |
unit 成立的时间 / 地点 |
| 体貌 | 动作阶段 |
完成 / 进行 / 经验 / 起始 / 持续;缺省 = 完成 |
| 谓词修饰 | 方式, 程度, 范围 |
优先拆到这里,再考虑细化谓词节点 |
| 论元角色 | 工具, 源, 目标, 接受者, 候选, 依据 |
用什么 / 从哪 / 到哪 / 给谁 / 在哪些里挑 / 按什么 |
| 辖域 | 量化, 否定辖域 |
量化:全称 / 存在 / 数量(n);否定辖域:否定作用项(与 negates 区分) |
| 语句级 | 模态, 置信度 |
模态:能 / 必须 / 可能 / 应该;含作者主观取向。置信度:直接 / 推断 / 传闻;high / low。评论 / 观点文体默认 low |
修饰谓词不封闭,按需新增,但应优先复用。
3.4 谓词派生
修饰过的谓词亦为节点,用 M[的]{基础谓词} 派生。B 必须 {},M 可 {} 或 (...) 但不属于 §2.3 hedge 类。
例:
{提升}[的]{需要} 派生 [需要提升]
{降低}[的]{需要} 派生 [需要降低]
否定式断言:(否定)[的]{基础谓词} 派生,与 不需要 / 不属于 / 不存在 / 不具有 同形态:
(否定)[的]{需要} 派生 [不需要]
{单独的记忆}[不具有]{独立存在性}
优先级:副词 / 程度 / 范围 / 时间优先拆到修饰行,谓词留在 family 基础成员;仅当修饰已融入核心动词语义无法拆分时,才另立新谓词节点。
反例:(以独特方式深刻)[的]{塑造}——"深刻" 属主观评价、"以独特方式" 属表层修辞,应化为 {塑造}[谓词]{...} + ()[方式]{独特} + ()[程度](深刻)。同理 (于1997年)[的]{击败} 应化为 {击败} + ()[发生时间]{1997}。
§4 Unit
图中只有一种结构单元:unit。
4.1 Unit 形态
{主体}[谓词]{论元}, {论元}, ...
| 位置 | 数量 | 角色 |
|---|---|---|
| 主体 | 1 个节点 | unit 的入口;反向索引由它登记 |
| 谓词 | 1 个节点 | 承载关系类型 |
| 论元 | 0 至 N 个节点,逗号分隔 | 其他参与方 |
主体单一为约定,不写作 {深蓝, 卡斯帕罗夫}。论元的反向索引由 §7.1 context_mentions 登记。
例:
{深蓝}[击败]{卡斯帕罗夫}
{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
{算法}[具有]() # 0 论元合法
4.2 修饰行
主 unit 后可附若干修饰行,第一括号留空:
()[修饰谓词](值)
() 展开规则:指向同一段(被空行或下一条非空主 unit 终止之前)内最近一条非 () 开头的主 unit。段终止后 () 不再有指代。
修饰行同等地位为 unit,进 subject_mentions / context_mentions;写作 ()[…](…) 仅为避免重复主 unit ID。值同样按 §2.2 测试标记 {} 或 (...)。
例:
{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
()[证据]{论文-IAA}
()[发生时间]{2017}
()[程度](非常) # 程度副词不承载
()[置信度](low) # 元标签不承载
4.3 派生节点 M[的]B
引用比已有节点更窄的概念时,先写一条 M[的]B 主 unit 引入派生节点。
合法性约束:
- 渲染名
{MB}整体通过 §2.2 测试; - M 不属于 §2.3 的 hedge 类;
- M、B 各按 standalone 是否承载信息标记
{}或(...)。
满足 1+2 后,四种组合均合法:
| 形态 | 例 | 渲染名 |
|---|---|---|
{M}[的]{B} |
{无监督}[的]{领域自适应算法} |
{无监督领域自适应算法} |
{M}[的](B) |
{现代机器学习算法}[的](训练) |
{现代机器学习算法训练} |
(M)[的]{B} |
(精心注释)[的]{图像数据集} |
{精心注释图像数据集} |
(M)[的](B) |
(基于 GAN)[的](模型) |
{基于 GAN 模型} |
非法形态及修复——M 为纯 hedge:
| 非法 | 改写 |
|---|---|
(更高级)[的]{设计描述语言} |
{高级}[的]{设计描述语言} + ()[程度](更) |
(完善)[的]{方法学} |
{方法学} + ()[置信度](完善) |
(非常)[的]{昂贵} |
{昂贵} + ()[程度](非常) |
(亟待解决)[的](问题) |
(问题) + ()[模态](亟待解决) |
否定派生:(否定)[的]{X},渲染 [不 X],专用于否定式断言。
引用方式:后续 unit 直接以渲染名引用,不再重复声明派生关系:
{基于 GAN 模型}[实现]{源域到目标域转换}
{现代机器学习算法训练}[需要]{精心注释图像数据集}
派生关系沿 的 主 unit 反查(§7.1 narrowed_by 索引)。
4.4 嵌套与局部 ID
意图、因果、条件、命题态度需要把另一些 unit 作为论元装入时,给被嵌套 unit 起段内局部 ID(u_a / u_b / ...),在外层 unit 论元位上引用:
{真实世界}[具有]{复杂性}, {不完美性} # u_a
{深度强化学习}[需要提升]{性能}, {鲁棒性} # u_b
{想象增强智能体}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}, {论文-IAA}
局部 ID 仅在本段内有效。跨段引用须用持久 unit ID(如 s2.u3)。
4.5 同义命名
与普通 unit 同形态,谓词为 同义:
{论文-IAA}[同义]{《深度强化学习的想象增强智能体》}
两边在查询时可互换。
4.6 不输出的内容
- 无认知内容的填充词("其实"、"嘛"、"啊" 作语气而非内容时);
- 纯重复 / 同义反复;
- 纯表层语言学功能、不携带认知内容的虚词。
焦点、被动主动、句末语气词等并非默认丢弃——其承载的认知内容(强调、施受、句类、信息来源)通过修饰行表达;仅在纯表层时丢弃。
§5 抽取原则
每条 unit 必须同时满足下面四条;非顺序步骤,是约束的合取。
I 事实优先(思考操作:整合)
规则:动词属元话语动词族时,跳过它进宾语找事实;元话语主语降级为 ()[证据](S)。
元话语动词族:
言说:提出 / 介绍 / 阐释 / 主张 / 报道 / 发表 / 题为 / 写道 / 论证 / 总结
观察:测试 / 验证 / 观察 / 发现 / 记录
模板:
原文:S [元话语动词] X,X 的内容是 ...
抽取:{X}[内容动词]{...}
()[证据]{S}
例外——叙述事件本身即世界事实,不能降级:
- 归属 / 优先权是关注点(学术优先权语境、履历语境、机构产出统计);
- 命题态度在场("X 怀疑 Y"——态度本身是事实);
- 历史事件("深蓝击败卡斯帕罗夫"、"韩玫毕业于清华")。
判别:去掉该动词,宾语作为独立事实是否仍然成立且更纯净?是 → 降级;否 → 保留。
II 最具体的标识符(思考操作:整合)
规则:主体 / 谓词 / 论元 / 修饰行值——每个位置都用最具体的稳定标识符。概念比已有标识符更窄时,写一条 (修饰)[的](基础) 主 unit 引入派生节点。
对称适用于所有位置:
- 主体 / 论元值上:"入选微芯片" ≠ 微芯片;
- 谓词位上:"以独特方式深刻塑造" ≠ 塑造;"于 1997 年击败" ≠ 击败。
典型操作——把一次性动作改写为持久的状态 / 需求:
<S>[做]<P of O> → {O}[需要 / 具有]{P}
+ bridge unit {S}[家族成员]{O 的需求 / 状态}
动作是一次性的,状态 / 需求是领域级持久事实;入口挂到这一层,新方法可归到同一标识符。bridge unit 仅在 S 从主 unit 消失时必要;S 在图里别处保留时(如 {DeepMind}[提出]{X})冗余。
例:
原文:DeepMind 提升了智能体在复杂环境中的学习效率
抽取:{智能体}[需要提升]{学习效率}
()[范围]{环境}
()[程度](复杂)
()[证据]{DeepMind}
III 嵌套修饰(思考操作:推理)
规则:modal / 意图 / 因果 / 条件 / 态度 / 引用 / 嵌入子句——一切对命题做的修饰或操作都装到外层 unit 的论元位,被嵌套的内层 unit 用段内局部 ID 引用。禁止用句法连词切碎为同层平行断言。
意图链(in order to thereby)——"从而" 在目的语境为未发生意图链,非因果结果;所有子目标共享一条 [目的是] 主 unit:
原文:DeepMind 提出 X,旨在应对真实世界的复杂性,从而提升深度强化学习的性能
{真实世界}[具有]{复杂性} # u_a
{深度强化学习}[需要提升]{性能} # u_b
{X}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}
因果链——主体是因,论元是果:
原文:真实世界规则不明确,使得在此类环境中进行想象耗时耗力
{真实世界}[具有]{规则不明确性} # u_a
{在真实世界中进行想象}[具有]{耗时耗力特征} # u_b
{u_a}[导致]{u_b}
模态 / 条件——模态 family 必须 / 应该 / 可能 直接修饰单条命题;条件关系用 必要条件 / 充分条件 二元谓词:
原文:要让算法执行复杂行为,就必须使其具备对未来推理的能力
{算法}[执行]{行为} # u_a 目标命题
()[程度](复杂)
{算法}[具有]{对未来推理的能力} # u_b 必需条件
{u_b}[必要条件]{u_a}
命题态度——把宾语命题名词化或装入嵌套:
原文:研究者认为该方法不可行
{该方法}[具有]{不可行性} # u_a
{研究者}[认为]{u_a}
IV 自洽(思考操作:自洽)
规则:图永不能同时存在两条互相矛盾的 unit。
操作:新 unit 入库前查 subject_mentions[新 unit.主体] 反查到的小集合;若主体重合 + 修饰行一致 + 谓词互为否定(通过 negates unit 查得),用 被取代 主 unit 把旧 unit 标为被取代,带时间戳。旧 unit 保留供审计;常态查询沿 ⇒ 链取末端。
§6 抽取流程
按以下顺序处理一段原文:
-
句法解析——识别小句、动词、论元、修饰、连词、辖域算子。
-
语言层预处理:
- 指代还原——人称代词、零指代("去了商店,买了苹果,很甜" → "[他]去了商店,[他]买了苹果,[苹果]很甜");
- 特殊句式标准化:
- 把字句 / 被字句 →
<施事>[谓词]<受事>; - 兼语句 → 致使 unit + 嵌套子 unit;
- 连动句 → 多条 unit,按时序 / 目的连;
- 是字句 / 有字句 →
属于/具有静态谓词; - 比较句 → 比较 / 程度 family + 修饰行
维度/参照;
- 把字句 / 被字句 →
- 辖域识别——决定否定 / 量化 / 模态的辖域归属(谓词自身用
negates、修饰行用量化/否定辖域、嵌套外层走 §5.III); - 句类识别——非陈述句(疑问 / 祈使 / 感叹)通过命题态度 family wrapping 变成 unit;语气词字面形式不输出。
-
复句拆分——按因果 / 转折 / 时序 / 目的 / 条件 / 让步切分。
-
逐条 unit——选谓词(归 family 基础成员)→ 定主体(≥1 个具体节点)→ 补修饰行;同时满足 §5 四原则。节点位置的
{}/()标记按 §2.2 测试逐节点判断。 -
入库——§5.IV 查冲突 → §7 索引自动更新。
§7 查询
7.1 反向索引(节点 → unit)
每个节点是一个 wiki 页面,按谓词 family 分组展示三块:
| 索引 | 含义 |
|---|---|
subject_mentions |
节点 → [作为主体出现的 unit ID] |
context_mentions |
节点 → [作为论元 / 修饰行值出现但不是主体的 unit ID] |
narrowed_by |
节点 → [以它为基础的派生节点](沿 的 主 unit 反查论元位) |
例:"1997 深蓝击败卡斯帕罗夫" → subject_mentions[深蓝] += 它,context_mentions[卡斯帕罗夫] += 它,context_mentions[1997] += 它。
7.2 判断索引(高频)
| 索引 | 含义 | 自动派生自 |
|---|---|---|
| ≡ | 两条 unit 等价 / 可互换 | 同义 主 unit |
| ↔ | 相关但说不清逻辑关系 | 相关于 主 unit |
| ⇒ | 后者取代前者 | 被取代 主 unit,带时间戳 |
矛盾(⊥)按 §5.IV 在入库时已被 ⇒ 消解,不在此索引。
7.3 查询操作
| 操作 | 做法 |
|---|---|
| 打开节点页 | subject_mentions[X] 按谓词 family 分组 + narrowed_by[X] 列派生节点 |
| 继承推理 | 沿 属于 闭包传递;派生不参与 |
| 展开 family | 谓词 ∈ family 基础成员 → 沿 同义 + 的 闭包找所有变体 unit |
| 找因果链 | 谓词 ∈ "导致" family,沿 (因→果) 主体遍历 |
| 谁主张了 X | subject_mentions[X] ∩ 谓词 ∈ "主张" family |
| 追溯目的-手段 | 谓词 ∈ "目的是" family,沿论元里嵌套的子 unit 展开 |
| 查事实出处 | context_mentions[S] ∩ 谓词 = 证据 |
| 整合新 unit | 主体反查邻居 → LLM 判 ≡ / ↔ / 冲突;冲突走 §5.IV |
| 取最新事实 | 沿 ⇒ 链取末端,跳过被取代的旧 unit |
入库时的语义判断已固化到谓词 / 修饰行里。所有查询是图遍历,无在线 LLM 调用。
§8 Trade-off
| 取舍 | 内容 |
|---|---|
| 接受语言表达层信息损失 | 焦点 / 主题前置、口吻、句末语气词、被动主动等表层语序不输出;认知内容由命题态度 family 与修饰行承载 |
| 接受叙述外壳信息损失 | §5.I 默认把 "谁说的" 压成 ()[证据]。归属是关注点时(学术优先权、争议引述),须手动升回主 unit |
| 入库依赖 LLM | 指代消解、特殊句式标准化、辖域识别、谓词 family 归并、事实层 vs. 叙述外壳判别均需 LLM;常态查询不再需要 |
| 等价 / 矛盾判定靠 LLM pairwise | 不靠形式逻辑求解 |
| 不做严格形式推理 | 目标是组织和检索 unit,不是定理证明;如需可叠加形式化命题层 |
| 入库代价高于 RAG | 一次入库换长期可推理,常态使用不再付 LLM 成本 |