# 认知图：1.以谓词作为概念

# 认知图：以谓词作为概念

文档定位：规范态（spec）。

***

## §1 总览

### 1.1 输入与输出

输入：自然语言文本。

输出：unit 集合——以世界中持久成立的事实与逻辑骨架为内容的结构化记录。

### 1.2 范围

对象：自然语言可表达的认知。图像、肌肉记忆、现象意识不在内。

接受的信息损失：

* 表层语序——焦点、主题前置、口吻、被动主动、句末语气词；其承载的认知内容由命题态度族与修饰行表达；
* 叙述外壳——"谁说的 / 谁阐释" 等元话语，降级为修饰行 `()[证据]`。

### 1.3 系统部件

按以下层组成，后续章节依次定义：

| 层 | 章节 | 定义 |
| - | - | - |
| 节点 | §2 | unit 的最小构成单位，按是否承载信息二分 |
| 谓词 | §3 | unit 的关系类型，分结构 / 内容 / 修饰三类 |
| unit | §4 | 由主体 + 谓词 + 论元构成的最小结构单元 |
| 抽取原则 | §5 | 从原文到 unit 的转换约束 |
| 抽取流程 | §6 | 实施原则的操作步骤 |
| 查询 | §7 | 基于 unit 图的反向索引与遍历 |

### 1.4 记号约定

| 记号 | 含义 |
| - | - |
| `{X}` | 可查询节点（承载信息）|
| `(X)` | 不可查询节点（修饰、派生组合的一部分）|
| `()` 空 | 修饰行回指占位 |
| `<X>` | 模板 / schema 槽位（说明用，不出现在 unit 文本里）|
| `[谓词]` | 谓词位 |
| `u_a` / `u_b` / … | 段内局部 unit ID |

***

## §2 节点

### 2.1 节点形态

节点是 unit 中的最小构成单位。出现位置：主体、谓词、论元、修饰行的值。同一节点全图唯一。

### 2.2 Queryability 标记

每个节点位置按是否承载信息二分：

| 标记 | 定义 |
| - | - |
| `{X}` | **承载者**：在文档所属域内，X 单独出现能稳定指向具体事物 / 概念 / 类，且关于 X 的事实是 non-trivial 且 non-vacuous 的 |
| `(X)` | **非承载者**：仅作修饰、描述或派生组合的一部分，不能独立承载信息 |

域相对性：标记按文档所属域判定，同一文档内一致。同一词在不同域可能不同——"图像" 在 CS 视觉域为 `(图像)`，在艺术史域可能为 `{图像}`。

判别测试——任一通过 → `{X}`，两者都不通过 → `(X)`：

* 测试 A：关于 X 是否能说出三件 non-trivial 的事？
* 测试 B：原文中 X 去掉所有修饰后，是否仍可独立成句作主语？

判别示例：

| 词 | A | B | 标记 |
| - | - | - | - |
| 张三 | ✓（出生年、雇主、毕业院校）| ✓ | `{张三}` |
| 机器学习算法 | ✓（学习模式、监督性、典型成员）| ✓ | `{机器学习算法}` |
| 训练 | ✗（仅有定义）| 勉强 | `(训练)` |
| 非常 | ✗ | ✗ | `(非常)` |
| 图像数据集 | ✓（典型成员 ImageNet）| ✓ | `{图像数据集}` |

抽取时机：标记由 LLM 在 §6 步骤 4 逐节点直接判断。

### 2.3 非承载者参考

下表为常见非承载者的归纳，供抽取时校准直觉；非字符串匹配规则，具体标记仍由 §2.2 测试逐节点判断。

评价 / hedge 类（在任何域几乎不可能成为承载者）：

| 类 | 成员 |
| - | - |
| 程度副词 | 非常 / 远远 / 十分 / 大大 / 极 / 更加 |
| 主观评价 | 重要 / 关键 / 优秀 / 完善 / 巨大 / 强大 / 著名 / 深刻 / 惊人 / 复杂 |
| 无锚比较 | 更高级 / 更强 / 更快 / 更好 / 越来越…（有明确基线则改写 `{X}[大于]{Y}`）|
| 量化 hedge | 大量 / 许多 / 一些 / 几乎 |
| 频率 / 模态 hedge | 通常 / 往往 / 可能 / 希望 / 推测 |
| 强调 / 指示 | 真正的 / 所谓的 / 这样 / 某种 / 任何 |
| 通用描述词 | 典型 / 具体 / 常规 / 普通 / 一般 / 基本 |
| 时代 hedge | 古老 / 过去 / 最近 / 近年（配具体时间则用 `()[发生时间]{1997}`）|

通用角色名词（在 CS / ML 域 referent 过宽，需修饰特化）：

| 类 | 成员 |
| - | - |
| 过程 / 行为 | 训练 / 测试 / 评估 / 验证 / 学习 / 推理 / 调优 / 处理 / 转换 |
| 主体 / 容器 | 模型 / 方法 / 系统 / 框架 / 架构 / 工具 / 平台 |
| 数据 / 输入输出 | 数据 / 样本 / 信息 / 内容 / 输入 / 输出 |
| 模态 | 图像 / 文本 / 视频 / 音频 / 信号 |
| 抽象属性 | 特征 / 属性 / 能力 / 功能 / 性质 / 状态 / 维度 |
| 流程结构 | 过程 / 阶段 / 步骤 / 操作 / 动作 / 结果 / 效果 |
| 选择 / 替代 | 方案 / 选择 / 替代方案 / 选项 / 候选 |
| 资源 / 环境 | 资源 / 环境 / 场景 |

***

## §3 谓词

谓词本身为节点，可被细化、同义、否定。分三类：结构、内容、修饰。

### 3.1 结构谓词（封闭，6 个）

不描述世界事实，描述 unit / 节点间的关系。每条有特定查询语义。

| 谓词 | 含义 | 查询语义 |
| - | - | - |
| `同义` | A 与 B 等价 / 可互换。覆盖命名别名、跨语言对照、定义性 identity | 派生 ≡ 索引；查询时节点合并 |
| `属于` | X 是 Y 的真子类 | 沿继承闭包传递；Y 的全集断言适用于 X |
| `的` | `M[的]{B}` 引入派生节点 `{MB}` | 不传递；派生节点上的特殊断言不推到 B |
| `相关于` | A、B 共现且语义相关，但说不清逻辑关系 | 派生 ↔ 索引 |
| `negates` | 两个谓词互为否定 | §5.IV 矛盾判定 |
| `被取代` | 旧 unit 被新 unit 取代 | 派生 ⇒ 索引；常态查询取末端 |

### 3.2 内容谓词

描述世界事实。按 family 归并——同 family 成员在认知层等价（"应对" ≡ "处理" ≡ "解决"），下游遍历沿 `同义` + `的` 闭包找到所有变体；不同 family 不互通。

归并目标：表面可写 family 内任意同义动词，存储 / 查询时归并到基础成员。新成员通过 `(新成员)[同义](基础成员)` 入库。

#### 3.2.1 单基础成员 family（family 内全部同义归并）

| family | 基础成员 | 同义成员 |
| - | - | - |
| 状态 / 属性 | `具有` | 是, 处于, 表现为 |
| 拥有 / 归属 | `拥有` | 占有, 持有 |
| 需求 | `需要` | 缺乏, 渴求, 要求 |
| 解决 | `应对` | 处理, 面对, 解决 |
| 通过 | `通过` | 借助, 利用, 经由 |
| 因果 | `导致` | 造成, 引起, 诱发 |
| 意图 / 目的 | `目的是` | 旨在, 为了, 借以 |
| 桥接（目的-手段-回应）| `实现` | 回应, 服务于, 满足 |
| 命题态度（信）| `认为` | 主张, 相信, 知道 |
| 命题态度（疑）| `怀疑` | 与 `认为` 通过 `negates` 关联 |

#### 3.2.2 多基础成员 family（family 内沿不同轴向，不可彼此合并）

| family | 基础成员 | 用途 |
| - | - | - |
| 部分-整体 | `包括`（整体→部分）, `组成`（部分→整体）| 与 `属于` 子类分类区分 |
| 位置 / 空间 | `位于`, `邻近`, `接触`, `包围` | 空间关系 |
| 比较 / 程度 | `大于`, `小于`, `等于`, `类似`, `不同`, `优于` | 两节点在某维度比较 |
| 时序 | `之前`, `之后`, `同时`, `期间`, `持续`, `起始于`, `终止于` | 命题 / 事件间时间关系（与修饰谓词 `发生时间` 不同）|
| 模态 | `必须`, `应该`, `可能`, `可以` | 命题级模态修饰 |
| 数量变化 | `增加`, `减少`（带方向；同义吸收 `加强` / `减弱` / `提升` / `降低` / `缩短` / `扩大` / `节省`）| 主体在某维度的方向性变化；常配 `()[程度](X 倍 / 百分比)` |

#### 3.2.3 不冻结的 family（按原文动词保留）

动作 / 事件：默认改写为 `具有 / 需要 / 属于`（见 §5.II）。三种例外保留事件谓词，直接用原文动词（"击败"、"提出"、"毕业于"、"获得"、"发表"）：

1. 归属 / 优先权是关注点（学术优先权、履历语境、机构产出统计）；
2. 命题态度在场；
3. 历史事件。

信息处理子类：`激发` / `编码` / `转换` / `重塑` / `分解` / `识别` / `触发` 等描述大脑 / 神经系统 / ML 模型内部机制的动词，按原文保留。压成 `[具有] X 能力` 会丢失 "active processing 不是 static capability" 的语义。

#### 3.2.4 常见动词归并参考

抽取者首次遇到下列表层动词时，按此归并：

| 表层动词 | 归并到 | 判别 |
| - | - | - |
| 借鉴 / 受...启发 / 源自 / 来自 | `起始于`（时序）| 技术血统 / 概念溯源 |
| 启发 / 激发 / 推动 / 驱动 | `导致`（因果）| 因果触发；agentive 语气不保留 |
| 采用 / 使用 / 引入 | `包括` / `通过` | 含 X 用 `包括`；"通过 X 实现 Y" 用 `通过` |
| 结合 / 配合 / 协同 | `相关于` / `包括` | 平等结合 → `相关于`；一方为整体 → `包括` |
| 模仿 / 复制 / 仿照 | `同义` / `起始于` | 结构复制 → `同义`；设计血统 → `起始于` |
| 帮助 / 助力 / 辅助 | `实现` / `导致` | 落地状态节点 → `实现`；后果 → `导致` |
| 提升 / 加强 / 缩短 / 节省 / 加速 | `增加` / `减少` | 数量变化 family，带方向 |
| 减弱 / 衰减 / 放缓 | `减少` | 同上 |
| 涉及 / 覆盖 / 跨越 | `包括` | 整体→部分 |

#### 3.2.5 `[实现]` 辨别

`实现` 是桥接 family 基础成员，但易被误用为万能桥。

| `{S}[实现]{A}` 中 A 的形态 | 正确归属 | 改写示例 |
| - | - | - |
| 状态 / 能力 / 解决方案节点 | 桥接（保留 `实现`）| `{基于 GAN 模型}[实现]{源域到目标域转换}` |
| 与 S 同质的对象 / 事件节点（A "就是" S 的别名）| `[同义]` | `{DQN}[实现]{RL 与 DL 整合}` → `{DQN}[同义]{RL 与 DL 整合}` |
| 已发生的具体后果 / 度量结果 | `[导致]` 或 `[属于]` | `{DQN}[实现]{Atari 专家级}` → `{DQN}[导致]{Atari 专家级表现}` |

判别：去掉 `[实现]`，问 "S 把这个状态 / 能力落地了吗？"——是 → 桥接；否 → 改写。

### 3.3 修饰谓词（开放，约 17 个基础成员）

出现在 `()[修饰谓词](值)` 行，给主 unit 附加上下文。主语统一为上一条主 unit。

| 类别 | 基础成员 | 含义 |
| - | - | - |
| 来源 | `证据`（= `出处`）| 事实来自谁 / 哪篇论文（叙述外壳标准着陆点）|
| 时空 | `发生时间`, `地点` | unit 成立的时间 / 地点 |
| 体貌 | `动作阶段` | 完成 / 进行 / 经验 / 起始 / 持续；缺省 = 完成 |
| 谓词修饰 | `方式`, `程度`, `范围` | 优先拆到这里，再考虑细化谓词节点 |
| 论元角色 | `工具`, `源`, `目标`, `接受者`, `候选`, `依据` | 用什么 / 从哪 / 到哪 / 给谁 / 在哪些里挑 / 按什么 |
| 辖域 | `量化`, `否定辖域` | 量化：全称 / 存在 / 数量(n)；否定辖域：否定作用项（与 `negates` 区分）|
| 语句级 | `模态`, `置信度` | 模态：能 / 必须 / 可能 / 应该；含作者主观取向。置信度：直接 / 推断 / 传闻；high / low。评论 / 观点文体默认 `low` |

修饰谓词不封闭，按需新增，但应优先复用。

### 3.4 谓词派生

修饰过的谓词亦为节点，用 `M[的]{基础谓词}` 派生。B 必须 `{}`，M 可 `{}` 或 `(...)` 但不属于 §2.3 hedge 类。

例：

```
{提升}[的]{需要}              派生 [需要提升]
{降低}[的]{需要}              派生 [需要降低]
```

否定式断言：`(否定)[的]{基础谓词}` 派生，与 `不需要` / `不属于` / `不存在` / `不具有` 同形态：

```
(否定)[的]{需要}              派生 [不需要]
{单独的记忆}[不具有]{独立存在性}
```

优先级：副词 / 程度 / 范围 / 时间优先拆到修饰行，谓词留在 family 基础成员；仅当修饰已融入核心动词语义无法拆分时，才另立新谓词节点。

反例：`(以独特方式深刻)[的]{塑造}`——"深刻" 属主观评价、"以独特方式" 属表层修辞，应化为 `{塑造}[谓词]{...}` + `()[方式]{独特}` + `()[程度](深刻)`。同理 `(于1997年)[的]{击败}` 应化为 `{击败}` + `()[发生时间]{1997}`。

***

## §4 Unit

图中只有一种结构单元：unit。

### 4.1 Unit 形态

```
{主体}[谓词]{论元}, {论元}, ...
```

| 位置 | 数量 | 角色 |
| - | - | - |
| 主体 | 1 个节点 | unit 的入口；反向索引由它登记 |
| 谓词 | 1 个节点 | 承载关系类型 |
| 论元 | 0 至 N 个节点，逗号分隔 | 其他参与方 |

主体单一为约定，不写作 `{深蓝, 卡斯帕罗夫}`。论元的反向索引由 §7.1 `context_mentions` 登记。

例：

```
{深蓝}[击败]{卡斯帕罗夫}
{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
{算法}[具有]()                              # 0 论元合法
```

### 4.2 修饰行

主 unit 后可附若干修饰行，第一括号留空：

```
()[修饰谓词](值)
```

`()` 展开规则：指向同一段（被空行或下一条非空主 unit 终止之前）内最近一条非 `()` 开头的主 unit。段终止后 `()` 不再有指代。

修饰行同等地位为 unit，进 `subject_mentions` / `context_mentions`；写作 `()[…](…)` 仅为避免重复主 unit ID。值同样按 §2.2 测试标记 `{}` 或 `(...)`。

例：

```
{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
()[证据]{论文-IAA}
()[发生时间]{2017}
()[程度](非常)             # 程度副词不承载
()[置信度](low)            # 元标签不承载
```

### 4.3 派生节点 `M[的]B`

引用比已有节点更窄的概念时，先写一条 `M[的]B` 主 unit 引入派生节点。

合法性约束：

1. 渲染名 `{MB}` 整体通过 §2.2 测试；
2. M 不属于 §2.3 的 hedge 类；
3. M、B 各按 standalone 是否承载信息标记 `{}` 或 `(...)`。

满足 1+2 后，四种组合均合法：

| 形态 | 例 | 渲染名 |
| - | - | - |
| `{M}[的]{B}` | `{无监督}[的]{领域自适应算法}` | `{无监督领域自适应算法}` |
| `{M}[的](B)` | `{现代机器学习算法}[的](训练)` | `{现代机器学习算法训练}` |
| `(M)[的]{B}` | `(精心注释)[的]{图像数据集}` | `{精心注释图像数据集}` |
| `(M)[的](B)` | `(基于 GAN)[的](模型)` | `{基于 GAN 模型}` |

非法形态及修复——M 为纯 hedge：

| 非法 | 改写 |
| - | - |
| `(更高级)[的]{设计描述语言}` | `{高级}[的]{设计描述语言}` + `()[程度](更)` |
| `(完善)[的]{方法学}` | `{方法学}` + `()[置信度](完善)` |
| `(非常)[的]{昂贵}` | `{昂贵}` + `()[程度](非常)` |
| `(亟待解决)[的](问题)` | `(问题)` + `()[模态](亟待解决)` |

否定派生：`(否定)[的]{X}`，渲染 `[不 X]`，专用于否定式断言。

引用方式：后续 unit 直接以渲染名引用，不再重复声明派生关系：

```
{基于 GAN 模型}[实现]{源域到目标域转换}
{现代机器学习算法训练}[需要]{精心注释图像数据集}
```

派生关系沿 `的` 主 unit 反查（§7.1 `narrowed_by` 索引）。

### 4.4 嵌套与局部 ID

意图、因果、条件、命题态度需要把另一些 unit 作为论元装入时，给被嵌套 unit 起段内局部 ID（`u_a` / `u_b` / ...），在外层 unit 论元位上引用：

```
{真实世界}[具有]{复杂性}, {不完美性}              # u_a
{深度强化学习}[需要提升]{性能}, {鲁棒性}          # u_b
{想象增强智能体}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}, {论文-IAA}
```

局部 ID 仅在本段内有效。跨段引用须用持久 unit ID（如 `s2.u3`）。

### 4.5 同义命名

与普通 unit 同形态，谓词为 `同义`：

```
{论文-IAA}[同义]{《深度强化学习的想象增强智能体》}
```

两边在查询时可互换。

### 4.6 不输出的内容

* 无认知内容的填充词（"其实"、"嘛"、"啊" 作语气而非内容时）；
* 纯重复 / 同义反复；
* 纯表层语言学功能、不携带认知内容的虚词。

焦点、被动主动、句末语气词等并非默认丢弃——其承载的认知内容（强调、施受、句类、信息来源）通过修饰行表达；仅在纯表层时丢弃。

***

## §5 抽取原则

每条 unit 必须同时满足下面四条；非顺序步骤，是约束的合取。

### I 事实优先（思考操作：整合）

规则：动词属元话语动词族时，跳过它进宾语找事实；元话语主语降级为 `()[证据](S)`。

元话语动词族：

```
言说：提出 / 介绍 / 阐释 / 主张 / 报道 / 发表 / 题为 / 写道 / 论证 / 总结
观察：测试 / 验证 / 观察 / 发现 / 记录
```

模板：

```
原文：S [元话语动词] X，X 的内容是 ...
抽取：{X}[内容动词]{...}
      ()[证据]{S}
```

例外——叙述事件本身即世界事实，不能降级：

1. 归属 / 优先权是关注点（学术优先权语境、履历语境、机构产出统计）；
2. 命题态度在场（"X 怀疑 Y"——态度本身是事实）；
3. 历史事件（"深蓝击败卡斯帕罗夫"、"韩玫毕业于清华"）。

判别：去掉该动词，宾语作为独立事实是否仍然成立且更纯净？是 → 降级；否 → 保留。

### II 最具体的标识符（思考操作：整合）

规则：主体 / 谓词 / 论元 / 修饰行值——每个位置都用最具体的稳定标识符。概念比已有标识符更窄时，写一条 `(修饰)[的](基础)` 主 unit 引入派生节点。

对称适用于所有位置：

* 主体 / 论元值上："入选微芯片" ≠ 微芯片；
* 谓词位上："以独特方式深刻塑造" ≠ 塑造；"于 1997 年击败" ≠ 击败。

典型操作——把一次性动作改写为持久的状态 / 需求：

```
<S>[做]<P of O>        →    {O}[需要 / 具有]{P}
                       +    bridge unit {S}[家族成员]{O 的需求 / 状态}
```

动作是一次性的，状态 / 需求是领域级持久事实；入口挂到这一层，新方法可归到同一标识符。bridge unit 仅在 S 从主 unit 消失时必要；S 在图里别处保留时（如 `{DeepMind}[提出]{X}`）冗余。

例：

```
原文：DeepMind 提升了智能体在复杂环境中的学习效率
抽取：{智能体}[需要提升]{学习效率}
      ()[范围]{环境}
      ()[程度](复杂)
      ()[证据]{DeepMind}
```

### III 嵌套修饰（思考操作：推理）

规则：modal / 意图 / 因果 / 条件 / 态度 / 引用 / 嵌入子句——一切对命题做的修饰或操作都装到外层 unit 的论元位，被嵌套的内层 unit 用段内局部 ID 引用。禁止用句法连词切碎为同层平行断言。

意图链（in order to thereby）——"从而" 在目的语境为未发生意图链，非因果结果；所有子目标共享一条 `[目的是]` 主 unit：

```
原文：DeepMind 提出 X，旨在应对真实世界的复杂性，从而提升深度强化学习的性能

{真实世界}[具有]{复杂性}                    # u_a
{深度强化学习}[需要提升]{性能}              # u_b
{X}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}
```

因果链——主体是因，论元是果：

```
原文：真实世界规则不明确，使得在此类环境中进行想象耗时耗力

{真实世界}[具有]{规则不明确性}              # u_a
{在真实世界中进行想象}[具有]{耗时耗力特征}    # u_b
{u_a}[导致]{u_b}
```

模态 / 条件——模态 family `必须` / `应该` / `可能` 直接修饰单条命题；条件关系用 `必要条件` / `充分条件` 二元谓词：

```
原文：要让算法执行复杂行为，就必须使其具备对未来推理的能力

{算法}[执行]{行为}                          # u_a  目标命题
()[程度](复杂)
{算法}[具有]{对未来推理的能力}              # u_b  必需条件
{u_b}[必要条件]{u_a}
```

命题态度——把宾语命题名词化或装入嵌套：

```
原文：研究者认为该方法不可行

{该方法}[具有]{不可行性}                    # u_a
{研究者}[认为]{u_a}
```

### IV 自洽（思考操作：自洽）

规则：图永不能同时存在两条互相矛盾的 unit。

操作：新 unit 入库前查 `subject_mentions[新 unit.主体]` 反查到的小集合；若主体重合 + 修饰行一致 + 谓词互为否定（通过 `negates` unit 查得），用 `被取代` 主 unit 把旧 unit 标为被取代，带时间戳。旧 unit 保留供审计；常态查询沿 ⇒ 链取末端。

***

## §6 抽取流程

按以下顺序处理一段原文：

1. 句法解析——识别小句、动词、论元、修饰、连词、辖域算子。

2. 语言层预处理：

    * 指代还原——人称代词、零指代（"去了商店，买了苹果，很甜" → "\[他]去了商店，\[他]买了苹果，\[苹果]很甜"）；
    * 特殊句式标准化：
        * 把字句 / 被字句 → `<施事>[谓词]<受事>`；
        * 兼语句 → 致使 unit + 嵌套子 unit；
        * 连动句 → 多条 unit，按时序 / 目的连；
        * 是字句 / 有字句 → `属于` / `具有` 静态谓词；
        * 比较句 → 比较 / 程度 family + 修饰行 `维度` / `参照`；
    * 辖域识别——决定否定 / 量化 / 模态的辖域归属（谓词自身用 `negates`、修饰行用 `量化` / `否定辖域`、嵌套外层走 §5.III）；
    * 句类识别——非陈述句（疑问 / 祈使 / 感叹）通过命题态度 family wrapping 变成 unit；语气词字面形式不输出。

3. 复句拆分——按因果 / 转折 / 时序 / 目的 / 条件 / 让步切分。

4. 逐条 unit——选谓词（归 family 基础成员）→ 定主体（≥1 个具体节点）→ 补修饰行；同时满足 §5 四原则。节点位置的 `{}/()` 标记按 §2.2 测试逐节点判断。

5. 入库——§5.IV 查冲突 → §7 索引自动更新。

***

## §7 查询

### 7.1 反向索引（节点 → unit）

每个节点是一个 wiki 页面，按谓词 family 分组展示三块：

| 索引 | 含义 |
| - | - |
| `subject_mentions` | 节点 → \[作为主体出现的 unit ID] |
| `context_mentions` | 节点 → \[作为论元 / 修饰行值出现但不是主体的 unit ID] |
| `narrowed_by` | 节点 → \[以它为基础的派生节点]（沿 `的` 主 unit 反查论元位）|

例："1997 深蓝击败卡斯帕罗夫" → `subject_mentions[深蓝] += 它`，`context_mentions[卡斯帕罗夫] += 它`，`context_mentions[1997] += 它`。

### 7.2 判断索引（高频）

| 索引 | 含义 | 自动派生自 |
| - | - | - |
| ≡ | 两条 unit 等价 / 可互换 | `同义` 主 unit |
| ↔ | 相关但说不清逻辑关系 | `相关于` 主 unit |
| ⇒ | 后者取代前者 | `被取代` 主 unit，带时间戳 |

矛盾（⊥）按 §5.IV 在入库时已被 ⇒ 消解，不在此索引。

### 7.3 查询操作

| 操作 | 做法 |
| - | - |
| 打开节点页 | `subject_mentions[X]` 按谓词 family 分组 + `narrowed_by[X]` 列派生节点 |
| 继承推理 | 沿 `属于` 闭包传递；派生不参与 |
| 展开 family | 谓词 ∈ family 基础成员 → 沿 `同义` + `的` 闭包找所有变体 unit |
| 找因果链 | 谓词 ∈ "导致" family，沿 (因→果) 主体遍历 |
| 谁主张了 X | `subject_mentions[X]` ∩ 谓词 ∈ "主张" family |
| 追溯目的-手段 | 谓词 ∈ "目的是" family，沿论元里嵌套的子 unit 展开 |
| 查事实出处 | `context_mentions[S]` ∩ 谓词 = `证据` |
| 整合新 unit | 主体反查邻居 → LLM 判 ≡ / ↔ / 冲突；冲突走 §5.IV |
| 取最新事实 | 沿 ⇒ 链取末端，跳过被取代的旧 unit |

入库时的语义判断已固化到谓词 / 修饰行里。所有查询是图遍历，无在线 LLM 调用。

***

## §8 Trade-off

| 取舍 | 内容 |
| - | - |
| 接受语言表达层信息损失 | 焦点 / 主题前置、口吻、句末语气词、被动主动等表层语序不输出；认知内容由命题态度 family 与修饰行承载 |
| 接受叙述外壳信息损失 | §5.I 默认把 "谁说的" 压成 `()[证据]`。归属是关注点时（学术优先权、争议引述），须手动升回主 unit |
| 入库依赖 LLM | 指代消解、特殊句式标准化、辖域识别、谓词 family 归并、事实层 vs. 叙述外壳判别均需 LLM；常态查询不再需要 |
| 等价 / 矛盾判定靠 LLM pairwise | 不靠形式逻辑求解 |
| 不做严格形式推理 | 目标是组织和检索 unit，不是定理证明；如需可叠加形式化命题层 |
| 入库代价高于 RAG | 一次入库换长期可推理，常态使用不再付 LLM 成本 |