认知图：1.以谓词作为概念

认知图：以谓词作为概念

文档定位：规范态（spec）。

§1 总览

1.1 输入与输出

输入：自然语言文本。

输出：unit 集合——以世界中持久成立的事实与逻辑骨架为内容的结构化记录。

1.2 范围

对象：自然语言可表达的认知。图像、肌肉记忆、现象意识不在内。

接受的信息损失：

表层语序——焦点、主题前置、口吻、被动主动、句末语气词；其承载的认知内容由命题态度族与修饰行表达；
叙述外壳——"谁说的 / 谁阐释" 等元话语，降级为修饰行 ()[证据]。

1.3 系统部件

按以下层组成，后续章节依次定义：

层	章节	定义
节点	§2	unit 的最小构成单位，按是否承载信息二分
谓词	§3	unit 的关系类型，分结构 / 内容 / 修饰三类
unit	§4	由主体 + 谓词 + 论元构成的最小结构单元
抽取原则	§5	从原文到 unit 的转换约束
抽取流程	§6	实施原则的操作步骤
查询	§7	基于 unit 图的反向索引与遍历

1.4 记号约定

记号	含义
`{X}`	可查询节点（承载信息）
`(X)`	不可查询节点（修饰、派生组合的一部分）
`()` 空	修饰行回指占位
`<X>`	模板 / schema 槽位（说明用，不出现在 unit 文本里）
`[谓词]`	谓词位
`u_a` / `u_b` / …	段内局部 unit ID

§2 节点

2.1 节点形态

节点是 unit 中的最小构成单位。出现位置：主体、谓词、论元、修饰行的值。同一节点全图唯一。

2.2 Queryability 标记

每个节点位置按是否承载信息二分：

标记	定义
`{X}`	承载者：在文档所属域内，X 单独出现能稳定指向具体事物 / 概念 / 类，且关于 X 的事实是 non-trivial 且 non-vacuous 的
`(X)`	非承载者：仅作修饰、描述或派生组合的一部分，不能独立承载信息

域相对性：标记按文档所属域判定，同一文档内一致。同一词在不同域可能不同——"图像" 在 CS 视觉域为 (图像)，在艺术史域可能为 {图像}。

判别测试——任一通过 → {X}，两者都不通过 → (X)：

测试 A：关于 X 是否能说出三件 non-trivial 的事？
测试 B：原文中 X 去掉所有修饰后，是否仍可独立成句作主语？

判别示例：

词	A	B	标记
张三	✓（出生年、雇主、毕业院校）	✓	`{张三}`
机器学习算法	✓（学习模式、监督性、典型成员）	✓	`{机器学习算法}`
训练	✗（仅有定义）	勉强	`(训练)`
非常	✗	✗	`(非常)`
图像数据集	✓（典型成员 ImageNet）	✓	`{图像数据集}`

抽取时机：标记由 LLM 在 §6 步骤 4 逐节点直接判断。

2.3 非承载者参考

下表为常见非承载者的归纳，供抽取时校准直觉；非字符串匹配规则，具体标记仍由 §2.2 测试逐节点判断。

评价 / hedge 类（在任何域几乎不可能成为承载者）：

类	成员
程度副词	非常 / 远远 / 十分 / 大大 / 极 / 更加
主观评价	重要 / 关键 / 优秀 / 完善 / 巨大 / 强大 / 著名 / 深刻 / 惊人 / 复杂
无锚比较	更高级 / 更强 / 更快 / 更好 / 越来越…（有明确基线则改写 `{X}[大于]{Y}`）
量化 hedge	大量 / 许多 / 一些 / 几乎
频率 / 模态 hedge	通常 / 往往 / 可能 / 希望 / 推测
强调 / 指示	真正的 / 所谓的 / 这样 / 某种 / 任何
通用描述词	典型 / 具体 / 常规 / 普通 / 一般 / 基本
时代 hedge	古老 / 过去 / 最近 / 近年（配具体时间则用 `()[发生时间]{1997}`）

通用角色名词（在 CS / ML 域 referent 过宽，需修饰特化）：

类	成员
过程 / 行为	训练 / 测试 / 评估 / 验证 / 学习 / 推理 / 调优 / 处理 / 转换
主体 / 容器	模型 / 方法 / 系统 / 框架 / 架构 / 工具 / 平台
数据 / 输入输出	数据 / 样本 / 信息 / 内容 / 输入 / 输出
模态	图像 / 文本 / 视频 / 音频 / 信号
抽象属性	特征 / 属性 / 能力 / 功能 / 性质 / 状态 / 维度
流程结构	过程 / 阶段 / 步骤 / 操作 / 动作 / 结果 / 效果
选择 / 替代	方案 / 选择 / 替代方案 / 选项 / 候选
资源 / 环境	资源 / 环境 / 场景

§3 谓词

谓词本身为节点，可被细化、同义、否定。分三类：结构、内容、修饰。

3.1 结构谓词（封闭，6 个）

不描述世界事实，描述 unit / 节点间的关系。每条有特定查询语义。

谓词	含义	查询语义
`同义`	A 与 B 等价 / 可互换。覆盖命名别名、跨语言对照、定义性 identity	派生 ≡ 索引；查询时节点合并
`属于`	X 是 Y 的真子类	沿继承闭包传递；Y 的全集断言适用于 X
`的`	`M[的]{B}` 引入派生节点 `{MB}`	不传递；派生节点上的特殊断言不推到 B
`相关于`	A、B 共现且语义相关，但说不清逻辑关系	派生 ↔ 索引
`negates`	两个谓词互为否定	§5.IV 矛盾判定
`被取代`	旧 unit 被新 unit 取代	派生 ⇒ 索引；常态查询取末端

3.2 内容谓词

描述世界事实。按 family 归并——同 family 成员在认知层等价（"应对" ≡ "处理" ≡ "解决"），下游遍历沿 同义 + 的 闭包找到所有变体；不同 family 不互通。

归并目标：表面可写 family 内任意同义动词，存储 / 查询时归并到基础成员。新成员通过 (新成员)[同义](基础成员) 入库。

3.2.1 单基础成员 family（family 内全部同义归并）

family	基础成员	同义成员
状态 / 属性	`具有`	是, 处于, 表现为
拥有 / 归属	`拥有`	占有, 持有
需求	`需要`	缺乏, 渴求, 要求
解决	`应对`	处理, 面对, 解决
通过	`通过`	借助, 利用, 经由
因果	`导致`	造成, 引起, 诱发
意图 / 目的	`目的是`	旨在, 为了, 借以
桥接（目的-手段-回应）	`实现`	回应, 服务于, 满足
命题态度（信）	`认为`	主张, 相信, 知道
命题态度（疑）	`怀疑`	与 `认为` 通过 `negates` 关联

3.2.2 多基础成员 family（family 内沿不同轴向，不可彼此合并）

family	基础成员	用途
部分-整体	`包括`（整体→部分）, `组成`（部分→整体）	与 `属于` 子类分类区分
位置 / 空间	`位于`, `邻近`, `接触`, `包围`	空间关系
比较 / 程度	`大于`, `小于`, `等于`, `类似`, `不同`, `优于`	两节点在某维度比较
时序	`之前`, `之后`, `同时`, `期间`, `持续`, `起始于`, `终止于`	命题 / 事件间时间关系（与修饰谓词 `发生时间` 不同）
模态	`必须`, `应该`, `可能`, `可以`	命题级模态修饰
数量变化	`增加`, `减少`（带方向；同义吸收 `加强` / `减弱` / `提升` / `降低` / `缩短` / `扩大` / `节省`）	主体在某维度的方向性变化；常配 `()[程度](X 倍 / 百分比)`

3.2.3 不冻结的 family（按原文动词保留）

动作 / 事件：默认改写为 具有 / 需要 / 属于（见 §5.II）。三种例外保留事件谓词，直接用原文动词（"击败"、"提出"、"毕业于"、"获得"、"发表"）：

归属 / 优先权是关注点（学术优先权、履历语境、机构产出统计）；
命题态度在场；
历史事件。

信息处理子类：激发 / 编码 / 转换 / 重塑 / 分解 / 识别 / 触发 等描述大脑 / 神经系统 / ML 模型内部机制的动词，按原文保留。压成 [具有] X 能力 会丢失 "active processing 不是 static capability" 的语义。

3.2.4 常见动词归并参考

抽取者首次遇到下列表层动词时，按此归并：

表层动词	归并到	判别
借鉴 / 受...启发 / 源自 / 来自	`起始于`（时序）	技术血统 / 概念溯源
启发 / 激发 / 推动 / 驱动	`导致`（因果）	因果触发；agentive 语气不保留
采用 / 使用 / 引入	`包括` / `通过`	含 X 用 `包括`；"通过 X 实现 Y" 用 `通过`
结合 / 配合 / 协同	`相关于` / `包括`	平等结合 → `相关于`；一方为整体 → `包括`
模仿 / 复制 / 仿照	`同义` / `起始于`	结构复制 → `同义`；设计血统 → `起始于`
帮助 / 助力 / 辅助	`实现` / `导致`	落地状态节点 → `实现`；后果 → `导致`
提升 / 加强 / 缩短 / 节省 / 加速	`增加` / `减少`	数量变化 family，带方向
减弱 / 衰减 / 放缓	`减少`	同上
涉及 / 覆盖 / 跨越	`包括`	整体→部分

3.2.5 `[实现]` 辨别

实现 是桥接 family 基础成员，但易被误用为万能桥。

`{S}[实现]{A}` 中 A 的形态	正确归属	改写示例
状态 / 能力 / 解决方案节点	桥接（保留 `实现`）	`{基于 GAN 模型}[实现]{源域到目标域转换}`
与 S 同质的对象 / 事件节点（A "就是" S 的别名）	`[同义]`	`{DQN}[实现]{RL 与 DL 整合}` → `{DQN}[同义]{RL 与 DL 整合}`
已发生的具体后果 / 度量结果	`[导致]` 或 `[属于]`	`{DQN}[实现]{Atari 专家级}` → `{DQN}[导致]{Atari 专家级表现}`

判别：去掉 [实现]，问 "S 把这个状态 / 能力落地了吗？"——是 → 桥接；否 → 改写。

3.3 修饰谓词（开放，约 17 个基础成员）

出现在 ()[修饰谓词](值) 行，给主 unit 附加上下文。主语统一为上一条主 unit。

类别	基础成员	含义
来源	`证据`（= `出处`）	事实来自谁 / 哪篇论文（叙述外壳标准着陆点）
时空	`发生时间`, `地点`	unit 成立的时间 / 地点
体貌	`动作阶段`	完成 / 进行 / 经验 / 起始 / 持续；缺省 = 完成
谓词修饰	`方式`, `程度`, `范围`	优先拆到这里，再考虑细化谓词节点
论元角色	`工具`, `源`, `目标`, `接受者`, `候选`, `依据`	用什么 / 从哪 / 到哪 / 给谁 / 在哪些里挑 / 按什么
辖域	`量化`, `否定辖域`	量化：全称 / 存在 / 数量(n)；否定辖域：否定作用项（与 `negates` 区分）
语句级	`模态`, `置信度`	模态：能 / 必须 / 可能 / 应该；含作者主观取向。置信度：直接 / 推断 / 传闻；high / low。评论 / 观点文体默认 `low`

修饰谓词不封闭，按需新增，但应优先复用。

3.4 谓词派生

修饰过的谓词亦为节点，用 M[的]{基础谓词} 派生。B 必须 {}，M 可 {} 或 (...) 但不属于 §2.3 hedge 类。

例：

{提升}[的]{需要}              派生 [需要提升]
{降低}[的]{需要}              派生 [需要降低]

否定式断言：(否定)[的]{基础谓词} 派生，与 不需要 / 不属于 / 不存在 / 不具有 同形态：

(否定)[的]{需要}              派生 [不需要]
{单独的记忆}[不具有]{独立存在性}

优先级：副词 / 程度 / 范围 / 时间优先拆到修饰行，谓词留在 family 基础成员；仅当修饰已融入核心动词语义无法拆分时，才另立新谓词节点。

反例：(以独特方式深刻)[的]{塑造}——"深刻" 属主观评价、"以独特方式" 属表层修辞，应化为 {塑造}[谓词]{...} + ()[方式]{独特} + ()[程度](深刻)。同理 (于1997年)[的]{击败} 应化为 {击败} + ()[发生时间]{1997}。

§4 Unit

图中只有一种结构单元：unit。

4.1 Unit 形态

{主体}[谓词]{论元}, {论元}, ...

位置	数量	角色
主体	1 个节点	unit 的入口；反向索引由它登记
谓词	1 个节点	承载关系类型
论元	0 至 N 个节点，逗号分隔	其他参与方

主体单一为约定，不写作 {深蓝, 卡斯帕罗夫}。论元的反向索引由 §7.1 context_mentions 登记。

例：

{深蓝}[击败]{卡斯帕罗夫}
{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
{算法}[具有]()                              # 0 论元合法

4.2 修饰行

主 unit 后可附若干修饰行，第一括号留空：

()[修饰谓词](值)

() 展开规则：指向同一段（被空行或下一条非空主 unit 终止之前）内最近一条非 () 开头的主 unit。段终止后 () 不再有指代。

修饰行同等地位为 unit，进 subject_mentions / context_mentions；写作 ()[…](…) 仅为避免重复主 unit ID。值同样按 §2.2 测试标记 {} 或 (...)。

例：

{想象增强智能体架构}[结合]{无模型方法}, {基于模型方法}
()[证据]{论文-IAA}
()[发生时间]{2017}
()[程度](非常)             # 程度副词不承载
()[置信度](low)            # 元标签不承载

4.3 派生节点 `M[的]B`

引用比已有节点更窄的概念时，先写一条 M[的]B 主 unit 引入派生节点。

合法性约束：

渲染名 {MB} 整体通过 §2.2 测试；
M 不属于 §2.3 的 hedge 类；
M、B 各按 standalone 是否承载信息标记 {} 或 (...)。

满足 1+2 后，四种组合均合法：

形态	例	渲染名
`{M}[的]{B}`	`{无监督}[的]{领域自适应算法}`	`{无监督领域自适应算法}`
`{M}[的](B)`	`{现代机器学习算法}[的](训练)`	`{现代机器学习算法训练}`
`(M)[的]{B}`	`(精心注释)[的]{图像数据集}`	`{精心注释图像数据集}`
`(M)[的](B)`	`(基于 GAN)[的](模型)`	`{基于 GAN 模型}`

非法形态及修复——M 为纯 hedge：

非法	改写
`(更高级)[的]{设计描述语言}`	`{高级}[的]{设计描述语言}` + `()[程度](更)`
`(完善)[的]{方法学}`	`{方法学}` + `()[置信度](完善)`
`(非常)[的]{昂贵}`	`{昂贵}` + `()[程度](非常)`
`(亟待解决)[的](问题)`	`(问题)` + `()[模态](亟待解决)`

否定派生：(否定)[的]{X}，渲染 [不 X]，专用于否定式断言。

引用方式：后续 unit 直接以渲染名引用，不再重复声明派生关系：

{基于 GAN 模型}[实现]{源域到目标域转换}
{现代机器学习算法训练}[需要]{精心注释图像数据集}

派生关系沿 的 主 unit 反查（§7.1 narrowed_by 索引）。

4.4 嵌套与局部 ID

意图、因果、条件、命题态度需要把另一些 unit 作为论元装入时，给被嵌套 unit 起段内局部 ID（u_a / u_b / ...），在外层 unit 论元位上引用：

{真实世界}[具有]{复杂性}, {不完美性}              # u_a
{深度强化学习}[需要提升]{性能}, {鲁棒性}          # u_b
{想象增强智能体}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}, {论文-IAA}

局部 ID 仅在本段内有效。跨段引用须用持久 unit ID（如 s2.u3）。

4.5 同义命名

与普通 unit 同形态，谓词为 同义：

{论文-IAA}[同义]{《深度强化学习的想象增强智能体》}

两边在查询时可互换。

4.6 不输出的内容

无认知内容的填充词（"其实"、"嘛"、"啊" 作语气而非内容时）；
纯重复 / 同义反复；
纯表层语言学功能、不携带认知内容的虚词。

焦点、被动主动、句末语气词等并非默认丢弃——其承载的认知内容（强调、施受、句类、信息来源）通过修饰行表达；仅在纯表层时丢弃。

§5 抽取原则

每条 unit 必须同时满足下面四条；非顺序步骤，是约束的合取。

I 事实优先（思考操作：整合）

规则：动词属元话语动词族时，跳过它进宾语找事实；元话语主语降级为 ()[证据](S)。

元话语动词族：

言说：提出 / 介绍 / 阐释 / 主张 / 报道 / 发表 / 题为 / 写道 / 论证 / 总结
观察：测试 / 验证 / 观察 / 发现 / 记录

模板：

原文：S [元话语动词] X，X 的内容是 ...
抽取：{X}[内容动词]{...}
      ()[证据]{S}

例外——叙述事件本身即世界事实，不能降级：

归属 / 优先权是关注点（学术优先权语境、履历语境、机构产出统计）；
命题态度在场（"X 怀疑 Y"——态度本身是事实）；
历史事件（"深蓝击败卡斯帕罗夫"、"韩玫毕业于清华"）。

判别：去掉该动词，宾语作为独立事实是否仍然成立且更纯净？是 → 降级；否 → 保留。

II 最具体的标识符（思考操作：整合）

规则：主体 / 谓词 / 论元 / 修饰行值——每个位置都用最具体的稳定标识符。概念比已有标识符更窄时，写一条 (修饰)[的](基础) 主 unit 引入派生节点。

对称适用于所有位置：

主体 / 论元值上："入选微芯片" ≠ 微芯片；
谓词位上："以独特方式深刻塑造" ≠ 塑造；"于 1997 年击败" ≠ 击败。

典型操作——把一次性动作改写为持久的状态 / 需求：

<S>[做]<P of O>        →    {O}[需要 / 具有]{P}
                       +    bridge unit {S}[家族成员]{O 的需求 / 状态}

动作是一次性的，状态 / 需求是领域级持久事实；入口挂到这一层，新方法可归到同一标识符。bridge unit 仅在 S 从主 unit 消失时必要；S 在图里别处保留时（如 {DeepMind}[提出]{X}）冗余。

例：

原文：DeepMind 提升了智能体在复杂环境中的学习效率
抽取：{智能体}[需要提升]{学习效率}
      ()[范围]{环境}
      ()[程度](复杂)
      ()[证据]{DeepMind}

III 嵌套修饰（思考操作：推理）

规则：modal / 意图 / 因果 / 条件 / 态度 / 引用 / 嵌入子句——一切对命题做的修饰或操作都装到外层 unit 的论元位，被嵌套的内层 unit 用段内局部 ID 引用。禁止用句法连词切碎为同层平行断言。

意图链（in order to thereby）——"从而" 在目的语境为未发生意图链，非因果结果；所有子目标共享一条 [目的是] 主 unit：

原文：DeepMind 提出 X，旨在应对真实世界的复杂性，从而提升深度强化学习的性能

{真实世界}[具有]{复杂性}                    # u_a
{深度强化学习}[需要提升]{性能}              # u_b
{X}[目的是]{u_a}, {u_b}
()[证据]{DeepMind}

因果链——主体是因，论元是果：

原文：真实世界规则不明确，使得在此类环境中进行想象耗时耗力

{真实世界}[具有]{规则不明确性}              # u_a
{在真实世界中进行想象}[具有]{耗时耗力特征}    # u_b
{u_a}[导致]{u_b}

模态 / 条件——模态 family 必须 / 应该 / 可能 直接修饰单条命题；条件关系用 必要条件 / 充分条件 二元谓词：

原文：要让算法执行复杂行为，就必须使其具备对未来推理的能力

{算法}[执行]{行为}                          # u_a  目标命题
()[程度](复杂)
{算法}[具有]{对未来推理的能力}              # u_b  必需条件
{u_b}[必要条件]{u_a}

命题态度——把宾语命题名词化或装入嵌套：

原文：研究者认为该方法不可行

{该方法}[具有]{不可行性}                    # u_a
{研究者}[认为]{u_a}

IV 自洽（思考操作：自洽）

规则：图永不能同时存在两条互相矛盾的 unit。

操作：新 unit 入库前查 subject_mentions[新 unit.主体] 反查到的小集合；若主体重合 + 修饰行一致 + 谓词互为否定（通过 negates unit 查得），用 被取代 主 unit 把旧 unit 标为被取代，带时间戳。旧 unit 保留供审计；常态查询沿 ⇒ 链取末端。

§6 抽取流程

按以下顺序处理一段原文：

句法解析——识别小句、动词、论元、修饰、连词、辖域算子。
语言层预处理：
- 指代还原——人称代词、零指代（"去了商店，买了苹果，很甜" → "[他]去了商店，[他]买了苹果，[苹果]很甜"）；
- 特殊句式标准化：
  - 把字句 / 被字句 → <施事>[谓词]<受事>；
  - 兼语句 → 致使 unit + 嵌套子 unit；
  - 连动句 → 多条 unit，按时序 / 目的连；
  - 是字句 / 有字句 → 属于 / 具有 静态谓词；
  - 比较句 → 比较 / 程度 family + 修饰行 维度 / 参照；
- 辖域识别——决定否定 / 量化 / 模态的辖域归属（谓词自身用 negates、修饰行用 量化 / 否定辖域、嵌套外层走 §5.III）；
- 句类识别——非陈述句（疑问 / 祈使 / 感叹）通过命题态度 family wrapping 变成 unit；语气词字面形式不输出。
复句拆分——按因果 / 转折 / 时序 / 目的 / 条件 / 让步切分。
逐条 unit——选谓词（归 family 基础成员）→ 定主体（≥1 个具体节点）→ 补修饰行；同时满足 §5 四原则。节点位置的 {}/() 标记按 §2.2 测试逐节点判断。
入库——§5.IV 查冲突 → §7 索引自动更新。

§7 查询

7.1 反向索引（节点 → unit）

每个节点是一个 wiki 页面，按谓词 family 分组展示三块：

索引	含义
`subject_mentions`	节点 → [作为主体出现的 unit ID]
`context_mentions`	节点 → [作为论元 / 修饰行值出现但不是主体的 unit ID]
`narrowed_by`	节点 → [以它为基础的派生节点]（沿 `的` 主 unit 反查论元位）

例："1997 深蓝击败卡斯帕罗夫" → subject_mentions[深蓝] += 它，context_mentions[卡斯帕罗夫] += 它，context_mentions[1997] += 它。

7.2 判断索引（高频）

索引	含义	自动派生自
≡	两条 unit 等价 / 可互换	`同义` 主 unit
↔	相关但说不清逻辑关系	`相关于` 主 unit
⇒	后者取代前者	`被取代` 主 unit，带时间戳

矛盾（⊥）按 §5.IV 在入库时已被 ⇒ 消解，不在此索引。

7.3 查询操作

操作	做法
打开节点页	`subject_mentions[X]` 按谓词 family 分组 + `narrowed_by[X]` 列派生节点
继承推理	沿 `属于` 闭包传递；派生不参与
展开 family	谓词 ∈ family 基础成员 → 沿 `同义` + `的` 闭包找所有变体 unit
找因果链	谓词 ∈ "导致" family，沿 (因→果) 主体遍历
谁主张了 X	`subject_mentions[X]` ∩ 谓词 ∈ "主张" family
追溯目的-手段	谓词 ∈ "目的是" family，沿论元里嵌套的子 unit 展开
查事实出处	`context_mentions[S]` ∩ 谓词 = `证据`
整合新 unit	主体反查邻居 → LLM 判 ≡ / ↔ / 冲突；冲突走 §5.IV
取最新事实	沿 ⇒ 链取末端，跳过被取代的旧 unit

入库时的语义判断已固化到谓词 / 修饰行里。所有查询是图遍历，无在线 LLM 调用。

§8 Trade-off

取舍	内容
接受语言表达层信息损失	焦点 / 主题前置、口吻、句末语气词、被动主动等表层语序不输出；认知内容由命题态度 family 与修饰行承载
接受叙述外壳信息损失	§5.I 默认把 "谁说的" 压成 `()[证据]`。归属是关注点时（学术优先权、争议引述），须手动升回主 unit
入库依赖 LLM	指代消解、特殊句式标准化、辖域识别、谓词 family 归并、事实层 vs. 叙述外壳判别均需 LLM；常态查询不再需要
等价 / 矛盾判定靠 LLM pairwise	不靠形式逻辑求解
不做严格形式推理	目标是组织和检索 unit，不是定理证明；如需可叠加形式化命题层
入库代价高于 RAG	一次入库换长期可推理，常态使用不再付 LLM 成本

Transformer

KV Cache

ChatGLM3典型计算图

Tokenization

Transformer in CV

新方法

Attention是不是必须的

神经网络的逻辑

改进大规模训练稀疏自编码器的方法

Transformer NLP到底有没有智能？

LLM大语言模型的训练

Transformer黑盒

NSA 稀疏注意力机制 by deepseek

FlashAttention

MLA by Deekseek

幻觉

LLM信息空间的映射

LLM推理行为

梯度下降-拟合高层次的信息

生物脑（人脑）的优势

意识（自我）

人脑的工作原理

仿真人脑的基本条件

人脑的推理模型

人脑的本能

CoT & 强化学习

分层LLM推理与Scaling思维模板

自然语言的内在逻辑

RAG

记忆方法学

思维编织器 WeaveMind

记忆对于LLM的意义

人类记忆

大脑记忆的核心机制

现代汉语：语法解析

现在汉语：语法结构对SVO表示的挑战

认知图：1.以谓词作为概念

认知图：2.图构建方法

认知图：3.入库与查询流水线

Meaning Dataset 详细介绍文档

附带meaning tree信息的数据集

AI突破的可能

计算模型

自洽后就有意识了吗？

动态算法

短期记忆和长期记忆

通用Agent的发展

Agentic Engineering 智能体编排

Agent Harness 解剖：生产级智能体外壳的 12 个组件

私人LLM评测 数据集和结果

卷积计算的测试

复杂工程的实践测试

一种理想的智能体编排架构

理想架构-Harness12对照分析

基于关键词的知识图

认知图：1.以谓词作为概念

认知图：以谓词作为概念

§1 总览

1.1 输入与输出

1.2 范围

1.3 系统部件

1.4 记号约定

§2 节点

2.1 节点形态

2.2 Queryability 标记

2.3 非承载者参考

§3 谓词

3.1 结构谓词（封闭，6 个）

3.2 内容谓词

3.2.1 单基础成员 family（family 内全部同义归并）

3.2.2 多基础成员 family（family 内沿不同轴向，不可彼此合并）

3.2.3 不冻结的 family（按原文动词保留）

3.2.4 常见动词归并参考

3.2.5 [实现] 辨别

3.3 修饰谓词（开放，约 17 个基础成员）

3.4 谓词派生

§4 Unit

4.1 Unit 形态

4.2 修饰行

4.3 派生节点 M[的]B

私人LLM评测数据集和结果

3.2.5 `[实现]` 辨别

4.3 派生节点 `M[的]B`