记忆对于LLM的意义



记忆是实现人性化的必要条件


稳定的长期记忆

现有模型的推理能力已经足够强,真正缺的是稳定的长期记忆。

我们需要那么多智能体协作,恰恰是因为一个智能体记不住所有事情。

图数据库


LLM实现记忆实现方法

  1. LLM大模型的权重

    1. 能进行一定深度和广度的处理能力,但是整体深度还是达不到人脑
    2. 需要通过及其复杂的梯度下降,不能快速存储特定数据,更新困难、无法追溯
    3. 黑盒,不确定性高,“增删改”不方便
    4. 计算资源消耗大,虽然有MoE
  2. KVCache 等运行态中间变量

    1. 存储密度比较低,存储容量上限低

      1. 相对于权重表示,KVCache依赖自然语言的token,表达能力(复杂抽象不能用语言表达)和效率都差一点
    2. 逻辑推理能力稍差,思维能力稍差

      1. CoT可能出现前后矛盾的表达,长上下文之后,模型的准确性下降
    3. 计算资源消耗稍大

      1. 潜式思维链(Latent Chain-of-Thought)是一个改进方向
  3. 外部专用数据存储系统

    1. 容量大
    2. 抽象层级最低,存储密度最低,能力差
    3. 资源消耗小
    4. 支持动态“增删改”

Revision #2
Created 2026-05-05 14:38:32 UTC by Colin
Updated 2026-05-16 04:11:08 UTC by Colin