Transformer黑盒

问题

Transformer是怎么组织和表达自然语言的？

可能的方向

通过不断的训练、运行来对模型的权重进行解析--逆训练
1. 生成出一系列的最核心的，最有效的样本的数据集，用于蒸馏其他的模型
从单点，添加探针的方式来推断输出的逻辑
1. 特定样本下各个权重的梯度（对结果的影响力）组成一张针对一个样本的逻辑地图
2. 通过统计大量样本在单点的情况分析出模型的抽象图
从最后的输出逻辑往前面推理的方式来推断模型的输出逻辑
找到整个模型的最边缘的知识点，最终的知识点，不会被其他知识使用的知识点，唯一的
1. 判断激活这个知识点的输入的概率的分布情况

《On the Biology of a Large Language Model》

模型先得答案，后编理由。模型在输出语言之前，已在注意力层完成了决策判断。这一点在“Step-skipping reasoning”（跳步推理）机制中表现尤为明显：模型不是一步步的推理证明，而是通过注意力机制聚合关键上下文，直接跳跃式生成答案
输出与推理时序错位。在数学题中，模型先预测答案token，再补全“第一步”“第二步”的伪解释。
要求回答“达拉斯所在的州，州府是哪个城市？” 然而归因图显示模型内部的情况是
- 一组激活 “Dallas” 的特征 → 激活“Texas”相关特征；
- 一组识别“capital”（首府）的特征 → 推动输出“一个州的首府”；
- 然后 Texas + capital → 推动输出 “Austin”。
人类也有类型的功能，类似于“第六感”，“快思考”
“错误答案”：不一定是模型不知道正确答案，可能是一些内置的权重选择的结果，可能是无意的（不知道答案），也可能是有意的（训练）的结果，比如：训练的时候规定避免输出有害结果。
其中结论：思维链并非AI的真实思考路径，而是事后构建的“合理化剧本”。不正确，思维链是对输入的合理分析，为了生成更合理的答案，加入了思维链生成的内容会改变最初的可能答案。
其中结论：人工智能心理架构，由四层构成：神经层、潜意识层、心理层与表达层。不正确，所谓的心里其实只是语言表达的统计结果，LLM都是在根据统计的信息计算结果，人为指定了权重的倾向性

Transformer

KV Cache

ChatGLM3典型计算图

Tokenization

Transformer in CV

新方法

Attention是不是必须的

神经网络的逻辑

改进大规模训练稀疏自编码器的方法

Transformer NLP到底有没有智能？

LLM大语言模型的训练

Transformer黑盒

NSA 稀疏注意力机制 by deepseek

FlashAttention

MLA by Deekseek

幻觉

LLM信息空间的映射

LLM推理行为

梯度下降-拟合高层次的信息

生物脑（人脑）的优势

意识

人脑的工作原理

仿真人脑的基本条件

CoT & 强化学习

分层LLM推理与Scaling思维模板

自然语言的内在逻辑

记忆

RAG

GraphRAG

记忆方法学

爬虫

记忆远远不止记录，而是倍增器

meaning dataset

附带meaning tree信息的数据集

AI突破的可能

新的AI计算模型

自洽后就有意识了吗？

Transformer黑盒

问题

可能的方向

《On the Biology of a Large Language Model》