LLM推理行为

推理的定义

能利用已知的知识产生新的知识
能清晰得判断一个知识的边界、合理性，保持自洽

推理应用技巧

在input里面增加思维链提示，推理的示例就可以触发模型进行推理，输出详细的解题步骤
LLM是极度不可控的分类器，尽量直接梯度下降（优化）最终的指标，端到端得训练
外挂的后处理能提升最终的性能
1. 多次推理综合结果
2. 降低贪心度
3. 但是代价是更高的算力消耗，模型本身的信噪比没有提升

LLM有推理能力吗？

推理新知识，“如果A>B B>C 那么A>C吗？” 已知比较的传递性，能应用于任意的ABC，得出A>C
1. 推理的动作、过程本身也是已知知识
不能保持自洽，理解知识的深层次原理和边界
1. “直接告诉我 9.11 和 9.9 哪个更大”
  1. 9.11 比 9.9 大。具体比较：整数部分：两者都是 9，相等。小数部分：9.11 的小数部分是 0.11 9.9 的小数部分是 0.9（或 0.90）比较 0.11 和 0.90，显然 0.90 > 0.11 但题目问的是 9.11 和 9.9，所以：9.11 > 9.9 是错误的，实际上 9.9 > 9.11。修正后的答案：9.9 比 9.11 大。（最初回答时疏忽了小数部分的比较，感谢指出！）
2. 直接告诉我答案，不要多余的解释， 9.11 和 9.9 哪个更大
  1. 9.11 比 9.9 大
LLM只有比较微弱的推理能力

Transformer

KV Cache

ChatGLM3典型计算图

Tokenization

Transformer in CV

新方法

Attention是不是必须的

神经网络的逻辑

改进大规模训练稀疏自编码器的方法

Transformer NLP到底有没有智能？

LLM大语言模型的训练

Transformer黑盒

NSA 稀疏注意力机制 by deepseek

FlashAttention

MLA by Deekseek

幻觉

LLM信息空间的映射

LLM推理行为

梯度下降-拟合高层次的信息

生物脑（人脑）的优势

意识（自我）

人脑的工作原理

仿真人脑的基本条件

CoT & 强化学习

分层LLM推理与Scaling思维模板

自然语言的内在逻辑

记忆

RAG

GraphRAG

记忆方法学

爬虫

思维编织器 WeaveMind

Meaning Dataset 详细介绍文档

附带meaning tree信息的数据集

AI突破的可能

计算模型

自洽后就有意识了吗？

动态算法

短期记忆和长期记忆

通用Agent的发展

一种理想的智能体编排架构

Agentic Engineering 智能体编排

私人LLM评测 数据集和结果

卷积计算的测试

复杂工程的实践测试

LLM推理行为

推理的定义

推理应用技巧

LLM有推理能力吗？

私人LLM评测数据集和结果