AI技术研究-衡量的标准

动态性

Transformer的“动态性决策”体现

Attention 本质上是利用dot计算，进行动态对信息的选取和重组
“动态选择”是提升算法效率的关键，类似于传统算法决策树的“减支”，能有效的增大搜索空间而不大幅增大推理算力需求
不管是RNN还是transformer都是在表达一个决策的过程，效率越高，越容易使用现成的硬件加速，越容易被训练（梯度下降），最终的效果越好

CoT，全称Chain of Thought

CoT是神经网络使用“语言”作为接口定义（对象的抽象）进行运算，进行反复推理，是在attention的一个层级的动态性上面再施加一层动态性
CoT 相当于强行约束LLM的输出是按照推理的范式，利用语言作为接口定义，输出推理过程的模版
通过增加约束，减少搜索空间，在原来LLM直接输出的基础上继续提高整个算法表达和推理的深度，
CoT也是一个动态运算的过程，前面的输出作为后面的输入

人类

人类有所谓的「启发式」思考，「直觉」让我们能将数百万种可能性快速缩减至几种可行的解决方案。

Khaoutar El Maghraoui：我认为有很多关于实时计算优化的工作被低估了。例如，像测试期计算（test-time compute）这样的技术，它允许 AI 模型在推理过程中动态分配额外的计算资源。这是我们在 OpenAI o1 模型中看到的技术，它真的在这里树立了一些重要的先例，它允许模型有效地分解复杂问题，某种程度上模仿了人类推理的方式。这也对我们设计这些模型的方式以及模型与硬件的交互方式产生了深远影响。在这种情况下，它推动了更多的硬件软件协同设计，特别是在推理过程中的处理优化。

算法的约束设计

“卷积” 是对模型在图像领域的一种约束，非常高效的表达了图像的特性，极大得降低了搜索空间
“Attention”是对语言（token）映射的约束，强制把一堆token约束（表达）成一个特定的语义
“multi-Head”是对实际因素相关性的约束

效率

表达的效率
1. 合理的抽象和表示一个复杂的事物/逻辑关系等等
知识组织的效率
训练/学习的效率
1. 遍历和判断整个因素空间的效率

Transformer解析

KV Cache

ChatGLM3典型计算图

Tokenization

Transformer in CV

新方法

Attention是不是必须的

神经网络的逻辑

改进大规模训练稀疏自编码器的方法

Transformer NLP到底有没有智能？

用推理的临时态实现意识--CoT

AI技术研究-衡量的标准

动态性

Transformer的“动态性决策”体现

CoT，全称Chain of Thought

人类

算法的约束设计

效率

知识的关联度/抽象程度

规模

自洽性

No Comments