Skip to main content

Recently Updated Pages

视觉就应该是卷积

算法&模型

先说观点,当前所有的科研人员都研究Transformer去了,但是卷积才是视觉的最高效的特征提取(编码)算法。

Updated 1 month ago by Colin

命名

基本问题

命名的重要性 好的设计从命名开始 研究表明,最优秀的设计师会设计出更快、更小、更简单的结构,而且设计过程也更轻松。伟大的结构和一般的结构之间差了一个数量级——Fred Brooks,Jr...

Updated 1 month ago by Colin

当代LLM智能体的最佳交互方式

基本问题

智能体的交互,除了对话还有那些,哪种是未来的方向? 对话 对,现在的LLM除了对话,没有别的形式 Chatgpt claude code为代表的编程类助手,本质上也是本地的Agent...

Updated 1 month ago by Colin

昂贵的共识

基本问题

共识有哪些? 流浪地球的计划和数字人的竞争 电动车方案,中国的锂电池,日本的氢能 股价 论点:社会达成一个共识是要付出巨大的代价的 共识是什么,有什么作用 学历是最简单的...

Updated 1 month ago by Colin

AI的效果悖论/骗局

基本问题

现象 看起来现在的大模型已经无所不能,LLM的语言能力,nano banana的图像,Sora的视频等等 能生成几乎是任意的数字内容,其实在早几年的CV(卷积网络)时代就已经有过一次惊艳了。...

Updated 1 month ago by Colin

提示词-prompt-自然语言接口

算法&模型

虽然我认为研究LLM心理学是没有意义的行为,但是更好得让工具为你服务是我的目的 prompt 最好是正面的,不要通过否定的方式来提示,而是采用直接的表达方式 尽量准确,详细得描述要求,举...

Updated 1 month ago by Colin

好奇心的底层原理

基本问题

我们都知道好奇心对于动物的意义,而且也符合达尔文的生物进化理论, 好奇心的生理基础是大脑中多巴胺系统与前额叶皮层的协同作用,形成 “探索→获得信息→奖赏→持续探索” 的正反馈循环。 但是大脑...

Updated 1 month ago by Colin

用语言模型处理图像?

基本问题

不太行,这个方向就有点荒谬(基于当前世界存在的信息基础) 不仅如此,目前流行的具身智能,竟然在尝试从《动作视频-行为描述》的端到端的训练 首先以下几个结论 当前大模型的成功,可以总结为...

Updated 1 month ago by Colin

Meaning Dataset 详细介绍文档

算法&模型 meaning

目录 概述 核心概念 语义层级结构 Rank 编码机制 序列生成机制 特殊功能机制 数据示例 概述 Meaning Dataset 是一个模仿自然语言结构和抽象表达的数据集。它通过层级化的...

Updated 1 month ago by Colin

理想和现实的距离很短吗?

基本问题

有个很常见的现象是,很多人有时候觉得,理想和现实的距离非常短, 上一秒还在理想的喜悦中,下一面又感觉认清了现实,没有前途 生理上的原因 大脑是一个非常贪心的机制,第六感,潜意识,总是以...

Updated 1 month ago by Colin

结构化表达的方式和方法--金字塔

基本问题

结构:整体类似一个金字塔一样的结构 由一个论点、结论、观点、结果作为节点 每个节点可以由多个小的节点进行解释、细化、证明、拆分步骤、原因、罗列、导致结果 可以从金字塔顶尖不断往下进...

Updated 1 month ago by Colin

自洽后就有意识了吗?

算法&模型 AGI基础方法

自洽能力对于人工智能的重要性 当前AI还不能轻易的实现自洽能力,甚至在在KV cache内的自洽性还存在挑战,权重范围内只能根据概率来输出 意识会去维护一个最本质的目的,不断检验当前...

Updated 1 month ago by Colin

Andrej Karpathy 2025年演讲与访谈深度解读:从大语言模型到Agent的演进

算法&模型

OpenAI 前创始成员安德烈·卡帕西(Andrej Karpathy)在2025年的全年演讲与公开访谈。他为我们揭示了 AI 从大语言模型到 Agent 演进的核心逻辑、工程现实与未来路径。 ...

Updated 2 months ago by Colin

当前AI技术发展的思考

基本问题

问题 视觉模型在2016年火了之后,现在发展得怎么样了,为什么? 看看商汤的股价就知道了 < 2 @ 20251220 技术不能满足大范围落地的需求 现在的LLM能不能达...

Updated 2 months ago by Colin

计算模型

算法&模型 AGI基础方法

背景 计算机已经发展了很多年,很多层的划分已经非常的明确 高层级的计算范式随着AI的发展,特别是LLM的发展,已经越发的清晰 传统计算机软硬件堆栈->神经网络算子->神经网络计算图...

Updated 2 months ago by Colin

短期记忆和长期记忆

算法&模型 AGI基础方法

一种误解 短期记忆是临时记忆,只是记忆的一部分关键信息 短期记忆 大脑的意识存在于短期记忆 是一个不断变化的,不断被更改的状态存储器 存储的是对当前状态的高度浓缩的,高度抽...

Updated 2 months ago by Colin

伊利亚·苏茨克维尔:2025年核心洞见

算法&模型

前OpenAI首席科学家、SSI创始人 为什么AI正在从“Scaling时代”迈入“算法创新”时代? 在旧金山湾区的核心技术圈层,随着计算集群规模的指数级扩张以及模型参数的爆炸式增长,智力过剩的...

Updated 2 months ago by Colin

模型能力的衡量标准--基础性能特征

算法&模型

动态性 Transformer的“动态性决策”体现 Attention 本质上是利用dot计算,进行动态对信息的选取和重组 增加模型表达的非线性能力,利用有限的参数量表示(覆盖)更...

Updated 2 months ago by Colin

预期的错位和偏差

基本问题

人类对你自己的预期认知会存在错误和偏差 输入:当前或者过往的经验提出出来的对未来判断的有用的资讯 预期:你对未来某件事成功的概率判断 问题是,怎么才能做到最准确的判断?那就要清楚其对信息的...

Updated 2 months ago by Colin

氛围

基本问题

这个词首先被用在了编程的领域,很奇怪的是编程本来是一件很精确的工作,追求准确无误的工作,但是“氛围编程”这个词语还是流行起来了, 那么这还是必然的还是无奈? 随着LLM基本搞定自然语言的理解...

Updated 2 months ago by Colin