人脑的仿真

生物脑(人脑)的优势

  1. 抽象
    1. 抽象出高效的,合理的,可复用的底层抽象
    2. 抽象出高效的、非常抽象的高层级概念,并应用于看起来毫不相关领域
  2. 记忆**:**记忆及快速的索引
  3. 类比:强大的类比功能
    1. 神经训练的收敛过程可以类比晶体管放大,训练要达到放大区,而不是在截止区和饱和区,不然会过拟合,或者欠拟合
      1. 饱和 类比 边际效应
      2. 放大区 类比 线性关系
    2. 国足出国踢球,输了球但是个人行李很多:差生文具多
  4. 联想:高效的联想思维能力
    1. 抽象概念的联想
      1. 自动构建一个逻辑树,逻辑组成的树,作为匹配的特征
      2. 每个节点表示逻辑关系,逻辑运算
    2. 具象概念的联想
      1. 猫和猫科动物的类似
  5. 意识,自洽
    1. 而人脑第一前提是“自洽”,同时尽量高效组织信息,产生高层抽象
    2. 预测:为了自洽,不断的进行逻辑推理和判断
    3. LLM追求极致压缩,尽量减少冗余信息
  6. 学习
    1. 模仿能力:一种快速的、高效的学习方法
      1. 贪心:只要是自洽的,没有矛盾的“事物”就可以被快速整合吸收
    2. 通过时间积累,不断的整理和思考已有的知识,提高效率
    3. 高效获取新技能的能力: ARC-AGI-2任务
  7. 创造力、创新
    1. 递归抽象能力
    2. 高层级的抽象概念,跨领域的互相借鉴
    3. 大范围(深度、广度)的思维推理:不断尝试可能的新概念

意识(自我)

意识的解释

  1. 意识,可以解释成 对自我的一种认可,我是我,一般说一个智能具有意识,表示能表现出“自我”的行为。
  2. 自我是一套复杂价值观、行为规则,是一种关于人文、社会、基本生存等的复杂算法的高层级抽象、表示
  3. 由于包含很多非理性的、直觉式的规则和规律,所以难以量化和计算。但是自我/意识就很好的表达了这一类的规则/规律

具体来说就是,首先假设一个主体,基本需求是自尊、自信、自强、生存等一系列的目标/需求,这些抽象的目标(价值观)才是人类进行活动的价值函数。

特别的用于处理社交,人性规则,等比较人文的需求。

  1. 工具类的应用非必须具有意识,但是, 对于“玩具”,“模仿动物”,“机器人”,“情感类处理” 非常有用,而且是必须的。
  2. 机器人如果不仅仅是产线的工具,需要有一些自我决策的行动,就需要意识。 要不然就和汽车产线的机械臂没有区别。
  3. 这里的区别不是体现在执行准确任务还是非确定任务,而是能用一些高层级(自我意识)的抽象规则,和当前的最新更新的状态,临场判断和执行一些任务

目标

  1. 表现为能一直统一个完整的,自洽的行为表现
    1. 保持行为、价值观的一贯性
  2. 能体现出个人的风格特色,价值观
    1. 有一些内在的价值观设定比较难以受外界的输入而改变
    2. 具有不完全受现有观念影响的判断逻辑。

引用

  1. 当人工智能的研究者终于制造出会使用语言的机器时,却并没有在这些机器中发现意识,会说话的Chat GPT却没有意识

人脑的工作原理

特点

  1. 人脑具有反馈回路,反馈回路形成正反馈,不断训练神经元,加强神经元

    1. 视觉神经能识别图像,也能通过提示想象出图像
    2. 语言作为抽象能力很强的表示工具,被充分用于协助思考,但不是智力的全部 @维特根斯坦
  2. 所有的神经元时刻待命,适当的输入技能激活输出

    1. 不激活的状态需要主动抑制皮层神经的激活
    2. 闭眼睛的时候,视觉神经会抑制视觉皮层的激活
  3. 动态激活

    1. 神经元默认是静息状态,根据输入,逐级激活需要激活的神经元
  4. 学习和实践(训练和推理)同步进行,训推同时进行

  5. 能量不足的时候,大脑不是不能工作,而是有低能耗模式

    1. 低血糖时候,大脑能通过降低视觉识别的精度来降低能耗
      1. 老鼠识别天敌“猫”就可以,不用识别出来具体是哪种猫

训练/学习的过程

  1. 贪心、模仿
  2. 高层级的抽象带来高效率
  3. 不断的对输入进行推理,保证自洽

训练的价值函数

  1. 生物神经元或者说大脑的训练目标,可能是让神经元处在一个有规律的环境中,不能接受杂乱无章的信号,比较喜欢有规律的受控的处罚和激活
  2. 能量效率,节能
  3. 只有在快要忘记的时候去努力回忆,记忆才会被深深地刻在大脑里

稀疏性

  1. 支持非常大的处理空间:每个神经元大约有1000-10000的突触,海马体神经元更多,约98%的突触位于树突
  2. 对很多(N=~10000)个输入信号处理,神经元通过学习,调整之间的固定连接,构造多个中间层的处理机制,形成高层级的抽象,实现高效动态计算。 大模型通过矩阵乘法将所有输入做映射计算。
  3. 这N个信号,实际存在的实际组合样本很少,大部份组合情况是不存在的,非常稀疏,
  4. 如果N个信号,只会存在一种情况,一个神经元就能表达,通过模仿、贪心学习快速进行抽象,而AI需要一个非常大矩阵乘法。
  5. AI的大矩阵映射出来的结果和人类的单个抽象(语义)概念不对应
    1. 通过梯度下降求解,自然会自动提高权重的信息密度,每个单点的输出可能是多种概念的某个共同特征的激活
    2. 人类则更注重适应性和丰富性,强调保持灵活性和上下文的完整性,而LLM侧重于统计压缩,力求最大程度地减少冗余信息

仿真人脑的基本条件

准则

  1. 能够持续学习
  2. 建立世界模型并进行规划的能力
  3. 能够进行新的高层级的抽象
  4. 能够进行“元”概念的学习和泛化

心智,意识

  1. 理解自我、个体的概念
  2. 维持自洽的基本能力
  3. 行动的目标都是内源性,外部不会直接给定一个明确的目标

创新

  1. 创新的原理,需要形成递归抽象的思维方式和能力
  2. 维护自洽,需要能做到实时动态的递归抽象

人脑的推理模型

  1. 神经元
    1. 可以被输入激活,激活后可以激活其他的连接的神经元
    2. 记忆区神经元
      1. 大部分时间是静息状态
    3. 逻辑推理神经元
      1. 视觉识别、语音识别,皮肤传感器等,人脸识别等等
      2. 正向,顺序激活,快速,没有递归
    4. 规划神经元
      1. 一团细胞,反复递归的激活,循环
  2. 区域
    1. 短路径,高并行
      1. 小脑,视觉识别
    2. 大量的边缘分布
      1. 记忆的节点
    3. 状态区
      1. 一堆的能主动激活其他人的细胞组成的临时记忆区,就是意识的本体
      2. 大量连接了记忆区的节点,一个连接多个,可以根据当前其他的状态进行动态的选择,从而表示一个临时的状态
        1. 比如,当前是在编程,那么当前这个细胞连接的编程相关的记忆会激活当前,其他的记忆的激活会被屏蔽
    4. 长路径,低并行,决策区
      1. 接收状态区的细胞的信号
      2. 清醒地时候,这些细胞就有足够的能量激活其他的细胞,形成一次迭代,和行动决策,激活下一步动作的信息源头
  3. 运行的本质
    1. 有一堆循环连接的神经元
      1. 只要没有在休息状态,就会不断根据输入状态激活对应的神经元
      2. 不断循环得保持激活状态,维持当前的意识

人脑的本能

1. 最底层的“目标函数”:生存与节能 (Survival & Energy Efficiency)

生物脑的一切高级功能都服从于这个终极指令。大脑只占人体重量的 2%,却消耗了 20% 的能量。因此,大脑极其“吝啬”计算资源。

2. 情绪机制 (The Reward / Loss Function)

在有逻辑之前,大脑先有情绪。情绪是大脑用来快速评估环境并做出反应的全局权重参数。

情绪是一套非常高效的处理复杂环境和外部情况的规则/算法,用来快速评估行动的好坏。

3. 驱动系统:奖惩

奖励驱动的“强化学习” (Reinforcement Learning)

4. 状态保持:分层记忆机制 (Hierarchical Memory System)

没有记忆,就没有时间概念,也就无法进行逻辑推演。大脑的记忆本能并不是为了“记录过去”,而是为了预测未来。

6. 核心计算引擎:预测与计划 (Predictive Coding & Planning)

现代认知科学认为,大脑本质上是一个预测机器(Prediction Machine)。预测是为了更好得避免可能的危险,更好得生存。

7. 降维与压缩:逻辑与抽象 (Logic & Abstraction)

现实世界的信息量是无限的,而大脑的算力是有限的。

模式识别与“统计学习”本能 (Statistical Learning)

大脑本质上是一个极其强大的概率计算引擎

8. “预测误差”驱动的好奇心 (Prediction Error & Curiosity)

9. 人性,社会性对齐(Social Alignment)

人类是极度社会化的生物,婴儿大脑中有专门处理“人”的硬件。

10. 模仿

  1. 模仿能力:出生几天的婴儿就能模仿大人吐舌头、张嘴——这是学习的雏形。
  2. 模仿是最低成本的学习,直接模仿标准答案,是风险最低的适应社会的行为

11. 预测与减少不确定性,避免预测误差

大脑是一台"预测机器",它存在的根本目的是不断预测下一刻会发生什么,并让预测与现实的误差最小化。

这是生物脑最核心的动力。大脑会自动对下一秒发生的事做预测,如果预测失败,就会产生强烈的电信号。

也就是说,大脑并不是被动地接收世界,而是主动地建构一个关于世界的模型,然后:

  1. 用感官输入去校验模型;
  2. 当预测出错时,要么更新模型(学习),要么采取行动改变世界(行为),让世界符合预测。

记忆、注意、情绪、决策——全部可以被解释为这台预测机器的不同子模块。

12. 对世界结构的"先验知识"

人类婴儿绝不是被动接收数据的白板,而是一个高度优化的、带着预设目标和底层算法的超级学习系统。时间、空间、因果、数量构成了他们理解物理世界的坐标系;而面孔偏好、意图探测和朴素道德,构成了他们理解社会世界的坐标系。而天生自带的短/长期记忆比对与统计学习机制,则是驱动这个系统不断自我更新、最终长成复杂智能的核心引擎。

这些"先验"就像一个粗糙的世界模型框架,后续所有学习都是在往这个框架里填细节。

13. 本能的层级

  1. 体内稳态(Homeostasis)——维持体温、血糖、水分、氧气等在安全范围内。
  2. 趋利避害——靠近奖励(食物、温暖、同伴),远离威胁(疼痛、捕食者)。由边缘系统、杏仁核、伏隔核等负责。
  3. 学习与记忆——把"什么行为导致了什么结果"存下来,以便下次预测得更准
  4. 社会性认知——人是群居动物,理解他人意图、建立关系本身就是生存策略
  5. 规划与想象——前额叶让我们能模拟"如果我这样做会怎样",这是"思考下一步行为"的神经基础。

14. 本能的总结

  1. 节能:降低能量消耗,提高生存率
    1. 情绪机制:基本的、高效的指导行动规则
    2. 人性化算法:社会活动能力、提高物种能力
    3. 更快得预测:避免浪费能量
  2. 预测危险:提高生存率
    1. 好奇心驱动学习:主动学习未知的可能有用的知识
    2. 模仿学习:快速得学习正确答案
    3. 总结规律的学习:学习更高层次的规律,高效得判断和行动
    4. 反思失败:避免反复得错误
    5. 记忆:基础设施
  3. 行动
    1. 主动行动
    2. 主动干预环境