Recently Updated Pages

完美复制一个我，那还是我吗？

基本问题

如果现在的AI技术发展到了，能把一个人的所有记忆，思想，想法，性格，爱好，脾气都完全复制和实现，那么这样一个物体还是我吗？这能称作是永生了吗？能：相当于两个“机器”同时维护一个“我”这样...

Updated 1 month ago by Colin

先量化再训练

AI加速芯片 Binary AI

量化主流的LLM到Binary Lut可以进行编码压缩，降低存储需求实际数据touch不到的选择项可以被去除调整顺序，编码，进行无损Lut表压缩原生的训练Bia...

Updated 1 month ago by Colin

无监督训练

算法&模型

统计模型 rank_tree表达了一短句子的逻辑分割，一段句子的分割，语意的组合，是抽象的一种，两个不一样的表示表达的是同一个语义怎么办？腿短的是狗，腿长的也是狗，有些逻辑不是组合能表达...

Updated 1 month ago by Colin

太快和太慢

基本问题

太，在这里其实表达的是个贬义词，描述一个不合适的前提在科技领域，所有的技术其实都要求其合适性在2025年的今天，大家还在争论激光雷达对于自动驾驶的必要性马斯克认为，路是给人修的，那么...

Updated 1 month ago by Colin

二值二进制 Binary 神经网络算法

AI加速芯片 Binary AI

背景FPGA的基本单元是LUT(查找表)，如果把LUT看成一种逻辑运算单元查找表的真值表可以表示静态权重查找表的部份输入表示动态权重FPGA的可重构特性，相对于AI处理器可以把部份或者全部的动态...

Updated 2 months ago by Colin

光学镜头和涡轮喷气发动机的区别

基本问题

结构上非常的类似：圆筒状，中间有粗有细，两头是空的形式上：中间存在多级，都是介质从一头进，另一头出，实现一些变化什么时候AI能自动总结出这个层面的规律都是处理光流和气流，对其路径...

Updated 2 months ago by Colin

模型能力的衡量标准--基础性能特征

算法&模型

动态性 Transformer的“动态性决策”体现 Attention 本质上是利用dot计算，进行动态对信息的选取和重组增加模型表达的非线性能力，利用有限的参数量表示（覆盖）更...

Updated 2 months ago by Colin

没有持续的增长，只有S型曲线式增长

基本问题

世界上不存在无限增长的事情（说你呢，Scaling Law），这基本是个定则，即使把目光拉长放到宇宙级视野里，宇宙中最大速度也不可能超过光速，宇宙它再大也总有个边界，是吧？所以，我觉...

Updated 2 months ago by Colin

生物脑（人脑）的优势

算法&模型人脑的仿真

抽象抽象出高效的，合理的，可复用的底层抽象抽象出高效的、非常抽象的高层级概念，并应用于看起来毫不相关领域记忆：记忆及快速的索引类比：强大的类比功能神经训练...

Updated 2 months ago by Colin

仿真人脑的基本条件

算法&模型人脑的仿真

准则能够持续学习建立世界模型并进行规划的能力能够进行新的高层级的抽象能够进行“元”概念的学习和泛化心智，意识理解自我、个体的概念维持自洽的基本能力行动...

Updated 2 months ago by Colin

新的AI计算模型

算法&模型基础方法

背景计算机已经发展了很多年，很多层的划分已经非常的明确高层级的计算范式随着AI的发展，特别是LLM的发展，已经越发的清晰传统计算机软硬件堆栈->神经网络算子->神经网络计算图...

Updated 2 months ago by Colin

LLM心理行为学的研究

基本问题

随着LLM的爆火，很多科研人员投入研究LLM表现出来的行为特别是一些心理学方面的表现，比如：谄媚自信/不自信固执己见/被质疑就动摇从原理上说，本质上都是数学的统计概率...

Updated 3 months ago by Colin

自然语言的内在逻辑

算法&模型记忆和语言

逻辑推断： A 是 B 与或非逻辑规律：传递性类比：判断相似性，通过类比来模仿很容易，但是分析内在原因，并描述出来，形成理论很难晶体管的饱和类比边际效应晶体管...

Updated 3 months ago by Colin

人类社交的更高层次的需求

基本问题

社会活动是人类的基本需求人类行为活动的目标不再是温饱之后，需要一种新的奖励形式，那就是社会的“认同”、“认可” 所有的社会属性都可以转换成“认可度”，财物、声誉、名望、游戏等级、公司领导等...

Updated 3 months ago by Colin

Transformer

算法&模型 Transformer

特点精细的抽象，记忆空间特别大大数据，大算力，大模型 scaling特性，可以训练很大的模型，用很多数据获得更多智能 “硬件彩票”，高强度对着GPU设计，能打满G...

Updated 3 months ago by Colin

LLM推理行为

算法&模型 Transformer

推理的定义能利用已知的知识产生新的知识能清晰得判断一个知识的边界、合理性，保持自洽推理应用技巧在input里面增加思维链提示，推理的示例就可以触发模型进行推理，输出详...

Updated 3 months ago by Colin

架构的力量

基本问题

什么样的架构设计是优秀的工作效率高效的开发效率高效的使用有效能很好的满足多方需求能快速、清晰的进行配置合理的接口生命力支持不断...

Updated 3 months ago by Colin

工作方法学

基本问题

遇到意见不一致的时候的处理方法逃避，事前避免，自我保护性避免利用制定一些规则来使得问题有统一的处理方法，使得大家达成一致利用名义上的决策者，虽然不是管理者，平时不参与讨论，但是有...

Updated 3 months ago by Colin

生命和AGI的开发

基本问题

蛋白质结构可能有 10 的 300 次方种，这些都远远超过宇宙中的原子数量，所有的因素都考虑进去，尝试的空间远远大于宇宙的时空那么为什么生命能够形成？自然进化规律，没有上帝和高级策略...

Updated 4 months ago by Colin

M40 安装cuda和torch

玩

设置BIOS 打开 PCIE 4G 支持使用V100需要在BIOS内打开above 4g decoding和resize bar，关闭csm 驱动 sudo...

Updated 4 months ago by Colin

Recently Updated Pages

完美复制一个我，那还是我吗？

先量化 再训练

无监督训练

太快和太慢

二值 二进制 Binary 神经网络算法

光学镜头和涡轮喷气发动机的区别

模型能力的衡量标准--基础性能特征

没有持续的增长，只有S型曲线式增长

生物脑（人脑）的优势

仿真人脑的基本条件

新的AI计算模型

LLM心理行为学的研究

自然语言的内在逻辑

人类社交的更高层次的需求

Transformer

LLM推理行为

架构的力量

工作方法学

生命和AGI的开发

M40 安装cuda和torch

先量化再训练

二值二进制 Binary 神经网络算法