Skip to main content

Recently Updated Pages

完美复制一个我,那还是我吗?

基本问题

如果现在的AI技术发展到了,能把一个人的所有记忆,思想,想法,性格,爱好,脾气都完全复制和实现, 那么这样一个物体还是我吗?这能称作是永生了吗? 能:相当于两个“机器”同时维护一个“我”这样...

Updated 1 month ago by Colin

先量化 再训练

AI加速芯片 Binary AI

量化主流的LLM到Binary Lut可以进行编码压缩,降低存储需求 实际数据touch不到的选择项可以被去除 调整顺序,编码,进行无损Lut表压缩 原生的训练Bia...

Updated 1 month ago by Colin

无监督训练

算法&模型

统计模型 rank_tree表达了一短句子的逻辑分割,一段句子的分割,语意的组合,是抽象的一种, 两个不一样的表示表达的是同一个语义怎么办? 腿短的是狗,腿长的也是狗,有些逻辑不是组合能表达...

Updated 1 month ago by Colin

太快和太慢

基本问题

太,在这里其实表达的是个贬义词,描述一个不合适的前提 在科技领域,所有的技术其实都要求其合适性 在2025年的今天,大家还在争论激光雷达对于自动驾驶的必要性 马斯克认为,路是给人修的,那么...

Updated 1 month ago by Colin

二值 二进制 Binary 神经网络算法

AI加速芯片 Binary AI

背景FPGA的基本单元是LUT(查找表),如果把LUT看成一种逻辑运算单元查找表的真值表可以表示静态权重查找表的部份输入表示动态权重FPGA的可重构特性,相对于AI处理器可以把部份或者全部的动态...

Updated 2 months ago by Colin

光学镜头和涡轮喷气发动机的区别

基本问题

结构上非常的类似:圆筒状,中间有粗有细,两头是空的 形式上:中间存在多级,都是介质从一头进,另一头出,实现一些变化 什么时候AI能自动总结出这个层面的规律 都是处理光流和气流,对其路径...

Updated 2 months ago by Colin

模型能力的衡量标准--基础性能特征

算法&模型

动态性 Transformer的“动态性决策”体现 Attention 本质上是利用dot计算,进行动态对信息的选取和重组 增加模型表达的非线性能力,利用有限的参数量表示(覆盖)更...

Updated 2 months ago by Colin

没有持续的增长,只有S型曲线式增长

基本问题

世界上不存在无限增长的事情(说你呢,Scaling Law),这基本是个定则, 即使把目光拉长放到宇宙级视野里,宇宙中最大速度也不可能超过光速,宇宙它再大也总有个边界,是吧? 所以,我觉...

Updated 2 months ago by Colin

生物脑(人脑)的优势

算法&模型 人脑的仿真

抽象 抽象出高效的,合理的,可复用的底层抽象 抽象出高效的、非常抽象的高层级概念,并应用于看起来毫不相关领域 记忆:记忆及快速的索引 类比:强大的类比功能 神经训练...

Updated 2 months ago by Colin

仿真人脑的基本条件

算法&模型 人脑的仿真

准则 能够持续学习 建立世界模型并进行规划的能力 能够进行新的高层级的抽象 能够进行“元”概念的学习和泛化 心智,意识 理解自我、个体的概念 维持自洽的基本能力 行动...

Updated 2 months ago by Colin

新的AI计算模型

算法&模型 基础方法

背景 计算机已经发展了很多年,很多层的划分已经非常的明确 高层级的计算范式随着AI的发展,特别是LLM的发展,已经越发的清晰 传统计算机软硬件堆栈->神经网络算子->神经网络计算图...

Updated 2 months ago by Colin

LLM心理行为学的研究

基本问题

随着LLM的爆火,很多科研人员投入研究LLM表现出来的行为 特别是一些心理学方面的表现,比如: 谄媚 自信/不自信 固执己见/被质疑就动摇 从原理上说,本质上都是数学的统计概率...

Updated 3 months ago by Colin

自然语言的内在逻辑

算法&模型 记忆和语言

逻辑 推断: A 是 B 与或非 逻辑规律: 传递性 类比:判断相似性,通过类比来模仿很容易,但是分析内在原因,并描述出来,形成理论很难 晶体管的饱和 类比 边际效应 晶体管...

Updated 3 months ago by Colin

人类社交的更高层次的需求

基本问题

社会活动是人类的基本需求 人类行为活动的目标不再是温饱之后,需要一种新的奖励形式,那就是社会的“认同”、“认可” 所有的社会属性都可以转换成“认可度”,财物、声誉、名望、游戏等级、公司领导等...

Updated 3 months ago by Colin

Transformer

算法&模型 Transformer

特点 精细的抽象,记忆空间特别大 大数据,大算力,大模型 scaling特性,可以训练很大的模型,用很多数据获得更多智能 “硬件彩票”,高强度对着GPU设计,能打满G...

Updated 3 months ago by Colin

LLM推理行为

算法&模型 Transformer

推理的定义 能利用已知的知识产生新的知识 能清晰得判断一个知识的边界、合理性,保持自洽 推理应用技巧 在input里面增加思维链提示,推理的示例就可以触发模型进行推理,输出详...

Updated 3 months ago by Colin

架构的力量

基本问题

什么样的架构设计是优秀的 工作效率 高效的开发效率 高效的使用 有效 能很好的满足多方需求 能快速、清晰的进行配置 合理的接口 生命力 支持不断...

Updated 3 months ago by Colin

工作方法学

基本问题

遇到意见不一致的时候的处理方法 逃避,事前避免,自我保护性避免 利用制定一些规则来使得问题有统一的处理方法,使得大家达成一致 利用名义上的决策者,虽然不是管理者,平时不参与讨论,但是有...

Updated 3 months ago by Colin

生命和AGI的开发

基本问题

蛋白质结构可能有 10 的 300 次方种,这些都远远超过宇宙中的原子数量, 所有的因素都考虑进去,尝试的空间远远大于宇宙的时空 那么为什么生命能够形成? 自然进化规律,没有上帝和高级策略...

Updated 4 months ago by Colin

M40 安装cuda和torch

设置BIOS 打开 PCIE 4G 支持   使用V100需要在BIOS内打开above 4g decoding和resize bar,关闭csm 驱动 sudo...

Updated 4 months ago by Colin