Skip to main content
Advanced Search
Search Terms
Content Type

Exact Matches
Tag Searches
Date Options
Updated after
Updated before
Created after
Created before

Search Results

159 total results found

硬件开发及仿真工具

AI加速芯片

LogicSIM生成RTL 时间定义只对reg有作用 同一时间reg只能被一个信号写 logic数据要存到reg才能继续被下一次使用 reg只有在clk(统一的时钟)的上升沿才会被触发写 logic的一次执行不会跨越clk(统一的时钟)的上升沿 所有的latch简化为get上一个cycle的数据,set下一个数据,不用复杂的map和锁 module 定义一堆latch和logic的集合 throughput都是1 latency可以>1 CIRCT项目的软件栈 PyChip vs Chisel

NoC

计算机体系结构

OpenSMART https://github.com/hyoukjun/OpenSMART/tree/master connect https://users.ece.cmu.edu/~mpapamic/connect/ https://github.com/crossroadsfpga/connect/tree/main Flexnoc is a commercial NoC generator by Arteris which generates a customized topology for each...

Cache写机制 Write-through与Write-back

计算机体系结构

Cache写机制分为write through和write back两种。 Write-through: Write is done synchronously both to the cache and to the backing store. Write-back (or Write-behind) : Writing is done only to the cache. A modified cache block is written back to the store, just before it i...

AI加速芯片架构的动态性支持讨论

AI加速芯片

动态性的级别划分 数据内容不同动态 算子数据的尺寸动态 大部分非GPGPU的DSA架构都支持得不好,有各种问题 同步开销大,同步资源管理难,存储资源浪费,程序代码大 等问题 不同的数据地址的程序代码动态 通过条件执行、跳转执行支持的程序动态 GPGPU类支持 自动生成、调用不用的单元的代码动态 很少在加速卡上实现,大部分是CPU可以实现 不同架构对动态性支持的区别 SIMT类型的GPGPU 华为和寒武纪类的DSA NPU推理DSA 类似燧原的SPMT

主流推理小芯片

AI加速芯片

NVIDIA Jetson Orin HAILO Hailo-8 15 等等 domain-specific-dataflow-processing 据悉,它能够在功耗低于5W的情况下,以每秒生成10 个token(TPS)的速度流畅运行Llama2-7B模型。同时,在处理Stable Diffusion 2.1模型(该模型可根据文本提示生成图像)时,Hailo-10同样在超低功耗范围内实现了每张图像评级低于5秒的优秀表现。 Hailo-10的性能高达每秒40万亿次(TOPS)。根据最新公布的基准测试数据...

AI加速芯片上的2D单元

AI加速芯片 GMP

卷积天然的数据复用度是Dot的9倍,对于芯片的压力更小 算力缩放是一个非常重要的问题,涉及架构各代之间的稳定性,保护客户的价值 L1/L2/L0 怎么支持reshape或者swizzel 不同的layout (NHWC等) 以及BPI BPK FF 不同数据精度的支持和混合计算 L0 L1 Fusion的支持 存储的mapping 利于运算和fusion feature*weight vs weightT*featueT 大2D Dot计算的表达 指令表达为小尺寸,对不同的计算需求(1D、2D)的fusion...

switch教程

【大气层双系统制作教程】 https://www.bilibili.com/video/BV16M411X79n/?share_source=copy_web 【腾讯文档】switch问题自查 https://docs.qq.com/doc/DVVFMWXRLQ096RXVG 【超级会员V7】通过百度网盘分享的文件:大气层18系统.rar 链接:https://pan.baidu.com/s/1RcmlxJ9z-9HnMFqvR2rmww?pwd=77h2 提取码:77h2 复制这段内容打开「百度网盘APP 即可获...

婴幼儿中的喘鸣

https://www.msdmanuals.cn/home/children-s-health-issues/respiratory-disorders-in-infants-and-children/wheezing-in-infants-and-young-children **在儿童呼气时,听到一种高音调喘鸣声(哨笛声)。如果气道严重变窄,那么在儿童吸气时也会听到喘鸣声。**极度病重儿童也可能会呼吸急促,用力使用胸部肌肉进行呼吸,出现鼻孔扩张及皮肤发青(紫绀)。存在肺部感染的儿童可能会出现发热。 根据哮喘急...

测量线性稳压器的 2nV/√ Hz噪声和 120dB 电源抑制

https://www.analog.com/en/resources/app-notes/an-159.html an-159.pdf AN159_Layout_Files.zip https://www.analog.com/cn/resources/app-notes/an-940.html 精密电路硬件设计指南   https://www.emoe.xyz/precision-circuits-hardware-design-guide/   EmoeNAP 用户手册 https:...

示波器SDS800XHD

参考链接 https://www.eet-china.com/mp/a307681.html https://blog.csdn.net/GLSWN8829/article/details/135455736 示波器操作 设置示波器IP 用网页登录IP SCPI输入命令 “PRBD?” => 返回现在的带宽 “MD5_SRLN?” => 命令获得SCOPEID “MD5_PR?” => 命令获得本机型号 填写SN 运行python脚本获取生成的ID “MCBD?” => 返回当前的带宽配置ID,应该和pytho...

锂电池/电动车使用规则

磷酸铁锂,因为不能从电压判断电量,经常充满一次,为了更好得平衡电池,电池间的平衡比满电的损害更小 由于磷酸铁锂的每个电池的自放电、能量回收充电的速度不一样,所以时间一长需要平衡校准 model3三元的官方建议尽量只冲到90%,除非充满了马上用 次次充满的磷酸铁锂的寿命通常比设置充电百分比限制的三元锂寿命更长 相对于满电,空电对电池的损害更大 磷酸铁锂建议使用范围100-30   三元建议80-30 磷酸铁锂正常日常使用 保持电池有一定的电量 >20%,低于40%就可以充电 用电多,一周>...

Reduce的并行加速

AI加速芯片

CUDA 1. 采用Divergence的支持和Block同步来支持 2. 其他的深度优化:https://developer.download.nvidia.com/assets/cuda/files/reduction.pdf DSA/ASIC

为什么Pytorch开始制约AI了

AI加速芯片 软件框架

这个想法比较超前了,但是已经有苗头了 pytorch已经显得臃肿,不适合大模型的特定需求 需求变化了,已经不是CNN的时代了,虽然在拼命搞静态图和并行库 一个开源框架统一市场后一段时间,就会开始因为臃肿而不适合新的需求,所以就需要大胆重构 和numpy等通用接口差异越来越大,学习成本增加 为啥JAX在大模型巨头玩家中的份额这么高呢? 大模型框架对原来的那种生态,可能要求没那么高,反倒对性能调试调优的效率要求高 JAX的简单,合理的功能抽象(更加符合第一性原理)才是用户的青睐点,pytorch也是靠这个取胜...

LLM大语言模型的训练

算法&模型 Transformer

预训练 1. 继续预训练 微调 全面微调更容易出现两个问题:模型崩溃和灾难性遗忘 PEFT技术本质上,是作为微调的自然正则化器 数据集的质量和筛选,对微调的成功起着重要作用:一个大趋势是质量比数量更重要,拥有一小部分高质量的数据,比拥有一大批低质量的数据更好。 一致的注释,没有错误、没有错误标签的数据、有噪音的输入/输出 与总体相比具有代表性的分布 微调是大模型开发中的一个关键方面,需要在艺术和科学之间取得微妙的平衡。 强化学习-DeepSeek-R1 通过约束生成的内容和方式 通过问答的和逻辑分析...

理解《思考,快与慢》

基本问题

卡尼曼如此形容两大思考模式 **系统一:**自动化的运作,非常快、不费力气,即使要费力,也很少,它不受自主控制。以下为系统一的工作内容,大致依复杂度排序如下: 判断一个物体较另一个物体距离自己更远。 判断一个声音来源的位置。 接续完成“战争与……”("War and......")这个词组。(战争与和平,英语:War and peace) 当看到一张可怕的图片时,做出厌恶的表情。 回答 2 + 2 = ? 阅读大型广告看板上的文字。 在没有车辆的道路上开车。 在棋局中发现一条好路(如果你是国际象棋大师的话)...

哲学观点

基本问题

哲学的本质本身就是一个哲学问题 胡适的描述是:凡研究人生切要的问题,从根本上着想,要寻一个根本的解决:这种学问叫做哲学 对哲学的主题亦存在许多看法。一些人认为哲学是对问题本身过程的观察。^{[15]} 后现代主义把哲学定义为创造概念的学术。 哲学所涉及的研究范畴是其它学科的总和,它给出对世界本质的解释,在很大程度上影响着接受者的世界观。 哲学是研究范畴及其相互关系的一门学问。范畴涉及到一门学科的最基本的定义、概念和内容,哲学具有一般方法论的功能。 哲学和其他陈述问题方法的差异是有批判性的、有代入问题的方法以及以理...

生物脑(人脑)的优势

算法&模型 人脑的仿真

抽象 抽象出高效的,合理的,可复用的底层抽象 抽象出高效的、非常抽象的高层级概念,并应用于看起来毫不相关领域 记忆**:**记忆及快速的索引 类比:强大的类比功能 神经训练的收敛过程可以类比晶体管放大,训练要达到放大区,而不是在截止区和饱和区,不然会过拟合,或者欠拟合 饱和 类比 边际效应 放大区 类比 线性关系 国足出国踢球,输了球但是个人行李很多:差生文具多 联想:高效的联想思维能力 抽象概念的联想 自动构建一个逻辑树,逻辑组成的树,作为匹配的特征 每个节点表示逻辑关系,逻辑运算 具...

意识(自我)

算法&模型 人脑的仿真

意识的解释 意识,可以解释成 对自我的一种认可,我是我,一般说一个智能具有意识,表示能表现出“自我”的行为。 自我是一套复杂价值观、行为规则,是一种关于人文、社会、基本生存等的复杂算法的高层级抽象、表示。 由于包含很多非理性的、直觉式的规则和规律,所以难以量化和计算。但是自我/意识就很好的表达了这一类的规则/规律 具体来说就是,首先假设一个主体,基本需求是自尊、自信、自强、生存等一系列的目标/需求,这些抽象的目标(价值观)才是人类进行活动的价值函数。 特别的用于处理社交,人性规则,等比较人文的需求。 工具类的...