异动
登录注册
淼鑫
2023-04-30 23:09:07
FPGA 利用门电路直接运算,而用户可以自由定义这些门电路和存储器之间的布线,改变执行方案。其基本原理是集成大量的基本门电路以及存储器,通过大量的可编程逻辑单元实现针对性的算法设计,即实现以硬件定义软件。FPGA 通过可编程逻辑综合,在并行计算上能够获得和 GPU 接近的并行计算性能,相比 CPU,有明显的性能提升,同时在功耗上优势明显在深度学习算法仍处于高速迭代的状态下,FPGA 因其可重构特性而具有显著优势。FPGA 市场化的阻碍主要在于高昂的硬件和开发成本,编程相对复杂,为实现重构而降低了计算资源占比,整体运算能力受到影响。
  ASIC 则为专用定制芯片的统称,在架构、设计、成本等方面存在更大的多样性,其中 VPU 是为图像处理和视觉处理设计的定制芯片。ASIC 的架构相对简单,性能和功耗与通用型产品相比更低。由于不需要包含 FPGA 用于实现重构的可配置片上路由与连线,相同工艺的 ASIC 计算芯片可以拥有 FPGA5-10 倍的运算速度,实现 PPA 最优化设计。ASIC 针对场景的定制化设计使其更适合终端推理场景,而如今它的主要劣势在于初期设计的资金投入和研发周期,且针对性设计限制了芯片的通用性。
  ASIP 是一种新型的定制化指令集的处理器芯片,它为某个或某一类型应用而专门设计,通过权衡速度、功耗、成本、灵活性等多个方面的设计约束,设计者可以定制 ASIP 以达到最好的平衡点,从而适应嵌入式系统的需要。ASIP 集合了 FPGA 和 ASIC 各自的优点,不仅可以提供 ASIC 级别的高性能和低功耗,还能提供处理器级别的指令集灵活性,实现可重新编程,更适用于需求尚未被明确定义、需要芯片具备一定通用性和可编程性的应用场景,从而满足 AI 算法快速更新迭代的需求,并延长芯片的使用生命周期。
@柴尔德: 理论来说,当大模型的算力、数据量以及参数量同时增大的时候,整个模型的效果会越来越好。GPT-3使用的数据量为40T,预测GPT-4的数据量需求为400T,但未来数据量将不会无限增大,所以当数据量不能增长的时候,光靠算力和模型参数量增长,并不能增强模型的效果。换言之,受到数据量的限制,NLP大语言模型
35 赞同-10 评论
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.02
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据