第125章 ai 芯片“启明二号”,性能翻倍再称王!(2/3)
: ai甚至能够参与到编译器、驱动程序乃至上层ai框架的设计中,确保软硬件从底层开始就为ai任务进行深度协同优化,实现“1+1>2”的效果。
就在《财富》杂志的采访团队离开未来智能总部后不久,“造芯阁”内部传来了一阵压抑不住的欢呼。
“启明二号”,成功了!
首批测试芯片从全球最顶尖的芯片代工厂(采用了业界最先进的3纳米制程工艺)送回,经过严格的测试验证,其表现超出了所有人的预期!
“林总,测试结果出来了!”芯片部门负责人,一位林风重金从硅谷挖来的华人顶级芯片专家陈海平,激动地向林风汇报,“所有指标全面超越设计目标!”
相比于“启明一号”,“启明二号”实现了惊人的飞跃:
峰值性能: 针对ai训练和推理的核心计算单元进行了大幅革新,峰值算力(以t8精度计算)直接达到了“启明一号”的 25倍!这意味着训练“风ai”这种万亿参数级别的大模型,时间可以缩短一半以上!
能效比: 最令人惊喜的是功耗控制。得益于先进的制程工艺和ai驱动的架构优化,“启明二号”在实现性能翻倍的同时,典型功耗反而比“启明一号”降低了 30!能效比提升了惊人的 35倍!这将极大地降低未来智能数据中心的运营成本,并为ai在移动端、边缘端的部署带来无限可能。
内存带宽与互联: 针对大模型对内存带宽的渴求,“启明二号”采用了全新的高带宽内存(hb)技术和光互联接口,大幅提升了数据传输速度,有效解决了“算力墙”和“内存墙”瓶颈。
专用加速单元: 针对transforr、图神经网络(gnn)等新型ai算法,以及ai视频处理、科学计算等特定场景,集成了更多、更高效的专用硬件加速单元。
在一个内部演示会上,工程师们用搭载了“启明二号”工程样片的服务器,现场重新训练了一个百亿参数级别的行业大模型,原本需要一周时间的训练任务,在短短两天内就高质量完成!另一组演示中,一颗低功耗版本的“启明二号”被安装在一台原型无人机上,竟然能够实时处理多路高清视频流,并流畅运行复杂的s(即时定位与地图构建
本章还未完,请点击下一页继续阅读>>>