发布时间:2024-12-16 03:37:07 来源: sp20241216
科技日报讯 (记者刘霞)据美国趣味科学网站14日报道,美国芯片初创企业Cerebras Systems推出了全新的5纳米级“晶圆级引擎3”(WSE-3)芯片。该公司官网称,这是目前世界上运行速度最快的人工智能(AI)芯片,将此前纪录提高了1倍。WSE-3拥有4万亿个晶体管,也使其成为迄今最大的计算机芯片,专门用于训练大型AI模型,未来也有望用于目前正在建设中的“秃鹰银河3号”AI超级计算机。
WSE-3芯片由90万个经AI优化的计算核心组成,集成在一块8.5×8.5英寸的硅晶圆上,类似其“前身”WSE-2。该公司在13日发布的一份新闻稿中表示,WSE-3的功耗和价格与WSE-2相当,但功率是其两倍。WSE-2包括2.6万亿个晶体管和85万个AI核心。目前用于训练AI模型的最强大芯片之一是英伟达H200图形处理单元(GPU),但该芯片只包含800亿个晶体管,仅为WSE-3晶体管数目的1/57。
WSE-3芯片将为正在建设中的“秃鹰银河3号”超级计算机提供动力。该超级计算机将由64个基于WSE-3芯片的Cerebras CS-3 AI系统组成,每秒浮点运算能力有望达到8百亿亿次,使其成为最强大的AI超级计算机之一。
当“秃鹰银河3号”与“秃鹰银河1号”和“秃鹰银河2号”系统“强强联手”,整个网络的浮点运算能力将达到每秒1千6百亿亿次。相较之下,目前世界上最强大的超级计算机——位于美国橡树岭国家实验室的“前沿”超级计算机,其运算能力为每秒1百亿亿次。
该公司称,CS-3系统具有卓越的易用性,相比GPU需要更少代码来训练大型AI模型,将用于训练比GPT-4或谷歌的“双子座”大10倍的未来AI系统。据称,GPT-4使用了约1.76万亿个参数来训练系统,而CS-3系统可处理有24万亿个参数的AI模型。
(责编:罗知之、陈键)