犇驰财经

亚马逊新款ai芯片上市!下一代芯片将与英伟达生态“合体”-澳亚国际

犇驰网 2025-12-03 3447浏览量


云计算“一哥”亚马逊aws在re:invent大会期间宣布,华尔街翘首期待的新一代自研ai芯片trainium3正式公开上市。

  综合澳亚国际的介绍,trainium3是亚马逊首款3nm制程芯片。与上一代trainium芯片相比,trainium3计算性能最高提升4.4倍,能效提升4倍,内存带宽几乎提升4倍,主打ai算力竞争的性价比赛道。由trainium3组成的ultraserver系统还可以互联,每台可容纳144枚芯片,为单个应用提供多达100万枚trainium3芯片,为上一代的10倍。

image

  公司表示,与同样使用图形处理单元(gpu)的系统相比,训练和运行ai模型的成本能够降低最多50%

  当然,指望亚马逊trainium3与谷歌tpu一战,甚至“挑战英伟达”的投资者可能会有些失望,毕竟没有任何资料显示这款芯片除了“性价比”之外的其他优势。

  亚马逊拒绝透露新款ai芯片与谷歌、英伟达最新产品的基准性能对比,也未披露功耗参数。目前我们仅知道每枚芯片集成144gb的高带宽内存,而谷歌最新的ironwood tpu为192gb,英伟达的blackwell gb300则最高可达288gb。

  负责trainium项目的aws副总裁兼首席架构师ron diamant也直言:“我不认为我们会试图取代英伟达”。

  diamant进一步表示,归根结底,这款自研芯片最大的优势就是性价比。他的主要目标是为客户在不同的计算工作负载上提供更多选择。

  对于亚马逊的ai芯片而言,最大的短板并不是芯片本身,而是亚马逊缺乏足够有深度且易于使用的软件库

  除了亚马逊自己以及公司大力投资的ai初创企业anthropic外,现在几乎找不到使用trainium芯片的知名公司。

  而anthropic也在10月表示,将采购最多100万块谷歌的tpu,又在11月宣布与英伟达签署投资入股协议,并将进一步购买英伟达芯片的算力。不过anthropic也强调,亚马逊仍然是其“主要的训练澳亚国际的合作伙伴和云服务提供商”, 预计到年底将使用超过一百万颗trainium 2芯片。

  使用人工智能赋能施工设备自动化的bedrock robotics介绍称,公司基础设施运行在aws服务器上,但在为挖掘机构建引导模型时,就得用英伟达芯片。公司首席技术官kevin peterson总结称:“我们需要它既高性能又易于使用,那就是英伟达。

  亚马逊似乎也意识到了这个问题。在trainium3的公告中,公司特别强调trainium4已在研发中,最大的亮点是“能与英伟达芯片协同工作”。

  公司表示,trainium4将支持英伟达nvlink fusion高速芯片互连技术,最终形成一种兼顾gpu与trainium服务器的经济高效机架级ai基础设施。

  英伟达介绍称,nvlink fusion的核心是nvlink fusion chiplet,超大规模云服务商可以将该chiplet嵌入其定制asic设计中,以连接nvlink规模化互联和nvlink交换机。

image

  (nvlink fusion芯片组使72个定制asic以每个asic 3.6 tb/s的带宽实现全互联,来源:英伟达)

  这意味着,基于trainium4的系统将能够与英伟达gpu互操作,并提升整体性能,同时依然使用亚马逊自研的、更低成本的服务器机柜技术。这也将使得那些以英伟达gpu为核心构建的大型ai应用,更容易迁移到aws。


标签:
文章来源声明:犇驰网
留言与评论(共有 条评论)
   
验证码:
网站地图