AI资讯芯片与硬件
亚马逊发布新一代AI芯片Inferentia 3,主攻推理优化
云端AI推理成本有望进一步降低,赋能更多企业级应用
2026年2月26日,亚马逊(Amazon)旗下云计算服务AWS宣布推出其第三代自研AI推理芯片Inferentia 3。这款芯片专为高效运行大型语言模型(LLMs)和生成式AI模型而设计,承诺在性能和成本效益上超越前代产品。Inferentia 3采用了全新的架构,显著提升了每瓦特的推理吞吐量,旨在帮助AWS客户在云端以更低的成本部署和扩展AI应用。亚马逊表示,Inferentia 3将首先在AWS的特定EC2实例中提供,预计将加速企业在客服、内容生成、数据分析等领域的AI落地进程,进一步推动AI服务的普及。
来源:
02.26AWS官方博客·CRN