帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
美媒:美国和伊朗正努力解决在核问题及制裁方面的措辞分歧
巨鲸nemorino.eth杠杆增持7,908.3枚ETH
YZi Labs 推出招聘平台 YZi Talent,整合旗下 Web3、AI 和生物科技投资组合职位
伊朗代表团结束在卡塔尔会谈议程,将返回德黑兰
ICON将于2026年底正式关闭,ICX迁移至SODA截止日期确定
某鲸鱼向Wintermute存入1756.6万枚ENA,亏损约360万美元
凯投宏观:即使中东冲突结束2026年主要经济体仍无望降息
本周宏观数据或主导加密市场走势,PCE、失业金与房市数据成美联储降息关键观察指标
SpaceX IPO前夕曝出200亿美元关联交易争议,马斯克好友或借IPO跻身全球富豪榜前列
Squid:安全事件与 Squid 核心协议及合约无关,所有 Squid 用户及集成方均未受影响


