帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相关快讯
Coinbase CEO公布八项金融愿景,业务版图全面对标「链上华尔街」
AI 与半导体股票持续活跃,Gate 在 NVIDIA 与美光相关合约交易中位居行业前列
vLLM封禁「简历贴金」虚假PR贡献者,拟引入企校邮箱验证严防AI灌水
立讯精密:光铜并进与头部客户布局光芯片并不矛盾
NSA拟引入Anthropic绝密新模型,白宫特批90亿美元预算破除算力荒
机构:标普500指数有望创下自2021年以来最强劲的盈利增长
分析:SpaceX IPO或扩大纳指BTC敞口,但可能对科技股与比特币资金虹吸形成短期利空
AI 创企 Hark 以 60 亿美元估值完成 7 亿美元 A 轮融资,Parkway Venture Capital 领投
白宫推迟人工智能行政令签署仪式
英伟达股价跌幅扩大至2%,英特尔跌幅扩大至4.3%。



