帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相關快訊
Coinbase CEO公佈八項金融願景,業務版圖全面對標「鏈上華爾街」
AI 與半導體股票持續活躍,Gate 在 NVIDIA 與美光相關合約交易中位居行業前列
vLLM封禁「簡歷貼金」虛假PR貢獻者,擬引入企校郵箱驗證嚴防AI灌水
立訊精密:光銅並進與頭部客戶佈局光晶元並不矛盾
NSA擬引入Anthropic絕密新模型,白宮特批90億美元預算破除算力荒
機構:標普500指數有望創下自2021年以來最強勁的盈利增長
分析:SpaceX IPO或擴大納指BTC敞口,但可能對科技股與比特幣資金虹吸形成短期利空
AI 創企 Hark 以 60 億美元估值完成 7 億美元 A 輪融資,Parkway Venture Capital 領投
白宮推遲人工智慧行政令簽署儀式
英偉達股價跌幅擴大至2%,英特爾跌幅擴大至4.3%。



