Postare

Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网
币界网
币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。

Declinarea responsabilității: conținutul OKX Orbit este furnizat doar în scopuri informative. Aflați mai multe

Răspunsuri

Încă nu există niciun comentariu. Fiți primul care răspunde!

Related Flash News

Avatar sursăBlockbeats19m în urmă

Mass-media americană: SUA și Iranul lucrează pentru a-și rezolva diferențele lingvistice privind problemele nucleare și sancțiunile

Avatar sursăBlockbeats55m în urmă

巨鲸nemorino.eth杠杆增持7,908.3枚ETH

Avatar sursăChainCatcher1h în urmă

YZi Labs a lansat platforma de recrutare YZi Talent, integrând poziții în portofoliul său Web3, AI și biotehnologie

Avatar sursăBlockbeats1h în urmă

Delegația iraniană și-a încheiat agenda în Qatar și se va întoarce la Teheran

Avatar sursăBlockbeats1h în urmă

ICON se va închide oficial la sfârșitul anului 2026, iar termenul limită pentru migrarea ICX către SODA este confirmat

Avatar sursăBlockbeats2h în urmă

O balenă a depus 17,566 milioane ENA în Wintermute, pierzând aproximativ 3,6 milioane de dolari

Avatar sursă币界网3h în urmă

Capital Macro: Chiar dacă conflictul din Orientul Mijlociu se încheie în 2026, marile economii încă nu au perspective de a reduce ratele dobânzilor

Avatar sursăBlockbeats3h în urmă

Săptămâna aceasta, datele macroeconomice ar putea domina piața cripto, PCE, cererile de șomaj și datele privind locuințele devenind indicatori cheie pentru reducerile ratelor Fed

Avatar sursăBlockbeats3h în urmă

În ajunul IPO-ului SpaceX, a apărut o controversă de 20 de miliarde de dolari privind tranzacțiile arudite, iar prietenul lui Musk ar putea folosi IPO-ul pentru a se clasa printre primii miliardari la nivel global.

Avatar sursăChainCatcher3h în urmă

Squid: Incidentele de securitate nu au legătură cu protocoalele și contractele de bază ale lui Squid; toți utilizatorii și integratorii Squid nu au fost afectați