Publicar

Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网
币界网
币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。

Aviso legal: o conteúdo do OKX Orbit é fornecido apenas para fins informativos. Saber mais

Respostas

Ainda sem comentários. Sê a primeira pessoa a responder!

Related Flash News

Avatar de origemBlockbeats19 min.

Media dos EUA: Os EUA e o Irão estão a trabalhar para resolver as suas diferenças linguísticas sobre questões nucleares e sanções

Avatar de origemBlockbeats55 min.

巨鲸nemorino.eth杠杆增持7,908.3枚ETH

Avatar de origemChainCatcher1 hora

A YZi Labs lançou a plataforma de recrutamento YZi Talent, integrando posições no seu portefólio Web3, IA e biotecnologia

Avatar de origemBlockbeats1 hora

A delegação iraniana concluiu a sua agenda no Qatar e regressará a Teerão

Avatar de origemBlockbeats1 hora

A ICON será oficialmente encerrada no final de 2026, e o prazo para a migração da ICX para SODA foi confirmado

Avatar de origemBlockbeats2 horas

Uma baleia depositou 17,566 milhões de ENA em Wintermute, perdendo cerca de 3,6 milhões de dólares

Avatar de origem币界网3 horas

Capital Macro: Mesmo que o conflito do Médio Oriente termine em 2026, as grandes economias continuam sem perspetivas de cortar as taxas de juro

Avatar de origemBlockbeats3 horas

Esta semana, os dados macroeconómicos poderão dominar o mercado cripto, com o PCE, os pedidos de subsídio de desemprego e os dados de habitação a tornarem-se indicadores-chave para cortes de taxas da Fed

Avatar de origemBlockbeats3 horas

Na véspera do IPO da SpaceX, surgiu uma controvérsia de 20 mil milhões de dólares sobre transações relacionadas, e o amigo de Musk poderá usar o IPO para se situar no topo da lista global de bilionários

Avatar de origemChainCatcher3 horas

Squid: Os incidentes de segurança não estão relacionados com os protocolos e contratos centrais da Squid; todos os utilizadores e integradores da Squid não foram afetados