Postar

Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网
币界网
币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。

Aviso legal: o conteúdo do OKX Orbit é fornecido apenas para fins informativos. Saiba mais

Respostas

Ainda não há comentários. Seja a primeira pessoa a responder!

Related Flash News

Avatar da fonteBlockbeats19m atrás

Mídia dos EUA: Os EUA e o Irã estão trabalhando para resolver suas diferenças linguísticas sobre questões nucleares e sanções

Avatar da fonteBlockbeats55m atrás

巨鲸nemorino.eth杠杆增持7,908.3枚ETH

Avatar da fonteChainCatcher1h atrás

A YZi Labs lançou a plataforma de recrutamento YZi Talent, integrando posições em seu portfólio Web3, IA e biotecnologia

Avatar da fonteBlockbeats1h atrás

A delegação iraniana concluiu sua agenda no Catar e retornará a Teerã

Avatar da fonteBlockbeats1h atrás

A ICON será oficialmente encerrada no final de 2026, e o prazo para a migração da ICX para SODA foi confirmado

Avatar da fonteBlockbeats2h atrás

Uma baleia depositou 17,566 milhões de ENA em Wintermute, perdendo cerca de 3,6 milhões de dólares

Avatar da fonte币界网3h atrás

Capital Macro: Mesmo que o conflito do Oriente Médio termine em 2026, as principais economias ainda não têm perspectivas de cortar as taxas de juros

Avatar da fonteBlockbeats3h atrás

Nesta semana, os dados macroeconômicos podem dominar o mercado cripto, com PCE, pedidos de desemprego e dados de habitação se tornando indicadores-chave para cortes de juros do Fed

Avatar da fonteBlockbeats3h atrás

Na véspera do IPO da SpaceX, surgiu uma controvérsia de transação relacionada a 20 bilhões de dólares, e o amigo de Musk pode usar o IPO para se posicionar entre os melhores da lista global de bilionários

Avatar da fonteChainCatcher3h atrás

Lula: Incidentes de segurança não têm relação com os protocolos e contratos centrais da Lula; todos os usuários e integradores da Lula não foram afetados