帖子
智谱联合提出下一代大模型推理网络架构ZCube,破解PD分离引发的结构性网络拥塞

币界网消息,智谱联合驭驯网络与清华大学提出下一代大模型推理网络架构ZCube,旨在破解大模型PD(prefill-decode)分离部署中日益严峻的结构性网络拥塞难题。ZCube架构已在GLM-5.1 coding千卡线上生产环境落地。该架构通过取消spine层交换机,采用全网扁平化拓扑(2跳网络直径),结合单/多轨混合接入机制,实现了跨节点全网交换机之间的流量负载均衡。在基准测试中,ZCube架构相比传统架构减少了33%的交换机与光模块硬件支出,同时GPU平均推理吞吐率提升了15%,首token时延(TTFT)P99分位数下降了40.6%。
相關快訊
伊朗代表團結束在卡達會談議程,將返回德黑蘭
某鯨魚向Wintermute存入1756.6萬枚ENA,虧損約360萬美元
凱投巨集觀:即使中東衝突結束2026年主要經濟體仍無望降息
本周巨集觀數據或主導加密市場走勢,PCE、失業金與房市數據成美聯儲降息關鍵觀察指標
SpaceX IPO前夕曝出200億美元關聯交易爭議,馬斯克好友或借IPO躋身全球富豪榜前列
Squid:安全事件與 Squid 核心協定及合約無關,所有 Squid 使用者及集成方均未受影響
ZEC最大空頭:ZEC空單增持3093.62枚,持倉規模超1688萬美元
宇樹科技科創板IPO將於6月1日上會
比特幣ETF兩周流出超20億美元,但分析師稱「機構資金並未離場」
Prometheum押注華爾街管道:代幣化證券真正缺的不是技術,而是「分銷」


