帖子
智谱联合提出下一代大模型推理网络架构ZCube,破解PD分离引发的结构性网络拥塞

币界网消息,智谱联合驭驯网络与清华大学提出下一代大模型推理网络架构ZCube,旨在破解大模型PD(prefill-decode)分离部署中日益严峻的结构性网络拥塞难题。ZCube架构已在GLM-5.1 coding千卡线上生产环境落地。该架构通过取消spine层交换机,采用全网扁平化拓扑(2跳网络直径),结合单/多轨混合接入机制,实现了跨节点全网交换机之间的流量负载均衡。在基准测试中,ZCube架构相比传统架构减少了33%的交换机与光模块硬件支出,同时GPU平均推理吞吐率提升了15%,首token时延(TTFT)P99分位数下降了40.6%。
相关快讯
伊朗代表团结束在卡塔尔会谈议程,将返回德黑兰
某鲸鱼向Wintermute存入1756.6万枚ENA,亏损约360万美元
凯投宏观:即使中东冲突结束2026年主要经济体仍无望降息
本周宏观数据或主导加密市场走势,PCE、失业金与房市数据成美联储降息关键观察指标
SpaceX IPO前夕曝出200亿美元关联交易争议,马斯克好友或借IPO跻身全球富豪榜前列
Squid:安全事件与 Squid 核心协议及合约无关,所有 Squid 用户及集成方均未受影响
宇树科技科创板IPO将于6月1日上会
比特币ETF两周流出超20亿美元,但分析师称「机构资金并未离场」
Prometheum押注华尔街渠道:代币化证券真正缺的不是技术,而是「分销」
不丹王国已累计抛售9,180枚BTC,均价98,067美元


