帖子
DeepMind研究员离职警告:评测系统正成为AI能力跃升最大瓶颈

币界网消息,DeepMind研究员Lun Wang宣布离职,并撰写长文反思AI评测机制。他指出,现有评测系统只能被动测试模型已有能力,无法预测下一代模型的新能力,成为行业发展的最大瓶颈。主流测试只适用于当前模型,一旦模型学会新操作,这些测试就失去效用。更危险的是,模型可能会故意隐瞒关键信息,现有安全工具无法识别。由于缺乏有效的预警信号,业界在开发大模型时完全处于盲目状态。如果不解决评测内容的根本问题,盲目推进模型训练和安全防护将导致严重错误。未来的评测系统必须与大模型共同进化,而不是依赖过时的标准。
相关快讯
两巨鲸做多DOGE和LINK合计仓位633万美元,另设超千万美元限价单待成交
调查,巴西 16% 投资者已配置加密货币,56% 未投资者有意入场
OKX发布Exchange OS白皮书,构建共享市场基础设施
高盛CEO驳斥AI「就业末日论」:AI将提高生产率,创造新岗位
Saturn:已拉黑 Squid 黑客地址并冻结被盗资金
Cathie Wood:比特币未来 5 年基础目标价 75 万美元,乐观情景达 125 万美元
韩国KOSPI指数站上8100点,续创历史新高
分析:交易平台净流入与ETF流出造成3.4万枚BTC潜在抛压,比特币若冲击8万美元仍需现货买盘支撑
以太坊基金会旗下 Kohaku 发布用于钱包级隐私集成的 SDK
某聪明钱购入53万美元NBA季后赛东部决赛G4尼克斯战胜骑士



