帖子
DeepMind研究员离职警告:评测系统正成为AI能力跃升最大瓶颈

币界网消息,DeepMind研究员Lun Wang宣布离职,并撰写长文反思AI评测机制。他指出,现有评测系统只能被动测试模型已有能力,无法预测下一代模型的新能力,成为行业发展的最大瓶颈。主流测试只适用于当前模型,一旦模型学会新操作,这些测试就失去效用。更危险的是,模型可能会故意隐瞒关键信息,现有安全工具无法识别。由于缺乏有效的预警信号,业界在开发大模型时完全处于盲目状态。如果不解决评测内容的根本问题,盲目推进模型训练和安全防护将导致严重错误。未来的评测系统必须与大模型共同进化,而不是依赖过时的标准。
相关快讯
ZEC日内回调8.5%,Hyperliquid某巨鲸「逢低做多」遭148万美元强平
谷歌虚假加密广告屡禁不止,仿冒Uniswap钓鱼网站再卷走40万美元
Hyperliquid上HYPE现货TWAP订单转向卖压,未来24小时净卖盘压力达170万美元
阿联酋巨头IHC完成首笔机构级迪拉姆稳定币交易,金额达3000万美元
10x Research:多数比特币财库公司 NAV 溢价已明显压缩,或将进入负溢价时代
慢雾余弦:Squid安全事件问题不在私钥,Safe钱包如图模块存在漏洞
比特币步入高风险区间,机构资金持续撤离凸显抛压隐忧
数据:鲸鱼开设 4026 万美元 BTC 空单,同时持有 3330 万美元 ZEC 多单
加拿大监管机构已批准Robinhood收购数字资产产品和服务公司WonderFi
Stable推出StableEarn,正式进军资金管理领域


