Допис

DeepMind研究员离职警告:评测系统正成为AI能力跃升最大瓶颈

币界网
币界网
币界网消息,DeepMind研究员Lun Wang宣布离职,并撰写长文反思AI评测机制。他指出,现有评测系统只能被动测试模型已有能力,无法预测下一代模型的新能力,成为行业发展的最大瓶颈。主流测试只适用于当前模型,一旦模型学会新操作,这些测试就失去效用。更危险的是,模型可能会故意隐瞒关键信息,现有安全工具无法识别。由于缺乏有效的预警信号,业界在开发大模型时完全处于盲目状态。如果不解决评测内容的根本问题,盲目推进模型训练和安全防护将导致严重错误。未来的评测系统必须与大模型共同进化,而不是依赖过时的标准。

Застереження. Вміст, опублікований на OKX Orbit, надається виключно в інформаційних цілях. Докладніше

Відповіді

Ще немає коментарів. Додайте першу відповідь!

Related Flash News

Аватар джерелаBlockbeats11хв тому

Біткойн увійшов у зону високого ризику, і продовження виведення інституційних фондів підкреслює занепокоєння щодо тиску на продажі

Аватар джерелаChainCatcher15хв тому

Дані: Whales відкрили $40,26 мільйона коротких позицій у BTC і тримали $33,3 мільйона в довгих позиціях ZEC

Аватар джерелаBlockbeats36хв тому

Канадські регулятори схвалили придбання Robinhood компанії з цифрових активів WonderFi

Аватар джерелаBlockbeats1г тому

Stable запустила StableEarn, офіційно увійшовши у сферу управління фондами

Аватар джерелаChainCatcher1г тому

Ф'ючерси Binance запустять кілька безстрокових контрактів USDT-M TradFi

Аватар джерелаBlockbeats1г тому

Два кити мають довгі позиції DOGE та LINK на загальну суму $6,33 мільйона, з понад $10 мільйонами лімітних ордерів, які очікують виконання

Аватар джерелаChainCatcher1г тому

Опитування показує, що 16% бразильських інвесторів виділили криптовалюти, тоді як 56% неінвесторів мають намір виходити на ринок

Аватар джерелаOdaily2г тому

Артур Гейс: Монетарна приватність буде «дуже необхідною», тому Zcash — другий за величиною холдинг

Аватар джерела币界网2г тому

OKX випустила білий документ Exchange OS для створення спільної інфраструктури маркетплейсу

Аватар джерелаBlockbeats2г тому

Генеральний директор Goldman Sachs спростовує «теорію кінця зайнятості»: ШІ підвищить продуктивність і створить нові робочі місця