
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Zřeknutí se odpovědnosti: Obsah v síti OKX Orbit je poskytován pouze pro informační účely. Další informace
Odpovědi
Related Flash News
Společnost Quantinuum zaměřená na kvantové výpočty se snaží získat 1,05 miliardy dolarů prostřednictvím IPO
Wintermute: Klíčová úroveň podpory Bitcoinu je v rozmezí 75 000–76 000 USD, což naznačuje, že struktura trhu se zcela nezhoršila
Íránská média: Rozmrazení íránských fondů je poslední vážnou překážkou mezi Íránem a Spojenými státy
Bloomberg: 9 peněženek velryb dominuje v multimiliardovém sporu Polymarketu
Ministerstvo obrany USA a SpaceX zpochybnily cenu Starlinku
Hlavní investiční ředitel BSR uvedl, že budují "Berkshire Hathaway 2" s cílem zvýšit počet Bitcoinů na akcii
Cesta nejmenšího odporu pro ceny zlata zůstává klesající
Írán trvá na tom, že polovina zmrazených prostředků bude k dispozici, až bude dohoda oznámena
Analýza: Bitcoin výrazně ochladil krátkodobý obrat a trh je blízko dna
Íránská média popřela tvrzení, že by Írán a USA dosáhly memoranda o porozumění