
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Declinarea responsabilității: conținutul OKX Orbit este furnizat doar în scopuri informative. Aflați mai multe
Răspunsuri
Related Flash News
Compania de calcul cuantic Quantinuum urmărește să strângă 1,05 miliarde de dolari printr-un IPO
Wintermute: Nivelul cheie de suport al Bitcoin este în intervalul de 75.000–76.000 dolari, indicând că structura pieței nu s-a deteriorat complet
Mass-media iraniană: Deblocarea fondurilor iraniene este ultimul obstacol serios dintre Iran și Statele Unite
Bloomberg: 9 portofele balene domină hotărârea Polymarket privind disputa de miliarde de dolari
Departamentul Apărării al SUA și SpaceX au contestat prețurile Starlink
Directorul de Investiții al BSTR a declarat că se construiește "Berkshire Hathaway 2", cu scopul de a crește numărul de Bitcoins pe acțiune
Calea de cea mai mică rezistență pentru prețurile aurului rămâne descendentă
Iranul insistă că jumătate din fondurile înghețate vor fi disponibile când va fi anunțat acordul
Analiză: Bitcoin s-a răcit semnificativ în cifra de afaceri pe termen scurt, iar piața este aproape de scădere
Mass-media iraniană a negat afirmațiile că Iranul și SUA ar fi ajuns la un memorandum de înțelegere