
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Zastrzeżenie: Treść na OKX Orbiter ma charakter wyłącznie informacyjny. Dowiedz się więcej
Odpowiedzi
Related Flash News
Firma zajmująca się obliczeniami kwantowymi Quantinuum dąży do pozyskania 1,05 miliarda dolarów poprzez wejście na giełdę
Wintermute: Kluczowy poziom wsparcia dla Bitcoina mieści się w przedziale 75 000–76 000 USD, co wskazuje, że struktura rynku nie uległa całkowitemu pogorszeniu
Irańskie media: Odmrożenie irańskich funduszy to ostatnia poważna przeszkoda między Iranem a Stanami Zjednoczonymi
Bloomberg: 9 portfeli wielorybów dominuje w wielomiliardowym sporze Polymarketu
Departament Obrony USA i SpaceX sprzeciwiły się cenie Starlink
Dyrektor ds. Inwestycji BSR oświadczył, że budują "Berkshire Hathaway 2", mający na celu zwiększenie liczby Bitcoinów na akcję
Najmniejsza droga oporu dla cen złota pozostaje w dół
Iran zapewnia, że połowa zamrożonych środków będzie dostępna w momencie ogłoszenia porozumienia
Analiza: Bitcoin znacząco ochłodził się w krótkoterminowym obrotie, a rynek znajduje się blisko dna
Irańskie media zaprzeczyły twierdzeniom, że Iran i USA zawarły memorandum o porozumieniu