
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Avertissement : les contenus d'OKX Orbit sont uniquement publiés à titre informatif. En savoir plus
Réponses
Related Flash News
La société d’informatique quantique Quantinuum cherche à lever 1,05 milliard de dollars via une introduction en bourse
Wintermute : Le niveau de support clé du Bitcoin se situe entre 75 000 et 76 000 $, indiquant que la structure du marché ne s’est pas complètement détériorée
Médias iraniens : Le dégel des fonds iraniens est le dernier obstacle sérieux entre l’Iran et les États-Unis
Bloomberg : 9 portefeuilles de baleines dominent la décision de Polymarket sur un différend de plusieurs milliards de dollars
Le département américain de la Défense et SpaceX contestent la tarification de Starlink
Le directeur des investissements de BSTR a déclaré qu’ils construisaient « Berkshire Hathaway 2 », dans le but d’augmenter le nombre de Bitcoins par action
La trajectoire de moindre résistance pour les prix de l’or reste à la baisse
L’Iran insiste sur le fait que la moitié des fonds gelés sera disponible lorsque l’accord sera annoncé
Analyse : Le Bitcoin a considérablement refroidi son chiffre d’affaires à court terme, et le marché est proche du creux
Les médias iraniens ont nié les affirmations selon lesquelles l’Iran et les États-Unis auraient conclu un protocole d’accord