
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Disclaimer: de content op OKX Orbit dient uitsluitend ter informatie. Meer informatie
Reacties
Related Flash News
Quantinuum computing-bedrijf Quantinuum wil via een beursgang $1,05 miljard ophalen
Wintermute: Het belangrijkste ondersteuningsniveau van Bitcoin ligt tussen $75.000 en $76.000, wat aangeeft dat de marktstructuur niet volledig is verslechterd.
Iraanse media: Het ontdooien van Iraanse fondsen is het laatste serieuze obstakel tussen Iran en de Verenigde Staten
Bloomberg: 9 walviswallets domineren de miljarden-dollar tellende uitspraak van Polymarket
Het Amerikaanse ministerie van Defensie en SpaceX hebben de Starlink-prijzen betwist
De Chief Investment Officer van BSTR verklaarde dat ze "Berkshire Hathaway 2" bouwen, met als doel het aantal Bitcoins per aandeel te verhogen
Het pad van de minste weerstand voor goudprijzen blijft dalend
Iran staat erop dat de helft van de bevroren fondsen beschikbaar zal zijn wanneer de overeenkomst wordt aangekondigd
Analyse: Bitcoin is aanzienlijk afgekoeld qua kortetermijnomzet en de markt bevindt zich dicht bij de bodem
Iraanse media ontkenden beweringen dat Iran en de VS een memorandum van overeenstemming hadden bereikt