
微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。
Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。
在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。
Aviso legal: o conteúdo do OKX Orbit é fornecido apenas para fins informativos. Saber mais
Respostas
Related Flash News
A empresa de computação quântica Quantinuum está a tentar angariar 1,05 mil milhões de dólares através de uma IPO
Wintermute: O principal nível de suporte do Bitcoin situa-se na faixa dos 75.000–76.000 dólares, indicando que a estrutura do mercado ainda não se deteriorou totalmente
Media iranianos: Descongelar fundos iranianos é o último obstáculo sério entre o Irão e os Estados Unidos
Bloomberg: 9 carteiras de baleia dominam a decisão multimilionária da Polymarket sobre uma disputa multimilionária
O Departamento de Defesa dos EUA e a SpaceX têm contestado os preços do Starlink
O Diretor de Investimentos da BSTR afirmou que estão a construir o "Berkshire Hathaway 2", com o objetivo de aumentar o número de Bitcoins por ação
O caminho de menor resistência para os preços do ouro continua a ser descendente
O Irão insiste que metade dos fundos congelados estará disponível quando o acordo for anunciado
Análise: O Bitcoin arrefeceu significativamente no volume de negócios a curto prazo, e o mercado está perto do fundo
Os media iranianos negaram as alegações de que o Irão e os EUA teriam alcançado um memorando de entendimento