Допис

微软让 GPT 与 Claude 协同工作,性能超越所有竞品

ChainCatcher
ChainCatcher

ChainCatcher 消息,微软周一宣布为 Copilot Researcher 推出两项新功能—Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。

Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任严格审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。

在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。

Застереження. Вміст, опублікований на OKX Orbit, надається виключно в інформаційних цілях. Докладніше

Відповіді

Ще немає коментарів. Додайте першу відповідь!

Related Flash News

Blockbeats19хв тому

Квантова комп'ютерна компанія Quantinuum прагне залучити 1,05 мільярда доларів через IPO

Blockbeats36хв тому

Wintermute: Ключовий рівень підтримки біткоїна знаходиться в діапазоні $75,000–$76,000, що свідчить про те, що структура ринку ще не повністю погіршилася

Odaily1г тому

Іранські ЗМІ: Розморожування іранських коштів — остання серйозна перешкода між Іраном і Сполученими Штатами

ChainCatcher1г тому

Bloomberg: 9 «китових гаманців» домінують у багатомільярдному рішенні Polymarket щодо спору

币界网1г тому

Міністерство оборони США та SpaceX оскаржують ціноутворення Starlink

ChainCatcher1г тому

Головний інвестиційний директор BSTR заявив, що вони створюють «Berkshire Hathaway 2», щоб збільшити кількість біткоїнів на акцію

币界网1г тому

Шлях найменшого опору для цін на золото залишається вниз

币界网2г тому

Іран наполягає, що половина заморожених коштів буде доступна після оголошення угоди

Blockbeats2г тому

Аналіз: Біткоїн суттєво охолов у короткостроковому обороті, і ринок знаходиться близько до дна

Odaily2г тому

Іранські ЗМІ заперечували заяви про досягнення меморандуму про взаєморозуміння між Іраном і США