筛选：

Sakana Fugu - 多模型编排即服务，一个API调度顶级模型军团

Sakana AI 推出的多智能体编排系统，用AI学出来的协作方式协调GPT/Claude/Gemini等顶级模型，一个API搞定复杂编程与推理任务

多模型编排即服务：一个API调用顶级模型军团

Sakana AI（日本，David Ha 创办）推出的 Sakana Fugu 是一款多智能体编排系统，以单一模型接口的形式对外提供服务。核心理念：不训练新模型，而是动态协调多个顶级模型（GPT、Claude、Gemini 等）协同工作，通过"AI 学出来的协作方式"而非人工设计的 workflow 来分配任务。

技术基础（ICLR 2026 两篇论文）

TRINITY — 用进化算法训练轻量协调器，给池中模型动态分配 Thinker（思考）、Worker（执行）、Verifier（验证）三种角色
Conductor — 用强化学习发现自然语言协调策略，自动设计 agent 之间的通信模式和 prompt

两个版本

版本	定位	输出价格
Fugu	日常使用，低延迟	按底层模型标准价
Fugu Ultra	复杂任务，最高质量	输入$5/输出$30（百万token）

多 agent 同时工作时只收最高那个模型的价格，不叠加。

Benchmark 表现

在编程、推理、科学等 benchmark 上全面超越 GPT-5.5 和 Opus 4.8：

SWE Bench Pro: 73.7（Ultra）/ Opus 69.2 / GPT 5.5 58.6
TerminalBench 2.1: 82.1 / Opus 74.6
LiveCodeBench: 93.2 / Opus 87.8
GPQA-D: 95.5

定价

Token 计费： 输入 $5、输出 $30（Ultra，百万 token），缓存 $0.50

订阅制：

Standard $20/月 — 轻量日常
Pro $100/月 — 10 倍用量
Max $200/月 — 30 倍用量

7 月底前订阅送第二个月免费。

优缺点

优点：

一个 API 统一调用，自动选最优模型组合
编程和复杂推理性能强劲
提供商灵活性：可排除特定模型满足合规要求
OpenAI 兼容 API，直接接入 Codex/Cursor 等工具

缺点：

闭源商业服务，编排逻辑不透明
不支持自部署，EU 地区暂不可用
数据需发送到 Sakana 服务器
纯推理场景，不具备工具链能力（终端、文件、浏览器等）

适合谁

需要强推理/编程能力但不想操心模型选择的企业用户、Kaggle 竞赛选手、安全分析人员。对于已有完善 agent 工具链（如 Hermes Agent、Cursor + MCP）的用户，可作为推理层补充，而非全栈替代。

1300举报0

Xiao.Xi•5天前

点击获取 ^_^

被收录：

模型 Sakana 编排

暂无评论