
Sakana AI 推出的多智能体编排系统,用AI学出来的协作方式协调GPT/Claude/Gemini等顶级模型,一个API搞定复杂编程与推理任务
多模型编排即服务:一个API调用顶级模型军团
Sakana AI(日本,David Ha 创办)推出的 Sakana Fugu 是一款多智能体编排系统,以单一模型接口的形式对外提供服务。核心理念:不训练新模型,而是动态协调多个顶级模型(GPT、Claude、Gemini 等)协同工作,通过"AI 学出来的协作方式"而非人工设计的 workflow 来分配任务。
技术基础(ICLR 2026 两篇论文)
- TRINITY — 用进化算法训练轻量协调器,给池中模型动态分配 Thinker(思考)、Worker(执行)、Verifier(验证)三种角色
- Conductor — 用强化学习发现自然语言协调策略,自动设计 agent 之间的通信模式和 prompt
两个版本
| 版本 | 定位 | 输出价格 |
|---|---|---|
| Fugu | 日常使用,低延迟 | 按底层模型标准价 |
| Fugu Ultra | 复杂任务,最高质量 | 输入$5/输出$30(百万token) |
多 agent 同时工作时只收最高那个模型的价格,不叠加。
Benchmark 表现
在编程、推理、科学等 benchmark 上全面超越 GPT-5.5 和 Opus 4.8:
- SWE Bench Pro: 73.7(Ultra)/ Opus 69.2 / GPT 5.5 58.6
- TerminalBench 2.1: 82.1 / Opus 74.6
- LiveCodeBench: 93.2 / Opus 87.8
- GPQA-D: 95.5
定价
Token 计费: 输入 $5、输出 $30(Ultra,百万 token),缓存 $0.50
订阅制:
- Standard $20/月 — 轻量日常
- Pro $100/月 — 10 倍用量
- Max $200/月 — 30 倍用量
7 月底前订阅送第二个月免费。
优缺点
优点:
- 一个 API 统一调用,自动选最优模型组合
- 编程和复杂推理性能强劲
- 提供商灵活性:可排除特定模型满足合规要求
- OpenAI 兼容 API,直接接入 Codex/Cursor 等工具
缺点:
- 闭源商业服务,编排逻辑不透明
- 不支持自部署,EU 地区暂不可用
- 数据需发送到 Sakana 服务器
- 纯推理场景,不具备工具链能力(终端、文件、浏览器等)
适合谁
需要强推理/编程能力但不想操心模型选择的企业用户、Kaggle 竞赛选手、安全分析人员。对于已有完善 agent 工具链(如 Hermes Agent、Cursor + MCP)的用户,可作为推理层补充,而非全栈替代。
暂无评论
