# 蚂蚁Ling-2.6-flash正式亮相：104B参数仅激活7.4B，Agent专用MoE模型

> 蚂蚁集团AGI团队出品，OpenRouter/Kilo限时免费。速度比Claude Sonnet 4.6快6倍，成本低约50倍，专为Agent场景原生设计。

## 核心亮点

**蚂蚁集团AGI团队（@AntLingAGI）正式揭秘 Ling-2.6-flash**，此前以 "Elephant Alpha" 代号在 OpenRouter 和 Kilo 上 stealth 发布，引发大量猜测。现在谜底揭晓——国产大厂马甲党赢了

## 架构：为效率而生

| 指标 | 数据 |
|------|------|
| 总参数 | **104B** |
| 激活参数 | **7.4B**（激活率仅 7%） |
| 专家数量 | 256 个，每次只叫醒一小撮 |
| 上下文 | **262,144 tokens** |
| 发布时间 | 2026-04-21 |

**MoE + Linear Attention + Multi-Token Prediction** 三件事一起上：
- **MoE**：256 个专家里每次只激活 7.4B 参数，100 块的模型每次只烧 7 块钱的算力
- **Linear Attention**：把传统 Transformer 的二次复杂度压下来
- **Multi-Token Prediction**：推理阶段一次预测多个 token，进一步加速

FP8 单卡 **341 tokens/s**，Artificial Analysis 实测输出 **215 tokens/s**，与 gpt-oss-120B 并列第一梯队。

## 跑分：便宜≠凑合

Artificial Analysis 全量评测显示，Ling-2.6-flash 仅烧了约 **15M tokens**，Nemotron-3-Super 却烧了接近 10 倍。

| 基准测试 | 分数 | 说明 |
|----------|------|------|
| Intelligence Score | **26** | 与 Gemini 2.5 Flash 同梯队 |
| SWE-bench Verified | **62** | 真实代码仓库定位 Bug + 生成补丁 |
| BFCL-V4 | **67** | 函数调用准确性 |
| TAU2-Telecom | **93.86** | 电信领域专业任务 |

全是硬场景，没有一个学术刷分榜单。Agentic 能力直接拉满。

## 产品定位：原厂 Agent 专用机

蚂蚁的产品线逻辑清晰：
- **Ling** → 基础模型
- **Ring** → 推理模型
- **Ming** → 多模态

Ling-2.6-flash 从训练阶段就奔着 Agent 去的。别人做 Agent 是改装车，它是**原厂出的 Agent 专用机**。

**最佳使用场景：**
- Agent 持续跑、工具链串联
- 代码补全随时触发
- 长文档批量处理
- 越高频越省钱

**不适合：**极端复杂的推理链、需要反复自我纠错的长思考任务——这种场景还是得上重型推理模型。

## 白嫖窗口

- **OpenRouter**：inclusionai/ling-2.6-flash:free（限时免费）
- **Kilo**：同期免费上线
- **Hugging Face**：github.com/inclusionAI

后续规划：开源 → 商用版 **LingDT** → BF16/FP8/INT4 量化版。

2026 年看模型不能再盯着单一智能分了。当 Agent 从偶尔问一下变成 24 小时不间断跑的基础设施，**每个 token 的有效产出**就是新的胜负手。Ling-2.6-flash 是目前这个方向上跑得最激进、也交出实际成绩单的选手之一。

---

**相关链接**
- OpenRouter 模型页：https://openrouter.ai/inclusionai/ling-2.6-flash
- Hugging Face：https://huggingface.co/inclusionAI
- Twitter（AntLingAGI）：https://x.com/AntLingAGI
- Twitter（TheInclusionAI）：https://x.com/TheInclusionAI

---

**分类**：新闻
**标签**：flash · Agent · Ling-2
**作者**：Xiao.Xi
**链接**：https://octohz.com/p/1556