
MoE仅激活4B,比原版Dense快8.7%且分数更高,263赞社区最认可的MLX免审查模型
SuperGemma4-26B-Uncensored-Fast v2
Apple Silicon 本地跑最快的 Gemma4 免审查模型,专为 MLX 优化。
核心亮点
- MoE 架构 — 128 专家选 8,实际只激活 4B 参数,比原版 Dense 26B 快 8.7%
- 免审查 — uncensored 处理保留,代码/工具调用/韩文不崩
- 比原版更强 — quick bench 总分 95.8 vs 原版 91.4(+4.4)
- 体积小 — MLX 4bit 仅约 13GB,256GB Mac 可轻松并行多模型
Benchmark 对比
| 指标 | Gemma4-26B 原版 4bit | SuperGemma Fast |
|---|---|---|
| Quick bench 总分 | 91.4 | 95.8 |
| 生成速度 | 42.5 tok/s | 46.2 tok/s |
| Code | 92.3 | 98.6 (+6.3) |
| Logic | 86.9 | 95.2 (+8.3) |
| Browser | 87.5 | 89.6 (+2.1) |
| System Design | 97.8 | 98.9 |
| Korean | 90.7 | 95.0 (+4.3) |
快速启动
# mlx_lm 启动
mlx_lm.server \
--model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 \
--port 8080
# 或 vMLX 启动
vmlx serve Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 \
--port 8080 --host 0.0.0.0
适用场景
- ✅ 编码助手 / Agent 工具调用
- ✅ 浏览器自动化 / 规划推理
- ✅ 韩文内容处理
- ✅ 隐私敏感的本地推理
- ❌ 不支持图片理解(纯文字模型)
- ❌ 非多模态,看图请用 Qwen3-VL 或 Gemma4 多模态版
暂无评论
