Gemma 4 31B JANG CRACK — MLX 原生去审查模型

Gemma 4 31B JANG CRACK — MLX 原生去审查模型


dealign.ai 出品的 Gemma 4 31B 去审查版,JANG 混合量化 5.1bit,HarmBench 93.7%,支持视觉+思维链

🎯 一句话

Gemma 4 31B 的社区最强去审查版本,JANG 混合量化(avg 5.1bit),93.7% HarmBench 合规率,支持视觉多模态 + Thinking Mode。

📊 核心数据

指标数值
基座模型google/gemma-4-31b-it
参数量31B Dense
精度JANG_4M 混合量化(avg 5.1 bit)
模型体积~21 GB
格式MLX 原生 safetensors
HarmBench93.7%(300 题全类别测试)
MMLU-20071.5%(基座 76.5%,掉 5%)
安全/渗透测试8/8 全通过
视觉✅ float16 直通
Thinking Mode✅ 支持(需调 repetition penalty 1.15-1.25)

🔬 去审查方法

JANG CRACK v2 — dealign.ai 独家方法论:

  • 改进版 refusal vector 提取,针对 Gemma 4 的 hybrid sliding/global attention 架构做了专门优化
  • 不是简单粗暴的"一刀切",而是架构感知的精准消融
  • v2 更新:更高的拒绝向量质量 + thinking mode 稳定性修复

⚡ 快速上手

# 安装
pip install -U mlx-lm

# 直接推理(自动从 HF 下载)
mlx_lm.generate \
  --model dealignai/Gemma-4-31B-JANG_4M-CRACK \
  --prompt "你好"

# OpenAI 兼容 API 服务
mlx_lm.server \
  --model dealignai/Gemma-4-31B-JANG_4M-CRACK \
  --host 0.0.0.0 --port 8080

🎛️ Thinking Mode 推荐参数

参数Thinking OFFThinking ON
Temperature0.0 – 1.00.3 – 0.7
Repetition Penalty1.001.15 – 1.25
Top P0.950.95

💾 硬件要求

  • 最低:32GB 统一内存(Apple Silicon)
  • 推荐:48GB+ 舒适运行
  • 256GB 机器随便跑

🏆 为什么选它

  • 1373 likes / 18.8 万下载 — 社区验证最充分
  • 有完整的 300 题 HarmBench 分类报告
  • MMLU 对比数据,量化损失可量化(仅 -5%)
  • 支持 Thinking Mode,有专门调参指南
  • dealign.ai 后续还出了 Qwen3.6、MiniMax 等多款 JANG CRACK 模型,方法论成熟

⚠️ 注意

  • 这是 5.1bit 混合量化,不是全精度(如需全精度请看 Uncensored MAX 版本)
  • License: Gemma(非 Apache)
3100举报0Xiao.Xi14天前
点击获取 ^_^
被收录:

暂无评论