标签「扩散」共 1 条内容
DFlash - 块扩散加速LLM推理的推测解码方案
轻量级块扩散模型,专为 LLM Speculative Decoding 设计,支持 vLLM/SGLang/MLX,已适配 20+ 主流大模型
29000Xiao.XiXiao.Xi7天前
点击获取 ^_^