站内搜索量化」共 8 条结果
Gemma 4 31B JANG CRACK — MLX 原生去审查模型
dealign.ai 出品的 Gemma 4 31B 去审查版,JANG 混合量化 5.1bit,HarmBench 93.7%,支持视觉+思维链
84000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
AirLLM - 单卡4GB GPU跑70B大模型推理的内存优化框架
无需量化/蒸馏/剪枝,在单张4GB GPU上运行70B大模型推理,支持Llama3.1 405B仅8GB VRAM
72000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
DwarfStar 4 — DeepSeek V4 Flash 本地推理引擎
antirez新作:DeepSeek V4 Flash的Metal/CUDA原生推理引擎,2-bit量化128GB Mac跑百万token上下文
83000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
Gemma 4 31B Uncensored MAX — BF16 全精度 MLX 去审查模型
prithivMLmods 出品的 Gemma 4 31B 全精度(BF16)去审查版,无量化损失,mlx-vlm 原生支持
78000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
TradingAgents - 多智能体 LLM 金融交易框架,模拟真实交易公司决策流程
基于多智能体 LLM 的开源金融交易框架,模拟真实交易公司架构,部署基本面/情绪/新闻/技术分析师和交易员、风控团队进行协作决策,支持多种 LLM 提供商和回测,适合量化交易研究与策略验证。
79000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
Fincept Terminal — 开源金融智能终端
基于 C++20/Qt6 的金融分析终端,内嵌 Python 3.11+,提供 CFA 级别分析、37 个 AI Agent、100+ 数据源、实时交易、QuantLib 量化套件与可视化节点工作流
59000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
vibevoice-mlx - VibeVoice TTS MLX 推理实现(Mac Studio 部署指南)
微软删除官方推理代码后,社区补上的完整 MLX 实现。支持 1.5B/7B 语音合成、零样本语音克隆、量化加速。
68000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
SD.Next - 接替 A1111 的全能 AI 生成 WebUI
支持 Stable Diffusion、SDXL、SD3、FLUX 及视频生成,内置量化引擎与自动调优,跨平台开箱即用
90000Xiao.XiXiao.Xi1个月前
点击获取 ^_^