标签「推理」共 6 条内容
TeaCache - 扩散模型免训练推理加速,视频/图片/音频生成提速神器
CVPR 2025 Highlight,通过智能缓存跳过冗余时间步,无需重训模型即可大幅加速扩散模型推理。支持Wan2.1/FLUX/HunyuanVideo等20+主流模型
36000Xiao.XiXiao.Xi26天前
点击获取 ^_^
fal.ai - 开发者首选的生成式AI媒体平台
1000+图像视频音频3D模型一行API调用,自研推理引擎比竞品快10倍,H100低至$1.2/小时,SOC2企业合规
42000Xiao.XiXiao.Xi28天前
点击获取 ^_^
讯飞星辰 MaaS 平台:模型集市
讯飞开放的大模型一站式服务平台,聚合科大讯飞、阿里、深度追求、智谱、Kimi 等62+模型
43000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
DwarfStar 4 — DeepSeek V4 Flash 本地推理引擎
antirez新作:DeepSeek V4 Flash的Metal/CUDA原生推理引擎,2-bit量化128GB Mac跑百万token上下文
87000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
AirLLM - 单卡4GB GPU跑70B大模型推理的内存优化框架
无需量化/蒸馏/剪枝,在单张4GB GPU上运行70B大模型推理,支持Llama3.1 405B仅8GB VRAM
74000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
VibeVoice 社区版 - PyTorch/CUDA 多 GPU 推理完整代码
微软删除官方 TTS 推理代码后,社区 fork 保留的 PyTorch 完整实现。支持单卡/多卡推理、语音克隆、Gradio Demo。
62000Xiao.XiXiao.Xi2个月前
点击获取 ^_^