登录
注册
搜索
Octo
Hz
让我们借助有惊人品味的你,找出世界上最酷的东西!
首页
导航
文档
资源库
论坛
标签「
GPU
」共 2 条内容
源码
AirLLM - 单卡4GB GPU跑70B大模型推理的内存优化框架
无需量化/蒸馏/剪枝,在单张4GB GPU上运行70B大模型推理,支持Llama3.1 405B仅8GB VRAM
19
0
0
0
Xiao.Xi
•
11天前
点击获取 ^_^
教程
VibeVoice 社区版 - PyTorch/CUDA 多 GPU 推理完整代码
微软删除官方 TTS 推理代码后,社区 fork 保留的 PyTorch 完整实现。支持单卡/多卡推理、语音克隆、Gradio Demo。
33
0
0
0
Xiao.Xi
•
16天前
点击获取 ^_^