
HKUDS 开源,导演+编剧+制片人+视频生成器一体化,支持创意/小说/剧本一键成片
项目简介
ViMax 是 HKUDS(香港大学数据科学实验室)开源的多智能体视频生成框架,将导演、编剧、制片人和视频生成器整合为一体,实现从创意到成片的全流程自动化视频制作。
核心功能
| 模块 | 说明 |
|---|---|
| Idea2Video | 输入创意想法,自动生成完整视频故事 |
| Novel2Video | 智能文学改编,将小说转化为分集视频内容 |
| Script2Video | 任意剧本生成视频,完全掌控叙事细节 |
| AutoCameo | 上传照片即可让本人/宠物作为角色客串视频 |
技术亮点
| 能力 | 说明 |
|---|---|
| 长脚本生成 | 基于 RAG 的长脚本设计引擎,自动分段多场景脚本 |
| 故事板设计 | 镜头级故事板系统,通过电影语言建立叙事节奏 |
| 多机位模拟 | 模拟多机位拍摄,保持角色定位与背景一致 |
| 智能参考图 | 自动选择首帧参考图,确保多角色和环境元素准确 |
| 一致性校验 | 并行生成多张图像,通过 MLLM/VLM 筛选最优一致帧 |
| 并行生成 | 同机位连续镜头并行处理,高效产出 |
支持模型
- Chat 模型:Google Gemini、MiniMax(M2.7 / M2.5,兼容 OpenAI API)
- 图像生成:Nanobanana、Google API
- 视频生成:Veo(Google API)
适用场景
- AI 短视频/微电影创作
- 小说/故事可视化改编
- 个人照片视频化(AutoCameo)
- 快速视频原型制作
Stars
4.4k Stars,Python 实现,活跃维护中
暂无评论
