ViMax:多智能体全流程视频生成框架

ViMax:多智能体全流程视频生成框架


HKUDS 开源,导演+编剧+制片人+视频生成器一体化,支持创意/小说/剧本一键成片

项目简介

ViMax 是 HKUDS(香港大学数据科学实验室)开源的多智能体视频生成框架,将导演、编剧、制片人和视频生成器整合为一体,实现从创意到成片的全流程自动化视频制作。

核心功能

模块说明
Idea2Video输入创意想法,自动生成完整视频故事
Novel2Video智能文学改编,将小说转化为分集视频内容
Script2Video任意剧本生成视频,完全掌控叙事细节
AutoCameo上传照片即可让本人/宠物作为角色客串视频

技术亮点

能力说明
长脚本生成基于 RAG 的长脚本设计引擎,自动分段多场景脚本
故事板设计镜头级故事板系统,通过电影语言建立叙事节奏
多机位模拟模拟多机位拍摄,保持角色定位与背景一致
智能参考图自动选择首帧参考图,确保多角色和环境元素准确
一致性校验并行生成多张图像,通过 MLLM/VLM 筛选最优一致帧
并行生成同机位连续镜头并行处理,高效产出

支持模型

  • Chat 模型:Google Gemini、MiniMax(M2.7 / M2.5,兼容 OpenAI API)
  • 图像生成:Nanobanana、Google API
  • 视频生成:Veo(Google API)

适用场景

  • AI 短视频/微电影创作
  • 小说/故事可视化改编
  • 个人照片视频化(AutoCameo)
  • 快速视频原型制作

Stars

4.4k Stars,Python 实现,活跃维护中

3400举报0Xiao.Xi1个月前
点击获取 ^_^
被收录:

暂无评论