
基于 Transformer 对比表示与扩散先验,输入草图或图片即可生成 3D CAD 模型,TMCE 2025 论文
项目简介
GenCAD 是一个图片条件化的计算机辅助设计(CAD)生成框架,基于 Transformer 对比表示(Contrastive Representation)与扩散先验(Diffusion Priors),能够将草图或实物图片转换为可编辑的 3D CAD 模型。
核心技术
| 模块 | 说明 |
|---|---|
| CSR Model | Contrastive Sketch Representation,对比学习草图与 CAD 的表示 |
| CCIP Model | Cross-Conditional Image Prior,跨模态图像先验 |
| Diffusion Prior | 扩散模型生成 CAD 嵌入,实现高质量形状生成 |
功能特点
- 输入草图→输出 CAD 模型
- 输入实物图片→输出 CAD 模型
- 支持 STL 可视化转换
- 支持无头服务器(headless)运行
部署方式
# Docker 推荐
git clone https://github.com/ferdous-alam/GenCAD
cd GenCAD
docker build -t gencad:latest .
# 训练 CSR Model
docker run -it gencad:latest conda run -n gencad_env python train_gencad.py csr -name test -gpu 0
# 推理
docker run --gpus all -v $(pwd)/data/images:/app/data/images -v $(pwd)/results:/app/results -it gencad:latest /bin/bash
xvfb-run --server-args="-screen 0 2048x2048x24" python inference_gencad.py -image_path data/images -export_img
论文与资料
- Paper: TMCE 2025
- arXiv: 2409.16254
适用场景
- 工业设计自动化:将手绘草图或实物照片转为可编辑 CAD
- AI 辅助造型:快速生成 3D 模型原型
- 计算机图形学研究:CAD 生成、跨模态表示学习
Stars
2.1k Stars,Python 实现,活跃维护中
暂无评论
