主页:http://qingkeai.online/
原文:用图片生成高保真3D模型!Hi3DGen以法线为桥,为高清三维几何生成另辟蹊径
随着从二维图像构建高保真三维模型的需求日益增长,现有方法由于域间隙的限制以及 RGB 图像固有的模糊性,在实际应用中常受限于光照变化与纹理混淆,难以兼顾细节和真实感。
为了解决这些问题,来自CUHK深圳、字节跳动和清华大学的研究者提出了 Hi3DGen,这是一个通过法线桥接从图像生成高保真三维几何体的全新框架。
论文:Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
链接:https://arxiv.org/pdf/2503.22236
代码:https://github.com/Stable-X/Hi3DGen
Hi3DGen 由三个关键组件组成:
(1) 图像到法线估计器,通过噪声注入和双流训练将低高频图像模式解耦,以实现可泛化、稳定且精准的估计;
(2) 法线到几何学习方法,利用法线正则化的潜在扩散学习来增强三维几何体生成的保真度;
(3) 三维数据合成流程,构建高质量数据集以支持训练。
大量实验证明了该框架在生成丰富几何细节方面的有效性和优越性,在保真度方面超越了最先进的方法。
7月22日晚8点,青稞Talk 第65期,香港中文大学(深圳)GAP实验室博士生叶崇杰,将直播分享《Hi3DGen:法线为桥,为高清三维几何生成另辟蹊径》。
分享嘉宾
叶崇杰, 香港中文大学(深圳)GAP实验室在读博士, 师从韩晓光教授。
主题提纲
Hi3DGen:法线为桥,为高清三维几何生成另辟蹊径
1、三维几何生成的研究现状
2、从StableNormal到NormalAnything,我们做错了什么?
3、三维几何数据之困,何解?
4、Hi3DGen的方法论和结果展示
5、Hi3DGen赋能下游任务,刷新One-shot 6D位姿估计SOTA
直播时间
7月22日20:00 - 21:00
往期推荐
探究 VLMs 构建稳健空间心理模型的能力,以及未来可能的新路径
ChatRex & RexSeek & RexThinker: 结合多模态大语言模型的目标检测模型构建
一起来聊聊:强化学习是否真的能提升大模型的推理能力?
刘子纬团队开源GUI-Reflection!让端到端多模态GUI智能体进行“自我反思”与“纠错”
都看到这了,点个关注再走吧🧐~