主页：http://qingkeai.online/

原文：用图片生成高保真3D模型！Hi3DGen以法线为桥，为高清三维几何生成另辟蹊径

随着从二维图像构建高保真三维模型的需求日益增长，现有方法由于域间隙的限制以及 RGB 图像固有的模糊性，在实际应用中常受限于光照变化与纹理混淆，难以兼顾细节和真实感。

为了解决这些问题，来自CUHK深圳、字节跳动和清华大学的研究者提出了 Hi3DGen，这是一个通过法线桥接从图像生成高保真三维几何体的全新框架。

论文：Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
链接：https://arxiv.org/pdf/2503.22236
代码：https://github.com/Stable-X/Hi3DGen

Hi3DGen 由三个关键组件组成：

(1) 图像到法线估计器，通过噪声注入和双流训练将低高频图像模式解耦，以实现可泛化、稳定且精准的估计；

(2) 法线到几何学习方法，利用法线正则化的潜在扩散学习来增强三维几何体生成的保真度；

(3) 三维数据合成流程，构建高质量数据集以支持训练。

大量实验证明了该框架在生成丰富几何细节方面的有效性和优越性，在保真度方面超越了最先进的方法。

7月22日晚8点，青稞Talk 第65期，香港中文大学(深圳)GAP实验室博士生叶崇杰，将直播分享《Hi3DGen：法线为桥，为高清三维几何生成另辟蹊径》。

分享嘉宾

叶崇杰, 香港中文大学(深圳)GAP实验室在读博士, 师从韩晓光教授。

主题提纲

Hi3DGen：法线为桥，为高清三维几何生成另辟蹊径

1、三维几何生成的研究现状
2、从StableNormal到NormalAnything，我们做错了什么?
3、三维几何数据之困，何解?
4、Hi3DGen的方法论和结果展示
5、Hi3DGen赋能下游任务，刷新One-shot 6D位姿估计SOTA

直播时间

7月22日20:00 - 21:00

往期推荐

探究 VLMs 构建稳健空间心理模型的能力，以及未来可能的新路径

ChatRex & RexSeek & RexThinker：结合多模态大语言模型的目标检测模型构建

一起来聊聊：强化学习是否真的能提升大模型的推理能力？

刘子纬团队开源GUI-Reflection！让端到端多模态GUI智能体进行“自我反思”与“纠错”

都看到这了，点个关注再走吧🧐～

分享嘉宾

主题提纲

直播时间

相关文章

Charles抓包工具中文安装和使用详解，快速掌握API调试与网络优化

Java :List，LinkedList，ArrayList

LLM面试题及讲解 4

Harmony-Next鸿蒙实战开发项目-仿小米商城App----V2

python闭包和装饰器（超详解）

解决hadoop常用到的问题

深度学习G3周：CGAN入门（生成手势图像）

流式数据处理实战：用状态机 + scan 优雅过滤 AI 响应中的 `＜think＞` 标签

【实时Linux实战系列】硬件中断与实时性

基于DTLC-AEC与DTLN的轻量级实时语音降噪系统设计与实现

基于Hadoop与LightFM的美妆推荐系统设计与实现

notepad++ 多行复制拼接

【前沿技术动态】【AI总结】Spring Boot 4.0 预览版深度解析：云原生时代的新里程碑

OkHttp 框架封装一个 HTTP 客户端，用于调用外部服务接口

使用Collections.max比较Map＜String, Integer＞中的最大值

鸿蒙状态栏操作

Product Hunt 每日热榜 | 2025-07-17

如何使用VScode使用ssh连接远程服务器不需要输入密码直接登录

vue实现el-table-column中自定义label

Vue 常用的 ESLint 规则集