High-Fidelity Texture Transfer Using Multi-Scale Depth-Aware Diffusion

这篇文章可以从一个带有纹理的几何物体出发,将其身上的纹理自动提取并映射到任意的几何拓扑结构上(见下图红线左侧);或者从一个白模几何对象出发,将任意类型的纹理映射到其身上(见下图红线右侧):
在这里插入图片描述
该文章主要应用预训练的扩散模型来搭建了一个3D纹理迁移框架。具体来说,作者们设计了一个多尺度的生成框架来从粗糙到精细地优化UV maps,同时为了确保多视角下的一致性,该文章使用了深度信息作为几何上的引导,同时提出一个新的一致性损失来进一步限制颜色的一致性以及减少artifacts。实验结果证明这个多尺度的框架不仅产生了高质量的纹理迁移结果,还能很好地处理复杂形状并保持正确的语义对应关系。

下图展示了这篇文章的overview:
图1
第一个阶段,先在两个不同的尺度上生成粗糙的目标UV map,生成过程中以reference物体的多视角图像和深度maps({I}ref和{D}ref),和target物体的深度maps({D}tar【1】)作为条件。
第二个阶段,精炼的高分辨率的纹理细节。

【1】博主注:这里原文中对应位置的符号写成了{D}ref,应该是标注错误了,如果作者看到,请及时修正。

下面在下图中介绍纹理生成细节:
在这里插入图片描述
(a)先将多个视角下的图像{I}ref、{I}lowtar通过编码器Encoder各自编码到latent空间,然后对其通过DDIM逆向加噪到第T 步,随后和深度maps{D}ref、{D}tar concatenate到一起,作为TexTrans模块的输入,最终生成纹理迁移后的多个视图的结果。目标物体的几何默认是已知的,这时候由于还知道了不同视角下的生成结果(可以看成rendering结果),那么就可以通过可微渲染来优化出粗糙的纹理map Tcoarsetar来了(理论上camera和light也应该是已知的,我估计是作者架设了已知,反正采用的是合成数据集)。
(b)这个阶段的核心是深度感知的自注意力特征注入,也就是上图(b)部分,我们来看看是怎么个回事儿:使用深度信息的引导将纹理或者外观从源物体迁移到目标物体上,生成的过程将会迭代两次,对应不同尺度的图像分辨率。第一次迭代过程中,采用ZTref(也就是参考图像多视图经过编码器Encoder得到的隐向量)来进行初始化目标物体的多个视图。参考下面这个图,来理解是怎么将reference物体的纹理迁移到目标物体的:
在这里插入图片描述
首先,在图(b)中我们能清晰的看到,作者使用了两个controlnet-based diffusion model分别以reference物体和target物体的多视图图像为输入,分别以他们的深度图为条件,来进行降噪处理。但是呢,可以清楚的看到处理reference物体的diffusion model交叉注意力部分引出来一个箭头,指向了处理target物体的diffusion model的交叉注意力部分,这里就是对应上面这个图的核心部分。这个模块的作用就是把reference物体的纹理给搞过来。那你可能想了,这么搞不会破坏掉target这边生成时的几何形状吗?嘿,还真不会,因为在训练时target的这部分还输入了深度信息,只要深度信息作为条件,基本上很难修改生成过程的整体轮廓、结构了,所以作者说这部分既能保证全局信息,还能专注于每个单独视角的细节。本质上是几何的深度信息为扩散模型提供了整体形状强先验,而交叉注意力模块中部分注意力矩阵的复用只是为了把纹理信息迁移过来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/90989.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/90989.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/90989.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习图像分类数据集—玉米粒质量识别分类

该数据集为图像分类数据集,适用于ResNet、VGG等卷积神经网络,SENet、CBAM等注意力机制相关算法,Vision Transformer等Transformer相关算法。 数据集信息介绍:玉米粒质量识别分类:[crush, good, mul] 训练数据集总共有3…

Unity VR手术模拟系统架构分析与数据流设计

Unity VR手术模拟系统架构分析与数据流设计 前言 本文将深入分析一个基于Unity引擎开发的多人VR手术模拟系统。该系统采用先进的网络架构设计,支持多用户实时协作,具备完整的手术流程引导和精确的工具交互功能。通过对系统架构和数据管道的详细剖析&…

【Spring Boot】Spring Boot 4.0 的颠覆性AI特性全景解析,结合智能编码实战案例、底层架构革新及Prompt工程手册

Spring Boot 4.0 的颠覆性AI特性全景解析,结合智能编码实战案例、底层架构革新及Prompt工程手册一、Spring Boot 4.0 核心AI能力矩阵二、AI智能编码插件实战(Spring AI Assistant)1. 安装与激活2. 实时代码生成场景3. 缺陷预测与修复三、AI引…

audiobookshelf-web 项目怎么运行

git clone https://github.com/audiobookshelf/audiobookshelf-web.git cd audiobookshelf-web npm i 启动项目 npm run dev http://localhost:3000/

扫描文件 PDF / 图片 纠斜 | 图片去黑边 / 裁剪 / 压缩

问题:扫描后形成的 PDF 或图片文档常存在变形倾斜等问题,手动调整颇为耗时费力。 一、PDF 纠斜 - Adobe Acrobat DC 1、所用功能 扫描和 OCR: 识别文本:在文件中 → 设置 确定后启动扫描,识别过程中自动纠偏。 2、…

适配器模式:兼容不兼容接口

将一个类的接口转换成客户端期望的另一个接口,解决接口不兼容问题。代码示例:// 目标接口(客户端期望的格式) interface ModernPrinter {void printDocument(String text); }// 被适配的旧类(不兼容) class…

流程控制:从基础结构到跨语言实践与优化

流程控制 一、流程控制基础概念与核心价值 (一)流程控制定义与本质 流程控制是通过特定逻辑结构决定程序执行顺序的机制,核心是控制代码运行路径,包括顺序执行、条件分支、循环迭代三大核心逻辑。其本质是将无序的指令集合转化为有…

Http与Https区别和联系

一、HTTP 详解 HTTP(HyperText Transfer Protocol)​​ 是互联网数据通信的基础协议,用于客户端(浏览器)与服务器之间的请求-响应交互 核心特性​​: 1.无连接(Connectionless)​​…

飞算JavaAI:开启 Java 开发 “人机协作” 新纪元

每日一句 明天是新的一天, 你也不再是昨天的你。 目录每日一句一、需求到架构:AI深度介入开发“源头设计”1.1 需求结构化:自然语言到技术要素的精准转化1.2 架构方案生成:基于最佳实践的动态适配二、编码全流程:从“…

Qt项目锻炼——TODO(五)

发现问题如果是自己创建的ui文件,怎么包含进自己的窗口类并且成为ui成员?一般来说Qt designer 会根据你.ui文件生成对应的ui_文件名这个类(文件名是ui文件名),它包含了所有 UI 组件(如按钮、文本框、标签等…

Vue框架之模板语法全面解析

Vue框架之模板语法全面解析一、模板语法的核心思想二、插值表达式:数据渲染的基础2.1 基本用法:渲染文本2.2 纯HTML渲染:v-html指令2.3 一次性插值:v-once指令三、指令系统:控制DOM的行为3.1 条件渲染:v-if…

从零开始的语言模型构建 CS336 第一课(一)

语言模型的发展历史 🏗 Early foundation models (2010年代后期) 2018:ELMo(基于 LSTM 预训练 微调)[Peters 2018]2018:BERT(基于 Transformer 预训练 微调)[Devlin 2018]2019:G…

微信获取access_token授权的两种不同情况

1.网页授权:需要页面调用授权的sdk,首先需要获取到code参数 (A.网页版的获取code参考另一篇文章:https://blog.csdn.net/ettamei/article/details/148763361?spm1011.2415.3001.5331 B.前端sdk提供:code只有5分钟的有…

达梦数据库windows静默安装

<DATABASE> <!-- 安装数据库的语言配置&#xff0c;简体中文版: ZH&#xff0c;繁体中文版: CHT&#xff0c;英文版: EN&#xff0c;不区分大小写。不允许为空 --> <LANGUAGE>ZH</LANGUAGE> <!-- 安装程序的时区配置&#xff0c;缺省为08:00&#…

20250709荣品RD-RK3588开发板的Android13系统下修改为连续长按10s开机

20250709荣品RD-RK3588开发板的Android13系统下修改为连续长按10s开机 2025/7/9 10:11缘起&#xff1a;由于荣品RD-RK3588开发板使用的PMIC是RK806。 以前在荣品PRO-RK3566开发板上使用的PMIC是RK809上做过了长按开机的。 直接迁移过来了&#xff01;1、根据RK809的DATASHEET&a…

20250713-`Seaborn.pairplot` 的使用注意事项

Seaborn.pairplot 的使用注意事项 sns.pairplot 是 Seaborn 中最常用、最强大的探索性数据分析&#xff08;EDA&#xff09;函数之一。 它在一个调用里就能同时展示&#xff1a; 任意两两变量间的 散点图&#xff08;观察关系、聚类、异常值&#xff09;对角线上每个变量的 单…

如何选择合适的AI论文写作工具?七个AI英文论文写作网站

在写作英文论文时&#xff0c;许多人往往会遇到写作思路卡壳、语言不流畅、重复率过高等问题。幸运的是&#xff0c;AI论文写作工具的出现&#xff0c;极大地提升了写作效率和质量。这些工具不仅可以帮你快速生成内容、扩展论点&#xff0c;还可以优化语言&#xff0c;帮助你顺…

【保姆级喂饭教程】idea中安装Conventional Commit插件

目录前言一、安装二、测试前言 之前了解到了Conventional Commit规范&#xff0c;idea中好像没什么钩子工具&#xff0c;测试一下Conventional Commit插件吧 一、安装 点击file-settings 点击plugins插件&#xff0c;搜索Conventional Commit&#xff0c;点击install安装&…

# 电脑每次重启都自动启动惠普安装程序,怎么取消?

电脑每次重启都自动启动惠普安装程序&#xff0c;怎么取消&#xff1f; 一、通过任务管理器禁用&#xff1a; 1&#xff09;右键点击任务栏上的空白区域&#xff0c;选择 “任务管理器”。 2&#xff09;在任务管理器窗口中&#xff0c;点击顶部菜单栏上的 “启动” 选项卡。 3…

QT遇到过的样式记录

此帖主要记录平常工程里遇到的qt样式 窗口无边框 原始文档 void QWidget::setWindowFlag(Qt::WindowType flag, bool on true) Sets the window flag flag on this widget if on is true; otherwise clears the flag. This function was introduced in Qt 5.9. See also se…