3D高斯泼溅(3D Gaussian splatting)自2023年提出以后,相关研究paper井喷式增长,尽管出现了许多改进版本,但依旧面临着诸多挑战,例如实现照片级真实感、应对高存储需求,而 “悬浮的高斯核” 问题就是其中之一。浮动高斯核通常由输入图像中的曝光或颜色不一致引发,也可能源于运动恢复结构(SfM)过程中产生的离群值。此外,严格意义上的高斯泼溅更偏向于 3D 重建而非新视图合成,它仅能为输入图像序列覆盖良好的场景部分生成新视角。

本文将聚焦于 3D 高斯泼溅的一个实际应用 ——高斯泼溅中的物体插入,并详细解读论文《3D Gaussian Splatting as Monte Carlo Markov Chain》,详见 3dgs-mcmc/,进一步展示MCMC与3dgs结合在gsplat第三方工具中的应用。

0. 3DGS MCMC 简介

3DGS 作为 MCMC 论文的前提如下:

  • ADC 的概率概念:尽管自适应密度控制 (ADC) 是一种有效的致密化和修剪策略,但它缺乏坚实的数学基础。MCMC 引入了一个概率框架来解决这一缺陷。
  • 收敛与探索: MCMC 论文并不单纯依赖基于优化的方法,而是将优化与探索相结合,从而能够找到问题的多个最优解决方案。
  • 将死高斯变为活高斯: ADC 启发式方法被通过重新定位死高斯来实现的状态转换所取代。
  • 引入正则化:论文还向损失函数引入了两种正则化:尺度正则化不透明度正则化

3d 高斯溅射训练 MCMC + 双边网格 3D 高斯溅射作为马尔可夫链蒙特卡洛无浮动高斯溅射

图 1:3DGS 与 3DGS + MCMC 的比较

本文从回顾 MCMC 开始,逐步引入到3DGS中。

1. MCMC概念回顾

MCMC 抽样是一种众所周知的近似算法,在机器学习中,广泛应用于概率建模。MCMC 的全称是蒙特卡洛马尔可夫链。蒙特卡洛和马尔可夫链是两种不同的算法。

有时,由于诸如空间复杂性、高维性等原因,一些积分和很难直接计算。在这些情况下,我们会对其进行近似——要么采用采样方法,比如MCMC,要么使用参数化分布,就像在变分推断中所做的那样。

例如,在贝叶斯统计中,计算后验分布需要对模型参数的所有可能值进行积分,并由先验和观测数据的似然性加权。随着参数数量的增加或似然函数变得复杂,这种积分很快就会变得难以处理。

                        先验、似然和后验 3DGS MCMC 论文解释

图 2:先验、似然和后验

从上图可以看出,先验、后验和似然在数学上的含义。

2. 3DGS中先验/似然与后验的引入

在3D 高斯泼溅 (3DGS) 的贝叶斯视图中,可以将模型参数(所有高斯泼溅的位置、大小、颜色、不透明度等)解释为随机变量。

3DGS 3d 高斯溅射训练 MCMC + 双边网格中的先验、似然和后验

图 3:3DGS 中的先验、似然和后验

  • 这些参数的先验分布p(θ)编码了在看到实际图像数据之前的任何假设偏好。例如,可能希望高斯函数的大小不受限制,或者它们的颜色位于合理范围内,或者总的 splats 数量不会激增,等等。
  • 可能性p(Data|θ) 衡量了特定的splats 配置参数θ对实际观察到的图像(训练视图)的解释程度。
  • 后验分布为:

                                        p(\theta|Data)=\frac{p(Data|\theta)p(\theta)}{p(Data)}

换句话说,后验分布就是基于数据的初始假设,然后如何通过观察到的图像数据进行更新。

3. 单纯融合 VS 融合+探索参数空间

自适应密度控制 (ADC) 是一种解决问题的启发式方法,但并未完全优化,并且缺乏坚实的数学基础。MCMC 通过为致密化和修剪策略提供更强大的数学基础来解决相同的核心问题。

具体来说,它通过将这些策略概念化为采样过程,为这些策略引入了一个概率框架。

“采样是一种通过研究大群体的一小部分来估计其整体特征的方法。”
例如,假设需要找到一条曲线下的面积(如下图所示)。通过积分计算它可能需要处理一个复杂的公式。相反,使用蒙特卡罗方法,则可以在曲线边界的矩形内随机散布红点。那么使用的点越多,估计就越准确。通过计算曲线下的点与矩形中总点数的比例,就可以确定曲线下的面积,因为这个比例对应于矩形面积的比例。”

                         高斯分布中的对象插入

图 4:蒙特卡洛估计曲线下面积

3DGS 的一般方法是:

  • 寻找单一最佳解决方案: 3DGS 遵循一种简单的优化方法。它初始化高斯函数,然后通过计算渲染图像和真实图像之间的 L1 损失来优化其配置。此损失用于更新高斯函数。然而,这种方法往往会产生单一最佳解决方案,并且可能会陷入局部最小值的问题。

MCMC 提出了一种不同的视角,它不是专注于寻找单一的最佳解决方案,而是旨在通过从后验分​​布中抽样来确定一系列能够同样好地解释数据的配置。

4. 用于概率 3DGS 建模的 MCMC

MCMC 引入了一个后验分布 G(θ),它表示在给定训练数据的情况下,高斯参数配置 g (位置、颜色、形状等)正确的概率。换句话说:

                        G(\theta)=P(\theta|Data)

这里,克\θ对应相同的配置。

这种分布G(θ) 的设计使得\θ能够很好表示场景的配置将具有较高的值 G(θ),而不能很好表示场景的配置将具有较低的G(θ)值。

通过将问题转化为从分布中进行抽样,可以使用马尔可夫链蒙特卡罗 (MCMC) 方法(如随

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/900790.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/900790.shtml
英文地址,请注明出处:http://en.pswp.cn/news/900790.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【软件测试】Postman中如何搭建Mock服务

在 Postman 中,Mock 服务是一项非常有用的功能,允许你在没有实际后端服务器的情况下模拟 API 响应。通过创建 Mock 服务,你可以在开发阶段或测试中模拟 API 的行为,帮助团队成员进行前端开发、API 测试和集成测试等工作。 Mock 服…

Spring-MVC

Spring-MVC 1.SpringMVC简介 - SpringMVC概述 SpringMVC是一个基于Spring开发的MVC轻量级框架,Spring3.0后发布的组件,SpringMVC和Spring可以无缝整合,使用DispatcherServlet作为前端控制器,且内部提供了处理器映射器、处理器适…

关于Spring MVC中@RequestParam注解的详细说明,用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格

以下是关于Spring MVC中RequestParam注解的详细说明,用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格: 1. 核心作用 RequestParam用于显式绑定HTTP请求参数到方法参数,支持以下场景: 参数名不一致&#xff1…

MySQL主从复制技术详解:原理、实现与最佳实践

目录 引言:MySQL主从复制的技术基础 MySQL主从复制的实现机制 复制架构与线程模型 复制连接建立过程 数据变更与传输流程 MySQL不同复制方式的特点与适用场景 异步复制(Asynchronous Replication) 全同步复制(Fully Synch…

ROS Master多设备连接

Bash Shell Shell是位于用户与操作系统内核之间的桥梁,当用户在终端敲入命令后,这些输入首先会进入内核中的tty子系统,TTY子系统负责捕获并处理终端的输入输出流,确保数据正确无误的在终端和系统内核之中。Shell在此过程不仅仅是…

Trae + LangGPT 生成结构化 Prompt

Trae LangGPT 生成结构化 Prompt 0. 引言1. 安装 Trae2. 克隆 LangGPT3. Trae 和 LangGPT 联动4. 集成到 Dify 中 0. 引言 Github 上 LangGPT 这个项目,主要向我们介绍了写结构化Prompt的一些方法和示例,我们怎么直接使用这个项目,辅助我们…

《安富莱嵌入式周报》第352期:手持开源终端,基于参数阵列的定向扬声器,炫酷ASCII播放器,PCB电阻箱,支持1Ω到500KΩ,Pebble智能手表代码重构

周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版 https://www.bilibili.com/video/BV1DEf3YiEqE/ 《安富莱嵌入式周报》第352期:手持开源终端&#x…

python 浅拷贝copy与深拷贝deepcopy 理解

一 浅拷贝与深拷贝 1. 浅拷贝 浅拷贝只复制了对象本身(即c中的引用)。 2. 深拷贝 深拷贝创建一个新的对象,同时也会创建所有子对象的副本,因此新对象与原对象之间完全独立。 二 代码理解 1. 案例一 a 10 b a b 20 print…

day22 学习笔记

文章目录 前言一、遍历1.行遍历2.列遍历3.直接遍历 二、排序三、去重四、分组 前言 通过今天的学习,我掌握了对Pandas的数据类型进行基本操作,包括遍历,去重,排序,分组 一、遍历 1.行遍历 intertuples方法用于遍历D…

SpringMVC的请求-文件上传

文件上传客户端三要素 1. 表单项type“file” 2. 表单的提交方式是post 3. 表单的enctype属性是多部分表单形式&#xff0c;及enctype“multipart/form-data” <% page contentType"text/html;charsetUTF-8" language"java" %> <html> <he…

在Ubuntu系统如何让MySQL服务器支持远程连接

目录 问题描述 解决方案 步骤一&#xff1a;检查MySQL配置文件 ​编辑 步骤二&#xff1a;修改bind-address参数 ​编辑 步骤三&#xff1a;重启MySQL服务 步骤四&#xff1a;验证更改 步骤五&#xff1a;检查防火墙设置 步骤六&#xff1a;测试远程连接 注意事项 …

JSON工具-JSONUtil

对象转JSON JSONUtil.toJsonStr可以将任意对象&#xff08;Bean、Map、集合等&#xff09;直接转换为JSON字符串。 如果对象是有序的Map等对象&#xff0c;则转换后的JSON字符串也是有序的。 //region 处理POST请求&#xff0c;将TreeMap转换为JSON字符串返回/*** 处理POST请求…

死锁 手撕死锁检测工具

目录 引言 一.理论联立 1.死锁的概念和原因 2.死锁检测的基本思路 3.有向图在死锁检测中的应用 二.代码实现案例&#xff08;我们会介绍部分重要接口解释&#xff09; 1.我们定义一个线性表来存线程ID和锁ID 2.表中数据的查询接口 3.表中数据的删除接口 4.表中数据的添…

Java 中 SQL 注入问题剖析​

一、引言​ 在当今数字化时代&#xff0c;数据是企业和组织的核心资产之一。许多应用程序都依赖于数据库来存储和管理数据&#xff0c;而 Java 作为一种广泛使用的编程语言&#xff0c;常被用于开发与数据库交互的应用程序。然而&#xff0c;SQL 注入这一安全漏洞却如同隐藏在…

安全理念和安全产品发展史

从安全理念的发展历史来看,技术与产品的演进始终围绕 “威胁对抗” 与 “业务适配” 两大核心展开。以下从七个关键阶段解析安全技术与产品的发展脉络,并结合最新实践与未来趋势提供深度洞察: 一、密码学奠基阶段(1970s 前) 安全理念:以 “信息保密” 为核心,防御手段…

【Ansible自动化运维】二、Playbook 深入探究:构建复杂自动化流程

​ 在 Ansible 自动化运维体系中&#xff0c;Playbook 是极为关键的部分。它允许我们以一种结构化、可重复的方式定义和执行一系列复杂的任务&#xff0c;从而构建高效的自动化流程。本篇文章将深入探究 Ansible Playbook 的各个方面&#xff0c;助您掌握构建复杂自动化…

springboot项目中常用的工具类和api

在Spring Boot项目中&#xff0c;开发者通常会依赖一些工具类和API来简化开发、提高效率。以下是一些常用的工具类及其典型应用场景&#xff0c;涵盖 Spring 原生工具、第三方库&#xff08;如Hutool、Guava&#xff09; 和 Java 自带工具。 1. Spring Framework 自带工具类 (…

23种设计模式-行为型模式-模板方法

文章目录 简介场景解决代码关键优化点 总结 简介 模板方法是一种行为设计模式&#xff0c;它在超类中定义了一个算法的框架&#xff0c;允许子类在不修改结构的情况下重写算法的特定步骤。 场景 假如你正在开发一款分析文档的数据挖掘程序。用户需要向程序输入各种格式&…

解决Long类型前端精度丢失和正常传回后端问题

在 Java 后端开发中&#xff0c;可能会遇到前后端交互过程中 Long 类型精度丢失的问题。尤其是在 JavaScript 中&#xff0c;由于其 Number 类型是双精度浮点数&#xff0c;超过 16 位的 Long 类型值就会发生精度丢失。 问题背景 假设有如下实体类&#xff1a; public class…

PowerPhotos:拯救你的Mac照片库,告别苹果原生应用的局限

如果你用Mac管理照片&#xff0c;大概率被苹果原生「照片」应用折磨过——无法真正并行操作多个图库。每次切换图库都要关闭重启&#xff0c;想合并照片得手动导出导入&#xff0c;重复文件更是无处可逃…… 直到我发现了 PowerPhotos&#xff0c;这款专为Mac设计的照片库管理…