基本信息

题目:PGSR: Planar-based Gaussian Splatting for Efficient  and High-Fidelity Surface Reconstruction

来源:TVCG2024

学校:ZJU-3DV

是否开源:https://github.com/zju3dv/PGSR

摘要:3DGS表面重建

        最近,3D高斯抛雪球( 3DGS )由于其高质量的渲染效果以及超快的训练和渲染速度引起了广泛的关注。然而,由于高斯点云的非结构化和不规则性,单纯依靠图像重建损失难以保证几何重建精度和多视图一致性。尽管最近出现了许多基于3DGS的曲面重建研究,但其网格质量普遍不尽人意。为了解决这个问题,我们提出了一种快速的基于平面的高斯散点重建表示( PGSR ),在保证高质量渲染的同时实现了高保真的表面重建。 具体来说,我们首先介绍一种无偏深度渲染方法,该方法基于点云的高斯分布直接绘制相机原点到高斯平面的距离和对应的法线图,并将两者相除得到无偏深度。然后我们介绍了单视图几何,多视图photometric和几何正则化以保持全局几何精度。我们还提出了一种相机曝光补偿模型来应对光照变化较大的场景。在室内和室外场景上的实验表明,该方法在保持高保真渲染和几何重建的同时,实现了快速的训练和渲染,优于基于3DGS和NeRF的方法。

Introduction

        论文针对新型视图合成(Novel View Synthesis)和几何重建(Geometry Reconstruction)问题,这些在AR/VR、3D内容生成和自动驾驶中至关重要。传统NeRF(Neural Radiance Fields)方法渲染质量高但训练和渲染慢(需数小时至数百小时)。3DGS通过显式3D高斯点云实现分钟级训练和毫秒级渲染,但高斯点云的无结构性和不规则性导致几何重建精度差,无法保证多视图一致性。

问题与挑战

  • 3DGS仅依赖图像重建损失,易陷入局部最优,高斯无法贴合真实表面。
  • 现有3DGS-based表面重建(如SuGaR)网格质量差,无法提取平滑表面。
  • 需要在保持渲染质量和速度的同时,提升几何精度。

主要贡献

  • 提出无偏深度渲染方法:将3D高斯压缩为平面,渲染平面参数(距离和法线),转换为无偏深度,促进几何约束引入。
  • 引入单视图和多视图正则化:优化每个像素的平面参数,实现全局几何一致性。
  • 曝光补偿模型:处理光照变化大的场景,提升重建精度。
  • 实验证明:在保持3DGS渲染质量和速度的前提下,实现SOTA几何重建精度,训练时间比NeRF-based方法快100倍。

方法概述如图4所示:压缩高斯为平面,渲染距离/法线/深度图;引入几何和光度正则化;曝光补偿RGB损失。

Related Works

论文回顾了表面重建的历史,从传统方法到神经方法,再到基于高斯的最新进展。

传统表面重建

  • 基于点云、体素或深度图的多视图立体(MVS)Pipeline。【时间太久远的文献就不写出来了】
  • 使用块匹配【PatchMatch】提取稠密点云,然后三角化或隐式表面拟合。
  • 缺点:易受噪声影响,后续方法(如[PatchMatchNet])整合深度网络提升匹配精度。

神经表面重建

  • 早期端到端方法使用点云、体素或网格/隐式场,但计算开销大,需要大量标注数据。
  • NeRF-based方法通过体渲染实现高保真视图合成,但表面捕捉差。
  • 改进:引入占用场或符号距离场(SDF);分解场景为点(如[Point-NeRF])或体素(如[Vox-surf,Neuralangelo),减少MLP依赖。
  • 缺点:训练慢(需数天,多GPU)。

基于3DGS的表面重建

  • SuGaR :从3DGS提取网格,通过正则化鼓励高斯贴合表面,从密度场采样点云,用Poisson重建网格。但依赖偏置深度,表面不平滑。
  • 同期工作:2DGS 将3D高斯压缩为2D盘,实现多视图一致几何;GOF 形成高斯不透明场,从水平集提取几何。
  • 缺点:这些方法深度不精确,多视图一致性差。PGSR通过平面渲染和正则化解决这些问题。

III. PRELIMINARY OF 3D GAUSSIAN SPLATTING

3DGS的基础知识,总结的很好,就放在这了。

Method

A. Planar-based Gaussian Splatting Representation

关键概念:

  • 传统3DGS使用3D高斯椭球体表示场景,但难以精确建模几何属性(如深度和法向量),因为椭球体形状不贴合实际表面。
  • 解决方案:将3D高斯“扁平化”(flatten)为2D平面高斯,使其更好地拟合场景表面。平面高斯近似局部平面,便于渲染深度和法向量。
  • 优势:渲染的深度与平面形状一致,避免几何冲突;消除权重累积影响,实现无偏深度(见Fig. 6)。

Flattening 3D Gaussian(扁平化3D高斯):

[9] Hanlin Chen, Chen Li, and Gim Hee Lee. Neusg: Neural implicit surface reconstruction with 3d gaussian splatting guidance. arXiv preprint arXiv:2312.00846, 2023.

Unbiased Depth Rendering(无偏深度渲染):

B. Geometric Regularization

这一节引入几何正则化,确保3D高斯贴合实际表面。分为单视图和多视图正则化。

1) Single-View Regularization(单视图正则化):

[24] Yingwenqi Jiang, Jiadong Tu, Yuan Liu, Xifeng Gao, Xiaoxiao Long, Wenping Wang, and Yuexin Ma. GaussianShader: 3D Gaussian Splatting with Shading Functions for Reflective Surfaces. arXiv preprint arXiv:2311.17977, 2023.

[37] Xiaoxiao Long, Yuhang Zheng, Yupeng Zheng, Beiwen Tian, Cheng Lin, Lingjie Liu, Hao Zhao, Guyue Zhou, and Wenping Wang. Adaptive Surface Normal Constraint for Geometric Estimation from Monocular Images. arXiv preprint arXiv:2402.05869, 2024.

[50] Xiaojuan Qi, Renjie Liao, Zhengzhe Liu, Raquel Urtasun, and Jiaya Jia. Geonet: Geometric neural network for joint depth and surface normal estimation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 283–291, 2018.

2) Multi-View Regularization(多视图正则化):

[4] Neill DF Campbell, George Vogiatzis, Carlos Herna ́ndez, and Roberto Cipolla. Using multiple hypotheses to improve depth-maps for multiview stereo. In Computer Vision–ECCV 2008: 10th European Conference on Computer Vision, Marseille, France, October 12-18, 2008, Proceedings, Part I 10, pages 766–779. Springer, 2008.

[15] Qiancheng Fu, Qingshan Xu, Yew Soon Ong, and Wenbing Tao. Geoneus: Geometry-consistent neural implicit surfaces learning for multiview reconstruction. Advances in Neural Information Processing Systems, 35:3403–3416, 2022.

[52] Johannes L Schonberger and Jan-Michael Frahm. Structure-from-motion revisited. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 4104–4113, 2016.

3) Geometric Regularization Loss(几何正则化损失):

C. Exposure Compensation Image Loss

D. Training

整体方法评价:

  • 创新:无偏深度渲染解决传统3DGS几何冲突;多层次正则化实现全局一致;曝光补偿提升实际场景鲁棒性。
  • 潜在局限:依赖高质量位姿;计算开销可能高于纯3DGS(多视图计算)。
  • 与参考文献关联:构建于3DGS基础上,融入MVS、NeRF元素(如Eikonal损失提及但未用)。实验(Fig. 7)显示优于基线。

实验

硬件平台

        所有实验在NVIDIA RTX 4090 GPU上运行,训练迭代次数固定为30,000次,使用AbsGS的致密化策略,并采用TSDF Fusion算法从渲染深度生成网格。

数据集

  • 数据集
    • Mip-NeRF360 :用于评估新视图合成性能,包含室内外复杂场景。
    • DTU :15个物体中心场景,用于评估重建质量。
    • TnT [28]:大型复杂场景,用于评估重建质量。
  • 评估标准
    • 渲染质量:PSNR(峰值信噪比,↑越高越好)、SSIM(结构相似性指数,↑越高越好)、LPIPS(学习感知图像补丁相似性,↓越低越好)。
    • 表面质量:F1分数(↑越高越好)和Chamfer距离(↓越低越好)。

[28] Arno Knapitsch, Jaesik Park, Qian-Yi Zhou, and Vladlen Koltun. Tanks and temples: Benchmarking large-scale scene reconstruction. ACM Transactions on Graphics (ToG), 36(4):1–13, 2017.

Benchmark

[20] Peter Hedman, Julien Philip, True Price, Jan-Michael Frahm, George Drettakis, and Gabriel Brostow. Deep blending for free-viewpoint imagebased rendering. ACM Transactions on Graphics (ToG), 37(6):1–15, 2018.

[45] Thomas M ̈uller, Alex Evans, Christoph Schied, and Alexander Keller. Instant neural graphics primitives with a multiresolution hash encoding. ACM transactions on graphics (TOG), 41(4):1–15, 2022.

[2] Jonathan T Barron, Ben Mildenhall, Matthew Tancik, Peter Hedman, Ricardo Martin-Brualla, and Pratul P Srinivasan. Mip-NeRF: A multiscale representation for anti-aliasing neural radiance fields. In Proceedings of the IEEE/CVF International Conference on Computer Vision, pages 5855–5864, 2021.

[57] Peng Wang, Lingjie Liu, Yuan Liu, Christian Theobalt, Taku Komura, and Wenping Wang. Neus: Learning neural implicit surfaces by volume rendering for multi-view reconstruction. arXiv preprint arXiv:2106.10689, 2021.

A. Real-time Rendering(实时渲染)

这一部分在Mip-NeRF360数据集上验证渲染质量,与纯新视图合成方法(如NeRF 、Deep Blending [20]、INGP [45]、Mip-NeRF360 [2]、NeuS [57])和类似重建方法(如3DGS 、SuGaR 、2DGS 、GOF )比较。

  • 定量结果(Table I)
    • 室内场景:PGSR的PSNR为30.41、SSIM为0.930、LPIPS为0.161。相比3DGS (PSNR 30.99, SSIM 0.926, LPIPS 0.199),PGSR在SSIM和LPIPS上略优,但PSNR稍低;优于SuGaR (PSNR 29.44, SSIM 0.911, LPIPS 0.216)和2DGS (PSNR 30.39, SSIM 0.923, LPIPS 0.183);接近GOF (PSNR 30.80, SSIM 0.928, LPIPS 0.167)。
    • 室外场景:PGSR的PSNR为24.45、SSIM为0.730、LPIPS为0.224。优于3DGS (PSNR 24.24, SSIM 0.705, LPIPS 0.283)、SuGaR (PSNR 22.76, SSIM 0.631, LPIPS 0.349)和2DGS (PSNR 24.33, SSIM 0.709, LPIPS 0.284);略逊于GOF (PSNR 24.76, SSIM 0.742, LPIPS 0.225)。
    • 所有场景平均:PGSR的PSNR为27.43、SSIM为0.830、LPIPS为0.193。整体优于3DGS (PSNR 27.24, SSIM 0.803, LPIPS 0.246)、SuGaR (PSNR 26.10, SSIM 0.771, LPIPS 0.283)和2DGS (PSNR 27.03, SSIM 0.804, LPIPS 0.239);略逊于GOF (PSNR 27.78, SSIM 0.835, LPIPS 0.196)。
    • 分析:PGSR在渲染质量上接近SOTA方法,同时提供优秀的表面重建。表中用红色、橙色、黄色标记最佳、次佳和第三佳结果,PGSR在多个指标上排名前列。
  • 定性结果(Fig. 5):展示了Mip-NeRF360上的渲染比较。PGSR的表面重建更平滑、细节更丰富,与GOF类似,但优于3DGS和SuGaR(后者存在浮动伪影)。

总体而言,PGSR实现了高保真渲染,同时保持表面重建优势。

B. Reconstruction(重建)

在DTU和TnT数据集上与神经表面重建方法(如NeuS [57]、Geo-NeuS [15]、VolSDF [61]、NeuralAngelo [33])和3DGS-based方法(如SuGaR、2DGS、GOF)比较。

  • DTU数据集(Table II)
    • Chamfer距离(mm,↓):PGSR平均为0.49(全分辨率)、0.53(下采样DS版本)。优于NeuralAngelo (0.61)、GOF (0.74)、2DGS (0.80)、NeuS (0.84)、VolSDF (0.86)、SuGaR (1.33)。
    • 训练时间:PGSR为1.0小时(DS为0.6小时),远快于NeuralAngelo (>128小时)和NeuS/VolSDF (>12小时);略慢于2DGS (0.32小时),但精度更高。
    • 具体场景:在scan24、37、40等15个场景中,PGSR在多数场景(如scan24: 0.36)取得最低Chamfer距离,表明重建精度最高。
    • 分析:PGSR实现了最高重建精度和相对快速训练。Fig. 7展示了定性比较:PGSR表面更平滑、细节更丰富(如物体边缘),优于SuGaR(粗糙)和2DGS(不完整)。
  • TnT数据集(Table III)
    • F1分数(↑):PGSR平均为0.68。接近NeuralAngelo (0.70),优于GOF (0.66)、2DGS (0.65)、SuGaR (0.62)、NeuS (0.55)等。
    • Chamfer距离(↓):PGSR平均为1.25。优于SuGaR (1.85)、2DGS (1.45),接近GOF (1.20)和NeuralAngelo (1.15)。
    • 训练时间:PGSR为1.0小时,远快于NeuralAngelo (>100小时)。
    • 分析:PGSR的F1分数与NeuralAngelo相似,但训练速度快100倍以上,且重建更多表面细节。Fig. 8展示了TnT上的定性结果:PGSR在复杂场景(如建筑物)中产生更完整的几何结构,减少了噪点和空洞。

总体结果(Fig. 5、7、8、Table II、III):PGSR在重建精度上显著优于其他3DGS-based方法,并在大型场景中表现出色。

初体验

TODO

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/97352.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/97352.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/97352.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最新After Effects2025下载安装(含安装包)AE 2025 保姆级下载一键安装图文教程

文章目录一、After Effects 2025下载二、After Effects 2025安装教程三、核心功能升级详解四、系统配置与兼容性说明一、After Effects 2025下载 ①夸克网盘下载链接:https://pan.quark.cn/s/a06e6200e64c 二、After Effects 2025安装教程 1.解压安装包:找到下载…

【网络安全领域】边界安全是什么?目前的发展及应用场景

在网络安全领域,边界安全(Perimeter Security) 是指围绕企业或组织网络的 “物理与逻辑边界” 构建的防护体系,核心目标是阻止未授权访问从外部网络(如互联网、合作方网络)侵入内部可信网络,同时…

虚拟机快照对内存与磁盘空间的影响

核心概念:快照是什么?虚拟机快照捕获的是在某个特定时间点上虚拟机的完整状态。这包括:磁盘状态:虚拟磁盘的数据。内存状态:当时虚拟机内存中的所有内容(如果选择)。配置状态:虚拟机…

免费开源的 Gemini 2.5 Flash 图片生成器

免费开源的 Gemini 2.5 Flash 图片生成器:gemini-nano-banana 项目详解 在 AI 图片生成领域,大多数工具要么收费昂贵,要么需要复杂的配置。今天为大家介绍一个完全免费开源的解决方案——gemini-nano-banana,一个基于 Google Gemi…

介绍分布式事务之Seata

简介 Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式事务解决方案。 🚀 一、Seata 的四种主要模式 Seata 提供的分布式事…

安卓/ios按键精灵脚本开发工具:OpenCV.FindImgAll命令介绍

函数名称OpenCV.FindImgAll 找图返回全部结果函数功能使用OpenCV多尺度模板找图,返回全部结果与FindPic的区别:OpenCV找图:基于特征相似性的找图,允许一定几何形变或颜色差异,从而提高多分辨率容兼及抗干扰能力&#x…

Linux时间处理函数

gettimeofday 是 Linux 系统中一个用于获取当前时间的系统调用函数。它能够获取从 Unix 纪元&#xff08;1970年1月1日 00:00:00 UTC&#xff09;到当前时刻的秒数和微秒数。函数原型#include <sys/time.h>int gettimeofday(struct timeval *tv, struct timezone *tz);参…

C++ 面试高频考点 力扣 34. 在排序数组中查找元素的第一个和最后一个位置 二分查找左右端点 题解 每日一题

文章目录二分查找进阶&#xff0c;精准定位左右边界题目描述先踩坑&#xff1a;朴素二分为什么搞不定重复元素&#xff1f;第一步&#xff1a;找左边界——如何定位“第一个target”&#xff1f;第二步&#xff1a;找右边界——如何定位“最后一个target”&#xff1f;完整代码…

在word以及latex中引用zotero中的参考文献

背景 如何在word以及latex中引用zotero中的参考文献 历史参考 恢复Zotero软件内的误删条目数据/文献-CSDN博客使用zotero保存 CNKI知网文章时发生错误。改为尝试用 Save as Webpage 保存。-CSDN博客 word 在word中引用zotero中的参考文献 打开word&#xff0c;点击引用 经典…

docker 部署Skywalking

创建网络 docker network create skywalking-network docker compose 安装SkyWalking docker-compose.yaml 文件 version: "3" services:# SkyWalking OAP server with Elasticsearch storageskywalking-oap:image: apache/skywalking-oap-server:8.9.0container…

动态UI的秘诀:React中的条件渲染

动态UI的秘诀&#xff1a;React中的条件渲染 作者&#xff1a;码力无边各位React探险家&#xff0c;欢迎回到我们的《React奇妙之旅》&#xff01;我是你们的老朋友码力无边。在之前的旅程中&#xff0c;我们已经学会了如何创建组件、传递数据&#xff08;Props&#xff09;、管…

ubuntu挂载外接硬盘

查看找到硬盘sudo fdisk -l例如&#xff1a;名字为&#xff1a;/dev/sda创建挂载点sudo mkdir -p /2TSSD手动挂载&#xff08;单次生效&#xff0c;关机会失效&#xff09;sudo mount /dev/sda1 /2TSSD开机自动挂载&#xff08;永远生效&#xff0c;关机会失效&#xff09;S1&a…

数学思想 | 数学思维过程对象封装

注&#xff1a;本文为 “数学思维过程对象封装” 相关译文。 英文引文&#xff0c;机翻未校。 略作重排&#xff0c;如有内容异常&#xff0c;请看原文。 What is the object of the encapsulation of a process? 过程封装的对象是什么&#xff1f; David Tall#, Michael Th…

常见视频封装格式对比

一、核心概念&#xff1a;封装格式 vs 编码格式 编码格式 (Codec): 例如 H.264, H.265 (HEVC), AV1, VP9。它负责对原始视频和音频数据进行压缩&#xff0c;是决定视频体积和清晰度的关键。封装格式 (Container): 例如 MP4, MKV, AVI。它负责将已经压缩好的视频、音频、字幕等打…

Java实现PDF表格转换为CSV

在很多企业办公和数据分析的场景中&#xff0c;PDF 中常常存放着报表、清单或统计数据。相比 PDF&#xff0c;CSV 文件 更易于在 Excel 或数据库中进行进一步处理。因此&#xff0c;我们常常需要一种方式&#xff0c;将 PDF 中的表格数据批量抽取并导出为 CSV 文件。 本文将介…

具有类人先验知识的 Affordance-觉察机器人灵巧抓取

25年8月来自武汉大学、阿里达摩院、湖畔研究中心、浙大和清华的论文“Towards Affordance-Aware Robotic Dexterous Grasping with Human-like Priors”。 能够泛化抓取目标的灵巧手是开发通用具身人工智能的基础。然而&#xff0c;之前的方法仅仅关注低级抓取稳定性指标&#…

项目管理的关键成功因素

项目管理的关键成功因素包括&#xff1a;目标明确、科学规划、有效沟通、资源保障、风险管理、团队协作、持续监控与总结改进。目标明确保证方向不偏移、科学规划确保执行有章可循、有效沟通减少误解与冲突、资源保障提供坚实支撑、风险管理帮助预防问题、团队协作提升整体效率…

[光学原理与应用-338]:ZEMAX - Documents\Zemax\Samples

Documents\Zemax\Samples 是 Zemax OpticStudio 软件自带的样例文件目录&#xff0c;包含大量预设的光学设计案例&#xff0c;涵盖镜头设计、照明系统、公差分析、非序列光学等多个领域。这些样例是学习软件功能、验证设计方法和快速启动项目的宝贵资源。以下是该目录的详细解析…

el-table合并列实例

想要实现效果&#xff1a;目前接口返回数据data:[{companyCode: "NXKYS",companyName:1123,costContractId:1123,costContractName:1123,createBy:1123,details:[{brand:1123,contractItemName:1123,modelSpec:1123,projectItemId:1123,requestQty:1123,transactionZ…

虚假 TradingView Facebook 广告在全球传播 Android 间谍软件

一项快速发展的恶意广告活动最初通过 Meta 的广告网络针对 Windows 用户&#xff0c;现已将其范围扩展到 Android 设备&#xff0c;推广伪装成合法交易应用程序的 Brokewell 恶意软件的高级版本。 Bitdefender Labs 警告称&#xff0c;此次移动攻击活动目前已在全球范围内展开…