近年来,已有若干方法尝试从单目视频实现 3D 点跟踪,然而由于在遮挡和复杂运动等挑战性场景中难以准确估计 3D 信息,这些方法的性能仍难以满足实际应用对高精度与鲁棒性的要求。
基于此,苏黎世联邦理工学院、卡内基梅隆大学联合提出首个数据驱动的多视角3D点追踪方法,旨在利用多个相机视角对动态场景中的任意点进行追踪。此方法的前馈式模型仅需少量相机即可直接预测 3D 对应点,从而实现鲁棒且精确的在线追踪。
论文链接:https://go.hyper.ai/2BSGR
最新 AI 论文:https://go.hyper.ai/hzChC
为了让更多用户了解学术界在人工智能领域的最新动态,HyperAI超神经官网(hyper.ai)现已上线「最新论文」板块,每天都会更新 AI 前沿研究论文。以下是我们为大家推荐的 5 篇热门 AI 论文,同时我们还为大家总结了论文架构的思维导图,一起来速览本周 AI 前沿成果吧 ⬇️
本周论文推荐
1. Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned
本文介绍了在红队测试语言模型方面的早期探索工作,旨在同时发现、衡量并尝试降低模型潜在的有害输出。研究发现,随着规模扩大,RLHF 模型的红队测试难度显著增加,而其他模型类型则未表现出明显的规模趋势。本文还公开发布了包含 38,961 条红队攻击样本的数据集,并描述了红队测试所采用的指令设计、执行流程、统计方法以及相关不确定性因素。
论文链接 : https://go.hyper.ai/j2U2u
不同模型的红队攻击成功率
2. Multi-View 3D Point Tracking
本文提出了首个数据驱动的多视角 3D 点追踪方法,旨在利用多个相机视角对动态场景中的任意点进行追踪。该方法在 1 至 8 个视角、不同观测角度以及 24 至 150 帧长度的多样化视频场景中均表现出良好的泛化能力。
论文链接 : https://go.hyper.ai/2BSGR
模型流程图
3. FusionProt: Fusing Sequence and Structural Information for Unified Protein Representation Learning
本文提出一种新型的蛋白质表示学习框架 FusionProt ,旨在同时学习蛋白质的一维序列与三维结构的统一表征。FusionProt 引入了一种创新的可学习融合标记,作为自适应桥梁,实现蛋白质语言模型与蛋白质三维结构图之间的迭代信息交互。
论文链接: https://go.hyper.ai/rjbaU
模型预训练架构图
4. Why Language Models Hallucinate
本文提出语言模型产生幻觉的根本原因在于,其训练与评估机制倾向于奖励猜测行为,而非承认不确定性,进一步分析了现代训练流程中导致幻觉的统计学根源。幻觉之所以持续存在,是因为在大多数评估方式中,语言模型被优化为“优秀的应试者”,在不确定时猜测反而能提升测试表现。这种对不确定回答的系统性惩罚,反映出当前主流但存在偏差的基准测试的评分方式应该予以修改,而非引入额外的幻觉评估指标。
论文链接 : https://go.hyper.ai/7TIjt
语言模型的幻觉示例
5. CryptoScope: Utilizing Large Language Models for Automated Cryptographic Logic Vulnerability Detection
本文提出了一个基于 LLM 的自动化密码学漏洞检测新框架 CryptoScope,将思维链(CoT)提示技术与检索增强生成(RAG)相结合,并依托一个经过精心整理的密码学知识库,该知识库包含超过 12,000 条条目。
论文链接 : https://go.hyper.ai/qkboy
模型架构图
以上就是本周论文推荐的全部内容,更多 AI 前沿研究论文,详见 hyper.ai 官网「最新论文」板块。
下周再见!