合成数据更“科研驱动”,强调 controllability 和 generalization evaluation:
之前往往直接采用经典数据集如OGB和OGB-large提供的经典数据集和数据划分思路
该思想从现有真实数据中学习参数,再构造类似但分布略异的数据集,验证模型泛化性能。(Large-Scale Synthetic Graph Dataset Generation Framework; MLG2023 KDD Workshop),在生成时调节各项参数以更全面的反映模型性能
graphworld则是提供了一个完全合成的数据集来反省模型效果(作者成为fake data)

NeurIPS 2024 Datasets and Benchmarks Track 更“产业/应用驱动”,强调 task relevance 和 community standard:
DrivAerNet++ 多模态汽车数据集,结合计算流体力学模拟与深度学习基准,用于自动驾驶研究。
DomainGallery 少样本图像生成数据集,强调属性驱动的微调方法。
Bench2Drive 封闭式端到端自动驾驶任务的多能力基准测试框架。
FEDMEKI 联邦学习场景下的医学基础模型扩展基准,注重知识注入。
GTSinger 面向歌唱任务的全球多技术语料库,包含真实音乐分数。
SolarCube 卫星与地面观测融合的大规模太阳能预测数据集。
CARE 酶分类与检索任务的基准套件,支持生物信息学研究。
VRSBench 面向遥感图像理解的多模态视觉语言基准数据集。
Sim2Real-Fire 森林火灾预测与回溯的多模态模拟数据集。
SciInstruct 科学语言模型训练用的自反式指令注释数据集。
HelpSteer 2 用于训练奖励模型的开源数据集,支持对齐与安全性研究。
WildPPG 长时间连续记录的真实世界脉搏波数据集,支持健康监测。
CRAG 综合检索增强生成(RAG)任务的基准数据集。
CVQA 多文化多语言视觉问答基准,覆盖全球多种语言与文化背景。
MMM-RS 多模态、多分辨率、多场景遥感图像生成基准。
UrbanDataLayer 城市科学研究的统一数据处理管道,支持多源数据融合。
DrivingDojo Dataset 交互式、知识丰富的自动驾驶世界模型数据集。

专门的NeurIPS 2024 Track Datasets and Benchmarks中:

DevBench 面向语言学习的多模态发展性基准,关注儿童语言习得过程
MedCalc-Bench 医学计算能力评估基准,用于测试 LLM 在医学推理中的表现
PRISM Alignment Dataset 多文化人类反馈数据集,用于研究 LLM 的主观性与对齐问题(best paper)
Brain Treebank 基于自然语言刺激的大规模脑电记录数据集,连接语言与神经活动
ChaosBench 用于气候预测的物理建模基准,支持多通道季节性预测任务
OpenMathInstruct-1 包含180万条数学指令的微调数据集,提升 LLM 数学能力
Embodied Agent Interface 用于评估 LLM 在具身决策任务中的表现,连接语言与行动
AgentBoard 多轮 LLM Agent 的分析性评估平台,支持行为与策略分析
LINGOLY 奥林匹克级语言推理题库,涵盖濒危语言与低资源语言
A Taxonomy of Challenges to Curating Fair Datasets 公平数据集构建挑战的系统分类,关注偏见与代表性问题

我们关注的是泛化与稳健性,不只是某个具体应用,同时 参考 DB Track 的设计理念,可以从 synthetic dataset generation 切入

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/93680.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/93680.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/93680.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【计算机网络面试】TCP/IP网络模型有哪几层

参考: 2.1 TCP/IP 网络模型有哪几层? | 小林coding | Java面试学习 以下为自己做的笔记 应用层 专注于为用户提供应用功能,如HTTP、FTP、Telnet、DNS、SMTP等。应用层不关心用户是怎么传输的,当两个设备间的应用需要通信时&…

3 种方式玩转网络继电器!W55MH32 实现网页 + 阿里云 + 本地控制互通

目录 1 前言 2 项目环境 2.1 硬件准备 2.2 软件准备 2.3 方案图示 3 例程修改 4 功能验证 5. 总结 1 前言 HTTP(超文本传输协议,HyperText Transfer Protocol)是一种用于分布式、协作式、超媒体信息系统的应用层协议, 基于 TCP/IP…

第四篇:科技封锁与文化渗透篇——T-501 与 M-208 双引擎布局(节奏增强版)

科技封锁与文化渗透篇——T-501 与 M-208 双引擎布局(节奏增强版) 引子 在全球竞争中,光有资本和市场远远不够。 • 科技封锁(T-501):通过技术标准、专利网络、供应链控制,让对手进入成本极高的…

python实现梅尔频率倒谱系数(MFCC) 除了傅里叶变换和离散余弦变换

语音识别第4讲:语音特征参数MFCC https://zhuanlan.zhihu.com/p/88625876/ Speech Processing for Machine Learning: Filter banks, Mel-Frequency Cepstral Coefficients (MFCCs) and What’s In-Between https://haythamfayek.com/2016/04/21/speech-processing-…

springBoot+knife4j+openapi3依赖问题参考

pom文件附带版本<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.1.12</version></parent><dependencies><!-- SpringDoc starter --><d…

XML DOM 高级

XML DOM 高级 引言 XML DOM(Document Object Model)是用于解析和操作XML文档的一种标准,它允许开发者通过编程方式访问和修改XML文档的内容。本文将深入探讨XML DOM的高级特性,包括XML解析、节点操作、事件处理以及性能优化等,帮助读者全面理解并掌握XML DOM的高级应用。…

「第18讲 内容生成应用场景与多语言支持」AI Agent开发与应用:基于大模型的智能体构建

第18讲核心内容概述内容生成应用场景营销文案生成&#xff1a;基于产品特征自动生成广告语、社交媒体文案&#xff0c;支持个性化推荐和A/B测试优化。新闻报道辅助&#xff1a;快速生成财经、体育等领域的结构化新闻摘要&#xff0c;结合实时数据更新内容。教育内容定制&#x…

金融业务安全增强方案:国密SM4/SM3加密+硬件加密机HSM+动态密钥管理+ShardingSphere加密

国密SM4/SM3 SM4&#xff1a;对称加密算法&#xff0c;分组长度128位&#xff0c;密钥长度128位&#xff0c;适用于数据加密&#xff08;如数据库字段、通信报文&#xff09;】 加密存储&#xff1a;用户身份证号、银行卡号等敏感字段&#xff08;配合ShardingSphere等中间件自…

Chaos Vantage 2.8.1 发布:实时探索与材质工作流的全新突破

作为行业领先的实时光线追踪渲染器&#xff0c;Chaos Vantage再添利器。2.8.1版本更新聚焦材质工作流、硬件效率与API拓展&#xff0c;为建筑可视化、动画制作等领域带来更流畅的操作体验与更深层的定制化可能。 一、核心功能更新&#xff1a;让创作更顺畅 完整V-Ray材质节点支…

【集合框架List接口】

&#x1f449; 用 ArrayList 存数据&#xff0c;结果插入时卡住了&#xff1f; &#x1f449; 想删除某个元素&#xff0c;却发现索引错乱了&#xff1f; &#x1f449; 不知道该用 ArrayList 还是 LinkedList&#xff0c;选错了导致性能瓶颈&#xff1f;一、List 是什么&#…

《棒球百科》奥运会取消了棒球·野球1号位

⚾️ 奥运会棒球消失&复活之谜&#xff01;深度揭秘全球体育权力游戏 ⚾️❌ 2008年为何被踢出奥运&#xff1f;(Why Removed in 2008?)MLB的致命抵制➤ 奥运赛期撞车MLB常规赛白热化阶段&#xff01;➤ 球队老板拒放巨星&#xff1a;2000年悉尼奥运美国队仅剩"替补阵…

基于js和html的点名应用

分享一个在课堂或者是公司团建上需要点名的应用程序&#xff0c;开箱即用。1、双击打开后先选择人员名单&#xff08;可以随时更改的&#xff09;2、下面的滚动速度可以根据需求调整<!DOCTYPE html> <html lang"zh"> <head> <meta charset"…

【深度学习-基础知识】单机多卡和多机多卡训练

1. 单机多卡训练&#xff08;Single Machine, Multi-GPU&#xff09; 概念 在同一台服务器上&#xff0c;有多块 GPU。一个训练任务利用所有 GPU 并行加速训练。数据集存放在本地硬盘或共享存储上。 核心原理数据并行&#xff08;Data Parallelism&#xff09; 将一个 batch 划…

数据库原理及应用_数据库基础_第2章关系数据库标准语言SQL_SQL语言介绍数据库的定义和删除

前言 "<数据库原理及应用>(MySQL版)".以下称为"本书"中2.1节和2.2节第一部分内容 引入 本书P40:SQL(Structure Query Language结构化查询语言)是一种在关系数据库中定义和操纵数据的标准语言,是用户和数据库之间进行交流的接口. ---SQL是一种语言,是…

实变函数中集合E的边界与其补集的边界是否相等

在实变函数&#xff08;或一般拓扑学&#xff09;中&#xff0c;给定一个集合 E \subseteq \mathbb{R}^n &#xff08;或更一般的拓扑空间&#xff09;&#xff0c;集合 E 的边界&#xff08;boundary&#xff09;与 E 的补集 E^c 的边界是否相等&#xff1f; 即&#x…

# C++ 中的 `string_view` 和 `span`:现代安全视图指南

C 中的 string_view 和 span&#xff1a;现代安全视图指南 文章目录C 中的 string_view 和 span&#xff1a;现代安全视图指南目录1. 原始指针的痛点1.1 安全问题1.2 所有权不明确1.3 接口笨拙1.4 生命周期问题2. string_view 深入解析2.1 基本特性2.2 高效解析示例2.3 防止常见…

Linux学习-多任务(线程)

定义轻量级进程&#xff0c;实现多任务并发&#xff0c;是操作系统任务调度最小单位&#xff08;进程是资源分配最小单位 &#xff09;。创建由进程创建&#xff0c;属于进程内执行单元。- 独立&#xff1a;线程有8M 独立栈区 。 - 共享&#xff1a;与所属进程及进程内其他线程…

高级堆结构

一、二项堆&#xff08;Binomial Heap&#xff09;&#xff1a;理解「合并操作」的优化二项堆的核心优势是高效合并&#xff0c;类似 “二进制加法”。我们通过「合并两个二项堆」的伪代码和步骤来理解&#xff1a;核心结构伪代码&#xff1a;class BinomialTreeNode:def __ini…

系统学习算法 专题十七 栈

题目一&#xff1a;算法思路&#xff1a;一开始还是暴力解法&#xff0c;即遍历字符串&#xff0c;如果出现当前位置的字符等于后面的字符&#xff0c;则删除这两个字符&#xff0c;然后再从头遍历&#xff0c;如此循环即可但是这样时间复杂度很高&#xff0c;每删除一次就从头…

深入解析函数指针及其数组、typedef关键字应用技巧

目录 一、函数指针变量的创建 1、什么是函数指针变量&#xff1f; 2、函数是否有地址&#xff1f; 3、创建函数指针变量 4、函数指针类型解析 二、函数指针变量的使用 三、两段有趣的代码 1、解释 (*(void (*)())0)(); 2、解释 void (*signal(int, void(*)(int)))(int…