转:

近日,人工智能领域迎来了一项革命性的突破。Transformer 论文作者之一的 Llion Jones 与前谷歌研究人员 David Ha 共同创立的人工智能公司 Sakana AI,联合MIT、OpenAI、瑞士AI实验室IDSIA等机构的研究人员,共同提出了一种名为“自动化人工生命搜索”( Automated Search for Artificial Life, ASAL)的新算法。

图片

这一创新技术使得AI能够自主发现全新的人造生命体,而无需繁琐的手工设计过程,标志着人工生命(Artificial Life, ALife)研究迈入了一个全新的里程碑。

什么是人工生命?

人工生命听起来很科幻,最早源于数学家约翰・何顿・康威在 1970 年提出的著名的“生命游戏”便是一种模拟人工生命系统,其中定义的规则可让其中的“细胞”像生命体一样运作。

人工生命是一个跨学科领域,结合了计算科学、生物学、复杂系统科学以及物理学等多个领域的知识,致力于研究生命的本质及其起源、演化和行为。它旨在通过模拟生命的行为、特性和演化过程来理解生命的本质,探索的范围不仅限于地球上的生物形式,还包括可能的外星生命或完全虚构的生命形式。

下图为 ASAL 其中一位作者 Phillip Isola 的推文以及他分享的一种人工生命。

图片

图片

通过计算机模拟,科学家们正在探索一个更宏大的命题——可能存在的生命形式。然而,过去的人工生命模拟往往依赖于复杂的手工设计,每一个细微的规则都需要研究者精心制定。这不仅限制了研究的效率,也阻碍了新生命形式的发现。

ALife的研究揭示了推动和加速人工智能进步的重要洞见,特别是对于涌现现象、进化机制和智能本质的理解。如果用AI加速人工生命的发现,人类就能更好地理解这些核心原则,从而启发未来的AI系统。

ASAL算法的创新之处

ASAL算法的出现,彻底改变了这一现状。该算法利用三种视觉-语言基础模型,能够自动搜索并发现模拟空间中最有趣、最具开放式的人造生命体:

图片

  • 监督式目标搜索(Supervised Target):搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界相似的世界。

  • 开放式搜索(Open-Endedness):在基础模型的表征空间中搜索会随时间不断提供新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。

  • 阐明(Illumination)搜索:搜索一组相关的多样化模拟,从而展现对我们来说非常陌生的世界。

人工生命基质(substrate),记为 S,其包含任何一组相关的人工生命模拟(例如,所有 Lenia 模拟的集合)。这些模拟可能在初始状态、转换规则或两者上有所不同。S 由 θ 参数化,它定义的单个模拟具有三个分量:

  • 初始状态分布 Init_θ

  • 前向动态阶跃函数 Step_θ

  • 渲染函数,Render_θ,作用是将状态转换为图像

虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个 θ 函数,它对初始状态 s_0 进行采样,运行 T 步模拟,并将最终状态渲染为图像:

图片

最后,还有另外两个函数 VLM_img (・) 和 VLM_txt (・),它们的作用是通过视觉 – 语言基础模型嵌入图像和自然语言文本,以及相应的内积 ⟨・,・⟩,以促进该嵌入空间的相似性测量。

监督式目标

人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界相似的世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。

为此,ASAL 会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。

图片

开放式

人工生命的一大挑战是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。

尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉 – 语言基础模型表征充当了人类表征的代理。

图片

阐明

人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类整体基质的第一步。

为了实现这一目标,ASAL 会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。

图片

研究者只需定义模拟空间的搜索范围,ASAL便能自动探索出各种新奇的生命形式。

图片

ASAL算法的创新之处在于其将基础模型应用于人工生命模拟搜索,自动化了规则设计和现象探索的过程。这不仅促进了新型人工生命体的自动发现,还为复杂性和开放性等现象提供了新的分析工具。研究者表示,通过利用AI加速人工生命的发现,我们可以加速对涌现、进化和智能的理解——这些核心原则将启发下一代AI系统的发展。

此外,ASAL算法的应用还具有深远的意义。它不仅推动了人工生命研究的进步,还为探索可能存在的生命形式提供了新的途径。通过计算机模拟,科学家们可以探索更宏大、更复杂的生命现象,从而加深对生命本质的理解。

实验验证ASAL真的可以

在实验中,ASAL算法展现了其强大的搜索能力。研究人员利用Boids、Particle Life、生命游戏(Game of Life)、Lenia和神经元胞自动机(Neural Cellular Automata)等多种人工生命基质,验证了ASAL的有效性。

  • Boids:模拟的是 N 个「鸟状物体(boids)」在 2D 欧几里得空间中的移动情况。所有 boids 都共享权重一样的神经网络,其会根据局部参考系中 K 个近邻 boids 向左或向右操纵每个 boid。该基质是神经网络的权重空间。

  • 粒子生命:模拟 N 个粒子,这些粒子又可分为 K 类;它们在一个 2D 欧几里得空间运动。该基质是 K × K 相互作用矩阵的空间,β 参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。

  • 类生命的元胞自动机(CA:将康威生命游戏泛化到所有在 2D 栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的 Moore 邻居的数量和细胞的当前状态。该基质有 2^18 = 262,144 种可能的模拟。

  • Lenia:将康威生命游戏推广到连续空间和时间,允许更高的维度、多个核和多个通道。该团队使用了 LeniaBreeder 代码库,它定义了基质,其中动态维度为 45 个,初始状态维度为 32 × 32 × 3 = 3,072 个。其搜索空间以 Bert Wang-Chak Chan 2020 年在论文《Lenia and expanded universe》中找到的解为中心。

  • 神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。

在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的边界。

搜索目标模拟

其中包括单个目标和随时间变化的目标序列。

对于单个目标,以下动图定性地展示 ASAL 的良好效果,可以找到与指定提示词匹配的模拟。

图片

对于时间目标,下图表明可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL 可以识别体现所需进化过程本质的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。

图片

搜索开放式模拟

下图(Fig.5)  展示了 ASAL 在类生命元胞自动机的开放式模拟中的潜力。

图片

图片

根据 3 式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前 5%。

Fig.5a 表明,最开放的 CA 表现了处于混沌边缘的非平凡动态模式,因为它们既没有稳定也没有爆发。

Fig.5b 则描绘了三个 CA 在 CLIP 空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。

Fig.5c 则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的 CA 紧密地靠在模拟主岛外的一个小岛上。

阐明整体基质

该团队使用了 Lenia 和 Boids 基质来研究公式 4 中的阐明算法的有效性。基础模型是 CLIP 。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后保留最多样化的解子集。

下面的 2 个「Simulation Atlas」展示了生成的模拟集。

图片

此可视化凸显了按视觉相似性组织的行为的多样性。使用 Lenia 时,ASAL 发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用 Boids 时,ASAL 重新发现了群集行为(flocking behavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。

量化人工生命

基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图 7 展示了量化这些复杂系统的涌现行为的不同方法。

图片

在上图 中,对两个 Boids 模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,表明了 boids 参数空间的非线性、混沌性质。重要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的 CLIP 相似性来为这种定性观察提供定量支持。

图片

上图 则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(a caterpillar)」,则可发现只有在模拟中至少有 1000 个粒子时才能找到它们,这符合 1972 年的「更多即不同(more is different)」的观察结果。

图片

在上图中,通过单独扫描每个参数并测量 CLIP 提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最重要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。

图片

上图 给出了对于 Lenia 模拟,CLIP 向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好稳定,因此这可提供有用的模拟停止条件。

结语

值得一提的是,Sakana AI此前已经推出了“世界上首个用于自动化科学研究和开放式发现的AI系统”——AI Scientist(人工智能科学家)。该系统能够独立进行科学研究,无需人类插手,甚至能够一口气产出多篇学术论文。

这一研究成果一经发布便引起了广泛关注。许多人认为这是释放AI力量、重新定义人工生命的一项惊人工作。有研究者表示自己多年来一直在尝试类似的事,但Sakana AI的工作是一个更加精彩的版本。

图片

此外,还有人提出疑问:这项研究是否可以用来观察意识的诞生?尽管目前还没有明确的答案,但毫无疑问,随着技术的发展,我们将逐渐揭开更多关于生命和意识的秘密。

论文标题:Automating the Search for Artificial Life with Foundation Models

论文地址:https://arxiv.org/pdf/2412.17799

在线论文:https://pub.sakana.ai/asal/

项目代码:https://github.com/SakanaAI/asal/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/84908.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/84908.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/84908.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day.31

变量类型: name: str "Alice" age: int 30 height: float 1.75 is_student: bool False 注解: def add(a: int, b: int) -> int: return a b def greet(name: str) -> None: print(f"Hello, {name}") 定义矩形类&a…

光谱数据分析的方法有哪些?

光谱数据分析是通过特征光谱识别物质结构与成分的核心技术,其标准化流程如下: ‌一、数据预处理‌(消除干扰噪声) ‌去噪平滑‌ Savitzky-Golay滤波:保留光谱特征峰形,消除高频噪声。 移动平均法&#…

RabbitMQ的使用--Spring AMQP(更新中)

1.首先是创建项目 在一个父工程 mq_demo 的基础上建立两个子模块,生产者模块publisher,消费者模块 consumer 创建项目: 建立成功: 删除多余文件 创建子模块1:publisher(生产者模块) 右键---…

DAY 31 文件的规范拆分和写法

浙大疏锦行 今日的示例代码包含2个部分 notebook文件夹内的ipynb文件,介绍下今天的思路项目文件夹中其他部分:拆分后的信贷项目,学习下如何拆分的,未来你看到的很多大项目都是类似的拆分方法 知识点回顾 规范的文件命名规范的文件…

EtherCAT至TCP/IP异构网络互联:施耐德M580 PLC对接倍福CX5140解决方案

一、项目背景与需求 某智能工厂致力于打造高度自动化的生产流水线,其中部分核心设备采用EtherCAT协议进行通信,以实现高速、高精度的控制,例如基于EtherCAT总线的倍福(Beckhoff)CX5140PLC,它能够快速响应设…

[学习] FIR多项滤波器的数学原理详解:从多相分解到高效实现(完整仿真代码)

FIR多项滤波器的数学原理详解:从多相分解到高效实现 文章目录 FIR多项滤波器的数学原理详解:从多相分解到高效实现引言一、FIR滤波器基础与多相分解原理1.1 FIR滤波器数学模型1.2 多相分解的数学推导1.3 多相分解的物理意义 二、插值应用中的数学原理2.1…

Java并发编程实战 Day 22:高性能无锁编程技术

【Java并发编程实战 Day 22】高性能无锁编程技术 文章简述 在高并发场景下,传统的锁机制(如synchronized、ReentrantLock)虽然能够保证线程安全,但在高竞争环境下容易引发性能瓶颈。本文深入探讨无锁编程技术,重点介绍…

打破语言壁垒!DHTMLX Gantt 与 Scheduler 文档正式上线中文等多语言版本!

你还在为英文技术文档望而却步吗?现在好消息来了!DHTMLX 团队宣布,其两款明星组件——DHTMLX Gantt(甘特图)与 DHTMLX Scheduler(日程排程器)的官方文档,现已全面支持中文、德语、韩…

无监督 vs 有监督的本质区别

一、无监督 vs 有监督的本质区别 1. 无监督学习 定义:数据中没有人为标注的 “正确答案”(如类别标签、目标值),模型需自己发现数据中的模式。任务目标:学习数据的分布规律、结构或生成逻辑。例子: 文本续…

【Linux】初见,进程概念

前言: 上文我们讲到了Linux下的第一个程序:进度条 【Linux】LInux下第一个程序:进度条-CSDN博客 本文我们来讲一讲Linux中下一个非常重要的东西:进程 1.冯诺依曼体系结构 我们所见的大部分计算机都是遵循的冯诺依曼体系结构…

Linux进程间通信(IPC)详解:从入门到理解

引言 作为一名C开发初学者,理解Linux下的进程间通信(Inter-Process Communication,简称IPC)机制是非常重要的一步。本文将用通俗易懂的语言,配合直观的图示,帮助你理解Linux进程间通信的基本概念和各种实现…

SQL进阶之旅 Day 27:存储过程与函数高级应用

【SQL进阶之旅 Day 27】存储过程与函数高级应用 文章简述 在数据库开发中,存储过程和函数是实现复杂业务逻辑、提高代码复用性和提升系统性能的重要工具。本文作为“SQL进阶之旅”系列的第27天,深入探讨存储过程与函数的高级应用,涵盖其设计…

泰国零售巨头 CJ Express 借助 SAP 内存数据库实现高效数据管理

泰国 CJ Express 运用 SAP 内存数据库有效控制数据增长案例 “Datavard Outboard 操作简便、配置轻松,我们得以在生产系统上完成数据归档,成功将约 730GB 数据迁移至 Hadoop 集群。”——K. Jak,J Express 技术服务经理 关于 CJ Express …

ImageSharp.Web 使用指南:高效处理ASP.NET Core中的图像

文章目录 前言一、ImageSharp.Web简介二、安装与配置1. 安装NuGet包2. 基本配置3. 高级配置 三、核心功能与使用示例1. 基本图像处理2. 处理模式详解3. 自定义处理命令 四、缓存策略1. 物理文件系统缓存2. 分布式缓存3. 自定义缓存 五、性能优化建议六、常见问题解决1. 图像处理…

使用R进行数字信号处理:婴儿哭声分析深度解析

音频信号处理将原始声音数据转化为有意义的洞见,适用于语音分析、生物声学和医学诊断等领域。使用R语言,我们可以处理音频文件、可视化频率内容,并生成如声谱图等详细图表。本指南将展示如何使用R包tuneR、seewave和rpanel分析婴儿哭声音频文…

【环境配置】解决linux每次打开终端都需要source .bashrc文件的问题

解决方法: cd vim .bash_profile输入下面内容后 :wq 保存并退出 # .bash_profileif [ -f ~/.bashrc ]; then. ~/.bashrc fi 参考链接&am…

ResizeObserver的错误

为什么会存在ResizeObserver错误 ResizeObserver loop completed with undelivered notifications. ResizeObserver用于监听元素content size和border size的变化。但是元素的变化和监听可能会导致循环触发,例如有元素A,监听元素A尺寸变化后将元素A的宽…

[k8s]--exec探针详细解析

在 Kubernetes 中,exec 探针是一种通过 在容器内执行命令 来检测容器健康状态的机制。它的核心逻辑是:执行命令后,若命令返回值为 0(表示成功),则认为容器健康;否则认为不健康。 一、exec 探针的…

偶数项收敛半径

🧠 背景:幂级数与收敛半径 一个幂级数(power series): ∑ n 0 ∞ a n x n \sum_{n0}^{\infty} a_n x^n n0∑∞​an​xn 其收敛半径 R R R 表示该级数在哪些 x x x 的取值范围内收敛。其计算公式: 1 R …

从0开始学习语言模型--Day01--亲自构筑语言模型的重要性

在如今这个时代,人工智能俨然已经成了一个大家耳熟能详的词汇。随着技术的发展,它在不断地降低计算机领域一些工作的门槛,甚至有时候我们能看到一个可能六年前还需要从头开始学习的职业,现在只需要能掌握一个专属的小模型就可以拥…