近年来,AI生成内容的质量突飞猛进,从文本到图像再到视频,几乎达到了以假乱真的程度。近期一段"人类在飞机上吵架看呆袋鼠"的视频在社交网络疯传,获得数千万次观看后,才被证实是AI生成内容,这一事件再次引发了人们对AI内容真实性的担忧。与此同时,AI在游戏领域的应用也取得了突破性进展,o3-pro大模型在经典游戏测试中表现优异,而游戏行业先驱John Carmack却对大型语言模型(LLM)在游戏中的应用持保留态度。本文将深入探讨AI生成内容的鉴伪技术、AI在游戏智能中的最新进展,以及中国AI初创企业Manus的崛起之路。

"袋鼠登机"事件:AI生成内容引发的信任危机

2025年6月,一段名为"人类在飞机上吵架看呆袋鼠"的视频在X(原Twitter)平台迅速走红。视频中,一只紧握登机牌、站得笔直的袋鼠,满脸无辜地看着自己的主人和一名空乘人员在登机口激烈争吵。由于袋鼠的举止表情"比小朋友还乖",这段视频在短时间内获得了7460万次观看,Instagram上的点赞量也高达110.4万次。

然而,细心的网友很快发现了视频中的多处不自然之处:

  1. 登机牌异常:袋鼠手中的"登机牌"上全是难以辨认的文字乱码,这是AI生成视频的典型特征。
  2. 语言问题:视频中的人类说着并不存在的语言,空乘人员佩戴的胸牌上也没有名字。
  3. 物品突变:乘客的左手无名指一开始没有任何首饰,但突然无中生有地出现了一枚戒指。

这些细节最终证实了这段视频是由AI生成的。进一步调查发现,该视频最初来自一个名为InfiniteUnreality的Instagram账号,该账号专门发布各种超现实的AI动物视频,如"系在飞机座椅上的河马"、"登机的长颈鹿"以及"躺在婴儿车里的小猪"等。

AI标签的隐蔽性与传播失真

值得注意的是,InfiniteUnreality账号实际上在简介和视频中打上了AI标签——使用代表无穷大的"Infinite Unreality"符号。然而,这种提示非常隐蔽,绝大多数网友根本无法识别。更糟糕的是,当其他博主转发这段视频时,往往不会重复标注"AI生成"的说明。例如,知名X账号DramaAlert在转发时就未透露该视频出自AI之手,导致更大规模的误判。

社交媒体的传播机制进一步放大了这种误导效应。许多网友在评论区半开玩笑地说"这是袋鼠日常"、"袋鼠看着很有礼貌",营造出"这是真实事件"的集体错觉。即使有少数人指出"AI生成"的真相,他们的声音也会被淹没在海量的玩梗与调侃中。

真实与虚假的边界模糊化

AI制造的混乱还不止于此。在"袋鼠登机"事件后不久,网络上又出现了相反的现象——有人将真实的视频冒充为AI生成的内容。例如,有博主发布了一段"妆容怪诞的钢琴家弹唱歌曲"的视频,声称这是使用谷歌Veo3生成的AI内容,甚至提供了详细的提示词。然而,这实际上是12年前Tim Minchin的真实表演录像。

类似地,还有博主用俄罗斯歌手Vitas的真实影像假冒Veo3生成的视频。虽然这些行为可能带有开玩笑的成分,但它们确实误导了大量观众,进一步模糊了真实与虚假的边界。

SynthID:谷歌的AI内容鉴伪解决方案

面对日益严重的AI生成内容泛滥问题,科技巨头谷歌推出了一款多模态AI内容鉴伪工具——SynthID。这款工具旨在识别谷歌旗下生成式AI(如Gemini、Imagen、Lyria、Veo等)所"生成"或"编辑"的图片、视频、音频和文本中的数字水印。

SynthID的技术原理

SynthID本质上是一种"数字水印"技术。当用户使用谷歌的生成式AI工具创建内容时,系统会在内容中隐性嵌入一组不易察觉、但特定工具能探测到的数字"指纹"。这种水印具有以下特点:

  1. 强鲁棒性:即使对内容进行加滤镜、裁剪、转格式等常规编辑,水印依然能被检测出来。
  2. 多模态支持:可应用于图片、音频、视频和文本多种媒体形式。
  3. 精准定位:不仅能判断内容是否来自谷歌AI,还能标记出最有可能藏有水印的具体区域或时间段。

在2025年谷歌I/O开发者大会上,谷歌正式推出了基于SynthID的Detector工具。该工具可以扫描文件中的隐形数字水印,精准定位图像、视频、音频或文本中嵌入水印的具体部分。例如,在音频中可标记水印片段,在照片中则高亮显示可能嵌入水印的区域。

SynthID的应用与局限

目前,SynthID Detector工具正在向记者、研究者和开发者推广,并计划嵌入谷歌的多款生成式AI工具,如Veo 3、Imagen 4和Lyria 2。此外,谷歌还与英伟达及GetReal Security等合作伙伴共同推进水印技术的应用。

然而,SynthID也存在明显的局限性:

  1. 平台限制:只能识别内置SynthID的内容,即必须是谷歌系模型(或有合作伙伴模型)的产物。对于ChatGPT、Stable Diffusion、Midjourney等第三方AI服务生成的内容,或者根本没有嵌入水印的AI内容,SynthID无法检测。
  2. 抗攻击性有限:虽然水印足够隐蔽且兼容常规编辑,但如果有人恶意反复大幅改动、转码、翻译或彻底重写内容,水印可能会被破坏,导致检测失败。
  3. 早期阶段:目前该技术还处于"早期测试"阶段,需要通过候补名单申请使用。

表:SynthID与其他AI内容检测方法的比较

检测方法

原理

优点

缺点

SynthID水印

数字指纹嵌入

高精度、可定位、抗常规编辑

仅限谷歌系模型、可能被恶意破坏

元数据分析

检查文件元数据

无需模型配合、适用范围广

容易被剥离、伪造

AI特征分析

检测生成痕迹

理论通用性强

误报率高、计算成本大

人工审核

人类专家判断

灵活适应各种情况

效率低、成本高、主观性强

o3-pro大模型:游戏智能的新标杆

在AI生成内容引发广泛讨论的同时,AI在游戏领域的应用也取得了突破性进展。o3-pro大模型在经典怀旧小游戏"推箱子"和"俄罗斯方块"中表现出色,突破了现有的基准[citation:用户提供内容]。

Lmgame基准测试表现

o3-pro大模型的测试是在名为Lmgame的benchmark上进行的,该基准专门用于评估大模型的游戏能力。测试结果显示:

  1. 推箱子:o3-pro完成了所有关卡,展现了出色的逻辑推理和规划能力[citation:用户提供内容]。
  2. 俄罗斯方块:其得分远超之前的SOTA(State-of-the-Art)模型o3,展示了快速决策和长期策略能力[citation:用户提供内容]。

Lmgame基准还包括2048、糖果传奇、超级马里奥兄弟和逆转裁判等多样化游戏,每款游戏都有不同的评价标准,全面评估AI模型的游戏智能[citation:用户提供内容]。

技术背景与支持

Lmgame项目由UCSD的HaoAILab负责,该实验室接受谷歌和英伟达的资助,并参与创立了非营利组织LMSYS[citation:用户提供内容]。这种产学研结合的模式为游戏AI研究提供了坚实的资源支持和技术保障。

o3-pro的成功表明,经过专门设计和训练的大模型可以在特定游戏领域达到甚至超越人类水平的性能。这为AI在更复杂游戏环境中的应用奠定了基础,也为通用游戏AI的发展指明了方向。

John Carmack对LLM在游戏中应用的质疑

尽管o3-pro在游戏测试中表现优异,但游戏行业先驱John Carmack对大型语言模型(LLM)在游戏中的应用持保留态度。作为《毁灭战士》和《雷神之锤》等经典游戏的缔造者,Carmack的观点在业界具有重要影响力。

Carmack的核心观点

Carmack认为,尽管LLM在文本生成、对话交互等领域展现了强大的能力,但将其应用于游戏设计中仍存在诸多局限性:

  1. 沉浸式体验的缺失:游戏的核心在于创造沉浸式体验,这需要高度的创意与技术结合。LLM虽然能够模拟人类语言,但它缺乏对复杂游戏逻辑的理解以及对玩家情感需求的深层次洞察4。
  2. 艺术性与技术挑战:优秀的游戏不仅依赖于代码编写,更需要设计师具备独特的想象力与审美眼光。例如,《我的世界》的成功源于其独特的像素化美学,而《塞尔达传说》系列则因其精妙的叙事结构与开放世界探索机制而成为经典。这些成就无法通过LLM简单复制或替代4。
  3. 交互式学习的重要性:Carmack更倾向于通过交互式体验流进行学习,类似于动物和人类的学习方式。他指出,基于Transformer的基础模型可能取代传统强化学习的想法存在疑问,因为要求LLM在一个从未见过的环境中表现良好可能极其低效8。

Carmack的实践方向

离开Meta后,Carmack加入Keen Technologies,与强化学习之父Richard Sutton合作,专注于强化学习领域的研究。他的团队目前由六名来自学术界和工业界的研究人员组成,专注于Atari游戏的研究,旨在解决连续、高效、终身、单一环境、多任务在线学习等挑战。

Carmack强调了Atari基准测试的重要性,并讨论了其在强化学习中的挑战和进展。他还提到,游戏选择、摄像头观察、操纵杆动作等技术细节对于实现真正的AI游戏智能至关重要。

值得注意的是,Carmack的团队正在进行一个有趣的项目:使用物理Atari游戏机和实时运行强化学习智能体的笔记本电脑进行交互学习。这个项目旨在降低系统延迟,并挑战那些认为完全具身的通用人工智能即将实现的观点。Carmack表示,他们将开源这项工作,以促进整个社区的发展8。

Manus:中国AI初创企业的崛起之路

在AI生成内容和游戏智能之外,中国AI初创企业Manus的发展也值得关注。自2025年3月初上线以来,Manus备受瞩目,已完成由Benchmark领投的7500万美元融资,估值达5亿美元[citation:用户提供内容]。

产品发展与市场表现

Manus已经开放公众注册,并推出文本转视频生成功能,进入新兴市场。尽管早期限量发放邀请码的策略引发争议,但随着产品的逐步开放,用户增长迅速[citation:用户提供内容]。

据Manus的商业计划书(BP)显示,其在AI Agent市场具有重要性和独特性,技术架构和核心能力突出。有传闻称,Manus的年度经常性收入(ARR)已接近1亿美元,显示出其产品潜力[citation:用户提供内容]。

技术架构与开源计划

2025年3月,Manus曾遭遇"越狱"事件,推特用户jianxliao发布推文称成功获取了Manus的沙盒运行时代码,揭示了Manus使用Claude Sonnet模型、配备29个工具且使用了browser_use开源项目等技术细节。

Manus联合创始人兼首席科学家季逸超迅速回应,解释了Manus的技术架构:

  1. 沙盒设计:每个Manus会话都有自己的沙盒,完全与其他会话隔离,用户可以通过界面直接进入沙盒7。
  2. 多Agent系统:这是Manus的关键特性之一——用户只与执行Agent通信,该Agent本身不了解知识、规划器或其他Agent的详细信息,这有助于控制上下文长度。
  3. 开源技术应用:Manus使用了browser_use等开源项目,季逸超特别强调"没有开源社区,Manus就不会存在"。

季逸超还透露,Manus确实使用了Claude和不同的阿里Qwen微调模型,并正在测试Claude 3.7。他最后强调,团队一直有开源传统,将在不久的将来开源不少"好东西"。

未来挑战与机遇

未来,Manus面临从单一爆款向生态型平台发展的挑战。随着AI生成内容市场的竞争加剧,Manus需要在技术创新、用户体验和商业模式上持续突破,才能保持领先地位[citation:用户提供内容]。

总结与展望

从"袋鼠登机"视频引发的AI内容真实性质疑,到o3-pro大模型在游戏测试中的突破表现,再到John Carmack对LLM在游戏中应用的独特见解,以及Manus等中国AI初创企业的崛起,我们可以看到AI技术正在多个领域快速演进并产生深远影响。

在AI生成内容方面,随着技术不断进步,真实与虚假的边界日益模糊。谷歌SynthID等鉴伪工具的出现为内容真实性提供了一定保障,但仍需行业共同努力建立更完善的标准和机制。未来可能的发展方向包括:

  1. 跨平台水印标准:推动行业建立统一的数字水印标准,使不同厂商的AI生成内容都能被有效识别。
  2. 混合检测方法:结合水印技术、元数据分析和生成痕迹检测等多种方法,提高鉴伪的准确性和鲁棒性。
  3. 法律法规完善:制定相关法律,明确AI生成内容的标识义务和传播责任。

在游戏AI领域,o3-pro的成功和Carmack的质疑反映了技术路线的多样性。未来可能会出现以下趋势:

  1. 专用游戏AI的发展:针对特定游戏类型优化的AI模型将继续突破性能极限。
  2. 强化学习与LLM的结合:探索两种技术路线的优势互补,创造更强大的游戏AI。
  3. 开源生态建设:如Carmack和Manus所倡导的,通过开源促进游戏AI技术的共同进步。

中国AI初创企业如Manus的快速发展,展现了本土创新力量的崛起。随着技术积累和市场拓展,这些企业有望在全球AI竞争中占据更重要的位置,但也需要应对技术创新、人才争夺和国际竞争等多重挑战。

在这个AI技术日新月异的时代,保持对技术发展的理性认知,既看到其巨大潜力,也清醒认识其局限性,将是社会各界需要共同面对的课题。只有通过技术创新、伦理考量和法律监管的多管齐下,才能确保AI技术健康发展,真正造福人类社会。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89251.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89251.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/89251.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么在linux中不能直接使用pip进行安装

您好,这是一个非常深刻且关键的问题,触及了 Linux 系统管理与 Python 开发实践的核心原则。理解了这一点,您就真正开始像一位经验丰富的开发者那样思考了。 简单来说,答案是:为了保护操作系统自身的稳定和完整性。 让…

IDEA相关配置记录

IDEA相关配置记录 参考链接: 参考链接: 1、安装jdk D:\Program Files\Java\jdk-21 https://blog.csdn.net/2302_81410974/article/details/142031416 2、安装maven D:\Java\workspace-maven\apache-maven-3.9.10 . ├── LICENSE ├── NOTICE ├──…

FastGPT私有化部署完整指南

🚀 FastGPT 私有化部署完整指南 📋 环境要求 硬件要求 最低配置:CPU: 4核内存: 8GB存储: 50GB网络: 稳定互联网连接推荐配置:CPU: 8核内存: 16GB存储: 100GB SSD网络: 10Mbps带宽软件环境 必需软件:- Docker: > 20.10.0- Docker Compose: > 2.…

系统架构设计师论文分享-基于架构的软件设计方法及应用

我的软考历程 摘要 2023年2月,我所在的公司做了开发纱线MES系统的决定,该系统为国内纱线工厂提供SAAS服务,旨在提高纱线工厂的智能化和数字化水平。我在该项目中被任命为系统架构设计师,全面掌管该项目的架构设计工作。本文将结…

团结引擎发布纯鸿蒙应用

大家好,我是阿赵。   这里尝试一下用团结引擎发布纯鸿蒙系统的应用。 一、 安装鸿蒙系统发布需要的组件 在团结引擎的Hub里面找到Add modules: 然后找到OpenHarmony的支持选项,由于我已经安装过了,所以会显示Installed,如果没…

C++基础(FreeRDP编译)

安装 先安装openssl 保姆级OpenSSL下载及安装教程,OpenSSL下载及安装教程-CSDN博客 vcpkg integrate install 安装 vcpkg install zlib vcpkg install ffmpeg:x64-windows 编译指令 PS D:\freerdp\FreeRDP\build> cmake .. -G "Visual Studio 17 2022" -A x…

用celery作为信息中间件

要在 Django 的 settings.py 中设置 Redis 作为 Celery 的 broker 和(可选)backend,你需要添加如下配置: 安装依赖(如未安装): pip install celery redis在 settings.py 中添加 Celery 配置(推荐放在文件底部): # Celery 配置 CELERY_BROKER_URL = redis://127.0.0.1…

Postman介绍及使用

Postman 是一个强大的 API 开发、测试和文档化工具,广泛用于开发者、测试人员和 API 设计者。以下是 Postman 的核心使用指南,涵盖基础操作到进阶功能: 一、基础使用 安装与界面 下载:官网下载(支持 Windows/macOS/Lin…

Android14音频子系统-ASoC-ALSA之DAPM电源管理子系统

文章目录 概述1)codec对象-WM89602)ALSA下的kcontrol的构造与使用3)ASOC-ALSA下的kcontrol构造与使用1、通用寄存器对象 - kcontrol2、DAPM下的寄存器对象-widget3、如何构造widget?4、抽象对象widget、route与path1)r…

如何修改anaconda 创建新虚拟环境的路径(默认是C:\.conda\envs)

参考文章: 如何修改anaconda 创建新虚拟环境的路径(默认是C:\.conda\envs)_anaconda创建环境怎么改路径-CSDN博客

前缀和计算

前缀和 输入一个长度为n的整数序列。接下来再输入m个询问,每个询问输入一对l, r。对于每个询问,输出原序列中从第l个数到第r个数的和。 所用方法和基本原理 前缀和数组的构建: 首先定义了一个方法getPrefixSum来构建前缀和数组。前缀和数组…

BP神经网络支持向量机实现风机故障诊断

BP神经网络,支持向量机等用于风机故障诊断 BP神经网络,支持向量机等用于风机故障诊断/成功算法/bp20111202_FDD.m , 1580 BP神经网络,支持向量机等用于风机故障诊断/成功算法/BP_FDD.m , 6044 BP神经网络,支持向量机等用于风机故…

c++ std::initializer_list

测试代码&#xff1a; int sum(std::initializer_list<int> params) { // 传递若干同类型参数int total 0;for (auto num : params) {total num;}return total; }void testInitializer_list() {// 自定义类支持列表初始化class Demo {public:Demo(std::initializer_li…

Python 数据分析与机器学习入门 (五):Matplotlib 数据可视化基础

引言&#xff1a;为何可视化至关重要&#xff1f; 俗话说&#xff0c;“一图胜千言”。在数据分析领域&#xff0c;这句话尤其正确。原始的数据表格和统计摘要虽然精确&#xff0c;但往往难以揭示数据中隐藏的模式、趋势、异常值和关系。数据可视化通过将数据转换成图形&#…

AI基础1--线性代数(TODO)

1 前言 关于矩阵的运算&#xff0c;其实之前写过一篇&#xff1a;算法矩阵提速原理_矩阵分块计算速度会更快嘛-CSDN博客 还是那句话&#xff0c;计算机懂个毛的高等数学。只是矩阵运算的并行性和结构化特点与 SIMD/GPU 的执行模型非常一致。在实际硬件实现中&#xff0c;许多矩…

如何让宿主机完全看不到Wi-Fi?虚拟机独立联网隐匿上网实战!

“如何让宿主机完全看不到Wi-Fi&#xff1f;虚拟机独立联网隐匿上网实战&#xff01;” 一、前言 在某些特定环境&#xff08;如企业办公或信息安全测试&#xff09;中&#xff0c;我们可能有这样的需求&#xff1a; 让宿主机无法识别或使用某个USB网络设备&#xff0c;但虚拟…

Excel基础操作知识笔记

​ 学习视频链接&#xff1a; ​​​​​​【公开课】Excel基础大全&#xff08;1-66集&#xff09;【超高清版】_哔哩哔哩_bilibili 深圳则秀教育官方账号的个人空间-深圳则秀教育官方账号个人主页-哔哩哔哩视频 Excel技巧零基础入门公开课小白&#xff08;Excel表格制作|Exc…

【2025/06/30】GitHub 今日热门项目

GitHub 今日热门项目 &#x1f680; 每日精选优质开源项目 | 发现优质开源项目&#xff0c;跟上技术发展趋势 &#x1f4cb; 报告概览 &#x1f4ca; 统计项&#x1f4c8; 数值&#x1f4dd; 说明&#x1f4c5; 报告日期2025-06-30 (周一)GitHub Trending 每日快照&#x1f55…

Oracle 进阶语法实战:从多维分析到数据清洗的深度应用​(第四课)

在《Oracle 树形统计再进阶》(第三课)基础上&#xff0c;我们跳出传统 SQL 聚合框架&#xff0c;探索Oracle 特有的高级语法特性&#xff0c;包括多维分析神器MODEL子句、数据清洗利器正则表达式、PL/SQL 存储过程优化&#xff0c;以及基于执行计划的查询调优技巧。这些技术能解…

SpringBoot -- 自动配置原理

SpringBoot 自动配置原理 基础知识 Bean扫描 我们在学习 Spring 的时候&#xff0c;如果要把标注一下注解的类扫描进 IOC 容器 Controller&#xff0c;Service&#xff0c;Mapper&#xff0c;是需要通过一下两种方式实现的&#xff0c;但是我们在 SpringBoot 工程中并没有编写…