来源 | 新智元

短短两年,马斯克Grok 4的横空出世,让xAI团队一举站上AI之巅。

图片

昨日一小时发布会,Grok 4让所有人大开眼界,直接刷爆了AIME 2025、人类最后的考试(HLE)两大基准。

这是狂堆20万GPU才换来的惊人成果,更具体讲,Grok 4算力飙涨了100倍。

图片

xAI团队成员自豪地表示,「Scaling强化学习才是正确的路」!

图片

而如今,硅谷大佬的目光不再只是AI模型的发布,其背后的顶尖团队才是关注的C位。

尤其是,在当前疯狂抢人大战之际,小扎又在瞄准下一波候选人了。

图片

也就是同一时间,xAI员工Daniel晒出了Grok 4团队作战图迅速刷屏。

一眼望去,80%的面孔几乎都是华人学者。

图片

图片

斯坦福博士毕业,现xAI研究员Xuechen Li感慨道,一小群顶尖人才在极致专注下的爆发力,竟能在极短时间内取得如此巨大的成就」!

图片

图片

Grok 4发布会之后的狂欢

接下来,一起盘点Grok 4身后的顶配华人天团都有谁?

图片

Grok 4背后天团,华人占比惊人

先来看,能够坐镇发布会,紧挨马斯克的两位华人学者。

他们也算是xAI对外公开的老熟人了,上次Grok 3直播同样坐在了老马的身旁。

图片

Grok 4发布会上,图片最右边是Jimmy Ba,多伦多大学计算机科学助理教授,AI大佬Hinton的学生,创始团队一员。

图片

另一位是xAI联创吴怀宇(Tony Wu),多伦多大学博士,妥妥的95后,也曾是AlphaGeometry、AlphaStar核心开发者。

图片

其他华人学者还包括:

Greg Yang(杨格)

杨格是xAI创始成员之一。

他本硕就读于哈佛大学数学系,导师是数学家丘成桐,并于2018年荣获摩根奖(Morgan Prize)荣誉奖。

在加入xAI之前,他曾是微软的高级研究员,负责AI理论研究。

图片

Zihang Dai(戴子航)

戴子航本科毕业于清华大学计算机科学系,师从著名计算机视觉专家朱松纯开展研究。

此外,他还获得了CMU硕士和博士学位。

他曾是前谷歌大脑研究员,在自然语言处理(NLP)领域拥有深厚的积累,尤其擅长Transformer架构的优化与创新。

图片

Guodong Zhang(张国栋)

张国栋于2017年获得了浙江大学学士学位,并于2022年获得了多伦多大学博士学位。

博士毕业后,他曾加入谷歌DeepMind任研究科学家。

图片

Shengyang Sun

Shengyang Sun在xAI领导AI专家团队。

他于2022年获得了多伦多大学计算机博士学位,于2017年获得了清华学士学位。

入职xAI之前,他曾在英伟达就职1年多,任高级研究科学家;在亚马逊担任过应用机器学习科学家。

图片

Bill Yuchen Lin(林禹臣)

林禹臣现任xAI研究员兼华盛顿大学(UW)客座助理教授,专注于LLM对齐、AI智能体训练、推理及多模态大模型。

他于2022年获得了南加州大学博士学位。他还曾拿下了上海交通大学IEEE荣誉班的学士学位,在校期间获校级优秀毕业论文奖。

图片

Xuechen Li

Xuechen Li分别获得了斯坦福大学计算机科学系的硕士和博士学位,在此之前,还曾拿到多伦多大学学士学位。

公开资料显示,他还曾就读于北京四中。

在加入xAI之前,他曾在谷歌任学生研究员,并在微软实习了四个月。

图片

Tianle(Tim)Li

Tianle(Tim)Li在xAI专注于Grok模型的后训练工作。

在此之前,他曾获得了UC伯克利EECS学士学位,并参与了著名的LMArena竞技平台的研发。

图片

Haotian Liu

Haotian Liu是Grok-1.5V、Grok-2、Grok-3的核心开发者。

他于2024年获得了威斯康星大学麦迪逊分校获得博士学位,师从Yong Jae Lee教授。

在此之前,他还曾获得了浙江大学获得学士学位,并拿到了优秀毕业生的称号。

图片

Lianmin Zheng

Lianmin Zheng曾获得了UC伯克利完成了博士学位,导师是Ion Stoica和Joseph E. Gonzalez教授。他本科就读于上海交通大学ACM班。

值得一提的是,他曾和团队共同创立了非营利组织LMSYS.org,致力于推进开源大语言模型研究。

图片

Jiacheng Hong

Jiacheng Hong于2012年获得了CMU硕士学位,本科曾就读于上海交通大学。

入职xAI之前,他曾在Pinterest任职12年,担任工程主管。

图片

Qian Huang

Qian Huang本科就读于康奈尔大学数学和计算机科学系,目前仍是斯坦福大学博士生(2027年毕业),同时也是xAI技术员之一。

图片

Yiwen Yuan

Yiwen Yuan曾获得了CMU计算机科学计算机系学士和硕士学位。

目前,她在xAI是一名技术员,曾在一家Kumo.AI初创任技术主管。

图片

Su Yan

Su Yan本科毕业于华北电力大学计算机系,并于2017年获得了南加州大学计算机硕士学位。

他的个人职业经历非常丰富,曾在Airbnb担任高级软件工程师、在TikTok任技术主管。

图片

Yikang Shen

Yikang Shen曾获得了北京航空航天大学计算机学士和硕士学位,还获得了蒙特利尔大学计算机博士学位。

此前,他在IBM任研究科学家,专注于打造下一代更高效的大模型。

图片

Wenhan Xiong

Wenhan Xiong曾获得了中国科学技术大学学士学位和UCSB的博士学位。

毕业后,他便加入了Meta GenAI团队任AI研究科学家,是 Llama2/3、CodeLlama的核心作者。

图片

还有一位研究员Yifei Zhou甚至暂停了UC伯克利博士学位,也要加入xAI参与最先进模型

图片

此外,xAI团队中参与Grok 4华人成员还有,Yuchen He、Tianyi Zhang、Xinlei Chen、Jihui Yang等等。

图片

刚刚,马斯克点评:xAI办公室氛围很nice!

图片

图片

一夜登顶,xAI首次夺魁!

除了xAI官方发布的数据,独立评测机构Artificial Analysis也在第一时间公布了对Grok 4模型的全方位基准测试结果。

最引人注目的是,Grok 4在「Artificial Analysis智能指数」中以73分的成绩拔得头筹,显著超越了一众顶级模型。

包括OpenAI o3(70分)、谷歌Gemini 2.5 Pro(70分)、Anthropic Claude 4 Opus(64分)和DeepSeek R1 0528(68分)。

图片

细分能力表现如下:

  • 代码与数学能力制霸:在「编码指数」(LiveCodeBench & SciCode) 和「数学指数」(AIME24 & MATH-500) 两大关键领域中均排名第一

图片

图片

  • 刷新高难度测试纪录

    • 在GPQA Diamond测试中取得了88%的历史最高分,大幅刷新了Gemini 2.5 Pro此前84%的纪录

    • 在「人类最后的考试」中以24%的成绩创下历史新高,超越了Gemini 2.5 Pro的21%

  • 多项全能:在MMLU-Pro和AIME 2024两项测试中,分别取得了87%和94%的最高分

图片

  • 速度:每秒输出75个token。慢于o3(188 token/s)和Gemini 2.5 Pro(142 token/s),但快于Claude 4 Opus(66 token/s)

  • 上下文窗口:256k token。低于Gemini 2.5 Pro的100万token(1m),但优于Claude 4 Sonnet/Opus(200k) 和o3(200k)

  • 其他关键特性

    • 支持文本和图像输入(多模态能力)

    • 支持函数调用和结构化输出

图片

最后,在定价方面,Grok 4延续了Grok 3的策略,即每百万输入/输出token分别为3美元/15美元。

这一价位与Claude 4 Sonnet持平,但高于Gemini 2.5 Pro(1.25美元/10美元)和近期降价后的o3(2美元/8美元)。

图片

不过,根据知名大佬「karminski-牙医」的实测,Grok 4的代码基准结果,有过拟合的嫌疑。

不管是已经用到包浆的「七边形小球弹跳」测试,还是刚做出来的「拆烟囱」测试,Grok 4的表现都不如旧版DeepSeek R1。

甚至,生成的代码还得靠Claude debug之后,才能跑……

图片

,时长00:54

图片

,时长00:31

参考资料:

https://x.com/LiTianleli/status/1943445775981404598

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/914161.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/914161.shtml
英文地址,请注明出处:http://en.pswp.cn/news/914161.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI大模型(七)Langchain核心模块与实战(二)

Langchain核心模块与实战(二)Langchian向量数据库检索Langchian构建向量数据库和检索器批量搜索返回与之相似度最高的第一个检索器和模型结合得到非笼统的答案LangChain构建代理通过代理去调用Langchain构建RAG的对话应用包含历史记录的对话生成Langchia…

Flutter基础(前端教程①-容器和控件位置)

一个红色背景的 Container垂直排列的 Column 布局中央的 ElevatedButton按钮下方的白色文本import package:flutter/material.dart;void main() {runApp(const MyApp()); }class MyApp extends StatelessWidget {const MyApp({Key? key}) : super(key: key);overrideWidget bu…

CSS flex

目录 flex-box和flex-item 主轴和副轴 ​编辑 flex-box的属性 flex-direction flex-wrap flex-flow justify-content ​编辑​align-items align-content flex-item的属性 flex-basis flex-grow flex-shrink flex flex-box和flex-item 当把一个块级元素的displ…

【JMeter】执行系统命令

步骤如下: 添加JSP233 Sampler:右击线程组>添加>取样器>JSR223 Sampler2.填写脚本,执行后查看日志。res "ipconfig".execute().text log.info(res)res "python -c \"print(11)\"".execute().text l…

AI Agent开发学习系列 - langchain之memory(1):内存中的短时记忆

内存中的短时记忆,在 LangChain 中通常指 ConversationBufferMemory 这类“对话缓冲记忆”工具。它的作用是:在内存中保存最近的对话历史,让大模型能理解上下文,实现连续对话。 对话缓冲记忆”工具 主要特点 只保留最近的对话内容…

uniapp实现微信小程序端图片保存到相册

效果图展示 安装插件海报画板导入到项目里面&#xff0c;在页面直接使用 <template><view><button click"saveToAlbum" class"save-button">保存到相册</button><image :src"path" mode"widthFix" v-if&qu…

Java生产带文字、带边框的二维码

Java 生成带文字、带边框的二维码1、Java 生成带文字的二维码1.1、导入jar包1.2、普通单一的二维码1.2.1、代码示例1.2.2、效果1.3、带文字的二维码1.&#xff13;.&#xff11;、代码示例1.3.2、效果2、带边框的二维码2.1、代码示例2.2、带边框的二维码效果 1、Java 生成带文字…

ARM单片机启动流程(三)(栈空间综合理解及相关实际应用)

文章目录1、引出栈空间问题2、解决问题2.1、RAM空间2.2、RAM空间具体分布2.3、关于栈空间的使用2.4、栈溢出2.5、变量的消亡2.6、回到关键字static2.7、合法性的判断1、引出栈空间问题 从static关键字引出该部分内容。 为什么能从static引出来&#xff1f; 在使用该关键字的…

【RK3568+PG2L50H开发板实验例程】FPGA部分 | 键控LED实验

本原创文章由深圳市小眼睛科技有限公司创作&#xff0c;版权归本公司所有&#xff0c;如需转载&#xff0c;需授权并注明出处&#xff08;www.meyesemi.com) 1.实验简介 实验目的&#xff1a; 从创建工程到编写代码&#xff0c;完成引脚约束&#xff0c;最后生成 bit 流下载到…

【Python练习】039. 编写一个函数,反转一个单链表

039. 编写一个函数,反转一个单链表 039. 编写一个函数,反转一个单链表方法 1:迭代实现运行结果代码解释方法 2:递归实现运行结果代码解释选择方法迭代法与递归法的区别039. 编写一个函数,反转一个单链表 在 Python 中,可以通过迭代或递归的方式反转一个单链表。 方法 1…

BERT代码简单笔记

参考视频&#xff1a;BERT代码(源码)从零解读【Pytorch-手把手教你从零实现一个BERT源码模型】_哔哩哔哩_bilibili 一、BertTokenizer BertTokenizer 是基于 WordPiece 算法的 BERT 分词器&#xff0c;继承自 PreTrainedTokenizer。 继承的PretrainedTokenizer&#xff0c;具…

PID控制算法理论学习基础——单级PID控制

这是一篇我在学习PID控制算法的过程中的学习记录。在一开始学习PID的时候&#xff0c;我也看了市面上许多的资料&#xff0c;好的资料固然有&#xff0c;但是更多的是不知所云。&#xff08;有的是写的太过深奥&#xff0c;有的则是照搬挪用&#xff0c;对原理则一问三不知&…

【Elasticsearch】function_score与rescore

它们俩都是用来“**干涉评分**”的&#xff0c;但**工作阶段不同、性能开销不同、能做的事也不同**。一句话总结&#xff1a;> **function_score** 在 **第一次算分** 时就动手脚&#xff1b; > **rescore** 在 **拿到 Top-N 结果后** 再“重新打分”。下面把“能干嘛”…

无广告纯净体验 WPS2016 精简版:移除联网模块 + 非核心组件,古董电脑也能跑

各位办公小能手们&#xff01;今天给你们介绍一款超神的办公软件——WPS2016精简版&#xff01;它有多小呢&#xff1f;才33MB&#xff0c;简直就是软件界的小不点儿&#xff01;别看它个头小&#xff0c;功能可一点儿都不含糊&#xff0c;文字、表格、演示这三大功能它全都有。…

《PyWin32:Python与Windows的桥梁,解锁系统自动化新姿势》

什么是 PyWin32在 Windows 平台的 Python 开发领域中&#xff0c;PyWin32 是一个举足轻重的库&#xff0c;它为 Python 开发者打开了一扇直接通往 Windows 操作系统底层功能的大门。简单来说&#xff0c;PyWin32 是用于 Python 访问 Windows API&#xff08;Application Progra…

vite如何生成gzip,并在服务器上如何设置开启

1. 安装插件npm install vite-plugin-compression -D2. 在 vite.config.ts 中配置TypeScriptimport { defineConfig } from vite import compression from vite-plugin-compressionexport default defineConfig({plugins: [compression({algorithm: gzip,ext: .gz,threshold: 1…

1068万预算!中国足协大模型项目招标,用AI技术驱动足球革命

中国足协启动国际足联“前进计划”下的大数据模型项目&#xff0c;预算1068万元。该项目将建立足球大数据分析平台&#xff0c;利用AI技术为国家队、青少年足球、业余球员及教练员裁判员提供精准数据分析服务&#xff0c;旨在通过科技手段提升中国足球竞技水平。 中国足球迎来数…

AI产品经理面试宝典第12天:AI产品经理的思维与转型路径面试题与答法

多样化思维:如何跳出单一框架解题? 面试官:AI产品常面临复杂场景,请举例说明你如何运用多样化思维解决问题? 你的回答:我会从三个维度展开:多角度拆解需求本质,多层级融合思维模式,多变量寻找最优解。比如设计儿童教育机器人时,不仅考虑功能实现(技术层),还融入情…

vscode.window对象讲解

一、vscode.window 核心架构图 #mermaid-svg-fyCxPz1vVhkf96nE {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-fyCxPz1vVhkf96nE .error-icon{fill:#552222;}#mermaid-svg-fyCxPz1vVhkf96nE .error-text{fill:#5522…

为什么一个 @Transactional 注解就能开启事务?揭秘 Spring AOP 的底层魔法

你是否也曾深陷在各种“额外”逻辑的泥潭&#xff0c;为了给一个核心业务方法增加日志、权限校验或缓存&#xff0c;而不得不将这些非核心代码硬塞进业务类中&#xff0c;导致代码臃肿、职责不清&#xff1f;是时候用代理设计模式 (Proxy Design Pattern) 来解脱了&#xff01;…