2025年被普遍认为是AI Agent商业化的关键之年,而大模型正是Agent能力的核心支撑。

当开发成本大幅降低,我们很可能看到各种垂直领域的Agent应用如雨后春笋般涌现。

技术普惠的现实意义对于广大AI创业者和开发者来说,这无疑是个好消息。

之前只有大厂才能玩得起的大模型游戏,现在中小团队也有了参与的机会。

开源往往能催生出最具创新性的应用。

6月30日,百度宣布其文心大模型4.5系列全面开源。

百度选择开放,实际上是在为自己争取更大的生态影响力。

2025年Agent爆发,文心4.5开源的时间点选得很巧妙。

此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

Image

产品地址:https://yiyan.baidu.com

Image

闭源模型的“镀金时代”

我们必须承认,闭源模型开启了这场革命。

以OpenAI的GPT系列和Anthropic的Claude为代表,它们用惊人的智能水平向世界证明了大型语言模型的颠覆性潜力。

它们是规则的制定者,是性能的标杆,也是商业化的先行者。

在那个阶段,开发最先进的大模型是一场资本和数据的豪赌,动辄数十亿美金的训练成本、海量的高质量数据集以及顶尖的人才储备,构筑了一道普通玩家难以逾越的护城河。

这种模式在商业上无可厚非,它确保了巨额投资的回报,并允许模型所有者完全控制其技术的发展方向和安全边界。

OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet共同定义了行业标杆,它们在通用推理、用户体验和功能完善度上达到了令人瞩目的高度 。

特别是Anthropic的Claude系列,凭借其独特的“Constitutional AI”理念,强调与人类价值观对齐,并在企业级应用上展现出独到之处 。

其Claude 3.5 Sonnet在研究生水平推理(GPQA)、编码能力(HumanEval)等多个基准测试中超越了GPT-4o,并引入了创新的“Artifacts”功能,允许用户与AI生成的图表、代码片段等内容进行交互式协作,这在复杂数据分析和内容创作场景中极具价值 。

Image

与此同时,OpenAI的GPT-4o则凭借其成本效益和多功能性,成为一个可靠的“全能选手”,能够处理从文本生成到多模态输入的广泛任务,为广大开发者提供了稳定且易于集成的解决方案 。

闭源模型最初的护城河是其无可争议的性能优势。

GPT-4的出现,让市场愿意为其高昂的成本和封闭的特性买单。

然而随着DeepSeek-R1等开源模型的性能在多个关键基准测试上追平甚至反超 ,这条护城河正在迅速收窄。

所以,当开源大模型的一些亮点被充分验证后,一般闭源模型会火速跟进。

无论是基础模型的能力,还是模型功能层的设计思路上,整体上是互相借鉴的过程。

开源AI力量的崛起

当Llama已成开源往事,由DeepSeek-R1扛起模型开源大旗

R1的技术路径:通过算法优化和架构创新,他们证明了"堆算力"并非唯一出路。

这种效率优先的思路,恰恰击中了当前AI发展的痛点——不是每家公司都有钱烧GPU集群,但每家公司都需要AI能力。

这种"技术普惠"策略直接引爆了华尔街的恐慌:

英伟达单日蒸发近6000亿美元市值,整个AI产业链都在重新审视自己的商业模式。

Image

国内千问一直秉持开源的路线,很多创业公司和产品底层都是基于Qwen进行强化学习,蒸馏,数据微调,百度也是看到了开源巨大的价值后决定正式开源,所以很期待这次文心“亮剑”。

开闭源模型对比:

Image

而且,传统云厂商也可以部署开源模型以更低的价格提供给初创 AI 团体或公司。

应用层开源技术栈:看不见的引擎

基础模型无法在真空中运行。

一个丰富多样的开源工具生态系统已经涌现,为开发稳健、可扩展的AI应用提供了必要的支撑。

  • 编排框架:像LangChain和Netflix Metaflow这样的工具,帮助开发者将大型语言模型、API和数据源像乐高积木一样组合起来,构建复杂的应用逻辑 。

  • 向量数据库:Milvus、Weaviate等专门的向量数据库,对于实现检索增强生成(RAG)至关重要。

RAG让大型语言模型能够基于事实性的、企业专有数据进行回答的关键技术。

  • 推理与部署:Ollama等工具使得在本地设备上部署和运行大型语言模型变得异常简单。

  • 完整的技术栈:一个典型的现代开源AI应用,其技术栈可能包括用于前端的Streamlit,用于嵌入的JinaAI,用于后端的FastAPI,以及用于数据存储的Postgres(结合pgvector扩展)。

百度文心4.5大模型,究竟有哪些料?

🌰

根据官方发布和技术社区的解析,百度此次开源的文心大模型4.5系列,绝非“轻量版”的试水,而是诚意满满的核心能力释放。

文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,增强了多模态理解能力。

文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。

在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。

其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越友商开源模型。

在多模态模型方面,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。

此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的友商相当。

Image

官方详细介绍地址:

https://mp.weixin.qq.com/s/BVQzYwcnpDzUAWvRzP5g_g

百度的这一步棋,精准而狠辣。

对于百度而言,很简单,我猜他们的想法是

“用AI开源换生态”

Image

Image

大模型开源:大厂不求速成,但求未来的“阳谋”

为什么这些不差钱的科技巨头,纷纷选择将自己耗费巨资研发的核心资产公之于众?

这并非一时冲动,而是一种深思熟虑的长期战略,一盘“阳谋”。

用社区参与构建真正的护城河

一个成功的开源模型,会迅速吸引一个庞大而忠诚的开发者社区。

这个社区会自发地为模型贡献代码、修复bug、开发教程、构建应用,甚至形成独特的文化圈层。这个由全球智慧共同构建的生态系统,其生命力和迭代速度,远非任何一家公司的闭源团队可以比拟。

这将形成一个独特的“AI恰饭硬核群体”,他们既是使用者,也是维护者和传播者,这种粘性是金钱买不来的。

Image

B端渗透的路径

对于企业级市场,直接使用通用大模型往往不够。

最佳实践是“基于开源模型蒸馏 + 私有数据微调”。

企业可以在一个强大的开源基座模型上,用自己积累的行业数据进行精调,创造出最适合自身业务场景的专用模型。这既保证了数据安全(无需上传到第三方平台),又极大地降低了开发成本。

开源,为大厂向B端市场的“慢渗透”铺平了道路。

Image

后发者的追赶捷径

对于在模型能力上稍稍落后的追赶者而言,开源是加速追赶第一梯队的最佳策略。

将模型开放,等于借助了全球开发者的力量来帮助自己改进技术、发现问题。

凭借大厂雄厚的资金和算力底蕴,再结合开源社区的集体智慧,可以迅速缩短与最前沿模型的差距。

股价是最终的KPI

模型本身开源可能短期内无法直接创造收入,但它所创造的行业影响力、技术领导力叙事,以及生态繁荣的预期,会直接反映在资本市场上。

投资者的信心会推高公司的股价,从而带来比直接售卖API调用远为丰厚的资本回报。

开源和闭源,各有各的道

最初马斯克在 OpenAI 时期的开放,到奥特曼时期商业化过渡,再到最近 OpenAI 再次转向不完全商业化的承诺,这家头部 AI 公司尚且在摸着石头过河,战略是根据自己公司优势和外部环境决定的。

Image

所以,即使是强如 OpenAI,也会在巨大未知的路线面前不得不进行各种探索,最终找到适合掌舵人和公司的长期路线。

各凭本事而已。

大模型的开源与闭源并不重要,“好用”才是验证真理的唯一准则。

近期李彦宏说过这么一句话,非常赞同:

"无论开源、闭源,基础模型只有解决现实问题,才有真实价值。"

AI 长期中期的技术发展,商业形态都存在极大的不确定性,其实可以理解这种策略的。

像 Claude,Gemini,Kimi 也都贡献了非常多的优秀开源项目。

但对于用户来讲,持续享受到最新的 AI 能力才是最实惠的。

底层逻辑:AI从基建为王走向应用层生态

风险投资向AI应用层转向

资本的流向是市场价值预期的最清晰指标。

在初期为基础模型研发注入巨额资金后,风险投资(VC)的焦点正明确地转向AI的应用层和运营层,这为本报告的核心论点提供了最有力的佐证。

数据显示了这一戏剧性的转变:

  • 惊人的增长:2024年,全球AI应用层初创公司吸引了高达510亿美元的风险投资,同比增长37%。而AI运营层(包括MLOps、数据工具等)的增长更为迅猛,融资额飙升344%,达到130亿美元。

  • 主导投资领域:AI相关初创公司在2024年占据了全球所有风险投资总额的近三分之一,成为最受资本青睐的赛道

  • 投资者的明确目标:VC们现在明确地将目标锁定在“生成式AI应用公司”——即那些利用第三方基础模型来构建面向消费者或企业的专业软件的公司 ()。他们尤其看好那些能够利用AI颠覆传统行业的垂直领域软件 ()。

  • 顶级机构入场:包括红杉资本(Sequoia Capital)、安德森·霍洛维茨基金(a16z)在内的顶级VC,以及像AI Fund这样的专项基金,都在积极地扩大其在AI应用和工具层的投资组合 。

风险投资在AI技术栈中的分布(2023-2024年)

Image

这场开源浪潮最深远的影响在于它将创新的重心从模型层下移到了应用层。

所以,无论是开源还是闭源,能够根据自身优势抓住可以抓的牌,保持在牌桌上的实力和定力。

留到最后,一起迎接 AGI 的到来。

对于百度而言,非常有希望以文心开源为基础构建下面的完整生态:

Image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/87087.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/87087.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/87087.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构:递归:斐波那契数列(Fibonacci Sequence)

目录 什么是斐波那契数列? 用递归推导Fibonacci 复杂度分析 用迭代推导Fibonacci 复杂度分析 递归优化:记忆化递归(Memoized Recursion) 复杂度分析 什么是斐波那契数列? 斐波那契数列(Fibonacci Seq…

ArcGIS Pro利用擦除工具,矢量要素消除另一矢量部分区域

选择“System Toolboxes”→“Analysis Tools.tbx”→“Overlay”→“Erase(擦除)”。 原始 擦除后

Linux: network: 性能 pause

最近看到一个问题,是关于网卡的throughput的性能问题,后来在ethtool-S里看到有pause的counter,这个也是网络性能问题的一个分析方向。算是学到了新的知识点。 $ grep -i -e 2025- -e pause ethtool*ens2f1np1 | grep -v -e ": 0\$" | headtail 4====

目标检测系列(五)已标注数据集(yolo格式)导入labelstudio继续标注

目录 1、labelstudio安装 2、yolo(txt)转json 3、COCO转yolo(仅针对coco格式标注信息) 4、设置环境变量并启动labelstudio 5、进入label studio创建工程并设置任务标签 6、安装http-server并启动文件映射服务 7、进入label studio导入json文件即可 1、labelstudio安装 …

pytorch底层原理学习--Libtorch

libtorch libtorch 是 PyTorch 的 C 实现版本,可以认为所有的pytorch底层都是由c实现,而pytorch的所有C实现就叫libtorch,也就是我们在pytorch官网getstart页面下载的cpytorch版本。我们用python写的pytorch神经网络代码都会通过pybind11将p…

TCP 三次握手协商 MSS 前,如何确定 MSS 值(附 Linux 内核源码)

文章目录 一、SYN总结影响 SYN MSS 的因素 二、SYNACK总结影响 SYNACK MSS 的因素 结合 Linux 内核源码 一、SYN 总结影响 SYN MSS 的因素 套接字选项 TCP_MAXSEG路由选项 advmss出口 MTU 减去 40(TCP 和 IP 的固定首部大小)IPV4_MAX_PMTU - 40(同上) 二、SYNACK 总结影响 SY…

扫描电子显微镜(SEM)夏令营面试基础题及答案

第二期表征问题SEM,后续会陆续更新其他表征 SEM和XRD一样,都是表征里面很常见的手段,基本上看论文这两个都是必不可少的 对于这部分内容,理解记忆>死记硬背,到时会问起来回答个大概就行, 像上…

Leetcode力扣解题记录--第49题(map)

题目链接:49. 字母异位词分组 - 力扣(LeetCode) 题目描述 给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 示例 1: 输入: strs ["eat", "tea", "tan", &quo…

AI赋能智慧餐饮:Spring Boot+大模型实战指南

⚡ 餐饮行业三大痛点 高峰期点餐拥堵:300人餐厅,15个服务员仍排长队 后厨浪费严重:食材损耗率高达25%,成本失控 顾客体验同质化:复购率不足30% 🚀 智慧餐饮解决方案架构 🔥 核心模块代码实现…

用鸿蒙打造真正的跨设备数据库:从零实现分布式存储

网罗开发 (小红书、快手、视频号同名) 大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等…

【Docker基础】Docker数据卷:数据卷的作用与使用场景

目录 1 Docker数据卷概述 1.1 什么是数据卷 1.2 数据卷的核心特性 3 数据卷与绑定挂载的对比 2.1 技术对比 2.2 选择建议 3 数据卷的核心作用 3.1 数据持久化 3.2 数据共享 3.3 备份与迁移 4 数据卷使用场景详解 4.1 数据库应用 4.2 日志集中管理 5 数据卷操作全…

安装GPU版本的Pytorch

前言 Pytorch是深度学习框架,在工作中我们一般是使用GPU版本的Pytorch,提高运行效率 安装GPU版本的Pytorch需要先安装CUDA和CUANN这两个GPU环境 如果准备安装GPU版本的Pytorch安装同志没有安装CUDA和CUANN,请看我上一篇文章 RTX5070显卡安装CUDA和CUDNN-CSDN博客 目录 安装…

微信小程序学习笔记

微信小程序学习笔记 一、文件和目录结构介绍 小程序包括:主体文件、页面文件 主体文件: app.js:小程序入口文件app.json:小程序的全局配置文件app.wxss:小程序的全局样式 页面文件:是每个页面所需的文…

抓包之通过wireshark抓ping包

写在前面 本文看下如何抓ping包。 1:正文 因为ping使用的是icmp协议,所以这里我们可以通过过滤icmp协议来进行抓包: 其中对于icmp请求报文状态码是8,如下: 响应状态码是0: 如下图是一个局域网环境中…

大文件分片上传 — nodejs

上传文件路由: var express require(express); var router express.Router(); const multer require(multer); const fs require(fs); const path require(path);// 确保上传目录存在 const uploadDir path.join(__dirname, ../backend/uploads); const temp…

HarmonyOS File和base64字符串转换

1. HarmonyOS File和base64字符串转换 1.1. Base64 1.1.1. Base64认知 Base64 是一种基于64个 ASCII 字符来表示二进制数据的表示方法,这个64个不同的字符为:   (1)大、小写字母(A– Z、a–z)。52个  …

【NodeJs】【npm】npm安装electron报错

解决问题 npm安装electron报错一般来说是镜像源的问题。 electron的镜像源与一般的 vue 之类的镜像源地址不一样需要单独配置。 npm读取的全局配置一般是在 C:\Users\{用户}\.npmrc 这个配置文件中。 如果你找不到你的配置文件可以执行如下命令, # 执行后会直接用txt打开你的…

植物small RNA靶基因预测软件,psRobot

psRoto软件安装 网址 http://omicslab.genetics.ac.cn/psRobot/downloads.php下载和安装 wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/psRobot_v1.2.tar.gz # tar -zxvf psRobot_v1.2.tar.gz # cd psRobot_v1.2 ## ./configure make make installpsRot…

翻译服务器

基于UDP编程博客里的回显服务器代码,翻译服务只需要改process方法即可 所以我们可以创建一个UdpDictServer直接继承UdpEchoServer然后重写process方法 在重写的方法中完成翻译的过程 代码: package network;import java.io.IOException; import java.net.SocketException; …

初等变换 线性代数

初等变换 介绍了三种初等变换的操作。 初等矩阵 初等矩阵是干嘛的呢?实际上初等矩阵就是我们矩阵的初等操作,每一个对矩阵的初等变换操作都相当于乘上一个初等矩阵。 左乘初等矩阵就相当于对行进行初等操作,右乘则相当于对列进行初等操作。…