2025 年 6 月 20 日,华为开发者大会 2025(HDC 2025)在东莞召开。华为常务董事、云计算 CEO 张平安宣布基于 CloudMatrix 384 超节点的新一代昇腾 AI 云服务全面上线,并发布盘古大模型 5.5,五大基础模型实现技术突破,同步披露农业、工业、智能驾驶等领域的落地实践。


新一代昇腾 AI 云服务:重构大模型算力底座

面对大模型对算力的爆发式需求,华为云新一代昇腾 AI 云服务以 CloudMatrix 384 超节点为核心,通过 MatrixLink 高速网络将 384 颗昇腾 NPU 与 192 颗鲲鹏 CPU 互联,构成超级 “AI 服务器”。单卡推理吞吐量达 2300 Tokens/s,较非超节点架构提升近 4 倍,算力有效使用率(MFU)提升 50% 以上。

该架构支持混合多专家 MoE 模型推理,实现 “一卡一专家” 的 384 路并行计算,同时可通过 “日推夜训” 灵活调度训推算力。在云数据中心,432 个超节点可级联成 16 万卡的超大集群,总算力规模达 300 PFLOPS。目前昇腾 AI 云服务已为科大讯飞、中科院等 1300 余家客户提供算力支持。

盘古大模型 5.5 升级:五大领域全面突破

自然语言处理(NLP)大模型推出 718B 深度思考 MoE 模型,含 256 个专家系统,在知识推理与数学能力上跻身业界第一梯队。其自适应快慢思考技术通过难度感知机制,使简单问题响应敏捷、复杂问题深度推理,整体推理效率提升 8 倍。例如,DeepDiver 技术可在 5 分钟内完成 10 跳以上复杂问答,生成万字专业报告。

面向企业,华为云提供基础模型、数据工程工具等六大能力,支持行业数据增训与微调。中国农业科学院基于盘古构建的农业科学发现大模型,已实现水稻株型改良,株高降低 25% 且抗倒伏能力提升。此外,医学、金融等五大行业 NLP 模型将于 6 月底上线。

多模态大模型发布 “世界模型”,为智能驾驶与具身机器人构建数字物理空间。广汽集团借助该模型实现 2D 视频与 3D 点云的像素级对应,数分钟内复原复杂场景,支撑智能驾驶模型 “两天一版本” 的迭代效率。配套发布的 CloudRobo 平台整合数据合成、仿真验证等能力,并提出机器人到云协议 R2C,推动行业标准化。

预测大模型采用 triplet transformer 架构,统一处理表格、时序、图像等多源数据,跨行业泛化能力显著提升。海螺水泥应用该模型实现熟料强度预测,添加固废降低成本;宝武钢铁高炉模型使铁水温度合格率超 90%,日省燃料 20 吨。

科学计算大模型与气象、能源领域深度结合。深圳气象局升级 “智霁” 模型实现区域集合预报,重庆气象局打造的 “天资・12h” 模型提升灾害预警能力;深圳能源通过大模型优化风光发电预测,提升能源调度效率。

计算机视觉(CV)大模型推出 300 亿参数 MoE 架构,支持图像、红外、激光点云等多维度感知。中国石油昆仑大模型攻克亚毫米级管道缺陷识别,效率提升 40%,人工强度降低 25%。


🌟 DMXAPI 全维度解决方案,重构 AI 开发体验 🌟

🚀 多模型集成:一个密钥开启全球智能生态
  • 只需1 个 API Key,即可无缝串联 GPT、Claude、Gemini、Llama 等全球顶尖大模型,打破技术壁垒与平台限制。
💰 财务合规:专业服务为商业落地护航
  • 企业级合规支持:无论是企业用户的项目采购,还是个人开发者的技术服务,均可提供正规发票,财务流程透明合规。

👉 登录 DMXAPI 官网,体验 “一个平台管理所有 AI 能力” 的高效与便捷!
点击链接:立即探索 DMXAPI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/88816.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/88816.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/88816.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Reactor Handle

handle 是 Reactor 中一个非常灵活的操作符,它允许你对每个源元素进行处理,并可以选择性地发出零个或多个元素。它既可以用于映射(map)也可以用于过滤(filter),因此可以看作是 map 和 filter 的…

C#哈希加密:原理、实现与应用

C#哈希加密:原理、实现与应用 在当今数字化时代,数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术,在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实…

httpbin.org是什么,有什么作用

httpbin.org 是一个开源的 HTTP 请求与响应测试服务,基于 Python 的 Flask 框架开发 它允许开发者发送各种 HTTP 请求,并返回请求的详细信息,便于调试和验证 HTTP 客户端的行为。以下是其核心功能和作用详解: 一、核心功能与作用…

mongodb生产备份工具PBM

如果你的 MongoDB 数据量特别大(例如几十 GB、TB 级别),普通的 mongodump/mongorestore 会显得缓慢且资源消耗大,不适合生产级别大数据集。下面是当前 MongoDB 社区和企业广泛使用的几种备份方案对比和推荐: 工具是否…

【LeetCode#第167题】两数之和Ⅱ

给你一个下标从 1 开始的整数数组 numbers &#xff0c;该数组已按 非递减顺序排列 &#xff0c;请你从数组中找出满足相加之和等于目标数 target 的两个数。如果设这两个数分别是 numbers[index1] 和 numbers[index2] &#xff0c;则 1 < index1 < index2 < numbers…

Python(一)实现一个爬取微信小程序数据的爬虫+工程化初步实践

文章目录 前言用Charles 抓包 iOS 微信小程序在Mac端和iOS端安装Charles 自签名证书Mac端iOS端 能抓到Safari浏览器的包但是抓不到微信小程序的包直接在iOS 上抓包的App如何抓取Android 7.0 以上/Harmony OS微信小程序包 Python 项目工程化pip 切换为国内镜像源工程化参考脚手架…

uview ui request get / post 传参含params和json数据的分析和使用

背景。单独写了controller方法去配合移动端的接口调用。但有的接口与pc端类似。于是进行了复用。但接口得复制不是。 uview js request 文档 注意迪三个参数是header 后端接口GET方法 调用代码截图 浏览器调试 总结。 复制之前的api接口。为了方便复用底层实现。接口类型…

用 pnpm + TurboRepo,构建多项目高效开发体系

在现代前端项目日益复杂的今天&#xff0c;我们越来越多地面对一个场景&#xff1a;多个项目共享逻辑、组件和依赖&#xff0c;而维护和构建效率却在不断拉垮。这种情况下&#xff0c;传统项目结构的痛点就显现无遗。 从我亲身实践来看&#xff0c;选择 pnpm TurboRepo 构建 …

Pytest 使用命令行参数执行指定环境的脚本—— Python 实践

&#x1f9fe; 一、项目背景 在自动化测试中&#xff0c;我们经常需要根据不同的运行环境&#xff08;如测试环境和生产环境&#xff09;来执行测试脚本。本文将详细介绍如何通过命令行参数来指定运行环境&#xff0c;并使用 Python 和 pytest 框架实现这一功能。 &#x1f6e…

利用可控验证码位数实现拒绝服务攻击(DoS)风险与线程模型分析

一、背景介绍&#xff1a;验证码接口中的潜在 DoS 漏洞 在渗透测试过程中&#xff0c;常见验证码接口支持传入“验证码位数”参数&#xff0c;表面看是业务可配置&#xff0c;实则若未做上限控制&#xff0c;极易成为资源消耗型 DoS 攻击入口。 &#x1f9ea; 测试场景&#…

Spring Cloud Feign 整合 Sentinel 实现服务降级与熔断保护

Spring Cloud Feign 整合 Sentinel 实现服务降级与熔断保护 在微服务架构中&#xff0c;服务之间的调用往往依赖 Feign&#xff0c;而服务调用的稳定性又至关重要。本文将介绍如何将 Feign 与 Sentinel 结合使用&#xff0c;实现服务的容错保护&#xff08;如降级与熔断&#…

宠物医院系统的设计与实现(springBoot版)

一、开题报告 一、本选题研究的意义和背景&#xff08;理论与现实意义&#xff09;&#xff1a; 背景&#xff1a;随着人们生活水平的提高&#xff0c;宠物饲养愈发普遍&#xff0c;宠物医院的需求也日益增长。挂号方式主要依赖现场挂号&#xff0c;导致宠物主人需要长时间排队…

SOCKSv5 协议通信的完整阶段与报文格式详解

SOCKSv5 协议的通信通常分为以下几个主要阶段&#xff1a; 方法协商阶段 (Method Negotiation)方法依赖的子协商阶段 (Method-Dependent Sub-negotiation) - 本例为用户名/密码认证请求发送阶段 (Request Sending)请求回复阶段 (Request Reply)数据传输阶段 (Data Transfer) …

​​Git提交代码Commit消息企业级规范

​​Git Commit 类型完整指南​​ 类型用途示例​​feat​​新增功能&#xff08;面向用户的功能性变更&#xff09;git commit -m "feat: 添加用户登录功能"​​fix​​修复 Bug&#xff08;解决代码中的问题&#xff09;git commit -m "fix: 修复首页加载崩溃…

TiDB AUTO_RANDOM 超大主键前端精度丢失排查:JavaScript Number 限制与解决方案

前端长整型主键“失踪”记 ——一次 ArrayIndexOutOfBoundsException 的排查全过程 一、事故现场 最近在维护 SMS-OFFICE 后台系统时&#xff0c;运维同事反馈&#xff1a; 点击「短信详情」或「邮箱账号详情」时&#xff0c;偶尔弹窗空白、日志报错&#xff1a; java.lang.A…

在postgresql使用mybatis动态创建数据库分区表

在postgresql使用mybatis动态创建数据库分区表 1. 整体描述2. 前期准备2.1 创建主表语句2.2 创建分表语句2.3 xxl-job 3. 代码实现3.1 mapper.xml层3.2 mapper.java层3.3 service接口层3.4 service实现层3.5 controller层 4. 总结 1. 整体描述 在java下实现&#xff1a;创建分…

Python网安-zip文件暴力破解

目录 源码在这里 需要的模块 准备一个密码本和需要破解的ZIP文件 一行一行地从密码文件中读取每个密码。 核心部分 注意&#xff0c;需要修改上段代码注释里的这段具有编码问题的代码&#xff1a; 源码在这里 https://github.com/Wist-fully/Attack/tree/cracker 需要的…

聊聊Golang开发工程师

诞生背景 Go由Google三位顶尖工程师&#xff08;Ken Thompson、Rob Pike、Robert Griesemer&#xff09;设计&#xff0c;目标是解决两大行业痛点&#xff1a; 硬件利用率不足&#xff1a;多核CPU普及&#xff0c;但C/C等语言难以高效利用并发能力&#xff1b; 开发效率低下&a…

机器学习6——线性分类函数

线性分类函数 分类问题的两种决策方法&#xff1a; 概率方法&#xff1a;通过计算后验概率进行分类。优点是在概率分布已知的情况下可以得到最优解&#xff0c;缺点是实际中概率密度通常未知&#xff0c;需要通过大量数据估计。判别方法&#xff1a;假设判别函数的形式已知&…

Sentinel(三):Sentinel熔断降级

一、Sentinel熔断概念介绍 官方文档网址&#xff1a;circuit-breaking | Sentinel 1、Sentinel熔断基本介绍 除了流量控制以外&#xff0c;对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措 施之一。一个服务常常会调用别的模块&#xff0c;可能是另外的一个远程服…