2024 年,我们见证了人工智能创新的空前爆发。AI 的快速发展令很多人惊叹,为了训练更先进的大语言模型(LLM),科技巨头争相获取强大的 GPU。如今,AI 正在无缝融入我们世界的每个角落。

image.png

在众多新兴 AI 公司、模型和应用的浪潮中,有个趋势愈发清晰:AI 的重点正在从训练转向推理。彭博社预测,到 2032 年,AI 推理市场规模将增至 1.3 万亿美元,这一观点也得到了很多最新报告的支持。市场的这一变化表明,2025 年将成为加速分布式 AI 推理发展的关键一年。

“持续改进” 和 “不断适应” 的往复循环

尽管在打造强大 AI 模型的过程中,训练工作仍将发挥关键作用,但未来的重点将会是推理:即部署这些模型,进而为企业和消费者提供实时、可行的见解和结果。同时,通过从边缘设备将动态数据回馈至训练过程,推动模型持续改进与适应,形成一个不断优化的循环。

AI 推理的应用方式

AI 推理是人工智能从 “画在纸上的饼” 转变为实际应用并产生现实影响的关键环节。Akamai 的客户正在多个行业和应用场景中利用 AI 推理,包括:

  • 智慧城市: 优化交通流量以减少拥堵并提升安全性,通过智能监控改善公共安全。
  • 自动驾驶车辆: 实现瞬时决策,促进高效的车队编排。
  • 工业物联网与制造业: 实施预测性维护以防止停机,通过实时视频分析提升质量控制。
  • 智能零售: 提供个性化购物体验,并通过智能结账和库存管理优化运营。
  • 医疗与远程医疗: 实时监测患者健康状况,通过图像处理加速医学诊断,支持先进的可穿戴设备。
  • 媒体娱乐: 定制个性化内容,实现实时视频转码和直播增强。

这些示例只是客户借助 AI 推理所能实现的广泛应用的冰山一角。随着边缘计算不断发展,预计将在各个行业看到更多创新性的应用。

AI 推理的常见挑战

这种创新也带来了一些常见挑战,包括延迟、成本和可扩展性。多年来,Akamai 始终致力于解决这些问题。

将大量通用且性能过剩的 GPU 集中在数据中心的方式,已无法满足大众对高效 AI 推理的规模化和响应速度的需求。我们需要采用全新范式,使推理架构更贴近用户,也就是要通过分布式云模型来实现。

通过分布式云模型实现 AI 推理

在采用分布式云模型提供 AI 推理时,需要考虑一些独特因素,包括:

  • 延迟与响应速度:在集中式云数据中心之间传输数据会影响用户体验,并可能导致业务机会流失。去中心化的分布式架构则可提升推理响应速度。
  • 资源约束:边缘设备在功耗、存储和计算能力方面存在限制。因此无比要通过部署轻量化、更高效的 AI 模型来实现强大的性能。
  • 安全与数据隐私:本地数据处理可减少数据在传输过程中的暴露,从而增强安全性。这对医疗、金融和政府等需遵守严格数据本地化和隐私法规的行业尤为重要。
  • 可扩展性与分布式架构:随着托管 AI 应用的分布式位置数量增加,跨网络管理和更新 AI 模型的复杂性也随之上升。因此,必须要能提供可扩展的模型部署和维护解决方案。
  • 带宽与成本效益:去中心化 AI 推理可大幅减少传输至集中式云服务器的数据量,不仅能缓解网络拥堵,还能显著降低数据传输和存储成本。

这些因素是在分布式、去中心化云基础设施上部署 AI 时的关键考量,所有希望高效利用 AI 的企业都应重点关注。

image.png

Akamai 强大生态系统带来卓越的性能和可扩展性

Akamai 致力于构建全球分布的云。我们的全球基础设施经过近 30 年发展,已容纳超过 25 个核心计算区域、快速扩展的分布式计算位置,以及超过 4000 个边缘节点。这一强大生态系统已经为满足企业在当前和未来 AI 推理需求做好了准备。

我们意识到,尽管客户对高性能有很高需求,但他们也越来越担心传统云服务商常见的高额成本超支。Akamai 云旨在解决这一日益增长的问题。

我们并没有沿袭传统做法囤积昂贵的通用 GPU,这些 GPU 对 AI 推理任务来说往往过于强大。相反,我们为客户提供了一种平衡的 GPU 替代方案:Nvidia RTX 4000 Ada 系列 GPU。这些 GPU 兼具性能和成本效益,非常适合 AI 推理、运行小型语言模型以及处理像媒体转码这样的专用工作负载。

强大但不失成本效益的方法

这种方法使我们能将卓越的 AI 能力更贴近用户,同时保持对客户的成本效益。我们的测试显示,在运行生成式 AI 类 Stable Diffusion 模型时,与传统公有云服务商提供的同类 GPU 替代方案相比,我们的成本节省幅度超过了 80%。

相信这种方法能带来最强大且兼具成本效益的结果,并能够推动新的 AI 应用场景继续发展。

分布式推理是使用 AI 的全新构想

随着 AI 的实用性不断提升,Akamai 认为:分布式推理不仅仅是技术的进步,更是对 AI 使用方式的根本性重新构想。从集中的资源密集型计算转向更高效的分布式边缘计算,这一转变已经在不知不觉中开始了。

Akamai 不仅在观察这一变革,也在积极塑造这场变革。通过将遍布全球的分布式网络、战略性的云计算投资(包括围绕推理工作进行优化的 GPU)以及对性能和成本效益的深刻理解等因素紧密结合在一起,Akamai 正专注于帮助企业释放 AI 推理的真正潜力。

很多企业也已经意识到,对于采用 AI 推理这件事,真正的问题已经不再是 “是否”,而是 “如何”。边缘不再仅仅是数据的目的地,而是正成为 AI 提供最具影响力、实时见解的主要领域。欢迎进入计算的下一世代。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/91418.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/91418.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/91418.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里云 RabbitMQ 可观测性最佳实践

阿里云 RabbitMQ 阿里云 RabbitMQ 是一款高性能、高可靠的消息中间件,支持多种消息协议和丰富的功能特性。它提供消息队列功能,能够实现应用间的消息解耦和异步通信,提升系统扩展性和稳定性。其支持多种消息持久化策略,确保消息不…

vue-router 导航式编程 参数的设置

主要是想记录一下this.$router.push、replace、go等方法的参数如何设置。字符串路径router.push(/home)直接使用字符串(或模板字符串)路径,可跳转到相应的URL路径。对象式路径路径也可以是一个对象,对象里以key:value的形式表示UR…

Swift实现股票图:从基础到高级

目录一、核心实现方案1. 原生方案:使用 Core Graphics 绘制2. 使用第三方库:Charts3. 跨平台方案:使用 SwiftUI Canvas二、技术指标实现1. 移动平均线 (MA)2. 布林带 (Bollinger Bands)3. MACD (Moving Average Convergence Divergence)三、…

【unitrix】 6.4 数特征(number.rs)

一、源码 这段代码定义了一个名为Number的trait&#xff08;特质&#xff09;以及它的实现。 use crate::sealed::Sealed; use crate::number::{V, BaseNumber, TNumber};/// 数值的统一标记特质 /// 可以是编译时类型化数字(TNumber)或运行时变量(V<T>) pub trait Numbe…

AI治AI:大语言模型自检新法

“以火攻火”的思路解决大语言模型(LLMs)“幻觉”问题 虚构是由于与提示无关的内部因素而不可预测地从 LLM 中出现的幻觉。作者专注于衡量 LLM 对提示响应的不确定性,使用高不确定性表示虚构的假设。他们通过计算一个称为熵的量来估计这种不确定性**,熵可以被认为是模型生…

ESLint 配置错误:ReferenceError: prettier is not defined 解决方案

问题描述在使用 pnpm lint 运行 ESLint 时&#xff0c;出现以下错误&#xff1a;Oops! Something went wrong! :( ESLint: 9.31.0 ReferenceError: prettier is not defined该错误导致 ESLint 无法正确执行代码格式检查&#xff0c;但 不会影响项目的实际运行&#xff08;如 pn…

数据结构--准备知识

一.算法效率算法效率分为两种&#xff1a;第一种为时间效率&#xff0c;第二种为空间效率。时间效率称为时间复杂度&#xff0c;空间效率称为空间复杂度。时间复杂主要衡量一个算法的运行速度&#xff0c;空间复杂度主要衡量一个算法所需的 额外的空间&#xff08;现在不需要特…

HTML 入门教程:从零开始学习网页开发基础

一、HTML简介 1.1 什么是HTML&#xff1f; HTML全称是Hyper Text Markup Language&#xff08;超文本标记语言&#xff09;&#xff0c;由Tim Berners-Lee和同事Daniel W. Connolly于1990年创立。它是一种用于创建网页的标准标记语言&#xff0c;而不是编程语言。 1.2 HTML的…

使用 bat 批量创建带有项目前缀名的文件夹结构

在项目管理中&#xff0c;经常需要为每个新项目创建一套标准化的文件夹结构。如文档中所述&#xff0c;用户希望为每个项目&#xff08;如"Project 1"、“Project 2”&#xff09;创建以下结构的文件夹&#xff1a; project-1_export\project-1_DWG project-1_expo…

Python类中魔术方法(Magic Methods)完全指南:从入门到精通

文章目录Python类中魔术方法(Magic Methods)完全指南&#xff1a;从入门到精通一、魔术方法基础1. 什么是魔术方法&#xff1f;2. 魔术方法的特点二、常用魔术方法分类详解1. 对象创建与初始化2. 对象表示与字符串转换3. 比较运算符重载4. 算术运算符重载5. 容器类型模拟6. 上下…

H3CNE综合实验之五角星

H3CNE综合实验之五角星 实验拓扑图交换机地址规划表&#xff1a;SW6G1/0/1Vlan100:10.1.3.2/24G1/0/2Vlan90:10.1.4.2/24G1/0/3Vlan50:10.1.5.1/24G1/0/4Vlan60&#xff1a;10.1.6.1/24SW7G1/0/1Vlan50:10.1.5.2/24G1/0/2Vlan30:192.168.3.1/24G1/0/6Vlan70:10.1.1.2/24G1/0/3-…

Android EventBus使用方法与底层原理详解

EventBus 是什么&#xff1f; EventBus 是一个基于发布/订阅&#xff08;Publish/Subscribe&#xff09; 模式的开源库&#xff08;主要由 greenrobot 开发维护&#xff09;。它的核心目的是简化 Android 应用中不同组件&#xff08;如 Activity, Fragment, Service, Thread 等…

初等数论简明教程

初等数论简明教程 本文给出初等数论中的一些重要的定理与例题&#xff0c;证明风格采用 整除线法 与 命题节点法。 整除线法 指推理的第 nnn 步左边的字符可由前面左边的字符得到&#xff0c;右边的字符可由前面右边的字符得到&#xff0c;整除线变成了推理线&#xff0c;既少…

Spring之核心容器(IoC,DI,基本操作)详解

Spring之核心容器IoC/DI/基本操作详解一、核心概念&#xff1a;IoC与DI的本质1.1 IoC&#xff08;Inversion of Control&#xff0c;控制反转&#xff09;传统开发模式&#xff08;无IoC&#xff09;IoC模式&#xff08;Spring容器管理&#xff09;1.2 DI&#xff08;Dependenc…

【论文阅读】基于注意力机制的冥想脑电分类识别研究(2025)

基于注意力机制的冥想脑电分类识别研究&#x1f4a1; Meta DataTitle基于注意力机制的冥想脑电分类识别研究Authors周梓涵Pub. date2025&#x1f4dc; Research Background & Objective背景&#xff1a; 现代生活压力导致心理问题日益突出&#xff0c;冥想作为一种有效的心…

GitHub 上 Star 数量前 8 的开源 Web 应用项目

原文链接&#xff1a;https://www.nocobase.com/cn/blog/github-open-source-web-applications。 近期&#xff0c;我们发布了多篇「Top GitHub Star 开源项目推荐」系列文章&#xff0c;受到了大量点赞与收藏&#xff0c;很多开发者留言表示希望能看到更多不同领域的开源工具推…

FATFS文件系统原理及其移植详解

一、FATFS简介 FATFS 是一个完全免费开源的 FAT/exFAT 文件系统模块&#xff0c;专门为小型的嵌入式系统而设计。它完全用标准 C 语言&#xff08;ANSI C C89&#xff09;编写&#xff0c;所以具有良好的硬件平台独立性&#xff0c;只需做简单的修改就可以移植到 8051、PIC、A…

KubeRay 和 Ray

KubeRay 和 Ray 不是替代关系&#xff0c;而是互补的协作关系。两者在分布式计算生态中扮演不同角色&#xff0c;共同构成完整的云原生 AI 解决方案。以下是具体分析&#xff1a;&#x1f527; 1. 核心定位差异Ray 是分布式计算引擎&#xff0c;提供底层 API&#xff08;如 ray…

破解轮胎仓储高密度与柔性管理难题

轮胎作为特殊的大件异形工业品&#xff0c;其仓储管理长期面临多重挑战&#xff1a;规格型号繁杂导致SKU数量庞大&#xff0c;重型载重对货架承重提出极高要求&#xff0c;橡胶材质对防压变形、避光防老化等存储环境存在严苛标准。传统平置堆垛或普通货架方案不仅空间利用率不足…

EVA series系列(上)

目录 一、EVA 1、概述 2、方法 二、EVA-02 1、概述 2、架构 三、EVA-CLIP 1、概述 2、方法 四、EMU 1、概述 2、架构 3、训练细节 4、评估 一、EVA 1、概述 为探寻大规模表征学习任务的MIM预训练任务在ViT基础上扩展到1B参数量规模&#xff0c;结合10M级别&am…