一、研究背景与概述

在当今数字化转型加速的背景下,人工智能技术正深刻改变企业协作与沟通方式。作为全球领先的视频会议平台,Zoom 已从单纯的通信工具转型为全面的生产力平台,而其 AI 技术架构是这一转变的核心驱动力。本报告将深入分析 Zoom 的 AI 技术架构,特别是其创新性的联合式 AI 方法、模型组合策略以及多模态集成技术,揭示 Zoom 如何通过技术创新实现高效、安全且经济的 AI 服务。

Zoom 采用联合式 AI 架构,整合了多种大型语言模型 (LLMs) 与其自有的小型语言模型 (SLMs),这种独特方法使其能够在保持高质量输出的同时显著降低成本。2023 年 11 月,Zoom 的联合式 AI 方法已实现接近 OpenAI GPT-4 的质量水平,而推理成本仅为后者的 6%。到 2025 年,Zoom 进一步优化了其 AI 质量,在最受欢迎的会议功能上,Zoom AI Companion 的相对误差比 GPT-4 降低了 20%(会议摘要 "重述") 和 60%(会议 "下一步行动")。

本研究将从技术架构、模型组合、工作流程、多语言处理、安全隐私保护等多个维度,全面剖析 Zoom 的 AI 技术体系,为理解现代企业级 AI 应用提供深度洞察。

二、联合式 AI 架构核心设计

2.1 联合式架构的基本原理

Zoom 的联合式 AI架构是一种创新的分布式 AI 系统设计,它允许多个不同的 AI 模型协同工作,以实现比单一模型更高的性能和效率。与传统的集中式 AI 架构不同,联合式架构能够动态整合多个模型的优势,同时避免了对单一模型的依赖。

"Zoom 的联合式 AI 方法在用户最需要的地方更有效。"Zoom首席技术官黄学东在 2025 年 2 月的更新中强调," 通过这种方法,我们可以提供高质量的 AI 体验,特别是在会议摘要和下一步行动等关键功能上。"

联合式架构的核心优势在于:

  1. 质量提升:通过模型间的协作,联合式架构能够生成比单一模型更准确、更全面的结果。
  2. 成本优化:智能选择最适合特定任务的模型,避免了总是使用最高成本模型的浪费。
  3. 灵活性与适应性:能够根据任务需求和环境变化动态调整模型组合。
  4. 可靠性增强:多模型的冗余设计提高了系统的容错能力和稳定性。

2.2 联合式架构的实现方式

Zoom 联合式 AI 架构的实现主要通过以下几个关键组件:

  1. 模型组合策略:Zoom 整合了多种闭源和开源的高级大型语言模型 (LLMs),包括其自研的 Zoom LLM 以及第三方模型如 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2。这种组合策略使 Zoom 能够利用不同模型的独特优势,避免了对特定 LLM 的依赖,这与微软 Copilot 依赖 GPT-4、谷歌依赖 Gemini 等竞争对手形成鲜明对比。
  2. Z 评分器 (Z-scorer) 评估机制:Zoom 开发了专有的 Z评分器来评判 AI 生成结果的质量。首先使用适合任务的低成本 LLM 完成任务,然后通过 Z 评分器评估初始任务完成质量。如果需要,系统会使用更高级的 LLM 对初始结果进行增强,类似于一个高效团队协作产生高质量产品的方式。
  3. 联合强化学习:为了更好地与人类偏好对齐,Zoom 改进了联合强化学习技术。通过将 Zoom LLM 与一组互补的 LLMs 联合使用,Zoom 的会议摘要功能现在能够提供高质量的结果,根据最近的基准测试,其性能甚至可以超过用于微软 Teams 中 Copilot 的 GPT-4。
  4. 多模型委员会机制:为了减少大多数 LLM 中固有的偏见,Zoom 组建了一个由多个 LLM (如 Claude-3、Gemini 和 GPT-4) 组成的委员会,以减少幻觉并改进 Zoom LLM。不同的 LLM 不太可能犯相同的幻觉错误,因此可以得出更一致的响应并减少异常值的影响。

这种联合式架构使 Zoom 能够为客户提供高质量的体验,特别是在其最受欢迎的功能上。根据内部基准测试,Zoom 的 AI Companion 在会议摘要和下一步行动方面的表现已经超越了 GPT-4。

三、模型组合策略:小模型与大模型协同

3.1 Zoom 的混合模型架构

Zoom 采用了一种独特的混合 AI 模型架构,结合了 "云端大模型 + 边缘小模型" 的策略,既兼顾了推理效率又保护了数据隐私。这种架构设计与行业内通常从大模型提取小模型的做法截然不同,Zoom 选择了从零开始构建其 20 亿参数的小型语言模型 (SLM)。

定制化小型语言模型:Zoom 的小型语言模型 (SLM) 是其 AI 架构的核心组件。黄学东指出,定制化的小模型在特定领域中的表现显著优于通用模型,成为开发智能代理工作流程的核心。这种方法使 Zoom 能够针对特定任务优化模型性能,同时降低计算资源需求。

多模型协同工作:Zoom 并没有依赖单一的大语言模型,而是采取了一种联合方法,结合多个通用大语言模型和自己定制的小语言模型。在技术架构方面,Zoom 引入了 20 亿参数的小语言模型,这一举措与行业通常的从大模型提取小模型的做法截然不同。

大模型与小模型的协同机制:当智能代理 AI 处理输入内容时,首先利用自家定制的小型语言模型进行初步分析,然后再将结果传递给更为强大的语言模型,以生成最终输出。这一过程不仅提高了反应速度,也确保了内容的高质量。

3.2 模型组合的优势与创新

Zoom 的模型组合策略带来了多项技术优势:

  1. 性能与成本的平衡:通过首先使用适合任务的低成本 LLM 完成任务,Zoom 能够在保持高质量输出的同时显著降低成本。根据内部测试,Zoom 的联合式 AI 方法在 2023 年 11 月就已实现接近 OpenAI GPT-4 的质量水平,而推理成本仅为后者的 6%。到 2025 年,这一优势进一步扩大,特别是在会议摘要的 "下一步行动" 功能上,相对误差降低了 60%。
  2. 适应性与灵活性:Zoom 的联合式架构可以整合来自合作伙伴的更新、更先进的 LLM 技术,如 OpenAI 的 GPT-4 Turbo,而无需对整个系统进行大规模重构。这种灵活性使 Zoom 能够快速采用新技术,同时保持系统的稳定性和兼容性。
  3. 特定领域性能优化:Zoom 的小型语言模型是针对特定领域任务优化的,如会议摘要、实时转录和智能回复等功能。这种定制化方法使模型在特定任务上的表现显著优于通用大模型,提高了整体系统的效率和准确性。
  4. 资源高效利用:通过动态分配不同复杂度的任务给相应的模型,Zoom实现了计算资源的高效利用。简单任务由轻量级模型处理,复杂任务则由更强大的模型处理,这种资源分配策略最大化了系统的吞吐量和响应速度。

四、Z 评分器机制与任务优化流程

4.1 Z 评分器的技术原理

Z 评分器是 Zoom AI 技术架构中的关键组件,用于评估 AI 生成结果的质量并指导后续优化过程。这一机制的设计灵感来源于统计学中的 Z 分数概念,用于衡量数据点与平均值的偏离程度。</

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921409.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921409.shtml
英文地址,请注明出处:http://en.pswp.cn/news/921409.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

排序-快速排序 O(n log n)

快排&#xff1a;1、设定一个中间值 q[ lr >>1 ] , 让左右区间来比较2、左边通过 i 依次比较&#xff0c;如果比这个中间值小&#xff0c;就继续 , 直到不符合3、右边通过 j-- 依次比较&#xff0c;如果比这个中间值大&#xff0c;就继续 &#xff0c;直到不符合4、两边…

【Proteus仿真】定时器控制系列仿真——LED小灯闪烁/流水灯/LED灯带控制/LED小灯实现二进制

目录 0案例视频效果展示 0.1例子1&#xff1a;基于AT89C51单片机的定时器控制小灯闪烁 0.2例子2&#xff1a;基于AT89C51单片机的定时器T0流水灯 0.3例子3&#xff1a;基于AT89C51单片机的定时器控制LED灯带 0.4例子4&#xff1a;基于AT89C51单片机的定时器控制LED闪烁 0…

进阶向:密码生成与管理工具

密码生成与管理工具&#xff1a;从零开始的完全指南在现代数字生活中&#xff0c;密码是保护个人信息和账户安全的第一道防线。随着网络服务的普及&#xff0c;每个人平均需要管理数十个不同账户的密码。一个强大且独特的密码通常应包含12个以上字符&#xff0c;混合大小写字母…

解决 Gitee 中 git push 因邮箱隐私设置导致的失败问题

解决 Gitee 中 git push 因邮箱隐私设置导致的失败问题 在使用 Git 向 Gitee 远程仓库推送代码时&#xff0c;可能会遇到因邮箱隐私设置引发的 git push 失败情况。最近我就碰到了&#xff0c;现在把问题现象、原因和解决方法分享出来。 一、错误现象 执行 git push -u origin …

Flutter的三棵树

“三棵树”是 Flutter 渲染和构建UI的核心机制&#xff0c;理解它们对于掌握 Flutter 至关重要。这三棵树分别是&#xff1a; Widget 树 Element 树 RenderObject 树 它们协同工作&#xff0c;以实现 Flutter 的高性能渲染和高效的响应式编程模型。 Flutter 是声明式的UI&…

同一台nginx中配置多个前端项目的三种方式

目录 第一种方式:配置多个二级域名 第二种方式:配置端口转发(不推荐) 第三种方式:同一个server中基于location配置(重点讲解) 第一种方式:配置多个二级域名 一个域名下面申请多个二级域名,每个二级域名配置一个vue前端项目,这个很好配置,在这里不再详细说明。 …

第二家公司虽然用PowerBI ,可能更适合用以前的QuickBI

第二家公司虽然用PowerBI &#xff0c;可能更适合用以前的QuickBI现在回想一下&#xff0c;第二家公司数据源是MySQL &#xff0c;常规报表是用excel报表&#xff0c;另外还做了一张能发布到web的看板供运营使用。基于基本情况&#xff0c;quickbi 的早期版本是合适的&#xff…

STM32 USBx Device HID standalone 移植示例 LAT1466

关键字&#xff1a;USBx&#xff0c; Device, HID&#xff0c;standalone 1.设计目的 目前 USBx Device standalone 的官方示例较少&#xff0c;不过使用 STM32CubeMX 可以快速地生成 USBx Device 相关类的示例工程&#xff0c;会很方便大家的开发。这里以 NUCLEO-H563 为例&…

python创建并写入excel文件

大家好&#xff0c;这里是七七&#xff0c;今天来跟大家分享一个python创建并写入一个excel文件的小例子&#xff0c;话不多说&#xff0c;开始介绍。首先我们来看一下这一小段代码。import openpyxl# 创建一个新的 Excel 工作簿workbook openpyxl.Workbook()# 获取当前活动的…

react native 出现 FATAL EXCEPTION: OkHttp Dispatcher

react native 出现 FATAL EXCEPTION: OkHttp Dispatcher 报错信息FATAL EXCEPTION: OkHttp DispatcherProcess: , PID: 8868java.lang.NoSuchMethodError: No virtual method toString(Z)Ljava/lang/String; in class Lokhttp3/Cookie; or its super classes (declaration of o…

sentinel实现控制台与nacos数据双向绑定

有两种方式可以实现&#xff1a;Springboot客户端做相应配置&#xff08;推荐&#xff09;修改sentinel-dashboard的源码一、Springboot客户端做相应配置&#xff08;推荐&#xff09;1、添加依赖<dependency><groupId>com.alibaba.csp</groupId><artifac…

Kubernetes (k8s)

Kubernetes (k8s) 以下是一份 ​Kubernetes (k8s) 基础使用教程&#xff0c;涵盖从环境搭建到核心操作的完整流程&#xff0c;附详细命令和示例&#xff1a; &#x1f680; ​一、环境准备&#xff08;3种方式&#xff09;​​ ​1. 本地开发环境&#xff08;推荐&#xff09;​…

三打ANSYS HFSS

2. 激励方式&#xff08;端口&#xff09;详细对比分析在HFSS中&#xff0c;“激励方式”和“端口”这两个词经常混用&#xff0c;但严格来说&#xff0c;“端口”是实现“激励”的一种最主要的方式。端口类型工作原理适用情况优点缺点波端口 (Wave Port)默认首选。计算端口的固…

3.python——数据类型转换

python的数据类型转换分为两种&#xff1a; 隐式转换&#xff1a;自动完成 显式转换&#xff1a;用类型函数转换 隐式转换 # 自动转为浮点数 num_int 123 num_flo 1.23num_new num_int num_flo显式转换 整型 x int(1) # x 输出结果为 1 y int(2.8) # y 输出结果为 2 z …

迅为RK3568开发板OpenHarmonyv3.2-Beta4版本测试-命令终端

将串口连接到开发板的调试串口&#xff0c;进入 OpenHarmony 系统后&#xff0c;会自动进入 OpenHarmony终端&#xff0c;如下图所示&#xff1a;

【面试题】介绍一下BERT和GPT的训练方式区别?

BERT(双向编码器): 预训练任务: 掩码语言模型(MLM):随机掩盖15%的token,其中: 80%替换为[MASK] 10%替换为随机token 10%保持原样 下一句预测(NSP):判断两个句子是否连续(后续版本已移除) 训练特点: 使用双向Transformer编码器 同时利用左右上下文信息 适合理解类任…

邪修实战系列(1)

1、第一阶段邪修实战总览&#xff08;9.1-9.30&#xff09; 把第一阶段&#xff08;基础夯实期&#xff09;的学习计划拆解成极具操作性的每日行动方案。这个计划充分利用我“在职学习”的特殊优势&#xff0c;强调“用输出倒逼输入”&#xff0c;确保每一分钟的学习都直接服务…

XR数字融合工作站打造智能制造专业学习新范式

智能制造是工业4.0的核心发展方向&#xff0c;涵盖数字化设计、智能生产、工业机器人、数字孪生、物联网等关键技术。然而&#xff0c;传统教学模式在设备成本高、实训风险大、抽象概念难理解等方面存在诸多挑战。XR数字融合工作站,利用VR/AR/MR等技术&#xff0c;通过虚拟仿真…

基于FPGA实现数字QAM调制系统

基于FPGA实现数字QAM调制系统题目要求一、代码设计1.顶层2.分频3.m序列4.串转并5.映射6.正弦波余弦波生成ROM和7.ask二、仿真波形总结题目要求 FPGA实现数字QAM调制系统要求根据正交振幅调制原理&#xff0c;利用正弦载波信号发生器&#xff0c;实现调制信号。调制原理会利用到…

DAY 22 复习日

浙大疏锦行复习日 仔细回顾一下之前21天的内容&#xff0c;没跟上进度的同学补一下进度。 作业&#xff1a; 自行学习参考如何使用kaggle平台&#xff0c;写下使用注意点&#xff0c;并对下述比赛提交代码 导入需要的库 import pandas as pd # 用于数据处理和分析&#xff0c;…