在大模型技术迅猛发展的今天,AI 正深度重塑数据基础设施,推动其向智能化快速演进。如何将 AI 深度融入数据管理,释放数据的潜在价值、提升运营效率,成为企业在构建 AI 驱动的数据资产管理体系的核心问题。

在近期举办的“DataFun AI+BI智能驱动峰会”上,腾讯游戏公共数据平台部专家戴诗峰分享了腾讯游戏在AI驱动下进行数据基础设施智能化革新的实践。他围绕腾讯游戏数据发展背景、AI驱动的资产体系重塑、智能湖仓架构建设以及AI智能场景应用探索四大核心议题,展示了如何通过“人+AI”双引擎模式,驱动游戏业务的智能化升级,开启数据治理的新篇章。

腾讯游戏数据发展的三阶段

戴诗峰回顾了腾讯游戏数据的二十年历程,将其数据能力演进划分为三个阶段。在早期的端游时代,腾讯游戏的数据体系主要围绕统一日志结构搭建,针对不同游戏需求进行逐一定制(CaseByCase)。这种方式虽然支撑了基础运营分析,但数据资产缺乏沉淀,新需求响应依赖人工,效率较低。随着2015年前后移动游戏的爆发,数据中台模式应运而生,腾讯游戏将分散的日志加工成可复用的指标、画像、模型等标准资产,涵盖了更广泛的用户生命周期运营、精细化营销等需求。

当下,游戏行业正迎来AI赋能的转折点。2020年起,腾讯游戏开始打造"能被大模型理解的数据资产",通过血缘染色、智能标注等技术让 AI 解析资产含义,同时在前端探索搭建统一自助服务门户,整合数据探索平台与LLM集成应用,使得90%的业务需求无需人工开发,推动数据从 “技术专属” 真正走向 “业务自助”。

AI时代数据技术的核心要求

戴诗峰强调,在数据框架演进至优化阶段,数据技术体系需围绕 “数据 AI 化内核、湖仓一体基座、业务自助化界面” 三大核心构建,才能实现从 “数据石油” 到 “智能汽油” 的转化。

首先,数据 AI 化内核要求资产既能被人工理解,也能被 AI 理解。腾讯游戏通过原始数据的血缘染色和智能化标注,结合本地化资产模型训练,建立起持续运营机制。其次,湖仓一体基座则需应对 PB 级训练数据的成本与性能挑战,统一管理结构化(如运营数据)与非结构化数据(如游戏语音、图片),实现流批一体化计算,让实时与离线数据能被统一访问。最后,业务自助化界面则聚焦降低使用门槛,支持自然语言查询生成报表、基于角色推荐数据集、无代码生成预警规则等,让业务人员直接 “用数据说话”。

基于AI的智能资产中台构建

戴诗峰指出,面对传统数据中台的“新需求响应滞后、业务难访问明细数据、存储成本高企”这三大痛点,腾讯游戏通过构建智能资产中台实现突破,核心是 “双目标驱动 + 知识图谱闭环”。

双目标驱动以 “资产复用率” 为北极星指标,通过本地化评价模型提升 AI 对资产的理解准确率,同时要求大模型覆盖 100% 数据开发场景、业务自助需求满足率超 90%。知识图谱闭环将资产分为基础资产(人工可理解)与优质资产(人机双理解),通过特征聚类、血缘分析关联数据链路与业务标签,目前已覆盖 5500 + 资产表、10W + 数据列,资产推荐 TOP3 准确度达 95.3%。

值得注意的是,在智能资产中台里,“让 AI 理解资产”并不是模糊的概念。为保障资产体系持续迭代,腾讯游戏还构建了十一步资产建设与应用闭环,涵盖从资产规范定义、候选资产生成到需求匹配、模型认证、图谱构建,再到应用反馈与资产下架的完整生命周期。通过持续评估模型理解准确率并调优,确保整个资产体系能够动态进化。

智能湖仓架构的建设与升级

任何上层应用的突破,都离不开底层架构的支撑。腾讯游戏的数据架构伴随着业务发展不断升级,从2010年分散的关系型数据库体系,到2015年引入Hadoop,但仍存在离线和实时数据壁垒的大数据架构,最终在2022年启动、2023年完成全部业务迁移至湖仓一体架构,实现了数据管理效率与业务支撑能力的跃升。

湖仓架构的核心价值在于打破数据湖与数据仓库的界限,通过统一平台管理数据,引入弹性伸缩计算和运营托管等机制,具备支持事务(确保数据一致性)、统一管理异构数据、兼容 BI 工具访问、打通端到端数据流、保持开放性、适配多场景等七大核心特性。

戴诗峰提到,湖仓架构设计围绕 “随需而动、丰俭由人、资产自治” 三个原则。“随需而动” 即技术服务于业务需求,如线上活动、高时效性场景需要实时数据才搭建实时链路;“丰俭由人” 是指不同业务根据自身情况选择,预算足、追求速度的业务将数据放 “仓” 里,对时效要求不高的业务直接用工具访问 “湖”,业务可自主选择计算加速层和引擎层的使用方式;“资产自治” 则实现资产自治理,高频有价值的资产自动沉淀优化,低频无效资产自动降级释放资源,无需人工持续干预,有效提升资源利用效率。这三个原则共同确保了湖仓架构既能精准匹配业务需求,又能实现资源利用效率的最大化。

这种架构带来的业务价值是立竿见影的。目前腾讯游戏基于湖仓架构实现了业务支撑能力的双重跃升:在交付模式上,过去冗长的需求流程被依托湖仓动态资产和AI能力的快速交付所取代。在数据时效上,实现了日志接入即实时化,湖中数据保持实时可用,有力支撑了前端资产和看板的实时更新,为业务决策提供了更及时的依据。

AI在数据场景的应用探索

在智能资产体系与湖仓架构支撑下,AI 已深度融入数据服务全场景,形成分层化的应用体系。

戴诗峰认为,最基础的业务应用是经营分析可视化。当前团队投入精力最多的是精细化运营场景,业务人员常常需要在查看报表后进行更灵活的动态分析(如对比新老活动数据),这高度依赖明细数据的提取能力,腾讯游戏正借助流式计算和湖仓架构来加速响应。而辅助决策等更高级场景,虽AI有潜力,但目前受限于稳定性和知识理解深度,仍需以预研探索为主,现阶段的核心仍聚焦于提升精细化运营的效率。

在精细化运营场景中,数据提取并非简单的 Text-to-SQL 过程,而是需要一整套的工程化平台支撑。从需求拆解、资产探查、SQL 生成,到批量跑数、结果验证,整个过程并非“需求→结果”的直线,而是靠工程化平台串联“找数据、写逻辑、跑任务、验结果”等环节,实现高效支撑精细化运营,让业务及时拿到所需数据。

在数据底座、资产及领域模型支撑下,Text-to-SQL只是起点,还可延伸出 Text-to-DSL,覆盖智能问答等场景,形成一个价值闭环。需求拆解和生成过程中沉淀的新特征或口径,会被反馈回资产建设体系,或成为个人特征,或升级进入公共资产目录,不断丰富知识库,反哺后续的需求理解和应用深化,推动业务与资产体系迭代,让数据应用更深入、高效。

结语

腾讯游戏通过AI驱动的数据新基建,实现了从"数据石油"到"智能汽油"的转化。未来,团队将持续深化资产体系与湖仓架构的智能化融合,积极探索AI在实时场景的创新应用,如实时玩家情感分析、自动化运营策略生成等,为游戏业务创新注入源源不断的智能动力。

书籍推荐

《大模型工程化:AI驱动下的数据体系》是腾讯游戏数据团队基于多年游戏数据工作的实践经验,发布的技术专著。该书深入讲解了大模型技术的发展、应用及工程化原理,并特别聚焦于游戏领域的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/917364.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/917364.shtml
英文地址,请注明出处:http://en.pswp.cn/news/917364.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu 系统风扇控制软件 CoolerControl

背景 A6000显卡的温度一直都是86度左右,GPU的风扇转速不够大。 我首先把 nvidia的驱动更新了,但是发现风扇依然依然保持在较低的转速。 后面无意间搜到了CoolerControl 这个linux平台的风扇控制软件。设置之后,增加了风扇的转速,…

Oracle 11gR2 Clusterware应知应会

Oracle 11gR2 Clusterware应知应会 关键特性 启动顺序 日志路径 资源状态 资源管理 关键特性 📖 Oracle 11gR2 Clusterware的一些关键特性如下: 在安装运行11gR2的Real Application Clusters数据库之前需要先安装11gR2 Clusterware。 GRID home包括Oracle Clusterware和AS…

微信小程序苹果手机和安卓,怎么做适配

1. 基于 rpx 单位进行布局适配微信小程序采用 rpx 作为尺寸单位,以实现不同设备的布局适配。小程序的屏幕宽度固定为 750rpx,在不同设备上通过动态计算 1rpx 对应的像素值进行适配。例如,在 iPhone 6 中,屏幕宽度为 375px&#xf…

XGBoost三部曲:XGBoost参数详解

之前已经介绍了XGBoost三部曲:XGBoost原理。本文详细介绍XGBoost参数,让大家在使用XGBoost的过程中能得心应手。后续会更新XGBoost实战,敬请期待。 文章目录 一、核心概念回顾 二、XGBoost算法参数整体介绍 1 原生接口和Scikit-learn接口的区别 2 参数分类详解 三、核心Boos…

【python】转移本地安装的python包

我们现在需要将某个环境已经安装的 python 包离线传递到另外一个环境,且确保这种安装行为最终不需要对 PYPI 中央仓库的有效连接,也能完成。下面给出两种办法: docker container 如果你的 python 环境位于某个容器内,那最好的办法…

TGD第十篇:当神经网络遇到TGD特征

目录一、实验背景二、实验设置三、实验结果和分析四、结语TGD 是我们定义的一种新的“变化率表征”,对连续函数而言是一种新的“广义导数”,对离散序列而言是一种新的差分。TGD 是一个名字,一个代号。在基于 TGD 的图像边缘检测以及视频边缘检…

FreeRTOS源码分析二:task启动(RISCV架构)

系列文章目录 FreeRTOS源码分析一:task创建(RISCV架构) 文章目录系列文章目录前言vTaskStartScheduler 调度器启动函数xPortStartScheduler架构特定调度器启动函数vPortSetupTimerInterrupt启动 RISCV 定时器中断xPortStartFirstTask启动第一…

Python编程基础与实践:Python基础运算符与表达式入门

Python运算符与表达式实战 学习目标 通过本课程的学习,学员可以掌握Python中算术运算符、比较运算符、逻辑运算符及赋值运算符的使用方法,并能够构建简单的表达式来解决实际问题。 相关知识点 Python运算符与表达式 学习内容 1 Python运算符与表达式 1.1…

Git下载全攻略(未更新完)

一、在 Windows 上安装 Git​ ​​​ 1.1 下载安装包​ 官方版本可在 Git 官方网站下载,打开Redirecting…,下载会自动开始。此安装包来自名为 Git for Windows 的项目(也称作 msysGit),它与 Git 本身是相互独立的项目,更多相关信息可访问Redirecting Git for Windows…

rocky\centos安装docker镜像的命令

1.安装依赖: sudo yum install -y yum-utils device-mapper-persistent-data lvm22. 选择仓库源: sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo阿里源: sudo yum-config-manager --add-r…

扣子,正式拥抱开源!

资料来源:火山引擎-开发者社区 扣子 是新一代 AI Agent 平台,旗下有四款子产品:「扣子空间」、「扣子开发平台」、「扣子罗盘」 及 Eino 。 我们始终坚信,AI Agent 的未来属于每一位开发者和创造者。为了让前沿的 AI 技术能够更快…

Git 各场景使用方法总结

以下是对 Git 各场景使用方法的全面总结,涵盖 20+ 核心场景和 100+ 命令,包含详细参数、使用示例及原理说明: 一、基础操作场景 1. 仓库初始化 # 本地初始化 git init git init --bare # 创建裸仓库(无工作区) git init -b main # 指…

国际标准组织共聚,智源推动全球AI开源与国际标准双轮驱动人工智能普惠化发展

7 月 26 日,人工智能标准化国际合作论坛在上海召开。该论坛由联合国工业发展组织全球工业人工智能联盟卓越中心主办,中国电子技术标准化研究院、上海人工智能研究院承办,工业和信息化部副部长单忠德、国家市场监督管理总局标准创新管理司司长…

《安富莱嵌入式周报》第356期:H7-TOOL的250M示波器模组批量生产中,自主开发QDD执行器,开源14bit任意波形发生器(2025-07-28)

周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版 《安富莱嵌入式周报》第356期:H7-TOOL的250M示波器模组批量生产中,自主开发QDD执行器&a…

大模型学习专栏-导航页

概要 本专栏是小编系统性调研大模型过程中沉淀的知识结晶,涵盖技术原理、实践应用、前沿动态等多维度内容。为助力读者高效学习,特整理此导航页,以清晰脉络串联核心知识点,搭建起系统的大模型学习框架,助您循序渐进掌握…

leetcode热题——组合

组合题目描述给定两个整数 n 和 k,返回范围 [1, n] 中所有可能的 k 个数的组合。你可以按 任何顺序 返回答案。示例 1: 输入:n 4, k 2 输出: [ [2,4], [3,4], [2,3], [1,2], [1,3], [1,4] ]示例 2: 输入:…

暑期算法训练.13

目录 57 力扣14最长公共前缀 57.1 题目解析: 57.2 算法思路 57.3 代码演示: ​编辑 57.4 总结反思: 58 力扣 5最长回文字符串 58.1 题目解析: ​编辑 58.2 算法思路: 58.3 代码演示: ​编辑 …

四、Portainer图形化管理实战与Docker镜像原理

作者:IvanCodes 日期:2025年8月2日 专栏:Docker教程 一、Portainer 安装与基础使用教程 Portainer 是一个轻量级、功能强大的Docker图形化管理界面 (GUI)。它能让你通过简单的Web界面来管理和监控你的Docker容器、镜像、卷、网络等资源&…

网络爬虫(python)入门

一、网络爬虫介绍 网络爬虫(Web Crawler)是一种自动抓取互联网信息的程序,它能够高效地从海量网页中提取有价值的数据。作为数据采集的利器,爬虫技术在数据分析、搜索引擎、价格监控等领域有着广泛应用。本文将带你全面了解Pytho…

如何解决pip安装报错ModuleNotFoundError: No module named ‘plotnine’问题

【Python系列Bug修复PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘plotnine’问题 一、摘要 在使用 PyCharm 进行 Python 开发时,常常需要通过 pip install 安装第三方包。某天,你在终端或 PyCharm 控制…