1. 论文地址
Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models
2. 中文:
Think in Games:做一个在王者荣耀中会玩和思考的Agent
3. 我记得几年前,相关文章还是使用dqn算法。玩雅利达小游戏,冒险岛,flybird, 单机枪战。目前llm做到了下一步决策 文字版,感觉还差实时操作英雄,实时决策 + 实时指令
3.1玩游戏拆解步骤即:
a. 实时理解游戏当前环境,英雄角色,英雄状态
b. 根据当前状态感知,生成英雄指令
c. 指令下发操作英雄
d. 再循环a
3.2 问题:每个步骤的模型处理慢,步骤间的流转会产生时延
后续技术更新是否出现一个聚合llm呢? 一个模型内处理abc降低流转延迟
再有gpu升级迭代 解决每个步骤模型的处理慢问题
4. 心影随行的ai游戏陪伴:
心影随形x百度智能云:发布当日三次扩容,助力逗逗AI达成900万用户成就 - 百度智能云千帆社区