星际争霸作为检验AI效果的一个重要“模式生物”, 是验证AI技术的重要平台,尤其在 深度学习 和 强化学习领域。该游戏因其复杂的游戏机制和实时决策要求,为AI研究提供了丰富的测试环境和挑战。
本博文是记录自己曾经研究星际争霸AI时对于数据部分的一点汇总,由于AlphaStar是模仿学习+强化学习的路线( 在 AlphaStar 中,第一步的训练是在暴雪提供的数据集上进行的有监督学习。据 DeepMind 称,经过有监督学习,AlphaStar 对暴雪的内置 AI 能保持 95% 上的胜率。接下来很多经过有监督学习的 AlphaStar 进行联赛 (League),相互对打,在这个过程中使用强化学习不断提升能力。),于是我先找的数据集,还踩了很多坑……知行合一致体悟,留与后人三两迳。
相关事件
2017年8月7日,Facebook的AI团队发布了史上最大的《星际争霸:母巢之战》游戏数据集。紧接着10号,Deepmind就和暴雪联合发布了《星际争霸2》的游戏数据集与AI训练平台SC2LE。
DeepMind and Blizzard open StarCraft II as an AI research environment - Google DeepMind
https://deepmind.google/discover/blog/deepmind-and-blizzard-open-starcraft-ii-as-an-ai-research-environment/
2018年12月10日和19 日AlphaStar 在《星际争霸2》中先后以 5:0 全胜的战绩击败了 2 位国际顶级的人类选手
2019年10月,出了那篇nature
Grandmaster level in StarCraft II using multi-agent reinforcement learning | Nature
https://www.nature.com/articles/s41586-019-1724-z
1.数据集
首先,星际争霸的数据集分为《星际争霸1:母巢之战》(母巢之战是DLC名)和《星际争霸2》的!他们是不同的!
2017年8月7日,Facebook 的四名科学家 Zeming Lin, Jonas Gehring, Vasil Khalidov, Gabriel Synnaeve 公布了史上最大的《星际争霸:母巢之战》游戏数据集:365GB,包含6万游戏记录,15亿帧,4.9亿玩家操作。
数据集-OpenDataLab
https://opendatalab.com/OpenDataLab/StarData这是Facebook 做的母巢之战的数据集
而到了Deepmind这里,事情就有一点复杂了。他们的对象不是《母巢之战》,而是更加高级的《星际争霸2》。Deepmind也给出了游戏数据集,包含6万5千场暴雪官方回收的匿名游戏数据。未来还会持续增加。
sc2_datasets——当下我找到的最好的星际2数据集!数据集、使用方式都给研究者准备好了!
数据集下载地址:
SC2ReSet: StarCraft II Esport Replaypack Set
https://zenodo.org/records/5575797
论文地址:(还是篇nature???)
SC2EGSet: StarCraft II Esport Replay and Game-state Dataset
https://www.nature.com/articles/s41597-023-02510-7.pdf
(PDF) SC2EGSet: StarCraft II Esport Replay and Game-state Dataset
https://www.researchgate.net/publication/373767449_SC2EGSet_StarCraft_II_Esport_Replay_and_Game-state_Dataset
帮助手册
使用样例- sc2_datasets 1.1.0 Documentation
https://sc2-datasets.readthedocs.io/en/latest/example.html帮助手册-SC2Reader User Manual — sc2reader 0.7.0-pre documentation
https://sc2reader.readthedocs.io/en/latest/
Spawning——这是最全最实时的星际的生数据集网站!
支持按玩家、比赛时间等(左侧条件筛选框)进行筛选!
Spawning Tool: Browse Replays
网站地址:
Spawning Tool: StarCraft 2 Build OrdersSpawning Tool organizes StarCraft 2 build orders, guides, and replays
https://lotv.spawningtool.com/
MCS:
中科院开源星际争霸2宏观运营研究数据集MSC
MSC: A Dataset for Macro-Management in StarCraft II | Papers With Code
https://paperswithcode.com/paper/msc-a-dataset-for-macro-management-in数据集:
MSC Dataset | Papers With Code
https://paperswithcode.com/dataset/msc数据集载入工程
https://github.com/wuhuikai/MSC
https://github.com/wuhuikai/MSC
Sc2ReplayStats
还算好用的星际数据集下载网站,就是必须注册,还有各种限制……
Sc2ReplayStats - Starcraft 2 Replay Replay Hosting/Training System - Sc2ReplayStats.com
https://sc2replaystats.com/
StarCraft II Unplugged: 大规模离线强化学习数据集
https://openreview.net/pdf?id=Np8Pumfoty
https://openreview.net/pdf?id=Np8Pumfoty
2.强化学习环境
当初我曾豪情万丈,觉得已经出现的东西应该很容易就可以复现和改进,结果我发现复杂的整局对战全使用深度学习并不容易,原来研究人员当初也是用编辑器做的小地图(mini-games,就几个兵对战的那种)来对战……
2017年的发布还包括了一系列迷你游戏(mini-games),这是一种将游戏分解成更可控的部分的技术,可以用于测试智能体在特定任务中的表现,例如移动视角(camera)、采矿或是选择操作单位。DeepMind 在博客中表示,希望研究者能够在这些迷你游戏上测试其技术,同时也为其他研究者提供新的迷你游戏,用以竞赛和评估。
3.AI接口
发布了星际争霸2的人工智能研究环境SC2LE(作为一个高中时玩魔兽地图编辑器的,我挺想做魔兽AI的,但是没接口没法接AI的输入输出啊……)
SC2LE 开放平台,相对于大家之前做的星际1的平台,最大的一个优势是提供了很多端到端的内容操作的API接口,发展出来可以通过接口像人一样打星际,进行控制。这种接口是在之前的星际1平台上不提供的。
Blizzard/s2client-proto: StarCraft II Client - protocol definitions used to communicate with StarCraft II.
https://github.com/Blizzard/s2client-proto
PySC2是SC2LE的继承者, PySC2 是由 DeepMind 开发的 星际争霸II 学习环境(StarCraft II Learning Environment, SC2LE)的 Python 组件。该项目旨在为机器学习研究者提供一个丰富的环境,用于强化学习(Reinforcement Learning, RL)研究环境。
google-deepmind/pysc2: StarCraft II Learning Environment
https://github.com/google-deepmind/pysc2
4.策略与数据挖掘
一个维护的星际争霸AI开发资料库
SKTBrain/awesome-starcraftAI: A curated list of resources dedicated to StarCraft AI.https://github.com/SKTBrain/awesome-starcraftAI
《星际争霸:母巢之战》的数据挖掘相关代码。(在调研中发现,星际争霸的策略主要是“建筑建造顺序”与“出兵顺序”)StarCraft Brood War Data Mininghttp://nova.wolfwork.com/dataMining.html
星际争霸AI对战排位平台:AI Arena
AI Arenahttps://aiarena.net/
星际2对手策略预测的一个论文使用的数据集
UCI Machine Learning RepositoryDiscover datasets around the world!https://archive.ics.uci.edu/dataset/272/skillcraft1+master+table+dataset
研究对手识别时的经典书籍《Plan, Activity, and Intent Recognition》
Plan, Activity, and Intent Recognition Archives - AAAIhttps://aaai.org/proceeding/ws17-13/
Spring是一个free的RTS游戏引擎,只看到一篇英文论文有用它,热度太低……
https://openreview.net/pdf?id=Np8Pumfotyhttps://openreview.net/pdf?id=Np8Pumfoty
不错的介绍:
数据集介绍1——游戏数据做评估 - 知乎https://zhuanlan.zhihu.com/p/82557388
其他参考:
AlphaStar 星际首秀,人工智能走向星辰大海-CSDN博客
数据集介绍1——游戏数据做评估 - 知乎https://zhuanlan.zhihu.com/p/82557388
最后,这CSDN编辑器有大bug啊!怎么我一撤销就少了好多东西啊!!!我只能在历史浏览中找之前看过什么再努力想起来把链接加上,不带文本编辑器这么玩人的!