文章目录
- 前情提要
- mistral模型
- 运行代码
前情提要
之前咱对LLM4KGC的代码稍作修改,目标是用modelscope来下载模型。
现在这个代码终于能跑了。
前面咱说,我们的显卡只有6G的显存。现在呢,我也成功借到了A100的显卡。这下,咱可以先跑跑这个项目默认带的mistral模型。
mistral模型
Mistral 是由法国初创公司 Mistral AI 推出的开源大语言模型(LLM)系列,以高性能、轻量化设计和对开发者友好的开源策略著称。其核心特点及发展历程如下:
-
性能突破与高效架构
- Mistral 7B(2023年10月发布)作为首个开源模型,仅 70亿参数 即在多项基准测试中超越 Llama 2 13B,甚至在推理和代码任务上优于 Llama 1 34B。其核心技术包括 分组查询注意力(GQA) 加速推理,以及 滑动窗口注意力(SWA) 支持长上下文(最高128K tokens)并降低计算成本。
- Mistral Large 2