一、介绍

MiniCPM 4 是一个极其高效的边缘侧大型模型,经过了模型架构、学习算法、训练数据和推理系统四个维度的高效优化,实现了极致的效率提升。

  • 🏗️ 高效的模型架构:
    • InfLLM v2 – 可训练的稀疏注意力机制:采用可训练的稀疏注意力机制架构,每个 token 只需要计算与 128K 长文本中不到 5% 的 token 的相关性,显著降低了长文本处理的计算开销
  • 🧠 高效的算法学习:
    • Model Wind Tunnel 2.0 – 高效的可预测扩展:引入了下游任务性能的扩展预测方法,使得模型训练配置搜索更加精确
    • BitCPM – 极限三值量化:将模型参数位宽压缩至 3 个值,实现了 90% 的极端模型位宽减少
    • 高效的训练工程优化:采用 FP8 低精度计算技术结合多 token 预测训练策略
  • 📚 高质量的训练数据:
    • UltraClean – 高质量预训练数据过滤和生成:基于高效的数据验证构建迭代数据清洗策略,开源高质量的中文和英文预训练数据集 UltraFinweb
    • UltraChat v2 – 高质量监督微调数据生成:构建大规模高质量监督微调数据集,涵盖知识密集型数据、推理密集型数据、指令遵循数据、长文本理解数据及工具调用数据等多个维度
  • ⚡ 高效的推理系统:
    • CPM.cu – 轻量级且高效的 CUDA 推理框架:集成稀疏注意力、模型量化和推测采样以实现高效的填充和解码
    • ArkInfer – 跨平台部署系统:支持在多个后端环境中的高效部署,提供灵活的跨平台适应能力

二、部署过程

基础环境最低要求说明:

环境名称版本信息
Ubuntu22.04.5 LTS
python3.10
Cuda12.1.1
NVIDIA Corporation3060

1、构建基础镜像

在算家云容器中心的租赁页面中,构建基础镜像 Miniconda-Ubuntu-22.04-cuda12.1.1

屏幕截图

2、从 github 仓库 克隆项目:

# 克隆 MiniCPM4 项目(如果克隆速度过慢可以开启学术代理加速)
git clone https://github.com/OpenBMB/MiniCPM.git

从

3、创建虚拟项目

# 创建一个名为 MiniCPM4 的新虚拟环境,并指定 Python 版本为 3.10
conda create -n MiniCPM4 python=3.10 -y

创建虚拟环境.png

等待安装完成

等待虚拟环境安装完成.png

4、安装模型依赖包

# 激活 MiniCPM4 虚拟环境
conda activate MiniCPM4# 切换到项目工作目录
cd /MiniCPM# 在 MiniCPM4 环境中安装 requirements.txt 依赖
pip install -r requirements.txt

安装模型依赖库requirements.png

依赖安装成功如下图所示:

requirements依赖安装成功.png

5、下载预训练模型

推荐下载方法:

1.安装 modelscope 依赖包。

pip install modelscope

安装

2.创建一个 Python 下载脚本

vim modelscope_download.py

3.在创建的脚本中插入以下下载代码

# Python 代码下载模型
from modelscope import snapshot_download
model_dir = snapshot_download('OpenBMB/MiniCPM3-4B', cache_dir='./', revision='master')

保存文件:Esc --》Shift + :–》输入英文的 :–》输入:wq

  • 如果你正在编辑文本,先按 Esc 键退出插入模式。
  • 然后,直接按 Shift + :(不需要先按冒号,这个组合键已经包含了冒号的输入),屏幕上会出现一个冒号,提示你输入命令。
  • 接着,输入 wq,表示你想要保存文件并退出。
  • 最后,按 Enter 键执行命令。

4.执行 modelscope_download.py 文件进行模型下载

python modelscope_download.py

执行

6、运行 hf_based_demo.py 文件

#切换到hf_based_demo.py 文件目录
cd demo/minicpm# 运行 hf_based_demo.py 文件
python hf_based_demo.py

运行

出现以上报错,需要修改模型路径

# 编辑 hf_based_demo.py 文件
vim hf_based_demo.py

修改路径1.png

将上方划红线的部分修改为刚刚下载模型的路径,并且修改模型的 gradio 页面 IP 和端口

修改路径2.png

第二次运行 hf_based_demo.py 文件

# 运行 hf_based_demo.py 文件
python hf_based_demo.py

第二次运行hf_based_demo.py

出现以上结果,还需要继续安装 accelerate 依赖

pip install accelerate

安装

第三次运行 hf_based_demo.py 文件

# 运行 hf_based_demo.py 文件
python hf_based_demo.py

可以成功运行:

第三次运行

三、网页演示

网页演示.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/916779.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/916779.shtml
英文地址,请注明出处:http://en.pswp.cn/news/916779.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS变量与Houdini自定义属性:解锁样式编程新维度

在前端开发中,CSS变量和Houdini自定义属性正在彻底改变我们编写和管理样式的方式。这些技术不仅提高了样式代码的可维护性,更为CSS带来了编程语言的强大能力。一、CSS变量:原生样式的革命 CSS变量(CSS Custom Properties&#xff…

Android中PID与UID的区别和联系(2)

一、核心概念对比特性PID (Process ID)UID (User ID)本质进程唯一标识符应用身份标识符分配时机进程启动时动态分配应用安装时静态分配生命周期进程结束时回收应用卸载时才回收变化性每次启动都可能不同长期保持不变作用范围单进程内唯一全设备范围唯一核心作用系统资源管理&am…

TCPDump实战手册:协议/端口/IP过滤与组合分析指南

目录 一、基础过滤速查表 1. 协议过滤(单协议) 2. 端口过滤 3. IP地址过滤 二、组合过滤实战示例 1. 协议端口组合 2. IP端口组合 3. 复杂逻辑组合 三、高级协议分析示例 1. HTTP请求分析 2. DNS问题排查 3. TCP连接问题分析 四、组合过滤场…

【智能协同云图库】智能协同云图库第八弹:基于阿里云百炼大模型—实现 AI 扩图功能

AI 扩图功能 需求分析 随着 AI 的高速发展,AI 几乎可以应用到任何传统业务中,增强应用的功能,带给用户更好的体验。 对于图库网站来说,AI 也有非常多的应用空间,比如可以利用 AI 绘图大模型来编辑图片,实现…

2025年Solar应急响应公益月赛-7月笔记ing

应急响应身为颜狗的我是真心觉得lovelymem的ui写得~~~~【任务1】应急大师题目描述:请提交隐藏用户的名称?print打印注册表,或者开启环境是就有【任务4】应急大师题目描述:请提交黑客创建隐藏用户的TargetSid(目标账户安…

C++/CLI vs 标准 C++ vs C# 语法对照手册

🚀 C/CLI vs 标准 C vs C# 语法对照手册🧩 核心类型系统对比 // 类型声明语法对比 标准 C C/CLI C# ─────────────────────────────────────────────────…

仓库管理系统-2-后端之基于继承基类的方式实现增删改查

文章目录 1 数据库表user 2 后端通用框架 2.1 User.java(实体类) 2.2 使用封装的方法(继承基类) 2.2.1 UserMapper.java(mapper接口) 2.2.2 UserService.java(service接口) 2.2.3 UserServiceImpl.java(service实现类) 2.2.4 UserController.java(控制器) 3 增删改查(封装的方法…

【el-table滚动事件】el-table表格滚动时,获取可视窗口内的行数据

一个简单的获取内容的办法 表格部分&#xff0c;主要是ref写一下<el-table :data"tableData" ref"tableRef"> </el-table>进入页面的时候绑定监听 mounted(){ // 绑定滚动事件this.$nextTick(() > {const table this.$refs.tableRef;const…

OCR 赋能自动阅卷:让评分更高效精准

考试阅卷中&#xff0c;OCR 技术正成为高效助手&#xff0c;尤其在客观题和标准化答题场景中表现亮眼。将考生答题卡扫描后&#xff0c;OCR 能快速识别填涂的选项、手写数字或特定符号&#xff0c;与标准答案比对后自动判分。相比人工阅卷&#xff0c;它能在短时间内完成成百上…

在docker中安装frp实现内网穿透

服务端frps 1.首先在服务器端安装frps docker pull snowdreamtech/frps2.本地创建frps的配置文件frps.ini [common] bind_port 7000 # frp 服务端控制端口 token xxxxx # 客户端认证密钥3.启动frps docker run -d --name frps \ --network host \ --restartalwa…

电脑开机后网络连接慢?

在数字化日益普及的今天&#xff0c;电脑已成为我们工作和生活中不可或缺的工具。但是&#xff0c;可能很多用户都遇到过电脑开机后网络连接慢的情况&#xff0c;这不仅影响了我们的工作效率&#xff0c;还极大降低了上网体验。怎么解决该问题呢&#xff1f;本文分享的这5个方法…

一分钟部署一个导航网站

先看效果1.部署教程 mkdir -p /home/ascendking/mysite cd /home/ascendking/mysite# 安装 WebStack-Hugo 主题git clone https://gitee.com/WangZhe168_admin/WebStack-Hugo.git themes/WebStack-Hugo# 将 exampleSite 目录下的文件复制到 hugo 站点根目录 cd /home/ascendki…

Rust实现微积分与高等数学公式

基于Rust实现高等数学中微积分 以下是基于Rust实现高等数学中微积分相关公式的示例整理,涵盖微分、积分、级数等常见计算场景。内容分为基础公式和进阶应用两类,提供可直接运行的Rust代码片段(需依赖num或nalgebra等库)。 微分运算 导数的数值近似(前向差分) 适用于函…

Android 键盘

基础知识1. 物理键盘&#xff08;Physical Keyboard&#xff09;定义物理键盘指的是设备上真实存在的、可以按压的键盘。例如&#xff1a;早期的 Android 手机&#xff08;如黑莓、摩托罗拉 Milestone&#xff09;自带的 QWERTY 键盘外接的蓝牙/USB 键盘平板或 Chromebook 上的…

SuperClaude Framework 使用指南

SuperClaude Framework 使用指南SuperClaude Framework 是一个开源配置框架&#xff0c;将 Claude Code 从通用 AI 助手转变为专业的上下文感知开发伙伴。该框架通过模板驱动架构应用软件工程原理&#xff0c;为专业软件开发工作流程提供了强大的增强功能。目前该项目处于 v3.0…

Ruby 发送邮件 - SMTP

Ruby 发送邮件 - SMTP 在互联网的世界中,邮件服务已经成为我们日常生活中不可或缺的一部分。而在开发过程中,使用Ruby发送邮件是一项基本技能。SMTP(Simple Mail Transfer Protocol)是互联网上用于发送电子邮件的标准协议。本文将详细介绍如何在Ruby中使用SMTP发送邮件。 …

Docker运行Ollama

1.docker-compose启动ollama 按照 ollama docker-compose配置说明 配置并启动ollama容器&#xff0c;启动成功后&#xff0c;浏览器访问 http://localhost:11434 如果显示如下即代表成功 如果你的服务器支持GPU&#xff0c;可添加GPU参数支持&#xff0c;参考&#xff1a;htt…

轻松管理 WebSocket 连接!easy-websocket-client

在前端开发中&#xff0c;WebSocket 是实现实时通信的核心技术&#xff0c;但原生 WebSocket 的连接管理&#xff08;如断连重连、心跳维护、事件监听&#xff09;往往需要编写大量重复代码。今天给大家分享一个好用的 WebSocket 连接管理库 —— easy-websocket-client&#x…

人工智能赋能社会治理:深度解析与未来展望

一、核心应用场景与技术实现1. 公共安全&#xff1a;智能防控与风险预警技术应用&#xff1a;立体化治安防控&#xff1a;AI摄像头集成人脸识别、行为分析、多目标追踪技术&#xff0c;提升破案率与公共安全能力。例如&#xff0c;深圳某区通过AI系统使盗窃案件破案率提升40%。…

解决使用vscode连接服务器出现“正在下载 VS Code 服务器...”

# 解决使用vscode连接服务器出现“正在下载 VS Code 服务器...”## 首先在vscode的输出中获取 commit idtext [17:17:41.679] Using commit id "c306e94f98122556ca081f527b466015e1bc37b0" and quality "stable" for server 从上面的体制中可以看出&#…