一、概述

机器学习模型的训练通常在Python环境下完成，而现实生产环境的复杂性和多样性使得模型的部署成为一个值得关注的重点。不同应用场景下有不同适应的实现方式，这里主要介绍通过一种通用中间格式——ONNX（Open Neural Network Exchange），来实现机器学习模型在C++平台的部署。

二、步骤

s1. Python环境中安装onnxruntime、skl2onnx工具模块；

s2. Python环境中训练机器学习模型；

s3. 将训练好的模型保存为.onnx格式的模型文件；

s4. C++环境中安装Microsoft.ML.OnnxRuntime程序包；
（Visual Studio 2022中可通过项目->管理NuGet程序包完成快捷安装）

S5. C++环境中加载模型文件，完成功能开发。

三、示例

使用 Python 训练一个线性回归模型并将其导出为 ONNX 格式的文件，在C++环境下完成对模型的部署和推理。

1.Python训练和导出

（环境：Python 3.11，scikit-learn 1.6.1，onnxruntime 1.22.0，skl2onnx 1.19.1）

import numpy as np
import onnxruntime as ort
from sklearn.datasets import make_regression
from sklearn.linear_model import LinearRegression
from skl2onnx import convert_sklearn
from skl2onnx.common.data_types import FloatTensorType# 生成示例数据
X, y = make_regression(n_samples=100, n_features=5, random_state=42)# 训练线性回归模型
model = LinearRegression()
model.fit(X, y)# 定义输入格式
initial_type = [('input', FloatTensorType([None, 5]))]# 转换模型为 ONNX 格式
onnx_model = convert_sklearn(model, initial_types=initial_type)# 保存 ONNX 模型
with open("linear_regression.onnx", "wb") as f:f.write(onnx_model.SerializeToString())print("\n模型已保存为: linear_regression.onnx\n")# 测试导出的模型
ort_session = ort.InferenceSession("linear_regression.onnx")
input_name = ort_session.get_inputs()[0].name
output_name = ort_session.get_outputs()[0].name# 创建一个测试样本
test_input = np.array([0.1, 0.2, 0.3, 0.4, 0.5]).reshape(1,5).astype(np.float32)# 运行推理
results = ort_session.run([output_name], {input_name: test_input})print(f"测试输入: {test_input}")
print(f"预测结果: {results[0]}")

在这里插入图片描述

2. C++ 部署和推理

（环境：C++ 14，Microsoft.ML.OnnxRuntime 1.22.0）

#include <iostream>
#include <vector>
#include <string>
#include <memory>
#include <onnxruntime_cxx_api.h>int main() {// 初始化环境Ort::Env env(ORT_LOGGING_LEVEL_WARNING, "ONNXExample");// 初始化会话选项Ort::SessionOptions session_options;session_options.SetIntraOpNumThreads(1);session_options.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL);// 加载模型std::wstring model_path = L"linear_regression.onnx";Ort::Session session(env, model_path.c_str(), session_options);// 获取输入信息Ort::AllocatorWithDefaultOptions allocator;size_t num_inputs = session.GetInputCount();size_t num_outputs = session.GetOutputCount();// 假设只有一个输入和一个输出if (num_inputs != 1 || num_outputs != 1) {std::cerr << "模型必须有且仅有一个输入和一个输出" << std::endl;return 1;}// 获取输入名称、类型和形状std::string input_name = session.GetInputNameAllocated(0, allocator).get();Ort::TypeInfo input_type_info = session.GetInputTypeInfo(0);auto input_tensor_info = input_type_info.GetTensorTypeAndShapeInfo();ONNXTensorElementDataType input_type = input_tensor_info.GetElementType();std::vector<int64_t> input_dims = input_tensor_info.GetShape();// 获取输出名称std::string output_name = session.GetOutputNameAllocated(0, allocator).get();// 创建输入数据std::vector<float> input_data = { 0.1f, 0.2f, 0.3f, 0.4f, 0.5f };size_t input_size = 5;// 创建输入张量std::vector<int64_t> input_shape = { 1, static_cast<int64_t>(input_size) };auto memory_info = Ort::MemoryInfo::CreateCpu(OrtArenaAllocator, OrtMemTypeDefault);Ort::Value input_tensor = Ort::Value::CreateTensor<float>(memory_info, input_data.data(),input_data.size(), input_shape.data(), 2);// 验证输入张量是否为张量if (!input_tensor.IsTensor()) {std::cerr << "创建的输入不是张量类型" << std::endl;return 1;}// 运行模型std::vector<const char*> input_names = { input_name.c_str() };std::vector<const char*> output_names = { output_name.c_str() };std::vector<Ort::Value> outputs = session.Run(Ort::RunOptions{ nullptr },input_names.data(),&input_tensor,1,output_names.data(),1);// 获取输出结果float* output_data = outputs[0].GetTensorMutableData<float>();Ort::TensorTypeAndShapeInfo output_info = outputs[0].GetTensorTypeAndShapeInfo();std::vector<int64_t> output_dims = output_info.GetShape();// 输出结果std::cout << "输入数据: ";for (float val : input_data) {std::cout << val << " ";}std::cout << std::endl;std::cout << "预测结果: ";for (size_t i = 0; i < output_info.GetElementCount(); ++i) {std::cout << output_data[i] << " ";}std::cout << std::endl;return 0;
}