摘要:

        本文系统梳理了大模型知识,以及与Spring AI的集成方案,涵盖本地部署、云服务、API调用三种模式的技术选型对比。通过DeepSeek官方API示例详解Spring AI的四种开发范式(纯Prompt/Agent/RAG/微调),并提供架构决策矩阵和性能优化技巧。

一、大模型概念

1基本概念

        大模型(Large Language Model)是指参数量巨大(通常超过10亿)、基于Transformer架构、通过海量数据训练的深度学习模型,具有强大的语言理解和生成能力。

2、关系图

关系说明‌:

  1. AI‌(人工智能)是最顶层的概念
  2. 大模型‌是AI的一个子领域,特指基于Transformer架构的大规模语言模型
  3. GPT‌(Generative Pre-trained Transformer)是OpenAI开发的大模型系列
  4. DeepSeek‌是国产的大模型系列,与GPT属于同级概念
  5. 最下层是各系列的具体版本

、大模型部署模式

维度

本地部署

云服务部署

开放API调用

典型场景

高安全性/持续高并发需求

弹性需求/快速上线

低频调用/快速验证

数据控制权

完全自主

云厂商托管(部分可控)

数据需上传至第三方

初始成本

极高(百万级硬件投入)

中等(按需租用云资源)

极低(仅API调用费)

长期成本

低(3年以上摊销优势)

中高(持续计费)

高(调用量越大成本越高)

运维复杂度

高(需专业团队)

中(云平台部分托管)

无(免运维)

模型定制能力

支持全参数微调

部分支持(如LoRA微调)

不支持

延迟表现

稳定(局域网内低延迟)

依赖云服务商网络质量

受公网波动影响

代表方案

LLaMA-3/DeepSeek本地化部署

AWS Bedrock/百度文心千帆

通义千问API/GPT-4 Turbo

一句话总结选择建议‌:

  • 要安全‌ → 本地部署
  • 要灵活‌ → 云服务
  • 要便宜(低频)‌ → 开放API

、大模型调用

下面 DeepSeek官网的API调用示例代码

from openai import OpenAI# 初始化OpenAI客户端
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")# 通过http调用大模型
response = client.chat.completions.create(model="deepseek-chat",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)# 打印结果
print(response.choices[0].message.content)

该实现通过OpenAI兼容接口调用deepseek-chat模型,包含系统提示词设置和温度参数调节

、大模型应用

        大模型应用指基于‌大规模预训练模型‌(如GPT、BERT、ViT等)开发的智能化解决方案,通过海量数据训练获得泛化能力,并适配具体场景需求。其核心特点包括:

  • 参数规模大‌:通常包含数十亿至万亿级参数
  • 多任务泛化‌:同一模型可处理文本、图像、语音等跨模态任务
  • 微调适配‌:通过提示工程(Prompt Engineering)或领域数据微调快速落地

大模型应用场景如下:

技术维度

应用场景

典型案例

文本分析

金融舆情监控

实时分析新闻/社交媒体的企业负面情绪(如Bloomberg Terminal)

法律合同审查

自动识别条款漏洞(如ROSS Intelligence)

科研文献挖掘

跨论文关联创新点(如Scite.ai)

多模态

医疗影像报告生成

CT扫描图→结构化诊断报告(如联影智能uAI)

工业质检增强

X光+可见光融合检测电池缺陷(如宁德时代)

教育AR互动

扫描课本插图→3D模型演示(如百度AR课堂)

机器人应用

仓储分拣机器人

语音指令"优先处理红色包裹"→动作执行(如极智嘉机器人)

手术辅助机械臂

根据术中超声图像自动调整切除范围(如达芬奇手术机器人)

家庭服务机器人

理解"把可乐放冰箱第二层"的复杂指令

智能体

虚拟数字员工

银行年报数据→自动生成PPT+讲解视频(如度小满)

游戏NPC

基于玩家行为动态生成剧情分支(如《逆水寒》GPT-NPC)

编程助手

自然语言描述→生成可运行代码(如GitHub Copilot)

自动驾驶

复杂场景决策

识别"交警手势"并生成避让路径(如Waymo)

乘客交互系统

多模态理解"空调太冷+手指调温动作"(如小鹏XNGP)

仿真测试

自动生成极端天气测试场景(如CARLA仿真平台)

五、AI应用开发架构

1. 纯Prompt问答架构

定义:通过自然语言指令直接调用大模型完成任务的零样本(zero-shot)交互模式

特征

  • 无代码侵入性
  • 响应速度最快(200-500ms)
  • 输出结果不可控性强

应用场景‌:

  • 客服自动回复(简单咨询)
  • 内容生成(社交媒体文案)
  • 快速知识问答(常识类问题)

2. Agent+Function Calling架构

定义‌:大模型作为决策中枢,动态调用工具/API的智能体系统

特征‌:

  • 具备工具使用能力
  • 支持多轮复杂任务
  • 需预定义工具描述(OpenAI格式)

函数认知的来源‌

  • 预训练知识‌:基础模型通过代码数据训练获得通用API调用模式理解(如HTTP请求格式)
  • 工具描述注入‌:调用前需向模型提供工具说明书(OpenAI格式示例):
tools = [{"name": "weather_api","description": "查询指定城市未来天气","parameters": {"type": "object","properties": {"city": {"type": "string", "description": "城市名称"},"date": {"type": "string", "format": "date"}}}
}]

应用场景‌:

  • 智能旅行规划
  • 跨系统办公自动化
  • 金融数据实时分析

3. RAG架构(检索增强生成)

定义‌:结合外部知识库检索与大模型生成的混合架构

特征‌:

  • 知识可实时更新
  • 回答准确性显著提升
  • 需向量数据库支持

角色职责说明

角色

职责

典型组件示例

用户

发起自然语言请求

终端用户/API调用方

AI应用

路由请求+组装上下文

FastAPI/Flask应用

大模型

内容生成/决策制定

GPT-4/DeepSeek

知识库

存储&检索结构化数据

Elasticsearch

应用场景‌:

  • 企业知识库问答
  • 法律条文查询
  • 医疗诊断支持系统

4. Fine-tuning架构

定义‌:通过领域数据微调基础模型参数的深度定制方案

特征‌:

  • 训练成本高(GPU小时计费)
  • 领域适应性强

应用场景‌:

  • 专业术语翻译(如法律文书)
  • 行业报告生成(金融/能源)
  • 方言语音识别

5. 架构对比矩阵

架构类型

开发成本

知识时效性

适合场景

纯Prompt

★☆☆☆☆

依赖预训练

简单问答

Agent+Function

★★★☆☆

实时

复杂流程

RAG

★★☆☆☆

可更新

知识密集型

Fine-tuning

★★★★★

训练时固化

专业领域

技术选型建议‌:

  • 验证阶段:从纯Prompt开始
  • 数据敏感场景:优先RAG
  • 流程自动化:选择Agent
  • 长期专业需求:考虑微调

六、spring AI 开发指南

1. ‌Spring AI核心概念

  • 定位‌:Spring生态对大模型能力的标准化集成方案
  • 核心组件‌:
    • AiClient:统一接口(支持OpenAI/Azure/Bedrock等)
    • PromptTemplate:动态提示词模板
    • AiResponse:标准化响应封装
  • 架构优势‌:

注意Spring AI支持DeepSeek架构图中体现由于DeepSeek应归类于OpenAI分支下(因其采用OpenAI兼容接口)

2. ‌快速集成示例‌

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-openai-spring-boot-starter</artifactId><version>1.0.0</version>
</dependency>
spring:
  ai:
    openai:
      api-key: ${OPENAI_KEY}
      base-url: https://api.deepseek.com
      chat:
        model: deepseek-chat
        temperature: 0.7

3. ‌四种开发模式实现‌

3.1 纯Prompt模式
@RestController
public class ChatController {@Autowiredprivate AiClient aiClient;@GetMapping("/ask")public String ask(@RequestParam String question) {Prompt prompt = new Prompt(question);return aiClient.generate(prompt).getGeneration().getText();}
}

3.2 Function Calling模式
@Bean
public FunctionCallback weatherFunction() {return new FunctionCallback("weather_api",  // 函数名称"""{"type": "object","properties": {"city": {"type": "string"}  // 定义输入参数(大模型生成)}}""") {@Overridepublic Object apply(Object input) {// 解析 input(JSON 格式),调用真实天气 APIString city = ((Map<String, String>) input).get("city");return fetchWeatherFromAPI(city); // 返回天气数据}};
}

3.3 RAG集成方案
@Bean
public VectorStore vectorStore() {return new PineconeVectorStore(pineconeClient,      // 连接 Pinecone 云服务"knowledge-index"    // 向量索引名称);
}@Bean
public Retriever retriever() {return new VectorStoreRetriever(vectorStore(), 3); // 返回 Top-3 相似结果
}

3.4 微调适配方案
@Bean
public FineTuningClient fineTuningClient() {return new OpenAiFineTuningClient(openAiApi); // 创建 OpenAI 微调客户端
}

  • 核心用途‌:允许你上传自定义数据集,对 OpenAI 的基础模型(如 GPT-3.5-turbo)进行微调,生成专属领域的定制模型。

4. ‌架构对比选择‌

需求场景

Spring AI方案

代码示例片段

快速原型开发

@EnableAiClients

自动注入AiClient

复杂业务流程

AiFunctionRegistry

动态工具注册

知识密集型问答

VectorStoreRetriever

混合检索+生成

领域专业术语

FineTuningJobLauncher

提交微调任务

展望趋势‌

        随着Spring AI对国产大模型支持度提升,DeepSeek等本土方案将更深度融入Java开发生态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/94702.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/94702.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/94702.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux下实现System V消息队列实现任意结构体传输

以下是一个实现&#xff0c;可以发送和接收任意类型的结构体消息&#xff0c;而不仅限于特定的CustomMsg类型&#xff1a;#include <stdio.h> #include <stdlib.h> #include <string.h> #include <sys/ipc.h> #include <sys/msg.h> #include <…

TCP的三次握手和四次挥手实现过程。以及为什么需要三次握手?四次挥手?

三次握手和四次挥手的实现原理&#xff0c;以及为什么要这样设计&#xff1f;三次握手的实现三次握手的核心角色与参数三次握手的具体步骤第一步&#xff1a;客户端 → 服务器&#xff08;发送 SYN 报文&#xff09;第二步&#xff1a;服务器 → 客户端&#xff08;发送 SYNACK…

Java开发时出现的问题---架构与工程实践缺陷

除语言和并发层面&#xff0c;代码设计、工程规范的缺陷更易导致系统扩展性差、维护成本高&#xff0c;甚至引发线上故障。1. 面向对象设计的常见误区过度继承与脆弱基类&#xff1a;通过继承复用代码&#xff08;如class A extends B&#xff09;&#xff0c;会导致子类与父类…

项目评审管理系统(源码+文档+讲解+演示)

引言 在当今快速发展的商业环境中&#xff0c;项目评审和管理是确保项目成功的关键环节。项目评审管理系统作为一种创新的数字化工具&#xff0c;通过数字化手段优化项目评审和管理的全流程&#xff0c;提高项目管理效率&#xff0c;降低风险&#xff0c;提升项目成功率。本文将…

ComfyUI 安装WanVideoWrapper

目录 方法2&#xff1a;通过 ComfyUI-Manager 安装 方法3&#xff1a;手动下载并解压 测试代码&#xff1a; WanVideoWrapper 方法2&#xff1a;通过 ComfyUI-Manager 安装 在 ComfyUI 界面顶部找到 Manager&#xff08;管理器&#xff09;选项。 进入 Install Custom Nod…

react合成事件大全,如onClick,onDrag

1. 鼠标事件onClick - 点击事件onContextMenu - 右键菜单事件onDoubleClick - 双击事件onDrag - 拖拽事件onDragEnd - 拖拽结束事件onDragEnter - 拖拽进入目标区域事件onDragExit - 拖拽离开目标区域事件onDragLeave - 拖拽离开事件onDragOver - 拖拽悬停事件onDragStart - 拖…

从《中国开源年度报告》看中国开源力量的十年变迁中,Apache SeaTunnel 的跃迁

如果把开源世界比作一条奔涌的大河&#xff0c;过去十年里&#xff0c;中国开发者已经从“岸边试水”变成了“中流击水”。在最近落下帷幕的 Community Over Code Asia 2025&#xff0c;华东师范大学教授王伟老师基于《中国开源年度报告》进行的一场分享&#xff0c;用一组数字…

JAVA 程序员cursor 和idea 结合编程

cursor 是基于vscode改良而来的&#xff0c;外加上Claude大语言模型而产生的AI编辑器&#xff0c;市面上也有阿里的灵码qianwen3-coder大语言模型。我个人电脑还是喜欢用idea集成灵码插件开发。但是也稍微介绍下习惯idea的人只是使用cursor代码生成的话&#xff0c;这有个小妙招…

查看部署在K8S服务的资源使用情况

要查看 Pod中 server 的资源使用情况&#xff08;CPU 和内存&#xff09;&#xff0c;你需要使用 Kubernetes 的监控工具。最常用的是 kubectl top 命令。✅ 方法一&#xff1a;使用 kubectl top&#xff08;推荐&#xff09; 1. 查看 Pod 的 CPU 和内存使用 kubectl top pod s…

uni-app vue3 小程序接入 aliyun-rtc-wx-sdk

安装依赖&#xff1a; npm install aliyun-rtc-wx-sdk crypto-jsuni-app&#xff0c;新建一个页面&#xff0c;粘贴以下代码 在阿里云实时音视频补充appId、appKey即可&#xff0c; <template><view class"container"><!-- 用户输入区域 --><vi…

Java技术栈/面试题合集(3)-Java并发篇

场景 Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享: Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客 通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。…

[AI 生成] Spark 面试题

spark 基础问题面试题以下是 Spark 基础面试题的全面梳理&#xff0c;涵盖核心概念、架构原理和编程模型&#xff0c;帮助快速掌握高频考点&#xff1a;一、核心概念1. Spark 核心组件组件作用Driver执行 main() 方法&#xff0c;调度任务&#xff0c;管理集群资源Executor在 W…

MySQL的DML增删改操作:

目录 添加数据&#xff1a; 方式1&#xff1a;一条一条添加数据&#xff1a; 方式2&#xff1a;将查询结果插入到表中&#xff1a; 更新数据&#xff1a; 删除数据&#xff1a; MySQL8的新特性&#xff1a;计算列&#xff1a; 本文介绍了MySQL数据库操作语言(DML)的基本使…

MySQL运维常用语法速查

&#x1f5c3;️ 一、数据库操作 CREATE DATABASE db_name; USE db_name; DROP DATABASE db_name; SHOW DATABASES;&#x1f517; 官方文档 &#x1f4ca; 二、表操作 表创建示例 CREATE TABLE users (id INT AUTO_INCREMENT PRIMARY KEY,name VARCHAR(50) NOT NULL,email V…

汽车以太网通信协议——SOME/IP

1. 背景 SOME/IP是一种汽车中间件解决方案&#xff0c;其全称是Scalable Service-Oriented Middleware over IP&#xff0c;即位于 IP 协议层以上的一种面向服务的可扩展的中间件。 中间件&#xff1a;该术语起源于复杂的软件系统开发&#xff0c;用以实现软件组件之间的数据交…

什么是负载均衡,有哪些常见算法?

文章目录1.什么是负载均衡2.负载均衡的分类2.1 二层负载均衡2.2 三层负载均衡2.3 四层负载均衡2.4 七层负载均衡3.负载均衡工具3.1 LVS3.2 Nginx3.3 HAProxy4.常见负载均衡算法5.面试回答模板1.什么是负载均衡 为了提升web应用的各方面能力&#xff0c;我们一般会把多台机器组…

PyTorch 核心三件套:Tensor、Module、Autograd

欢迎来到啾啾的博客&#x1f431;。 记录学习点滴。分享工作思考和实用技巧&#xff0c;偶尔也分享一些杂谈&#x1f4ac;。 有很多很多不足的地方&#xff0c;欢迎评论交流&#xff0c;感谢您的阅读和评论&#x1f604;。 目录引言1 Tensor1.1 &#x1f6e0;️Tensor 的核心用…

python源码是如何运行起来的

为什么要了解底层原理 写出高质量代码 问题定位 满足好奇心 机械通感 开始 当我们编写并运行一行 print(Hello, World!) 时&#xff0c;背后究竟发生了什么&#xff1f;Python 代码是如何从我们可读的文本&#xff0c;变成计算机可以执行的指令的呢&#xff1f; 很多人将…

MacOS Docker 安装指南

MacOS Docker 安装指南 引言 Docker 是一个开源的应用容器引擎,它允许开发者打包他们的应用以及应用的依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app)。Docker …

Cisco 3750X交换机更新到IOS 15.2后无法启动 提示:Boot process failed...

背景及故障现象 一台新购入的二手Cisco 3750X-48P&#xff0c;原机自带IOS软件版本为12.x&#xff0c;可以正常工作。 但将IOS版本升级到15.2之后&#xff0c;在启动过程中卡住。 第一次加载IOS软件时是正常的&#xff0c;提示&#xff1a; Loading "flash:/c3750e-uni…