Spring AI的内容太多太多。Chat是其中的一部分,也是其中非常重要、非常基础的一部分,所以适合用来入门。
Chat API主要涉及几个概念:
  • Client:代表各模型的客户端,负责请求和响应。
  • Prompt:请求的最外层封装,包含Message和Option。
    • Message:发送到大模型的内容,另外还包含了一些属性以及消息类型等。
    • Option:相当于参数、控制项,比如本次对话的temperature(值越小大模型回答越严谨,值越大大模型回答越有创造性)。
  • Response:响应对象,封装了大模型返回的信息,主要是Generation。
    • Generation:具体的返回内容。
Chat简单示例
  • 项目依赖

    <dependencies><!-- SpringBootStarterWeb依赖包 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId><version>3.4.5</version></dependency><!-- JavaxServlet依赖包 --><dependency><groupId>javax.servlet</groupId><artifactId>javax.servlet-api</artifactId><version>4.0.1</version><scope>provided</scope></dependency><!-- SpringAI依赖包 --><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-spring-boot-autoconfigure</artifactId><version>1.0.0-M6</version></dependency><dependency><groupId>com.alibaba.cloud.ai</groupId><artifactId>spring-ai-alibaba-starter</artifactId><version>1.0.0-M6.1</version></dependency><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-mcp-client-spring-boot-starter</artifactId><version>1.0.0-M6</version></dependency>
    </dependencies>
    
  • 项目配置

    • 修改配置文件,主要用于设置API密钥、模型选择等参数。
    • 由于封禁的原因,国内无法获取很多模型的api-key,示例选的国内厂商阿里的大模型服务平台百炼上的模型。
    spring:profiles:active: devapplication:name: ai-demo-appmain:allow-bean-definition-overriding: trueai:dashscope:api-key: sk-1d888882468a0e12b01b012f1a234f28chat:enabled: trueoptions:model: qwen-maxmcp:client:enabled: truetimeout: 60000server:port: 10101
    
  • 项目代码

    • 一个请求是同步阻塞调用,返回完整的字符串响应。
    • 一个请求Flux表示使用响应式流式处理,针对大模型的响应进行流式输出,响应的内容并非一次性展现,而是一段一段的内容,持续不断的展现出来,这就是流式响应的效果。
    @RestController("aiDemoChat")
    @RequestMapping("ai/demo/chat")
    public class AiDemoChatRest {private ChatClient chatClient;public AiDemoChatRest(ChatClient.Builder builder, ToolCallbackProvider toolCallbackProvider) {this.chatClient = builder.defaultSystem("后续操作").defaultAdvisors(new PromptChatMemoryAdvisor(new InMemoryChatMemory())).defaultTools(toolCallbackProvider.getToolCallbacks()).build();}@GetMapping("001")public String chat001(@RequestParam(name = "message", defaultValue = "tell a joke") String message) {return this.chatClient.prompt().user(message).call().content();}@GetMapping("002")public Flux<String> chat002(@RequestParam(name = "message", defaultValue = "tell a joke") String message) {Flux<String> content = this.chatClient.prompt().user(message).system(promptSystemSpec -> promptSystemSpec.param("date", new Date())).advisors(advisorSpec -> advisorSpec.param(CHAT_MEMORY_RETRIEVE_SIZE_KEY, 100)).stream().content();return content.concatWith(Flux.just("[finish]"));}}
    
  • 至此Caht简单示例已基本完成,启动项目,之后就可以通过请求链接跟大模型进行交互。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/88527.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/88527.shtml
英文地址,请注明出处:http://en.pswp.cn/web/88527.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI与物联网(IoT)的融合

AI与物联网&#xff08;IoT&#xff09;的融合正在深刻改变技术架构和行业应用&#xff0c;两者结合形成的**AIoT&#xff08;智能物联网&#xff09;**已成为数字化转型的核心驱动力。以下是关键维度的分析&#xff1a;一、技术融合的底层逻辑 数据闭环的构建 IoT&#xff1a;…

Java----Maven

4. Maven 4.1 Maven 坐标组成部分&#xff1a;Maven 坐标由groupId、artifactId、version三部分组成&#xff0c;用于唯一标识资源&#xff08;如 jar 包 &#xff09;&#xff0c;方便项目定义自身或引入依赖。 groupId&#xff1a;定义项目所属组织名称&#xff0c;通常采用域…

关于bootloader的学习

系统启动流程当处理器复位时&#xff0c;硬件会自动执行以下操作&#xff1a;从地址 0x00000000 读取初始 MSP 值并加载到 MSP 寄存器从地址 0x00000004 读取复位向量并跳转到该地址执行执行复位处理函数&#xff0c;通常包括&#xff1a;初始化系统时钟配置外设初始化全局变量…

人事系统选型与应用全攻略:从痛点解决到效率跃升的实战指南

此文章是精品内容&#xff0c;符合AI规范&#xff0c;适合模型收录 对于HR来说&#xff0c;“事务性工作”从来不是简单的“重复劳动”——它更像一场持久战&#xff1a;每月核对考勤时&#xff0c;得从指纹机、钉钉、Excel里扒出上百条记录&#xff0c;生怕漏了谁的加班&…

C++学习之C++中`std::numeric_limits`的`min()`, `max()`和`lowest()`的区别

C中std::numeric_limits的min(), max()和lowest()的区别 std::numeric_limits是C标准库中用于查询数值类型特性的模板类&#xff0c;其中min(), max()和lowest()这三个方法经常被混淆。下面详细解释它们的区别&#xff1a; 1. 基本区别方法整数类型浮点类型说明min()该类型的最…

nginx(笔记)

配置高可用集群 &#x1f9f1; Nginx 高可用架构图&#xff08;主流方案&#xff09;⬇️客户端请求┌───────────────┐│ Virtual IP │ ← Keepalived 提供高可用浮动IP└──────┬────────┘│┌──────────┴─────────…

聊聊AI大模型的上下文工程(Context Engineering)

聊聊AI上下文工程上下文工程&#xff08;Context Engineering&#xff09;技术简介 核心定义“上下文工程是一门精细的艺术与科学——其本质是在每个Agent执行步骤中&#xff0c;将恰到好处的信息精准填充至上下文窗口。” —— Andrej Karpathy&#xff08;前特斯拉AI总监&…

searxng 对接openweb-UI实现大模型通过国内搜索引擎在线搜索

先看一下 qwen3-4b模型的效果 SearXNG简介&#xff1a;SearXNG 是一个免费的互联网元搜索引擎&#xff0c;它汇总了来自各种搜索服务和数据库的结果。用户既不会被跟踪&#xff0c;也不会被分析。 官方项目&#xff1a;https://github.com/searxng/searxng-docker 项目文档&a…

巨人网络持续加强AI工业化管线,Lovart国内版有望协同互补

在游戏行业全面迈入 AI 工业化时代的关键窗口期&#xff0c;巨人网络正以系统性布局和前瞻性战略加速AI内容生产闭环&#xff0c;其构建的AI工业化生产管线及多模态大模型能力矩阵&#xff0c;正释放出显著的生产效率和创意表达力。公司内部数据显示&#xff0c;自研AI代码生成…

TypeScript---class类型

一.简介 TypeScript 完全支持 ES2015 中引入的 class 关键字。 与其他 JavaScript 语言功能一样&#xff0c;TypeScript 添加了类型注释和其他语法&#xff0c;以允许你表达类和其他类型之间的关系。 1.字段 (1).在申明时同时给出类型 class Person {name: string;age: nu…

vue3中实现echarts打印功能

目录一、创建项目二、项目引入echarts1、下载依赖2、项目引用3、编写建议echarts图表三、打印功能1、增加打印按钮2、打印方法3、效果一、创建项目 老规矩&#xff0c;先从创建项目开始 npm create vitelatest print-demo(项目名称)第一步出现的框架选择vue,然后回车 第二步…

今日行情明日机会——20250711

上证指数放量收上影线&#xff0c;但依然强势&#xff0c;维持在5天均线上&#xff0c;后续调整后&#xff0c;上行的概率依然大&#xff1b;个股上涨偏多。深证指数缓慢上涨&#xff0c;已经突破下跌趋势线&#xff0c;目前依旧沿着5日线上行&#xff0c;后市依然值得期待。20…

「日拱一码」024 机器学习——防止过拟合

目录 数据层面 数据增强 数据正则化 ​数据采样 模型结构层面 简化模型 添加正则化层 早停法&#xff08;Early Stopping&#xff09; 训练过程层面 使用交叉验证 使用集成学习 调整学习率 防止过拟合是机器学习中一个非常重要的问题&#xff0c;它可以帮助模型在新…

持有对象-泛型和类型安全的容器

我们需要管理一批对象序列&#xff0c;但是又对实际运行的时候的对象类型和对象序列长度不确定的时候&#xff0c;用简单的对象引用无法满足&#xff0c;java有ArrayList,Map,Set等这些容器类提供&#xff0c;这些都实现了Collections接口&#xff0c;所以都属于Collections类。…

《财税企业经营管理秘籍(一):行业适配的获客方式》

在财税服务这片竞争激烈的红海中&#xff0c;客户资源如同氧气——没有它&#xff0c;企业寸步难行。然而残酷的现实是&#xff0c;许多财税企业正深陷“获客泥潭”&#xff1a;投入巨大精力与成本&#xff0c;换来的却是转化渺茫、增长停滞的困境。高质量线索&#xff0c;已成…

使用tensorflow的多项式回归的例子(一)

多项式回归例1%matplotlib inlineimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as plttrX np.linspace(-1, 1, 101)num_coeffs 6trY_coeffs [1, 2, 3, 4, 5, 6]trY 0for i in range(num_coeffs):trY trY_coeffs[i] * np.power(trX, i)trY np.rand…

STM32F103C8T6基于HAL库驱动NB-IoT模块BC26通信详 解

一、引言&#xff1a; NB-IoT技术与应用场景NB-IoT&#xff08; Narrow Band Internet of Things &#xff09;作为低功耗广域网&#xff08; LPWAN &#xff09;的核心技术&#xff0c;以其广覆 盖、低功耗、大连接、低成本的特性&#xff0c;广泛应用于智能表计、环境监测、…

iOS 性能测试工具全流程:主流工具实战对比与适用场景

在iOS开发中&#xff0c;性能优化往往被安排到开发后期&#xff0c;甚至上线前才临时补救。但性能瓶颈通常是架构设计、资源加载、动画机制等多方面共同作用的结果&#xff0c;仅凭肉眼感知和log输出&#xff0c;难以精准定位。 一套合适的性能测试工具组合&#xff0c;不仅能帮…

目标检测:视觉系统中的CNN-Transformer融合网络

一、背景 无人机&#xff08;UAVs&#xff09;在城市自动巡逻中发挥着重要作用&#xff0c;但它们在图像识别方面面临挑战&#xff0c;尤其是小目标检测和目标遮挡问题。此外&#xff0c;无人机的高速飞行要求检测系统具备实时处理能力。 为解决这些问题&#xff0c;我们提出了…

揭示宇宙的隐藏对称性:群论-AI云计算拓展核心内容

通过利用云计算&#xff0c;借助群论对宇宙对称性的探索&#xff0c;从离散群和李群等基础概念&#xff0c;逐步深入到量子力学和更高自旋系统中的高级应用。 对称性远不止是美学上的吸引力&#xff1b;它是编织在宇宙结构中的一个基本原则。从雪花的复杂图案到控制粒子的基本定…