开发一个面向企业的chatBI工作流

已完成

  1. 基础 Text2SQL 功能实现
    实现用户输入自然语言问题后,系统能够自动生成 SQL 并执行返回结果。
  2. 用户交互优化
    支持用户通过补充信息对查询进行调整,提升易用性。
  3. 模糊时间处理机制
    对“最近”“近期”等模糊时间关键词进行补全或引导,提升时间表达准确性。

后续优化

  1. 预定义高频问题与回答
    对一些可预见的问题设置高质量回复,提高响应质量和效率。
  2. 构建高质量知识库
    针对数据结构、字段定义、样例问题等,持续完善知识库,确保 SQL 生成的准确率。
  3. 引入持续学习机制
    通过用户反馈和历史数据,不断优化模型能力与表现。

核心能力分析:用户问题分类

Text2SQL 的核心是理解用户意图。为此,我设计了一个问题分类机制,以便动态路由不同类型的问题到合适的处理流程中:

1. 直接提问类(Direct Ask)

例子:“今年公司订单销量为多少?”
处理流程:自然语言 → 表名识别 → SQL 生成 → 执行 → 返回结果


2. 补充或修正类(Refine or Clarify)

例子:“我指的是3月的订单”“只看前5个客户”
处理流程

  • 获取上次提问或SQL上下文
  • 添加或替换时间、字段、过滤条件
  • 重新生成SQL或进行增量修正
  • 执行并返回

3. 异常反馈类(Error Feedback)

例子:“SQL 报错了”“字段错了”“PG 不支持这个写法”
处理流程

  • 判断是语法错误还是逻辑错误
    • 语法错误:尝试修复 SQL,确保符合数据库类型(MySQL/PostgreSQL 等)
    • 逻辑错误:引导用户澄清查询意图
  • 附带错误上下文,重新生成 SQL

4. 格式要求类(Result Formatting)

例子:“生成表格”“我要柱状图”“只返回数字”
处理流程

  • 保持 SQL 不变,仅调整输出格式
  • 根据用户偏好选择展示方式(图表、表格、纯文本等)

最终分类汇总

分类标签描述处理备注
direct_query用户提出独立的新查询问题走完整 SQL 生成流程
refine_query补充时间/字段/条件等限制结合对话上下文再生成 SQL
sql_error_feedback用户反馈 SQL 错误修复或引导重新提问
format_request用户要求以特定格式展示结果格式包装,不重生 SQL
reset_or_abort用户中断或重启对话清除上下文,重置状态
other暂不归类的其他问题等待进一步分析或澄清

工作流核心流程图

🔁 用户意图识别模块

为实现分类判断,系统中设计了一段 prompt 用于意图识别:

你是一个精确的用户意图识别助手,专门用于一个多轮问答的 SQL 生成系统。
请你阅读用户的当前输入,并判断这句话的意图属于以下哪一种(只返回标签,不要解释):
- direct_query
- refine_query
- sql_error_feedback
- format_request
- reset_or_abort
- other
当前用户输入是:
""" 开始 / sys.query """

智能补全用户问题

当用户问题不完整时,我们使用另一个 prompt 完成补全:

你是一个智能助手,擅长将不完整的查询补全为简洁、自然的提问句。
请根据以下内容补全提问:
用户原始问题:会话变量 / last_question;
附加信息:开始 / sys.query;
将附加信息融合到用户问题中,若是词语解释,请替换原词;若是限制条件,请补充进问题中。
仅返回最终补全后的提问句,不要解释、不加修饰。

例如:

  • 原始问题:“查询最近的信息”
  • 补充信息:“2020年前”
  • 输出:“查询2020年前的信息”

工具与参考

  • 会话变量机制:用于保存用户上下文,如 last_questionlast_sqllast_result 等,支持多轮对话。
  • 插件工具:参考 Dify 插件系统
    Dify Database 插件

测试示例

模糊时间处理:

  • user:查询最近工单量
  • sys:请明确时间
  • usr:2020年前
  • sys:生成并执行 SQL

多轮提问:

  • usr:系统中每年的订单数分别是多少
  • sys:直接生成 SQL 并返回图表

结果格式修改:

  • usr:我要折线图返回结果
  • sys:直接返回图表结果


如果你对 Text2SQL、意图识别或多轮问答系统有兴趣,欢迎交流探讨!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/90968.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/90968.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/90968.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python HTML模块详解:从基础到实战

一、模块体系全景图 Python生态中处理HTML的工具可分为三大层级: 标准库基础层:html模块 html.parser第三方增强层:BeautifulSoup(搭配解析器)专业级工具层:lxml requests-html 二、标准库核心模块详解…

PyTorch常用Tensor形状变换函数详解

PyTorch常用Tensor形状变换函数详解 在PyTorch中,对张量(Tensor)进行形状变换是深度学习模型构建中不可或缺的一环。无论是为了匹配网络层的输入要求,还是为了进行数据预处理和维度调整,都需要灵活运用各种形状变换函数…

自主智能Agent如何重塑工作流自动化:技术、经济与未来展望

自主智能Agent的崛起与工作流自动化的范式革命2025年7月,当OpenAI向付费用户推出具备网页浏览和代码执行能力的ChatGPT Agent时,工作流自动化领域迎来了一场静默但彻底的革命。这款不再满足于简单问答的智能体,在一个安全的虚拟计算机环境中运…

技术架构、行业应用、工具链整合、挑战应对及未来趋势五大模块,引用多个权威来源数据与开源项目实现细节。

以下是一份关于AI技术落地的实战经验总结报告,结合代码示例、可视化图表与行业案例,内容分为技术架构、行业应用、工具链整合、挑战应对及未来趋势五大模块,引用多个权威来源数据与开源项目实现细节。AI技术落地实战指南:从架构设…

第 9 篇:神经网络初探——当AI拥有了“大脑”,世界从此不同

《人工智能AI之机器学习基石》系列⑨ 专栏核心理念: 用通俗语言讲清楚机器学习的核心原理,强调“洞察 + 技术理解 + 应用连接”,构建一个完整的、富有启发性的知识体系。

音频焦点 Android Audio Focus 进阶

旧焦点处理 示例调用链: requestAudioFocus() → propagateFocusLossFromGain_syncAf() → handleFocusLossFromGain()。 系统事件(如来电)→ 强制焦点变化 → handleFocusLossFromGain()。 函数 propagateFocusLossFromGain_syncAf 焦点持有者发生的焦点丢失通知 主要功能…

MFC UI对话框

文章目录对话框模态对话框创建销毁关闭CDialog::OnCancel()EndDialog()CDialog::DestroyWindow()非模态对话框创建销毁关闭delete this对话框 模态对话框 ​​阻塞父窗口​​,强制用户先处理对话框。关闭前父窗口无法响应事件。 创建 推荐:非指针方式…

RabbitMQ--@RabbitListener及@RabbitHandle

两者区别 在 Spring AMQP 中,RabbitListener 和 RabbitHandler 是处理 RabbitMQ 消息的核心注解,但职责和使用场景完全不同。以下从 定义、区别、场景、示例 逐层解析:一、核心定义1. RabbitListener作用:标记 方法或类 为 Ra…

【基于CKF的IMM】MATLAB例程,CV和CT两个模型下的IMM,二维,滤波使用CKF(容积卡尔曼滤波),附下载链接

本程序实现了基于交互多模型(IMM)容积卡尔曼滤波(CKF)的多模型融合定位方法,并与纯CV−CKFCV-CKFCV−CKF(匀速模型)和CT−CKFCT-CKFCT−CKF(匀角速度转弯模型)方法对比。…

AI资讯日报 - 2025年07月28日

AI资讯日报 | 2025年07月28日 周一 今日核心要点 精华提炼 技术突破 • 腾讯混元:开源发布、3D技术 • 书生Intern:开源发布、多模态 企业动态 • AI工具集:协同创作、视频生成 数据概览分类数量重点关注技术突破2 条开源发布、3D技术企业动态…

大语言模型 LLM 通过 Excel 知识库 增强日志分析,根因分析能力的技术方案(1):总体介绍

文章大纲 1. 核心目标 2. 系统总体架构 3. Google Cloud 端到端方案(含无 RAG & RAG 双模式) 3.1 无 RAG:Function-Calling 查表模式 3.2 RAG:托管式向量检索 4. 开源轻量级方案 5. 数字孪生联合验证(实验性) 6. 知识图谱增强(Neo4j) 7. 监控与持续优化(CometLLM)…

Deepseek + browser-use 轻松实现浏览器自动化

在数字化时代,浏览器应用广泛,浏览器自动化可大幅提升效率。Deepseek 是强大的智能语言模型,能精准解析复杂指令,browser - use 是专注浏览器操作的工具,提供丰富 API 接口,支持主流浏览器的各类自动化操作…

开疆智能ModbusTCP转Profient网关连接西门子PLC与川崎机器人配置案例

本案例是西门子PLC与川崎机器人通过Profient转ModbusTCP网关进行通讯转换的配置案例,西门子作为profinet主站,机器人作为ModbusTCP服务器。配置过程:机器人配置川崎机器人控制器提供了RS232、以太网的通信接口,同时也可通过加装选…

Docker多主机网络连接:实现跨主机通信

Docker 是一种流行的容器化平台,它可以帮助开发人员更方便地构建、发布和管理应用程序。在 Docker 中,容器是独立运行的应用程序包装,包含了运行所需的所有文件、库和环境变量。Docker 提供了多种网络连接方式,使得容器之间可以进…

OSPF笔记

一、OSPF基础1、技术背景(RIP中存在的问题)RIP中存在最大跳数为15的限制,不能适应大规模组网周期性发送全部路由信息,占用大量的带宽资源路由收敛速度慢以跳数作为度量值存在路由环路可能性每隔30秒更新2、OSPF协议特点没有跳数限…

kotlin基础【3】

Kotlin Playground: Edit, Run, Share Kotlin Code Online 资料&#xff1a;kotlin实战 第一章 data class Person(val name: String,val age:Int?null)//允许接受以age为空&#xff0c;当为空将它赋值为null,如果不这么写直接写age:Int?是否可以fun main(args:Array<St…

Java-数构二叉树

1.树 1.1概念 树是一种非线性的数据结构&#xff0c;它是由n个有限节点组成一个具有层次关系。这种结构有以下特点&#xff1a; 一个特殊的结点&#xff0c;称为根节点&#xff0c;根节点没有前驱节点除根节点以外&#xff0c;其余节点分成M个互不相交的集合。每个集合又是一…

编程中水合的理解

在编程中&#xff0c;水合&#xff08;Hydration&#xff09; 是一个常见概念&#xff0c;尤其在 前端开发 和 服务端渲染&#xff08;SSR&#xff09; 场景中频繁出现。它的核心含义是&#xff1a;将静态内容“激活”为交互式动态内容。1. 水合的本质简单理解&#xff1a;水合…

使用ffmpeg转码h265后mac默认播放器不支持问题

由于mac自带录屏是mov并且文件特别大&#xff0c;我使用ffmpeg转码视频为h265使用如下命令ffmpeg_command [ffmpeg_path,"-i", input_path,"-c:v", "libx265","-preset", "veryslow","-map_metadata", "0&q…

支持MySQL、PostgreSQL和Redis集群部署,1Panel开源面板v2.0.5版本发布

2025年7月24日&#xff0c;现代化、开源的Linux服务器运维管理面板1Panel正式发布v2.0.5版本。在这一版本中&#xff0c;1Panel新增数据库集群部署、邮件告警和主从节点灵活切换三项功能&#xff0c;聚焦为企业级运维场景提供更优使用体验。 1Panel v2.0.5版本是1Panel开源面板…