一、项目概述
本项目致力于构建一个结合 n8n 工作流引擎 与 通义千问大模型 的智能体,旨在对庞大的业务数据库进行自动化分析、语义建模及自然语言问答。通过不同工作流的迭代构建,实现了表结构解析、业务含义提取、关系可视化、问答服务等能力,推动企业数据资产可视化与智能化升级。
二、工作流开发进度
日期 | 工作流名称 | 功能简介 |
---|---|---|
2025/4/24 | A1分析数据库表作用_V1.0_示例数据库Demo | 使用示例数据库验证分析流程 |
2025/5/12 | A1针对数据库表问答V0.1 | 初步实现结构化问答功能 |
2025/5/13 | A1分析数据库表作用_V1.0_全量数据库 | 支持 333 张真实业务表的全量分析 |
2025/5/15 | A1针对数据库表问答V0.2_引入知识库 | 引入知识库加速问答分析 |
三、操作步骤记录
✅ 1. 示例数据库分析
-
运行
A1分析数据库表作用_V1.0_示例数据库Demo
-
验证数据合并、分析、文件保存节点功能是否正常
✅ 2. 全量数据库处理
-
运行
A1分析数据库表作用_V1.0_全量数据库
-
加载 333 张业务表,处理字段、关系、样例数据等结构信息
-
合并后送入通义千问模型进行作用分析
✅ 3. 数据合并与输出
-
使用数据合并节点,整合结构与样例数据为统一格式
-
智能体节点对合并数据进行作用分析,输出语义结果
-
保存输出至
allData.txt
及多个教程表关系_*.txt
文件中,示例路径:/documents/AIBrain_test/now.txt
✅ 4. 自然语言问答功能
-
V0.1版本:直接将所有表格分析结果输入模型,响应慢
-
V0.2版本:引入知识库,先检索相关表,再送入模型分析,大幅提升效率
四、关键技术要点
-
模型上下文管理:V0.1 中上下文过长,导致 token 消耗大,V0.2 引入知识库缓存显著优化响应速度;
-
节点模块配置:智能体节点配置部分存在疑似 OCR 识别错误,如“elim”,可能为某内部模块或配置点;
-
文件输出规范化:自动生成的关系文件命名不一致,存在
zt_action
、zt_al agent
等重复或错误命名,后续需清洗合并; -
视觉输出待补充:表关系图谱与结构语义图仍在测试阶段,尚未形成完整可视化组件。
五、当前问题与待优化项
问题/风险 | 优化方向 |
---|---|
工作流 inactive,尚未上线 | 模型接口打通后激活主流程 |
表结构合并逻辑未完全验证 | 增加异常数据兼容测试 |
文件命名混乱 | 引入命名规则和清洗脚本 |
智能体节点配置未明 | 明确“elim”等关键词实际作用 |
结果 token 消耗大 | 精简表分析结果内容,控制上下文长度 |
六、下一步计划
-
✅ 2025/5/27:完成
A1分析数据库表作用_V1.0_全量数据库
流程测试 -
🔄 集成阿里百炼平台的应用发布能力,发布开放应用
-
🔄 整理输出文件结构,建立统一命名与归档机制
-
🔄 推出基于结构化+非结构化内容的资产分析 Beta 服务
七、补充备注
-
当前版本为开发迭代日志记录,用于后续项目总结与团队协作参考;
-
所有流程运行截图与输出文件保存在
/documents/AIBrain_test/
; -
项目命名统一使用
A1_
前缀便于管理与溯源。
八、操作步骤
工作流
主要搭建了4个工作流
操作步骤
- 运行『AI分析数据库表作用_V1.0_示例数据库Demo』,调试流程
运行效果见全量运行的截图。
- 运行『AI分析数据库表作用_V1.0_全量数据库』,分析真实的业务数据库,包含333张表。
运行效果图
-
数据合并节点,将表的结构和数据合并到一起
-
模型配置
-
智能体节点对上一步合并的数据进行分析
-
将结果保存到文件
-
表关系分析结果
- 运行『AI针对数据库表问答V0.1』,测试问答效果。
-
模型配置为max,上下文比较长
-
测验问题:一共有多少项目?
-
测验问题:关于『绩效』的最新公告内容
-
测验问题:** 项目最近一条完成的沟通内容
- 运行『AI针对数据库表问答V0.2_引入知识库』
- 前面流程直接把所有333张表的分析结果都给了通义,结果token很长,模型分析就比较慢,后面把表格分析结果保存到知识库,然后根据问题分析关联表,接下来从知识库检索相关表结构,把结果给到模型进行分析,效率高了很多。
后续优化点:
对相似问题可以缓存
对业务数据的分析结果可以再精简,降低token消耗
发布流程,与阿里百炼的应用结合,发布公开应用
结合非结构化数据的分析,可以提供数据资产梳理服务