主要是想试一下视觉模型的效果
用到的是glm4.5v和qwen3-30b
大体流程:
输入:发票图片或者发票PDF
条件分支:二者存在其一,就去对应的大模型
图片分支:走glm4.5视觉模型,提取信息,传给结果
PDF分支:先通过文档提取器,然后传给语言大模型,提取信息,传给结果
结果:展示
结果:
{
"发票号码": "24412000000050936591",
"开票日期": "2024年04月07日",
"购买方信息": {
"名称": "虞城县际逗商贸行",
"统一社会信用代码": "92411425MA44JBBE68"
},
"销售方信息": {
"名称": "贝棒棒文化体育传播中心(有限合伙)",
"统一社会信用代码": "91310113MAC6W62WXY"
},
"项目": [{
"名称": "日用杂品际逗出口品质浓缩型无磷食品级洗涤洗洁精",
"规格型号": "300ml袋装",
"单位": "袋",
"数量": 10,
"单价": 5.0475247524753,
"金额": 50.48,
"税率/征收率": "1%",
"税额": 0.50
}],
"合计": {
"金额":