千问多模态模型qwen-vl-plus:图片中的表格内容提取


勇哥注:

这节是调用千问多模态模型qwen-vl-plus,完成表格的内容提取,并转为json格式。



pdf_table.jpg


注意几点:

  1.  图片可以是本地,或者是线上的。

  2.  多模态模型的api调用是:dashscope.MultiModalConversation.call

    而不是dashscope.Generation.call


源码:

import os
import dashscope
import json

dashscope.api_key = os.environ.get('DASHSCOPE_API_KEY')

#封装模型响应函数
def call_model(messages):
    try:
        response = dashscope.MultiModalConversation.call(
            model='qwen-vl-plus',
            messages=messages,
            max_tokens=1024,
            temperature=0.5,
        )
        return response
    except Exception as e:
        print(f"模型调用失败: {e}")
        return None

messages = [
    {
        "role": "user",
        "content": [
            {
                #"image": "file://e:/pdf_table.jpg"
                "image": "https://aiwucai.oss-cn-huhehaote.aliyuncs.com/pdf_table.jpg"
            },
            {
                "text": "提取图片中的表格,并将其转换为json格式"
            }
        ]
    }
]

content = call_model(messages)
print(content)
print(content.output.choices[0].message.content)

结果:

[{'text': '以下是图片中表格的JSON格式提取:\n\n```json\n{\n  "
表格": [\n    {\n      "客户信息": {\n        "联系方式": "",\n        "客诉日期": "",\n        "严重程度": {\n          "一般
": "",\n          "紧急程度": {\n            "一般": "",\n     
       "紧急": ""\n          }\n        },\n        "产品型号": "",\n        "生产日期": {\n          "年": "",\n          "月
": "",\n          "数量": 1,\n          "限额": "详"\n        },\n        "客户诉求": {\n          "客户诉求点": "退货 □换修"\n        },\n        "图例说明": ""\n      }\n    },\n    {\n  
    "分析人": "2018年__月__日",\n      "零时对策": {\n        "零时对策": "库存产品再检验 □退回二级纠正 □其它",\n        "1.防
止发生对策": ""\n      },\n      "建言人": "日期:2018年__月__ 
日",\n      "要求完成时间": "2018年__月__日",\n      "进程追踪": "□按时完成 □延期完成 □未完成",\n      "纠正归属": "□设计部 □ 
品质部 □装配车间 □压铸车间 □车床车间 □仓库 □运输 □其它"\n    },\n    {\n      "备注说明": ""\n    }\n  ]\n}\n```\n\n### 说明:
\n1. **客户信息**:\n   - 包括联系方式、客诉日期、严重程度(分为
“一般”和“紧急”)、产品型号、生产日期(年、月、数量、限额)、客 
户诉求(包括客户诉求点)以及图例说明。\n\n2. **分析人**:\n   - 
记录了分析人的姓名或编号,以及分析日期(2018年__月__日)。\n\n3. **零时对策**:\n   - 列出了零时对策的具体内容,包括库存产品再 
检验、退回二级纠正、以及其他措施。\n   - 防止发生对策部分为空白
。\n\n4. **建言人**:\n   - 记录了建言人的姓名或编号,以及日期(
2018年__月__日)。\n\n5. **要求完成时间**:\n   - 要求完成的时间
为2018年__月__日。\n\n6. **进程追踪**:\n   - 进程追踪选项包括按
时完成、延期完成和未完成。\n\n7. **纠正归属**:\n   - 纠正归属部
门包括设计部、品质部、装配车间、压铸车间、车床车间、仓库、运输 
等。\n\n8. **备注说明**:\n   - 备注说明部分为空白。\n\n此JSON格
式清晰地展示了表格中的各项信息,并按照逻辑结构进行了组织。'}]


LLM系列文章:

---------------------------------------------------

deepseek的dashscope调用示例

http://47.98.154.65/?id=2745

天气查询小例子:测试LLM调用的function功能

http://47.98.154.65/?id=2746

千问多模态模型qwen-vl-plus:图片中的表格内容提取

http://47.98.154.65/?id=2747


本文出自勇哥的网站《少有人走的路》wwww.skcircle.com,转载请注明出处!讨论可扫码加群:
本帖最后由 勇哥,很想停止 于 2025-11-06 21:29:04 编辑

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

会员中心
搜索
«    2025年11月    »
12
3456789
10111213141516
17181920212223
24252627282930
网站分类
标签列表
最新留言
    热门文章 | 热评文章 | 随机文章
文章归档
友情链接
  • 订阅本站的 RSS 2.0 新闻聚合
  • 扫描加本站机器视觉QQ群,验证答案为:halcon勇哥的机器视觉
  • 点击查阅微信群二维码
  • 扫描加勇哥的非标自动化群,验证答案:C#/C++/VB勇哥的非标自动化群
  • 扫描加站长微信:站长微信:abc496103864
  • 扫描加站长QQ:
  • 扫描赞赏本站:
  • 留言板:

Powered By Z-BlogPHP 1.7.2

Copyright Your skcircle.com Rights Reserved.

鄂ICP备18008319号


站长QQ:496103864 微信:abc496103864