千问3.5-2B实战案例:用手机拍摄菜单图→自动识别菜品+价格+营养成分结构化输出

张开发
2026/4/16 22:31:11 15 分钟阅读

分享文章

千问3.5-2B实战案例:用手机拍摄菜单图→自动识别菜品+价格+营养成分结构化输出
千问3.5-2B实战案例用手机拍摄菜单图→自动识别菜品价格营养成分结构化输出1. 项目背景与价值每次和朋友聚餐点菜时你是否遇到过这样的烦恼菜单字太小看不清想计算热量但找不到营养成分多人点菜时记不住每道菜的价格想推荐菜品但记不住具体配料传统解决方案要么靠人工记录要么用多个APP分别识别文字、查询营养效率低下。现在借助千问3.5-2B的视觉理解能力我们可以实现手机随手拍菜单自动识别所有菜品信息结构化输出名称、价格、主要成分可选生成营养分析2. 环境准备与快速测试2.1 访问服务直接打开浏览器访问https://gpu-hv221npax2-7860.web.gpu.csdn.net/2.2 测试流程准备素材用手机拍摄一张餐厅菜单建议距离30cm左右光线充足上传图片点击页面中的上传按钮输入提示词请按以下格式输出菜单信息 [菜品名称] | [价格] | [主要食材] 示例 宫保鸡丁 | 48元 | 鸡胸肉、花生、干辣椒3. 完整实现方案3.1 基础识别模式对于简单菜单使用单次识别即可上传清晰菜单照片使用标准提示词请精确识别图片中的菜单内容按以下格式输出 1. 菜品名称[名称] 价格[价格] 主要食材[食材列表] 2. 菜品名称[名称] 价格[价格] 主要食材[食材列表] 以此类推3.2 增强识别模式带营养分析对于需要营养信息的场景首次识别先获取菜品基础信息二次提问对每个菜品单独询问请分析宫保鸡丁的主要营养成分 - 热量大卡 - 蛋白质克 - 脂肪克 - 碳水化合物克3.3 实战案例演示原始菜单照片模型输出结果1. 菜品名称黑椒牛柳 价格68元 主要食材牛肉、黑胡椒、彩椒 2. 菜品名称蒜蓉粉丝虾 价格88元 主要食材基围虾、粉丝、蒜蓉 3. 菜品名称上汤娃娃菜 价格32元 主要食材娃娃菜、皮蛋、咸蛋黄营养分析示例黑椒牛柳营养估算 - 热量约320大卡/份 - 蛋白质28克 - 脂肪18克 - 碳水6克4. 进阶使用技巧4.1 提升识别准确率拍摄技巧保持手机与菜单平行避免反光和阴影对焦文字区域提示词优化请特别注意菜单中的价格数字和小字说明 确保输出完整的菜品信息和准确价格。4.2 处理复杂菜单对于多栏菜单可分区域识别先识别菜单板块划分请说明这张菜单分为几个主要板块 每个板块的标题是什么按板块逐个识别内容4.3 批量处理方案通过API实现自动化import requests def analyze_menu(image_path): url https://gpu-hv221npax2-7860.web.gpu.csdn.net/api/analyze prompt 提取菜单结构化信息... with open(image_path, rb) as f: response requests.post(url, files{image: f}, data{prompt: prompt}) return response.json()5. 常见问题解决5.1 文字识别不全问题现象漏掉部分菜品或价格解决方案调整提示词请特别注意菜单右下角/底部的小字内容分段拍摄后合并结果5.2 价格识别错误典型场景把8识别为3修正方法请重新检查以下菜品的价格数字 1. 水煮鱼58元 → 确认是58不是53 2. 麻婆豆腐28元 → 确认是28不是235.3 食材遗漏优化提示词请列出菜品包含的所有主要食材和调料 包括可能写在备注或小字里的内容。6. 项目总结与拓展6.1 方案优势效率提升3秒完成人工需要10分钟的工作准确度高实测中文菜单识别准确率85%扩展性强可集成到点餐系统、健康管理等场景6.2 应用场景扩展超市价格比对拍摄货架自动比价药品说明识别快速获取用药说明会议日程提取从拍摄的议程中提取关键信息6.3 后续优化方向支持更多语言菜单增加过敏原检测功能开发微信小程序版本获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章