AI 大模型图片翻译和 OCR 翻译技术方案

jake 2026年03月27日 2 阅读 0 评论更新于 2026-03-29

摘要

为图片实现翻译能力，基于大模型速度考量延展 OCR 翻译；即图片翻译目前有大模型翻译和 OCR 翻译两种模式，根据商业化策略进行限制和切换AI 图片翻译次数限制

大模型翻译

大模型翻译直接接入云平台中心的 Gemini Flash Pro 接口，用的是 nano banana pro 模型

图生图接口：https://yapi.300624.cn/project/1386/interface/api/241688

公共任务查询接口：http://yapi.wondershare.cn/project/963/interface/api/76745

下发任务

OCR 翻译

OCR 翻译先把图片送往 abbyy 进行 OCR 提取图片的所有文本坐标已经段落，利用 OpenCV 对原图进行色块填充并翻译译文返回。

评论（0）

暂无评论，快来抢沙发！