摘要
为图片实现翻译能力,基于大模型速度考量延展 OCR 翻译;即图片翻译目前有大模型翻译和 OCR 翻译两种模式,根据商业化策略进行限制和切换AI 图片翻译次数限制
大模型翻译
大模型翻译直接接入云平台中心的 Gemini Flash Pro 接口,用的是 nano banana pro 模型
图生图接口:https://yapi.300624.cn/project/1386/interface/api/241688
公共任务查询接口:http://yapi.wondershare.cn/project/963/interface/api/76745
下发任务
OCR 翻译
OCR 翻译先把图片送往 abbyy 进行 OCR 提取图片的所有文本坐标已经段落,利用 OpenCV 对原图进行色块填充并翻译译文返回。
暂无评论,快来抢沙发!