type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
OCR软件
- 软件名:PilloOCR
- 框架:截图传给LLM,视觉理解为Markdown文本,直接输出
- 优点:步骤少,免去了上传这一步骤。截图调用win自带的,LLM对接视觉理解模型
- 后期:用的百炼的模型,qwen-vl-max;免费的一百万token有效期到年底,到时候得换模型服务提供商
大模型服务平台百炼控制台
百炼控制台是阿里云大模型服务平台,提供AI模型训练、部署、推理一站式服务,支持多种大模型框架,助力企业快速构建AI应用。
- 后期API提供商参考:
- 硅基流动的免费视觉模型
效果顶级,LLM还是太好用了
使用说明
- Author:Frank
- URL:https://blog.fqqblog.com/article/2e7bd4d9-052e-81ac-b9b7-fbd6d962a471
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
