Lazy loaded image
项目开发
🛠️PillOCR
Words 153Read Time 1 min
2025-8-24
2026-1-13
type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
 

OCR软件

  1. 软件名:PilloOCR
    1. PillOCR
      OB0NEUpdated Jan 12, 2026
  1. 框架:截图传给LLM,视觉理解为Markdown文本,直接输出
  1. 优点:步骤少,免去了上传这一步骤。截图调用win自带的,LLM对接视觉理解模型
  1. 后期:用的百炼的模型,qwen-vl-max;免费的一百万token有效期到年底,到时候得换模型服务提供商
    1. 大模型服务平台百炼控制台
  1. 后期API提供商参考:
    1. 硅基流动的免费视觉模型
效果顶级,LLM还是太好用了
 
 

 

使用说明

 
 
 
 
 
 
 
 
 
 

 
 
 
上一篇
Agent框架+Python
下一篇
插件_提示词路由