这个模型是基于文心大模型训的,也就0.9B 参数,之前在OmniDocBench V1.5榜单上超了Gemini-3-Pro和DeepSeek-OCR2,是全球SOTA了。
我直接来个原地测试,将扫描版PDF书籍OCR识别后转成清晰的EPUB电子书。
拿了一张物理试卷来测,有很多物理专业术语,分辨率也不太高,还带图。这个Skill的精度非常高,可以识别里面所有的文字,还能把图表按位置重新放到新图里。
安装命令很简单,直接发地址就好了。
每天有解析几万页数的文档额度,应该是目前唯一免费高精度读PDF的Skill。
Prompt:
帮我安装这个Skill,clawhub. ai/Bobholamovic/paddleocr-doc-parsing
然后OpenClaw会提示你要配置对应的URL跟 Key,
是在paddleocr. com里面获取的
- 点击API
- 选【PaddleOCR-VL-1.5】
- 复制示例代码里的 【TOKEN】 和 【API_URL】
把这些都发给 OpenClaw,然后发一张图片就可以直接测试了。感觉后面但凡带点文本的图都可以丢给OCR提取信息了。
##