找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2|回复: 0

百度把PaddleOCR-VL-1.5做成OpenClaw Skills了,也上架到ClawHub了,配置好后就可以直接解析文档了。

[复制链接]

12

主题

0

回帖

36

积分

新手上路

积分
36
发表于 2 小时前 | 显示全部楼层 |阅读模式
百度把PaddleOCR-VL-1.5做成OpenClaw Skills了,也上架到ClawHub了,配置好后就可以直接解析文档了。


这个模型是基于文心大模型训的,也就0.9B 参数,之前在OmniDocBench V1.5榜单上超了Gemini-3-Pro和DeepSeek-OCR2,是全球SOTA了。

我直接来个原地测试,将扫描版PDF书籍OCR识别后转成清晰的EPUB电子书。

拿了一张物理试卷来测,有很多物理专业术语,分辨率也不太高,还带图。这个Skill的精度非常高,可以识别里面所有的文字,还能把图表按位置重新放到新图里。

安装命令很简单,直接发地址就好了。
每天有解析几万页数的文档额度,应该是目前唯一免费高精度读PDF的Skill。

Prompt:
帮我安装这个Skill,clawhub. ai/Bobholamovic/paddleocr-doc-parsing

然后OpenClaw会提示你要配置对应的URL跟 Key,
是在paddleocr. com里面获取的
- 点击API
- 选【PaddleOCR-VL-1.5】
- 复制示例代码里的 【TOKEN】 和 【API_URL】

把这些都发给 OpenClaw,然后发一张图片就可以直接测试了。感觉后面但凡带点文本的图都可以丢给OCR提取信息了。
##











本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-22 18:54 , Processed in 0.219953 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表