我是钱

百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

当前位置：首页 » 新媒体运营 » 正文

百度ocr，这大概是我最后一款OCR工具了，一步到位

1400 人参与 2022年08月15日 10:26 分类 : 新媒体运营评论

创作立场声明：本人长年热衷于挖掘各种好玩有趣或稀奇古怪的电脑软件和手机 App，写文科生都能看得懂玩得转的玩机教程，期待和大家的深入探讨交流。

今天来反思一下关于 OCR 这一块的问题。

月底，给大家安利了天若 OCR 的最后一个开源版本 .，但我一直心中有愧。

一方面我的需求没有那么大，把一直用着的天若拉出来其实有点取巧，真正偶尔用一次的情况下，完全可以用 QQ 自带的文字识别。

另一方面天若那个版本两三年没更新了，作者跑去维护别的项目去了，虽然说是接受百度、搜狗、腾讯、有道四个接口。

但公共接口挂了两个（腾讯、百度），而真正支持用自己申请的接口只有百度一个。

看很多小伙伴其实对百度这个接口并不买单，这是我有愧的地方。

毕竟咱偶尔分享一个应用，就是想让更多人了解到更好用的软件，违背了初衷我可不干。

好在那次摸索的 OCR 的时候，了解到 PandaOCR 可以支持多个自定义接口。

怎么说呢，就很强大。

作者也是个爆肝强人，每逢节假日还在那里更新迭代，比起早早退出舞台的天若 . 更值得拿出来说道说道。

这不，它来了。

PandaOCR

额，今天介绍的版本是 PandaOCR .。

这大概是最后一个免费提供多自定义接口的版本了。

百度ocr，这大概是我最后一款OCR工具了，一步到位-百度竞价优化_微商推广_今日头条自媒体_新媒体运营_剑谦网络

前几天去 GitHub 上翻 PandaOCR 的时候，发现多了个 Pro 版本。

作者原话，因为前期急着上新功能，结果忽视了执行逻辑混乱以及后续维护成本高的问题。

换句话说，就是作者把旧版的代码定性成屎山了。

与其满头大汉（不是错字）的折磨自己，不如重构一遍，跳过那座山，然后就有了 Pro 版。

这是 PandaOCR Pro .：

可问题是 Pro 版只提供有百度的自定义接口，别的接口都成收费服务了。

所以，各种意义上说，PandaOCR . 就成了能免费使用的最后一个版本。

不过作者说啊，这最后一个版本只是不上新功能了，已有的功能接口仍会维护。

对于绝大部分人来说，这就够了，比如我。

如果你真心喜欢这个浓眉大眼小熊猫，还是可以给作者支持一波。

能做什么

一款集大成的 OCR 工具有什么用？

对于文本识别质量而言，那是接口的对比，如果弄不太明白的，可以看看天若 OCR 的那篇文章。

就识别效果而言，搜狗的准确率高些，百度手写识别的效果更好，有道的识别速度更快，讯飞和 Mathpix 的公式识别更清晰，百度的表格识别也不错。

所以抛开接口，回归到 PandaOCR 自身，它提供了怎样的方便，才是我们该关心的。

我们重新认识一下它的界面，左边显示图片，右边则是识别文本和翻译框，外加一个功能栏：

操作起来很方便，默认快捷键「F」截图，然后就能调用你选择的接口自动识别。

识别的内容会显示在桌面，以弹窗的形式显示，至于显示的内容，可以在「高级」设置中选择。

当然，高级设置里能更改更多东西，比如是否监听剪切板，是否自动复制识别的内容，甚至字体、截图方式等等。

双击 PandaOCR 的识别和翻译那一块，还会有惊喜，打开监听剪切板，分分钟变成一个翻译软件。

对了，还有个固定截图的功能，简单的说，就是把截图框固定到桌面一处，然后快捷键触发 OCR 识别。

我看 B 站上已经有人拿它来做游戏机翻工具了，效果是这样的。

我就不重复造轮子了，感兴趣的可以去研究一下。

PandaOCR 之所以强大，还是因为它支持的接口多，那它到底能使用什么接口呢？

我从它配置文件里看了一下：

支持通用识别：搜狗 + 腾讯 + 百度 + 有道 + 阿里 + 讯飞 + 网校 + SpaceOCR

支持手写识别：腾讯 + 百度 + 阿里 + 讯飞

支持公式识别：微软（演示）+ 百度 + 腾讯 + Mathpix + 讯飞

支持表格识别：有道（演示）+ 百度 + 腾讯 + 阿里

支持翻译：搜狗 + 腾讯 + 百度 + 有道 + 彩云小译 + DeepL

是不是看的都有些怵的慌，事实上早先版本的接口更多，最后一个版本应该删除了近个接口。

但设置起来并不麻烦，右键点击左上角的图标，选择「编辑配置」，在文本中更改对应的接口就行。

至于怎么申请接口，又要放哪里，我这里还是以百度为例，介绍一下。

申请接口

进入百度 AI 开放平台，注册登录个账号先。

然后在「人工智能」找到「OCR 文字识别」里的「通用场景文字识别」。

当然你也可以在这里找到「OCR 文字识别」：

反正流程不变，选择「创建应用」。

然后「应用名称」和「应用描述」都随便填，记得「应用归属」选择个人。

最后立即创建，从「应用列表」把 API Key 和 Secret Key 记录下来。

总结一下申请流程，就是注册登录 - 申请 - 填信息 - 开通 - 复制 ID 和密钥 - 在 Panda 中粘贴-重载配置文件。

就是中间这个粘贴步骤，PandaOCR 的格式一直是「ID | KEY」，竖线前后都有个空格，最容易出错的就是这里了。

纵观整个流程，相信我，真的没有你想的那么难。

我就不光明正大借着申请接口来水字了，再简单说说接口免费额度以及注意事项。

百度

我以前见过的这种类似的工具，一般给的接口都是百度的。

无他，实在是百度给的免费额度太多了，通用 OCR 识别的每日额度高达万。

可惜，这些都成了过往云烟，月底的时候百度把额度改成了未实名次/月，实名次/月。

所以百度的接口再也不是最香的了，但百度的手写识别还是挺给力的。

免费额度如下：

通用识别次/月，高精度通用识别次/月，表格识别次/月，手写识别次/月，通用翻译免费。

腾讯

腾讯云在开通识别时，有个营业执照，那个不管它，直接选确定就行。

还有就是需要自己申请一下密钥（账号信息-访问管理），不过那个腾讯云的翻译，现在好像只能使用 API 参数调用，PandaOCR 应该是用不成了。

至于免费额度，腾讯云的 OCR + 表格 + 公式接口共用次/月，翻译百万/月。

搜狗

搜狗没有免费额度，而是直接按次收费的，能免费用的点在于刚开始送的元新用户注册券。

而且作者说是得充点钱才能用，我往里充了一块钱，正在白嫖那元的新人福利。

有道

和搜狗一样是按量收费的，新人福利元。

阿里

阿里云的 OCR 也是按次收费的，最大的优惠应该是不可重复购买的那个每次 . 元了。

SpaceOCR

每月有 . 万次的免费额度，不过是个国外的网站，邮箱注册（亲测 QQ 邮箱可用），看不懂的直接机翻就行。

网校

也就是好未来，PandaOCR 只提供了好未来 OCR 的接口，没有翻译接口，所以翻译那个就不用添到项目里了。

免费额度都是每日次，手写也是百次（过去好像是每日万，哭了）。

讯飞

讯飞的 OCR 识别的免费形式，是天的万次使用，时间到或者用完即止。

DeepL

不陌生吧，翻译里的 yyds，它家 API 的免费额度为每月个字符。

但是，亚洲只有个日本，街道那把我给尬住了，所以我放弃了，溜。

Mathpix

注册登录没啥的，免费额度每月次的公式识别，但是创建项目时需要美元的手续费，所以这就意味着你得用到信用卡。

总结

PandaOCR 这个工具，不仅可以像常规 OCR 工具那样截图识别，固定截图和复制翻译的功能给了它更多的可能。

拿来翻译论文、做机翻工具都可以，而这都源于大厂的提供的接口。

PandaOCR 就像是一个中间的掮客，把大厂资源汇集一处，带来了全新的可能。

不过有一说一，现在白嫖大厂资源是越来越难了。

但要说缺点的话，就是这玩意用起来太复杂了。

但可能很长一段时间，我的 OCR 工具都不会改了，为了写这一篇文章，我把所有的接口都申请了一遍，不过也算有所得。

下回碰到更好用的OCR，估计我就转投付费软件的阵营了。

本文链接：https://www.woshiqian.com/post/131358.html

百度分享获取地址：https://share.baidu.com/code

百度ocr

我是钱微信/QQ：5087088

广告位、广告合作QQ：5087088

评论（0）

赞助本站

搜索

网站分类
今日头条自媒体 新媒体运营 百度竞价优化 互联网创业项目 顶尖文案 销售技巧和话术 引流推广 创奇学院 创奇学院：开口就成交演说修炼笔记 精神门内部机密档案

最近发表
分手了还应该留着联系方式吗，搜狐视频的别样情怀，如何用“笑”构筑新生态？ 小红书如何发布视频和图片，在小红书，动漫穿搭也能成为“流量密码” 百家号可以留联系方式吗，搜狐自媒体中的商品卡要怎么设置 微信引流推广，海外媒体推广：软文推广如何做到精准的引流 怎么做引流推广，朋友圈营销引流软文推广的2种方法分享给你 推广引流方法与渠道，送你一个100%有效的免费引流的推广套路 女主播聊天话术，主播直播必备话术（基础篇） 直播带货的发展趋势，如何看待网络直播这一营销模式？ 网红直播带货的营销模式，品牌商与直播营销 新手怎么直播吸引人气，新手主播学会这些话术，进阶主播不是梦

我是钱博客
首页 我是钱专栏 创业思维 百度竞价优化 微商推广 今日头条自媒体 新媒体运营

我是钱

当前位置：首页 » 新媒体运营 » 正文

百度ocr，这大概是我最后一款OCR工具了，一步到位

1400 人参与 2022年08月15日 10:26 分类 : 新媒体运营 评论

评论（0） 赞助本站

搜索

网站分类

最近发表

我是钱博客

1400 人参与 2022年08月15日 10:26 分类 : 新媒体运营评论

评论（0）

赞助本站