wangfreexx / wangfreexx-tianruoocr-cl-paddle Goto Github PK
View Code? Open in Web Editor NEW天若ocr开源版本的本地版,采用Chinese-lite和paddleocr识别框架
License: GNU General Public License v3.0
天若ocr开源版本的本地版,采用Chinese-lite和paddleocr识别框架
License: GNU General Public License v3.0
我想要通过代码 直接识别
作者你好,众所周知OCR接口容易失效是一大痛点,所以增加自定义OCR接口很重要,相信很多人也有这样的需求。
功能需求:
由用户自定义OCR接口,程序读取用户填写的配置信息:
OCR API URL :http://example.com
Data: {
.....
}
程序将截图转base64添加到Data,然后Post请求OCR URL,再由自定义OCR接口返回识别参数(返回的参数格式由你决定,用户根据你的参数格式做接口修改)
请作者大大可以采纳我的建议,我代表大家感谢你的付出!
PA-OCR 英文数字模型下 识别的英文单词 比 中文模型下的识别准确率高很多。
美中不足的是 识别的英文单词之间 却会缺少空格。
捕获到未处理异常:System.IO.IOException
异常信息:请求的操作无法在使用用户映射区域打开的文件上执行
异常堆栈: at System.IO. Error.WinIOError(Int32 errorCode, StringmaybeFullPath)
at System.IO.FileStream.Init(String path, FileMode mode, FileAccessaccess, Int32 rights, Boolean useRights, FileShare share Int32 bufferSizeFileOptions options, SECURITY_ATTRIBUTES secAttrs, String msgPath,
Boolean bFromProxy, Boolean useLongPath, Boolean checkHost)at System.IO.FileStream..ctor(String path, FileMode mode, FileAccessaccess, FileShare share)
at System.Xml.XmlDocument.Save(String filename)
at TrOCRHelper.IniHelper.SetValue(String sectionName, String key.String value)
at TrOCR.Program.DealErrorConfig()
at TrOCRProgram.Main(String! args)
无论是CL还是Pa接口,英文识别都有毛病;首先CL无法识别全部英文,其次Pa接口选择英文数字模式后,可以识别出全部英文,但是无法自动识别英文单词之间的空格,导致长达几行的英文段落中的所有单词都连在了一起→既没法阅读也没法翻译
试了一下主要的功能都挺好的,除了二维码这块的体验上有些不如人意。
于是想问问能否增加一下先校验内容是否二维码,是则直接输出了(至少https这种的能直接输出),否则的话进行正常ocr识别
希望作者每次更新文件名能保持命名规律,方便添加到 scoop 中自动更新
設置的窗口不靈活,導致一些設定功能不顯示。比如:Tab1‘常規’的自動保存被蓋了一半。
有人在pdd卖你做的软件卖的很多了
拆分、合并、分段都是不错的功能,朗读也可以来朗读英文。
I don't know Chinese so I don't how to change to English interface
目前有两个问题想请教一下
1、谷歌翻译的接口是否有上限之类的,用了一段时间后(大概翻译了几十次和一千多字符左右)就直接报错了
[谷歌接口报错]:
1.网络错误或者文本过长。
2.谷歌接口可能对于某些网络不能用,具体不清楚。可以尝试挂VPN试试。
3.这个问题我没办法修复
2、输入百度翻译的api后无法使用百度翻译,正常谷歌翻译可用的情况下也是,排除了网络和api问题,想问问是不是没有用百度的通用翻译API HTTPS 地址:https://fanyi-api.baidu.com/api/trans/vip/translate
报错:翻译超时,请检查网络,或更换翻译平台。
公司内网电脑32位的
作者您好,
微软雅黑这个字号很小而且很粗,字很挤看着太累了,不如宋体看着顺眼,现在是只能识别后再修改成宋体,而且下次识别的结果还是微软雅黑的,很麻烦。请问怎么能把默认字体设置成宋体。
期待回复。谢谢
你好,我已经用你事先编译好的onnxruntime.dll替换原本ML.onnxruntime里的dll,发现还是还没使用。是我哪里步骤有问题吗,是不是少了一个win7版本的Microsoft.ML.OnnxRuntime.dll
希望增加批量图片识别和表格识别,在工作中经常能用到
每次取消后再次启动,还是会变成首行缩进模式。
建议谷歌翻译直接更改为代理的接口
大佬, 能问下天若ocr的接口问题吗, 官方这个接口啥意思呀 //image:要识别的图片
public static string OCR_Custom(Image image)
{
//string url = "";
//string poststr ="";
//string result =CustomHelp.HttpPost(url,poststr);
//获取请求获取解析结果后按照下面格式进行解析
TxtFormat.Root jsonRoot=new TxtFormat.Root();
jsonRoot.result=new List<TxtFormat.TextBlock>();
jsonRoot.isHasLocation=true;//判断是否含有坐标返回
for(int i=0; i<5; i++)//遍历返回的json字符串
{
TxtFormat.TextBlock textBlock = new TxtFormat.TextBlock();
textBlock.Text = "公式测试文本"+i.ToString();//json内的文本
textBlock.TopLeft = new Point(0,0);//左上角坐标
textBlock.TopRight = new Point(0,0);//右上角坐标
textBlock.BottomRight =new Point(0,0);//右下角坐标
textBlock.BottomLeft =new Point(0,0);//左下角坐标
jsonRoot.result.Add(textBlock);
}
string json = JsonConvert.SerializeObject(jsonRoot);
return json;
}
识别弹窗中若输入数字必然是不常用的全角,很不方便,希望能调整一下。
另外,识别内容的合并功能希望能再优化一下,最好能去掉所有格式,这样更便于使用。
开发者您好,
诚邀您参加PaddleOCR社区常规赛。社区常规赛意在扩大基于PaddleOCR开发的各种项目的影响力,通过常规赛形式对优质的社区项目进行奖励。并且所有报名项目都会收录在社区贡献文档中,通过PaddleOCR平台流量让优质的项目获得更多关注。
如果您有意参加,请在1月12日前在上述链接中报名并提交本项目。谢谢!
PaddleOCR-PM
或者设定字体后,能够保存到配置文件?
现在的默认字体不怎么好看的感觉╰(°▽°)╯
https://ocr.space/ 这个网站提供免费api,每月有25000条,挺好的
你好,
希望提供命令行静默操作。这样的话方便使用其他软件后台调用它。
平时使用ShareX多一些,希望可以添加命令好调用天若OCR,现在只能打开软件,还需要再次按F4。。
还有一个功能需求,,希望可以用其他颜色标注出准确率低的字,,,
非常感谢!
祝好
天若OCR原版有公式接口,对于理工科来说很有用途,这里的版本能加上这个接口设置吗?
如果可以就太棒啦(●。∀。●)精力不够就不必啦~
系统是win11最新版本,可以正常识别文字正常翻译但就是无法朗读/(ㄒoㄒ)/~~真的很需要朗读功能
开了系统的显示缩放也没有效果
本想反映置顶无效,结果发现是静默识别默认开启的问题,很多时候也不能保证识别百分百正确,还是需要在显示界面编辑一下,还有识别英文看翻译。
文本识别后,有多行的文本,自动复制的不能换行
需要手动全选复制才能换行,
修改版的自动识别后直接把多行连城一行了
win11系统1381版本,快捷键的组合键不可用,修改为ctrl+alt+其他不可生效,只能F1234等等或者单个的按键例如a\b\c这种单个的按键,组合键无法保存
只能Ctrl+O,我想Ctrl+Alt+O
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.