如何区分手写体和印刷体模式识别

如题所述

举报该文章

相关建议 2017-06-21

这个问题其实是OCR , 和ICR的问题...
ocr 是一门很难技术，基本上也少有公开的...

我理解的ocr 是获取到一个图片文字之后，提取出字体框架模型，然后在相应的字典库中查找匹配模型(相当于2 楼所说模式识别)，找到匹配度最佳的那个，既是所识别的字符...
我所说字体模型是什么呢？我理解的是，如汉字，大概是一个至少4*4像素点的区域(好像不能少于这个，要不汉字的几个笔画很难区分)，

最后，如果匹配上了就是ocr。

难点就在这里！ocr中所用的字库一定小于ICR，复杂度也小于ICR, 比如汉字"一" ，打印体的可能只需要定义一种字模就OK(不考虑各种字体，效果字),但对于icr，则要定义这个汉字"一" 是歪了斜了，甚至有的人会写成可以匹配到"."(圆点)字模的程度...那这就很难了。当然这个例子可能不恰当！
顺便说一下，就当下(2010年2月为止)汉字的ICR 基本上不能商用...至于拉丁字母文字和数字方面的ICR,部分国外厂商测试效果还不错...比如abbyy, iris . 还有一家美国的公司(暂时性遗忘该名称)...

就说这么多...偶然逛逛csdn，等分ing........

温馨提示：内容为网友见解，仅供参考

当前网址：https://22.t2y.org/zz/ctft20ccx000xx62ix6.html

其他看法

无其他回答

相似回答

如何模式识别简单的手写数字答：手写体数字识别的基本过程：系统主要由手写体数字识别的训练过程和识别过程组成，训练过程和识别过程均包括预处理、特征提取和模式识别三部分。一般包括如下过程：获取数据→预处理→特征提取→选择分类→识别输出。

手写体识别系统的原理是什么?答：如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机，并着重于汉字识别的研究。文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。信息采集将纸面上的文字灰度变换成电信号，输入到计算机中去。信息采集由文字...

如何区分手写体和印刷体 模式识别

如何区分手写体和印刷体模式识别