为了更好的体验本站,请升级或更换其他浏览器进行浏览。

永不提醒 关闭
<广告>

如何使用丹青中英文文件辨别系统辨识文稿?

文档编号:350003


前言
书面文档不容易保存和携带,很多用户通过扫描仪把书面文档转换成图像格式的电子文档,例如:JPEG、BMP和TIFF格式的文档,这些文档最大的缺点是不容易进行编辑。通过爱普生公司随机提供的丹青中英文文件辨别系统(以下简称:丹青软件)可以把图像格式的文档转换成可以编辑的文本格式,例如:Microsoft Word格式(扩展名是DOC)或写字板格式(扩展名是TXT)。本文详细说明此软件的使用方法。
注:丹青中英文文件辨别系统仅适用于Windows操作系统

适用型号:
扫描仪
GT15000/GT2500/Per1270/1670/2480/2580/3170/3490/3590/4180/4490/4870/4990/V10/V100/V200/V350/V500/V700
多功能一体机
ME200/CX5500/CX8300/CX9300F/RX510/RX630/CX5900/CX6900F/RX690

操作步骤
一. 准备工作:

1.将扫描仪或超一体机与电脑连接好,并正确安装扫描仪驱动程序(操作方法请参考随机提供的用户指南)。
2.安装丹青中英文文件辨识系统。爱普生部分扫描仪或超一体机随机捆绑了该软件,安装方法请参考该软件的帮助文件。
3.将需要识别的文档放置在扫描仪的扫描板上,并打开扫描仪或超一体机的电源。

二. 开始扫描:
1. 选择“开始”—“程序”启动“丹青中英文文件辨识系统”软件,选择“文件” -- “扫描仪设定”选项,选择你所安装的扫描仪或超一体机型号。在工具栏中选择“扫描”按钮,系统自动调用“EPSON Scan”扫描程序,如图(1);

1

图(1)工具栏中选择“扫描”

2. 调用“EPSON Scan”默认为“全自动模式”,推荐使用“专业模式”进行扫描,如图(2);

2

图(2)使用“专业模式”进行设置

注:确保扫描文本的质量,避免出现以下内容:
  a.复印件的复印件、传真、手写字符;
  b.字符间距或行间距很小的文本;;
  c.表格中的文本或带下划线的文本;
  d.草体或斜体字体和8磅以下的字体;

3. 扫描普通文稿时,可以将“文稿类型”设置为“反射文稿”;“自动曝光类型”设置为“文稿”;“图像类型”选择为“黑白”,并且“分辨率”设置在300dpi-600dpi 之间(“分辨率”是影响文字识别效果的主要设置),如图(3);

3
图(3)“分辨率”是影响文字识别效果的主要设置

注:建议普通的五号印刷体采用250--300dpi ;四号以上的字体采用150--200dpi;如果是六号或七号字,使用400--600dpi。若扫描原件是较为粗糙的纸张(如:报纸等),建议您使用600dpi左右的分辨率。

4. 点击“预览”会弹出预览框,将需要扫描的部分通过鼠标框选出来,如图(4);

4 
如图(4)选择要扫描区域

5.适当调整“阀值”,使需要扫描的文字尽量清晰 (“阀值”是影响文字识别效果的主要设置),如图(5);

5 
图(5) “阀值”是影响文字识别效果的主要设置

注:若纸张过薄,扫描结果可能显示出纸张背面内容,影响到文字识别的效果。出现此现象时,请适当减小阀值。.若扫描结果显示出文字颜色较浅,请适当增加阀值。

6.当一切设置完毕后,选择“扫描”。扫描仪会将扫描的图像导入到软件中去,扫描完成后选择“关闭”。

三. 文稿调整:
1. 文稿辨识前先校正倾斜角度,选择“编辑”-“旋转”选项(文稿角度不正将影响文字识别的效果),如图(6);

6 
图(6)使用“旋转”校正倾斜角度

2. 使用“橡皮擦”工具将图片中的杂点去掉,如图(7)。

7
图(7)使用“橡皮擦”去掉图片的杂点

注:由于丹青系统无法辨识黑底白字的图片,若输入的正是此类图片可利用“编辑”-“反白”的功能将图片转换成白底黑字之后再进行辨识。

四. 文稿识别:
(1)选择工具栏中的“版面设定”按钮设置文稿的版面,在“表格设定”中选择-“非表格文件”,“内容设定”中选择文档中所使用字符,如图(8);

8
图(8)在“版面设定”中设置

(2) 选择“版面分析”,软件自动完成版面分析后,请点击工具栏中的“辨识”,软件会按照相应设置来识别文字,如图(9);

9
图(9)“版面分析”后自动框出要识别区域

(3)选择“词库校对”,软件会根据软件词库中常见的词语搭配关系,分析整篇文章,自动校对并修改文稿中没有被正确识别的常见词语,如图(10);

10
图(10)使用“词库校对”将修改没有正确识别的常见词语

(4)如果使用“词库校对”功能依然无法识别某些文字,可选择“查看”-“文稿编辑模式”选项,手动校正文稿,如图(11);

11
图(11)使用“文稿编辑模式”选项手动校正文字

(5) 校对完毕,选择“保存”,并将保存类型设置为“MS Word文件格式” 或者“TXT文本格式”。保存好之后就可以直接通过Word 等软件的进行文字编辑了,如图(12)。

12
图(12)选择“保存”并将保存类型设置为MS Word文件格式

注:表格识别与文档识别的操作步骤基本相同,只在“版面设定”窗口中,“表格设定”选择“一般表格文件”,“内容设定”选择文档中所使用字符,如图(13)。

13 
图(13)表格识别的“版面设定”

五. 文稿扫描识别过程结束

 

 


您的问题是否解决?
*
如果您的问题未能解决,请点击(此处)联系在线工程师进行咨询。非工作时间, 请 Email 联系我们。在线工程师工作时间:周一至周日 8: 00-22: 00(国家法定节假日除外)
如果该文章未能满足您的需要,建议您留下意见和联系方式,技术人员会及时和您取得联系。您的联系方式不会用于商业用途。谢谢!
推荐

立即查询 >