单击【整理】|【删回车】栏的启动器,打开“删除冗余回车设置”对话框,如图9所示。
图9 删除冗余回车设置
图9中,有三种段首规则供选择,一是“紧”,二是“松”,三是“中等”。如果将“紧”选项选中,那么仅识别较常用的段首文本,得到较少的段落;如果将“松”选项选中,那么将识别较常用、次常用和不常用的段首文本,得到较多的段落;如果将“中等”选项选中,那么将识别较常用和次常用的段首文本。
如果选中选项“视冒号为段落结束”,那么把冒号视为段落结束标志之一。
如果选中选项“强制以较长段落为参照”,那么计算参考段落时,以所有段落中相对较长的段落作为参考段落进行比较分析。
计算出参考段落长度后,小于参考段落一定长度比例(比如图9中的80%)的段落将被视为段落结束。
一行一段的段落字符数特别少时,往往来自于对某些表格文字的识别。通过设置参考段落最小长度可以将这些段落排除。
参考段落最小长度太小(小于5),而且所操作的文档内容的每段的字数也非常少时(小于5),处理效果较差。
计算段落“字符数”时,每个英文字母和空格单字节字符计半个字符。
注意:“删除冗余回车”功能是按照以上设置和一定规则删除不必要的回车符,不能保证百分之百符合期望。
相关主题