红依兰生殖机构

红依兰生殖机构

文档清理:摆脱太多标签

admin 159 90

文档清理:去除过多的标签

当你打开一个文档(如memoQ、Trados、Wordfast等。)在CAT工具中,你可能会注意到某些段落中的标签过多;这类文件通常由PDF源转换而来。格式不正确会导致翻译中出现很多问题,尤其是使用CAT工具翻译时,会产生过多的标签,导致文本翻译困难。在保留格式和布局的同时,有一些方法可以安全地删除尽可能多的不必要的标签。在这些工具中,我们以前探索过CodeZapper。

此外,TransTools的一部分是Document Cleaner,这是一个准备畸形文档的工具集合,用于翻译和移除标签中的文档,这些标签总是出现在CAT工具中(例如SDL Trados Studio、memoQ、Wordfast Pro、DejaVu等。).如果文档有许多书签、非标准字符间距、文本和段落阴影、连字符、常规格式的字符样式等。

可用命令

文档清理器提供以下命令:

?标签去除器OCR或PDF转换软件在处理PDF文件或图像中的文本时,通常会应用许多不同的复杂文本格式,这会在CAT软件中创建大量的标签。在大多数情况下,这种复杂的格式在原始的可编辑文档中是找不到的,所以您可以安全地删除它,并且仍然拥有看起来像原始文档的文档。

“标签清理器”命令执行以下操作,以最小化标签并使文档更加用户友好:

修正了不可见的格式问题,

删除文本和段落阴影,

删除文本突出显示,

重置不均匀的字符间距,

删除手动连字符,

修复了格式问题,以及

文档清理:摆脱太多标签

将“黑色”的字体颜色改为“自动”。

你也可以在这里观看Dominique Pivard关于Tag Cleaner的视频。

?重新保存-有些文档在导入CAT工具时,每个片段中包含太多标签。该命令将文档保存为RTF并返回到原始格式,这通常会消除这种“流氓”标签。

?表格列对齐器——当您识别包含多页表格的文档时,这些表格被识别为多个表格,每页一个。但是,当您添加这些表格时,它们通常会有未对齐的垂直边框。该命令有助于正确设置这种表格的格式。

?线条移除-一些OCR工具插入垂直或水平浮动线条,而不是边框。这个命令可以帮助您更容易地跟踪和删除它们。

?un frame-大多数OCR工具在表格、图像或文本块周围插入框架,但它们通常是不必要的,可能会给翻译人员带来问题。例如,如果文本被扩展,则翻译后的文本无法适合或放在多个页面上。此命令可以帮助您删除此类框架并保留其内容。

?书签清理-如果文档包含书签,它们将作为标签对导入到CAT工具中。此命令删除某些类型的书签,例如不是从字段或超链接引用的书签,或者目录书签。

?应用可变行高-当OCR工具处理表格时,它们对每一行应用一种特殊的格式,以便行高高于或大于原始PDF/扫描中的行高。有些工具使用固定的行高,这可以防止在向行中添加更多文本时行扩展。此命令允许您删除此格式,以便根据行中的文本量来扩展或收缩行高。

?格式化工具-为了匹配原始文档格式,OCR和PDF转换工具使用段落间距、缩进、段落和文本颜色、字符样式等。格式化工具是一组命令,允许您删除特定类型的段落并将文本格式化为默认值。