ABBYY Recognition Server提供了一系列关键功能,可以使基于文本的信息锁定在易于发现的静态图像中,并将其转化为宝贵的资产。它们包括:

从任何文档创建PDF

ABBYY Recognition Server自动转换纸张,图像和电子文档,并将其保存为压缩存档兼容文件,如PDF或PDF/A。支持多种输入格式,包括DOCX,XLSX,ODT,PPT等。

支持各种转换

ABBYY Recognition Server可以处理直接从扫描仪和MFP获取的图像文档,或从网络或FTP文件夹,Microsoft® SharePoint®库或邮箱导入的图像文档。它还提供了一个用于从客户端应用程序以编程方式提交任务的API。转换后的文档可以传送到目标文件夹,SharePoint库或电子邮件地址,并通过API返回给客户端,或通过脚本规则路由到目标业务系统。对于图像文档的“只读”存档,可以使用特殊模式,该模式允许以可搜索的格式复制存档的整个结构而不更改原始图像。

与Microsoft SharePoint集成

图像可以通过OCR进行处理,并在上传到Microsoft SharePoint网站之前以一致的方式转换为可搜索的文件。已存储在SharePoint库中的图像文档可以在库中的可搜索PDF中进行转换。扫描的PDF文件可以使用文本层进行增强,并存储在跟踪文档历史记录的新版本号下。所有新到图像都将被自动检测和转换。对于SharePoint中的TIFF存档,IFilter可用于背景内容提取

OCR和条形码识别

ABBYY Recognition Server的核心是一个功能强大的OCR引擎,可以处理超过190种语言的文档。它由一个条形码识别引擎作为补充,读取1D和2D条形码,如PDF417,QR码等。条形码可用于执行文档分离或作为文档元数据的来源。

分配文档类型和元数据

文档类型可以通过脚本规则自动检测或由操作员手动分配。索引值(元数据)可以通过方便的点击工具从文档内容中捕获,并根据其类型分配给每个文档。

附加功能

描的PDF文件可以通过自动注入文本层转换为可搜索的PDF和PDF/A文档。已经包含可搜索文本(例如,数字化出生的PDF)的PDF文件可以按照原样移动到目的地,或者转换为保存书签,附件,元数据和原始图像质量的PDF / A文件。
ABBYY Recognition Server使用先进的MRC压缩技术生成小尺寸和高视觉质量的PDF文件。通过对创建的PDF文件的每个单独的层应用不同的压缩方法来实现MRC压缩的PDF的最佳大小/质量比。
内置的负载平衡机制确保服务器以最有效的方式利用所有可用的硬件资源。排队的任务在处理站及其CPU之间动态分配以进行并行处理。管理员可以使用其他负载平衡工具,以调度和优先级的形式提供。
ABBYY识别服务器可作为独立的独立服务使用,也可作为大型业务系统的组成部分。它提供了多种集成工具,包括基于COM的API,Web服务API,脚本和指令XML文件(XML-Tickets)。