纸质与电子文档中的注释的捕获及显示
2019-11-26

纸质与电子文档中的注释的捕获及显示

一种软件和/或硬件装置使得用户能够将注释与包含在数字内容中的文本段关联。捕获客户端允许用户创建与在由用户查看的内容上的文本段关联的注释。注释由注释服务器与该文本段关联存储。当用户随后查看内容时,该装置将在查看内容中的文本片段与所存储的文本段比较。发现匹配该文本片段的文本段由该装置识别,并且关联的注释由显示客户端在查看的内容上显示给用户。由于所存储的注释与文本段关联而不是与原始内容或和从其识别文本段的原始内容关联的标识符关联,因此注释能应用于任何在今后利用该文本段的内容。

下面的第13节描述位于捕获文本本身之外的但可能对识别文档起重要帮助的各种不同因素。这些因素包括诸如最近扫描的历史、特定用户的长期阅读习惯、用户的地理位置和用户对特定电子文档的最近使用之类的事情。这样的因素在此被称为“上下文”。

在对特定内容的访问限于特定人群(诸如客户或者雇员)的情况下,这样的内容可以由防火墙保护并且因此通常不可由第三方进行索引。不过,内容提供者可能希望对保护的内容提供索引。在此情况下,内容提供者可以向服务提供者付费来向系统订户提供内容提供者的索引。例如,律师事务所可以对所有客户的文档编索引。该文档存储在该律师事务所的防火墙之后。然而,律师事务所希望它的雇员和客户可以通过便携扫描仪访问该文档,因此其向服务提供者提供该索引(或者指向该索引的指针),服务提供者进而在该律师事务所的雇员或客户经由他们的便携扫描仪提交再现文档扫描的搜索项时搜索律师事务所的索引。该律师事务所能够向服务提供者的系统提供雇员和/或客户的列表以使得此功能或该系统能够在搜索该律师事务所的索引之前通过询问该律师事务所来验证访问权限。应当注意的是,在之前的示例中,由律师事务所提供的索引只是该客户的文档的索引,并不是律师事务所的所有文档的索引。因此,服务提供者只能够授权该律师事务所的客户访问该律师事务所为该客户编索引的文档。

10. 5报酬模型

该设备可以嵌入在移动电话中或以某种其他方式与移动电话账户相关联。例如,可以通过将与账户关联的SIM卡插入到扫描仪中而将该扫描仪与移动电话帐户关联。类似地,该设备可以嵌入在信用卡或其他的支付卡中,或具有与这样的卡连接的装置。该设备因此可以用作支付代币,并且通过来自再现文档的捕获可以启动金融交易。

同样,用户不是总能监控感兴趣的文档。因此一些实施例包括提醒用户注意注释活动(例如,由特定人作出的文档注释、对特定文档的注释、对任何用户文档的注释、对任何用户注释的注释/响应等等)的注释通知/警告。

8. 1认证的文档访问

该系统传送用于再现出版物的增强内容的方式之一是使用再现文本中的关键字。当预定的关键字由用户捕获时,捕获的关键字触发与该关键字关联的内容的传送。在一些实施例中,关键字由关键字服务器440辨别,使得从数据库中提取内容并被发送到与用户关联的设备(任选地诸如显示器或扬声器之类的输出设备)。该关联的设备可以是附近的显示器或打印机。该系统可以将每个再现的关键字(或关键字的组合)与产品或服务的广告关联。作为示例,如果用户从再现文档(例如汽车杂志)捕获字词“新车”,则可以触发该系统将本地福特经销店的广告发送到在便携捕获设备302的位置附近的显示器。

图3A和3B是为允许用户创建和存储对任何类型内容的注释而由该装置实施的捕获过程300的流程图。无论何时用户希望对其正查看的特定内容段添加一个或多个注释,该装置都可以执行该捕获过程。创建可用任何类型内容操作的跨平台捕获客户端的挑战之一是用户可以查看内容的格式的多样化。例如,即使是像文档那样普遍的一段内容也可以各种格式表不,包括MicrosoftWorcUAdobePDF>CorelWordPerfect、OpenDocument及其它格式。虽然可以创建接口来与这些格式的每一种的内容进行对接,以确保注释捕获客户端130的宽泛适用性,但是该客户端任选地与正向用户显示的内容的图像进行交互而不是·与由用户使用的查看应用所规定的底层格式内容进行交互。然而,在(诸如通过查询应用API)可获得关于显示内容的信息的那些情况下,所述系统任选地使用此信息代替对显示的内容本身执行图像分析。在块305中,在没有API可用来描述用户显示器上正呈现的内容的情况下,由该装置捕获包含正向用户显示的内容的全部或部分屏幕缓冲器。在块310中,由OCR/识别组件150处理捕获到的屏幕缓冲器数据从而识别正向用户显示的文本。作为识别过程的一部分,数据、图形和显示格式(displayformatting)能够被识别并且任选地用作主题或锚材料,或者可以将其丢弃。通过从用户为查看或操纵内容而使用的任意应用的显示输出中提取文本,捕获客户端130能够在不必与每一显示内容的应用的API进行对接的情况下识别内容中的所有文本,并且其处理没有这样的API可用——即没有关于显示内容的信息可用的情况。尽管将OCR/识别组件描绘为在用户的查看设备的表示层捕获客户端130中,但是本领域技术人员要明白,可以通过远程服务执行一些或全部OCR/识别处理。例如,该装置可以在捕获客户端处执行初始处理,并且可以将部分处理过的数据的内容图像或者捕获的屏幕缓冲器数据的全部或若干部分传送到可以执行类似或更加资源密集的OCR处理(例如,标志和商标的图像匹配、稳健的OCR处理、稀有或特殊字体的处理等)的远程OCR/识别服务。远程处理从用户设备移除了一些或所有计算负担,同时允许执行更复杂的OCR/识别处理。