一种采集和统计分析数据的方法
2020-01-12

一种采集和统计分析数据的方法

本发明公开了一种采集和统计分析数据的方法,该方法包括终端数据采集方法和数据统计分析方法,终端数据采集方法是指终端与数据采集服务器使用约定的数据协议进行通讯,数据采集服务器以UDP方式提供服务,终端将状态和行为数据以UDP数据包的形式发送到数据采集服务器,数据统计分析方法,其统计分析的项目包括:各个栏目的实时在线人数、在一段时间内各个栏目的用户访问状况、每个终端用户的实时行为和历史行为。本发明由于采取多层系统结构,且数据收集时采用UDP形式和约定数据协议,可准确收集终端用户的使用状态和行为数据,并对用户动态信息进行分析和统计。

消息格式:表3中将20、21位的用户当前所在栏目数设为1,22、23位栏目标识设为37(休闲游戏栏目的标识号)。

数据采集服务器收到系统退出消息,将用户的状态设置为离线。并将本次用户登陆—退出的记录写入数据库,然后将本条退出消息写AMSMQ队列。

一种采集和统计分析数据的方法

下面结合附图和具体实施例对本发明作进一步详细的说明。

附图说明

一种采集和统计分析数据的方法

在上述系统中的数据采集采用如下的终端数据采集策略:

综上所述,本发明提出的一种进行数据采集和统计分析的系统和方法,能够准确地收集用户在集成了多个内容和服务的系统中的使用状态和行为数据。并对这些用户动态信息进行分析和统计,该系统尤其适用于宽带数字家庭娱乐系统中采集和分析用户行为,并为不同用户提供完美的个性化服务系统中。

为解决上述技术问题,本发明提供了一种采集和统计分析数据的方法,

所有用户的行为历史记录保存在数据库,此数据由数据采集服务器在用户的一次登入登出过程中,全程记录到数据库。此用户用于整理每个用户的行为规律,分析出用户的习惯和爱好,便于对用户提供一对一的服务。

其中0〜3字节为数据通讯协议标志,用于标志该UDP数据包是属于本系统数据采集协议包,如定为"PRAP";4~5为两字节的版本号;6〜7为协议包BODY部分的字节长度;8〜11为协议包B0DY的类型标识,四字节的编码,该编码是全局统一的;12〜15为timestamp,即时间戳。

BODY数据体格式可变,数据的意义由HEAD中的Type位来标识。当Type为l时,如下表3:<table>tableseeoriginaldocumentpage11</column></row>

Description

综上所述,本发明提出的一种进行数据采集和统计分析的系统和方法,能够准确地收集用户在集成了多个内容和服务的系统中的使用状态和行为数据。并对这些用户动态信息进行分析和统计,该系统尤其适用于宽带数字家庭娱乐系统中采集和分析用户行为,并为不同用户提供完美的个性化服务系统中。