您的位置:寻梦网首页编程乐园PHP 编程>站点流量监测系统的研究与应用
站点流量监测系统的研究与应用
作者:汤茂斌 余国庆 李就好  来源:微计算机信息



摘要:站点流量监测系统是对网站的流量进行统计,并对统计的数据进行分析。分析的内容包括:时段分析、搜索引擎、地域分析、客户端分析、页面分析,从而为衡量一个网站的价值提供有力的评证,还可以根据分析的数据对网站的内容做适当的修改,以提高网站对访客的粘性。
关键词:流量监控;时段;地域;搜索引擎;客户端

1 引言

本文通过对网站流量数据的统计结果进行分析,来衡量网站价值。目前国内对网站流量分析最著名的公司是中国站长联盟,此公司的网络平台被国内很多中小型企业做为流量统计标准平台;此外,还有一网络爱好者开发的流量数据分析软件,这类软件主要通过对web服务器的日志进行分析得到结果,此类软件只能针对某一个web服务器(比如IIS或是Tomcat等)设计。

国外衡量网站的标准主要有Alexa排名和Google Pagerank;PageRank是google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,网站PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站/网页在google搜索结果的排名中有优先权[1]。Alexa通过Alexa工具条,来收集用户的资料,以便统计网站流量和排名。Alexa网站排名的计算,是以网站的每天平均使用人数、 人均访问页面数(与人数和人均页数之乘积成正比)为基础, 以这二者的几何平均数来排名。而正式名次,基于最近三个月之内资料的平均值。除全世界网站排名之外,Alexa网站亦提供各种语言、地区、主题的分类排名[2]。排名预设基于只能用于InternetExplorer的AlexaToolbar得来,并非所有用户都用它,因此使用它的人数是否能代表一般网络用户具有争议。

本文分别介绍对各类站点流量的统计分析算法,包括分时段统计、搜索引擎统计、地域流量统计、客户端使用状况统计、页面访问统计,并对五种数据进行提取和合理的分析,给出了实验结果。能提高网站管理者和开发人员对流量统计的认识,从而进一步加强对网站效益的开发。

2 站点流量统计分析的实现

(1)时段分析

时段分析是指对一个网站的24个小时浏览情况进行统计,统计的内容包括访问量、独立访客量;此功能可以帮助我清楚了解到所统计的网站各个时间段的访问情况,从而在这些时间段内做各种应对的工作。

(2)搜索引擎统计

搜索引擎统计是对通过几大搜索引擎(百度,Google,雅虎,腾讯SOSO,搜狗)进入统计站点的客户进行统计;搜索引擎统计可以让我们了解到站点被搜索引擎收录的一个概况,从而针对各种搜索引擎做出优化,让站点更多的页面被搜索引擎收录,以便更多的客户能够搜索到。

(3)地域分析

地域分析是按地区(以省为单位)对进入统计站点的客户进行统计;地域分析可以让我们了解到各个地区访问站点的情况,从而提供给需要在各个地区拓展的广告商有力的数据,以便广告商在此站点做广告,增加站点广告费收入。

(4)客户端分析

客户端分析是访问统计站点的客户使用的操作系统别及浏览器类别进行统计; 客户端分析可以让我们了解到访客的上网工具的基本情况。

(5)页面分析

页面分析是对统计站点的各个页面的访问量进行统计; 页页分析可以让我们了解到站点各个页面的访问情况,了解哪些内容更受访客的观注,从而增加一些受访客观注的内容来提升站点的访问量。

3 五种统计数据的提取与分析

对站点流量的分时段统计、搜索引擎统计、地域流量统计、客户端使用状况统计、页面访问统计后的五种数据进行提取,给出实验结果,进一步对统计的数据进行分析,从而得到一衡量网站价值的凭证。

(1)数据提取的流程图


                      图1  数据提取的流程图

(2)数据提取的设计与实现

站点流量统计数据的提取:

在数据访问层类的模块中封装一个类UpdateStat,更新统计的数据,结构如图2:

                  

                            图2 类UpdateStat

类UpdateStat中的方法Get_IP_ProvinceID是传递一个IP字符串返回所在地区的编号, db是声明的一个自定义的数据操作的类,用于操作数据库(更新数据库存的数据);UpdateStatGO传递了七个参数:

string ID,         统计站点编号

bool NewAgent,     标识是否新访客

string ProvinceID, 地区编号

string SearchType, 搜索引擎类别

string OSType,     操作系统类别

string BrowserType,浏览器类别

string Url         当前页面地址

UpdateStatGO调用存储过程UpdateStat,更新几类统计的数据(时段分析、搜索引擎、地域分析、客户端分析、页面分析)。[3] [4] [5]

以下是UpdateStat类的主要代码:

public class UpdateStat

    {

        //声明一个类数据库操作类,此类已封闭了数据库的相关操作的几个方法

        private DB db = new DB();

        //更新几类统计的数据(时段分析、搜索引擎、地域分析、客户端分析、页面分析)

        public void UpdateStatGO(string ID,bool NewAgent, string ProvinceID, string SearchType, string OSType, string BrowserType, string Url)

        {

            SqlParameter[] parameters = {

              new SqlParameter("@ID", SqlDbType.VarChar),

                new SqlParameter("@NewAgent", SqlDbType.Bit),

              new SqlParameter("@ProvinceID", SqlDbType.VarChar),

                new SqlParameter("@SearchType", SqlDbType.VarChar),

              new SqlParameter("@OSType", SqlDbType.VarChar),

               new SqlParameter("@BrowserType", SqlDbType.VarChar),

              new SqlParameter("@Url", SqlDbType.VarChar)

            };

            parameters[0].Value = ID;

            parameters[1].Value = NewAgent;

            parameters[2].Value = ProvinceID;

            parameters[3].Value = SearchType;

            parameters[4].Value = OSType;

            parameters[5].Value = BrowserType;

            parameters[6].Value = Url;

            db.ExecuteScalar("UpdateStat", parameters);

        }

        public string Get_IP_ProvinceID(string IP)

        {

            SqlParameter[] parameters = {

                 new SqlParameter("@IP", SqlDbType.VarChar)};

            parameters[0].Value = IP;

   return db.ExecuteScalarOneValue("Get_IP_ProvinceID", parameters).ToString();

        }

    }

 

存储过程UpdateStat传递的参数有以下:

@ID varchar(10),            网站编号

@NewAgent bit,              标识是否新访客

@ProvinceID varchar(20),  地区编号

@SearchType varchar(20),  搜索引擎类别

@OSType varchar(20),       操作系统类别

@BrowserType varchar(20), 浏览器类别

@Url varchar(100)           当前页面地址

存储过程UpdateStat每次调用都将更新统计站点相应的数据[6]

4 结论

站点流量监控系统是通过对访问数据实时存储来实现统计数据的提取。并对数据的统计结果进行分析, 从而得到一衡量网站价值的凭证,对网站的发展有以下作用:

(1)及时掌握网站推广的效果,减少盲目性;

(2)分析各种网络营销手段的效果,为制定和修正网络营销策略提供依据;

(3)通过网站访问数据分析进行网络营销诊断,包括对各项网站推广活动的效果分析、网站优化状况诊断等;

(4)了解用户访问网站的行为,为更好地满足用户需求提供支持;

(5)作为网络营销效果评价的参考指标。

(6) 帮助了解网站的访问情况,提前应对系统负荷问题

(7) 根据监测到的访问客户端的信息来优化网站设计和功能

本文作者的创新点在于通过对访问数据实时存储、统计,并实现统计数据的提取和分析, 从多角度得到一衡量网站价值的凭证。站点管理者可以根据分析的数据对网站的内容做适当的修改,以提高网站对访客的粘性。

参考文献

[1][Germany]Christian Holm, Mike Kruger, Bernhard Spuida. Dissecting a C# Application Inside SharpDevelop. 2003.03.

[2]Xu L, OJA E, Kultanen P.A new curve detection method: Randomized Hough Transform(RHT)[J]. Pattern Recognition Letters,1990.11(5):331-338
[3] 唐进等. 基于统计聚类随机椭圆检测方法[J].  微计算机信息,2007,11-1:237-238

[4] 贾海朋等. LabVIEW访问Access数据库的研究[J].  微计算机信息,2007,11-1:102-103

[5] 然哥诺辛尔蒙 著,肖奕,曹俊 译.  ASP.NET2.0XML高级编程(第3版)[M].  北京:清华大学出版社 2005

[6] http://www.gamutsoft.net/services_035.html