Google Analytics中的三种流量来源
通常,在我们输入域名访问一个网站的时候,浏览器会向服务器发送一个HTTP请求,在这个请求的头部信息中会包含一个Referer字段,记录了本次请求的来源URL地址。
推介网站流量:
如果你通过点击http://webdataanalysis.net/上的友情链接访问我的博客,在HTTP请求的Referer字段中就会记录下这个URL地址。同时在页面加载后Google Analytics的追踪代码会向Google返回一条数据,参数中utmr也会记录到这个URL地址。
搜索引擎流量:
如果是通过搜索引擎呢?当我们在搜索引擎中查询关键词的时候,搜索结果页的URL里会带有我们当前搜索的关键词内容。比如,我在google搜索我的网站域名。搜索结果页的URL是这样的。
http://www.google.com/search?hl=en&q=bluewhale.cc&aq=f&aqi=g-s1g2&aql=&oq=&gs_rfai=q是google 的查询参数,后面是我本次搜索的关键词。点击结果访问网站时,HTTP会把这个URL记录到Referer字段里。
在ga,js文件中,会对每次Referer字段的URL进行比较,如果是搜索引擎就保存关键字信息。并一起发送回google的服务器。
直接访问流量:
如果是直接输入域名,或者是从收藏夹中访问,在HTTP的请求中就不会有Referer字段,同时Google Analytics的返回数据中utmr的值也会为空。
三种流量来源的记录方式都说完了,看起来还算清楚,HTTP头信息记录访问的Referer信息,Google Analytics按照Referer信息对来源进行判断,有Referer信息的算作推介来源,Referer信息与JS文件中的搜索名称匹配的保留关键字信息,并算作搜索来源。没有Referer信息的算作直接流量。看起来不会有什么问题的。但实际上并不是这么准确的。
PS:此外,在Google Analytics的流量来源饼图中有时还会有黄色的部分。这部分表示单独标记过的URL所产生的流量。
对流量来源造成影响的因素:
影响搜索引擎流量的因素:
Google Analytics依靠JS文件中的搜索引擎名称和查询参数列表来判断本次访问的来源,但JS文件中并没有覆盖所有的搜索引擎。所以当Google Analytics在找不到对应的搜索引擎名称,或者查询参数的时候,就会把这次访问归为推介网站来源。
影响推介网站流量的因素:
Google Analytics依靠Referer字段来获得访问的来源URL,并根据是否有Referer信息来对流量进行分类。但有时却无法获得这部分信息。比如:
1 点击Flash广告中的链接
2 点击包含在JS中的链接
3 使用鼠标拖拽链接打开页面
4 … …
Kevin Yang的博客中列举了各种可能丢失Referer的原因,并针对每个原因在不同的浏览器中进行了测试。
影响直接访问流量的因素:
所有丢失Referer信息的来源都会被Google Analytics算作直接流量。所以,直接访问流量的组成比较复杂。里面可能包含了部分推介来源的流量,这会使报告中的直接流量膨胀。同时当访问者首先通过搜索引擎或标记链接访问网站后,再次直接访问时,这部分直接流量又会被记录为之前的来源。 这些都会影响我们对直接流量属性的判断。
所以在开头的那个例子中,仅凭数据的解释和定义对数据进行分析是不够的。好像纸上谈兵。这时我们更多需要的是对行业的了解(这个指标在行业中表现如何?),对用户的了解(用户真的会这么做吗?),和怀疑的精神(数据究竟是如何产生的?)。
【所有文章及图片版权归 蓝鲸(王彦平)所有。欢迎转载,但请注明转自“蓝鲸网站分析博客”。】
Read more: http://bluewhale.cc/2010-04-25/google-analytics-traffic-source-details.html#ixzz2TX9S97KI