清除Google Analytics虚假流量(典型来源:rank-checker.online)

  • By 青岛seo
  • 2016-03-29
  • 点击:
  • GA,统计

最近在对公司网站日常流量常规检查的时候发现了奇怪的现象,着陆页出现了很多与本站不相关的页面,再通过次级维度—流量获取—来源/媒介,得到其来源信息,如图(来源不止referral,还有direct):

经过持续几天的观察,发现这些不相干的流量越来越多,可以说网站的数据已经被污染了,在此基础上做的数据分析也是不可靠的。对GA熟悉的同学会一眼就看出上图中的着陆页有问题,但下图中的数据就有很大的迷惑性了,刚开始我也是一扫而过,没放上心上,还以为自己的网站的引荐流量还不错(是本站的数据),呵呵,如图:

从上图的数据可以看出,因为着陆页和来源都不是固定的,针对着陆页和来源/媒介设置排除和过滤是不现实的。这些数据的产生也跟网站没有一点关系,是直接侵入到了GA中,因为我的网站在3月18日才安装了统计代码,而去年就有这些虚假数据了,如图:

在GA中,可以通过过滤主机名的办法统计只包含自己网站数据,通过次级维度—行为—主机名,得到以下信息。可以看出,只有主机名才能区分真实流量与虚假流量。

 

新建新数据视图—过滤器—添加过滤条件,填写过滤器名称,过滤器类型选择自定义—包含—主机名,过滤模式将自己网站的域名填上即可,注意GA中过滤模式默认使用的是正则表达式,因此要使用“\”对“.”进行转义,如图:

利用这种方式还可以清洗掉与自己网站使用相同统计代码的数据(这种情况常发生在自己网站的源代码被对方拷走放自己网站上而没有清除掉统计代码的时候)

你可能对它们感兴趣

无相关信息