Google Analyticsのアクセス数の偽装
ようやくお休みになったので久々にログを眺めてたのですが、Google Analyticsのアクセス数に偽装の痕跡があった。
うちのサイトはAnalyticsとi2iアクセスランキングで数字に差が無いかチェックしているのだけど、Analyticsの方の数字だけ
が数日前から回され始めていた。
だいたいのアクセス偽装はJavaScript経由じゃなくてwget等で直接カウンターにアクセスするのだけど、Analyticsはそんな単純なアクセス方法ではカウントされないので、ちょっと興味深かったのでやり方を考えてみた。
結論を言えば、
- ローカルにWebサーバーを立てて
- DNSサーバー(ないしはhosts)に偽装先のホスト名を登録して
- AnalyticsのIDをセットしたhtmlを作る(か、プログラムで動的生成させて)
- ヘッドレスブラウザ等で自サイトのリファラーをセットしてアクセス
ということをやっているのだろう。おそらくはAnalyticsのID収集からクローラーを使って自動化しているだろうし、技術的に分かっている人がやっている感じがある。
今回のケースでは、i2iと比べなくとも滞在時間等のAnalyticsの数字が残念だったのでひと目で、尋常でないアクセスだと見抜いたよ
状態だったのですが、このあたりを上手くやられるとサーバーのアクセスログと照らし合わせないと判別できなくなるのでなかなか厄介だなと思った。
サーバーの生ログは見やすい形にしておかんとだめかなぁ。
あるいは、最近のGoogleさんの主張に乗っかってSSL専用サイトにしてAnalyticsもSSLオンリーにする方法でも対応できると思う。
最近はRapid SSLとか使えば1000円位で取れるらしいし、モダンブラウザだとSPDYが優先的に使われるからHTTPより速くなるらしいし、まあ利用者からの利便性も上がるし、ここら辺にコストかけてもいいっちゃいいかなぁ。
まあ、今のところ偽装されてアクセス数を吸い取られたとしても大した数じゃないので放置しておきますが。アクセス数が10倍くらいになったら真面目に対策しよう。