サンプリング

何かおかしい?データが取得できないようだ。今まで問題なくデータが取れていたにも関わらず、しばらくしてから、おかしい?と感じたら、それはサンプリングが発生しているかもしれないし、アナリティクスの制限にひっかかっているかもしれないし、アナリティクスに何らかの障害が発生しているかもしれない。ここでは多くの方が知っているであろう企業の大規模サイトの話であることを前提にする。( アナリティクス障害除く )

何故に大規模サイト?この数字の違和感は大規模サイトでしか発生しえない。具体的に言えば、例えば、月間40万セッションを超えるようなサイトだ。そのようなサイトで3か月分で期間設定したのちデータを確認すべく、セカンダリディメンションやセグメントを使うと、サンプリングがかかる。

サンプリングとは、実際のデータではなく、推定データと呼ぶべきもので、全体のセッションの一部、例えば10%を元に全データを推定して表示させる仕組みである。従って、表示されたデータに違和感を感じるケースが出てくることだろう。思ったより、少ない、もしくは、多いと感じるのだ。
*サンプリングがかかるとアナリティクス左上に黄色のアイコンが出現する

サンプリング

サンプリングの発動条件は下記2点の条件が揃った時
1)50万件超のセッション
2)セカンダリディメンション・セグメント・フィルタを使う

対策: 1.集計期間を短くする
集計期間のセッションでサンプリングが決まるので、50万セッションに満たない期間、例えば、先ほどの例であれば3か月間でなく、1か月単位でデータを出して別途集計する。

対策: 2.アナリティクス360 (有料版)を使う
アナリティクス360であれば、1億セッション超にてサンプリングがかかるので、先ほどの例であれば、3カ月でも十分余裕がある。

制限事項

プロパティあたり 1 か月 1,000 万ヒット

1000万ヒットを超えるとデータが取得が難しいので、アナリティクス360を考慮すべき時期に来ている。Google アナリティクス チームからアナリティクス 360(アナリティクス有料版) へのアップグレードの案内が来るという。


ユーザーあたり 1 日 20 万ヒット

セッション 1 回あたり 500 ヒット

ヒット数がこのいずれかの上限を超えると、以降のヒットはそれぞれ該当の日付中、 セッション中は処理されなくなるこれらの制限はアナリティクス 360を利用の場合も同じように適用される。ページ数が膨大で、全ページにてスクロールを計測している場合、セッション 1 回あたり 500 ヒットを超える可能性がある。特定のページのみスクロール計測するといった対策が必要となる。

アナリティクスの障害

まれなケースだが、アナリティクス自体に何らかの障害が起きている可能性がある。今までの感覚だと、通常、短時間(1時間以内)で問題は解決されている。参考:Analytics ステータスダッシュボード