異常値(外れ値)が自動で検出可能に
Post date: Oct 23, 2013 2:35:22 PM
Adobeサミットで2年前から話題になっていた異常値検出 (Anomaly Detection)の機能が2013年10月18日にリリースされました。設定すれば、無料で使えます。実装の変更も不要です。
なぜ異常値が重要?
Web解析では、(1)重要な指標を定期的に確認し、(2)変化があればアドホックに詳細な分析を行う、という流れになりますが、意外と大変です。
ダッシュボードやレポートを作るのが大変
定期モニタリングが長続きしない
目視ではあまり多くの指標を監視できない
統計的な処理をしないで間違った判断をすることがある
USでは、データサイエンティストがWeb解析の生データ(に近い詳細データ)を統計ソフトやエクセルに取り込んで処理することもありますが、スキルの敷居が高くなる、手間がかかる、時間がかかる、などのハードルがあり、手軽には真似できません。
同じことが、Adobe Analyticsのレポート画面上で簡単に調べられるようになりました。
アナリストにはうれしい機能ですね。
予測範囲を算出しグラフ表示
時系列データの傾向を統計処理し、95%の確率で予想される範囲(上限と下限)を算出してくれます。
グラフでは範囲がグレーの帯のように表示されます。
この範囲を超えた値が「異常値」(外れ値)です。
異常値の時期と程度をプロット
指標が予測範囲をいつ、どの程度超えたのかが、色付きのブロックで表示されます。
大きな異常値ほど、ブロックの色が濃くなり、点線から上下に離れて表示されます。
二つのグラフは同期する
ブロックのグラフには、複数の指標が表示されます。グラフ上をドラッグしてブロックを選択状態にすると、それらの指標の線グラフが表示されるので、どの指標なのかが分かります。
使うための設定
どの指標をウォッチするかは事前に設定が必要です。
「サイト指標」メニューに「異常値の検出」が追加されているので、クリックしてレポート画面を開き、右上の設定アイコンをクリックします。
設定はレポートスイート単位になります。正しいRS名が選択されていることを確認してから、指標を選択します。
指標の数に制限はありませんが、多いとグラフがノイズだらけになります。最初は多めに選んでおき、実際のレポート(グラフ)を見ながら絞り込むと良いでしょう。
簡易セグメントを適用できる
指標の単純な合計値だけでなく、特定ディメンションの特定の行項目で絞り込むこともできます。
上の図の「フィルター適用済み指標を追加」ボタンをクリックして設定します。
例えば、「Facebookでロイヤルティを高める」という施策の効果をウォッチしたい場合は、このように設定します。
リファラがfacebook.comの場合の「リピート訪問」という指標をセットしています。
eVarなどのコンバージョン系指標も使えます。
「フィルター適用済み指標」と聞くとよく分からなくなりますが、「簡単なセグメントを作成する」と考えると分かりやすいです。
まとめ
このように、Ad Hoc(旧Discover)やData Workbench(旧Insight)を使わなくても手軽に統計処理ができます。
何を深掘りして分析すべきかが分かるようになるので、これは大きなステップといえます。
メール通知など、機能や使い勝手は改善していくとか。今後が楽しみな機能ですね。
参考
レポートの使い方:Run an anomaly detection report
検出アルゴリズム:Anomaly Detection