異常値(外れ値)が自動で検出可能に

posted Oct 23, 2013, 7:35 AM by Makoto Shimizu   [ updated Oct 23, 2013, 7:53 AM ]

Adobeサミットで2年前から話題になっていた異常値検出 (Anomaly Detection)の機能が2013年10月18日にリリースされました。設定すれば、無料で使えます。実装の変更も不要です。

なぜ異常値が重要?

Web解析では、(1)重要な指標を定期的に確認し、(2)変化があればアドホックに詳細な分析を行う、という流れになりますが、意外と大変です。

  • ダッシュボードやレポートを作るのが大変
  • 定期モニタリングが長続きしない
  • 目視ではあまり多くの指標を監視できない
  • 統計的な処理をしないで間違った判断をすることがある

USでは、データサイエンティストがWeb解析の生データ(に近い詳細データ)を統計ソフトやエクセルに取り込んで処理することもありますが、スキルの敷居が高くなる、手間がかかる、時間がかかる、などのハードルがあり、手軽には真似できません。

同じことが、Adobe Analyticsのレポート画面上で簡単に調べられるようになりました。

アナリストにはうれしい機能ですね。

予測範囲を算出しグラフ表示

時系列データの傾向を統計処理し、95%の確率で予想される範囲(上限と下限)を算出してくれます。

グラフでは範囲がグレーの帯のように表示されます。

この範囲を超えた値が「異常値」(外れ値)です。

異常値の時期と程度をプロット

指標が予測範囲をいつ、どの程度超えたのかが、色付きのブロックで表示されます。

大きな異常値ほど、ブロックの色が濃くなり、点線から上下に離れて表示されます。

二つのグラフは同期する

ブロックのグラフには、複数の指標が表示されます。グラフ上をドラッグしてブロックを選択状態にすると、それらの指標の線グラフが表示されるので、どの指標なのかが分かります。

使うための設定

どの指標をウォッチするかは事前に設定が必要です。
サイト指標」メニューに「異常値の検出」が追加されているので、クリックしてレポート画面を開き、右上の設定アイコンをクリックします。

設定はレポートスイート単位になります。正しいRS名が選択されていることを確認してから、指標を選択します。

指標の数に制限はありませんが、多いとグラフがノイズだらけになります。最初は多めに選んでおき、実際のレポート(グラフ)を見ながら絞り込むと良いでしょう。

簡易セグメントを適用できる

指標の単純な合計値だけでなく、特定ディメンションの特定の行項目で絞り込むこともできます。

上の図の「フィルター適用済み指標を追加」ボタンをクリックして設定します。

例えば、「Facebookでロイヤルティを高める」という施策の効果をウォッチしたい場合は、このように設定します。

リファラがfacebook.comの場合の「リピート訪問」という指標をセットしています。

eVarなどのコンバージョン系指標も使えます。

「フィルター適用済み指標」と聞くとよく分からなくなりますが、「簡単なセグメントを作成する」と考えると分かりやすいです。

まとめ

このように、Ad Hoc(旧Discover)やData Workbench(旧Insight)を使わなくても手軽に統計処理ができます。

何を深掘りして分析すべきかが分かるようになるので、これは大きなステップといえます。

メール通知など、機能や使い勝手は改善していくとか。今後が楽しみな機能ですね。

参考

Comments