分類を自動化できるルールビルダーが便利

posted Jul 22, 2013, 4:37 PM by Makoto Shimizu   [ updated Jul 22, 2013, 11:42 PM ]

便利だけど面倒なSAINT作業を支援するツールとして以前にSaint Bernardを紹介しましたが、もっとスゴい自動分類機能「分類ルールビルダー」が2013年5月24日にSiteCatalystの標準機能としてリリースされています。Adobe Summit 2013の最後のセッション「SNEAKS」で紹介された機能です。

リリース直後から早速使っていて、非常に重宝しているので紹介します。Saint Bernardにも同じような自動分類機能がついていますが、「分類ルールビルダー」は自動で定期実行できるので、運用が劇的に楽になります。

使えるシチュエーション

キー(変数にセットして送信する値)に含まれる情報から分類項目を抽出するので、キー自体にメタ情報が含まれていることが前提になります。

例1:トラッキングコード(キャンペーン変数)にメディアタイプ、メディア名、出稿時期を含めている

トラッキングコード メディアの種類 メディア 時期
em_daily_20130702 メール dailyのお知らせメール 2013年7月
af_ls_201302 アフィリエイト Linkshare 2013年2月
sm_aw_201306 リスティング広告 AdWords 2013年6月

この場合、トラッキングコードを「_」という文字で区切り、emで始まるなら「メール」、afで始まるなら「アフィリエイト」などと自動で判定して分類することができます。

例2:旅行サイトで製品名にメタデータを含めている

Product変数 商品の種類 割引
F:NRT_SLC:S 航空チケット なし
H:SLC:B ホテル バーゲン

「F:」で始まるなら「航空チケット」、「H:」なら「ホテル」と分類できます。

適さない場合

逆に、以下のような場合はルールビルダーではなく手または別のプログラムで分類する必要があります。

  • 日付を曜日で分類する
  • 商品番号を商品名で分類する
  • URLをページ名とジャンル名で分類する
  • ページ名を公開日と担当者名で分類する

ところで、分類のメリットは

  • 後から過去に遡って再分類できる
  • 変数を消費しない
  • メニューが階層化されるので親子関係を理解しやすい

という点です。JavaScriptや処理ルール、VISTAルールで分類してから別の変数に格納するという方法もあるので、何がベストか判断する必要があります。

自動分類の設定方法

以下のレポートに表示されている検索キーワードのうち、ClickMap関連のものを「Click Map」とまとめる場合を例に説明します。

あらかじめ分類を設定しておきます。

1. 管理コンソールから分類ビルダーにアクセス

管理コンソールの中にあります。新UIでは管理コンソールが移動しているのでご注意。


2. まずルールセットを作成

ルールセットは個別のルールを格納する箱のようなもので、分類対象の変数(レポート)と適用先レポートスイートを設定します。


ルールセットを追加」ボタンをクリックし、ルールセットに名前(何をどう分類するのかの短い説明)をつけ、分類対象の変数(レポート)を選択します。

変数のメニューには、ログイン中のカンパニーに紐づく全てのレポートスイートで既に分類が設定された変数がアルファベット順に表示されます(変数名はいつも頭にv3.やc51.などと種類と番号をつけておくと、こういう時に楽になります)。どれか一つのみを選択します。

つまり、ルールセットと変数(レポート)は1:1になるので、ルールセット名は「v28:KWを製品/機能別に分類」など、変数名と自動分類対象の分類項目を含めると良いでしょう。

記入と選択が終わったら「ルールセットを作成」ボタンをクリックすると、ルールセットの一覧(表)に作成したルールセットが表示されます。

作成したルールセット名をクリックして表示される次の画面で、設定を続けます。

3. レポートスイートを指定

ちょっと翻訳が変ですが、「およびスイートを追加」をクリックして適用先レポートスイートを選択します。

選択した変数に分類が設定されているレポートスイートのみが表示されるので、チェックボックスにチェックを入れて「保存」します。

4. ルールを作成

ルールを追加」ボタンをクリックし、ルールセットの中にルールを作成します。

単純な部分一致と正規表現を使えます。

今回はバリエーションを含めるなど細かい指定ができる正規表現を使ってみます。

正規表現を入力してから「サンプルキー」の欄にテスト用の文字列を入力すると、その下に判定結果がリアルタイムで表示されるのが便利です。

保存」して閉じます。

5. テスト

テスト用ルールセット」をクリックすると、ルールセット毎のテスト用キーをセットで保存しておけるので、いつでも再テストできて便利です。

左側の大きな入力エリアに1行ずつテスト用の文字列を入力します。

テストを実行」した結果、大文字と小文字が区別されてマッチに失敗していると分かったので、「ルールセットに戻る」で編集画面に戻り、正規表現を修正します。

テスト用ルールセット」をクリックして再テストしたところ...

今度は問題なく大文字も小文字もヒットしました。

ルールは一つのルールセットの中に複数作ることができます。その場合は、上から順番に実行されます。コンフリクトした場合は最後のルールが有効になります。マッチしても残りのルールが評価され続ける、ということですね。

「#」の数字をクリックすると、順番の番号を変更できます。

6. アクティブ化

テストが問題なければ、「アクティブにする」をクリックしてルールをONにします。

ルールは一日に一度実行されるので、次に実行されるまで最大24時間かかります。

右下の上書きオプションを使うと、指定した期間の過去分のキーが再分類されます。

利用上の注意点

  • 自動分類は一日に一回、定期実行される(リアルタイムではない)
  • 上書きのチェックを入れない場合は、今後発生する未分類のキー(全ての分類項目がnullであるキー)のみが自動分類の対象になる
  • 上書きは差分の更新になる(例えば3つある分類のうち1つだけ自動分類した場合、ヒットしたキーの残りの2つの分類はそのまま残る)
  • テキスト形式の分類のみを自動分類できる
  • 変数とレポートスイートの組み合わせに対して設定できるルールセットは一つのみ(なのでルールは既存ルールセットに追加する)

参考

Comments