SiteCatalystやGAをパケット型にできる「Pion」その1

posted Mar 21, 2010, 7:28 AM by Makoto Shimizu   [ updated Apr 20, 2010, 5:14 AM ]

データ収集と解析の分離には大きな意味がある

アクセス解析にはログ型、ビーコン型、パケットキャプチャ型、とありますが、これはデータ収集の方法が違うだけであり、アクセス解析サービス全体の特徴を表しているわけではありません。実際には、収集したデータをどう保管・集計し、対話的に何をどこまで解析可能にするか、などポスト計測の部分がより重要だと思います。集計の処理時間はどれ位か?多次元のクロス集計はできるのか?データ量に制限はあるのか?カスタム変数はどれ位あるのか?収集時のデータ加工は可能か?など。

Pionのようなデータ収集のみに特化したサービスを使うと、タグ型のアクセス解析サービスでもパケットキャプチャ型のメリットを享受できるようになります。また、一つの仕組みでデータを収集し、複数のアクセス解析サービスへデータを送る、というマルチ対応も容易になります。選択肢が多様になるのは良いことですね。データ収集よりも重要なポスト計測部分での競争や発展を今後は期待したいところです。

やっぱり評価することに

pharさんが評価されていたのでもう不要かも、と思っていたのですが、無料の機能制限付きPion LiteではなくPion Enterpriseなら新発見があるかもと思い、試すことにしました。

Pion Enterpriseは完全に企業向けの製品なので(フリーのPion Liteは機能制限があり実用的ではない)、インストール方法などは省略します。SiteCatalystと連携させるとGenesisの利用料金が発生するので、Google Analyticsで試しました。CookieはGoogle Analytics の __utma と __utmc を流用して個別ユーザーを判別させる設定にしました。

構成

このような構成でデータがやりとりされます。今回はWebサーバと同じサーバーにインストールしていますが、独立したマシンにインストールすれば、既存システムを変更する必要がなくなります。proxyサーバーのようなものですね。Apacheモジュールで計測するよりも拡張性があり、導入や障害の切り分けが容易な点で優れているといえます。

評価の目的(知りたいこと)

今回のレビューの観点(知りたいこと)は、下記の3点に絞りました。仕事で使っているSiteCatalystの携帯用モジュールでいつも不便に感じている点です。

  • 何がどこまで計測できるのか?JavaScriptコードによる計測との違いは?
  • 計測のためにページの作り方を変える必要はあるのか?
  • 設定や管理は楽か?

※安定性やパフォーマンスは評価しません。

何ができるのか

ドキュメントに書かれた機能一覧をまとめました。

  • アクセスデータの収集
    • 画像やRSS、携帯などJavaScriptタグが使えないアクセスの計測
    • 計測対象のフィルタリング
    • 指定期間内の最小/最大/平均/ユニーク値を抽出して記録できる(全アクセスではなく)
  • 他のデータとの統合
    • データベース、ログファイル、APIなどから取得したデータと統合してから記録できる
  • 他のシステムへの記録
    • Google AnalyticsやSiteCatalyst、WebTrendsに収集データを送り、集計とレポーティングが可能
    • 別途データベースやBIツールに収集データを直接送信することも可能
    • Webサービスでアプリにデータを送信することも可能

実際どうなのか?使ってみました(その2へ続く

Comments