PCA(主成分分析)で潜在顧客エリアの抽出(Customer Prospecting by using PCA)ツールの仕組み
[PCA(主成分分析)で潜在顧客エリアの抽出(Customer Prospecting by using PCA)] は、顧客データベースをすばやく簡単に解析するために使用するツールです。これにより、顧客データの人口統計閾値を決める際のアナリストの負荷が軽減されます、ユーザが顧客のインジケータとなる人口統計変数を指定すれば、残りはツールが実行してくれます。顧客ポイントが入る区画内の選択された人口統計を解析し、主成分分析(PCA)手法を使用してそれらを比較することにより、人口統計値が顧客データにどれだけ類似しているかに基づいて区画をランク付けします。出力されるのは、そのランクに基づいて主題別にマッピングされた区画のリストです。区画を 1 から x まで(x はランク付けのために選択された区画の数)ランク付けします。1 が入力の顧客に最もよく一致していることを表します。
主成分分析(PCA)手法
PCA 手法は、変数選択の負荷を除去しながら、類似レベルに従って店舗のランク付けを行います、自分で選択した事前定義の変数セットを使用して類似性にスコアを付けるか、提供されたすべての変数を使用することができます。
次の図は、どのように変数または近傍を選択できるかを説明しています。ここで、K は見つけられる近傍の数です。
PCA アルゴリズムは、店舗ごとの一組の変数を 1 つのベクタとして考えます。次に、すべての候補店舗および主要店舗の一組のベクタを検討し、それに対して次の順序で PCA を実行します。
- 共分散マトリックスを構築します。
- 共分散マトリックスの固有ベクトルと固有値を見つけます。
- カイザー基準を使用して、固有値が 1 未満の固有ベクトルをドロップします。
- これらの固有ベクトルが、初期スペースのサブスペースになります。
- このサブスペースに対するすべてのベクタについて投影を計算します。
- 投影データを [0,1] 間隔に標準化します。
- L2(ユークリッド)距離を使用して、類似した最も近い候補店舗を K 個選択します。
結果のレイヤは、主要店舗に最も近い K 個の候補店舗を含み、主要店舗からの L2 距離に従って色分けされます。
5/20/2014