クラスタ/外れ値分析(Cluster and Outlier Analysis (Anselin Local Moran's I))の詳細
一連のフィーチャクラス([入力フィーチャクラス])と分析フィールド([入力フィールド])を指定すると、[クラスタ/外れ値分析(Cluster and Outlier Analysis)] ツールにより高い値または低い値を持つ空間クラスタが特定されます。このツールでは、空間的な外れ値も特定されます。この場合、ツールでは、ローカルな Moran's I 値、Z スコア、p 値、および各フィーチャのクラスタ タイプを表すコードが計算されます。Z スコアと p 値は、計算されたインデックス値の統計的な有意性を表します。
解釈
I が正の値である場合は、フィーチャの近隣フィーチャが同様に高いまたは低い属性値をもち、このフィーチャがクラスタの一部であることを示しています。I が負の値である場合は、フィーチャの近隣フィーチャが異なる値をもっており、このフィーチャが外れ値であることを示します。どちらの場合も、統計的に有意なクラスタまたは外れ値であるとみなすためには、フィーチャの p 値が十分に小さいものである必要があります。統計的な有意性の判断の詳細については、「Z スコアとは、p 値とは」をご参照ください。Local Moran's I インデックス(I)は、相対的な測定であり、計算された Z スコアまたは p 値との関係の中でしか解釈できないものです。
[出力] フィールドのクラスタ/外れ値タイプ(COType)では、高い値をもつ統計的に有意な(0.05 水準)クラスタ(HH)、低い値をもつクラスタ(LL)、高い値が主に低い値に取り囲まれている外れ値(HL)、低い値が主に高い値に取り囲まれている外れ値(LH)が区別されます。
出力
このツールを使用すると、入力フィーチャクラスにある各フィーチャについて、Local Moran's I インデックス、Z スコア、p 値、COType の各属性をもつ新しい出力フィーチャクラスが作成されます。これらの属性のフィールド名は、カスタムのモデルやスクリプトで使用できるように生成されたツール文字列出力としても返されます。
ArcMap でこのツールを実行すると、自動的に、コンテンツ ウィンドウに出力フィーチャクラスが、[COType] フィールドにデフォルトのレンダリングが適用された状態で追加されます。適用されるレンダリングは、<ArcGIS>/ArcToolbox/Templates/Layers にあるレイヤ ファイルによって定義されます。必要に応じて、テンプレート レイヤ シンボルをインポートすれば、デフォルトのレンダリングを再適用できます。
ベスト プラクティスのガイドライン
- 結果は、入力フィーチャクラスに 30 個以上のフィーチャが格納されている場合にのみ、信頼性があります。
- このツールを使用するときには、カウント、率、その他の計測値などの入力フィールドが必要です。各ポイントが 1 つのイベントまたはインシデントを表すようなポイント データを分析している場合は、評価の対象となる具体的な数値属性(重要度ランキング、カウント、その他の計測)がないかもしれません。インシデントの多い位置(ホット スポット)やインシデントが非常に少ない位置(コールド スポット)の特定を考えている場合は、分析の前にインシデント データを集約する必要があります。ホット スポットとコールド スポットは、[ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))] ツールでも効果的に特定できます。ただし、統計的に有意な空間的な外れ値(高い値が低い値に取り囲まれている場合や低い値が高い値に取り囲まれている場合)は、[クラスタ/外れ値分析(Cluster and Outlier Analysis (Anselin Local Moran's I))] ツールでしか特定できません。
- 適切な空間リレーションシップのコンセプトを選択してください。
- SPACE_TIME_WINDOW コンセプトを選択すると、時空間クラスタおよび外れ値を特定できます。詳細については、「時空間分析」をご参照ください。
- 適切な距離バンドまたは距離の閾値を選択してください。
- すべてのフィーチャが少なくとも 1 つ近接フィーチャを持つ必要があります。
- すべてのフィーチャを近接フィーチャとするフィーチャが存在してはいけません。
- 特に、入力フィールドの値が偏っている場合は、各フィーチャに 8 つの近隣フィーチャをもたせてください。
適用例
[クラスタ/外れ値分析(Cluster and Outlier Analysis (Anselin Local Moran's I))] ツールでは、高い値の集中、低い値の集中、および空間的な外れ値を特定できます。これは次のような質問に答えるうえで役立ちます。
- 分析範囲における裕福層と貧困層の間の最も急激な境界はどこにあるか?
- 分析範囲に、消費パターンが異常な領域はあるか?
- 分析範囲全体にわたって糖尿病発生率が予想外に高い場所はどこか?
経済、資源管理、生物地理、政治地理、人口統計など多数の分野での適用が可能です。
参考資料
Anselin, Luc『Local Indicators of Spatial Association—LISA』(Geographical Analysis 27(2): 93–115)、1995 年
Mitchell, Andy『The ESRI Guide to GIS Analysis, Volume 2』(ESRI Press、2005 年)