高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))の仕組み

[高/低クラスタ分析(High/Low Clustering)] ツールでは、指定された分析範囲について、集中の度合いの高/低が計測されます。

演算

General G 統計の計算

General G 統計の付加的な計算を表示する

分子と分母の違いは加重(wij)だけであることに注目してください。高/低クラスタ分析は正の値にしか使用できません。このため、ウェイトがバイナリ(0/1)の場合や常に 1 未満の場合は、General G の範囲が 0 ~ 1 になります。この統計には、二値加重方式を推奨します。[空間リレーションシップのコンセプト] パラメータでは、固定距離バンド(Fixed Distance Band)、Polygon Contiguity、K Nearest Neighbors、または Delaunay Triangulation を選択します。[標準化] パラメータには [なし] を選択します。

解釈

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールは推測統計です。つまり、分析結果が、帰無仮説との関係で解釈されます。高/低クラスタ(General G)統計の帰無仮説は、フィーチャ値に空間クラスタが存在しないというものです。このツールから返される p 値が小さく、統計的に有意である場合は、帰無仮説を棄却することができます(「Z スコアとは、p 値とは」をご参照ください)。帰無仮説が棄却されると、Z スコアの符号が重要になります。Z スコアの値が正の場合、観測 General G インデックスが期待 General G インデックスよりも大きく、分析範囲内で高い値で属性がクラスタリングしていることを示します。Z スコアの値が負の場合、観測された General G インデックスが期待される General G インデックスよりも小さく、分析範囲内で低い値で属性クラスタリングしていることを示します。

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールが最適なのは、値がほとんど等しく分布しているときに、高い値で空間的に予期せぬ急上昇を特定する場合です。残念ながら、高い値と低い値の両方がクラスタとなっている場合は、互いに相殺する傾向にあります。高い値と低い値の両方がクラスタリングしているときに空間クラスタを計測する場合は、[空間的自己相関分析(Spatial Autocorrelation(Morans I))] ツールを使用します。

[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールと [空間的自己相関分析(Spatial Autocorrelation(Morans I))] ツールの帰無仮説はどちらも、全くのランダム空間(CSR)です。つまり、対象の空間的プロセスがランダムであることを反映して、値がデータセット内のフィーチャ間でランダムに分布している状態です。ただし、[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールの Z スコアの解釈は、[空間的自己相関分析(Spatial Autocorrelation(Morans I))] ツールの Z スコアの解釈とは大きく異なります。

結果

高/低クラスタ分析(High/Low Clustering)

空間的自己相関分析

p 値が統計的に有意ではない

帰無仮説を否定できません。フィーチャ属性値の空間分布は、かなり高い確率でランダムな空間プロセスの結果です。つまり、観測された空間パターンの値は、完全に空間的に偶発的な場合にとり得る場合の 1 つにすぎない可能性が十分にあります。

p 値が統計的に有意であり、Z スコアが正の値である。

帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。

帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の高い値や低い値の空間分布は、期待されるよりも空間的にクラスタリングしています。

p 値が統計的に有意であり、Z スコアが負の値である。

帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセット内の低い値を示す空間分布は、期待されるよりも空間的にクラスタリングしています。

帰無仮説を否定することができます。根底にある空間プロセスが真にランダムである場合、データセットの高い値や低い値の空間分布は、期待されるよりも空間的に分散しています。空間的に分散したパターンは、ある種の競合プロセスを反映していることが少なくありません。高い値をもつフィーチャは、高い値をもつ他のフィーチャに反発し、同様に、低い値をもつフィーチャは低い値をもつ他のフィーチャに反発します。

出力

[高/低クラスタ分析(High/Low Clustering (Getis-Ord General G))] ツールは 5 つの値を返します。これらの値は、観測 General G、期待 General G、差異、Z スコア、p 値です。これらの値は、[結果] ウィンドウから表示でき、派生出力値としてモデルまたはスクリプトに渡すことができます。このツールでは、結果を概要図にした HTML ファイルを作成することもできます。[結果] ウィンドウで HTML ファイルをダブルクリックすると、デフォルトのインターネット ブラウザで HTML ファイルが開かれます。

また、結果ウィンドウのメッセージ エントリを右クリックして、[表示] を選択すると、結果が [メッセージ] ダイアログ ボックスに表示されます。

ツールの出力は [結果] ウィンドウからアクセスできます。

よくあるご質問(FAQ)

Q: [ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))] ツールからの結果は、統計的に有意なホット スポットを示しています。[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールからの結果が統計的に有意になっていないのはなぜですか?

A: [高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールのようなグローバル統計では、対象データの全体的なパターンと傾向が評価されます。グローバル統計は、分析範囲全体で空間パターンにばらつきがないときに最も有効です。ローカル統計(ホット スポット分析など)では、各フィーチャが、近隣のフィーチャとの関係で評価され、ローカルな状況がグローバルの状況と比較されます。ここで、1 つの例を検証します。1 組の値の平均値を計算するとき、これはグローバル統計値の計算でもあります。すべての値が 20 に近い場合、平均値も 20 に近くなり、その結果はデータセット全体を非常によく表すまとめとなります。一方、値の半数が 1 付近であり、残りの半数が 100 付近である場合の平均値は 50 付近になります。50 付近のデータ値が存在しない可能性があるため、平均値はデータセット全体を適切に表したサマリとはいえません。ただし、データ値のヒストグラムを作成すると、二山分布になっていることがわかります。同様に、[高/低クラスタ(High/Low Clustering(Getis-Ord General G))] ツールなどのグローバル統計は、分析範囲全体にわたって計測対象の空間プロセスが一貫している場合に最も効果的です。その場合、結果は空間パターン全体をよく表すまとめになります。詳細については、以下に引用した Getis と Ord(1992 年)のものと、彼らの提示する SIDS の分析をご参照ください。

      

Q:[高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] ツールからの結果と [空間的自己相関分析(Spatial Autocorrelation(Morans I))] ツールからの結果が異なるのはなぜですか?

A:上の表をご参照ください。これらのツールは、別の空間パターンを計測するものです。

      

Q: このツールで得た Z スコアや p 値を別の分析範囲の分析結果と比較することはできますか?

A: 結果を比較できるのは、分析範囲と分析に使用するパラメータが固定されている(比較の対象となるすべての分析で同一である)場合だけです。ただし、分析範囲が一式の固定されたポリゴンで構成されており、分析パラメータが固定されている場合は、特定の属性について時間の経過に伴う Z スコアの変化を比較できます。たとえば、特定の国の地域レベルで市販薬(OTC)購入のクラスタについて傾向分析する場合を考えてみます。この場合、各期間について [高/低クラスタ分析(High/Low Clustering(Getis-Ord General G))] を実行してから、結果を線グラフにまとめることができます。Z スコアが統計的に有意であり、上昇している場合、高い OTC 購入の空間クラスタの程度が上昇していると結論付けることができます。

      

Q: フィーチャのサイズは分析に影響を与えますか?

A: フィーチャのサイズは結果に影響することがあります。たとえば、大きいポリゴンが低い値をもつ傾向にあり、小さいポリゴンが高い値をもつ傾向にある場合は、高低の集中が同等であっても、指定した距離の範囲内により多くの小さいポリゴンのペアがあるために、観測 General G インデックスが、期待 General G インデックスよりも高くなることがあります。

適用例

参考資料

Getis, Arthur および J. K. Ord『The Analysis of Spatial Association by Use of Distance Statistics』Geographical Analysis 24、no. 3、1992 年

Mitchell, Andy『The Esri Guide to GIS Analysis, Volume 2』Esri Press、2005 年

5/10/2014