ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))の詳細
[ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))] ツールは、データセットの各フィーチャの Getis-Ord Gi*(発音は ジー-アイ-スター)統計値を計算します。結果である Z スコアと P 値は、高い値または低い値を持つフィーチャが空間的にどこでクラスタ化されるかを示します。このツールは、各フィーチャと近傍フィーチャの関連性を調べることで機能します。高い値を持つフィーチャは興味深いフィーチャではあっても、統計的に有意なホット スポットではない可能性もあります。統計的に有意なホット スポットである場合は、高い値を持つフィーチャが、同じように高い値を持つ別のフィーチャに囲まれています。あるフィーチャとその近傍を対象とする特定エリアの合計値が、すべてのフィーチャの合計値と比例的に比較されます。実際の特定エリアの合計値と期待された合計値が、偶然には発生しないほど大きく異なっていれば、Z スコアは統計的に有意ということになります。
計算
解釈
データセットの各フィーチャに対して返される Gi* 統計値は Z スコアです。統計的に有意な正の Z スコアの場合、Z スコアが大きくなるほど、高い値のクラスタ化が激しくなります(ホット スポット)。統計的に有意な負の Z スコアの場合、Z スコアが小さくなるほど、低い値のクラスタ化が激しくなります(コールド スポット)。統計的有意性の決定の詳細については、「Z スコアとは、P 値とは」をご参照ください。
出力
このツールは、入力フィーチャクラスの各フィーチャの Z スコアと P 値を持つ新しい出力フィーチャクラスを作成します。入力フィーチャクラスに適用される選択セットがある場合、選択したフィーチャだけが分析され、選択したフィーチャだけが出力フィーチャクラスに書き出されます。このツールは、Z スコアと P 値のフィールド名も、カスタム モデルやスクリプトで使用できるように、派生出力値として返します。
このツールを ArcMap で実行すると、出力フィーチャクラスは自動的にコンテンツ ウィンドウに追加され、Z スコア フィールドにはデフォルトのレンダリングが適用されます。適用されるホットからコールドまでのレンダリングは、<ArcGIS>/ArcToolbox/Templates/Layers にあるレイヤ ファイルによって定義されます。必要に応じて、テンプレート レイヤ シンボルをインポートすれば、デフォルトのレンダリングを再適用できます。
ホット スポット分析の考慮事項
ホット スポット分析を行うときに考慮すべきことが 3 つあります。
- 分析フィールド([入力フィールド])とは。ホット スポット分析ツールは、高い値または低い値(犯罪件数、事故の深刻度、スポーツ用品の購入額など)が空間的にクラスタ化されるかを評価します。このような値を含むフィールドが分析フィールドです。ただし、ポイント インシデント データの場合、インシデントに関係する特定の値の空間クラスタ化を分析するよりも、インシデントの激しさを評価することに目が向くことがあります。その場合は、分析の前にインシデント データを集約する必要があります。そのための方法はいくつかあります。
- 分析範囲にポリゴン フィーチャがある場合は、[空間結合(Spatial Join)] ツールを使用して、各ポリゴンのイベント数を集計できます。その結果である各ポリゴンのイベント数を含むフィールドが、分析の入力フィールドになります。
- [フィッシュネットの作成(Create Fishnet)] ツールを使用して、ポイント フィーチャ上にポリゴン グリッドを構築します。次に、[空間結合(Spatial Join)] ツールを使用して、各グリッド ポリゴン内のイベント数を集計します。分析範囲外のグリッド ポリゴンは削除します。また、分析範囲内のグリッド ポリゴンの多くでイベント数がゼロの場合は、適切であればポリゴンのグリッド サイズを大きくします。または、分析する前にイベント数がゼロのグリッド ポリゴンを削除しておきます。
- 別の方法として、一致または近接したポイントがいくつかある場合は、[インテグレート(Integrate)] ツールと [イベントの集計(Collect Events)] ツールを使用して、(1)指定した距離内にあるフィーチャをスナップしてまとめ、(2)イベント数とスナップされたポイント数を示すカウント属性が関連付けられ、それぞれ独自の位置にポイントを含む新しいフィーチャクラスを作成します。得られた ICOUNT フィールドを分析の入力フィールドとして使用します。注意:
同じ位置にあるポイントが実は冗長なレコードではないかという懸念がある場合は、重複を見つけて削除する、[同一値を持つレコードの検出(Find Identical)] ツールが役立ちます。
- [空間リレーションシップのコンセプト] はどれが適切か。[距離バンドまたは距離の閾値] の値はなにが最善か。
[ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))] ツールの [空間リレーションシップのコンセプト] の推奨値(デフォルト値)は [Fixed Distance Band] です。Space-Time Window、Zone of Indifference、Contiguity、K Nearest Neighbor、Delaunay Triangulation でもかまいません。分析距離の値を決めるベスト プラクティスと戦略については、「空間リレーションシップのコンセプトの選択」と「固定距離の選択」をご参照ください。時空間ホット スポット分析については、「時空間分析」をご参照ください。
- 疑問はなにか。
これは自明のように思われるかもしれませんが、分析の入力フィールドの作成方法によって、問うことのできる疑問の種類が決まります。もっとも興味があるのは、インシデントが多数起きている場所を決めることでしょうか、それとも、特定の属性の高い値と低い値が空間的にどこでクラスタを形成しているかでしょうか。そうであれば、生の値または生のインシデント件数に対して、[ホット スポット分析(Hot Spot Analysis(Getis-Ord Gi*))] を実行します。この種の分析は、資源配分タイプの問題に特に役立ちます。これとは別に(または追加として)、他の変数に比べて想定外に高い値を持つエリアを見つけたい場合もあります。たとえば抵当流れを分析する場合は、おそらく住宅が多い場所には抵当流れも多いと予想されます(いいかえれば、抵当流れの件数は、ある程度は住宅数の関数であると予想されます)。抵当流れの件数を住宅数で割って、この比率に対してホット スポット分析を実行した場合、もはや「抵当流れの件数が多いのはどこか」という疑問ではなく、「住宅数に対して、抵当流れの件数が予想外に多いのはどこか」という疑問を持っていることになります。分析の前に比率を作成することで、特定の予想される関係(たとえば、犯罪数は人口の関数、抵当流れの件数は住宅数の関数)を制御して、予想外のホット スポットとコールド スポットを特定できます。
ベスト プラクティスのガイドライン
- 入力フィーチャクラスは少なくとも 30 個のフィーチャを含んでいますか?フィーチャ数が 30 個未満の場合、結果は信頼できません。
- [空間リレーションシップのコンセプト] の選択は適切ですか?このツールでは、[Fixed Distance Band] が推奨されています。次空間ホット スポット分析については、「空間リレーションシップのコンセプトの選択」をご参照ください。
- [距離バンドまたは距離の閾値] の値は適切ですか?「固定距離の選択」をご参照ください。
- すべてのフィーチャが少なくとも 1 つ近接フィーチャを持つ必要があります。
- すべてのフィーチャを近接フィーチャとするフィーチャが存在してはいけません。
- とくに入力フィールドの値に歪みがある場合は、フィーチャはそれぞれ約 8 個の近接フィーチャを持つようにします。
適用例
犯罪分析、疫学、投票行動分析、経済地理学、小売分析、交通事故分析、人口統計学などで応用できます。次に、例を示します。
- 感染症が集中して発生している場所はどこか?
- すべての住宅火災の中で台所火災の数が予想よりも多い場所はどこか?
- 避難場所はどこに設置すべきか?
- いつ、どこで強さがピークになっているのか?
- リソースをさらに割り当てる必要があるのは、どの場所およびどの期間か?
参考資料
Mitchell, Andy『The ESRI Guide to GIS Analysis, Volume 2』(ESRI Press、2005 年)
Getis, A.、J.K. Ord 共著 1992 年『The Analysis of Spatial Association by Use of Distance Statistics』(Geographical Analysis 24(3))
Ord, J.K.、A. Getis 共著 1995 年「Local Spatial Autocorrelation Statistics: Distributional Issues and an Application」(Geographical Analysis 27(4))
ホット スポット分析のショート ビデオ
- Part 1: Choosing a Conceptualization of Spatial Relationships
- Part 2: Choosing an Appropriate Distance Band
- Part 3: Understanding Your Results
- Hot Spot Analysis of 911 Emergency Call Data(「Using Spatial Statistics Tools」を選択してください)
Scott, L、N. Warmerdam 共著、『Extend Crime Analysis with ArcGIS Spatial Statistics Tools』(ArcUser Online、April–June 2005)