ジオコーディング プロセス
住所ロケータを作成したら、これを使用して住所のジオコードを開始できます。ただし、住所ロケータによる入力アドレス データの準備、住所ロケータの検索、住所マッチングの方法に加え、住所ロケータの設定の変更がこのプロセスに与える影響について理解することは、ジオコーディングのパフォーマンスと精度の向上に役立ちます。
次の表では、プロセスについて説明します。
ステップ |
概念的な例 | |
---|---|---|
1. 元の住所の入力 |
127 West Point Drive, Olympia, WA 98501 |
|
127 | West | Point | Drive | Olympia | WA | 98501 127 | West Point | Drive | Olympia | WA | 98501 |
||
|
||
|
||
| ||
127 W Point Dr, Olympia, WA 98501 | ||
住所の解析
住所ロケータが住所を解析するときには、住所ロケータのスタイルに基づいて住所を住所要素に分解します。たとえば、「123 Main Street」という住所の場合、123 は番地、Main は道路名、Street は道路タイプになります。住所を複数の方法で解析できる場合もあります。「127 West Point Drive」という住所で、West は通常は道路の方向として解釈されますが、特定のケースにおいては、West Point という道路名として考えることもできます。住所検索の精度を上げるために、住所ロケータによる解析では、ジオコーディング プロセスで必要とされる複数の異なるアドレス エレメントのセットに住所を分解します。
作成した住所の複数の表現
方向や道路タイプなど、住所要素の多くは、しばしば略語を使用して記述されます。これらの略語は、さまざまな形式で表現されます。たとえば、Avenue(道路)は AV または AVE と省略して記述されたり、Avenue と省略さずに記述されたりします。住所ロケータ スタイルで定義されているとおりに、各住所要素の値のリストが確立されます。たとえば、「127 West Point Drive, Olympia, WA 98501」という住所の場合、各住所要素には次の表に示すような複数の値または表現が含まれています。
住所ロケータの検索
住所ロケータが住所を解析し、各住所要素の値のリストが作成されたら、検索基準のセットに基づいて、入力住所の要素に一致するロケータ内のフィーチャが検索されます。検索基準のセット(都市、州、郵便番号の組み合わせなど)を使用して住所の候補を見つけることができなかった場合、一致候補が見つかるまで、もっと制約の少ない基準(住所や郵便番号のみなど)を使用して検索が続けられます。
各候補の一致に関するスコア
住所ロケータは、一致場所の候補セットを生成したら、各候補セットとジオコーディングしている住所との一致の度合いを決めるスコア付けを行います。各候補には、0 ~ 100 の範囲のスコアが割り当てられます。このスコアの作成には、各住所要素が使用されます。各候補のスコアは、住所要素に次のいずれかが適用されていると低くなります。
- スペル間違い - Pennsylvania や Ahwatukee など長くてあまり使用しない道路名の場合、スペルを間違いやすくなります。
- 間違い - たとえば、住所の道路番号が候補の住所範囲内に存在しない場合などです。
- 欠落 - たとえば、住所データには道路の方向が指定されているのに候補には指定されていない場合などです。
フィルタした候補のリスト
各候補にスコアが付けられたら、住所ロケータは、候補とする最小スコアのセットに基づいて住所の一致候補のセットを作成します。これらの一致候補の中で、候補とする最小スコアよりもスコアが低い候補は、候補リストから削除されます。
最適な一致候補
住所ロケータは、候補をスコア順にランク付けして表示します。一致を見直して選択することができます。マッチングのテーブルで、住所は最高スコアの候補と自動的に一致することになります。
一致したフィーチャの表示
ジオコーディング プロセスの最終ステップとして、最適な候補に対応するフィーチャを使用して、一致した住所のロケーションが生成されます。このロケーションは、ライン フィーチャに沿った内挿(サイド オフセットとエンド オフセットのパラメータを含む)に基づいていたり、参照フィーチャがエリアまたはポイントの場合は、ポリゴン重心に基づいていたりします。