Funktionsweise der Ähnlichkeitssuche

Mit dem Werkzeug Ähnlichkeitssuche werden die Feature-Kandidaten identifiziert, die einem oder mehreren abzugleichenden Eingabe-Features am ähnlichsten sind (oder sich am meisten von diesen unterscheiden). Ähnlichkeit basiert auf einer angegebenen Liste von numerischen Attributen (Interessenattribute). Wenn mehr als ein Feature für Abzugleichende Eingabe-Features angegeben wird, basiert die Ähnlichkeit auf Durchschnittswerten für jedes der Interessenattribute. Die Ausgabe-Feature-Class (Ausgabe-Features) enthält die Features für Abzugleichende Eingabe-Features sowie alle übereinstimmenden Feature-Kandidaten, die gefunden wurden, nach Ähnlichkeit geordnet (wie mit dem Parameter Größte oder geringste Ähnlichkeit angegeben). Die Anzahl der zurückgegebenen Treffer hängt vom Wert des Parameters Anzahl der Ergebnisse ab.

Potenzielle Anwendungsbereiche

Abgleichmethoden

Der Abgleich kann auf Attributwerten, Attributwerten in einer Rangfolge oder Attributprofilen (Kosinusähnlichkeit) beruhen. Die für diese Methoden eingesetzten Algorithmen werden nachfolgend beschrieben. Für alle Methoden gilt, dass bei mehr als einem Feature für Abzugleichende Eingabe-Features der Durchschnitt für die Attribute für alle Features errechnet wird, um ein zusammengesetztes Ziel-Feature zur Verwendung für den Abgleichprozess zu erstellen. Durchschnittliche Interessenattribute

Attributwerte

Wenn Sie für den Parameter Abgleichmethode die Option ATTRIBUTE_VALUES auswählen, standardisiert das Werkzeug zunächst alle Interessenattribute. Danach werden für jeden Kandidaten die standardisierten Werte von denen des Ziels subtrahiert, die Differenz quadriert und die quadrierten Differenzen addiert. Diese Summe wird zum Ähnlichkeitsindex für den Kandidaten. Nachdem alle Kandidaten verarbeitet wurden, werden die Kandidaten vom kleinsten Index (größte Ähnlichkeit) bis hin zum größten Index (geringste Ähnlichkeit) sortiert.

DetailinformationenDetailinformationen:

Die Standardisierung der Attributwerte umfasst eine Z-Transformation, wobei jeder Wert vom Mittelwert für alle Werte subtrahiert und durch die Standardabweichung für alle Werte dividiert wird. Bei der Standardisierung werden alle Attribute in denselben Maßstab überführt, auch wenn sie von sehr unterschiedlichen Zahlentypen dargestellt werden: Verhältnisse (Zahlen von 0 bis 1,0), Bevölkerung (mit Werten von über einer Million) und Entfernungen (z. B. Kilometer).

Attributwerte in einer Rangfolge

Wenn Sie für den Parameter Abgleichmethode die Option RANKED_ATTRIBUTE_VALUES auswählen, beginnt das Werkzeug mit der Erstellung aller Interessenattribute für das Ziel-Feature und alle Kandidaten. Daraufhin wird für jeden Kandidaten die quadrierte Differenz für jedes Attribut in Relation zum Ziel-Feature summiert. Wenn der Bevölkerungswert für das Ziel der zehntgrößte unter allen Kandidaten ist und die Bevölkerung für den betreffenden Kandidaten die fünfzehntgrößte, würde die Summe der quadrierten Rangdifferenz der Bevölkerung für diesen Kandidaten 10 - 15 = -5 und -5**2 gleich 25 betragen. Die Summe der quadrierten Rangdifferenzen für alle Interessenattribute ist der Ähnlichkeitsindex für diesen Kandidaten. Nachdem alle Kandidaten verarbeitet wurden, werden die Kandidaten vom kleinsten Index (größte Ähnlichkeit) bis hin zum größten Index (geringste Ähnlichkeit) sortiert.

Attributprofile

Wenn Sie für den Parameter Abgleichmethode die Option ATTRIBUTE_PROFILES auswählen, standardisiert das Werkzeug zuerst alle Interessenattribute (für diese Methode sind mindestens zwei Interessenattribute erforderlich). Daraufhin wird Kosinusähnlichkeitsmathematik verwendet, um den Vektor von standardisierten Attributen für jeden Kandidaten mit dem Vektor von standardisierten Attributen für das abzugleichende Ziel-Feature zu vergleichen. Die Kosinusähnlichkeit der zwei Vektoren A und B wird folgendermaßen berechnet:

Kosinusähnlichkeitsgleichung

Die Kosinusähnlichkeit ist nicht mit dem Abgleich von Attributgrößen befasst. Diese Methode beschäftigt sich stattdessen mit den Beziehungen zwischen den Attributen. Wenn Sie ein Profil (Liniendiagramm) der standardisierten Attribute in den zu vergleichenden Vektoren (das Ziel und einer der Kandidaten) erstellt haben, werden möglicherweise sehr ähnliche oder sehr unterschiedliche Profile angezeigt:

Attributprofile

Der Index der Kosinusähnlichkeit reicht von 1,0 (vollständige Ähnlichkeit) bis -1,0 (vollständige Unähnlichkeit) und wird im Feld SIMINDEX (Kosinusähnlichkeit) angegeben. Diese Ähnlichkeitsmethode wird verwendet, um Orte zu finden, die über dieselben Eigenschaften verfügen, möglicherweise jedoch in einem größeren oder geringeren Umfang.

Empfehlungen

Zuordnen von Ähnlichkeitsmustern

Wenn Sie für den Parameter Anzahl der Ergebnisse einen sehr großen Wert festlegen (gleich oder größer als die Anzahl der Features in den Kandidaten-Features), ordnet das Werkzeug alle Kandidaten in eine Rangfolge. Die Ausgabe für diese Analyse zeigt das räumliche Muster für die Ähnlichkeit. Beachten Sie, dass Sie Informationen über Ähnlichkeiten und Unterschiede erhalten, wenn Sie alle Kandidaten in eine Rangfolge ordnen.

Karte der Ähnlichkeitsränge

Mit räumlichen Variablen

Angenommen, Sie kennen die Orte (Polygonflächen), an denen eine bestimmte gefährdete Art sich gut entwickelt, und Sie möchten andere Orte finden, wo sie ebenfalls erfolgreich leben kann. In diesem Fall suchen Sie nach Orten, die den erfolgreichen Lebensräumen ähnlich sind, Sie benötigen jedoch auch Orte, die groß und kompakt genug sind, um das Überleben der Art zu gewährleisten. Für diese Analyse können Sie eine Kompaktheitsmetrik für jede Polygonfläche berechnen (allgemeine Kompaktheitsmesswerte basieren auf der Fläche eines Polygons in Relation zu der Fläche eines Kreises mit demselben Umfang). Sie können dann den Kompaktheitsmesswert und ein Attribut, das die Polygongröße darstellt (Shape_Area), dem Parameter An Ausgabe anzuhängende Felder hinzufügen, wenn Sie das Werkzeug Ähnlichkeitssuche ausführen. Die Sortierung der ersten zehn Treffer bezüglich Kompaktheit und Fläche erleichtern die Ermittlung der Orte, die am besten für die Neuansiedlung der Art geeignet sind.

Angenommen, Sie sind ein Einzelhändler, der expandieren möchte. Wenn Sie bereits erfolgreiche Geschäfte haben, können Sie mit Attributen, die die wichtigsten Erfolgseigenschaften wiedergeben, potenzielle Standorte für eine Expansion ermitteln. Es wird davon ausgegangen, dass die vertriebenen Produkte vor allem bei Studenten beliebt sind und Sie Standorte in der Nähe Ihrer aktuellen Geschäfte oder Wettbewerber vermeiden möchten. In diesem Fall sollten Sie vor dem Werkzeug Ähnlichkeitssuche das Werkzeug Near ausführen, um räumliche Variablen zu erstellen: Entfernung zu Universitäten oder Orten mit einer höheren Dichte von Universitätsstudenten und einer großen Entfernung zu vorhandenen Geschäften und Wettbewerbern. Daraufhin können Sie diese räumlichen Variablen zum Parameter An Ausgabe anzuhängende Felder hinzufügen, wenn Sie das Werkzeug Ähnlichkeitssuche ausführen.

6/5/2014