ファイル ジオデータベースの圧縮と最適化

データ容量をよりコンパクトにするために実行するという点では概念的に似ているものの、ファイル ジオデータベースに適用される圧縮と最適化は、まったく異なる処理を実行します。

まず、圧縮という言葉がさまざまな意味で使用されますが、ファイル ジオデータベースの圧縮は、以下に示すような圧縮とは異なります。

上記の圧縮と異なり、ファイル ジオデータベースの圧縮は SDC(Smart Data Compression)に関連しており、SDC と同じ手法を適用して、同様の利点をもたらします。

ファイル ジオデータベースの圧縮とは

格納要件を抑えるために、ファイル ジオデータベースのフィーチャクラス(ベクタ データ)とテーブルを読み取り専用形式に圧縮することができます。圧縮されたデータセットは、ArcCatalog および ArcMap 上で、未圧縮時と同じように表示され、編集以外の操作は同じように実行できます。圧縮されたデータはダイレクト アクセス形式なので、ArcGIS と ArcReader からはデータを直接読み取ることができます。データにアクセスするたびにデータを解凍する必要はありません。

圧縮には、データを圧搾する、押し込む、または押しつぶすというイメージがありますが、データの圧縮ではそのようなことは起こりません。圧縮とは、データを物理的に小さな領域に押し込むことではなく、別のよりコンパクトなパターンにエンコードし直すことです。圧縮プロセスでは、データから冗長性が削除されるため、結果として、圧縮されたデータはほとんどの場合、元のデータよりも小さくなります。

たとえば、3 つの A41 が連続している場合は、

A41 A41 A41

次のようにエンコードし直すことができます。

A41(3)

(3) は、A41 が 3 回繰り返されることを示します。圧縮されたデータを表示する際、ArcGIS は A41(3) を A41 A41 A41 として解釈します。この例は、ArcGIS がファイル ジオデータベースのデータを圧縮するための手法の 1 つにすぎません。ArcGIS は、データのタイプ、一意な値の数、値が繰り返される回数に応じて、各フィールドに異なる手法を適用します。

特定のデータセットの圧縮率は、複数の要因によって決まりますが、フィーチャのタイプと属性データの冗長度が最も重要となります。詳細については、「ファイル ジオデータベースの圧縮について」をご参照ください。

最適化とは

最適化では、レコードの並べ替えと空き領域の削除により、ファイル内のレコードの格納領域が整理されます。ファイル ジオデータベースまたはパーソナル ジオデータベースでデータの追加や削除を頻繁に行う場合は、月に一度の割合で、ジオデータベースを最適化してください。これにより、ファイルのサイズを減らして、パフォーマンスを向上させることができます。圧縮されていないデータの最適化と、ファイル ジオデータベースの圧縮とは無関係であり、別の処理と考えてください。詳細については、「ファイル ジオデータベースとパーソナル ジオデータベースの最適化」をご参照ください。

5/10/2014