Ключевые слова конфигурации для файловых баз геоданных

При создании набора данных в файловой базе геоданных вы можете выбрать ключевое слово конфигурации для настройки способа хранения данных. Каждое ключевое слово оптимизирует процесс хранения для конкретного типа данных, слегка улучшая эффективность и производительность работы. Доступно семь ключевых слов. Их нельзя настроить.

В большинстве случаев вы будете использовать ключевое слово DEFAULTS при создании класса пространственных объектов или растра в файловой базе геоданных. Ключевое слово DEFAULTS работает, как правило, отлично, за исключением тех ситуаций, когда

Если вы не определили никакое ключевое слово конфигурации, то будет использоваться DEFAULTS.

Данное ключевое слово

Влияет на хранение данных

DEFAULTS

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF8.

TEXT_UTF16

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF16.

MAX_FILE_SIZE_4GB

Ограничение на размер данных 4 Гб

Текст хранится в формате UTF8.

MAX_FILE_SIZE_256TB

Сохраняет данные размером до 256 TB

Текст хранится в формате UTF8.

GEOMETRY_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF8.

Сохраняет атрибуты геометрии в файле отдельно от непространственных атрибутов

BLOB_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF8.

Сохраняет атрибуты BLOB в файле отдельно от остальных атрибутов

GEOMETRY_AND_BLOB_OUTOFLINE

Хранит данные размером до 1 ТБ

Текст хранится в формате UTF8.

Сохраняет атрибуты геометрии и BLOB в файлах отдельно от прочих атрибутов

Ключевые слова конфигурации, доступные для наборов данных в файловых базах геоданных

Хранение текста: UTF8 по сравнению с UTF16

UTF8 является самым лучшим форматом хранения в том случае, если у вас имеются текстовые данные на английском, ином западноевропейском языке или на любом другом языке, в котором используется латинский алфавит, например, польский, турецкий или индонезийский. UTF8 хранит каждый латинский символ без диакритического знака (например, знака подчеркивания или ударения) с помощью 1 байта, а каждый диакритический или любой другой символ, которого нет в латинском алфавите, с помощью нескольких байтов, от 2 до 6. Поскольку UTF8 хранит большую часть текстовых символов с помощью 1 байта, то он обеспечивает меньший размер данных и улучшенную производительность при работе с данными на этих языках.

UTF16 является наиболее эффективным форматом хранения текстовых данных на языках, использующих алфавит, отличный от латинского:китайский, японский, русский, греческий или арабский. Для этих языков в данном формате на один символ приходится 2 байта. Для представления того же самого символа в формате UTF8 может потребоваться до 6 байт, что приведет к увеличению размеров данных и несколько снизит производительность в работе с данными на этих языках. Данный метод хранения текста доступен только с ключевым словом TEXT_UTF16, который имеет ограничение в размере на 1 ТБ.

MAX_FILE_SIZE_4GB

Данное ключевое слово обеспечивает несколько лучшее хранение наборов данных размером меньше 4 ГБ, чем ключевое слово DEFAULTS, хотя размеры экономии сравнительно незначительны:на каждой записи будет экономиться 1 байт, т.е. около 1 МБ для миллиона записей. Например, класс объектов всех дорог Калифорнии (2092079 записей) занимает 312 МБ при использовании ключевого слова DEFAULTS и 310 МБ при использовании ключевого слова MAX_FILE_SIZE_4GB.

Данное ключевое слово устанавливает для набора данных ограничение на максимальный размер в 4 ГБ, так что вам следует определять это ключевое слово только в том случае, если вы уверены, что класс пространственных объектов и набор растровых данных никогда не будут занимать больше 4 ГБ.

MAX_FILE_SIZE_256TB

Определение ключевого слова конфигурации MAX_FILE_SIZE_256TB позволит вам создать набор данных, который может занимать до 256 ТБ. Вы могли бы использовать это ключевое слово только для хранения очень больших наборов растровых данных.

ПримечаниеПримечание:

Хотя файловая база геоданных сможет позволить вам хранить наборы данных таких размеров, убедитесь в том, что у вас имеется для этого достаточно места на диске.

Вложенное (In-line) хранение и связанное (out-of-line) хранение

Вложенное хранение данных означает хранение всех атрибутов объекта в одном файле или в одной виртуальной таблице файловой базы геоданных. Когда вы храните данные в связанном режиме, они будут храниться в отдельном месте.

Если все данные хранятся во вложенном состоянии, они будут загружаться в память при выполнении запросов или редактировании класса объектов. Таким образом класс объектов, которых хранит большие объемы информации в атрибутах будет занимать больше дискового пространства и потреблять больше памяти для обработки.

Атрибуты типа Геометрия (Geometry) и BLOB потенциально могут хранить большие объемы данных. Например, если много объектов в классе объектов состоят из тысяч вершин, то возможно вам потребуется хранить информацию о геометрии объектов в связанном режиме в другом файле. Или, если данные в атрибутах занимают много дискового пространства (например, состоят из нескольких полей с текстом или больших объектов BLOB в полях атрибутов), вы, возможно, захотите хранить геометрию объектов в отдельном файле, чтобы автоматически не загружать большие объемы данных в память компьютера. Если вы храните и геометрию и данные типа BLOB в отдельных файлах, они будут загружены в память только при обращении к ним. Например, если вы выбираете объекты в ArcMap на основе значений типа BLOB, атрибуты BLOB будут загружены в память.

Если класс объектов содержит большие объемы данных в атрибутах типа BLOB, вы можете указать ключевое слово BLOB_OUTOFLINE при создании класса объектов. Тогда атрибуты типа BLOB будут загружаться только при запросе к ним.

ПримечаниеПримечание:

Ключевое слово GEOMETRY_AND_BLOB_OUTOFLINE всегда используется, если создаются наборы данных terrain, для улучшения скорости работы. Это делается внутри программы и невозможно изменить.

9/11/2013