Using data compression for the 生产化制图 (Production Mapping) workspace in SQL Server (Production Mapping)

利用表和索引的行与页面压缩,可以通过减少数据库大小来节省存储空间。数据压缩的缺点是会增加 CPU 使用率,因为必须对数据进行压缩并在访问时解压缩。不能将数据压缩用于系统表,而且只有企业版和开发版的 SQL Server 2012 支持数据压缩。

可对以下内容进行数据压缩配置:

可用于 SQL Server 2012 的数据压缩形式有三种:行级压缩、Unicode 压缩和页面级压缩。

有关详细信息,请参阅 MSDN 库中的堆(不含聚类索引的表)

Row-level compression

行级压缩通过为长度固定的数据使用更为有效的存储格式来实现。

行级压缩使用下列策略节省空间:

虽然没有减少数据使用的空间量,但行级压缩不会带来页面级压缩的存储改善。行级压缩的优势在于它需要的 CPU 使用率比页面级压缩更少。可使用以下语法通过行级压缩来压缩表:

ALTER TABLE tableName REBUILD WITH (DATA_COMPRESSION=ROW)

For example, to rebuild all partitions of the pm.TableA table of the PMDB database by using row compression, use the following query:

USE [PMDB]
ALTER TABLE [pm].[TableA] REBUILD PARTITION = ALL
WITH (DATA_COMPRESSION = ROW)

可使用以下语法通过行级压缩来配置索引:

ALTER INDEX indexName ON tableName REBUILD PARTITION ALL WITH (DATA_COMPRESSION=ROW)

有关行级压缩的详细信息,请参阅 MSDN 库中的行压缩实现

Unicode compression

利用 Unicode 压缩,数据库引擎可以压缩存储在页面或行压缩对象中的 unicode 值。可将 Unicode 压缩用于长度固定的 nchar(n) 和 nvarchar(n) 数据类型。在启用行和页面压缩后,会在适当时自动使用 Unicode 压缩。

有关 Unicode 压缩的详细信息,请参阅 MSDN 库中的Unicode 压缩实现

Page-level compression

页面级压缩压缩数据的方法是对重复值和通用前缀仅存储一次,然后在表中其他位置参考这些值。当将页面压缩应用于表时,也将应用行压缩技术。页面级压缩使用以下策略:

页面压缩的效益取决于所压缩数据的类型。涉及许多重复值的数据相比于由更多唯一值进行填充的数据,前者的压缩程度更高。可使用以下常用语法来应用页面级压缩:

ALTER TABLE name REBUILD WITH (DATA_COMPRESSION=PAGE)

For example, to rebuild all partitions of the pm.TableA table of the PMDB database by using page compression, use the following query:

USE [PMDB]
ALTER TABLE [pm].[TableA] REBUILD PARTITION = ALL
WITH
(DATA_COMPRESSION = PAGE)

可使用以下语法通过页面级压缩来配置索引:

ALTER INDEX indexName ON tableName REBUILD PARTITION ALL WITH (DATA_COMPRESSION=PAGE)

有关页面级压缩的详细信息,请参阅 MSDN 库中的页面压缩实现

如果表或索引已分区,则可基于每个分区配置压缩。如果使用 ALTER PARTITION 语句拆分分区,则新分区将继承原始分区的数据压缩属性。如果对两个分区进行合并,则生成的分区将具有目标分区的压缩属性。虽然通过压缩的确可以在页面中存储更多的行,但并不会更改表或索引的最大行大小。如果最大行大小和压缩开销超出 8,060 字节,则无法启用表以进行压缩。索引的默认压缩设置为“无”,并且必须在创建索引时指定索引压缩属性。非聚类索引不会继承表的压缩属性,但堆中创建的聚类索引会继承该堆的压缩状态。数据压缩仅在源中应用,因此在从压缩源中导出数据时,SQL Server 将以未压缩的行格式输出数据。将未压缩的数据导入到启用了压缩的目标表中,会对数据进行压缩。

有关数据压缩的详细信息,请参阅 MSDN 库中的数据压缩

要使用数据压缩向导更改表和索引的压缩设置,请执行以下步骤:

步骤:
  1. 启动 SQL Server Management Studio。
  2. 右键单击要压缩的表或索引,单击存储,然后单击管理压缩

    将显示欢迎使用数据压缩向导 对话框。

  3. 单击下一步

    将显示选择压缩类型 对话框。

  4. 选择压缩类型。

    可以选择对所有分区使用相同的压缩类型,也可以基于每个分区在“行”、“页面”和“无”中进行选择。

  5. 单击计算以确定当前空间使用率和压缩后使用率之间的差值。

    将显示选择输出选项 对话框。

  6. 选择是创建脚本、立即执行操作还是根据计划执行选项。
  7. Click Next.
  8. Click Finish.

有关数据压缩向导的详细信息,请参阅 MSDN 库中的数据压缩向导帮助

Estimating compression

确定某一对象压缩效益的最佳方法是使用 sp_estimate_data_compression_savings 存储过程。压缩效益取决于诸如数据唯一性等因素。sp_estimate_data_compression_savings 存储过程仅在企业版 SQL Server 2012 中可用。

存储过程的语法如下:

sp_estimate_data_compression_savings[ @schema_name = ] 'schema_name', [ @object_name = ]
'object_name', [@index_id = ] index_id,[@partition_number = ] partition_number,
[@data_compression = ] 'data_compression'

For example, to configure an estimate of the compression benefits of using row compression on the pm.TableA table in the PMDB database, execute the following Transact-SQL statement:

USE PMDB;
GO
EXEC sp_estimate_data_compression_savings 'pm', 'TableA', NULL, NULL,
'ROW';
GO

To configure an estimate of the compression benefits of using page compression on the same table, execute the following Transact-SQL statement:

USE PMDB;
GO
EXEC sp_estimate_data_compression_savings 'pm', 'TableA', NULL, NULL,
'PAGE';
GO

有关如何估计压缩节约值的详细信息,请参阅 MSDN 库中的 sp_estimate_data_compression_savings (Transact-SQL)

You can use the SQL script below for the pm user table and indexes and to generate the SQL statements to set page compression for the tables and indexes.

/*---------------------------------------------------------------------
-- Verify PM Schema Storage
---------------------------------------------------------------------*/
USE [pmdb]
GO
/*---------------------------------------------------------------------
--List all tables
---------------------------------------------------------------------*/
SELECT USER_NAME(o.uid) [owner], o.name,o.id,o.type,o.status
FROM sysobjects o
WHERE USER_NAME(o.uid) = 'pm'
AND o.type <> 'S' and o.type = 'U'
ORDER BY o.name,o.type;
GO
/*---------------------------------------------------------------------
--List all indexes
---------------------------------------------------------------------*/
SELECT USER_NAME(o.uid) [owner], OBJECT_NAME(i.id) [table], i.name [index],o.type [type]
FROM sysindexes i inner join sysobjects o ON i.id = o.id
WHERE USER_NAME(o.uid) = 'pm'
AND o.type <> 'S' and o.type = 'U' and i.indid = 1
ORDER BY USER_NAME(o.uid),OBJECT_NAME(i.id),i.name;
GO

/*---------------------------------------------------------------------
--Table page compression
--Example:
/*
ALTER TABLE PM.CITIES 
REBUILD WITH (DATA_COMPRESSION = PAGE);
GO
*/
---------------------------------------------------------------------*/
--Generate script to set table page compression:
SELECT 'ALTER TABLE ' + USER_NAME(o.uid) + '.' + o.name + ' REBUILD WITH (DATA_COMPRESSION = PAGE);' [TXTSQL]
FROM sysobjects o
WHERE USER_NAME(o.uid) = 'pm'
AND o.type <> 'S' and o.type = 'U'
ORDER BY o.name,o.type;
GO

/*---------------------------------------------------------------------
--Index page compression
--Example:
/*
ALTER INDEX R125_pk 
ON PM.CITIES
REBUILD WITH ( DATA_COMPRESSION = PAGE ) ;
GO
*/
---------------------------------------------------------------------*/
--Generate script to set index page compression:
SELECT 'ALTER INDEX ' + i.name + ' ON ' + USER_NAME(o.uid) + '.' + OBJECT_NAME(i.id) +
       ' REBUILD WITH ( DATA_COMPRESSION = PAGE );' [TXTSQL]
FROM sysindexes i inner join sysobjects o ON i.id = o.id
WHERE USER_NAME(o.uid) = 'pm'
AND o.type <> 'S' and o.type = 'U' and i.indid = 1
ORDER BY USER_NAME(o.uid),OBJECT_NAME(i.id),i.name;
GO

Compression and TDE

数据库文件的加密是在页面级别执行的。已加密数据库中的页面将在写入磁盘之前进行加密,并在读取到内存时进行解密。TDE 不会增加已加密数据库的大小。

有关详细信息,请参阅 MSDN 库中的 SQL Server 2012 - 透明数据加密 (TDE)

加密后的数据压缩要明显少于等效的未加密数据。如果使用 TDE 加密数据库,则备份压缩无法对备份存储进行显著压缩。因此,不建议将 TDE 和备份压缩一起使用。

有关详细信息,请参阅 MSDN 库中的 SQL Server 2012 – 数据压缩

4/27/2014