一、Update Statistics的作用 為了提高數(shù)據(jù)庫的效率,INFORMIX提供了一個(gè)基于成本的查詢優(yōu)化器,執(zhí)行update statistics語句的作用就是將您創(chuàng)建的數(shù)據(jù)庫表的有關(guān)統(tǒng)計(jì)信息更新到系統(tǒng)sysmaster的相關(guān)表中(如systables、syscolumns、sysindexes、sysdistrib、sysprocplan等),以便查詢優(yōu)化器選擇最佳的執(zhí)行路徑。當(dāng)sysmaster庫中沒有相應(yīng)的統(tǒng)計(jì)信息,或者統(tǒng)計(jì)信息不十分準(zhǔn)確時(shí),優(yōu)化器便無法制定一個(gè)行之有效的查詢策略,其結(jié)果必然是進(jìn)行大量極其可怕的順序掃描,產(chǎn)生嚴(yán)重的性能問題。 因此,當(dāng)您重新裝載數(shù)據(jù)或者對(duì)數(shù)據(jù)庫表進(jìn)行了大量的更新操作后,應(yīng)該及時(shí)執(zhí)行update statistics。也許您會(huì)發(fā)現(xiàn),數(shù)據(jù)庫一些參數(shù)配置的不合理可能使數(shù)據(jù)庫效率降低百分之幾,但如果您沒有定期執(zhí)行update statistics的話。數(shù)據(jù)庫的性能則可能降低幾到十幾倍。 二、Update Statistics的語法 執(zhí)行update statistics共有三個(gè)級(jí)別,即:update statistics low、updates tatistics medium、update statistics high。 1 update statistics[low]for table[{table-name|synonym-name}[(column-list)]]][drop distributions] update statistics low只更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息,對(duì)字段的分布情況不做統(tǒng)計(jì)。其語法說明如下: (1)update statistics或update statistics low,對(duì)當(dāng)前數(shù)據(jù)庫中所有表(包括系統(tǒng)表)及過程進(jìn)行更新統(tǒng)計(jì)。 (2)update statistics low for table,對(duì)當(dāng)前數(shù)據(jù)庫中所有表(包括臨時(shí)表,但不包括系統(tǒng)表)進(jìn)行更新統(tǒng)計(jì)。 (3)update statistics low for table tablename,對(duì)指定的表所有字段進(jìn)行更新統(tǒng)計(jì)。 (4)update statistics low for table tablename(column-list),對(duì)指定表的指定字段進(jìn)行更新統(tǒng)計(jì)。 (5)如果不帶drop distributions,原有字段分布情況依然保留;否則,原有字段分布情況將被刪除。 2 update statistics medium[for table[{table-name|synonym-name}[(column-list)]]][resolution percent[conf]][distributions only] update statistics medium除了更新表、字段、記錄數(shù)、頁數(shù)及索引等的最基本信息外,對(duì)字段的分布情況會(huì)采取抽樣的辦法來統(tǒng)計(jì),因此與update statistics low相比需要花費(fèi)更多的時(shí)間。其語法說明如下: (1)resolution percent是指分布統(tǒng)計(jì)的詳細(xì)程序,percent定義的是一個(gè)百分?jǐn)?shù),如resolution2意思是指按照字段的值分布統(tǒng)計(jì)成50段,如果不指定resolution percent,缺省值為2.5。 (2)conf是指分布統(tǒng)計(jì)時(shí)取樣的比例,conf參數(shù)的取值范圍為0.80—0.99,缺省值為0.95。 (3)如果指定了distributions only,則對(duì)索引的信息不做更新統(tǒng)計(jì)。 3 update statistics high[for table[{table-name|synonym-name}[(column-list]]][resolutionpercent][distributions only] update statistics high與update statistics medium的區(qū)別是在統(tǒng)計(jì)字段的分布情況時(shí),后者采用了取樣的辦法,而前者進(jìn)行全部統(tǒng)計(jì),因此update statistics high更新統(tǒng)計(jì)最全面,執(zhí)行時(shí)間也最長(zhǎng)。其語法說明如下: (1)如果不指定resolution percent,缺省值為0.5。 (2)如果指定了distributions only,則對(duì)索引的信息不做更新統(tǒng)計(jì)。 4 update statistics for procedure[procedure-name],只對(duì)指定的過程進(jìn)行更新統(tǒng)計(jì),對(duì)表不做更新統(tǒng)計(jì) 三、如何執(zhí)行Update Statistics 通常執(zhí)行update statistics的方法是: 1 對(duì)表中不帶索引的字段執(zhí)行update statistics medium,每個(gè)表執(zhí)行一次。一般情況下,缺省參數(shù)就足夠了。對(duì)于特別大的表(執(zhí)行update statistics時(shí),通常把超過26570條記錄的表定義為特別大的表),可以帶參數(shù)resolution1.00.99。 2 對(duì)表中帶有索引的字段執(zhí)行update statistics high,每個(gè)字段執(zhí)行一次。 3 對(duì)表中帶有復(fù)合索引的字段執(zhí)行update statistics low,每個(gè)表執(zhí)行一次。 4 對(duì)每一個(gè)小表執(zhí)行update statistics high。 四、注意事項(xiàng) 1 數(shù)據(jù)庫本身不會(huì)自動(dòng)更新sysmaster庫中有關(guān)statistics統(tǒng)計(jì)信息,只有執(zhí)行update statistics語句后,才能得到更新。 2 執(zhí)行update statistics語句時(shí),必須具有DBA權(quán)限或者為表的屬主。 3 由于update statistics通常為單線程運(yùn)行,不能利用PDQ等并發(fā)功能,對(duì)于一個(gè)較大的數(shù)據(jù)庫,執(zhí)行update statistics語句一般需要幾個(gè)小時(shí)。為提高效率,可以將update statistics分為多個(gè)shell程序同時(shí)執(zhí)行,并充分考慮數(shù)據(jù)空間分布情況,在并發(fā)執(zhí)行時(shí)減少磁盤讀寫的沖突。 4 執(zhí)行update statistics語句會(huì)占用一些臨時(shí)空間,當(dāng)臨時(shí)空間不夠時(shí),數(shù)據(jù)庫將提示錯(cuò)誤。您可以通過設(shè)置DBUPSPACE環(huán)境變量,使update statistics在遇到臨時(shí)空間不夠時(shí)分步來執(zhí)行排序統(tǒng)計(jì)。 |
|