乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      集成顯卡優(yōu)化之葵花寶典

       星之明光 2011-01-31

      集成顯卡優(yōu)化之葵花寶典 性能最高升91%

        寫在前面:本篇提到的思路或是方法,作為集顯主板硬件優(yōu)化的技術,原則上適用于所有集顯主板,筆者將力圖討論技術本身而不是硬件本身;但由于任何硬件技術都存有相應的硬件載體,因而出現帶有主板生產商自身特征的信息是不可避免的,對此大家僅作參考,而在行文的過程中筆者也將盡量回避。

        基于用戶認可度和產品行情這兩個方面,筆者將討論重點設定為AMD 790GX芯片組,對于這款號稱“史上最強規(guī)格”的集顯芯片組,各大傳媒上的介紹可謂是汗牛充棟------筆者就此略過,只提關鍵性的一點:相較于其前代780G芯片組,790GX芯片組普遍采用了板載顯存的做法,由于板載顯存的引入,由此導致了超頻后花屏的現象,提升性能的同時解決花屏現象,顯然這也是優(yōu)化集顯的主旨所在,故在本篇就其方法也有所得及。


        但是,作為一門較為系統(tǒng)的技術,所牽涉的內容是比較繁雜的,要對進行一一細致的論述,顯然是不十分現實的;因此,筆者在本篇主要立足于“授人以魚,不如授之以漁”,從原理入手,既講方法,對優(yōu)化的思路也有所涉及,力求讀者朋友牚握相關方法的同時,也能明白方法所依托的原理。


        為了讀者們能夠有一個較清楚的認識,先進行理論探討,深化認識之后,再進行技術操作。

        從理論上來看,集成顯示核心與一般的顯卡的工作原理是一樣的。為三部分:數據處理(GPU)、數據存儲(顯存)與數據傳遞(總線),差別就在于各部分所依托的硬件載體不同;如圖1所示,對K8/K10架構而言,板載GPU與CPU之前通過HT總線互連,GPU通過訪問集成在CPU內部的內存控制器,讀取被共享為顯存的內存中的數據。如此,按提升獨顯性能的常規(guī)思路,只需提升GPU的數據處理能力,并同時提升數據傳輸的帶寬,即可獲得性能上的提升;同理,用同樣的思路,也可以提升集顯的性能。


      圖1 NV的C51芯片組架構圖

        從硬件上來看,集顯工作部分實體為:計算部分,即板載的顯示核心GPU;數據傳輸部分,對于K8/K10平臺而言是HT總線,Intel平臺為FSB前端總線;數據存儲部分,為共享為顯存的內存。這樣,由前面的講解,將自然地推導出這樣的規(guī)律:只需提升顯示核心和內存的頻率就可以實現集顯性能的提升。---這無疑是正確的,但卻不是全部----實際操作發(fā)現,簡單的套用所帶來的性能提升十分有限。

        原因何在?答案是HT總線。,出于習慣地將集成顯示等效為獨立顯卡,卻忽視了另一至關重要的因素,那就是數據傳輸。我們知道,AMD自754平臺開始,拋棄了前端總線架構,轉而使用HT總線作為CPU與其他芯片進行數據交換的載體,由于工藝的原因,早期的K8系列主板并不能承受過高的HT總線,這導致絕大數的用戶都習慣性將HT總線倍頻降低,以提高CPU的外頻表現。由于忽視了集顯數據傳輸也同樣依托于HT總線,從而導致雖然GPU的數據處理能力提升,內存可提供的數據帶寬攀升,但兩者之間的數據交換通道地是十分狹隘-----這顯然好比水庫要泄洪,雖然河道十分寬闊,但是閘門的開口太小,泄洪無法高效進行。

        筆者于2007年使用A690G芯片組偶然之間的發(fā)現存在這樣的規(guī)律,并在之后的一段時間沉迷于對于這一發(fā)現的證明與拓廣之中。相對于人們常識性地提升核心與內存頻率的方法而言,這個發(fā)現確實是更具備本質性,因為它不僅是為理論解釋提供了素材,也為集顯優(yōu)化技術提供了指導。

        經過漫長的測試,根據集顯三個組成部分的對應因素,將影響集顯性能的因素按影響因子由大到小排列為:集成顯示核心頻率>HT總線頻率>內存頻率與內存參數>CPU主頻。需要指出的是,對于不同的平臺,各個因素的影響因子并不一致,但是其順序的非列卻是基本一致的。與此同時,在這需要更正一個人們長期以來的成見,即認為CPU主頻幾乎不影禹集顯的性能,---對于INTEL平臺這也許是成立,但對于AMD平臺而言,由于CPU頻率攀升帶來內存訪問延遲的降低以及內存帶寬的提升----這在某種程度等效于提高內存頻率和優(yōu)化時序---同樣也能帶著集顯性能的提升。


        790GX集顯的優(yōu)化操作立足于兩點:第一,由于790GX對帶寬的要求較高,顯示帶寬的提升帶來的性能提升是十分巨大的,這就意味著人,搭載K10(HT3.0)處理器的790GX平臺,相對于搭載K8處理器(HT總線為2.0)的平臺,將獲得更高的性能表現;第二,790GX板載顯存所帶來的影響是兩面的,雖然可以帶來性能的攀升,但同時也引入超外頻時花屏的現象(關閉板載顯存雖然可以根除花屏現象,但卻不是理想的優(yōu)化集顯的方法)。


      圖2 790GX的架構圖

        因此,優(yōu)化的重點就必然緊在這兩個方面:提升帶寬和解決花屏現象,其中首要解決的就是顯卡花屏現象,因為超外頻時花屏現象不解決,外頻無法提升,HT總線頻率和內存頻率都無法得到提升。在得出結論之前,筆者就手頭上的一塊790GX主板進行實現一個試驗。作一點補充,該主板板載容量128M,默認頻率為1066的三星顆粒顯存。


      圖3 板載三星1066顯存顆粒
       筆者能過BIOS內選定某一顯存分頻,然后在windows下軟拉提高外頻,得到某顯存外頻下對應的最高不花屏外頻數值,列表1。

      顯存頻率與最高外頻對應表

      顯存分頻/ Mhz

      533

      400

      350

      333

      最高外頻/Mhz

      210

      260

      298

      310

       得到計算最高外頻的線性公式:

        最高外頻=板載顯存極限頻率÷(BIOS內顯存分頻/cpu的默認外頻)×2。

        其中,BIOS內顯存分頻一般為400Mhz、533Mhz、667Mhz這幾個選項;K8/K10 CPU的默認外頻為200Mhz;板載顯存的最高頻率可以按照板載顯存默認頻率稍微放大(廠商出于穩(wěn)定性的需要,會保留一定的余量)。當然也可以根據如下方法得顯存極限頻率:

      1. 在BIOS將顯存頻率設為一定值,比如說我們可以設成400Mhz(等效于800Mhz)。

      2. 以10Mhz為步進逐級提升外頻,至花屏為止,然后此基礎上將外頻降低10Mhz,使用二分法求得在此設定下最高外頻。例如我們假定主板在270外頻下花屏,取260與270之平均值265Mhz,觀察是否花屏;如不,則取265與270之均值,如花屏,則取265與250的平均值。如此循環(huán),直到外頻不變。

      3. 記錄下此時的外頻值,按照前面所提的反推。假定主板在265外頻不花屏,則此顯存的最高頻率為:265×(400÷200)×2=1060Mhz.

        如此,則可以根據此顯存頻率求得不同顯存頻率設定下的最高外頻。


      圖4 顯存頻率選項

        不難發(fā)現,板載顯存體質越好,在相同的設定下極限外頻就越高,這也就是為何板載DDR3的主板具備更好的外頻表現的原因所在;那么對于板載DDR2顯存的主板的用戶,就沒有什么別的方法可以提升外頻了么?結論是NO!具體方法有二:

      1. 通過要求廠商在BIOS內增加顯存頻率333Mhz甚至更低的選項,按照公式,BIOS內顯存頻率設定值越低,開啟板載的極限外頻就越高;

      2. 軟改顯存頻率,最新的AMD OverDrive2.0.14軟件提供了顯示核心和顯示頻率的調節(jié)功能。使時需要注意的是,一定在在BIOS內將顯示核心頻率設定置為默認。

       


      圖5 AOD軟件調節(jié)界面

        有了前面的前面的準備工作,這樣我們就可以根據需要選定自己需要的外頻值,尋求最優(yōu)的設定參數。

        外頻設定:對于影響集顯性能五大項目,其中集卡核心頻率和內存的參數是獨立的,調其中任意一個項目不會影響其他項目,而另外三項卻是相互關聯,三者的組合起來將產生多種設定;對于優(yōu)化者而言,自然是希望各個參數均是極優(yōu)的,以達到理想的性能,然而在實際中并非所有的最優(yōu)參數所由一種設定實現-----這樣,就需求尋找各個互相制衡中的參數的平衡點。

        舉例而言,對一顆極限在3.4G的K8 CPU,我們該如何選擇外頻和倍頻的配置,既能發(fā)揮出內存的性能,又能讓HT總線足夠高。這需要相當的技巧,并且需要根據具體情況進行具體的分析。假定內存足夠好,6分頻比是最理想的,此時內存頻率為3400÷6=566,等效為1132Mhz,當然前提是內存能夠在該頻率下穩(wěn)定;接下來就需要選持合適的外頻,是選擇261*13,還是340*10,或是400*8.5,以提升HT總線頻率為標準:HT總線為5X,如果主板能夠承受2000Mhz的HT總線頻率(實際上790GX主板具備此種能力),顯然是外頻越高越好;于是就得到這樣的一組參數:外頻400、倍頻8.5、內存分頻(不是分頻比)為DDR667、HT總線倍頻為5X(或1000Mhz)---一個初步的優(yōu)化方案形成。

        因此可以總結出如下思想方法:首先,熟知CPU、內存和主板的三者體質,這是優(yōu)化的前提;第二,HT總線倍頻保持為5X,根據CPU頻率選持合理的外頻和倍頻,理論上是倍頻越低越好,以得到高外頻;第三,根據倍頻和內存體質選擇合理的分頻比,繼而設定相應的分頻。

        內存優(yōu)化:由于各廠商推出的BIOS中內存參數選項不盡相同,所以難以統(tǒng)一論述,只以memset為例,對部分重要的參數進行講解,得出這些參數的影響規(guī)律花費的時間無疑是最多的。


      圖6 Memset軟件

        對于tCL、tRTC、tRP、tRAS、tRC幾個參數,大家是十分熟悉的,這即是大家熟悉的“大參”,不待我說,在不影響穩(wěn)定的前提下,盡量將延遲優(yōu)化至最低。對比測試發(fā)現,tCL的影響因子是最大的,因而保證穩(wěn)定性的前提下,首先考慮優(yōu)化該參數。

        而對于一些小參,大家想必是十分陌生的,現將最重要的幾個小參羅列出來:

      Refresh Mode Select(tRC): 該參數對帶寬的影響十分嚴重;將其設為15.6us(內存默認為7.8us),將帶來3D性能十分顯著地提升。

      Write to write delay(tWRWR):其對性能影響的程度不亞于tRC,黙認為2,將其設為1可帶來集顯性能的顯著提升。

      Read/Write Queue Bypass:該參數對于帶寬有一定的影響;默認為8X,值設為16X性能較優(yōu)。

      Queue ByPass Max:對帶寬有一定影響;默認為7,值越大越好,推薦設為10以上。

      Max Asynchrone lantency:默認隨主板不同而不同;越小越好,一般不能低于6ns,7ns是筆者主板的合適值。

      Idle Cycle limit:根據主板不同而不同,默認為16,實際上可以設為64或更大,對性能有輕微的影響。

        至于其他參數,對性能的影響并不是十分明顯。按照值越小,性能越好的思路優(yōu)化即可。

      板載顯存優(yōu)化:對顯存的工作模式以及相應參數的設定,將極大提示集顯性能。

      優(yōu)化思路如下:

      1. 必須開啟板載顯存。經多次測試對比發(fā)現,對于K8平臺而言,開啟板載顯存將帶來14%左右的性能提升;

      2. UMA-SP Interleave Mode(板載顯存-共享內存交互模式)設定為Inter leave ratio(顯存與共享顯存之比)為1:3,Inter leave size(顯存容量)為128M,該參數性能最佳。

      3. 對比測試發(fā)現,在系統(tǒng)內存為2G的條件下,共享內存設為512M性能最優(yōu)。

       


      Inter leave size設定


      Inter leave ratio設定

      附:以上每個參數的對照測試均進行三遍以上,其真實性應是毋庸置疑的。

        通過筆者的反復調試,最終在373外頻,9倍頻,HT總線頻率1865Mhz,內存頻率1120Mhz,顯示核心為1090Mhz下,將3D Mark06成績提升至2684分;而一顆搭配5000+,2G雙通道DDR800內存的790GX主板的默認成績約為1400分左右,性能幅度提升喜人。

       



        至此,本文的介紹即已告一段落。超頻無止境,技術的進步是永不會停止的,在這個技術更新日新月異的時代,希望筆者一篇小說,能為讀者朋友們的集顯優(yōu)化策略提供一點淺薄的參考,也希望各位讀者朋友不吝賜教,以期技術共同進步。

        本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多