1. <var id="fe6gj"></var>

    <rp id="fe6gj"><nav id="fe6gj"></nav></rp>

    <noframes id="fe6gj"><cite id="fe6gj"></cite>

    <ins id="fe6gj"><button id="fe6gj"><p id="fe6gj"></p></button></ins>
    1. <tt id="fe6gj"><i id="fe6gj"><sub id="fe6gj"></sub></i></tt>
        億恩科技有限公司旗下門戶資訊平臺!
        服務器租用 4元建網站

        服務器內存怎么增強可靠性和可用性

        在如今的虛擬化數據中心中,單單一臺服務器可能運行眾多虛擬機,而每個虛擬機作為一個文件駐留在內存中。但是當新的服務器添置更多更快的內存以滿足更大的計算需求時,內存可靠性問題就顯得尤為重要。IT人員必須留意內存故障,并充分利用旨在增強內存可用性的服務器特性。

        由于大家的注意力大多集中在服務器的處理能力、網絡帶寬和存儲IOPS(每秒輸入輸出操作)上,所以很容易忽視服務器內存的可用性和可靠性。雖然處理器是任何服務器的核心部件,但是工作負載的所有指令和數據都存儲在內存中。

        在如今的虛擬化數據中心中,單單一臺服務器可能運行眾多虛擬機,而每個虛擬機作為一個文件駐留在內存中。但是當新的服務器添置更多更快的內存以滿足更大的計算需求時,內存可靠性問題就顯得尤為重要。IT人員必須留意內存故障,并充分利用旨在增強內存可用性的服務器特性。

        如今,企業級服務器采用數TB的64位內存,這些預制模塊遵守聯合電子設備工程委員會(JEDEC) DDR3和DDR3L(低電壓)標準而設計和制造。這樣一來,企業很容易從諸多內存廠商購得價位合理的內存,但是遵守標準并不能保證可靠性。

        內存可靠性面臨的最大威脅并不是徹底的故障,不過可能會出現生產缺陷、電事件及其他物理異常引起的故障。確切地說,服務器內存面臨的最大威脅來自隨機比特錯誤——某個比特出現自發逆轉。要是未加以檢查,僅僅一個比特出現錯誤就會以突如其來、可能災難性的方式,改動指令或改變數據流。

        比特錯誤會自然發生。內存模塊的錯誤率從每兆字節內存每小時大約1比特(有時被標為1010 errors/bit*h)到每兆字節內存每百年1比特(1017 errors/bit*h)不等。這個范圍相差得太大了,但隨著內存子系統速度變快、電氣操作電壓變低以及服務器上的內存總量增加,比特被“誤解”并影響工作負載的可能性隨之變得相當大。

        其他因素也會加劇單比特錯誤,比如本底輻射(阿爾法粒子)、寄生電事件(如附近電磁干擾)、糟糕的主板屏蔽或設計,甚至DIMM插座上的電觸點受到破損或質量低劣。

        增強內存可用性的特性

        缺少可用內存始終是個問題,而奇偶校驗等錯誤檢測技術已存在了好多年。奇偶校驗很簡單,對于檢測單比特錯誤也很有效,但它糾正不了單比特錯誤,所以沒有大量地應用于服務器。幸好,現在有或正出現另外許多特性,有助于增強內存可靠性。不妨考慮以下幾種方案:

        ECC。系統廠商們不是依賴奇偶校驗,而是依賴糾錯碼(ECC)技術。ECC立足于奇偶校驗的基礎上,它使用一種算法,為每64比特的內存創建和存儲一個8比特碼(每個地址總共72比特)。這種算法和編碼讓系統得以實時檢測和糾正單比特錯誤,此外還能檢測多比特錯誤,并防止系統使用破損數據。ECC通常是許多通用服務器上采用的確保內存可靠性的默認技術。

        先進ECC。先進ECC把ECC方法擴大到了多種內存設備,讓ECC得以檢測和糾正多比特故障,只要這些故障出現在同一個內存設備里面。不過,ECC和先進ECC并不支持任何一種故障切換機制,所以為了排除有問題的內存模塊,仍得關閉系統(或依賴其他系統技術)。許多企業級服務器可以提供某種先進ECC,比如IBM ProLiant或戴爾PowerEdge。

        內存錯誤跟蹤。應對內存錯誤的一方面是,首先密切跟蹤內存錯誤。新興的服務器設計通過為錯誤率和位置做一份列表,開始密切跟蹤可以糾正的錯誤。一些服務器還能將錯誤信息保存在內存模塊上的可重寫串行存在檢測(SPD)內存空間——可以讀取該內存空間,以便將來評估和分析。一旦系統能跟蹤可以糾正的內存錯誤,并將該信息轉移到系統的管理工具,就有可能通過記下錯誤率突然增加的DIMM來預測可能發生的內存故障。錯誤跟蹤稱得上是更先進的內存可靠性特性的先驅,更先進的特性包括DIMM故障切換或在物理內存空間里面轉移數據。

        熱備用內存。熱備用概念在磁盤存儲領域很常見,但只是最近才在服務器設計流行起來。這是由于系統必須有一定的智能,才能先識別和跟蹤可以糾正的內存錯誤,之后才能決定把數據轉移到備用內存模塊上。內存錯誤跟蹤方面的技術進步讓服務器的內存控制器得以將數據從存在的錯誤不可接受的DIMM轉移到同一通道中的另一個備用DIMM上。這也叫內存插槽備用(rank sparing)。這種方法存在的不足是,為錯誤發生前一直非生產性的服務器增添內存需要一筆開支。

        設備標記(Device tagging)。一種內存故障切換技術是基于BIOS的技術,名為設備標記。當系統跟蹤到出現錯誤率增加的內存模塊時,系統基本上就能把數據從有問題的內存轉移到ECC內存——實際上使用ECC內存作為一個小小的熱備用內存。這有望減少內存故障,但同時無法在這部分內存里面進行錯誤檢測和糾正。設備標記被用作一種權宜之計,讓系統保持運行,直到有問題的內存模塊被換掉為止。

        內存鏡像。完美的內存可靠性技術就是把服務器上內存中內容從一個通道復制到另一個配對通道上。這實際上就是為內存建立了RAID 1機制。如果一個通道的內存里面出現故障,內存控制器就會切換到配對通道上,沒有任何干擾;完成修復工作(如果需要修復)后,通道就可以重新進行同步。鏡像方法的缺點與存儲方面的RAID 1一樣;由于內存中的內容被復制,存儲容量減少了一半,或者說內存成本實際上翻了一番。

        如今內存在現代虛擬化服務器中扮演更關鍵的角色,所以應對和緩解內存錯誤的破壞性效應顯得比以往更為重要。IT專業人員可以使用一系列不斷完善的內存可靠性特性,但是他們必須先對內存可用性方面的需求進行更認真地評估,然后再部署擁有的特性可以滿足那些需求的服務器。

        河南億恩科技股份有限公司(www.endtimedelusion.com)始創于2000年,專注服務器托管租用,是國家工信部認定的綜合電信服務運營商。億恩為近五十萬的用戶提供服務器托管、服務器租用、機柜租用、云服務器、網站建設、網站托管等網絡基礎服務,另有網總管、名片俠網絡推廣服務,使得客戶不斷的獲得更大的收益。
        服務器/云主機 24小時售后服務電話:0371-60135900
        虛擬主機/智能建站 24小時售后服務電話:0371-55621053
        網絡版權侵權舉報電話:0371-60135995
        服務熱線:0371-60135900

        1
        1
        分享到:責任編輯:小恩

        相關推介

        共有:1條評論網友評論:

        驗證碼 看不清換一張 換一張

        親,還沒評論呢!速度搶沙發吧!
        av不卡不卡在线观看_最近2018年中文字幕_亚洲欧美一区二区三区_一级A爱做片免费观看国产_日韩在线中文天天更新_伊人中文无码在线