本發明專利技術提供一種基于Intel?Brickland-EX平臺的同頻鎖步模式的自動切換方法,將系統默認的工作模式設置為Performance模式,通過監控管理單元收集內存報錯信息,并設置閥值,錯誤超過這個閥值則在系統重啟過程中,BIOS將CPU的訪存模式自動設置為同頻鎖步模式以保證系統訪存穩定性,這樣就降低了總線負荷,降低至1/2cacheline,并提高了ECC的糾錯能力,保證系統訪存性能。
【技術實現步驟摘要】
本專利技術涉及計算機應用
,具體地說是一種基于Intel Brickland-EX平臺同頻鎖步模式的自動切換方法。
技術介紹
Intel Brickland-EX平臺處理器的訪存方式共有兩種 其一稱作Performance模式,也叫Independent模式,在這種模式下,處理器下游每個內存通道都是獨立的,處理器在讀寫操作時在每個內存通道均以完整cache line傳輸,可以充分保證訪存的高性能; 其二稱作Lockstep模式,也稱為同頻鎖步模式,在這種模式下,處理器下游的內存通道兩兩進行同頻鎖步,處理器在讀寫操作時在同頻鎖步的兩個內存通道以一半cache line傳輸數據,兩個同頻鎖步的內存通道組合起來才是一個完整的cache line,這樣做的好處是減少內存通道的負載,使ECC糾錯更加游刃有余,大幅提聞系統訪存的可罪性,但可以看出在Lockstep模式下,處理器訪存性能降低了一半。綜上,在Brickland-EX平臺下兩種處理器訪存方式各有利弊,那么在實際應用過程中,如何選擇便成為一個難以決定的問題。本文闡述的就是基于Intel Brickland-EX平臺的同頻鎖步模式自動切換方法 在服務器領域,尤其是基于Intel Brickland-EX平臺下的高端服務器領域中,由于處理器數量多,內存容量大,加之整個架構和連接非常復雜,給系統的穩定性帶來極大的挑戰;在實際應用方面,系統不穩定的大多數可能來自于訪存錯誤,訪存發生問題,就會可以直接導致系統藍屏或死機。服務器生廠商或芯片生產商往往提供一些提高穩定性的功能,它們以損失性能為代價,提高了系統可靠性。本文前部分介紹的同頻鎖步模式就是這樣一種功能。但性能是很多客戶不愿意舍去的,尤其在高性能運算應用中,性能是重中之重,客戶不惜花費重金購買多核高主頻處理器,構建大容量內存系統,目的就是追求良好的性能。因此,如何在性能及可靠性之間斡旋,成為一個值得討論的話題;盡可能保證系統性能,在必要的時候再選擇犧牲性能換取穩定性才是正確的理念。本文講述的同頻鎖步模式自動切換方法遵循這樣的理念,具有極強的實用性和極高的商業價值。
技術實現思路
本專利技術的目的是提供一種基于Intel Brickland-EX平臺的同頻鎖步模式自動切換方法。本專利技術的目的是按以下方式實現的,自動切換步驟如下 O為了保證系統訪存性能,BIOS將系統默認的訪存模式設置為Performance模式,并開啟CPU ECC糾錯功能,在Brickland-EX平臺表現為SDDC或DDDC功能;2)如果訪存時發生2bit以下的錯誤,通過ECC功能可以將錯誤糾正,2bit以上錯誤則需要啟用DDDC功能糾正,同時BIOS需要將記錄這一次錯誤并通過PCH的LPC總線傳送給BMC ; 3)BMC設置閥值計數器,當接收BIOS傳送的錯誤數量達到10次以上時,閥值計數器溢出,BMC將溢出的I寫入EEPROM保存;于此同時BMC設置內存位置編碼寄存器記錄報錯內存的位置,一并寫入EEPROM中保存; 4)系統在下一次重啟或重新開機時,BMC首先從EEPROM中獲取報錯內存的位置,并確認此位置內存是否被更換,如果發現已經替換為新的內存,BIOS將啟用默認的 Performance訪存模式,BMC清空內存位置編碼寄存器和閥值寄存器;如果發現報錯的內存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPI0,告知BIOS需將訪存切換為同頻鎖步模式; 5)通過監控管理單元收集內存報錯信息,并設置閥值,錯誤超過這個閥值則在系統重啟過程中,BIOS將CPU的訪存模式自動設置為同頻鎖步模式以保證系統訪存穩定性,這樣就降低了總線負荷,降低至1/2 cache line,并提高了 ECC的糾錯能力; 6)維修過故障內存后,或長時間沒有發生內存錯誤時,監控管理單元再通過BIOS將訪存方式再次變更Performance模式。本專利技術的有益效果是將系統默認的工作模式設置為Performance模式,通過監控管理單元收集內存報錯信息,并設置閥值,錯誤超過這個閥值則在系統重啟過程中,BIOS將CPU的訪存模式自動設置為同頻鎖步模式以保證系統訪存穩定性,這樣就降低了總線負荷,降低至1/2 cache line,并提高了 ECC的糾錯能力,保證系統訪存性能。附圖說明圖I是Performance模式體系架構 圖2是同頻鎖步模式體系架構 圖3是切換訪存模式的體系架構 圖4是自動切換流程圖。具體實施例方式參照說明書附圖對本專利技術的方法作以下詳細地說明。本專利技術提出了一種基于Intel Brickland-EX平臺的Lockstep自動切換方法,利用監控管理單元收集內存報錯信息,并通過BIOS切換處理器訪存方式;可以盡可能保證服務器系統的性能,在必要的時候選擇犧牲性能換取系統穩定性。Intel Brickland-EX訪存體系架構如圖I所示同頻鎖步切換訪存模式的體系架構如圖2所示 系統自動切換步驟如下如圖3、圖4所示; O為了保證系統訪存性能,BIOS將系統默認的訪存模式設置為Performance模式,并開啟CPU ECC糾錯功能,在Brickland-EX平臺表現為SDDC或DDDC功能; 2)如果訪存時發生2bit以下的錯誤,通過ECC功能可以將錯誤糾正,2bit錯誤需要啟用DDDC功能糾正,同時BIOS需要將記錄這一次錯誤并通過PCH的LPC總線傳送給BMC ;3)BMC設置閥值計數器,當接收BIOS傳送的錯誤數量達到10次以上時,閥值計數器溢出,BMC將溢出的I寫入EEPROM保存;于此同時BMC設置內存位置編碼寄存器記錄報錯內存的位置,一并寫入EEPROM中保存; 4)系統在下一次重啟或重新開機時,BMC首先從EEPROM中獲取報錯內存的位置,并確認此位置內存是否被更換,如果發現已經替換為新的內存,BIOS將啟用默認的Performance訪存模式,BMC清空內存位置編碼寄存器和閥值寄存器;如果發現報錯的內存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPI0,告知BIOS需將訪存切換為Lockst印模式; 5)系統開機后,BIOS將CPU的訪存模式自動設置為Lockstep;這樣就降低了總線負荷,降低至1/2 cache line,并提高了 ECC的糾錯能力; 6)維修過故障內存后,或長時間沒有發生內存錯誤時,監控管理單元再通過BIOS將訪 存方式再次變更Performance模式。除說明書所述的技術特征外,均為本專業技術人員的已知技術。權利要求1.一種基于Intel Brickland-EX平臺的同頻鎖步模式自動切換方法,其特征在于自動切換步驟如下 .1)為了保證系統訪存性能,BIOS將系統默認的訪存模式設置為Performance模式,并開啟CPU ECC糾錯功能,在Brickland-EX平臺表現為SDDC或DDDC功能; .2)如果訪存時發生2bit以下的錯誤,通過ECC功能可以將錯誤糾正,2bit以上錯誤則需要啟用DDDC功能糾正,同時BIOS需要將記錄這一次錯誤并通過PCH的LPC總線傳送給BMC ; .3)BMC設置本文檔來自技高網...
【技術保護點】
一種基于Intel?Brickland?EX平臺的同頻鎖步模式自動切換方法,其特征在于自動切換步驟如下:1)為了保證系統訪存性能,BIOS將系統默認的訪存模式設置為Performance模式,并開啟CPU?ECC糾錯功能,在Brickland?EX平臺表現為SDDC或DDDC功能;2)如果訪存時發生2bit以下的錯誤,通過ECC功能可以將錯誤糾正,2bit以上錯誤則需要啟用DDDC功能糾正,同時BIOS需要將記錄這一次錯誤并通過PCH的LPC總線傳送給BMC;3)BMC設置閥值計數器,當接收BIOS傳送的錯誤數量達到10次以上時,閥值計數器溢出,BMC將溢出的1寫入EEPROM保存;于此同時BMC設置內存位置編碼寄存器記錄報錯內存的位置,一并寫入EEPROM中保存;4)系統在下一次重啟或重新開機時,BMC首先從EEPROM中獲取報錯內存的位置,并確認此位置內存是否被更換,如果發現已經替換為新的內存,BIOS將啟用默認的Performance訪存模式,BMC清空內存位置編碼寄存器和閥值寄存器;如果發現報錯的內存沒有被更換,則查看EEPROM中是否記錄閥值的溢出,如有溢出則通過拉低與PCH之間的GPIO,告知BIOS需將訪存切換為同頻鎖步模式;5)通過監控管理單元收集內存報錯信息,并設置閥值,錯誤超過這個閥值則在系統重啟過程中,?BIOS將CPU的訪存模式自動設置為同頻鎖步模式以保證系統訪存穩定性,這樣就降低了總線負荷,降低至1/2?cache?line,并提高了ECC的糾錯能力;6)維修過故障內存后,或長時間沒有發生內存錯誤時,監控管理單元通過BIOS將訪存方式再次變更為Performance模式。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:李博樂,林楷智,
申請(專利權)人:浪潮電子信息產業股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。