本發(fā)明專利技術(shù)提供一種磁盤陣列多級(jí)數(shù)據(jù)自動(dòng)修復(fù)的方法,第一級(jí)別把因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域;第二級(jí)是根據(jù)預(yù)留區(qū)域的使用情況以及一些關(guān)鍵屬性,并對(duì)磁盤損壞的歷史信息進(jìn)行統(tǒng)計(jì),采用智能學(xué)習(xí)方法預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤得數(shù)據(jù)進(jìn)行備份。該一種磁盤陣列多級(jí)數(shù)據(jù)自動(dòng)修復(fù)的方法和現(xiàn)有技術(shù)相比,提前對(duì)可能失效的盤的數(shù)據(jù)進(jìn)行備份,大大提高了系統(tǒng)可靠性。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及計(jì)算機(jī)
,具體涉及。
技術(shù)介紹
有些磁盤陣列產(chǎn)品的掉盤是由于少量壞扇區(qū)引起的。由于少量壞扇區(qū)而引起的磁盤失效,大大降低了系統(tǒng)的可靠性。幾乎所有的硬盤都會(huì)有壞扇區(qū),從損壞形式上來(lái)說(shuō),壞扇區(qū)可分為兩類軟損壞扇區(qū)和物理?yè)p壞扇區(qū)。軟損壞扇區(qū)往往是病毒或某些軟件造成的,不是真正的壞扇區(qū),可以通過(guò)再次格式化來(lái)修復(fù)。另一種是物理?yè)p壞引起的壞扇區(qū),數(shù)據(jù)將永遠(yuǎn)無(wú)法寫入到這種扇區(qū)中。這兩種形式引起的壞扇區(qū)都可以通過(guò)數(shù)據(jù)轉(zhuǎn)移來(lái)避歸。另外,有很多掉盤的情況是可以提前檢測(cè)出來(lái),通過(guò)缺陷參數(shù)發(fā)生的變化進(jìn)行預(yù)測(cè),還可以通過(guò)壞扇區(qū)的數(shù)量進(jìn)行聯(lián)動(dòng)決策,進(jìn)而能夠提前做出準(zhǔn)備,把可能發(fā)生失效的盤的數(shù)據(jù)備份到熱備盤上去,從而可以減少數(shù)據(jù)丟失的概率。針對(duì)以上問(wèn)題,本專利技術(shù)提供一種可以進(jìn)行多級(jí)數(shù)據(jù)修復(fù)的磁盤陣列自動(dòng)修復(fù)的方法。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)的技術(shù)任務(wù)是針對(duì)在現(xiàn)有技術(shù)的不足,提供。本專利技術(shù)的技術(shù)方案是按以下方式實(shí)現(xiàn)的,該,包括扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程和磁盤參數(shù)異常修復(fù)過(guò)程,所述修復(fù)過(guò)程包括 步驟一、對(duì)磁盤陣列的讀寫錯(cuò)誤或磁盤參數(shù)異常進(jìn)行故障分析; 步驟二、對(duì)因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域,分析損壞情況,預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤進(jìn)行數(shù)據(jù)備份。所述步驟一中讀寫錯(cuò)誤故障分析包括以下步驟 1)、首先查看讀寫操作是否為已經(jīng)記錄的壞扇區(qū); 2)、如果扇區(qū)被記錄為壞扇區(qū),則在預(yù)留扇區(qū)上讀寫數(shù)據(jù),并判斷是否出錯(cuò),否則讀寫該扇區(qū)的數(shù)據(jù); 3)、如果讀寫預(yù)留扇區(qū)或者原始扇區(qū)出現(xiàn)錯(cuò)誤,則判斷是否可修復(fù),如果能修復(fù),就進(jìn)行數(shù)據(jù)轉(zhuǎn)移;如果無(wú)法修復(fù),就設(shè)定該盤失效。所述扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程包括周期掃描過(guò)程,該過(guò)程用于掃描磁盤,及時(shí)發(fā)現(xiàn)錯(cuò)誤,同時(shí)為了不影響使用性能,該過(guò)程只在設(shè)備空閑的時(shí)候進(jìn)行掃描。所述步驟一中磁盤參數(shù)異常故障分析包括周期性掃描檢測(cè)收集磁盤屬性數(shù)據(jù)信息,這些信息包括預(yù)留區(qū)域使用情況、磁盤自然屬性、磁盤增長(zhǎng)缺陷屬性。上述磁盤參數(shù)異常故障分析的過(guò)程包括 第一層、預(yù)留區(qū)域使用情況判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷; 第二層、磁盤自然屬性使用時(shí)間和溫度,判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷; 第三層、磁盤增長(zhǎng)缺陷屬性錯(cuò)誤計(jì)數(shù)統(tǒng)計(jì),判別算法可以采用閥值比較、采用貝葉斯概率統(tǒng)計(jì)或者秩和檢驗(yàn)統(tǒng)計(jì)等算法中的一種。本專利技術(shù)與現(xiàn)有技術(shù)相比所產(chǎn)生的有益效果是 本專利技術(shù)的通過(guò)提前對(duì)可能失效的盤的數(shù)據(jù)進(jìn)行備份,大大提高了系統(tǒng)可靠性,把可能發(fā)生失效的盤的數(shù)據(jù)備份到熱備盤上去,從而可以減少數(shù)據(jù)丟失的概率。附圖說(shuō)明附圖I是本專利技術(shù)的總體結(jié)構(gòu)示意圖。附圖2是讀寫錯(cuò)誤分析的流程示意圖。附圖3是壞盤預(yù)測(cè)的流程示意圖。具體實(shí)施例方式下面結(jié)合附圖對(duì)本專利技術(shù)所提供的作以下詳細(xì)說(shuō)明。由于如何發(fā)現(xiàn)壞扇區(qū)故障主要有兩個(gè)方面 1)通過(guò)扇區(qū)讀寫報(bào)錯(cuò); 2)周期性掃描硬盤發(fā)現(xiàn)介質(zhì)或者數(shù)據(jù)錯(cuò)誤。本專利技術(shù)一旦發(fā)現(xiàn)壞扇區(qū)故障,可以把該位置的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域。本專利技術(shù)還對(duì)磁盤故障進(jìn)行預(yù)測(cè),通過(guò)分析磁盤參數(shù)信息對(duì)磁盤可預(yù)測(cè)故障進(jìn)行預(yù)測(cè),為數(shù)據(jù)主動(dòng)遷移提供依據(jù)。如附圖I所示,,包括扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程和磁盤參數(shù)異常修復(fù)過(guò)程,所述修復(fù)過(guò)程包括 步驟一、對(duì)磁盤陣列的讀寫錯(cuò)誤或磁盤參數(shù)異常進(jìn)行故障分析; 步驟二、對(duì)因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域,分析損壞情況,預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤進(jìn)行數(shù)據(jù)備份。為了記錄數(shù)據(jù)轉(zhuǎn)移信息,要建立一個(gè)扇區(qū)映射表,表格的每一項(xiàng)包含原來(lái)扇區(qū)號(hào)和新轉(zhuǎn)移的扇區(qū)號(hào),這個(gè)表格可以放到磁盤預(yù)留空間,使用的時(shí)候放到內(nèi)存。另外,還有個(gè)計(jì)數(shù)器remap記錄有每個(gè)磁盤多少個(gè)扇區(qū)進(jìn)行了轉(zhuǎn)移。如附圖2所示,所述步驟一中讀寫錯(cuò)誤故障分析包括以下步驟 I)讀寫操作先在映射表中查詢此扇區(qū)是否已經(jīng)記錄為壞扇區(qū),所述映射表為記錄數(shù)據(jù)轉(zhuǎn)移信息簡(jiǎn)歷的表格。2)如果此扇區(qū)在映射表中有記錄,就到預(yù)留扇區(qū)上讀寫數(shù)據(jù),并判斷是否出錯(cuò);否則讀寫該扇區(qū)的數(shù)據(jù)。3)如果讀寫預(yù)留扇區(qū)或者原始扇區(qū)出現(xiàn)錯(cuò)誤,則判斷是否可修復(fù)(根據(jù)RAID算法,如果一個(gè)條帶錯(cuò)誤過(guò)多,則無(wú)法修復(fù)),如果能修復(fù),就進(jìn)行數(shù)據(jù)轉(zhuǎn)移;如果無(wú)法修復(fù),就設(shè)定該盤失效。本方明引入一個(gè)周期線程,用于扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程中掃描磁盤,及時(shí)發(fā)現(xiàn)錯(cuò)誤。為了不影響使用性能,該線程只在設(shè)備空閑的時(shí)候進(jìn)行掃描。磁盤的故障分為可預(yù)測(cè)故障和不可預(yù)測(cè)故障,而可預(yù)測(cè)故障可以通過(guò)一些參數(shù)的變化來(lái)提前做出預(yù)測(cè)。本專利技術(shù)有一個(gè)周期檢測(cè)線程,檢測(cè)磁盤的關(guān)鍵參數(shù),最后把各個(gè)磁盤的參數(shù)對(duì)比,選擇一個(gè)健康程度最差的磁盤(比如錯(cuò)誤最多或者溫度最高等),同歷史損壞磁盤的數(shù)據(jù)進(jìn)行對(duì)比分析,進(jìn)而確定是否可能損壞。結(jié)合壞扇區(qū)的數(shù)據(jù)轉(zhuǎn)移,所述步驟一中磁盤參數(shù)異常故障分析可以從三個(gè)種類的參數(shù)進(jìn)行如圖3: 1)RAID層次分析預(yù)留區(qū)域使用情況,判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷。2)進(jìn)入磁盤自然屬性分析使用時(shí)間和溫度,判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷。3)磁盤增長(zhǎng)缺陷屬性分析錯(cuò)誤計(jì)數(shù)統(tǒng)計(jì),包含尋址錯(cuò)誤計(jì)數(shù)等,判別算法可以采用閥值比較、采用貝葉斯概率統(tǒng)計(jì)或者秩和檢驗(yàn)統(tǒng)計(jì)等算法中的一種。權(quán)利要求1.,其特征在于包括扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程和磁盤參數(shù)異常修復(fù)過(guò)程,所述修復(fù)過(guò)程包括 步驟一、對(duì)磁盤陣列的讀寫錯(cuò)誤或磁盤參數(shù)異常進(jìn)行故障分析; 步驟二、對(duì)因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域,分析損壞情況,預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤進(jìn)行數(shù)據(jù)備份。2.根據(jù)權(quán)利要求I所述的,其特征在于所述步驟一中讀寫錯(cuò)誤故障分析包括以下步驟 1)、首先查看讀寫操作是否為已經(jīng)記錄的壞扇區(qū); 2)、如果扇區(qū)被記錄為壞扇區(qū),則在預(yù)留扇區(qū)上讀寫數(shù)據(jù),并判斷是否出錯(cuò),否則讀寫該扇區(qū)的數(shù)據(jù); 3)、如果讀寫預(yù)留扇區(qū)或者原始扇區(qū)出現(xiàn)錯(cuò)誤,則判斷是否可修復(fù),如果能修復(fù),就進(jìn)行數(shù)據(jù)轉(zhuǎn)移;如果無(wú)法修復(fù),就設(shè)定該盤失效。3.根據(jù)權(quán)利要求I或2所述的,其特征在于所述扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程包括周期掃描過(guò)程,該過(guò)程用于掃描磁盤,及時(shí)發(fā)現(xiàn)錯(cuò)誤,同時(shí)為了不影響使用性能,該過(guò)程只在設(shè)備空閑的時(shí)候進(jìn)行掃描。4.根據(jù)權(quán)利要求I所述的,其特征在于所述步驟一中磁盤參數(shù)異常故障分析包括周期性掃描檢測(cè)收集磁盤屬性數(shù)據(jù)信息,這些信息包括預(yù)留區(qū)域使用情況、磁盤自然屬性、磁盤增長(zhǎng)缺陷屬性。5.根據(jù)權(quán)利要求4所述的,其特征在于上述磁盤參數(shù)異常故障分析的過(guò)程包括 第一層、預(yù)留區(qū)域使用情況判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷; 第二層、磁盤自然屬性使用時(shí)間和溫度,判別算法采用閥值,超出閥值就認(rèn)為是壞盤,否則進(jìn)入下一層次判斷; 第三層、磁盤增長(zhǎng)缺陷屬性錯(cuò)誤計(jì)數(shù)統(tǒng)計(jì),判別算法可以采用閥值比較、采用貝葉斯概率統(tǒng)計(jì)或者秩和檢驗(yàn)統(tǒng)計(jì)等算法中的一種。全文摘要本專利技術(shù)提供,第一級(jí)別把因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域;第二級(jí)是根據(jù)預(yù)留區(qū)域的使用情況以及一些關(guān)鍵屬性,并對(duì)磁盤損壞的歷史信息進(jìn)行統(tǒng)計(jì),采用智能學(xué)習(xí)方法預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤得數(shù)據(jù)進(jìn)行備份。該和現(xiàn)有技術(shù)相比,提前對(duì)可能失效的盤的數(shù)據(jù)進(jìn)行備份,大大提高了系統(tǒng)可靠性。文檔編號(hào)G06F11/14GK102981930SQ201210459440公本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種磁盤陣列多級(jí)數(shù)據(jù)自動(dòng)修復(fù)的方法,其特征在于包括扇區(qū)讀寫錯(cuò)誤修復(fù)過(guò)程和磁盤參數(shù)異常修復(fù)過(guò)程,所述修復(fù)過(guò)程包括:步驟一、對(duì)磁盤陣列的讀寫錯(cuò)誤或磁盤參數(shù)異常進(jìn)行故障分析;步驟二、對(duì)因壞扇區(qū)出現(xiàn)讀寫錯(cuò)誤的數(shù)據(jù)轉(zhuǎn)移到預(yù)留區(qū)域,分析損壞情況,預(yù)測(cè)磁盤是否失效,提前對(duì)可能失效的盤進(jìn)行數(shù)據(jù)備份。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:文中領(lǐng),古世磊,
申請(qǐng)(專利權(quán))人:浪潮電子信息產(chǎn)業(yè)股份有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。