文章詳情頁
教你如何處理Oracle數(shù)據(jù)庫中的壞塊
瀏覽:4日期:2023-11-12 14:31:23
一:什么是數(shù)據(jù)庫的壞塊 首先我們來大概看一下數(shù)據(jù)庫塊的格式和結(jié)構(gòu) 數(shù)據(jù)庫的數(shù)據(jù)塊有固定的格式和結(jié)構(gòu),分三層:cache layer,transaction layer,data layer。在我們對數(shù)據(jù)塊進行讀取寫入操作的時候,數(shù)據(jù)庫會對要讀寫的數(shù)據(jù)塊做一致性的檢查,其中包括:數(shù)據(jù)塊的類型、數(shù)據(jù)塊的地址信息、數(shù)據(jù)塊的SCN號以及數(shù)據(jù)塊的頭部和尾部。假如發(fā)現(xiàn)其中有不一致的信息,那數(shù)據(jù)庫就會標記這個數(shù)據(jù)塊為壞塊了。數(shù)據(jù)庫的壞塊分為兩種,邏輯壞塊和物理壞塊。 二:壞塊對數(shù)據(jù)庫產(chǎn)生的影響 假如數(shù)據(jù)庫出現(xiàn)壞塊,數(shù)據(jù)庫的告警日志文件里面會存在有如下的一些報錯信息:Ora-1578以及Ora-600 and trace file in bdump Directory,其中Ora-600錯誤的第一個參數(shù)值的范圍是[2000]-[8000],不同的值代表著數(shù)據(jù)塊的不同的層出現(xiàn)問題,具體的如下表所示: Range block layerCache layer 2000 – 4000Transaction layer 4000 – 6000Data layer 6000 - 8000壞塊產(chǎn)生影響的對象可能是數(shù)據(jù)字典表、回滾段表、臨時段、用戶數(shù)據(jù)表和索引等。不同的對象產(chǎn)生壞塊后的處理方法不盡相同。 三:壞塊產(chǎn)生的原因 Oracle調(diào)用標準C的系統(tǒng)函數(shù),對數(shù)據(jù)塊進行讀寫操作,因此,壞塊是有可能由以下幾種原因產(chǎn)生: Ø 硬件的I/O錯誤 Ø 操作系統(tǒng)的I/O錯誤或緩沖問題 Ø 內(nèi)存或paging問題 Ø 磁盤修復(fù)工具 Ø 一個數(shù)據(jù)文件的一部分正在被覆蓋 Ø Oracle試圖訪問一個未被格式化的系統(tǒng)塊失敗 Ø 數(shù)據(jù)文件部分溢出 Ø Oracle或者操作系統(tǒng)的bug 四:壞塊的處理方法 1. 先收集相應(yīng)的關(guān)于壞快的信息,從AlertSID.log文件或者從trace文件中查找,找到例如以下的一些信息: Ora-1578 file# (RFN) block#Ora-1110 file# (AFN) block#Ora-600 file# (AFN) block#其中RFN表示的是relative_fno AFN表示的是file_id Select file_name,tablespace_name,file_id “AFN”,relative_fno “RFN”From dba_data_files;Select file_name,tablespace_name,file_id, relative_fno“RFN”From dba_temp_files;2. 確定存在壞塊的對象是什么: SELECT tablespace_name, segment_type, owner, segment_name, partition_name FROM dba_extents WHERE file_id = <AFN> and <BL> between block_id AND block_id + blocks – 1;通過上面這個查詢語句就可以查出當前存在壞塊的對象是什么,是什么類型的對象。需要注重的是假如是temp文件中出現(xiàn)壞塊,是沒有記錄返回的。 3. 根據(jù)2中查詢出來的對象類型,確定相應(yīng)的處理方法 出現(xiàn)壞塊的常見對象有: Ø Sys用戶下的對象 Ø 回滾段 Ø 臨時段 Ø 索引或者分區(qū)索引 Ø 表 常用的處理方法有: Ø 恢復(fù)數(shù)據(jù)文件 Ø 只恢復(fù)壞的block(9i以上版本可用) Ø 通過ROWID RANGE SCAN 保存數(shù)據(jù) Ø 使用DBMS_REPAIR Ø 使用EVENT 4. 具體處理方法的介紹 Ø 恢復(fù)數(shù)據(jù)文件方法: 假如數(shù)據(jù)庫是歸檔方式下,并且有完整的物理備份,就可以使用此方法來恢復(fù)。 步驟如下: 1) 先offline受影響的數(shù)據(jù)文件,執(zhí)行以下的語句: ALTER DATABASE DATAFILE 'name_file' OFFLINE;2) 保留有壞塊的數(shù)據(jù)文件,然后拷貝備份的數(shù)據(jù)文件。假如恢復(fù)的數(shù)據(jù)文件要求路徑不同,執(zhí)行以下的語句: ALTER DATABASE RENAME FILE 'old_name' TO 'new_name';3) 恢復(fù)數(shù)據(jù)文件,執(zhí)行以下語句: RECOVER DATAFILE 'name_of_file';4) Online恢復(fù)后的數(shù)據(jù)文件,執(zhí)行以下的語句: ALTER DATABASE DATAFILE 'name_of_file' ONLINE;Ø 只恢復(fù)壞的block(9i以上版本可用) 使用這種方法要求數(shù)據(jù)庫版本是9.2.0以上,要求配置了Rman的catalog數(shù)據(jù)庫,數(shù)據(jù)庫為歸檔方式,并且有完整的物理備份。 步驟如下: 使用RMAN的BLOCKRECOVER命令 : Rman>run{blockrecover datafile 5 block 11,16;}也可以強制使用某個SCN號之前的備份,恢復(fù)數(shù)據(jù)塊。 Rman>run{blockrecover datafile 5 block 11,16 restore until sequence 8505;}Ø 通過ROWID RANGE SCAN 保存數(shù)據(jù) 1) 先取得壞塊中ROW ID的最小值,執(zhí)行以下的語句: SELECT dbms_rowid.rowid_create(1,<OBJ_ID>,<RFN>,<BL>,0) from DUAL;2)取得壞塊中的ROW ID的最大值,執(zhí)行以下的語句: SELECT dbms_rowid.rowid_create(1,<OBJ_ID>,<RFN>,<BL>+1,0) from DUAL;3)建議一個臨時表存儲那些沒有壞塊的數(shù)據(jù),執(zhí)行以下的語句: CREATE TABLE salvage_table AS SELECT * FROM corrupt_tab Where 1=2;4)保存那些不存在壞塊的數(shù)據(jù)到臨時表中,執(zhí)行以下的語句: INSERT INTO salvage_table SELECT /*+ ROWID(A) */ * FROM <owner.tablename> A WHERE rowid < '<low_rid>';INSERT INTO salvage_table SELECT /*+ ROWID(A) */ * FROM <owner.tablename> A WHERE rowid >= '<hi_rid>‘;5) 根據(jù)臨時表中的數(shù)據(jù)重建表,重建表上的索引,限制。 Ø 使用10231診斷事件,在做全表掃描的時候跳過壞塊 可以在session級別設(shè)定: ALTER SESSION SET EVENTS '10231 TRACE NAME CONTEXT FOREVER, LEVEL 10';也可以在數(shù)據(jù)庫級別上設(shè)定,在初始化參數(shù)中加入:event='10231 trace name context forever, level 10' ,然后重啟數(shù)據(jù)庫。 然后從存在壞塊的表中取出不存在壞塊的數(shù)據(jù),執(zhí)行以下的語句: CREATE TABLE salvage_emp AS SELECT * FROM corrupt_table;最后rename生成的corrupt_table為原來表的名字,并重建表上的索引和限制。 Ø 使用dbms_repair包進行恢復(fù) 使用dbms_repair標記有壞塊的表,在做全表掃描的時候跳過壞塊,執(zhí)行以下的語句: Execute DBMS_REPAIR.SKIP_CORRUPT_BLOCKS('<schema>','<tablename>');然后使用eXP工具或者createtable as select的方法取出沒有壞塊數(shù)據(jù),然后重建表,表上的索引和限制。 五:壞塊的預(yù)先發(fā)現(xiàn)的方法 1. 假如要檢測數(shù)據(jù)庫中所有的表,可以利用exp工具導(dǎo)出整個數(shù)據(jù)庫可以檢測壞塊。不過這個工具有一些缺陷,對以下情況的壞塊是檢測不出來的: Ø HWM以上的壞塊是不會發(fā)現(xiàn)的 Ø 索引中存在的壞塊是不會發(fā)現(xiàn)的 Ø 數(shù)據(jù)字典中的壞塊是不會發(fā)現(xiàn)的 2. 假如只是對數(shù)據(jù)庫中比較重要的表進行壞塊檢查,可以使用ANALYZE TABLE tablename VALIDATE STRUCTURE CASCADE 的方法來檢測壞塊,它執(zhí)行壞塊的檢查,但是不會標記壞塊為corrupt,檢測的結(jié)果保存在USER_DUMP_DEST目錄下的用戶trace文件中。 3. 使用Oracle的專門工具dbv來檢查壞塊,具體的語法如下: 要害字 說明 (默認)---------------------------------------------------- FILE 要驗證的文件 (無) START 起始塊 (文件的第一個塊) END 結(jié)束塊 (文件的最后一個塊) BLOCKSIZE 邏輯塊大小 (2048) LOGFILE 輸出日志 (無) FEEDBACK 顯示進度 (0) PARFILE 參數(shù)文件 (無) USERID 用戶名/口令 (無)SEGMENT_ID 段ID (tsn.relfile.block) (無)例如: Dbv file=system01.dbf blocksize=8192DBVERIFY: Release 9.2.0.5.0 - Production on 星期六 11月 27 15:29:13 2004Copyright (c) 1982, 2002, Oracle Corporation. All rights reserved.DBVERIFY - 驗證正在開始 : FILE = system01.dbfDBVERIFY - 驗證完成檢查的頁總數(shù) :32000處理的頁總數(shù)(數(shù)據(jù)):13261失敗的頁總數(shù)(數(shù)據(jù)):0處理的頁總數(shù)(索引):2184失敗的頁總數(shù)(索引):0處理的頁總數(shù)(其它):1369處理的總頁數(shù) (段) : 0失敗的總頁數(shù) (段) : 0空的頁總數(shù) :15186記為損壞的總頁數(shù):0匯入的頁總數(shù) :0注:因為dbv要求file后面跟的必須是一個文件擴展名,所以假如用裸設(shè)備存儲的,就必須使用ln鏈接裸設(shè)備到一個文件,然后再用dbv對這個鏈接文件進行檢查。
標簽:
Oracle
數(shù)據(jù)庫
排行榜
