登錄客戶的機(jī)器,對于crs的錯(cuò)誤排查,從系統(tǒng)日志著手
在系統(tǒng)日志里有如下有關(guān)crs失敗的信息 Jan 29 20:25:59 inthrac01 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7004. Jan 29 20:25:59 inthrac01 su(pam_unix)[10765]: session closed for user oracle Jan 29 20:25:59 inthrac01 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7199. Jan 29 20:25:59 inthrac01 su(pam_unix)[10769]: session closed for user oracle Jan 29 20:25:59 inthrac01 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7574. 這里提示crs啟動(dòng)有故障,查看相應(yīng)的日志信息 /tmp/crsctl.7004 /tmp/crsctl.7199 /tmp/crsctl.7574 都出現(xiàn) OCR initialization failed accessing OCR device: PROC-26: Error while accessing the physical storage Operating System error [Permission denied] [13] 這里的錯(cuò)誤時(shí)ocr的device的設(shè)備,沒有權(quán)限訪問。 既然如此,我們就看看這個(gè)裸設(shè)備的權(quán)限叻喲。 運(yùn)行命令 [root@dxdb01 ~]# ocrcheck Status of Oracle Cluster Registry is as follows : Version : 2 Total space (kbytes) : 622080 Used space (kbytes) : 1932 Available space (kbytes) : 620148 ID : 1667883930 Device/File Name : /dev/raw/raw1 Device/File integrity check succeeded Device/File not configured Cluster registry integrity check succeeded ocr的設(shè)備是裸設(shè)備/dev/raw/raw1 [root@dxdb01 ~]#ls /dev/raw/raw1 -l crw-rw---- 1 root disk 162, 1 Jan 29 20:36 /dev/raw/raw1 裸設(shè)備的權(quán)限確實(shí)不正確 [root@dxdb01 ~]# chown root:oinstall /dev/raw/raw1 [root@dxdb01 ~]#ls /dev/raw/raw1 -l crw-rw---- 1 root oinstall 162, 1 Jan 29 20:36 /dev/raw/raw1 [root@dxdb01 ~]# crsctl check crs Failure 1 contacting CSS daemon Cannot communicate with CRS Cannot communicate with EVM 再等待一下。 [root@dxdb01 ~]# crsctl check crs CSS appears healthy CRS appears healthy EVM appears healthy CRS已經(jīng)啟動(dòng)成功叻。 現(xiàn)在看看資源的狀況 [root@dxdb01 ~]# crs_stat -t Name Type Target State Host ------------------------------------------------------------ ora....b01.gsd application ONLINE UNKNOWN dxdb01 ora....b01.ons application ONLINE UNKNOWN dxdb01 ora....b01.vip application ONLINE ONLINE dxdb01 ora....b02.vip application ONLINE ONLINE dxdb01 這里資源除了vip是UNKNOWN的 這里可以查看$CRS_HOME/log/dxdb01/alertdxdb01.log文件 可以發(fā)現(xiàn)一些線索叻 這里和上面一樣同樣是由權(quán)限導(dǎo)致的。 一樣的方法解決,先查看vote disk的設(shè)備的權(quán)限 vote disk的權(quán)限應(yīng)該是oracle:oinstall, 按照這樣的權(quán)限就解決叻。 解決完了,就詢問了一下是做了什么操作,客戶說,也沒有做什么操作,不過是共享儲(chǔ)柜上次要換地方,就是關(guān)機(jī),開機(jī)而已,就出現(xiàn)這個(gè)問題叻。 根據(jù)客戶的描述,做了一下重啟的動(dòng)作,果然,這兩個(gè)裸設(shè)備的權(quán)限又發(fā)生改變叻。 估計(jì)可以沒有綁定raw device的處理 查看/etc/rc.d/rc.local確實(shí)沒有 檢查/etc/udev/permissions.d/50-udev.permissions文件,也是沒有相關(guān)處理。 在/etc/rc.d/rc.local里加上了相關(guān)的處理 chown root:oinstall /dev/raw/raw1 chown oracle:oinstall /dev/raw/raw2 重啟機(jī)器,CRS成功啟動(dòng),數(shù)據(jù)庫啟動(dòng)正常。 故障完全排除。 |
|