26 декабря 2012 г.

Ошибка при старте кластера


После сбоя на дисковом массиве, упал кластер

При старте crsd демон не находил ocr файлов, которые были размещены в дисковой группе DATA

2012-12-22 10:48:21.774: [UiServer][1157368128] {0:0:122} Done for ctx=0x2aaab80c4460
2012-12-22 10:48:24.021: [    AGFW][1144760640] {0:5:21} Agfw Proxy Server received the message: RESOURCE_STATUS[Proxy] ID 20481:44752
2012-12-22 10:48:24.021: [    AGFW][1144760640] {0:5:21} Received state LABEL change for ora.asm 1 1 [old label  = Startup Initiated, new label = OCR not started]
2012-12-22 10:48:24.021: [    AGFW][1144760640] {0:5:21} Agfw Proxy Server sending message to PE, Contents = [MIDTo:2|OpID:3|FromA:{Invalid|Node:0|Process:0|Type:0}|ToA:{Invalid|Node:-1|Process:-1|Type:-1}|MIDFrom:0|Type:4|Pri2|Id:7067:Ver:2]
2012-12-22 10:48:24.021: [    AGFW][1144760640] {0:5:21} Agfw Proxy Server replying to the message: RESOURCE_STATUS[Proxy] ID 20481:44752
2012-12-22 10:48:24.021: [   CRSPE][1155266880] {0:5:21} State change received from isur-db-01 for ora.asm 1 1
2012-12-22 10:48:24.021: [   CRSPE][1155266880] {0:5:21} Processing PE command id=129. Description: [Resource State Change (ora.asm 1 1) : 0x2aaaac178c90]
2012-12-22 10:48:24.021: [   CRSPE][1155266880] {0:5:21} Set State Details to [OCR not started] from [ Startup Initiated] for [ora.asm 1 1]
2012-12-22 10:48:24.021: [   CRSPE][1155266880] {0:5:21} PE Command [ Resource State Change (ora.asm 1 1) : 0x2aaaac178c90 ] has completed
2012-12-22 10:48:24.022: [    AGFW][1144760640] {0:5:21} Agfw Proxy Server received the message: CMD_COMPLETED[Proxy] ID 20482:7068
2012-12-22 10:48:24.022: [    AGFW][1144760640] {0:5:21} Agfw Proxy Server replying to the message: CMD_COMPLETED[Proxy] ID 20482:7068
2012-12-22 10:48:24.022: [    AGFW][1144760640] {0:5:21} Agfw received reply from PE for resource state change for ora.asm 1 1
~

[root@isur-db-01 ohasd]# /u01/app/11.2.0/grid/bin/ocrcheck
PROT-602: Failed to retrieve data from the cluster registry
PROC-26: Error while accessing the physical storage



ocrconfig_loc=+DATA


Нет дисковой группы +DATA

SQL> select NAME from v$asm_diskgroup;

no rows selected

SQL> select disk_number, name from  v$asm_disk;

DISK_NUMBER NAME
----------- ------------------------------
          1
          0
SQL> select NAME , STATE FROM V$ASM_DISKGROUP;

no rows selected


[root@isur-db-01 ~]# /etc/init.d/oracleasm listdisks
DISK1
DISK2


SQL> select TOTAL_MB from v$asm_disk;

  TOTAL_MB
----------
         0
         0



SQL> shutdown immediate
ORA-15100: invalid or missing diskgroup name

SQL> startup
ORA-32004: obsolete or deprecated parameter(s) specified for ASM instance
ASM instance started

Total System Global Area  283930624 bytes
Fixed Size                  2227664 bytes
Variable Size             256537136 bytes
ASM Cache                  25165824 bytes
ORA-15032: not all alterations performed
ORA-15017: diskgroup "DATA" cannot be mounted
ORA-15063: ASM discovered an insufficient number of disks for diskgroup "DATA"

Диски в дисковой группе DATA имеют статус PROVISIONED


SQL> select HEADER_STATUS,name from v$asm_disk;

HEADER_STATU NAME
------------ ------------------------------
PROVISIONED
PROVISIONED



/u01/app/11.2.0/grid/bin/kfed read /dev/oracleasm/disks/DISK1


kfdhdb.acdb.ub2spare:     43605 ; 0x1de: 0xaa55

В этом случае восстанавливать нужно по ноте Mounting Diskgroup Fails With ORA-15063 and V$ASM_DISK Shows PROVISIONED [ID 1487443.1]

На обоих серверах. На первом:

dd if=/dev/oracleasm/disks/DISK1 of=/tmp/DISK1.dd bs=1M count=1

 /u01/app/11.2.0/grid/bin/kfed read /dev/oracleasm/disks/DISK1 |grep ausize
kfdhdb.ausize:                  1048576 ; 0x0bc: 0x00100000


/u01/app/11.2.0/grid/bin/kfed repair /dev/oracleasm/disks/DISK1 aus=1048576

На втором:

/u01/app/11.2.0/grid/bin/kfed read /dev/oracleasm/disks/DISK2 |grep ausize


dd if=/dev/oracleasm/disks/DISK2 of=/tmp/DISK2.dd bs=1M count=1

/u01/app/11.2.0/grid/bin/kfed repair /dev/oracleasm/disks/DISK2 aus=1048576


После этого asm смог смонтировать дисковую группу +DATA и кластер поднялся на обоих серверах.

10 декабря 2012 г.

Ошибка при работе Oracle Web Service Manager


В логе 2-го гейтвея постоянно сыпятся сообщения об ошибке:

 Log of com.fors.wsmstep.audit.common.CommonLogEntry failed: java.lang.IllegalStateException: Datasource not found: Not in an application scope –
  
Эту ошибку формирует программа , которая выполняет подпись сообщений (custom sign message)

Для исправления нужно прописать свойство 
<data id="oc4j-options" value="-userThreads"/>  
(выделенное вы выдержке ниже в process-type=”wsm) по пути  <нужный gateway>/opmn/conf/opmn.xml

 Затем перезапустить gateway (например командами opmnctl stopall, opmnctl startall – чтобы перезапустить нужный gateway, надо эти команды запускать там где находится файл opmnct.exe в поддиректории нужного gateway’я <gateway> /opmn/bin/)

      <process-type id="wsm" module-id="OC4J" status="enabled"
               <module-data>
                  <category id="start-parameters">
                     <data id="java-options" value="-server -mx1024M -ms512M -Xrs -XX:MaxPermSize=128M …"/>
                     <data id="oc4j-options" value="-userThreads"/>
                  </category>
                  <category id="stop-parameters">
                     <data id="java-options" value="-Djava.security.policy=$ORACLE_HOME/j2ee/wsm/config/java2.policy -Djava.awt.headless=true -Dhttp.webdir.enable=false"/>
                  </category>
               </module-data>