RAC-Glossar

Ein schöner Glossar von Andreas Reinhardt über die wichtigen Komponenten von RAC 11gR2.

Cluster           Verbund gleichartiger Ressourcen.
Die Clusterware ermöglicht das Zusammenspiel von Prozessen auf mehreren Knoten.
RAC (Real Application Cluster) verwendet mehrere Instanzen auf mehreren Knoten.
ASM arbeitet auf einem Storage Cluster mit mehreren Platten. 
 

Ausgewählte Prozesse der Oracle Clusterware:

 

OHASD          Oracle High Availability Services Daemon
Wird beim Systemstart über die Datei /etc/inittab bzw. als Windows Service gestartet. Er initiiert Agenten
(ohasd oraagent, ohasd orarootagent, cssdagent), welche wiederum die anderen Prozesse der Oracle Clusterware starten. Der OHASD liest dazu die Oracle Local Registry aus, in der die Abhängigkeiten der weiteren Prozesse festgelegt sind. Das beeinflusst deren Startreihenfolge.
Prozess: ohasd.bin (Linux), ohasd.exe bzw. OracleOHService (Windows)

CRS               Cluster Ready Services
Der CRS-Daemon ist der Hauptprozess der Clusterware zur Verwaltung von Cluster-Ressour­cen
(Status von Datenbank, Instanz, Listener, Services, VIP u.a.). Er speichert Ressourcen-Profile im
OCR und startet bzw. überwacht mit Hilfe weiterer Prozesse (crsd oraagent, crsd orarootagent) diese Ressourcen. Operationen: Start, Stop, Monitor, Failover.
Er erzeugt Events, z.B. Restart, wenn sich der Ressourcen-Status ändert.
Er steuert das Global Resource Management (Zugriff auf Oracle-Blöcke aus mehreren Instanzen).
Der Prozess crsd selbst wird im Feh­lerfall ebenfalls automatisch neu gestartet.
Er läuft unter der root-Kennung.
Prozess: crsd.bin (Linux), crsd.exe bzw. OracleOHService (Windows)

CSS                Cluster Synchronisation Services
Der OCSS-Daemon verwaltet die Node Membership Configuration (Zuordnung von Knoten zum Cluster und Instanzen zu Knoten) in der
Voting Disk und in der OCR. Er überwacht auch den Status des Private Interconnect sowie den Status der Instanzen, einschließlich der ASM-Instanz. Er benachrichtigt alle Knoten, wenn ein Knoten dem Cluster hinzugefügt oder aus dem Cluster herausgenommen wird.
Prozess: ocssd.bin (Linux), ocssd.exe bzw. OracleOHService (Windows)

EVM               Event Manager
Leitet Ereignis-Nachrichten weiter (z.B. Ausfall einer Ressource), die vom CRS erzeugt werden. Diese Weiterleitung kann erfolgen über den Oracle Enterprise Manager, über Skripte aus einem Callout Directory, über den
ONS oder über Advanced Queueing.
Prozesse: evmd.bin, evmlogger.bin (Linux), evmd.exe bzw. OracleOHService (Windows)

 

Dateien der Oracle Clusterware:

 

OCR               Oracle Cluster Registry
Ist Teil der
CRS und dient als deren Repository. Das ist eine Datei, die Konfigurationsdaten und Statusinfor­mationen zu Cluster, Knoten, Datenbank, Instanzen, Services und VIP enthält.
Wird z.B. durch folgende OCR-Client-Anwendungen verändert: OUI, SRVCTL, EM, DBCA, NETCA.
Das OCR-File muss auf einer Shared Disk liegen (
ASM, Raw Device oder OCFS).
Es kann maximal fünf OCR-Spiegelfiles geben.

Voting Disk   Datei, die von CSS beschrieben wird und Knotenüberwachungsinformationen enthält. Bei Aus­fall des gesamten Private Interconnect geht jeder Knoten davon aus, er sei der derzeit einzige Knoten im Cluster. Dadurch könnte es zu konkurrierenden Blockzugriffen kommen. Um das zu verhindern, versuchen alle Knoten, die Voting Disk für sich zu reservieren. Der Knoten mit der kleinsten Knoten-Nummer be­kommt dabei das Eigentümerrecht am Cluster und bleibt verfügbar. Alle anderen Knoten schalten sich automatisch ab. Sollte nur bei einem Knoten das Private Interconnect ausfallen, wird er von den verbleibenden Knoten zum Herunterfahren gezwungen. Somit bleibt immer der größere Subcluster verfügbar. Die Voting Disk muss auf einer Shared Disk liegen (ASM, Raw Device oder OCFS). Der Oracle Support erlaubt maximal fünfzehn Spiegelfiles der Voting Disk, wobei drei oder fünf Files empfohlen werden.


Komponenten des Global Resource Managements in den Datenbank-Instanzen :

 

GRD               Global Resource Directory
Das GRD ist die Zusammenfassung der Informationen zur Synchronisation aller Instanzen. Jede Instanz verwaltet einen Teil des GRD in der SGA. Somit erstreckt sich das GRD über alle Kno­ten. Diese Informationen werden von
GCS und GES verwaltet, die für jeden Oracle Block eine der Instanzen als Ressourcen-Master nominieren und den anderen Instanzen diesen Master bekannt machen. Das ermöglicht die Lokalisierung des aktuellen Block-Images im Cluster.

GCS               Global Cache Service
Ist Teil des
GRD. Gewährleistet die Konsistenz der Kopien eines Oracle Blocks auf allen In­stanzen
(= Cache-Coherence) mit Hilfe des Cache-Fusion-Algorithmus. Koordiniert den Zugriff auf die Blöcke und sichert die Synchronisation der Blöcke und das Schreiben des aktuellen Blocks auf Platte.

GES               Global Enqueue Service
Ist Teil des
GRD. Erfasst den Status aller clusterweiten Sperren (Global Enqueues). Arbeitet auch mit Sperren im Data Dictionary Cache und Library Cache. Erkennt Deadlocks.

 

Hintergrundprozesse der Datenbank-Instanzen:

 

LMSn             Lock Manager Process (bedient GCS)
Auch Global Cache Service Process genannt. Sendet Datenblöcke nach einem Cache Fusion Request über das Private Interconnect zur anfordernden Instanz und kontrolliert den zugehörigen Nachrichtenverkehr. Eine Instanz kann mehrere LMS dynamisch starten.

LMD               Lock Manager Daemon (bedient GES)
Auch Global Enqueue Service Daemon (GESD) genannt. Regelt clusterweite Sperren und den Zugriff auf Datenblöcke bei einem Cache Fusion Request. Dieser Daemon behandelt alle Remote Resource Requests, die von einer anderen Instanz initiiert werden. Dazu gehören Cache Fusion Requests sowie Requests für den Data Dictionary Cache und den Library Cache. Der LMD er­kennt zudem Deadlocks und überwacht Lock Conversions.

LMON            Lock Monitor (bedient GES)
Auch Global Enqueue Service Monitor (GESM) genannt. Rekonfiguriert Sperren beim Hinzu­fügen oder Entfernen einer Instanz. Prüft das Vorhandensein aller Instanzen und verteilt beim Instanz-Ausfall die Funktion des Masters eines Blockes auf eine verbleibende Instanz (Dynamic Resource Remastering).

LCK                Lock Process
Verarbeitet Lock-Requests, die sich nicht auf Cache Fusion beziehen, z.B. Requests für den Data Dictionary Cache und den Library Cache. Er pflegt eine Liste aller bestehenden Sperren.

DIAG              Diagnosability
Daemon

Sammelt Informationen zur Diagnose bei Fehlern der Oracle Prozesse in RAC-Umgebungen und schreibt Trace-Dateien.


Weitere Strukturen für die Hochverfügbarkeit

 

VIP                 Virtual IP
Eine virtuelle IP-Adresse ist eine logische Adresse im Cluster. Sie wird in der /etc/hosts eingetragen bzw. vom DNS aufgelöst und von
CRS für ein automatisches Failover verwendet. Das heißt, dass bei Ausfall eines Knotens die VIP einem anderen Knoten zugeordnet wird. Dort empfängt die VIP zwar TCP-Aufrufe, kann aber keine Oracle-Verbindungen mehr herstellen. Deshalb sendet sie dem Client sofort eine Fehlermeldung. Der Client wird dann beim Reconnect an eine andere Listener-Adresse geleitet. Vorteil: Der Client muss nicht auf einen TCP-Timeout warten.

ASM               Automatic Storage Management
Speichermethode für Dateien auf ASM-Diskgroups mit Striping und Mirroring (ähnlich RAID 0/1). Ersetzt Logical Volume Manager und Cluster File System. Kann an Stelle von Raw Devices oder
OCFS verwendet werden. Die Voting Disk und das OCR-File und kön­nen seit Oracle 11.2 auf ASM- Diskgroups gespeichert werden. Die Voting Disk und das ASM-SPFILE werden dabei an einer definierten Stelle in einer ASM-Diskgroup gespeichert. Das OCR-File wird erst beim Start des CRSD benötigt,
zu einem Zeitpunkt, an dem die ASM-Instanz bereits läuft.

ACFS             ASM Cluster File System
Im ASM können nur Binärdateien gespeichert werden. Um den Vorteil des Striping und Mirroring für alle Dateien verfügbar zu machen, wird auf einer ASM-Diskgroup ein Filesystem erzeugt, dass mit Kommandos des Betriebssystems ansprechbar ist. Grundlage des ACFS ist eine ASM-Datei vom Typ ADVM (ASM Dynamic Volume Manager). Diese ADVM-Datei simuliert ein Volume, auf dem ein Filesystem vom Typ ACFS erzeugt werden kann. Das ACFS wird dann mit dem Kommando mount bzw. über die Datei /etc/fstab an einen Mountpoint gehängt.

OCFS             Oracle Cluster File System
Älteres Cluster File System für Linux und Windows. Filesystem, auf das ebenfalls von mehreren Knoten konkur­rierend zugegriffen werden kann. Es kann mit Kommandos des Betriebssystems bearbeitet werden. Regelung des Zugriffs mit Sperren und Logs. Auf dem OCFS können auch die Voting Disk und das OCR-File gespeichert werden.

FAN                Fast Application Notification
Mit FAN werden Ereignis-Nachrichten sofort weitergereicht, nicht erst nach Auftreten von Verbin­dungs-Timeouts oder nach Polling-Aufrufen. Unterstützt werden Ereignisse für Services, Daten­bank, Instanz, ASM und Knoten.
FAN filtert Cluster-Ereignisse und gibt diese weiter an:
- Server-Komponenten wie SMTP-Mail, SNMP-Agent (über Server Callout Scripts)
- Remote-Komponenten (über Proxy-Anwendungen)
- Anwendungen (über
ONS)
- Enterprise Manager

ONS               Oracle Notification Services
Ist Teil der
CRS. Übermittelt Events des FAN an C- und Java-Anwendungen. Wird Server-seitig und Client-seitig (bzw. auf dem Middle-Tier-Application-Server) konfiguriert.
Prozess: ons (Linux), ons.exe (Windows)

TAF                Transparent Application Failover
Bei Ausfall einer Instanz werden die Benutzer automatisch über eine neue Session mit einer noch aktiven Instanz ver­bunden. Wenn eine Anwendung auf den Ausfall mit einem Reconnect reagiert, kann sie fortge­setzt werden. Notwendig dafür ist neben der als "cluster aware" entwickelten Anwendung eine Konfiguration der Net Services für ein Client Failover.

GSD               Global Services Daemon
Prozess, der die Interaktion des CRS von Oracle10g/11g mit Tools von Oracle9i (Oracle Enterprise Manager und SRVCTL) koordiniert, wenn diese administrative Aufgaben aus­führen, z.B. startup oder shutdown.