ハイ アベイラビリティ システムとスイッチオーバーおよびスイッチバック手順の説明
ハイ アベイラビリティ シナリオには、レプリケーション シナリオのすべての機能およびワークフローが組み込まれていますが、新しい重要な 3 つの要素がさらに追加されています。これは、実行前検証、マスタとマスタ上で実行しているアプリケーションのモニタリング、およびスイッチオーバー プロセス自体です。
- 実行前検証
- スイッチオーバー中には、失敗する可能性のあるものが多く存在します。権限やアプリケーションの設定、または HA シナリオ自体の設定にも問題がある可能性があります。このため、HA シナリオの作成時および開始時に、Arcserve RHA は広範なチェック リストを実行します。このチェックは、スイッチオーバー中に問題を引き起こすことがわかっている一般的な問題が発見されるかどうかを判断するように作られています。そのような問題が実行前検証で発見されると、エラーと警告が表示され、HA シナリオの実行前にそれらの問題を解決するよう求められます。
- マスタとマスタ上で実行しているアプリケーションの自動モニタリング
- シナリオが開始されるとすぐに、レプリカは定期的(デフォルトでは 30 秒ごと)にマスタをチェックします。モニタリング チェックには 3 種類あります。マスタがアクセス可能で実行中であることを確認するためにマスタに送信される ping リクエスト、適切なサービスが実行中でデータが良好な状態にあることを確認するデータベース チェック、特定のアプリケーションをモニタするために調整可能なユーザ定義チェックです。
- これらのいずれかでエラーが発生すると、チェック全体が失敗と見なされます。設定したタイムアウト時間(デフォルトでは 5 分)ですべてのチェックが失敗した場合、マスタ サーバは停止しているとみなされます。これにより、HA シナリオの設定によって、Arcserve RHA がアラートを送信するか、または自動的にスイッチオーバーを開始します。
- スイッチオーバーとスイッチバックのワークフロー
- 初期の HA シナリオでは、マスタはアクティブ コンピュータ、レプリカはスタンバイ コンピュータになります。スタンバイ コンピュータはアクティブ コンピュータの状態を継続的にチェックして、それが稼動いているかどうかを判断し、アクティブ コンピュータの役割を引き継ぐかどうかを決定します。
- スイッチオーバーは自動的に、または手動で実行できます。初めてスイッチオーバーが発生すると、スタンバイ状態であったレプリカがアクティブ コンピュータとなり、マスタがスタンバイ モードになります(引き続き稼動可能であると仮定した場合)。マスタ(現在は「スタンバイ」)の準備が完了すると、スイッチバック プロセスを、自動または手動で開始することができます。スイッチバックの後、マスタは再びアクティブになり、レプリカは前のスタンバイおよびモニタリングの役割に戻ります。
- 注: 接続が失われた後、再接続の試行中に、ノード(マスタまたはレプリカのいずれか)が自らの役割の決定を試みます。両方のノードが自らをマスタとして確立する場合、再接続の際に、最新のアクティブ マスタが引き続きマスタとして機能し、古い方のマスタはスタンバイ レプリカとなります。
重要:スイッチオーバーの実行後、スタンバイ サーバ上の「サーバ」サービス(ファイルのサポート、印刷、名前付きパイプ共有などに使用)は、スイッチオーバーの発生から 10 分間はアクセスできなくなります。ws_rep.cfg ファイルで、オプション HASharesAccessTimeout を参照してください。