[HPE] IRFを構成しているSWが故障したときの復旧手順

HPでIRFを構成しているSWが故障したときの復旧手順になります。

 ◆交換用の筐体を設置

CiscoなどのSWが故障したときは通常では交換用の筐体にConfigを流し込んだり、
交換用の筐体を現地に持っていって現地にあるコンパクトフラッシュを
流用するなどの方法があると思います。

HPのIRFの場合複数で構成されている筐体が故障した場合でも、
現地で稼動しているIRFに組み込む形で復旧対応を行うことができます。

今回はその流れについてご説明させて頂きます。

◆IRFの構成情報

現在はIRFスイッチとして稼動しているlogical-swは
physical-sw1とphysical-sw2の2台で構成されています。
Priority値が大きいphysical-sw1がMasterになっています。

◆Master側のphysical-sw1が故障

Master側のphysical-sw1が故障しました。
現在はphysical-sw2がMasterとなり1台でIRFが形成されている状態です。
1台の構成になってもIRFが解除される訳ではありません。

◆交換用の筐体を準備する

故障したphysical-sw1と同じ状態のものを作成します。
[physical-sw1の構成情報]
(1)Member IDは1
(2)Priorityは5
(3)IRFを構成したときのdescriptionがphysical-sw1となる様にする
(4)IRFポートはFortygiga1/0/49を使用

■(1)Member IDの設定
デフォルトではMember IDは1なので特に変更は必要ありません。
Member IDを他のものに変更する必要がある場合は下記の手順を実施する必要があります。
※ここではMember IDが2に設定されているものを1に変更する手順になります。
<HP>system-view
[HP]irf member 2 renumber 1
Renumbering the member ID may result in configuration change or loss. Continue?[Y/N]y
[HP]save
The current configuration will be written to the device. Are you sure? [Y/N]:y
Please input the file name(*.cfg)[flash:/startup.cfg]
(To leave the existing filename unchanged, press the enter key):
flash:/startup.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait…
Saved the current configuration to mainboard device successfully.
[HP]quit
<HP>reboot
Member IDを変更したら再起動をする必要があります。
[HP]はsystem-viewモードに移行していることを意味します。

■(2)Priorityの設定
[HP]irf member 1 priority 5
コマンドを見るとMember IDとPriorityを同時に設定できそうに見えます。
このコマンドはMember IDが既に1になっている装置のPriorityを5にする設定になります。

■(3)IRFのdescription設定
[HP]irf member 1 description physical-sw1
IRFを構成しているホスト名はlogical-swとしています。
このコマンドにより構成している物理ノードをdescriptionとして分かるようにできます。

■(4)IRFポートの設定
[HP]interface FortyGigE 1/0/49
[HP-FortyGigE1/0/49]shutdown
[HP-FortyGigE1/0/49]quit
[HP]irf-port 1/1
[HP-irf-port1/1]port group interface FortyGigE 1/0/49
You must perform the following tasks for a successful IRF setup:
Save the configuration after completing IRF configuration.
Execute the “irf-port-configuration active” command to activate the IRF ports.
[HP]interface FortyGigE 1/0/49
[HP-FortyGigE1/0/49]undo shutdown
[HP-FortyGigE1/0/49]quit
[HP]irf-port-configuration active
[HP]save
The current configuration will be written to the device. Are you sure? [Y/N]:y
Please input the file name(*.cfg)[flash:/startup.cfg]
(To leave the existing filename unchanged, press the enter key):
flash:/startup.cfg exists, overwrite? [Y/N]:y
Validating file. Please wait…
Saved the current configuration to mainboard device successfully
基本的な流れは下記の通りです。
・IRFポートとして設定するI/Fをshutdownする
・IRFポートとして設定するI/Fを割り当てる
・IRFポートとして設定したI/Fをundo shutdownする
・system-viewモードでirf-port-configuration activeコマンドを実行する
・コンフィグを保存する


◆display irfコマンドで確認

<HP> display irf
MemberID    Role    Priority  CPU-Mac         Description
 *+1        Master  5          00e0-fc0f-1234  physical-sw1
--------------------------------------------------
 * indicates the device is the master.
 + indicates the device through which the user logs in.

 The bridge MAC of the IRF is: bcea-fa10-1234
 Auto upgrade                : yes
 Mac persistent              : 6 min
 Domain ID                   : 0
 IRF mode                    : normal

ここまでできれば交換用の筐体の準備は完了です。

◆現地作業の順番に注意

次に説明するケーブルの接続や電源を投入する順番に気をつけてください。
※場合によってはミスオペレーションになってしまうことがあります。

◆交換用の筐体を設置

まずは電源ケーブルを繋がずにラックに設置します。
※普通はいきなり電源を入れないと思いますが、ここはとても重要です。

◆IRFポートにケーブルを接続する

physical-sw1とphysical-sw2のIRFポート間をケーブルで接続します。
ケーブルを接続する前に交換したphysical-sw1の電源が入っていないことが重要です。

◆交換したphysical-sw1の電源を投入する

既にIRFポート間が繋がっていることを確認したら、
交換したphysical-sw1の電源を入れます。

◆故障対応完了

交換したphysical-sw1がIRFに組み込まれ、再度2台構成に戻りました。
現在Masterで稼動しているのはphysical-sw2です。
Priority値が大きいphysical-sw1はStandbyとして稼動します。

電源を投入する前に必ずIRFポート間をケーブルで繋いでおく理由

故障後にIRFはphysical-sw2のみの1台として稼動している状態です。

先にIRFポート間を繋いでからphysical-sw1の電源を入れると、
起動時に既にphysical-sw2がMasterとなっていることを理解するので、
physical-sw1は自分をStandbyとします。

しかしIRFポート間を繋いでいない状態でphysical-sw1を起動すると、
physical-sw1は自分自身しかいないことから自分をMasterとします。

その後にphysical-sw1とphysical-sw2を繋いでしまうと、
お互いのPriorityを比べて値が大きい方をMasterにしてしまいます。

IRFはMasterが持っているコンフィグをStandbyにコピーします。

先程交換した筐体には稼動しているIRFに組み込むだけの最低限の設定しか入っていません。

その結果現地で稼動していたphysical-sw2のコンフィグは消えてしまいます。

故障したSWが元々StandbyでPriorityの値が小さい方であった場合は、
先に電源を入れてから繋いだとしても現地で稼動しているSWの方が
Priority値が大きいためコンフィグが消えることはありません。

但し作業方法を統一化するために必ず先にIRFポート間を繋ぐようにしましょう。

※この部分は少し概念が難しいので別途説明しようと思います。

補足記事を書きました。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする