最近では社内サーバーで使っていた機能(オンプレミス)もクラウドサービスへ移行することが多くなってきました。
これに伴い、システムに異常が発生した場合、一体どこで異常が発生しているのか検知することが難しくなっています。
異常を疑う要素としては、以下のようなものがあります。
- システム不具合による障害(異常データや想定外の処理などにシステムが対応できていないケース)
- 社内ネットワーク(VPN)に障害発生
- クラウドサーバーに障害発生(例:AWS, IBMクラウドなど)
障害が発生した時は、1つずつ異常を確認し問題が発生している箇所を特定する必要があります。
今回はAWS(AmazonWebService)に障害が発生していないかリアルタイムに確認する方法をご紹介します。
AWS(AmazonWebService)に障害が発生していないかリアルタイムに確認する方法
AWS(アマゾンウェブサービス)はこれまでにも忘れた頃に障害が発生し、AWSを利用しているシステムを停止させる事態となっています。
頻繁に発生することではありませんが全くない訳でもないので、まずはここを疑ってみましょう。
Service Health Dashboard
まずは一般の方(サーバー管理者以外)でも確認できる方法として、Service Health Dashboardを確認する方法があります。
※初期画面は英語で表示されるので日本語に翻訳した方が見やすいです。
お使いのサービスのリージョンタブを開きます。
通常アジア太平洋地域(Asia Pacific)タブを選択します。
お使いのリージョンの各サービスが正常に稼働しているのか確認します。
パーソナルヘルスダッシュボードを確認する
こちらはサーバー管理者(AWSのダッシュボードにアクセスできる利用者)のみが閲覧できる画面です。
上記の【Service Health Dashboard】画面から『パーソナルヘルスダッシュボードを確認する』ボタンをタップすると、AWSアカウントのログインを促されます。
ログインを完了すると、契約しているアカウントのリージョンごとの状況が確認できます。
サービス状態や予定されているイベントなど、問題がないか確認します。
アマゾン公式アカウントの通知
Twitterには、アマゾン ウェブ サービス ジャパン株式会社の公式アカウントがあります。
アカウントのプロフィールには以下ように、「最新情報、役立つ情報などをつぶやきます」とありますが、障害情報はつぶやいてくれません。
AWSは、世界で最も包括的で広く採用されているクラウドプラットフォームです。
最新情報、役立つ情報などをつぶやきます。
という訳で、非公式ではありますが、AWSのステータスの変化を検知してつぶやいてくれるAWS障害情報をフォローしておくこともおすすめします。
スポンサーリンク
外部サービスを利用する
DownDetectorという外部サービスがあります。
こちらは様々な情報を元にクラウドサーバーの異常を検知し各システムの障害発生状況を可視化してくれるサービスです。
AWSサービスの稼働状況はこちら>>
2021年2月20日は東京リージョンで大規模な障害が発生しましたが、この時のDownDetectorの画面がこちらです。
異常検知の数がMAX時1800に上っていることが分かります。
2021年2月22日現在の画面がこちら↓↓
「AWSに問題があるかもしれません」と表示されていますが、その報告件数はMAX25件程度。
前回の大規模障害の際の報告件数とは桁違いですね。
Downdetectorは、様々なデータソースから情報を収集しておりTwitterなどの障害情報も取得しています。
リアルタイムに障害の発生状況を確認するのにTwitterは非常に有効です。
ひとりの利用者からの問題報告では、それがサーバーの障害に起因するものと特定することはできません。
今回は上記の25という数値が「問題の影響範囲が大勢の人々に及んでいる」と判断され、「AWSに問題があるかもしれません」と表示されているものと思われます。
ちなみに赤字の「AmazonWebServiceに問題が発生している」ボタンは障害が発生しているときに自己申告でクリックするためのものです。
まとめ
今日はAWS(AmazonWebService)に障害が発生していないかリアルタイムに確認する方法をご紹介しました。
まずは『Service Health Dashboard』でAWSの各種サービスの稼働状況を確認し、『Downdetector』で同様の障害報告のボリュームを確認するという方法が良いかと思います。
その他の要因で障害が発生している可能性もありますが、まずは落ち着いて一つずつ問題の個所を特定して対策を行いましょう!