同時に起きた二つのシステム障害

時事

7月19日に、Windows関連のシステムで、世界的なシステム障害が発生し、いくつもの企業のサービスが停止する事態にまで発展しました。

この事件は、一般の報道を見ていても良く分からない部分も多く、報道機関自身も事態を正確に理解していないものと思われます。

そこで、ここで今回のシステム障害について、簡単に解説しておきたいと思います。

システム障害は二つ同時に起きていた

報道を見ているとWindowsの障害で、世界中の空港やテレビ局その他のシステムの停止を引き起こしているように見えますが、実際には19日に偶然二つのシステム障害が発生していたのです。

一つは、セキュリティ企業 CrowdStrike の Falcon Sensor の更新プログラムに不具合による、デスクトップ Windows がダウンして、ブルースクリーンを表示する事態になったシステム障害。

もう一つは、Microsoft社のクラウドサービスの Azure と Microsoft365&OneDrive のシステム障害によりクラウドコンピュータが使用できなくなるシステム障害です。

二つのシステム障害は、既に解消しています。

CrowdStrikeの障害

CrowdStrikeとは

CrowdStrikeは、クラウドベースのエンドポイントセキュリティプラットフォームを提供するサイバーセキュリティ企業です。主な製品と特徴は以下の通りです:

  1. Falcon Platform: 主力製品で、次世代のアンチウイルス、エンドポイント検知・対応(EDR)、脅威ハンティングなどの機能を統合しています。
  2. AI/機械学習の活用: 高度な脅威検知のために人工知能と機械学習技術を使用しています。
  3. クラウドネイティブ: クラウドベースのアーキテクチャにより、迅速な展開と更新が可能です。
  4. リアルタイム保護: 継続的な監視と即時対応を提供します。
  5. 脅威インテリジェンス: グローバルな脅威情報ネットワークを活用しています。

普及率に関しては、具体的な数字を正確に把握することは難しいですが、以下のような傾向があります:

世界での普及:

  • Fortune 100企業の約65%が利用していると報告されています(2022年時点)。
  • 北米市場でのシェアが特に高く、企業向けEDR市場でトップクラスの地位を占めています。

日本での普及:

  • 日本市場でも成長を続けていますが、欧米ほどの普及率には至っていません。
  • 大手企業や金融機関を中心に採用が進んでいます。
  • 日本市場特有のニーズに対応するため、ローカライズや日本語サポートの強化を進めています。

障害の内容

今回、問題を起こしたのは、CrowdStrike の Falcon Sensor の定期的に配信するセキュリティ更新プログラムに不適切なファイルを配信したことにより、Windows10と11のシステムデバイスドライバがダウンしたことにより、Windows10と11がダウンしブルースクリーンを表示して機能停止したというシステム障害です。

このセキュリティ更新プログラムは、単体テストをしていれば確実に不具合を発見できた性質のもので、完全に CrowdStrike社の初歩的な過失によるものです。
作業プロセス自体に問題がある可能性が濃厚で、CrowdStrike社の管理不行き届きの責任が問われるでしょう。

Microsoft Azureの障害

Microsoft社のクラウドコンピュータである Azure がシステム障害で停止しました。
これにより、内部で Azure を利用している Microsoft365(旧Office365) と、クラウドストレージの OneDrive がアクセス不能になり使用できなくなりました。

原因は、Microsoft社発表によると Azure のバックエンドワークロードの一部で構成変更を行った際のミスで、ストレージとコンピューティングリソース間の通信が中断され、影響を受けたサービスに接続障害が発生したとのことです。

二つのシステム障害は、それぞれ関係が無い

報道を聞いていると、「CrowdStrike の障害の影響を受けて、Microsoftのシステム障害が起きた」ように見えますが、実際は、CrowdStrike のシステム障害と、Microsoftのシステム障害は、全く異なるシステム障害です。

Microsoftクラウドのシステムは CrowdStrike のセキュリティソフトを使用していません。

二つのシステム障害が、偶然同時に起こっただけで、互いに全く関係無いのです。

二つのシステム障害は既に解決している

CrowdStrike の Falcon Sensor のセキュリティ更新プログラムは、既に正しいものに更新されており、少なくとも CrowdStrike社側は必要な対処を終えています。 ただ、 Falcon Sensor を使用している企業のシステムは、デスクトップWindowsにダウンロードされた間違ったセキュリティ更新プログラムを削除して、OSを再起動しなければならないのと、システムダウンによって生じたシステムと業務のフローの正常化に追われるので、復旧に時間がかかります。

Microsoft の Azure の障害は、19日の夕方の時点で復旧しており、既に正常に稼働しています。

こちらはサーバー側の障害なので、クライアント側のデスクトップWindowsに復旧作業は特に必要ありません。

マクドナルドのシステム障害は無関係

何の偶然か分かりませんが、同時期にマクドナルドでもレジが作動しない業務システム障害が発生していますが、これは純粋にマクドナルド内部のシステム障害であり、CrowdStrike社のシステム障害とも、Microsoft社のシステム障害とも、関係ありません。

 

以上、報道が混乱しているようなので、解説してみました。

タイトルとURLをコピーしました