Facebook、6時間にわたる障害の原因は「誤った設定変更」と発表

Facebook、6時間にわたる障害の原因は「誤った設定変更」と発表

マイキー・キャンベルのプロフィール写真マイキー・キャンベル

· 1分で読めます

フェイスブックは月曜日遅く、同社の主力ソーシャルネットワークと関連サービスに影響を与えた6時間の障害について謝罪し、この障害は「誤った設定変更」によるものだと主張した。

Facebookと関連サービス(Instagram、WhatsApp、Messenger、Oculus VRなど)は、東部標準時午前11時30分頃にオフラインとなり、約6時間アクセス不能状態が続きました。その後の報道では、ボーダーゲートウェイプロトコル(BGP)のアップデートの不具合が障害の原因であると示唆されており、Facebookの新たな声明はこの説を裏付けているようです。

Facebookのエンジニアリングおよびインフラストラクチャ担当副社長サントシュ・ジャナダン氏はブログ投稿で「不便」をもたらしたことを謝罪し、ルーター構成の変更によりデータセンター間の通信が中断されたと説明した。

「当社のエンジニアリングチームは、データセンター間のネットワークトラフィックを調整するバックボーンルーターの設定変更が、この通信を中断させる問題を引き起こしたことを突き止めました」とジャナルダン氏は述べた。「このネットワークトラフィックの中断は、データセンター間の通信に連鎖的な影響を及ぼし、サービスを停止させました。」

この説明は、Cloudflareが同日早朝に提供した情報と一致しています。同社は、問題の原因をトラフィックルーティングに影響を与えたBGPの不具合にまで遡らせました。当時、ダウンタイムの原因は単純なDNS設定エラーではないかと推測する声もありましたが、一部のDNSサービスが機能しているものの応答がないことが判明したため、この説明は放棄されました。

ジャナルダン氏はまた、Facebookの社内ツールが障害の影響を受け、問題の診断と解決が困難になっているという報道を認めた。ニューヨーク・タイムズ紙によると、セキュリティエンジニアはデジタルバッジが使用不能になったため、影響を受けたサーバーに物理的にアクセスできなかったという。

Facebook は、システムがハッキングされたという噂を恐れたのか、ブログ記事で、この障害は「誤った設定変更」によって発生したと改めて述べ、このダウンタイムの結果としてユーザーデータが侵害されたことはないと指摘している。