OVH は、2017 年 12 月 6 日水曜日、またも波乱に満ちた夜を経験しました。2017 年 11 月 9 日に発生した大規模な障害の後、インフラストラクチャを改善するために、ホストはメンテナンス作業を実行する必要がありましたが、ソフトウェアのバグにより開始することさえできませんでした。多くのサイトがオフラインになり、高い遅延が発生します。
OVH では、2017 年 12 月 6 日水曜日の夕方に新たな障害が発生し、多くのサイトで異常な遅延が発生しました。最中のようにOVH の大規模な障害により、数百万のサイトがオフラインになった、そのCEOであるOctave KlabaがTwitterで状況の推移を私たちに知らせ続けました。しかし、特定の顧客のうんざりはますます顕著になっています。
オクターブ・クラバによれば、この事件は1か月前に発生した事件よりもはるかに深刻ではなく、事件と密接に関連しているという。 「11 月 9 日、ルーベの光ネットワークで大きな問題が発生しました。この問題は、構成が消去される原因となった、使用している機器のソフトウェアのバグに関連していました。」とOVHの上司は説明します。 「それ以来、ネットワーク全体で機器を更新してきました。また、この種のバグが再び問題を引き起こすことを防ぐために、Roubaix サイトでクラスターを 3 つに分割することにしました。バグが発生した場合、その構成はトラフィックの 30% にのみ影響します。」彼は指定します。さらに、11月9日のこの内訳は多大な費用がかかるだろう。OVH、ホストは顧客に数百万ユーロを払い戻さなければならない。
ただし、このステップは計画どおりに進みませんでした。メンテナンスは午後 11 時に開始される予定でしたが、OVH チームはその準備中に、午後 8 時 20 分に設定が再び消えたことに気づきました。すべてのリンクが再びダウンしました”。最新のソフトウェア バージョンではデータベースの削除を引き起こすもう 1 つのバグ。影響を受けたサイトのほとんどは長期間オフラインにならなかったが、一部のサイトは高いレイテンシが観察された。渋滞は、交通がパリ~ルーベに直接向かうのではなく、パリ~グラヴリーヌ~アムステルダム~ルーベを経由してしばらく移動したという事実によって説明できます。
アップです。ソフトウェアの最新バージョンを使用しているにもかかわらず構成が消えてしまう理由を理解するために、今夜のメンテナンスを凍結します。申し訳ありません。
— オクターブ・クラバ (@olesovhcom)2017 年 12 月 6 日