2018.11.09

クラウド時代の玉突き事故

最近、電車がよく遅延します。

理由は、様々な私鉄が相互乗り入れをするようになった結果、例えば埼玉で副都心線の非常停止ボタンが押されると、横浜の東急東横線が止まる、みたいな。

相互に連結して、便利になった結果、どこか1カ所でもトラブルが起きると、全部が停止する、という感じです。

これが、インターネットサービスでも起きています。

ライナフが使っている、SORACOMというSIMのサービスは、クラウドサーバーをはじめとして、複数のクラウドサービスを使うことで成り立っています。
他にも、ライナフが使っているクラウドサービス(API)は、どれも複数のクラウドサービスの上に出来上がっており、そのうち1つでも止まると、全体が止まってしまいます。

ライナフのサービスが上流になるケースも出てきていて、うちのサービスが止まると下流で構成されているサービスを止めてしまいます。

まるで玉突き事故ですね。

各社共に、サービスを止めないようにすごく気を付けているのですが、それでも、自分たちの原因ではなく他のサービスで事故が起きると、もらい事故というか、障害が起きてしまいます。

万が一、アマゾンがやっているクラウドサーバーのAWSや、マイクロソフトがやっているAZUREが止まった日には、世界が終わるんじゃないかと心配になるレベルです・・・・。

世の中を回すインフラ企業であるという自覚を持って、サービスを止めないように気を付けます。