米グーグル(Google)の電子メールサービス「Gmail」に障害が発生し、大多数のユーザーが一時アクセスできなくなった。
グーグルの各種ウェブサービスの稼働状況を提供する「App Status Dashboard」は日本時間2日午前4時53分、Gmailの「大多数のユーザー」が障害の影響を受けており、影響を受けた人はGmailを利用できなくなっていると報告した。同サイトはそれから1時間半以上経った同日午前6時37分にGmailが復旧したと伝えた。
グーグルでは5月にも大規模な障害が発生している。このときは数百万人のユーザーが検索エンジンやGmail、ニュースサービス「Google News」などを利用できなくなった。2月にもGmailに障害が発生し、数百万人が数時間にわたりアクセスできない状態となった。
完璧なシステムなどありえない?!
昨日、Mixi関連でGmailを使っていて、いままで目立った不具合などなかったなどと書いた翌日にこの事故でした。Googleの前の障害のときには、実際にその現象を見ることができましたが、今回は日本では夜中ということもあり、見ることはできず、ニュースで初めて知りました。
米Googleは、9月1日にGmailで起きたサービス障害の原因について、ルータの過負荷によるものだったことを明らかにしました。
障害の発端となったのは、同日朝に定期アップグレードのため、Gmailの一部サーバをオフラインにしたことにあると同社は説明している。これら サーバがオフラインになっている間、GmailのWebインタフェースはほかのサーバにトラフィックを送ります。このときに、リクエストルータ(トラフィック を適切なGmailサーバに転送するサーバ)の幾つかが過負荷状態になりました。Googleが最近リクエストルータに変更を加えた際に、「負荷を少し過小評 価していた」ためだといいます。
過負荷状態のリクエストルータからほかのルータにトラフィックが転送され、さらに過負荷状態のルータが増え、数分のうちにすべてのリクエストルー タが過負荷になりました。この結果、Gmailサーバにリクエストが転送されず、ユーザーがGmailにアクセスできなくなりました。ただし、IMAP/POPア クセスの場合は違うルータを使っているため、通常通りに動いていました。
Googleのエンジニアリングチームはキャパシティ不足が問題であると気づき、リクエストルータを追加してサービスを復旧させたといいます。
今回も、結局は人為的なミスであったことがわかっています。人間まで含めたシステムということになると、やはり、完璧とはいかないといことです。ユーザーもそのことは、認識して、普段から複数のメール・アドレスを使うなどの対処をしておくべきだと思います。どのようなシステムでも、そのシステムが使えなくなった場合の対処方法など考えておくべきです。私は、現在会社で使っているシステムを最初に導入しましたが、その当時でも、店数が50以上あって、システム導入した次の年には100を超えてしまいしまた。理論的に、ネットワークがつながることと、本当につながることとはまったく別問題であるということを身をもって知ることができました。やはり、業務上で完璧に使うといことと、理論上の話はまったく異なるということです。
年金問題なども、いろいろな不手際が明らかになっていますが、私は、一番問題なのは、日本の場合は、年金の処理事務に人為的ミスはないことを前提として運用していることです。アメリカの場合は、いくつかの年金基金が事務処理を行っていますが、事務処理には誤りがありえるという考えで運用しています。だから、誤りがあった場合の対処法をあらかじめ定めてあるので混乱は生じていません。
実際にアメリカでは年に3万件ほどの誤りがあるそうです。それに、これは当たり前のことだと思います。人間が行うことですから、事務処理自体にも間違いはあるだろうし、受給者などの記憶違いなどもあるし、それに、犯罪、自然災害などもあるでしょうから、記録が消えたり、誤ることなどいくらでもありえるはずです。
まったくお粗末なことですね。日本は先端技術など進んでいるところがありますが、変なところで遅れているところがあります。たとえば、戦争中に日本が爆撃を行うには、作戦に本当に必要な爆撃機しか用意しなかったそうです。ところが、アメリカでは、爆撃機が爆撃に向かう途中に、撃墜されたり、故障を起こしたりする数や、現地で爆弾を落とす前に撃墜されることをあらかじめ勘定に入れて爆撃機の編隊を組んだそうです。中には、物量に圧倒的な差があったから仕方ないという人もいるようですが、日本の場合は、初戦で勝っていたときでも、爆撃に必要な機数しか用意していませんでした。
この体質いまでも、引き継いでいるのだと思います。Gmailのようなサービス、Googleは比較的短時間で、復旧したそうですか、日本の場合はどうなのでしょうか?かなり不安です。最近では、気象庁のシステム障害があり、実際には地震被害がないはずの地域に、警報が発信されてしまったという例があります。今回は、あまり問題はなかったと思いますが、もし、地震がおこるはずのところに、警報がいかないということにでもなれば由々しきことです。
やはり、どんな人にも間違いが起こらないように最初からシステムを設計すること、いわゆるフールプルーフやフールセーフを盛り込むこと。システム障害などが発生した場合の、代替案、障害が発生した際の処置方法などのアーカイブなどをつくったり、FAQをつくったりして必要な人にはすぐに閲覧できるようにしておくなどの配慮が必要不可欠です。さらに、最後の駄目押しで、アーカイブやFAQは少なくとも1年に一回くらいは更新し続けるべきです。
【関連記事】
グーグルが選挙情報サービス 候補者が動画で質問に回答―やっと選挙にも新たなツールがでてきたか?
動画:Google Wave発表、リアルタイム・コラボレーションの基盤へ―Google Waveはリアルタイムのやりとりを革新し社会を変革するか!?!
ADs by yutakarlsn
以下のバナーをクリックしていただくと、楽天デリバリーに飛びます!
ピザテンフォー一昨年の楽天デリバリーの「ファミリーへのおすすめ」部門で、堂々の2位となりました。ますます、便利になったテンフォーを是非ご利用ください。
YUTAKARLSON、USA 市長からのお願い