そのSLAには9がいくつ並んでいますか?

SLA周りの誤解についての面白いブログ記事をみつけたので、
筆者了解の上簡単に翻訳してこちらで紹介します。

抄訳では記事の面白さが伝わらないと思うので全訳しました(多少意訳はしています。
ご容赦ください)。記事内のリンク先はそのままにしていますが、
該当するページ内容に日本語のものがあればそちらをリンクしています。

原文はこちら Coding Out Loud  8月11日の投稿。

http://blog.codingoutloud.com/2011/08/11/quick-how-many-9s-are-in-your-sla/

by Bill Wilder : Windows Azure MVP の人です。

以下、本文の翻訳です。

 

~ そのSLAには9がいくつ並んでいますか? ~

最近私はある企業のCEOが講師の一人であったイベントに参加しました。その企業はAmazon cloud servicesを使っていて、最も重要な部分でAmazonS3として知られているSimple Storage Serviceを使っていました。

S3サービスは「あっち側」(クラウド)で稼働し、アプリケーションやデータファイルの管理のためのスケーラブルなレポジトリを提供しています。このサービスはどんなサイズのファイルも、そしてどれだけの容量のファイルも引き受けます。だから、あっち側に置きたいものを好きなだけ持っていけます ―― そして、これは従量課金のサービスなので、使った分だけ払えばよいのです。S3はかなり知られているサービスになっています。Wikipediaによれば、よく知られている顧客事例としてSmugMug社があります:

SmugMugの写真預かりサービスは2006年4月からS3を利用している。初期にはサービス停止やスピードの低下なども少なくなかったが、1年経過後には「社内保有しているストレージよりもかなり信頼性が高い」とコメントし、ストレージ費用を100万ドル近く節約できたと言っている。

いいですね。

もちろん、Amazonだけがこのようなサービスを提供するクラウドベンダーではありません。GoogleはGoogle Storageを提供しているし、マイクロソフトはWindows Azure Blob Storageを提供していて、どちらも機能や性能はS3のそれと非常に似通っています。Amazonが最初に市場に参入していますが、3つのサービスどれもが現在では成熟したものになっており、3社ともインターネット規模のシステムと、大容量のデータストレージプラットフォームを構築することにあたってはエキスパートです。

上述の私が出席した講演で、S3についての話が出てきました。講演者は ―― Amazonのサービスで統一した環境を使っている企業から来ている人でしたが ―― S3の信じられないほど強固なサービスレベルアグリーメント(SLA: Service Level Agreement)についてとても褒めていました。彼は、このことが彼の会社の競争優位性となるだけでなく、「Amazonの他のクラウドベンダーに対する競争優位性」でもあると言っていました。

ちょっとここで立ち止まって考えてみましょう。―― 知っていますか? ―― S3のSLAはどうなっていましたっけ?Google Storageは?Windows Azure Blob Storageは?

回答を紹介する前に確認しておきます。サービスレベルアグリーメント(SLA) とは、サービスプロバイダー(このケースではAmazon、Google、マイクロソフト)によって提供される書面によるポリシーです。そこには提供されるサービスのレベルがどれだけで、どのように数値化され、そこに達しない時にどうなるか、などが記載されています。

通常、「サービスレベル」の部分は稼働時間について書かれていて、99.9%(“three nines:“9”が3桁)というように“9”の数で定義されます。一般的に、9の数が多いほど良いことになります。―― Wikipediaに9の数とダウンタイム/停止時間の対比表があります(より一般的には、SLAには他の項目もあります。たとえば、規定レベルに達しない時の顧客への返金、期待できるスピード、制限事項、など。ただ、ここでは“9”についてのみ触れることにします)。

さて…さっきの質問にもどりますが… S3やその他同様の他社サービスで、Amazon、Google、マイクロソフトのSLAは何桁の”9”を表明しているのでしょう?先述の講演者は、S3の稼働時間SLAは、”9”が11個並ぶものを提供していると言いました。もう一度言います ―― “9”が11桁 ―― 99.999999999%の稼働時間。先ほどので探そうとしても、「欄外」になってしまいます。- 表には”9”が6つ並ぶところまでしかないのです!私の手計算によると、― ほぼ - 1年間にダウンタイムが32ミリ秒未満ということになります。これは、「瞬き」の時間の半分ほど、ということになります。- はい。瞬きの半分にも達しないのです(半分瞬き、の先は「目をつむる」ことになるわけですが:) )。

素晴らしい数字です!もし、これが本当だったなら。実のところ、Amazon S3のSLAWindows Azure Blob StorageのSLAGoogle StorageのSLAとまったく同じ数の”9”しか提供していません。いずれも、99.9%、です。

Amazon、Google、マイクロソフトのStorageのSLAはすべて全く同じ数の”9”が並んでいます:すべて99.9% です。”9”は3つです。

私は、くだんのCEOを、(ありもしない)11桁の”9”などと大げさに言った、と責めるつもりはありません(実際、ここでの話には彼または彼女が誰であるかは全く関係ありません)。私にとって、より興味深かったのは、Amazonとそのプラットフォーム性能周りについて、印象的とも言える「現実歪曲空間(Reality distortion field)」があるということでした。私が講演を聞いたCEOは誤解をしていましたが、これはSLAが間違って解釈された最初のケースではなく、おそらく最後でもないでしょう。

私は11桁の”9”の出所について調べてみました。Amazon のCTOであるWerners Vogelsがブログの中でS3サービスは ―― 注意深く言葉を選んで ―― 「99.999999999%の耐久性を持つ」ように「設計されて」いると述べています。Vogelsの言葉は、このテーマについての次にあげるAmazon FAQとも合致しています:

Q: Amazon S3 の信頼性はどの程度ですか?

Amazon S3 は、特定の一年間、99.999999999%のオブジェクト耐久性を提供するようデザインされています。この耐久性レベルは、0.000000001% のオブジェクト平均年間予測喪失率に該当します。例えば、Amazon S3 に10,000のオブジェクトが保存されている場合、単一のオブジェクト損失が発生する予測平均発生率は、10,000,000年に一度ということになります。さらに、Amazon S3 は、2つの施設でデータ損失が同時に発生するのを防ぐようデザインされています。

第一に、上記二つの記述はブログのコメントや、FAQページの項目からの引用であって、SLAからの引用ではありません。次に、いずれの記述もオブジェクトの耐久性について述べています - 稼働時間や可用性についてではありません。第三に、そして決定的な点ですが、その桁数の”9”を実現するように「設計されて」いる、と言っているのです。何も保証はしていません。それでもこれは、目を引くメッセージですし、うまいマーケティングだと思います。

AmazonがS3の設計にそれだけの自信を持っているというのは良いことです。コンピューティングのインフラ設計についての同様な記述は見つけていませんが。現実的には、[クラウド]サービスは設計やアーキテクチャだけではなく、実装、オペレーション、管理、などが関わってくるのです。もちろん、アーキテクチャや設計は強固である必要がありますが、それだけで、あなたのサイトをダウンそして場合によってはデータの損失さえも)させるサービス停止を防げるものではありません。ですから、Amazonの例に限らず桁数の多い”9”をうたうことに私のように懐疑的な人は他にもいます。

では、実際の99.9%、3桁の”9”であるSLAはどうなのでしょうか?期待しすぎないようにしてください。ある識者が私にこう言ったことがあります。サービスレベルアグリーメントという名称には理由がある。サービスレベルギャランティー(保証)とは言っていない。保証はないのだ、と。

この投稿でAmazonを攻撃するつもりはありません ―― 他のベンダーも、過去にも ―― そして今後もきっと ―― サービスの中断はあります。ほとんどの企業にとって、クラウドはそれでも、自分たちのアプリケーションをホストする方法として最もコスト効率的で信頼できるものです。巨大なプラットフォームクラウドベンダーに専門知識、事業集中、信頼性、セキュリティ、規模の経済効果、効率性などで対抗できる企業はわずかしかありません。あなたが「あっち側」へいくのは時間の問題です。今日、あなたの競合(認識している相手であれ未認識の相手であれ)はもう、「あっち側」に行き始めているのです。識者が私に言った通り(「キャズム」を例に出して)、イノベーターやアーリーアダプターとなるのは、競争優位を得るためにはリスクを喜んでとる企業群なのです。前にも、こういうことを見たことと思います:このインターネットってものは、しばらくは生き続けるだろう。と。その通り、クラウドサービスをまだ無視しておこうというのも無理のないことです。いずれは、クラウドに行くのです。ただ、このカーブのどのあたりに乗っかるのか、ということだけなのです。

“9”の話に戻りましょう…。もちろん、Amazonはここで何も間違ったことはしていません。彼らの文書に正確でないところや惑わされそうなところは全然ありません。しかし、私たちコミュニティーの人間は、何が本当に記述されているのかを注意深く見る必要があります。ですから、ここで私は自分が所属しているテクノロジーコミュニティーに小さなお願いを一つしようと思います。クラウドプラットフォームを比較して議論をするときには ―― ブログであれ、講演する時であれ、1:1のチャットであれ ―― 事前によく調べましょう。少なくとも、事実に基づいた議論を保てるように。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中