グーグルの「計算」は何がこれまでと違うのか

yomoyomoさんがツボを押さえた紹介をされているこの議論、私も「競争は必要だ」という意見に同意します。

ただ、ここで「競争か独占か」と言われている本当の対象は、「検索」ではなくて「クラウドコンピューティング」ではないかと思います。だから、「検索が独占されても、まだまだパイはたくさんある」というオライリーの主張にも同意できる部分もあります。

「何がグーグルの本質か」「グーグルの何が既存の技術と違うのか」ということを明確にしていけば、この議論の本質が見えてくると私は思います。

グーグルが既存の技術と違う所は、二点あります。一点は既存の技術がこだわっている所をグーグルが捨ててしまった所。もう一点は、既存の技術に扱えない領域を扱えるようにしたこと。

グーグルが捨ててしまったもの、それは「トランザクション処理」だと思います。

三菱東京UFJ銀行のシステム障害が話題になっていますが、ある意味では銀行のオンラインシステムは、グーグルなんか足元にも及ばないすごい技術だと私は考えています。

銀行に限らず、企業の数字を扱うコンピュータシステムには、非常に大きな制約条件があるからです。

たとえば、私が自分の口座Aに1000円入っていて、それを全額自分の別の口座Bに送金したとします。口座Aから1000円引いて、口座Bに1000円足すだけの単純な処理です。

企業システムにおける大きな制約条件とは、「送金途中の口座を何があっても外に見せてはいけない」ということです。もし、この送金の処理と同時に、何か集計の処理が行なわれていて、口座Aから引いた直後の残高0円と、口座Bに足す前の残高0円を足し合わせたら、私は無一文になっていまいます。この集計処理は、口座A:1000円+口座B:0円=合計1000円としてもいいし、口座A:0円+口座B:1000円=合計1000円としてもいいのですが、送金の途中の状態を見せてはいけません。

これが「トランザクション処理」です。

企業のシステムは、ほとんどが金額や数量の足し算引き算だけの単純なものですが、一連の処理をまとまって行う多くの「トランザクション」の集合であって、こういう意味での一貫性を確保するのは大変なことなのです。

障害があって止まることは許されても、トランザクションの途中経過を外に見せることは許されません。上記の送金の処理中、口座Aから引いた直後にシステムが止まってそのまま復旧したら、私は無一文になってしまいます。

この「トランザクション」という制約の為に、単純な足し算引き算のプログラムを作るのに、凄く高度な技術が必要になります。

ところが、グーグルはこれを捨てています。

私が「グーグルばんざい!」と書いたページを「マイクロソフトばんざい!」に書き変えたとします。もし検索にトランザクション処理が要求されたら、私のそのページは「グーグル」という単語の検索結果に出て「マイクロソフト」という単語の検索結果に出ないか、その逆か、どちらかであることが必要になります。両方出たらアウトです。

でも、検索にそんな意味での厳格さを求める人はいません。だから、グーグルは「トランザクション」という制約無しにシステムを開発することができます。もちろん、内部処理では、「トランザクション」に相当するような厳格な管理が随所に必要ですが、ユーザに見せる内容に一貫性が求められないということで、その負担はずっと軽いものになります。

グーグルはここをサボる代わりに、コンピュータの歴史上、他に誰もやってないことに挑戦しています。

それは「粒の揃ってないデータを大量に処理すること」です。

銀行の口座は、どんな金持ちでもどんな貧乏人でも同じ一つのデータです。口座番号というIDと残高という金額の組み合わせであることは同じです。このように、既存のシステムは、規格化されたデータ、粒の揃ったデータのみを扱いました。

ところが、WEBページというのは、いろんな意味で、それぞれのページに個性があります。長いページもあれば短いページもあるし、リンクが多いページもあれば、単なるテキストだけのページもある。相互につながっているページもあれば、ほとんど孤立しているページもある。

グーグルが凄いのは、大量のページを処理することではなくて、多種多様なバラツキの多いWEBページというデータをそのまま扱える技術を開発したことです。

同じ、大量データ処理とか分散コンピューティングと言っても、粒が揃っているデータを扱うのと粒が揃ってないデータを扱うのでは全然意味が違います。

グーグルは、「トランザクション」を捨てて「粒の揃ってないデータ」を扱うことを可能にした。

これが、組織から個人へという権力の移行に直結しているわけです。つまり、組織というのは一貫性が要求されるので、組織の為のコンピュータはほぼ必然的に「トランザクション」を必要とし、その代わりにデータの粒を揃えることを受けいれます。

しかし、人間の行動は本来、Webページのようにバラバラで粒が揃ってないもので、「トランザクション」を個人として求める人はいません。そういう個人としての人間が生成するさまざまなデータを、規格化しないで受けいれて何らかの計算結果を出す技術をグーグルは開発したのです。ここにグーグルの独自性があります。

そして、そういう技術の存在を前提として、組織と個人が同時に変容していくことがオライリーの言うWeb2.0の本質だと私は思います。

「検索」というのは、その技術の適用範囲として第一歩であり入口に過ぎません。だから、それが独占されるかどうかはオライリーの言うように大きな問題ではないと私は思います。

しかし、「検索」を独占することは、同時に「粒の揃ってないデータ」を扱う技術の独占を意味するかもしれません。そういう前提に立つならば、TechCrunchが言うように、この分野での健全な競争が欠かせないということになるでしょう。

当ブログの関連記事:


一日一チベットリンクチベットNOW@ルンタ:ノッチンガムのダライラマ法王 - livedoor Blog(ブログ)