2005.10.26
Google Baseがもたらす 「Webデータ」 の時代
Google Baseはまだ始まっていない。始まっていないが、気になって仕方がない。

第1弾エントリでも書いたように、これはおそらく、Googleのこれまでのサービスの中でも最大級に重要なものになり、Webの歴史の中でも大きな節目となるくらい、重要なサービスになるような気がする。

なぜそんなに重要なのか、そしてGoogle BaseによってWebがどう変わるのか、私なりに少し考えてみたい。

なお、以下の記述はGoogle Baseについてすでに出ている情報から、私が理解したり推測したことに基づいた考察であり、これから出てくるGoogle Baseの実際のサービス内容と食い違う可能性があることをお断りしておく。

Google Baseは、Web上でデータベースを作ることを可能にする。ブログのエントリや、ブックマークなどと同列なものとして、イベント情報、お店情報、不動産の物件情報などを置けるようになる。

これらにはURLが振られて、人間が直接見ることもできるし、ソフトウェア向けのWeb APIでアクセスすることもできる。

この2種類のインターフェイス、「人間向けのインターフェイス」と「ソフトウェア向けのインターフェイス(API)」を最初から兼ね備えていることが、きわめて重要だ。

ブログの場合、基本的には人間が見るものとして作られており、「人間向けのインターフェイス」がデフォルトだといえる。しかしそれに加えて、RSSやトラックバックAPIなど「ソフトウェア向けのインターフェイス」が充実してきたことで、さまざまな関連サービスが可能になった。現在のブログシーンの隆盛はかなりの部分、この「ソフトウェア向けのインターフェイス」によってもたらされたといえるだろう。

この両面性を最初から備え、そしてブログのエントリやブックマークだけではない、あらゆる「型」のデータを扱えるのがGoogle Baseなのだ。

本の感想や映画のレビュー、お店の紹介などを書く場合、現状のブログの仕組みだと、サーチエンジン側から見て、その書かれた「対象」を捉えるのがむずかしい。データが構造化されていないので、全文検索してブログの本文から「ほじくり出す」しかない。しかしこれでは、まともな情報は取り出せない。

何かの情報を探していて、「Googleは使えない」と思ったことはないだろうか?その理由がまさにこれだ。現状のWebでは、データが「構造化されていない」ので、全文検索による単純一致しかない。とにかくその単語が入ったページを持ってくるしかないのだ。

Google Baseによって、例えば「本の書評」といったデータを、Web上にそのまま置けるようになる。「本の書評」が、例えば「ISBNコード」「評者」「本文」というフィールドからできているとすると、特定の本についてみんながどんな評を書いているか知りたければ、その本のISBNコードから引くだけで、評がずらっと出てくるのだ。この「本の書評」データを、ISBNコードを含む「本」のデータとあわせれば(技術用語でいえば「join」)、本の書評ポータルになるだろう。

このように、Google Baseはいわゆる「Web API」のレベルを超えて、「データそのもの」をWebに置けるようにする仕組みだ。「サービスの向こう側」にあるデータをWeb APIを通じて取るのではなく、「データそのもの」が取れるようになる。

ティム・オライリーの「Web 2.0とは何か?」では、<データこそ次の「インテル・インサイド」>だと書かれている。これからのWebでは、「データが主役」なのだ。Google Baseはまさに、あらゆる種類の「データ」に対応することで、たくさんのデータを取り込むことを狙ったものだといえるだろう。

ここでもし、このデータを取り出す(export)ことができなければ、かなりの反感を買うことは間違いない。取り出せないのでは、最初にデータを入れるのに抵抗を感じる。他人のサービスを使っても、データは「自分のもの」だからだ。しかし、おそらくその心配はないと思う。最低でも、Web APIがあればデータは取れるし、もっと便利なexport機能もおそらく用意されるだろう。

Googleとしては、データは自由に出し入れしてもらっても、サービスとしてリードポジションをとれれば十分なのだと思う。デファクト・スタンダードになれば技術的な仕様などの主導権もとれるし、構造化されたデータがWebにたくさんのってくれば、Googleというサーチエンジン自体とのシナジー(相乗効果)も大きい。データをロックイン(囲い込み)するなんてケチなことをしなくても、Googleなら十分メリットがあるはずだ。

構造化されたデータをWebに直接置くことができ、それを自由に出し入れできる。これにより、ただでさえ動きの早い現在のWebの風景が、さらに激変するだろう。Google Baseがもたらすこの新しいパラダイムを、ここではとりあえず「Webデータ」(注)と名づけることにしたい。

注 : Web APIの意味での「Webサービス」という言葉が、どうもあいまいな感じの名前であるのと同様、「Webデータ」というのも、あいまいな名前だと思う。しかし、まさに「Webサービス」に対して「Webデータ」が出てきた、という意味では、それなりにピッタリな名前とも思える。

Google Baseが広まれば、そしてそれがデータをロックインせずオープンにしていれば、同種のサービスが必ず出てきて、そのような「仕組み」が一般化する。ここで「Webデータ」といっているのは、その仕組みのことだ。

「Webデータ」の時代は、本格的なWeb 2.0時代の始まりなのかもしれないし、あるいはWeb 2.0にすら捉えられていない、さらに次の動きなのかもしれない。いずれにせよ、それはWeb 2.0よりもはるかに「具体的」だ。

「Web 2.0」が、Webの新傾向を包括する曖昧な名称であり、お祭り的にひろがるbuzz(流行語)であるのに対し、Google Baseがもたらす 「Webデータ」は、XMLやRSSなどと同じように、まったく具体的な技術である。

XMLやRSSは、褒められたり、貶されたり、騒がれたり、誤解されたりしながらも、世の中を「具体的に」変えた。

これと同じように、Google Baseがもたらす 「Webデータ」 は、どんな毀誉褒貶や誤解にもかかわらず、世の中を「具体的に」変えていくだろう。


(「「Webデータの時代」 がもたらす3つの技術発展」に続く)