「Webデータの時代」 がもたらす3つの技術発展
(「Google Baseがもたらす 「Webデータ」 の時代」の続きです)
Google Baseによって訪れるであろう「Webデータの時代」は、わたしたちに何をもたらすだろうか。
以下、これによって発展が加速されるであろうと思われる情報技術について、私が想像するものを3つ挙げてみた。
1 スキーマ技術
Webデータの時代では、構造化されたデータと切っても切れないものとして、データの「型」(スキーマ)の技術が発展する。まだあまり普及していないスキーマ技術が、専門的なものから一般的なものへ、大きく羽ばたくだろう(かつてのネットやウェブがそうだったように)。ただその過程で、単純化や変容も起きるだろう。
RSSがブログシーンを変えたように、いろいろなスキーマのオープンスタンダードが、これからどんどん出てくる。その種のものはこれまでもいろいろな業界団体などで作られてきたが、それらが実践の場に上げられて試される。それが委員会的な論理でなく、「使えるかどうか」という適者生存の論理によって、デファクト・スタンダードが決まっていくだろう。
そして何よりも、それらを「実際に使える」ツールや環境が充実してくるはずだ。この意義がじつに大きい。
2 意味(セマンティクス)技術
スキーマ技術を突破口として、W3Cなどが地道に進めてきたセマンティック・ウェブの技術が大きく伸びる。スキーマ技術とセマンティクス技術は別のものだが、スキーマレベルを突破すれば、セマンティクスまで一気に進展すると思う。
セマンティック・ウェブの眼目である「意味(セマンティクス)」の技術が発展し、意味ベースの情報処理が一般化する。意味ベースとは、例えば札幌のラーメン屋を登録しておくと、「北海道のラーメン屋」という検索で出てくる、ということだ(このとき、札幌が北海道に含まれるという意味関係を知っている「オントロジー」というデータベースが別にあって、それを使う)。
単語の客観的な意味を網羅したオントロジーが使えるようになれば、ソーシャルブックマークなどで使われる「タグ」なども意味ベースでつながりを辿れるし、オントロジーをWikipediaなどと組み合わせれば、応用はまさに無限だ。
3 ボット、エージェント技術
Web上でデータやスキーマを自由に作成できるようになれば、いわゆるボット(ソフトウェアのロボット)の可能性も一気に広がる。ボットが扱うデータをWeb上に置けるだけでなく、ボットというソフトウェア自身の部品になるソースコードもデータとしてWeb上に置けるので、きわめて強力な応用ができそうだ。
人間の代わりに高度な処理をおこなう「エージェント」技術、「電子秘書」みたいなものも、Web上で大きく具体化しそうだ。ここにセマンティクス技術まで加われば、「情報処理」が「思考」に近づくだろう。
先日、似たような話を書いたばかりだが(「クリエイティヴなロジック - 将棋ソフトとMemeorandum」)、この調子であれば、そういう世界はもっと早くやってきそうな気がしてきた。
Google Baseによって訪れるであろう「Webデータの時代」は、わたしたちに何をもたらすだろうか。
以下、これによって発展が加速されるであろうと思われる情報技術について、私が想像するものを3つ挙げてみた。
1 スキーマ技術
Webデータの時代では、構造化されたデータと切っても切れないものとして、データの「型」(スキーマ)の技術が発展する。まだあまり普及していないスキーマ技術が、専門的なものから一般的なものへ、大きく羽ばたくだろう(かつてのネットやウェブがそうだったように)。ただその過程で、単純化や変容も起きるだろう。
RSSがブログシーンを変えたように、いろいろなスキーマのオープンスタンダードが、これからどんどん出てくる。その種のものはこれまでもいろいろな業界団体などで作られてきたが、それらが実践の場に上げられて試される。それが委員会的な論理でなく、「使えるかどうか」という適者生存の論理によって、デファクト・スタンダードが決まっていくだろう。
そして何よりも、それらを「実際に使える」ツールや環境が充実してくるはずだ。この意義がじつに大きい。
2 意味(セマンティクス)技術
スキーマ技術を突破口として、W3Cなどが地道に進めてきたセマンティック・ウェブの技術が大きく伸びる。スキーマ技術とセマンティクス技術は別のものだが、スキーマレベルを突破すれば、セマンティクスまで一気に進展すると思う。
セマンティック・ウェブの眼目である「意味(セマンティクス)」の技術が発展し、意味ベースの情報処理が一般化する。意味ベースとは、例えば札幌のラーメン屋を登録しておくと、「北海道のラーメン屋」という検索で出てくる、ということだ(このとき、札幌が北海道に含まれるという意味関係を知っている「オントロジー」というデータベースが別にあって、それを使う)。
単語の客観的な意味を網羅したオントロジーが使えるようになれば、ソーシャルブックマークなどで使われる「タグ」なども意味ベースでつながりを辿れるし、オントロジーをWikipediaなどと組み合わせれば、応用はまさに無限だ。
3 ボット、エージェント技術
Web上でデータやスキーマを自由に作成できるようになれば、いわゆるボット(ソフトウェアのロボット)の可能性も一気に広がる。ボットが扱うデータをWeb上に置けるだけでなく、ボットというソフトウェア自身の部品になるソースコードもデータとしてWeb上に置けるので、きわめて強力な応用ができそうだ。
人間の代わりに高度な処理をおこなう「エージェント」技術、「電子秘書」みたいなものも、Web上で大きく具体化しそうだ。ここにセマンティクス技術まで加われば、「情報処理」が「思考」に近づくだろう。
先日、似たような話を書いたばかりだが(「クリエイティヴなロジック - 将棋ソフトとMemeorandum」)、この調子であれば、そういう世界はもっと早くやってきそうな気がしてきた。