2008.08.12
HTML 5は何をもたらすか
HTML 5が与えるインパクト、それがもたらすものについて、具体例を3つ考えてみた。


■ HTML5は何をもたらすか

1 Webレイアウトの「標準」
2 フィードを代替する
3 Webページの「リミックス」が進む

以下、順に説明していこう。


■ 1 Webレイアウトの「標準」

HTML 5では「article」タグでページの「本文」が取れる」の図にあるように、HTML 5で導入される「header」「article」「nav」「footer」などの新タグは、現在のWebレイアウトでよく用いられるid名などをそのまま、正式なタグに昇格させたものだ。

HTML 5が実際にブラウザでサポートされ、広く普及するのはだいぶ先だろう。しかし現時点からこの仕様、新しいタグ名が挙がっているということで、divのidやclassとして「header」「article」「nav」「footer」など、HTML 5のタグを意識した値が使われるケースが増えていくと思う。

こうして、実際にHTML 5が「使える」ようになる前から、仕様の告知効果によって、レイアウトの「標準」が普及していくのだ。現時点では、divのidとして何を使うのも自由だが、おそらくHTML 5のタグ名に収束していく流れが出てくると思う。

そうなれば、実際に「article」タグがなくても、例えば「div id="article"」のところが記事の単位だと判定できる。いまのHTMLを使って、そのまま構造化コンテンツを実現しようという「microformats」の方向だ。

ブラウザでの表示というよりも、Webページをソフトウェアで解析するという観点では、HTML 5の「article」タグでなくても、「記事という単位を抽出する標準的な方法」が確立されるだけで十分なのだ。


■ 2 フィードを代替する

いまのフィードの役割とは、

1) プッシュ型の更新通知
2) 構造化コンテンツの配信(タイトル、本文などが抽出されている)

の2つだ。

HTML 5の「article」タグがあれば、このうち2)のほうの「本文」は、どんなWebページからでも直接抽出できるようになる。「本文」レベルでよければ、2)の役割のためにフィードを使う必要はなくなる。

そして、ブログのトップページなどの「一覧ページ」では、記事やサマリーの単位ごとに「article」タグで囲まれるようになる。これらをソフトウェアで解析して抽出すれば、ほとんどフィードになる。

そもそもフィードとは、同一URLの内容が更新されていく「一覧型のページ」であり、いわば「ソフトウェア向けのトップページ」みたいなものだ。

「article」タグがあれば、ブログのトップページを解析すれば「本文の一覧」が抽出できるわけで、どの記事が追加されたかもわかる。昔からある「アンテナ」サービス(Webページの差分判定による更新通知)を、ちょっとフィードに近づけた感じだ。

ただし、「本文」以外の情報、タイトルやリンクURLなどを抽出するには別の方法が必要になる。これも、article内のどこからタイトルやリンクURLを抽出すればいいかという標準的な方法が確立すれば、解決できそうだ。ここまで来れば、ほぼ完全にフィードを代替できて、フィードが不要になるかもしれない。


■ 3 Webページの「リミックス」が進む

「header」「article」「nav」「footer」といったタグの導入によってHTMLの構造化が進むと、ソフトウェア的な加工、「リミックス」が格段にやりやすくなる。

HTMLの加工がしやすくなると、いろいろなサイトからWebページを取得して、加工するようなマッシュアップ、アグリゲーション系のサービスが作りやすくなる。サーチエンジンの検索精度が上がるのも、ここに含まれるだろう。

いっぽう、そうしたサーバ系の加工だけでなく、クライアント側の加工も多くなりそうだ。Webページには多数のメニューやバナーなどが含まれているので、それらを削ぎ落として「本文」だけを見る、といった使い方が増えると思う。これは、ブラウザのプラグイン(Greasemonkeyなど)による加工が当面は多そうだが、もう少しホームサーバ的な環境、「パーソナルネット」的な環境が普通になっていけば、プロキシサーバの機能になりそうだ。

以上、HTML 5がもたらすメリットの具体例を、ひとまず3つ考えてみた。

個人的には、主に1の「標準」の視点で見ていて、ブラウザがHTML 5のフルスペックに対応するのを待つというよりも、HTMLをソフトウェア処理する立場から興味をもっている。

その意味では、HTML 5の「article」タグでなく、単に「div id="article"」をみんなで使おう、というのが広まるだけでもいい。これだけで、上の3つはすぐに実現できるのだ。


関連エントリ:
HTML 5では「article」タグでページの「本文」が取れる
http://mojix.org/2008/08/10/html5_article_tag
フィードをアイテム単位に区切れば、セマンティック・ウェブが一気に現実化する
http://mojix.org/2008/03/24/feed_item_semantic_web
Web 2.0の3つの方向 - マッシュアップ、Ajax、新しいブラウザ
http://mojix.org/2005/09/28/105324