Yahoo! Search BlogのIntroducing Robots-Nocontent for Page Sectionsというエントリにて、robots-nocontentというmicroformatみたいなものが提案されています*1。
ページのメインではない項目にclass="robots-nocontent"
を付加することで、クローラがその部分を検索結果の対象としないよう処理します。シンプルですね。
例は次のような感じでしょうか。
<div class="header"> <h1>うぇぶさいと</h1> <ul class="navigation robots-nocontent"><!-- nav --></ul> </div> <div class="main"> <div class="ad robots-nocontent"><!-- ads --></div> <h2>たいとる</h2> <p>えんとり</p> </div> <div class="sidebar robots-nocontent"><!-- sidebar --></div> <div class="footer"> <address class="copyright robots-noconent">Copyright ...</address> </div>
サイドバーやナビゲーション、ヘッダーに広告など、いろいろ「無駄」な情報を検索エンジンが拾ってしまうことはよくありますし、それらを排除することでユーザによりよい結果を提示しようとしているのでしょう。まあ、メインの情報をうまくマイニングできないと暗に示しているだけかもしれませんが。。
しかし、メインの情報を拾わせることは意味があるように思うんですが、アプローチの仕方があまり美しくないですね。メインの部分に埋める"robots-main
"なんかも欲しいなあと。
さて、ここで思いつくのはXHTML Roleです。予めrole="main"
やrole="navigation"
、role="navigation"
というRoleが定義されているので、検索エンジンはそれを利用してメインの情報を適切に拾うことが可能となります。早く出て欲しいなあ。
*1:広がりによってはrel-nofollowみたくmicroformatとしてμf.orgに取り込まれるかも
aratako02007/05/07 13:47このニュースを見ていて思ったんですけど、やっぱりa rel="nofollow"とは違うんですよね。ほかの検索エンジンがサポートしてくれるのなら、やりがいもあるんでしょうけど。
vantguarde2007/05/09 16:49rel-nofollowはコメントスパム対策っていう目的があったので広まったんでしょうね。robots-nocontentのような明らかな不利益への対策ではないものは、なかなか使うことのメリットを見いだせない人が多いんじゃないかなと思います。