重複コンテンツとは「コンテンツが同じなのにurlが異なる状態」の事です。
「すべてオリジナルコンテンツだから重複していない」と、鼻くそをほじっては食べるエコなあなた!
URLの正規化していれば大丈夫ですが、未実施の場合はアウトです。
URLの正規化していない場合は、wwwの有無とindex.htmlの有無でコンテンツの評価が分散されてしまうので、結果として成果を出すことが難しくなります。
wwwの有無とindex.htmlの有無
- http://example.com/
- http://www.example.com/
- http://example.com/index.html
- http://www.example.com/index.html
wwwの有無とindex.htmlの有無 だけでも4パターンあります。更にssl(htpps://)が加われば、さらに増えます。
評価分散の問題点
- リンク/pagerankの分散
- 非効率なクロール
- 低品質評価
これを回避するために行う措置がいわゆるurlの正規化(urlを統一する事)です。
今回は、ドメインを正規化させる方法を中心にお話しします。
正規化する方法
301リダイレクト(.htaccessファイルを使ってして正規化)
「www」あり・なしの設定は.htaccessでそれぞれ301リダイレクトして統一します。
<!-- wwwありに統一 -->
Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^example\.com$
RewriteRule ^(.*)$ http://www.example.com/$1 [R=301,L]
<!-- wwwなしに統一 -->
Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www\.example\.com$
RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]
canonicalタグを使う
現在のサーバーではほとんどhtaccessが利用できると思いますが、もしも利用できない場合はhead内にcanonicalタグを記述すれば、ドメインを正規化することができます。
canonicalタグには下記のように正規化したいURLを記述すれば、そのURLがGoogleに認識され統一する事が出来ます。
<link rel="canonical" href="http://example.com/">