目次
今回は、Googleなどの検索エンジンにWebサイトを正しく評価してもらうために欠かせない「URLの正規化」を紹介します。
「URLの正規化」とは
「URLの正規化」とは、正しくない状態に置かれているURLを正しく直すことです。SEO(検索エンジン最適化)を進めるうえで必要不可欠な施策のひとつです。
ここでいう“正しくない状態”とは、同じページを表すURLが複数存在している状態を指します。
Googleは一つ一つのURLに対し、「このURLにはこのコンテンツがある」と判断し、検索結果に反映させています。この時、異なるURLに同じコンテンツがあった場合、Googleはどちらを評価すればいいかわからなくなります。
具体的には以下のいずれでも同じサイトが閲覧できるような場合が“正しくない状態”です。
①https://●●●.com/
②https://www.●●●●.com/
③https://●●●●.com/index.html
④https:// www.●●●●.com/index.html
それぞれ、頭に「www.」が付いている、お尻に「/index.html」が付いているというだけの違いなので、ユーザーがサイトを利用するうえでは特に不便はないでしょう。しかし、検索エンジンは同じコンテンツが記載された4つのページがある、と解釈します。
“同じコンテンツが記載された4つのページがある”ということは、検索エンジンに「コンテンツが重複した4つのWebサイトが存在する」と見なされる可能性があるということです。
コンテンツの重複は、Googleをはじめとする検索エンジンがサイトの評価を下げる原因の一つです。被リンク数などの外部評価が分散されるうえ、コピーコンテンツとみなされてペナルティ対象になる場合もあります。
「URLの正規化」は、同じコンテンツに対するURLが複数存在するために検索エンジンに勘違いされてしまう、さらに結果としてサイトの評価を下げてしまう、そのような事態を避けるために必要な施策といえます。
「URLの正規化」のメリット
ここからは、「URLの正規化」についてもう少し具体的に解説していきましょう。
“正規化”というと、今あるものを新しく作り直すような何か大がかりなものを想像するかもしれません。しかし、URLの正規化とは、いわば複数あるものをひとつに統合するという作業を指します。Googleでは「ほとんど同じコンテンツの複数のページがサイトに含まれる場合、優先する URL を Google に指定する方法」と定義しています。
具体的には、冒頭に例として挙げた4つのURLのうち、たとえば②のURL(http://www.●●●●.com/)に統合して①、③、④は表示させないようにする、または①、③、④は②と同じサイトであることを検索エンジンに伝えるというのが基本的な方法です。
正規化によって、以下のようなメリットが考えられます。
正当な評価を受けることができる
重複コンテンツが解消されることで、検索エンジンは純粋にコンテンツの内容でサイトの評価をしてくれるようになります。
正規化のあとはサイトの内部をより見やすく、より充実した中身の濃いものにすることに集中することで、サイトの評価を上げていくことができるでしょう。
被リンクを一本化できる
被リンクとは、他のサイトからこちらのサイトにリンクしてもらう、具体的にはURLを記載してもらって飛べるようにしてもらうこと。サイトの評価を上げるのに、最もシンプルで効果的な方法のひとつです。
しかし、たとえば冒頭に挙げた例のように4つの異なるURLがあり、複数のサイトがそれぞれバラバラに4つのURLを記載してリンクを飛ばしてしまうと、被リンクの効果がバラけてしまうことが考えられます。
あなたのサイトにたくさんの評価が集まっていることをGoogleなどの検索エンジンにしっかり認識させるためにもURLを正規化しておく必要があります。
それでは、実際にURLを正規化させる方法のうち、代表的な2つをご紹介します。
.htaccessファイルで301リダイレクト
URLの正規化にはいくつか方法がありますが、最もメジャーで確実な方法が.htaccessファイルによる301リダイレクト処理です。これはGoogleも推奨している方法です。
検索エンジンの結果で表示されるページの URL を変更する必要がある場合は、サーバー サイドの 301 リダイレクトを使用することをおすすめします。これは、ユーザーや検索エンジンが正しいページにたどり着くことを保証する最善の方法です。ステータス コード 301 は、ページが別の場所に完全に移転したことを意味します。
リダイレクトとは、ある特定のURLにアクセスした際、自動的に別のURLに転送させる仕組みです。
冒頭で挙げた例では、「www.」や「/index.html」の有り無しのいずれでも閲覧できる状態でした。しかし、どのURLでアクセスした際も「https://www.●●●●.com/」に転送されるようリダイレクト処理をしておくと、Googleの評価もそのURLに統一されます。
また、「301」は情報の中身が恒久的に移動したことを表すステータスコードです。単純なリダイレクトではなく301リダイレクトを利用することで、正規化されていなかった他のURLの評価も引き継ぐことができます。
.htaccessファイルはメモ帳でも作成できます。下記のようなソースを記入したファイルを「.htaccess」という名前で保存し、index.htmlと同階層に設置します。
下記のソースは「https:// ●●●●.com/」を「https://www.●●●●.com/」にリダイレクトする場合の記入例です。
RewriteEngine on RewriteCond %{HTTP_HOST} ^(●●●●.com)(:80)? [NC] RewriteRule ^(.*) http://www. ●●●●.com/$1 [R=301,L]RewriteCond %{THE_REQUEST} ^.*/index.html RewriteRule ^(.*)index.html$ http://www. ●●●●.com/$1 [R=301,L]
.htaccessはURLの正規化の際に最もよく使われ、非常に強力な手法です。wwwの有り無しだけでなく、SSL化の際にも301リダイレクトを行い、サイトの評価を引き継ぎます。
しかし、サーバーによっては.htaccessが利用できない場合があります。そんな時は次に紹介するタグを使用した正規化を行いましょう。
Canonicalタグで評価を一本化
Canonicalタグによる正規化は、最もシンプルな方法のひとつです。Canonicalタグとは、HTMLページに記述するメタタグのひとつで、検索エンジンに対し評価する対象を指定することができます。
HTMLソース内に1行追加するだけのため、.htaccess よりも作業負担が小さく、サーバーの仕様にかかわらず利用できます。また、wwwの有り無しなど、リダイレクトにより完全に統一してしまってよい場合ではなく、パラメータによる表示切替など、リダイレクトはできないが評価は統一させたいケースでも用いることができます。
たとえば冒頭に挙げた例のように4つのURLがあり、「https://www.●●●●.com/」に統合するとしましょう。
この場合には、HTMLページのhead部分に以下のようなコードを打ちこみます。
<link rel=”canonical” href=” https://www.●●●●.com/”>
もともと、「Canonical(カノニカル)」とは、「聖書の正典」「規範・規準」を意味する英単語「Canon(カノン)」を形容詞化した言葉。「正典と認められたもの」「規準的なもの」を意味します。
Canonicalタグは、コード内に記載されたURLこそが「“正典と認められた、規準的な”正規のURL」であると検索エンジンに認識してもらうという効果があります。
301リダイレクトと異なり、いずれのURLでもサイトを閲覧できますが、コピーコンテンツとして扱われたり、評価が分散したりすることはありません。
まとめ
今回はURLの正規化をテーマに紹介しました。
SEO対策には内部対策、外部対策など様々な手法がありますが、評価対象となるサイトのURLが正規化されていないと効果が半減してしまいます。
最近はSSL化がSEOに与える影響が注目され、SSLを導入するサイトがどんどん増えています。しかし、URLの正規化を行っていない場合、SSL化以前の評価を引き継げないためSEOに悪影響を与える場合があります。
今回紹介した「.htaccessファイルで301リダイレクト」「Canonicalタグで評価を一本化」はどちらも簡単な方法で手間をかけずに正規化できる方法です。
httpsとhttpやwwwの有無など、わかりやすいものは対策していても、URL最後の「/」の有無など、気づきにくい部分が放置されていることもありますので、ぜひ一度、サイトを見直してみて下さい。