網址 URL 的規範化 (URL canonicalization)
唯一的一個網頁,卻會有許多的網址能夠到達。這在 SEO 來說並非一件好事。最常見的情況,以下的幾個網址,常會指向同一個網頁:
http://www.domainname.com/
http://domainname.com/
http://www.domainname.com/index.htm
http://domainname.com/index.htm
技術上,這幾個 URL 是不同的。但是絕大部份的網站,對於網站的首頁都會產生這樣的情形。以上述類似的四個網址都會傳回完全相同網頁內容。正常的情況下,網站應該是只有唯一的一個首頁。而且,對搜索引擎來說,也需要由上述的幾個不同的 URL 中挑出一個最洽當的網址來代表這一個網頁。很多網站首頁的 Back-Link 使用的 URL 並非唯一的。幾乎是上頭所說的四種 URL 都被用上了。這樣的情況,對網站的訪客雖然不會造成很大的困擾,因為不論那一個網址都會到達同樣的首頁,看到相同的文件。但是,這樣的情形對搜索引擎來說,並不是一件好事。因為,你究竟要讓搜索引擎如何判斷那一個網址才是你真正的首頁。甚至於到最後,可能認定你的網頁是重覆複製的 spam 了。若是,被判定為複製網頁,最壞的結果是搜索引擎只挑出其中的一個,而其他的全被列為複製網頁而丟到查都查不到的情況了。
因此, URL 規範化是一個不能不重視的問題。
以網站管理員的立場而言,能做的幾件事 :
站內的內部連結,要做到連結到各網頁的 URL 只使用一種網址。尤其是首頁,不論是否使用有 www 或沒用的。一旦選定了一種之後,從一而終的都只要使用一種。如此,搜索引擎才能明白那一個網址才是你的首頁的網址。
對於,外來的連結是你無法完全控制的。因為,我們實在無法控制別人如何寫你首頁的網址。唯一的辦法是,你可用 301 網頁重導向把各網址重新導向你所選定的首頁網址。
如果,你選定以 http://domainname.com/ 做為你的首頁網址。那麼 :
http://www.domainname.com/
http://www.domainname.com/index.html
http://domainname.com/index.html
這些網址,就該都要以 301重導向到 http://domainname.com/
同時,你可用 Google 的網站管理員工具 在偏好的網域中,選定 http://domainname.com/ 為你的主網域。 可千萬不可使用要移除在 Google 網頁目錄裏的資料嗎? 內所提供的方式,把帶有 www 的 www.domainname.com 網址給刪除了。或者是你想要用帶有 www 的網址時,也把不帶 www 的網止給刪除了。
除了首頁會有這類帶有 www 或無 www 的 URL 規範的問題。搜索引擎有時會有把網址中的大寫全改為小寫的現象。有時是會有去掉網址中包含 SID 的處理。這些,都有可能造成引擎網址規範化的問題。
文章資訊
2007-05-21 00:05 貼出, 並編屬 : 搜尋排前, 網站的推廣. 標籤 : Google-的網站管理員工具, URL-canonicalization
前一篇文 : 三腳貓在 SERP 的戰績 »
次一篇文 : 網頁如何以 301 Redirect 重導向 »












2007-05-21 12:45
既然你提到了 URL rewrite,有個方法是把帶 http://www. hostname 的要求重寫為只有網域名。
ServerName http://www.domainname.com
RewriteEngine On
RewriteRule ^/(.*) http://domainname.com/1 [R,L]
這樣就可以修正有時候有 http://www. 有時候沒有的問題了。
2007-05-21 12:47
糟糕,被吃掉角括號… (再貼)
〈VirtualHost *〉
ServerName http://www.domainname.com
〈IfModule mod_rewrite.c〉
RewriteEngine On
RewriteRule ^/(.*) http://domainname.com/1 [R,L]
〈/IfModule〉
〈/VirtualHost〉