誤差值超過 83% 的排名
邏輯上要證明排名是對的,必需把列入整個排名的每一個體都拿出來檢討才能證其正確性。可是要證其錯誤就容易多了,只要找到一個錯,就可說明這個計算系統是錯的。
就如同我要說部落格觀察的排名誤差值超過 83%,那我只要找出一個例子,排名誤差超過 83% ,這個說法就成立了。
我們以 phptw.net 在部落格觀察為例來討論。查看 phptw.net 的排名紀錄,在這一週的排名是 363,上一週是 381,前一週是 665。我們不討論其中那一個是對的或錯的。不過,確定的是這三週來,我所管理的 phptw.net 網站,根沒沒進行任何的更新,也許外來的 links 可能有小幅的增加,不過部落格觀察所捉取的該站連結數並沒有太大的變動。可是依據它這不準確的統計方式,下一週 phptw.net 又該列入藍眼觀察了。這其中,可想見所謂藍眼觀察的荒謬性有多麼高的了。相同的情況,前幾個月我就介紹過另一個 “好好笑的藍眼觀注” 。
如此荒謬排名誤差的原因為何,不該是我需要去找答案。提出此一排名系統的人才是最該用力去達成系統的可靠性。如果,一個網站沒進行任何更新,沒兩個星期排名可有 665/363= 183% 的誤差,沒道理的進步了 83%,那麼我可不得不說這樣的排名系統也許只有 17% 的參考的價值了?
排名所以如此誤差,主要該是發生在於該系統引用 Google 的 blogsearch 的數據,Google 變動了取樣的方式。
譬如說 : blogsearch 列舉 phptw.net 的外來 blog 的連結數,其網址原為
http://blogsearch.google.com/?q=http://phptw.net ,但現在這網頁連結數是 0。
若是改查 :
http://blogsearch.google.com/blogsearch?hl=zh-TW&ie=UTF-8&q=link:http://phptw.net&btnG=搜索網誌&lr=lang_zh-TW
則網頁連結數有 14。
查所有誌是 0,反而查繁體網誌卻有 14 。而 Google 有時候又會是查所有誌又會變成是正確的 14。Google 提供的數據不穩定,引用此一數據來分析的部落格觀察也不察,有時候捉到對的,有時候捉到的會是錯的。或者是某一批 blog 捉到對的數字於是排名就可突然竄昇。或者是某一批 blog 捉不到數字而是 0,這一批的排名就可突然的掉了 83% 以上。






