2012-03-07 11:03:49
WEB動態(tài)語言有很多,ASP,PHP,.NET,JSP等,之所以在標(biāo)題中著重提到ASP,是因?yàn)槟壳笆忻嫔洗蠖鄶?shù)的企業(yè)站點(diǎn)還是采用ASP來做的,這個語言因?yàn)閷W(xué)習(xí)的門檻較低,又有ACCESS的完美配合,所以是大多數(shù)程序員首選的企業(yè)站點(diǎn)語言。我們不在這篇文章中討論ASP的安全性或技術(shù)層面的東西,我僅在這篇文章中分享最新學(xué)習(xí)到的一個理念,就是ASP網(wǎng)站的站內(nèi)搜索功能對SEO的影響。
因?yàn)镾EO對靜態(tài)語言的收錄有一定的優(yōu)先(雖沒有絕對性,但由于同樣的配置上,靜態(tài)頁面的訪問速度快于動態(tài)頁面,所以從用戶體驗(yàn)角度上,百度是優(yōu)化收錄和排名的),現(xiàn)在大多數(shù)在網(wǎng)絡(luò)公司工作的程序員都開始接觸SEO網(wǎng)絡(luò)營銷的概念,所以有些程序員在站點(diǎn)規(guī)劃上會生成靜態(tài),但有個矛盾點(diǎn),就是站內(nèi)搜索,特別是對于一些產(chǎn)品或新聞信息比較多的站點(diǎn),這個功能是至關(guān)重要的,由于數(shù)據(jù)的傳輸問題,無法做到絕對的全站靜態(tài),要么是偽靜態(tài),要么是用XML做為小型數(shù)據(jù)庫進(jìn)行篩選,但從本質(zhì)上講,還是動態(tài)的。
這種站內(nèi)搜索頁面產(chǎn)生的結(jié)果頁面往往是重復(fù)程度很高,或相似性很高,不太理解這個意思的朋友,我舉個例子:
比如淘寶網(wǎng)里有1000個電腦商品,然后搜索筆記本,或者搜索14寸筆記本,出來的結(jié)果差不多,這里僅僅是兩個關(guān)鍵詞在搜索,隨著產(chǎn)品數(shù)據(jù)變大,可以搜索出相似結(jié)果的關(guān)鍵詞也會越來越多,那么這些關(guān)鍵詞搜索產(chǎn)生的結(jié)果頁面,它們的相似性就極高,甚至有重復(fù)性,自然,百度是不喜歡這些頁面的。
上面講的只是一個不喜歡的概念,真正理解起來,從搜索引擎的原理上分析,我們會清楚地知道,互聯(lián)網(wǎng)上每天的更新是巨大的,但百度就一個,他派出來的“蜘蛛”抓取頁面和分析頁面時,都需要時間,而由于這些頁面要進(jìn)行數(shù)據(jù)庫的篩選,花費(fèi)的時間是分析其他頁面的幾倍,等“蜘蛛”有耐心分析完后,又發(fā)現(xiàn)這些站內(nèi)搜索產(chǎn)生的頁面有很高的相似性,所以容易想象,百度不會因?yàn)槟愕恼军c(diǎn)產(chǎn)生了很多這種頁面而覺得你的網(wǎng)站規(guī)模比較大,反之有負(fù)面的影響,因?yàn)槟憷速M(fèi)了它的時間,并且關(guān)鍵是這些頁面并未給你的站點(diǎn)帶來多少的豐富內(nèi)容。
那么既然如此,有沒有辦法處理這種情況呢?因?yàn)楫吘宫F(xiàn)在絕大多數(shù)網(wǎng)站都有這種站內(nèi)搜索的功能,自然也存在這種弊端了。
我看了很多國內(nèi)比較知名的SEO人士的文章和訪談,他們也有提起這種情況,但至今還沒有什么好的辦法可以解決。
根本原因如下所述:
如果用robots來直接引導(dǎo)蜘蛛不去抓取這些頁面,這一點(diǎn)上是可行的,但是我們要知道,來這些頁面之前,蜘蛛是延著我們的站內(nèi)結(jié)構(gòu)一步步過來的,等抓到這些頁面時,受到ROBOTS的影響,就好像我們斷了它的路,這是個比喻,實(shí)際情況下,站內(nèi)的權(quán)重需要傳遞,形成一個循環(huán),需要斷掉的話,讓權(quán)重有來無回,有點(diǎn)類似太空中的“黑洞”。因此不管你用robots還是用其他一些手段,可以讓蜘蛛不來抓取,但不能讓權(quán)重做到合理的傳遞。
綜上所述,站內(nèi)搜索目前還是SEO工作者盤中的一塊雞肋,至少在目前的搜索引擎算法中還不能得到完美的解決。
不過SEO的技術(shù)在不斷成熟,搜索引擎的算法也在日趨人性化,我們知道了本質(zhì)的原理,雖然目前沒有辦法解決,但不代表無法解決。
我們一方面期待搜索引擎本身能協(xié)調(diào)這個問題,另一方面,我們也探索SEO的合理解決方法。
【尊重原創(chuàng),分享觀點(diǎn)。來自芝麻開門網(wǎng)絡(luò)科技原創(chuàng)文章