網(wǎng)站內(nèi)頁(yè)不被收錄原因分析
廣告:
網(wǎng)頁(yè)內(nèi)容太少
經(jīng)驗(yàn)總經(jīng)出對(duì)于文章內(nèi)容太少的頁(yè)面,百度會(huì)放棄收錄。
網(wǎng)頁(yè)內(nèi)容質(zhì)量問(wèn)題
我們都知道,搜索引擎蜘蛛喜歡的是新鮮的,豐富的網(wǎng)頁(yè)內(nèi)容,而如果我們的網(wǎng)站內(nèi)容基本上都是從別的網(wǎng)站轉(zhuǎn)載
過(guò)來(lái)的,甚至是采集過(guò)來(lái)的,那么網(wǎng)頁(yè)不被收錄也是情有可原的。互聯(lián)網(wǎng)上存在的無(wú)窮無(wú)盡的網(wǎng)頁(yè),而且還在以龐大的基數(shù)擴(kuò)張,搜索引擎想要返回給用戶好感興趣的,真正需要的信息,就必須保持索引庫(kù)中的網(wǎng)頁(yè)盡量有意義,收錄重復(fù)頁(yè)面只會(huì)讓搜索引擎的索引庫(kù)增多而并不能提高檢索精確率。同時(shí),就像我在第二點(diǎn)中提到那樣,搜索引擎排斥違法的,不良信息類型的站點(diǎn),我們不應(yīng)該把這些內(nèi)容填充到網(wǎng)站上去。
同ip站點(diǎn)連帶因素
查詢同ip下的網(wǎng)站,觀察這些網(wǎng)站是否有存在類似si 服,xx,賭博這類搜索引擎排斥的網(wǎng)站,這些網(wǎng)站的近期收
錄情況以及權(quán)重的初步判斷。如果發(fā)現(xiàn)這些網(wǎng)站也存在類似的問(wèn)題,那么說(shuō)明百度已經(jīng)對(duì)這個(gè)服務(wù)器 ip 不信任,并采
取了遏制的措施,應(yīng)該準(zhǔn)備轉(zhuǎn)移網(wǎng)站到另外一個(gè)服務(wù)器或者空間上了。
robots文件和meta robots限制
查看我們網(wǎng)站根目錄下的 robots 文件,是否限制了百度蜘蛛的索引,如果 robots 文件并不存在問(wèn)題的話,也不
要忘記觀察網(wǎng)頁(yè)上的meta robots 屬性。尤其是啟用了seo 插件的wordpress 站點(diǎn),比如說(shuō)all in one seo 這個(gè)插件
的設(shè)置選項(xiàng)里面,就有noindex category 的選項(xiàng),如果開啟了這個(gè)選項(xiàng),那么蜘蛛爬行到博客分類頁(yè)面的時(shí)候,就會(huì)
follow 頁(yè)面上的鏈接,但是并不索引分類頁(yè)面。'
域名的歷史因素
判斷下我們的網(wǎng)站域名在過(guò)去是否有人使用過(guò),這個(gè)可以通過(guò)查詢網(wǎng)站的反鏈接,通過(guò)domain 指令判斷是否存在
記錄以及通過(guò) http://www.remenweb.com/ 這個(gè)網(wǎng)站判斷之前的域名歷史情況。更為詳細(xì)的可以查看"判斷域名是否被K過(guò)的三個(gè)方法總結(jié)"
導(dǎo)出鏈接
觀察我們網(wǎng)站的導(dǎo)出鏈接是否有死鏈接,錯(cuò)誤鏈接,甚至有被百度K掉的網(wǎng)站鏈接,在搜索引擎排名機(jī)制中顯示,
當(dāng)我們的網(wǎng)站存在鏈接指向一個(gè)頁(yè)面的時(shí)候,默認(rèn)就相當(dāng)于對(duì)這個(gè)網(wǎng)頁(yè)投了贊成票,而如果我們對(duì)百度認(rèn)為的不良站點(diǎn)
使用我們的投票權(quán)利,那么被百度懲罰也是正常的。一般來(lái)說(shuō),內(nèi)頁(yè)的導(dǎo)出鏈接并不會(huì)對(duì)整站產(chǎn)生影響,所以當(dāng)我們?cè)?/p>
首頁(yè)中增加鏈接的時(shí)候,必須注意首頁(yè)指向的網(wǎng)頁(yè)是被百度所認(rèn)可的,如果是權(quán)威性的頁(yè)面就更好了。
蜘蛛”陷阱“
蜘蛛抓取頁(yè)面是基于鏈接的,如果我們的網(wǎng)站里面存在一些阻止蜘蛛爬行的代碼或者是鏈接中帶有過(guò)多容易讓蜘蛛
迷失的參數(shù)的時(shí)候,蜘蛛無(wú)法繼續(xù)通過(guò)鏈接抓取頁(yè)面,自然也就無(wú)法收錄內(nèi)頁(yè)。最典型的比如說(shuō),flash類型的網(wǎng)站,
鏈接通過(guò)js腳本調(diào)用的網(wǎng)站,或者是嵌套過(guò)多表格的網(wǎng)站。
優(yōu)化過(guò)度
優(yōu)化過(guò)度這點(diǎn)可能很多人會(huì)忽略掉,百度對(duì) SEO 的態(tài)度雖然說(shuō)有一定的改變,但是對(duì)那些處理過(guò)度的,明顯表示截取搜索流量的網(wǎng)站進(jìn)行審核和降權(quán)的態(tài)度肯定是不會(huì)改變的。在上篇網(wǎng)站標(biāo)題(title)書寫方法一文中提到的不要在網(wǎng)站標(biāo)題中堆砌關(guān)鍵詞也是出于同樣的考慮。
總結(jié)了以上幾點(diǎn),我們應(yīng)該根據(jù)網(wǎng)站分析情況結(jié)合log 日志數(shù)據(jù),對(duì)網(wǎng)站進(jìn)行相應(yīng)的處理,相信一段時(shí)間之后,就
能夠解決百度不收錄內(nèi)頁(yè)這種情況,大量提高網(wǎng)站的收錄率。過(guò)幾天我會(huì)把SEO熱門網(wǎng)的評(píng)測(cè)分析和操作結(jié)果做一個(gè)記
錄分享出來(lái)。雖然我現(xiàn)在并沒有對(duì)SEO熱門網(wǎng)的收錄和反向鏈接數(shù)量做一個(gè)詳細(xì)的記錄,但每天還是會(huì)去通過(guò) site 指
令觀察網(wǎng)站的收錄情況,我發(fā)現(xiàn)這段時(shí)間博客的百度收錄并沒有提高,最近更新的內(nèi)頁(yè)都沒有收錄,甚至刪除了對(duì)分類
頁(yè)面的索引。百度了下“百度不收錄內(nèi)頁(yè)”,發(fā)現(xiàn)也有很多朋友在網(wǎng)站優(yōu)化的過(guò)程中也遇到了類似的問(wèn)題,所以我就把
網(wǎng)絡(luò)上現(xiàn)存的資料結(jié)合我的一些想法來(lái)分析下引起百度不收錄內(nèi)頁(yè)這種現(xiàn)象的原因。
廣告: