百度是國內(nèi)網(wǎng)站進(jìn)行SEO優(yōu)化的主要目標(biāo),因此各種對(duì)于百度搜索引擎算法的猜測(cè)研究就比較多,這里阿俊網(wǎng)絡(luò)分享一些百度官方給出的關(guān)于百度在搜索規(guī)則上的一些說明。固然不可能涉及到搜索算法的核心本質(zhì),但是對(duì)于那些不知真假的小道消息來講已經(jīng)算得上彌足珍貴了。
1、百度蜘蛛抓取網(wǎng)頁時(shí),為什么會(huì)在URL上加上類似這樣的pvt=2&ent=ynent0404的一些字符?
答:這些參數(shù)并非百度增加的。百度搜索引擎的spider會(huì)在浩瀚的互聯(lián)網(wǎng)上尋找、抓取鏈接,一些網(wǎng)站會(huì)在顯示URL的時(shí)候,會(huì)自動(dòng)地在URL后面增加一些參數(shù),因而造成這種現(xiàn)象??梢钥隙ㄟ@種現(xiàn)象不會(huì)對(duì)網(wǎng)站頁面的抓取的造成負(fù)面妨礙,但我們會(huì)保持關(guān)注,并在適當(dāng)?shù)臅r(shí)機(jī)改進(jìn)。
2、為什么百度蜘蛛天天爬行很多次、爬行很多頁面,而收錄的網(wǎng)頁只有一兩個(gè)?
答:百度中網(wǎng)頁的抓取和建立索引是不差未幾的。這些抓取網(wǎng)頁會(huì)經(jīng)過一些必要的檢查過程之后才會(huì)被建立到索引中(即被收錄)。
3、百度如何判定克隆站,我的網(wǎng)站被克隆了怎么辦?
答:百度有專門的算法識(shí)別克隆網(wǎng)站。建議通過百度消息或者通過反饋中心發(fā)送一下具體的網(wǎng)址,這樣可以更好的分析,為相關(guān)的算法升級(jí)積累數(shù)據(jù)。
也有可能是有人講將別的域名直接指向到你的服務(wù)器上,這樣的話,可以直接在服務(wù)器端拒盡所有非自己所有域名的訪問。
4、被降權(quán)的網(wǎng)站要多長時(shí)間才能恢復(fù)?
答:百度對(duì)待降權(quán)網(wǎng)站有自動(dòng)檢測(cè)和開釋機(jī)制,但在中間會(huì)有一個(gè)觀察期。若在觀察期內(nèi)未發(fā)現(xiàn)網(wǎng)站有異常的變化,就會(huì)以正常情況對(duì)待。此外,百度現(xiàn)在對(duì)于網(wǎng)站作弊的懲罰機(jī)制越來越趨于公道化,而不會(huì)是簡(jiǎn)單的一棍子打死。
5、百度快照不出現(xiàn)標(biāo)題和描述是怎么回事?
答:可能是網(wǎng)站的robots禁止了百度的抓取,而后來robots解除禁止抓取狀態(tài),對(duì)于百度來講,需求一段時(shí)間進(jìn)行生效。
6、假如在robots.txt中設(shè)置了禁止百度收錄網(wǎng)站的內(nèi)容,為什么還會(huì)出現(xiàn)在百度搜索結(jié)果中?
答:假如其他網(wǎng)站鏈接到了你在robots.txt文件中設(shè)置的禁止收錄的網(wǎng)頁,那么這些網(wǎng)頁仍然可能會(huì)出現(xiàn)在百度的搜索結(jié)果中。
但你的網(wǎng)頁上的內(nèi)容不會(huì)被抓取、加入索引和顯示,百度搜索結(jié)果中展示的僅是其他網(wǎng)站對(duì)您相關(guān)網(wǎng)頁的描述。
7、網(wǎng)站修改robots之后多久生效?
答:不差未幾的站點(diǎn)會(huì)有不差未幾,但通常在幾天內(nèi)逐步生效。但也有發(fā)現(xiàn)過很久不生效的意外情況,可以在這里或者通過進(jìn)行。
8、百度抓取頁面大小有限制嗎,頁面內(nèi)容過多會(huì)不會(huì)被截取部分?
答:頁面大小和搜索引擎的抓取之間沒有直接關(guān)系。但百度建議網(wǎng)頁(包括代碼在內(nèi))不要過大,過大的網(wǎng)頁可能會(huì)抓取截?cái)?而內(nèi)容部分,也不要過大,過大會(huì)被索引截?cái)?。?dāng)然,抓取截?cái)嗟纳舷?,?huì)遠(yuǎn)大于索引截?cái)嗟纳舷蕖?/div>
9、網(wǎng)站遭到惡意群發(fā)攻擊導(dǎo)致被降權(quán)怎么辦好?
答:百度有很完善的識(shí)別算法,這類行為并不會(huì)導(dǎo)致網(wǎng)站受到妨礙。
假如Baiduspider抓取不到你的網(wǎng)站,對(duì)百度來講,你的網(wǎng)站是無法訪問的,建議分析一下網(wǎng)站的訪問日志,看看是否最近Baiduspider的抓取變少了,找到Baiduspider抓取忽然變少的時(shí)間點(diǎn),查看網(wǎng)站或者服務(wù)器是否修改了什么配置,導(dǎo)致spider無法訪問網(wǎng)站。