您所在的位置: 首頁?>?千搜學(xué)院 > 網(wǎng)站優(yōu)化
全球互聯(lián)網(wǎng)網(wǎng)站2016年數(shù)量超過10億。這浩如煙海的網(wǎng)站及站內(nèi)內(nèi)容,搜索引擎(百度、谷歌、360等)不可能完全抓取收錄在自己的數(shù)據(jù)庫中。搜索引擎只會爬行抓取部分網(wǎng)站,在這部分網(wǎng)站中進行排名工作。搜索引擎放出的探索新舊網(wǎng)站的小程序,就是搜索引擎蜘蛛。在百度叫做Baiduspider,在谷歌叫做Google bot。
蜘蛛爬行是網(wǎng)站排名的頭一步
可以說,蜘蛛是我們網(wǎng)站獲得在搜索引擎排名的頭一步。只有我們的網(wǎng)站被蜘蛛爬行,才有可能進行下一步的收錄、索引、排名一系列步驟。不被蜘蛛爬行,不被收錄的網(wǎng)站,是無法參與搜索引擎的排名的。
吸引蜘蛛爬行方法:外鏈
搜索引擎蜘蛛順著互聯(lián)網(wǎng)上的各種鏈接(錨文本鏈接、文本鏈接、URL超級鏈接),爬行在各種鏈接組成的互聯(lián)網(wǎng)網(wǎng)狀結(jié)構(gòu)中,像自然界的蜘蛛爬行在網(wǎng)中。這也是蜘蛛名字的由來。
聰明的同學(xué)到這可能就清楚我們網(wǎng)站頭一個蜘蛛是怎么來的了:通過已經(jīng)被百度抓取的網(wǎng)站上的鏈接,爬行到我們網(wǎng)站上。也就是說,我們網(wǎng)站首先需要給我們網(wǎng)站做一個蜘蛛爬行的入口路徑。
通常來說,擁有互聯(lián)網(wǎng)中樞地位的目錄型網(wǎng)站,是很好的外鏈發(fā)布入口。搜索引擎蜘蛛對于鏈接中樞的目錄型網(wǎng)站爬行的頻率很高,可以及時發(fā)現(xiàn)我們發(fā)布的鏈接。像百度自身的網(wǎng)址提交路徑,360網(wǎng)址提交,hao123,dmoz目錄等。
權(quán)重較高的網(wǎng)站、新浪等大型網(wǎng)站、行業(yè)相關(guān)論壇、行業(yè)相關(guān)博客、行業(yè)相關(guān)其他站點,只要搜索引擎蜘蛛爬行抓取,都是我們前期提交網(wǎng)站網(wǎng)址的好平臺,都會吸引蜘蛛到我們網(wǎng)站上來。
蜘蛛抓取策略:原創(chuàng)性
搜索引擎希望顯示給用戶不同的搜索結(jié)果,重復(fù)性內(nèi)容影響用戶體驗,搜索引擎對原創(chuàng)性高的網(wǎng)站更青睞。蜘蛛爬行時也會進行數(shù)據(jù)比對,如果是新站,同時里面都是互聯(lián)網(wǎng)上早已有的老生常談,蜘蛛會認為這是一個低質(zhì)站點,無需浪費太多時間在此類網(wǎng)站上。
蜘蛛抓取策略:更新頻率
搜索引擎蜘蛛每隔一段時間會訪問一次網(wǎng)站,如果兩次訪問時間中網(wǎng)站內(nèi)容沒有變化,蜘蛛會推遲下次到訪的時間。良好的網(wǎng)站更新頻率,會不斷吸引蜘蛛訪問,從而使網(wǎng)站站內(nèi)更多內(nèi)容被搜索引擎抓取收錄。
相關(guān)熱搜詞:SE工作原理