簡析動態(tài)頁面會對SEO產(chǎn)生什么影響?
設(shè)計爬蟲時,通常都回避動態(tài)網(wǎng)頁(如Charkabarti,Joshi,Punera,&Pennock,2002)。識別動態(tài)網(wǎng)頁時,只要看URL中是否出現(xiàn)問號,含問號的就是動態(tài)網(wǎng)頁。忽略動態(tài)網(wǎng)頁是因?yàn)樗鼈內(nèi)菀自斐芍┲胂葳濉V┲胂葳謇碚撋鲜且粋€無限的網(wǎng)頁集合,而蜘蛛不能完整地遍歷這個集合。在線日歷就是一個容易被忽略的蜘蛛陷阱,它生成的動態(tài)網(wǎng)頁中可以標(biāo)上日期,并包含指向后1天網(wǎng)頁的鏈接。一個爬蟲從這個日歷中找到一個網(wǎng)頁后,便會無止境地請求后1天的網(wǎng)頁。
動態(tài)的頁面(url)屬于蜘蛛陷阱,搜索引擎蜘蛛一旦爬行進(jìn)入,很有可能會出不來、或是不好流暢的抓取,所以建議網(wǎng)頁是靜態(tài)或是經(jīng)過偽靜態(tài)處理的。
轉(zhuǎn)載請注明出處:
http://m.555978.cn/