今天就跟大家聊聊有關Google優(yōu)化蜘蛛爬取和索引的技巧有哪些,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
由于google掌控者搜索市場的大部分的份額,所以應時時關注和聽取它的一些動態(tài)。“Google發(fā)表了一篇叫做優(yōu)化蜘蛛爬取和索引的技巧”,是不是該引起我們的注意呢?
文中內(nèi)容高度強調(diào)可以提高你站點爬取的能力的一些技巧,下面是陳列的關于URL的具體的例子。
“互聯(lián)網(wǎng)是個大世界,時時刻刻都有新的內(nèi)容被發(fā)表,創(chuàng)造,”Google 分析師Susan Moskwa說到。“Google 擁有無限的資源,所以當它面臨幾乎無限的在線的可利用的資源時,google的蜘蛛只有能力去找尋和爬取一部分的內(nèi)容,而面對已經(jīng)爬取了的內(nèi)容,我們又只能索引一部分。”
Moskwa說:“URL就像一座連接你站點和搜索引擎蜘蛛之間的橋梁,蜘蛛需要能夠找到并通過這座橋梁(IE,找到并爬取你的URL)到達你的網(wǎng)站內(nèi)容頁,如果你的URL地址過于復雜或是太冗余,蜘蛛就要花費很多時間去跟蹤并反跟蹤自己爬取的腳印,如果URL地址被很好的組織著,并直接指向相關區(qū)域的內(nèi)容,這樣就不會爬取到空白或是重復的內(nèi)容頁了。”
如果你想被Google更好的索引,你必須刪除URL地址中用戶具體信息。具體情況可瀏覽幻燈片。基本上URL的參數(shù)時不會改變網(wǎng)頁的內(nèi)容,所以這些參數(shù)應該要刪除或是放入cookie中。這樣就會減少很多URL指向同一個內(nèi)容的數(shù)量,加快檢索。(這里應該指的就是盡量使用靜態(tài)地址,少產(chǎn)生一些用戶自帶的參數(shù)的重復URL)
Google說漫無目的的無限的空間和廣度其實很浪費時間,所以對于那些是地址的不管是過去的還是將來的url地址,好有一個時間標志。例如example/2009/08//11/title
告訴Google那些網(wǎng)頁可以忽略它不需要爬取。包括一些登陸的頁面,聯(lián)系方式,購物車和其他的頁面,類似于要求用戶去執(zhí)行的行為,蜘蛛是無法識別操作的。可以通過使用robots.txt文件來實現(xiàn)。
最后,盡可能避免重復的內(nèi)容。Google希望每一個內(nèi)容頁面都對應一個的地址。當然他們不可能全部的識別出來,因此會有一些典型鏈接因素存在讓你去鑒別哪些特定內(nèi)容網(wǎng)頁的URL更被人們喜愛。
看完上述內(nèi)容,你們對Google優(yōu)化蜘蛛爬取和索引的技巧有哪些有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。
本文題目:Google優(yōu)化蜘蛛爬取和索引的技巧有哪些-創(chuàng)新互聯(lián)
文章網(wǎng)址:http://www.2m8n56k.cn/article45/ccidei.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、域名注冊、網(wǎng)站導航、移動網(wǎng)站建設、全網(wǎng)營銷推廣、網(wǎng)頁設計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:[email protected]。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容