<var id="fe6gj"></var>

<rp id="fe6gj"><nav id="fe6gj"></nav></rp>

<noframes id="fe6gj"><cite id="fe6gj"></cite>

<ins id="fe6gj"><button id="fe6gj"><p id="fe6gj"></p></button></ins>

<tt id="fe6gj"><i id="fe6gj"><sub id="fe6gj"></sub></i></tt>

始創于2000年股票代碼：831685

咨詢熱線：0371-60135900 注冊有禮登錄

掛牌上市企業
60秒人工響應
99.99%連通率
7*24h人工
故障100倍補償

全部產品

您的位置：網站首頁 > 幫助中心>文章內容

文章內容

搜索引擎的兩種基本抓取策略

發布時間: 2012/9/11 11:18:12

大家好，這里是雅安seo優化博客。今天我們來說說搜索引擎的收錄過程中所采取的收錄抓取策略。

　　蜘蛛在完成對robots.txt文件的訪問之后便會開始對所進入的頁面進行判斷是否符合收錄標準，如果符合，那么提取其內容和鏈接。這個頁面抓取完成之后，還沒完，蜘蛛還會順著所提取的鏈接探索下去，從這個鏈接爬到下一個頁面，又從下一個頁面上的鏈接爬到再下一個頁面......

　　由于互聯網上的頁面鏈接結構異常復雜，蜘蛛需要采用一定的策略才能爬行到網上的所有頁面。最簡單的搜索引擎抓取策略有兩種：

　　1、深度優先策略

　　

　　如上圖，簡單點來說就是沿著一條路線垂直深入的爬行下去，直到完成任務。

　　2、廣度優先策略

　　

　　如上圖，簡單說就是先把指定的一個頁面上的所有鏈接爬行一遍，然后再從每條鏈接深入同樣平行地進行爬行。

　　在實際中，這兩種策略是同時發生的，理論上只要給予足夠的時間，搜索引擎蜘蛛就可以爬完所有的頁面。但是蜘蛛的帶寬資源、時間并不是無限的，所以蜘蛛只能爬行一定的時間，權重越高的網站自然爬行的時間越長。

　　搜索蜘蛛的目的就是探索到有價值的頁面并收錄，這就是為什么權重高的站爬行時間長，抓取度深的原因。所以我們建議新站的網站鏈接層次不要過深，免得蜘蛛在短時間內爬行不到。

在收索引擎蜘蛛爬行完畢之后，便會把搜集到的網頁數據交給數據分析系統，整個收錄過程便結束了。好了，今天的seo基礎就到這里。
本文出自：億恩科技【www.endtimedelusion.com】

服務器租用/服務器托管中國五強！虛擬主機域名注冊頂級提供商！15年品質保障！--億恩科技[ENKJ.COM]

上一篇 >> 淺談新浪微博與騰訊微博的各自屬性
下一篇 >> 怎樣撰寫好的網站標題和描述

同類文章

您可能在找

服務器托管/租用

億恩云建站

億恩北京公司：

經營性ICP/ISP證：京B2-20150015

億恩鄭州公司：

經營性ICP/ISP/IDC證：豫B1.B2-20060070

億恩南昌公司：

經營性ICP/ISP證：贛B2-20080012

服務器/云主機 24小時售后服務電話：0371-60135900

虛擬主機/智能建站 24小時售后服務電話：0371-60135900

專注服務器托管17年

掃掃關注-微信公眾號

0371-60135900

Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技版權所有　地址：鄭州市高新區翠竹街1號總部企業基地億恩大廈　法律顧問：河南亞太人律師事務所郝建鋒、杜慧月律師

京公網安備41019702002023號

億恩公告

在線客服

服務器托管
服務器租用
云服務器
域名/空間
云建站

0371-60135900
7*24小時客服服務熱線

av不卡不卡在线观看_最近2018年中文字幕_亚洲欧美一区二区三区_一级A爱做片免费观看国产_日韩在线中文天天更新_伊人中文无码在线