百度官方教你三步輕松解除百度蜘蛛封禁_揚州森禾網絡
經常有運營人員問,為什么我的網站或智能小程序資源的內容非常優質,但是沒有查詢到百度蜘蛛抓取記錄,或在百度搜索中沒有得到收錄和展現? 這有可能是部分網站或智能小程序存在封禁百度蜘蛛的情況,導致百度蜘蛛無法正常抓取,所以無法在百度搜索中正常收錄和展現。 常見的封禁行為包括robots封禁、封禁百度UA、封禁百度IP等。
如何驗證網站和智能小程序是否存在封禁百度蜘蛛的情況?
快來按照以下方法自查吧~
1、自查robots.txt文件 首先, 開發者們先查看robots.txt文件,是否存在封禁記錄。一般robots.txt文件放置在網站根目錄下~
【建議方案】如果存在robots封禁的情況,請開發者們及時修改或者刪除robots.txt文件。
2、自查是否封禁百度UA 如果開發者們自查robots.txt文件無異常,可以進一步排查是否存在封禁百度UA情況。
1 執行代碼進行自查 執行以下命令進行排查: curl--head--user-agent'Mozilla/5.0 (compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)'--request GET 'xxxxxxx' xxxxxxx為網站域名,如:http://www.abc.com 注意:如果站點正常,不存在封禁百度UA的情況,則其返回碼是200,如出現其他返回碼為異常。
2 變更瀏覽器進行UA驗證 通過觀察站點資源在其他瀏覽器是否得到正常的抓取和收錄,來判斷網站是否有封禁百度UA的情況。
【建議方案】查看網站反爬蟲策略,進行策略調整,解除百度UA封禁;或者針對百度UA添加策略白名單。
3、自查是否存在IP封禁 如果以上驗證均無異常,開發者們則可以排查是否存在IP封禁的情況。 常見的IP封禁,源自網站的防火墻系統配置,需要查看防火墻配置系統后臺,檢查是否存在百度蜘蛛的IP級別封禁措施。