常用抓取返回码有哪些?常用抓取返回码总结

发布时间:2023-09-22 点击:96
常用抓取返回码有哪些?相信很多人都会有这样的疑问,下面西部数码网为您详解一下常用抓取返回码总结。
1) 最常见的404代表“not found”,认为网页已经失效,通常将在库中删除,同时短期内如果spider再次发现这条url也不会抓取;
2) 503代表“service unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。
3) 403代表“forbidden”,认为网页目前禁止访问。如果是新url,spider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。
4)301 代表是“moved permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们推荐使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。
以上就是对常用抓取返回码有哪些?常用抓取返回码总结的全部介绍,如果您想了解更多seo,请关注西部数码网。


代理平台底部修改-其他问题
租gpu云服务器哪里最便宜
云服务器适合办公吗
xin是什么域名?xin域名个人能用吗?
大理服务器云存储价格
网站虚拟主机多少合适
怎么放在你们服务器上的网站有些电脑可以打开
一分钟了解Html中CSS的三种链接方式