建站知识
|
建站知识百度VIP大讲堂QA:抓取、建库、解析问:为什么收录量像坐过山车一样的,还有为什么有些网页今天在明天就没了? 答:百度会周期建库,且每个库的收录量是恒定的,你老是有新增,肯定会再从库里淘汰一些,反正总是保持那个库是满的。在建库的过程中,你会感觉有波动。具体的怎么筛,哪个页面会留下哪个页面会淘汰,这个策略是有很多的,他随着时间的变化,收录的标准策略也是在发生微调。 问:我们站点使用CDN加速会不会比较容易造成蜘蛛无法抓取?因为有时候修改掉他绑定的什么东西。 答:如果要修改掉一定要通知到上一级,现在不存在这个问题,现在你如果修改掉也可以解析掉,之前可能会存在这个问题。 问:你们百度自己也有一个CDN加速,对抓录排名有没有影响? 答:在使用CDN加速这个问题上,我们对所有站点一视同仁。但我建议你使用技术能力强的CDN服务商,保证站点的稳定和速度,百度会更喜欢。 问:刚才您说IP上的站点数不能太多,那CDN这种情况怎么办? 答:CDN的情况另说,如果我们识别出来是CDN的话不会受站点数量的影响,如果你是提供独立IP的话会有这样一些问题。 问:还是IP上站点数量的问题,如果是主域跟二级域名呢?也受数量限制? 答:我说的是独立域名。当然质量比较好的二级域名也可以认为是独立域名。 问:多个域名,他有相同的一些内容,怎么建库? 答:如果是多域名在同一个主域下面有相同内容的话,不可能所有都建库,而且被建库的那个可能不是你希望的那个,所以尽量不要有相同的内容。 问:刚才讲的IP如果是多域名的话,好几百个IP域名,现在我们也用了CDN,按照刚才的说法,单个IP最多抓多少?1000万是说对站点还是对IP? 录入时间:2014/12/16 Hits:9766 |