做网站运维最糟心的事,莫过于网站被黑后好不容易清理干净,百度却迟迟不更新收录。明明所有恶意代码、黑页内容都删干净了,搜出来的快照还是显示赌博、色情等违规信息,访客一点开就以为网站还在被黑,直接流失大量客户,连正常的排名和流量也跟着掉。这种情况真的太常见了,我们武荣网络每个月都能接到十几个这样的求助。
很多站长以为删了被黑内容就万事大吉,等着百度自动更新就行。但实际上,百度的收录和快照机制,加上被黑后触发的风控审核,导致页面更新往往会滞后很久,少则一周,多则一两个月都恢复不了。今天就结合我们的实操经验,讲清楚为什么清理后收录不更新,以及怎么快速解决这个问题。
为什么删了被黑内容,收录还是不更新?
首先要明白,百度的快照不是实时更新的,尤其是被黑过的站点,会进入特殊的风控观察期,更新速度会比正常站点慢很多。
最主要的原因是百度的缓存机制。百度爬虫抓取页面后,会将页面内容存储在自己的服务器上,形成快照。即使原页面内容修改了,百度服务器上的缓存也不会立刻删除,需要等待下一次爬虫抓取并验证内容正常后,才会更新快照。正常站点的快照更新周期是7-15天,被黑过的站点会延长到30天以上。
其次是残留的恶意痕迹没有清理干净。很多站长只删了表面的黑页和明显的木马,却忽略了隐藏的后门、被篡改的JS代码、被植入的暗链。这些残留的恶意代码会被百度爬虫再次检测到,判定网站仍存在安全问题,直接暂停页面更新,甚至延长风控期。
还有一个容易被忽略的点是页面权重被降权。网站被黑后,百度会暂时降低站点的信任度和权重,爬虫的抓取频率会大幅下降。原本每天都会来的爬虫,可能变成一周甚至半个月才来一次,自然也就没法及时发现页面内容的变化。
最后是搜索引擎的风控审核机制。凡是出现过违规内容的站点,都会被百度标记为“高风险站点”。后续的所有内容更新,都会经过更严格的人工审核和算法复核,只有确认网站已经彻底安全、没有再出现违规内容后,才会恢复正常的收录和快照更新。
快速恢复收录和快照的6个步骤
如果你的网站也遇到了清理被黑内容后收录不更新的问题,按照下面的步骤一步步操作,能大幅缩短恢复周期。
第一步:彻底排查,确保没有残留恶意代码
这是最基础也是最关键的一步,只要还有一点残留,所有后续操作都是白费。
用D盾、安全狗等专业工具全盘扫描服务器,查杀所有木马、后门和病毒;
对比网站源码的备份文件,找出所有被修改过的文件,尤其是js、php、html等动态文件;
检查网站的后台权限、数据库权限,删除所有陌生的管理员账号,修改所有密码;
排查网站的外链和内链,删除所有被植入的暗链和恶意跳转代码。
第二步:在百度搜索资源平台提交快照更新
确认网站彻底安全后,主动向百度提交快照更新申请,提醒爬虫重新抓取页面。
登录百度搜索资源平台,进入“站点管理-快照更新”;
输入需要更新的页面URL,提交申请;
注意:同一个页面24小时内只能提交一次,不要频繁提交,否则会被判定为异常操作,反而延长更新时间。
第三步:提交整改说明,申请解除风控
对于被标记为高风险的站点,单纯提交快照是不够的,需要主动向百度说明整改情况。
在搜索资源平台的“反馈中心”提交反馈,详细说明网站被黑的时间、清理的过程、采取的安全加固措施;
附上清理前后的页面截图、服务器安全扫描报告,证明网站已经彻底安全;
态度诚恳,说明后续会加强安全防护,避免再次被黑。一般1-3个工作日就会收到百度的回复。
第四步:更新原创内容,提升爬虫抓取频率
被黑后站点的爬虫抓取频率会很低,需要通过持续更新优质原创内容,吸引爬虫重新来访。
每天更新1-2篇高质量的原创文章,围绕网站的核心主题,内容要有实际价值;
给新文章加上指向首页和核心页面的内链,引导爬虫抓取整个站点;
不要更新低质量的采集内容,否则会进一步降低百度的信任度。
第五步:提交死链,清理残留的被黑页面索引
很多被黑生成的页面,即使已经被删除,百度的索引库中还会保留记录,用户搜索时仍然会显示。
收集所有被黑生成的页面URL,制作成死链文件;
在搜索资源平台的“死链提交”模块上传死链文件,申请百度删除这些无效索引;
同时设置404页面,引导用户和爬虫访问正常的页面。
第六步:做好安全加固,防止再次被黑
恢复收录后,一定要做好安全防护,避免再次被黑,否则之前的努力全部白费,而且第二次被黑的处罚会更严重。
开启服务器防火墙和入侵检测系统,实时监控异常访问;
定期备份网站数据和数据库,最好做到异地备份;
及时更新网站程序、插件和服务器系统,打上所有安全补丁;
关闭不必要的端口和服务,限制后台登录IP。
这些误区一定要避开
很多站长着急恢复收录,会走一些弯路,反而适得其反:
不要频繁提交快照更新,一天提交好几次,只会让百度觉得你在刷流量;
不要修改网站的TDK和核心结构,被黑后站点本身就不稳定,频繁修改会延长风控期;
不要刷流量、刷外链,这些违规操作会被百度检测到,直接导致站点被降权甚至K站;
不要抱有侥幸心理,觉得删了表面内容就行,残留的后门迟早会再次被黑客利用。
最后说一句,网站被黑后收录不更新是正常现象,不用过于焦虑。只要彻底清理了恶意代码,做好安全加固,按照正确的步骤提交申请和更新内容,一般2-4周就能恢复正常的收录和快照。
安全永远是第一位的,平时多花点时间做好基础防护,比被黑后花几倍的精力去补救要划算得多。如果你的网站被黑后长时间恢复不了,也可以按照上面的步骤逐一排查,绝大多数情况都能自己解决。
下一篇:没有了!