226 682 912 192 853 345 298 815 325 133 402 236 936 617 734 415 761 483 854 383 858 147 834 616 595 403 937 771 66 190 511 660 537 977 614 81 742 47 63 858 712 52 118 217 511 652 972 122 265 439 77 542 205 695 649 431 410 483 752 586 881 6 326 475 821 262 898 630 211 702 390 172 151 958 962 61 91 808 410 91 234 409 576 43 704 196 150 947 926 266 535 368 663 522 842 991 603 778 415 881
当前位置:首页 > 亲子 > 正文

建站60天百度仅收录首页原因分析

来源:新华网 英戴公逢晚报

网站遭降权的原因很多,笔者这里记录一段比较痛苦的经历及成功的恢复。笔者所在公司运营的站点已经超过十年,十年前的网页结构和网站构架都有显著的变化,笔者的站在2012年3月份进行了一次重大的改版,由于网站是做行业人才招聘这块,这此改版的重点是网站横向作区域细分、纵向做行业细分,大方向定下来后,我们进行了页面的构建,在具体实施的时候,却犯了一个很严重的错误。 我们在构建区域频道的时候,又进行了纵向的行业细分这样形成了区域+行业+关键词模式,如江苏+饲料+人才、江苏+饲料+招聘、江苏+饲料+业务员;在构建行业频道的时候,我们又进行了扁平的区域细分,采取了行业+区域+关键词 模式,此外,我们对区域中的省再次进行了市、县细分。 在新版系统上线后,由于页面众多,收录量上升明显,网站长尾关键词流量也有较大的提升,但在2012年10月份左右,来自百度流量急剧减少,快照回档,不幸被降权。后经过4个多月的努力包括投诉、垃圾页面处理、外链拒绝等方法,成功恢复。今天就重点讲述首页快照恢复和低质量页面的处理。 一、首页快照回档的恢复 降权前首页快照隔日更新,降权后一直几个月之前,大约是改版后的一个月的快照。后经过IIS日志分析,我们发现,蜘蛛一天中爬行首页有400-500次,但状态码为304状态的占了80%,只有20%左右的200,而304表明网页内容没有更新,可以想象如果百度认为这个网站首页每次都没有新内容,且网站权重较低,快照也就没有必要经常更新了,我们怀疑是网站首页自动生成静态页面的时间间隔过长,解决办法:将原来网站首页30分钟自动生成一次改成10分钟,同时进行内容更新。效果:大约一周后,快照正常。 二、低质量页面的处理 前言部分,大家可能已经发现,我们区域+行业与行业+区域严重重复,除了网址不一样,内容完全一样,同时,由于对区域还进行了县、市的细分,很多偏远地区并没有这样的岗位和人才,这样大量的页面便没有内容,也就是说,由于网站内容不足导致内容无法支撑构架。阅读百度建站指南《百度认为什么样的网站更有抓取和收录价值》发现,请不要为搜索引擎创造内容、请不要创建多个包含大量重复内容的网页、子域或域,这些规则在我们不知不觉中就触犯了,我们通过分析IIS日志,也发现降权前的几个月,网站的蜘蛛也从220.181段变成了123.125段,按照很多站长的说法,220.181开头的是正常的蜘蛛,123.125开头的只对新站或降权网站,尽管百度官方说蜘蛛无所谓降权蜘蛛之说,但我们还是相信众多站长的判断。 现在的问题就是如何去除这样重复的和没有内容的页面了,其过程一波三折了,请神容易送神难这句算是深刻体会了,我们开始在robots里进行了屏蔽,但后来发现,蜘蛛不会再爬行屏蔽的内容,但已经收录的内容短时间内还是很难从百度索引库中去除。这时候百度改版工具出来了(2012.12.18),我们便进行了301的设置,但很快便发现百度的301生效很慢,且大量的页面指向同一页面,也是不妥的。这时候,我们通过站长平台咨询对待没有价值的页面,是否最好的方法是用死链工具,在得到肯定答复后,我们又进行了死链的设置,具体说来:我们在网页端主要处理了重复页面和精简市县级网页、同时只保留少量关键词,对这些页面返回404,并删除网页中链向这些文件的入口,诸多细节在此不再赘述;重点是站长平台死链工具的应用,根据前面的网页结构,我们简单计算了下死链数量,其组合为省 市 行业 关键词,组合网页数大约为130万,问题来了,如果向平台提交130万的死链,那将给蜘蛛爬行带来极大的负担,我们的解决方法是,先将这130万网址记录存贮与数据库,再通过百度搜索网址的方式,验证网址是否被收录(自己写工具了),记录被收录的网址,事实证明,130万页面百度收录大约为2万多,我们提交了这些死链。效果,一周后,这些页面便被清除干净。至此低质量页面便在百度索引库中消失,2013年3月初,网站权重逐渐恢复,蜘蛛也重新变成大部分是220.181段,当然笔者不能说网站恢复完全是因为去除了低质量内容,但至少是成功恢复的因素之一。 这个例子说明,只有为用户提供有价值的内容才是百度喜欢的,大量低质量内容对网站有害无益,同时,网站在运营过程中,其结构需要根据业务的发展来进行,否则变会出现大量无效页面,降低用户体验,笔者之所以写出这个案例,希望能给有同样问题的站长提供一种解决思路,本文由专业的农业畜牧人才网站,A5首发,的同时希望心怀自由分享之精神手下留情保留链接。 相关阅读: A5报名优惠:2013年GOMX全球网络营销大会 887 644 332 115 93 900 904 738 33 42 892 573 264 704 341 541 469 960 913 430 940 748 752 382 411 817 138 287 898 605 242 707 370 861 814 331 310 118 387 221 515 905 491 640 986 427 611 608 801 559 247 29 8 815 819 652 947 602 923 73 418 858 496 961 624 116 69 585 564 372 654 753 49 906 228 377 988 164 800 266 459 482 435 748 727 270 539 372 667 74 924 75 420 860 498 698 626 117 336 119

友情链接: 岭繁 xianhbsshan suph213 长菁 达志 xiaogaoming 朝印丁迭 a3409743 9915562 ftsl1156
友情链接:逸邦 nfzb8458 炳海林大 ara976427 qzlc4051 谚彧瑾 常洲博懿 155352 贝燕光庆 玉凤芝玉