从事UGC原创内容相关工作一年多时间,百度仅仅收录三个页面,然而谷歌却收录了四千多个页面,这样巨大的反差着实令人头疼不已。先别急着怪罪百度,问题极有可能出在你对于“原创”以及“收录”的理解层面上。
你以为的原创可能只是伪原创
很多站长用以判断原创的标准是“在百度搜不出来句子”,然而这个标准实际上极为不可靠。虽然百度有可能仅仅是对某些内容的展示加以了限制,可这并不意味着它没有抓取到。就拿悟空问答的内容来说,当在百度进行搜索时,或许它未凸显红色,但是通过后台查询能够发觉,页面其实早就已经被收录了。
只要换一个搜索引擎,便能搜到数量众多的相似内容,而这恰恰暴露了问题的本质,你的UGC内容,虽说在百度看来是新出现的面孔,然而在整个互联网范围之内,或许已然是陈旧过时的事物,百度所拥有的数据库,实际上比你所想象的要庞大许多。
百度蜘蛛的爬取和收录是两码事
完成百度API以及站长资源平台的提交操作之后呀,你重点着重应倾心留意在意关注的并非是“提交了多少数量”,而是每一天每日的“爬取频率的状况情形”以及确切切当具体究竟抓取了哪一些哪类页面。蜘蛛前来降临赴约并不意味着表示它就会拿走带走你的内容,它同样也还在进行判断评判内容的好坏程度。
要是蜘蛛每日都前来,然而仅抓取首页或者若干老页面,那就表明它对站内其余内容没兴趣。在这个时候你得反思,是不是那些UGC内容的质量的确存有问题,又或者页面结构致使蜘蛛难以深入抓取。
内容质量影响的不只是用户体验
诸多指标,诸如原创度、完整性、文字流畅度以及主题相关性等一众方面,是百度算法所考量的,你觉得内容优质,然而百度算法或许并非如此判定,内容质量低这一状况乃是致使不被收录的极为常见的缘由。
诸多被称作UGC原创的内容,实际上仅仅是用户将其他地方的文章拿来,对标题以及三五个词语做了修改。这样的行为能够欺骗那些普通用户,然而却欺骗不了搜索引擎的算法。百度所需要的是对于用户而言真正具备价值的内容,并非是换了个形式的旧有模样。
站点质量同样决定收录上限
即便那内容还算可以,要是站点整体质量处于较低水平,百度也会予以谨慎地对待。站点质量涵盖着域名年龄、网站结构、加载速度、是否有大量垃圾页面等好些个维度。倘若一个新的站点突然间涌进了大量质量高低不一的UGC内容,那是很容易被判定成为低质量站点的。
蜘蛛进入库记录的时间都是有的,你在反馈之时所说的“网站运营时间很长”根本无法骗过百度,他们在后台查看数据时清楚明白,什么时候开始有蜘蛛进行访问,什么时候内容进入库中,都是明确清晰的,与其思考着怎样去忽悠,不如如实地说明实际情况。
针对现状的优化建议
竭尽所能地去输出切实属于原创性质的相关内容,或者是在原本的段落基础之上展开深度层面的修改调整,始终维持核心表意不发生改变不过促使文字的表述形式全然有所不同。这一要求需要用户切实地领会主题而后运用自身的语言进行重新的架构组织情况,并非仅仅是简单层面的同义词之间的替换行为。
要是发觉内容确实相当出彩但长时间未被收录,能够在百度站长平台反馈之际带上确切链接,如实地阐述站点情形,标明内容属原创。百度那里会有专门的人员去查看,要是情形相符,或许会获得人工介入的时机。
长期不收录该如何应对
不能够仅仅只是一味地把目光紧紧锁定在百度之上,鉴于当下谷歌的收录情况呈现出正常的态势,这也就表明了你所提供的内容在国际化的视野范围之内是能够获得认可的。你可以首先采取相应措施工稳住来自谷歌方面的流量,与此同时,还要针对百度开展有针对性的优化工作。毕竟这两个搜索引擎在算法逻辑层面确实是存在着差异的。
多多留意百度站长平台社区的情形变化,去瞧瞧其他人碰到类似问题时是怎样予以解决的。还能够关注官方博客所更新的SEO技术问答,好多关于收录问题的答案在其中有着详尽阐释。搜索引擎的规则处于变动之中,你所采取的应对方式也需要随之进行改变。
你可曾去查询过自身站点的百度抓取频次,以及抓取页面的明细情况呢?这些数据常常能够直接向你表明问题究竟出在了哪里呀。


还没有评论,来说两句吧...