最近在对之前运营的“爱情父母帮”进行改版,至于改版的原因,不久前发过一篇文章解释“爱情父母帮”相亲平台为什么停止运营。不过在改版和不断尝试的过程中,发现了一些让人一头雾水的情况,让我感觉到wordpress内容管理系统似乎比hexo静态博客系统或者其他内容管理系统更加容易被百度收录似的,而且是容易很多。下面我们来详细描绘一下这整个过程所产生的疑惑,供大家一起讨论参考。
一、尝试部署wordpress使用的时候
大概在9月20号的时候,之前的网站被彻底关停。当时我在想,是换成wordpress还是其他博客系统呢?由于不太喜欢PHP所以从未用过wordpress,这次决定试一试,毕竟网络上有那么多的网站都是用的wordpress来建站的。因此,我在我的云服务器上按照官方文档安装了PHP环境、wordpress最新版、mysql数据库、nginx等等,最终成功的跑起来了。然后我就可以正常通过lovebykin这个域名在浏览器中进行访问以及进入管理模块对网站进行各种设置了。
当时,我在设置wordpress布局的最初,就安装了一个免费的love-nature主题,主要还是因为这个主题免费、然后自带的插件比较丰富,并且号称有大概50W+的网站在用这个主题模板,所以虽然不太喜欢他的整个网站结构和布局,我还是选择了他,毕竟只是试一试嘛。其实,有一个很符合我想要建一个资讯站的主题模板,但是要钱还挺贵的,所以就放弃了。
此时网站还是一个空的love-nature主题的网站,并且我也没有配置任何的百度统计、主动推送之类的。我最先想到的还是自己动手撸一下他的模板,想要把他改成我想要的资讯站的样子。因此就这么一直鼓捣网站的页面样式了。
刚开始鼓捣不久,就发现PHP的服务容易崩溃,经过百度才知道,PHP的这个啥php-cgi服务在windows系统环境中运行时,最大只能接收500次请求,就会自动关闭。因此在linux系统环境中一直都有一个叫做php-fpm管理器的东西,有了它之后就可以很智能的管理好php-cgi的所有进程了。但是!!!php-fpm一直都没有windows版本的,这是很多年都没有解决的问题,所以在windows环境下,只有一些比较古老或者不完善的第三方插件,来对php-cgi进行管理,一般都是热心网友开发的吧,效果似乎一般般,还是容易挂掉。本着试试看的心态,我还是忍了,虽然心里有些疙瘩。
后面的几个小时,我一直在鼓捣wordpress的页面样式问题,时间如流水,一不小心就弄到了凌晨两点多。但是,整个网站的效果还是很原始,感觉样式编辑器不是很好用,给我的感觉就是:还不如我自己直接动手撸代码舒服!并且编辑器想要使用高级pro功能,就要花钱升级专业版了,不然真的很难用。总之鼓捣了几个小时,真的感觉wordpress处处都要花钱,不花钱就让人用得挺不顺心的,想实现完全白嫖感觉很难很难,而且整个cms系统都太笨重,反应速度也比较慢。
大概凌晨三点我就觉得不想继续下去了,冲动之下我就把云服务器上的PHP和wordpress文件夹全部删除了。也就是说,至此我的wordpress网站彻底没了,然后我就睡觉去了。
二、第二天开始尝试部署hexo博客
彻底放弃wordpress之后,我睡醒了就开始想要使用hexo博客系统来建一个纯静态的站点了。感觉hexo的优势还是挺大的,非常轻量化,不吃配置,不耗费资源,甚至不需要安装数据库,每次把所有内容生成html文件,然后用nginx去作为web服务器来指向hexo的public文件夹即可,效率很高。
当然,我也选择了使用最普遍最有名的next主题,在github上下载的7.X版本。将next主题安装到hexo系统之后,就开始调整next主题的各种配置,总的来说还是很方便的。但是个人还是觉得next主题不够个性化,不符合我的站的主题,因此作为一个程序猿,我又开始了魔改,当然这个魔改和优化一直持续了十多天。既然是魔改,说明改动还是非常大的,但是个人认为没有破坏原有的SEO优化。并且网站也比默认的next主题好看。
三、疑惑出现
大概就在我安装hexo博客的当天,也就是我删除wordpress的当天,我通过百度的site:www.lovebykin.com
指令,居然就看到wordpress的love-nature主题中自带的几个页面居然就被收录了!!!实在是神奇,被收录的几个页面比如about页、service页、主页(love-nature)等等。不得不说我当时非常震惊,因为我从部署wordpress到删除它,一共也就经历了不超过五个小时吧,而且在这期间我一直在改布局样式,而且网站是个空壳,除了主题自带的about页、service页等几个空的页面之外,可以说是啥也没有了,这样都能被百度快速收录???我真的懵了。
四、疑惑进一步加深
截止目前,吱托邦已经上线了20多天了,然而那几个本应该属于wordpress中的应该消失的页面,却依然在百度的site:www.lovebykin.com
指令中能够找到,而我其实很早就给百度提交了死链文件,让百度把那几个不存在的页面给删掉的。并且,自从换了hexo之后,收录变得很差了,二十多天过去,几乎每天都更新文章,反而快照内容几乎是不变的,也几乎没有文章被放出来,而我的绝大部分文章都是99%原创的。这几天看到百度搜索资源平台显示索引量在上升,每天蜘蛛爬取大概在40次左右,但是其实页面完全没有放出来。我反馈了百度也没用,根据多年实践,百度一直都是机器人自动回复:您好,搜索对互联网内容的抓取与展示需要一定的识别周期,是否收录是根据页面内容质量和用户需求综合判断的,我们不保证收录网站的每一条链接,目前网站的整体收录情况正常,感谢您对百度的关注和支持!
然而,比如下面这个早已不存在的页面,在被删除二十多天之后突然被放出来,很有点莫名其妙啊!就这魔性的标题加上空内容也能被收录啊?
五、关于收录现状的疑惑
1.为什么wordpress一个空的主题、空的内容都能那么快被收录,而我现在的hexo博客完全被百度忽略似的。
2.根据我的深度研究,并没有觉得wordpress在seo上有多么的优秀,对于html标签的运用以及网站的整体结构等等方面也没有比hexo的next主题高明。
3.很早就提交了死链文件,在这种情况下百度都舍不得删除那几个属于wordpress的不存在的页面。
4.而且在wordpress存在的那几个小时,我在线上疯狂的修改样式,难道不是容易被百度惩罚吗哈哈。
5.wordpress的整体相应速度,明显要比hexo慢太多了,百度应该是更喜欢hexo这种静态的html页面才对吧。
6.我觉得两者一个显著的区别在于,当时wordpress我没有弄adsense广告,而hexo中我是植入了adsense广告的,但是这个应该不至于吧。
还有满脑疑惑,一时间竟想不起来了。这几年搞个人网站以及百度SEO,给我的感触就是:百度SEO根本就是玄学!都是看命看运气!很多人都在坚持着,但谁知道坚持的结果到底是什么呢,还是羡慕必应和谷歌。根据我的遭遇,以及网络上众多网友的反馈,wordpress确实比其他内容管理系统更容易收录,这种百度搜索引擎的收录偏好,具体并不知道是什么原因导致的,大家普遍怀疑可能是wordpress用的人非常非常多,才使得搜索引擎更加青睐wordpress的模板吧。