raksmart活动促销

分享

写回答

发帖

对于Google伪静态与静态HTML的差别

互联网出海创业 互联网出海创业 1330 人阅读 | 2 人回复

发表于 2010-1-4 22:17:22 | 显示全部楼层 |阅读模式

经常看到类似这样的帖子:
  • 静态HTML和伪静态哪个更好?
  • 我使用Rewrite把URL做成伪静态了,搜索引擎会不会当作静态网页对待?
下面就静态HTML与伪静态问题,发表一下个人看法。
以下内容,仅针对Google,其他搜索引擎未必如此。
首先我们来看哪个更好的问题
就老樂多年对Google的观察,目前Google在这个问题上已经基本完美解决。也就是说,现在对于Google,无论使用伪静态还是静态HTML,基本都能很好的抓取和收录,不会出现几年前那种带多个参数的动态URL就不抓取的现象。
抓取解决了,那么同等情况下,伪静态还是静态HTML针对搜索引擎更好?答案是静态HTML,截止目前是这样,以后不保证(后面的内容会再说这个问题)。
上面所说一定是在同等情况,如前面的一篇文章“Google解说动态、静态、伪静态网址”所说,你要把这样一个URL地址:
http://www.domain.com/read.php?classid=123&lang=en&id=321
Rewrite成:
http://www.domain.com/read-321.html
效果理论来说反而不如上面的动态地址。
接下来我们来看Google看到的伪静态和静态HTML
Google 管理员工具 中增加了“像 Googlebot 一样抓取”功能,对于SEO来说,价值是非常大的,可以直观的看到,Googlebot看到你的网页是什么样的。
为了实验,上传了一个演示xhtml代码的静态HTML网页,与上一篇文章做对比。下面是模拟抓取出来的结果:

(点击查看大图)
上图中,左侧是一篇文章的伪静态页面,右侧是一个静态HTML文件,对比一下,能明显看到下面两个差别:
  • Last-Modified:静态HTML有修改时间(对于搜索引擎意味着可直接获取文件修改时间)
  • Content-Length:文件大小(SEO应该清楚,文件大小对于搜索引擎的影响;Googlebot如果能从服务端直接获取文件大小,作为参考,抓取的效率会更高)
下图是静态HTML的文件属性:

最后,猜测一下Google为什么认为静态HTML优于动态URL
对比一下静态HTML与动态URL的工作方式:
  • 静态HTML:客户端与服务端通讯成功,服务端直接发送文件属性与内容。
  • 动态URL:客户端与服务器端通讯成功,服务端根据客户端请求的内容,产生页面内容,发送服务端信息与请求的内容。
使用动态URL:假如程序出现问题,所有基于些程序的内容将无法访问;假如模板变化,所有信息内容都会发生变化,而真正有价值的内容并没有改变;假如数据库ID不是唯一,新增的内容沿用了被删除内容的ID,将出现URL没有改变而页面完全变化……
而如果是静态HTML,文件只有“存在&不存在”(服务端状态不计算在内),“修改&未修改”(读Last-Modified就好了)。
经过这样的分析,得出的结果是:静态HTML具有更高的稳定性。
这个猜测也能解释SEO经常遇到的一个问题,网站中的一些文档(PDF&DOC&XML)权重相对都较高。
挺长时间没有写博客,语言有些混乱,呵呵
有时间的时候,专门写篇博客,介绍一下Google管理员工具中“像 Googlebot 一样抓取”各标签的意思,刚开始用的朋友可能对这些不是很了解。

回答|共 2 个

mlmm

发表于 2010-1-5 14:30:57 | 显示全部楼层

感觉不太一样.....

wizardheng

发表于 2010-1-6 16:31:30 | 显示全部楼层

看不懂,不过还是坚持看下来了,连带楼主给的传送门- -

我用的是wordpress,也就是说与其小心翼翼地去伪静态,还不如不动,保持原样,对不?
这个是wordpress中文资源站的帮助,这个方法实现的是静态,还是伪静态呀?

前提是你的博客主机必须支持Mod Rewrite
在本地用记事本新建一个1. htaccess 文件 然后上传至你的博客根目录 并改名为 .htaccess 设置属性为644
登录到wordpress后台,“设置”→“永久链接”。
在“自定义结构”中填写永久链接的格式。
常用的写法有:
样式:http://www.yourwebsite.com/123.html
写法:/%post_id%.html
样式:http://www.yourwebsite.com/archives/123.html
写法:/archives/%post_id%.html
样式:http://www.yourwebsite.com/2007/09/16/post-name.html
写法:/%year%/%monthnum%/%day%/%postname%.html
样式:http://www.yourwebsite.com/2007/03/post-name.html
写法:/%year%/%monthnum%/%postname%.html
样式:http://www.yourwebsite.com/category/post-name.html
写法: /%category%/%postname%.html
样式:http://www.yourwebsite.com/archives/post-name.html     
写法:/archive/%postname%.html
样式:http://www.yourwebsite.com/post-name.html     
写法:/%postname%.html
说明:
%year% 日志发布的年,4位数字,如:2004
%monthnum% 日志发布的月份,2位数字,如:05
%day% 日志发布当月的第几天,2位数字,如:28
%hour% 日志发布时间中的“小时”,2位数字,如:15
%minute%  日志发布时间中的“分钟”,2位数字,如:43
%second% 日志发布时间中的“秒”,2位数字,如:33
%postname%  一串处理过的日志标题。如,日志标题为“This Is A Great Post!”,那么%postname%表示为“this-is-a-great-post”
%post_id% 日志的唯一编号
%category% 日志所在的分类
%author%  日志的作者
注意:设置完的永久链接 要等待一会才能生效

[ 本帖最后由 wizardheng 于 2010-1-6 04:45 PM 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则