今天帮一个客户处理问题的时候发现了这个事情,就是关于网站伪静态!客户说网站打开老是慢,如果大家对网络熟悉的话,应该知道,网站打开慢有很多原因的!两边的技术都测试过了,网络是没问题的,于是就查看主机进程、发现内存和CPU占用率很高!剩下的就是排查是什么原因导致了CPU使用率过高!看看他网站里装了什么错误的程序或者程序里面有死循环一类的!
伪静态是相对真实静态来讲的.
一、什么是静态技术? 所谓静态的意思,就是地址中不带问号。
二、为什么要用伪静态技术? Web应用程序最大的特点之一就是无状态,当一个页面跳转到另一个页面时,那么这个页面上的所有参数都将抛弃,所以动态页面一般利用url地址来保存其参数,就像:
www.xxxx.net/essay.asp?id=1 这样,搜索引擎在录取该页面时,可能会因为问号而进入死循环(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以很多时候带问号的地址是不会进去的,这样便降低了页面的收录效率。
既然这样,那么选用不带问号的url不是可以更好的让搜索引擎收录自己的网页?的确。静态网页的url正好不带问号,所以我们要伪造静态,目的就是为了SEO,提高网站的收录效率。
1.关于伪静态的用处 有些用户觉得,伪静态和真静态实际被收录量会相差很大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?
估计很难看得出,因为所谓静态的意思,就是地址中不带问号,不带问号的就是静态,管他是真的还是伪的?搜索引擎看得出吗? 所以说,其实不论是真的还是伪的,其实对于搜索引擎来说都是一样的,搜索引擎没有说,你这个是伪的,我不收录你.
究根结底的来说,为什么搜索引擎会不收录带问号的网址?因为搜索引擎怕由于问号而进入死循环,所以很多时候带问号的地址是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有真静态比伪静态收录得多的说法.
2.关于伪静态的坏处 当然犹如一篇文章的作者所说的 "如果流量稍大一些使用伪静态就出现CPU使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的ISS数是1000" 确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由CPU来判断了,所以CPU占有量的上升,确实是伪静态最大的弊病.
总结 1.使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的.
2.既然真伪静态的效果一样,我们就可以选择伪静态了.
3.但是伪静态大量使用会造成CPU超负荷.
4.所以我们只要不大量使用就可以了.
5.既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用.
6.所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了
以上内容是我转载自网络、方便大家了解的同时,自己也增加了知识! |