内容发布系统的开发在站点流量很大的时候,为了提高系统性能,减短系统响应时间,我们很多时候考虑把站点做成静态的,用后台的发布系统发布出来。静态页面在性能上具有不少优势,但是,相对动态页面灵活性不够,扩展性不好,以后维护起来也比较麻烦。下面,就我的经验谈谈怎样生成这些静态站点。生成静态页面一般来说都是做好静态页面的模板,然后从数据源读取数据,生成html代码块替换模板中的标签,然后生成静态文件。比如文章页面模板部分如下:tableborder=1style=BORDER-COLLAPSE:collapsewidth=100%cellpadding=2cellspacing=2trtdahref=(#ArticleUrl#)(#Title#)/abr作者(#Author#)时间2006-3-2413:38:00/td/trtrtd摘要:(#Description#)/td/trtrtd(#Content#)/td/tr/table我们可以用如下的方法读取该模板的内容///summary///读取文件内容////summary///paramname=strFilePath文件路径/param///returns文件内容字符串/returns///paramname=strEncodingName编码名称(GB2312,UTF-8等)/parampublicstringReadFile(stringstrFilePath,stringstrEncodingName){stringstrFile=string.Empty;StreamReadersr=newStreamReader(strFilePath,System.Text.UnicodeEncoding.GetEncoding(strEncodingName));try{strFile=sr.ReadToEnd();}catch(Exceptione){}finally{sr.Close();}returnstrFile;}假设返回的字符串是strTemplate,从数据库中读取的文章标题为strTitle,作者为strAuthro,发布时间为strPostTime,描述为strDescription,内容为strContent,我们就可以用string的Replace方法把标签替换为实际要显示的内容了strArticle=strTemplate.Replace((#Title#),strTitle);strArticle=strArticle.Replace((#Author#),strAuthor);……………………………………这样,strArticle就是要显示页面的html代码了,再用如下的方法写入文件///summary///写Html文件////summary///paramname=strHtml写入的字符串/param///paramname=strDestinationFilePath目的文件路径/param///paramname=strEncodingName编码名称(GB2312,UTF-8等)/parampublicvoidWriteFile(stringstrHtml,stringstrDestinationFilePath,stringstrEncodingName){StreamWritersw=newStreamWriter(strDestinationFilePath,false,System.Text.UnicodeEncoding.GetEncoding(strEncodingName));try{sw.Write(strHtml);sw.Flush();}catch(Exceptione){strErrorMessage=e.Message.ToString();}finally{sw.Close();}}这里要注意的是Replace方法有时候替换会失效,比如ahref=http://(#UserID#).it.com.cnone/a这里的(#UserID#)不能用Replace方法替换,可以这样来替换strArticle=Regex.Replace(Article,\\(#UserID#\\),strUserID);现在,生成静态文件的方法我们会了,再来看看一些个性化技巧,如何给用户提供不同风格的各种页面。现在一般是通过div+css的方法给每个用户提供不同风格的页面。也就是说每个用户页面的html代码结构是一样的,只是外部css不一样,这样在写页面的时候,我们可以把基本的html代码硬编码到我们的程序中,减少了复杂度。css可以很好的控制页面布局,实现起来很方便。这种方法中,所有风格的同一页面模板只有一个,一个风格对应一个css文件。这样,可以满足一般的需求了,很多的blog都是采用这种方法来实现,比如blogcn,douban。但是,这种方法也有个缺陷,因为html代码是硬编码到后台代码中,所有风格的同一页面模板只有一个,所以页面的个性化也受到了一定限制。比如我想让一个风格的文章列表用表格形式,另一个采用其他方式,就无法实现了,因为我们已经把具体内容写在后台代码中了,只是引用的css文件不同。只要我们稍加改进,就完全可以随心所欲定制页面了,我的方法如下:每个风格一套模板,一个css。比如文章页面的另一个风格模板如下:divahref=(#ArticleUrl#)(#Title#)/abr作者(#Author#)时间2006-3-2413:38:00hr摘要:(#Description#)br(#Content#)div同样,我们也可以用上面替代的方法生成页面,只是每次要根据用户所选择的模板来选择不同的模板文件,而不是所有的用户选择同一个。看到这里,你可能会问,那要是列表怎么办?以前是把列表的html代码直接写在后台代码中,现在呢?遇到这样的情况,我们可以做下面这样的模板。table!--ArticlesListStart--!--Article(#ArticleID#)Start--trtdheight=20/td/trtrtdtableborder=1style=BORDER-COLLAPSE:collapsewidth=100%cellpadding=2cellspacing=2ID=Table2trtdahref=(#ArticleUrl#)(#Title#)/a/td/trtrtd摘要:(#Description#)/td/trtrtd发表于(#ReleaseTime#) | 评论((#CommentCount#)) | 访问((#VisitCount#))/td/tr/table/td/tr!--Article(#ArticleID#)End--!--ArticlesListEnd--/table上面的模板中!--Article(#ArticleID#)Start--和!--Article(#ArticleID#)End--之间的内容就是文章列表中一个文章的代码,我们只需要用正则表达式把这部分找出来,替换标签就得到了一个列表中一个文章的html代码,把所有文章的代码连起来就得到了文章列表的代码,再让得到的代码替换模板中!--ArticlesListStart--和!--ArticlesListEnd--的内容就得到了最终要写入页面的代码。虽然比以前div+css的方式多了些步骤,但是,这样确实有效可行。大家也许会发现,上面的模板也为某些更新页面而不需要读数据库提供了基础,比如我要从文章列表中删除ID为100的文章,我们只要删除!--Article100Start--和!--Article100End--之间的内容就可以了,根本不需要再读数据库。但是,这样也会带来隐患,假如某次文件操作失败,那就永远是失败,不能跟数据库的内容同步,当然你可以通过提供其他功能来解决这个问题。既然是为了性能,我们把页面发布成静态,那我们不如再进一步,看看怎样提高写静态页面的性能。1.提取所有页面的公共部分,放外部文件进行引用。比如所有页面的导航部分是相同的,这些部分经常要根据用户的操作进行更新,如果把它完全写在每个页面中,更新起来代价是很大的,必须重写每个页面。我们可以把这些内容外挂到js中,更新这些内容的时候,更新相应的js文件就可以了,一次更新,整站更新。这里,要注意的是要对js的特殊字符要进行转义,比如;'等特殊字符要在前面加上/进行转义。2.局部更新,而不是整体更新我们可以用!--ArticlesListStart--和!--ArticlesListEnd--这样的标记把文章列表标记出来,更新文章页面的时候,我们只需要生成文章列表html代码,代替原页面(非模板)这两个标记之间的内容就可以了。这样,能大量减少读数据库的次数,性能自然也提高不少。在不同内容越多的页面,性能优势越明显。3.使用分层树结构存放文件这个其实是对读取性能的优化了。我们不要把大量的文件都生成在同一个根目录下,这样服务器遍历文件就会影响性能。我们可以使用分层树结构来生成文件,比如按年/月/日的形式组织文件目录。综合有目的性的使用以上方法可以提高发布系统的性能,也能使用户界面最大限度地个性化。有时,我们可以采用静态和动态结合的方法提高系统性能,比如文章列表第一页生成静态,后面的采用动态方式。总之,对访问频率越高的页面生成静态越有优势,更新频率越高的页面动态方式越有优势,所以我们要均衡两者,有的放矢的选择。