避免Adodb.Stream输出UTF-8时自动写入的BOM(asp)

作者:zhtc009 时间:2011-08-24 20:32:56 

asp生成html如果采用utf8编码方式,多数采用的是Adodb.Stream组件,因为fso并不能支持Utf-8

最近在写一个生成HTML页面的程序,模板是一个UTF-8的HTML文件,在这个文件里已经去除了BOM。现在用ADODB.STREAM读取模板,添加内容,然后输出为UTF-8的HTML网页。但我检查这个HTML时发现被自动加上了BOM。导致<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">申明错误,从而使div布局的页面样式发生错误。

        关于什么是BOM这里不作讨论,如果不明白可以去google一下,但是在这个实例中我们不希望文件开头包含这个BOM。

        有没有解决办法?

        最直接简单的做法可以这样:
我们已经知道BOM占用3个字节,那么我们可以在stream中写入UTF-8字符串之后,将stream转换为二进制类型,然后跳过头3个字节,并将剩下的字节用CopyTo()方法拷贝到一个新的stream中去。不过这样好像有潜在的很严重的性能问题,如果这个文本流比较大,那么处理这个流是不是就要耗费双倍的资源?

        那我们将上面的方案改进一下。
经过测试发现,stream在“UTF-8”编码的Text方式下首次调用WriteText()方法时,会自动在stream的最开始加入3个字节。
更严格的说,在以下状态下
stream.Position = 0; // 流的位置在最开始时
stream.Type = 3; // adTypeText
stream.Charset = 'UTF-8';
调用stream.WriteText()方法时,stream会自动先在流的最开始插入3个字节的BOM。

        而stream.Position在任何非0值的情况下,调用WriteText()方法都不会再插入BOM了,可以利用这一点来避免自动插入BOM。

假如我们需要朝stream中写入10个UTF-8字符,我们先按照通常方式在一个刚创建的stream中只写入第一个UTF-8字符。

之后将stream转换为二进制类型(adTypeBinary),跳过stream开始的3个BOM字节,并读出剩余的字节(这些字节应该只包含刚刚一个字符的数据,不含其它杂质)。

        再回到流的开始,将刚刚读出的字节重新写入流,写完后立即调用SetEOS()方法将当前位置设为流末尾。

        然后将stream重新转换回文本类型(adTypeText),并将流当前位置移到流末尾。

        此时继续写入剩余的9个UTF-8字符,stream会将其编码后的字节数据直接添加到尾部,而不会再插入BOM了。

        此后若需要继续往stream中写入文本,直接调用WriteText()方法即可。

        通过测试可以发现,如上方式写入的UTF-8字符串通过ReadText()方法也能正常读出,但是stream.Size却比传统方式直接写入UTF-8的stream小3,很明显就是少了那3个“多余”的BOM字节。

        问题到此还未结束。
        此时你可能想直接调用stream.SaveToFile()方法保存到文件,你可能会发现,这时保存的文件中还是带有BOM,上述方法无效?

        出现这种情况,是因为你漏掉了关键的一步:在调用SaveToFile()方法之前,需要将流转换为二进制类型。

        原来还是Adodb.Stream在自作聪明,输出的时候发现UTF-8文本流的开头缺少BOM,又会再次将其加上。

        但是若将流类型改为二进制,输出时就可以绕过Adodb.Stream的BOM监测了。


'***********************************************
'函数名:LoadFile
'作 用:利用ADODB.Stream读取模板文件
'参 数:File:要读取的文件
'Author:Evller
'***********************************************
Function LoadFile(ByVal File)
Dim objStream
     On Error Resume Next
     Set objStream = Server.CreateObject("ADODB.Stream")
     If Err.Number=-2147221005 Then 
         Response.Write "<div align='center'>非常遗憾,您的主机不支持ADODB.Stream,不能使用本程序</div>"
         Err.Clear
         Response.End
     End If
     With objStream
         .Type = 2
         .Mode = 3
         .Open
         .LoadFromFile Server.MapPath(File)
         If Err.Number<>0 Then
     Response.Write "<div align='center'>文件<font color='#ff0000'>"&File&"</font>无法被打开,请检查是否存在!</font></div>"
     Err.Clear
     Response.End
         End If
         .Charset = "utf-8"
         .Position = 2
         LoadFile = .ReadText
         .Close
     End With
     Set objStream = Nothing
End Function


'******************************************************************************
'函数名:SaveToFile   
'作 用:生成html静态页面,去掉bom标签文件
'参 数: Content内容,FileName路径
'Author:Evller
'******************************************************************************
Sub SaveToFile (Content,FileName)   
    dim stm:set stm=server.CreateObject("adodb.stream")   
    stm.Type=2 '以文本模式读取   
    stm.mode=3   
    stm.charset="utf-8" 
    stm.open   
    stm.Writetext (content)   
    stm.Position = 3   
    dim newStream:Set newStream = Server.CreateObject("adodb.stream")   
    With newStream   
        .Mode = 3   
        .Type = 1   
        .Open()   
    End With 
    stm.CopyTo(newStream)   
    newStream.SaveToFile server.MapPath(FileName),2   
    stm.flush   
    stm.Close   
    Set stm = Nothing 
    Set newStream = Nothing 
End Sub


实例:
List="news list!"

Content=LoadFile("template.htm")'先利用LoadFile读取模板template.htm内容

Content = Replace(Content,"{$list$}",list)'把模板中的内容替换

Call SaveToFile(Content,"index.htm")'生成文件html文件

Response.Write "生成成功!"

下载Demo demo.rar (1.77 KB)

文章首发易维网络,转载请注明出处。

标签:adodb,utf-8,bom
0
投稿

猜你喜欢

  • 在阿里云的CentOS环境中安装配置MySQL的教程

    2024-01-13 13:13:26
  • Django如何使用第三方服务发送电子邮件

    2021-08-06 03:49:15
  • MySQL中的全表扫描和索引树扫描 的实例详解

    2024-01-24 02:39:43
  • Python Unittest ddt数据驱动的实现

    2023-10-29 14:54:14
  • python爬取各省降水量及可视化详解

    2023-08-04 15:19:57
  • python 还原梯度下降算法实现一维线性回归

    2023-10-09 21:53:42
  • Python 一键获取百度网盘提取码的方法

    2023-11-30 06:13:49
  • javascript面向对象技术基础(二)

    2010-02-07 13:09:00
  • Python实现的概率分布运算操作示例

    2023-02-21 10:16:18
  • python logging 日志轮转文件不删除问题的解决方法

    2023-07-06 20:04:30
  • python进程池的简单实现

    2021-02-22 06:22:14
  • Python装饰器有哪些绝妙的用法

    2022-09-08 01:09:47
  • 带你轻松了解 SQL Server数据库的组成

    2009-02-05 15:53:00
  • git恢复删除的分支及内容的方法

    2023-03-09 20:16:27
  • Python3变量与基本数据类型用法实例分析

    2023-07-09 10:52:39
  • javascript框架设计之框架分类及主要功能

    2024-04-18 09:33:40
  • windows系统中Python多版本与jupyter notebook使用虚拟环境的过程

    2022-11-28 13:24:01
  • java正则表达式提取数字的方法实例

    2022-07-09 12:49:31
  • python PIL模块的基本使用

    2022-08-28 16:35:19
  • python 包实现JSON 轻量数据操作

    2022-11-13 05:40:32
  • asp之家 网络编程 m.aspxhome.com