XMLHTTP自动判断远程网页字符编码

作者:llinzzi 来源:蓝色理想 时间:2007-12-28 13:41:00 

本文介绍了使用xmlhttp处理远程文件数据、或采集文章时,对对方网页编码的处理方法。因为使用ajax的xmlhttp网页编码处理不当很容易出现乱码问题。因此编码的处理是很重要的一步。本文自动判断远程文件的编码格式,很方便。

如果您对xmlhttp不是很了解可以先看看:XMLHTTPRequest的属性和方法简介采用XMLHTTP编写一个天气预报的程序

1、在服务器端的xmlhttp.Open("GET",url,false)异步必须是关闭的,而客户端的异步是打开的,这个很好理解。

2、在服务器端的xmlhttp.Responsebody 这里用的是Responsebody而不是ResponseText或ResponseXml,一开始我是用ResponseText,但在函数bytesToBSTR转换编码的时候提示错误,经过比较发现其他的asp小偷程序里的代码都是Responsebody,分析后,发现body返回来的是二进制数据而不是像ResponseText或ResponseXml那样返回字符或dom对象。

ajax的asp代理函数介绍:

send_request(url) ,url为地址

服务器端代码如下带自动判断所有字符编码,已测试 日语 韩语 繁体:


<%@LANGUAGE="JAVASCRIPT" CODEPAGE="65001"%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" 
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>XMLHTTP自动判断远程网页字符编码 - asp之家</title>
</head>
<% 
Server.ScriptTimeout=9999999;
function send_request(url) {
 var codedtext;
 http_request = Server.CreateObject("Microsoft.XMLHTTP");
 http_request.Open("GET",url,false);
 http_request.Send(null);
 if (http_request.ReadyState == 4){
  //自动判断编码开始
  var charresult = http_request.ResponseText.match(/CharSet=(\S+)\">/i);
  if (charresult != null){
  var Cset = charresult[1];
  }else{Cset = "gb2312"}//对获取不到的网站采用gb2312编码,可自行更改
  
//自动判断编码结束
  codedtext = bytesToBSTR(http_request.Responsebody,Cset);
  }else{
  codedtext = "Erro";
  }
 return(codedtext);

function bytesToBSTR(body,Cset){
var objstream;
objstream = Server.CreateObject("Adodb.Stream");
objstream.Type = 1;
objstream.Mode = 3;
objstream.Open();
objstream.Write(body);
objstream.Position = 0;
objstream.Type = 2;
objstream.Charset = Cset;
bytesToBSTR = objstream.Readtext;
objstream.Close;
return(bytesToBSTR);
} %>
<body>
使用方法:
<%
 Response.Write(send_request(http://www.aspxhome.com)) %>
</body>
</html>


标签:XMLHTTP,编码,远程,乱码,ajax
0
投稿

猜你喜欢

  • Mysql中SQL语句不使用索引的情况

    2024-01-28 04:19:57
  • ASP Access实现网站计数器(访问量)

    2011-04-10 10:33:00
  • TensorFlow入门使用 tf.train.Saver()保存模型

    2023-06-07 15:29:45
  • java使用正则表达式判断邮箱格式是否正确的方法

    2022-07-24 20:31:10
  • Python用requests模块实现动态网页爬虫

    2022-10-15 16:27:06
  • 发个js从样式表取值的函数

    2008-05-20 12:23:00
  • 详解python中的json的基本使用方法

    2022-03-15 22:29:13
  • mysql 8.0.21 安装配置方法图文教程

    2024-01-18 20:34:44
  • python带你探寻WSGI Application原理

    2022-03-25 19:35:55
  • Python关于__name__属性的含义和作用详解

    2021-10-28 09:29:51
  • Python 实现打印单词的菱形字符图案

    2021-06-30 20:08:52
  • Python遗传算法Geatpy工具箱使用介绍

    2021-11-02 02:21:16
  • mysql 分页优化解析

    2024-01-15 00:33:40
  • ASP截取中英文字符串固定长度

    2009-08-19 17:12:00
  • 解决使用pycharm提交代码时冲突之后文件丢失找回的方法

    2023-11-21 07:25:32
  • python条件和循环的使用方法

    2021-12-16 22:27:59
  • colab中修改python版本的全过程

    2022-10-31 07:18:38
  • mysql添加索引方法详解(Navicat可视化加索引与sql语句加索引)

    2024-01-24 22:32:37
  • PHP中集成PayPal标准支付的实现方法分享

    2023-09-06 09:11:22
  • Python爬虫实现搭建代理ip池

    2022-05-19 06:57:11
  • asp之家 网络编程 m.aspxhome.com