asp中利用xmlhttp抓取网页内容的代码

来源:asp之家 时间:2023-07-06 04:18:12 

需要分件html源代码
此例中的被抓取的html源代码如下
<p align=left>2004年8月24日星期二;白天:晴有时多云南风3—4级;夜间:晴南风3—4级;气温:最高29℃最低19℃ </p>
而程序中是从
以2004年8月24日为关键字搜索,直到</p>结速
而抓取的内容就变成了"2004年8月24日星期二;白天:晴有时多云南风3—4级;夜间:晴南风3—4级;气温:最高29℃最低19℃ "
干干净净的了。记录一下。

代码如下:


<%
On Error Resume Next
Server.ScriptTimeOut=9999999
Function getHTTPPage(Path)
t = GetBody(Path)
getHTTPPage=BytesToBstr(t,"GB2312")
End function
Function GetBody(url)
on error resume next
Set Retrieval = CreateObject("Microsoft.XMLHTTP")
With Retrieval
.Open "Get", url, False, "", ""
.Send
GetBody = .ResponseBody
End With
Set Retrieval = Nothing
End Function
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
Function Newstring(wstr,strng)
Newstring=Instr(lcase(wstr),lcase(strng))
if Newstring<=0 then Newstring=Len(wstr)
End Function
%>
<html>
<BODY bgColor=#ffffff leftMargin=0 topMargin=0 MARGINHEIGHT=0 MARGINWIDTH=0>
<!-- 开始 -->
<%
Dim wstr,str,url,start,over,dtime
dtime=Year(Date)&"年"&Month(Date)&"月"&Day(Date)&"日"
url="http://www.aspxhome.com/"
wstr=getHTTPPage(url)
start=Newstring(wstr,dtime)
over=Newstring(wstr,"</p>")
body=mid(wstr,start,over-start)
response.write "<MARQUEE onmouseover=this.stop(); onmouseout=this.start();>"&body&"</marquee>"
%>
<!-- 结束 -->
</body></html>

标签:xmlhttp,抓取,网页内容,小偷
0
投稿

猜你喜欢

  • pytorch 获取tensor维度信息示例

    2023-09-20 01:32:02
  • 解决mac使用homebrew安装MySQL无法登陆问题

    2024-01-27 06:22:24
  • Python jieba库分词模式实例用法

    2023-12-09 23:40:42
  • vue实现某元素吸顶或固定位置显示(监听滚动事件)

    2024-05-09 15:15:10
  • PHP队列用法实例

    2023-10-20 12:30:49
  • Python中PyQt5/PySide2的按钮控件使用实例

    2023-03-04 16:27:44
  • 浅谈python类属性的访问、设置和删除方法

    2022-01-12 00:14:48
  • python正则表达式之对号入座篇

    2021-03-31 17:59:55
  • Go语言实现AzDG可逆加密算法实例

    2024-02-12 17:50:01
  • python读取excel数据绘制简单曲线图的完整步骤记录

    2022-04-27 10:52:18
  • 详解Pandas与openpyxl库的超强结合

    2021-09-05 03:52:15
  • 成功解决ValueError: Supported target types are:('binary', 'multiclass'). Got 'continuous' instead.

    2023-01-24 03:59:00
  • thinkphp 多表 事务详解

    2023-07-08 05:43:36
  • jquery each的几种常用的使用方法示例

    2024-04-09 19:48:49
  • go 对象池化组件 bytebufferpool使用详解

    2024-02-10 14:26:11
  • python操作csv格式文件之csv.DictReader()方法

    2021-03-04 18:10:04
  • Javascript基础知识(三)BOM,DOM总结

    2024-04-19 09:46:39
  • 详解如何创建Python元类

    2023-09-20 04:50:15
  • 在Django中预防CSRF攻击的操作

    2023-11-11 15:55:13
  • numpy之sum()的使用及说明

    2023-12-12 00:31:16
  • asp之家 网络编程 m.aspxhome.com