php实现断点续传大文件示例代码

作者:钱海海 时间:2024-04-28 09:45:17 

一、断点续传原理

所谓断点续传,也就是要从文件已经下载的地方开始继续下载。在以前版本的 HTTP 协议是不支持断点的,HTTP/1.1 开始就支持了。一般断点下载时才用到 Range 和 Content-Range 实体头。

不使用断点续传


get /down.zip http/1.1
accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-
excel, application/msword, application/vnd.ms-powerpoint, */*
accept-language: zh-cn
accept-encoding: gzip, deflate
user-agent: mozilla/4.0 (compatible; msie 5.01; windows nt 5.0)
connection: keep-alive

 服务器收到请求后,按要求寻找请求的文件,提取文件的信息,然后返回给浏览器,返回信息如下:


HTTP/1.1 200 Ok
content-length=106786028
accept-ranges=bytes
date=mon, 30 apr 2001 12:56:11 gmt
etag=w/"02ca57e173c11:95b"
content-type=application/octet-stream
server=microsoft-iis/5.0
last-modified=mon, 30 apr 2001 12:56:11 gmt

使用断点续传


GET /down.zip HTTP/1.0
User-Agent: NetFox
RANGE: bytes=2000070-
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2

多了这么一行Range: bytes=2000070-

这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传,前面的字节不用传了。
Range的完整格式是:


Range: bytes=startOffset-targetOffset/sum [表示从startOffset读取,一直读取到targetOffset位置,读取总数为sum直接]

Range: bytes=startOffset-targetOffset [字节总数也可以去掉]

服务器收到这个请求以后,返回的信息如下:


HTTP/1.1 206 Partial Content
content-length=106786028
content-range=bytes 2000070-106786027/106786028
date=mon, 30 apr 2001 12:55:20 gmt
etag=w/"02ca57e173c11:95b"
content-type=application/octet-stream
server=microsoft-iis/5.0
last-modified=mon, 30 apr 2001 12:55:20 gmt

和前面服务器返回的信息比较一下,就会发现增加了一行:


Content-Range=bytes 2000070-106786027/106786028

返回的代码也改为206了,而不再是200了。


HTTP/1.1 206 Partial Content

知道了以上原理,就可以进行断点续传的编程了。

二、PHP实现


/** php下载类,支持断点续传
* download: 下载文件
* setSpeed: 设置下载速度
* getRange: 获取header中Range
*/

class FileDownload{

/** 下载
* @param String $file 要下载的文件路径
* @param String $name 文件名称,为空则与下载的文件名称一样
* @param boolean $reload 是否开启断点续传
*/
public function download($file, $name='', $reload=false){
$fp = @fopen($file, 'rb');
if($fp){
if($name==''){
$name = basename($file);
}
$header_array = get_headers($file, true);
//var_dump($header_array);die;
// 下载本地文件,获取文件大小
if (!$header_array) {
$file_size = filesize($file);
} else {
$file_size = $header_array['Content-Length'];
}
$ranges = $this->getRange($file_size);
$ua = $_SERVER["HTTP_USER_AGENT"];//判断是什么类型浏览器
header('cache-control:public');
header('content-type:application/octet-stream');

$encoded_filename = urlencode($name);
$encoded_filename = str_replace("+", "%20", $encoded_filename);

//解决下载文件名乱码
if (preg_match("/MSIE/", $ua) || preg_match("/Trident/", $ua) ){
header('Content-Disposition: attachment; filename="' .$encoded_filename . '"');
} else if (preg_match("/Firefox/", $ua)) {
header('Content-Disposition: attachment; filename*="utf8\'\'' . $name . '"');
}else if (preg_match("/Chrome/", $ua)) {
header('Content-Disposition: attachment; filename="' . $encoded_filename . '"');
} else {
header('Content-Disposition: attachment; filename="' . $name . '"');
}
//header('Content-Disposition: attachment; filename="' . $name . '"');

if($reload && $ranges!=null){ // 使用续传
header('HTTP/1.1 206 Partial Content');
header('Accept-Ranges:bytes');

// 剩余长度
header(sprintf('content-length:%u',$ranges['end']-$ranges['start']));

// range信息
header(sprintf('content-range:bytes %s-%s/%s', $ranges['start'], $ranges['end'], $file_size));
//file_put_contents('test.log',sprintf('content-length:%u',$ranges['end']-$ranges['start']),FILE_APPEND);
// fp指针跳到断点位置
fseek($fp, sprintf('%u', $ranges['start']));
}else{
file_put_contents('test.log','2222',FILE_APPEND);
header('HTTP/1.1 200 OK');
header('content-length:'.$file_size);
}

while(!feof($fp)){
//echo fread($fp, round($this->_speed*1024,0));
//echo fread($fp, $file_size);
echo fread($fp, 4096);
ob_flush();
}

($fp!=null) && fclose($fp);
}else{
return '';
}
}

/** 设置下载速度
* @param int $speed
*/
public function setSpeed($speed){
if(is_numeric($speed) && $speed>16 && $speed<4096){
$this->_speed = $speed;
}
}

/** 获取header range信息
* @param int $file_size 文件大小
* @return Array
*/
private function getRange($file_size){
//file_put_contents('range.log', json_encode($_SERVER), FILE_APPEND);
if(isset($_SERVER['HTTP_RANGE']) && !empty($_SERVER['HTTP_RANGE'])){
$range = $_SERVER['HTTP_RANGE'];
$range = preg_replace('/[\s|,].*/', '', $range);
$range = explode('-', substr($range, 6));
if(count($range)<2){
$range[1] = $file_size;
}
$range = array_combine(array('start','end'), $range);
if(empty($range['start'])){
$range['start'] = 0;
}
if(empty($range['end'])){
$range['end'] = $file_size;
}
return $range;
}
return null;
}
}

$obj = new FileDownload();
$obj->download('http://down.golaravel.com/laravel/laravel-master.zip','', true);

来源:https://www.cnblogs.com/qianhaihai/p/13154321.html

标签:php,断点续传,文件
0
投稿

猜你喜欢

  • pytest内置fixture使用临时目录流程详解

    2021-12-27 06:49:23
  • Python 列表映射后的平均值

    2021-12-25 19:02:39
  • python 常见的反爬虫策略

    2022-12-17 21:51:54
  • 关于Python 实现tuple和list的转换问题

    2022-02-18 21:29:03
  • 基于python pygame实现的兔子吃月饼小游戏

    2023-10-26 21:25:23
  • 【Python】Python的urllib模块、urllib2模块批量进行网页下载文件

    2021-04-26 18:19:14
  • Pytorch中Tensor与各种图像格式的相互转化详解

    2023-05-23 01:46:54
  • 发现一个不错的11px字体:PMingLiu

    2008-09-06 12:49:00
  • vue实现移动端图片裁剪上传功能

    2024-05-10 14:15:04
  • python机器学习实战之最近邻kNN分类器

    2021-11-11 14:55:52
  • python验证码识别的实例详解

    2021-05-28 14:59:51
  • python 获取等间隔的数组实例

    2023-05-21 15:07:16
  • django框架自定义用户表操作示例

    2021-10-04 04:29:54
  • python中文乱码的解决方法

    2022-07-12 18:03:48
  • MySQL创建数据库并支持中文字符的操作方法

    2024-01-27 16:09:45
  • 解析:安装 MySQL时如何选择安装软件包

    2008-12-31 17:15:00
  • TorchVision Transforms API目标检测实例语义分割视频类

    2022-12-05 14:24:56
  • MySQL数据表添加字段的三种方式

    2024-01-13 10:49:30
  • Golang实现单元测试中的接口层

    2024-04-26 17:17:29
  • python3.4用函数操作mysql5.7数据库

    2024-01-13 01:08:40
  • asp之家 网络编程 m.aspxhome.com