千家信息网

如何解决php gzip css乱码问题

发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,这篇文章主要为大家展示了"如何解决php gzip css乱码问题",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"如何解决php gzip css乱码问题"
千家信息网最后更新 2025年01月24日如何解决php gzip css乱码问题

这篇文章主要为大家展示了"如何解决php gzip css乱码问题",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"如何解决php gzip css乱码问题"这篇文章吧。

php gzip css乱码的解决办法:1、使用自带的zlib库;2、使用CURL代替"file_get_contents";3、使用gzip解压函数解决乱码问题。

本文操作环境:Windows7系统、PHP7.1版,DELL G3电脑。

php file_get_contents抓取Gzip网页乱码的三种解决方法

用 file_get_contents() 函数抓取网页会发生乱码现象。有两个原因会导致乱码,一个是编码问题,一个是目标页面开了Gzip,下面说的就是开了Gzip功能如何才能不乱码的方法

把抓取到的内容转下编码即可($content=iconv("GBK", "UTF-8//IGNORE", $content);),我们这里讨论的是如何抓取开了Gzip的页面。怎么判断呢?获取的头部当中有Content-Encoding: gzip说明内容是GZIP压缩的。用FireBug看一下就知道页面开了gzip没有。下面是用firebug查看我的博客的头信息,Gzip是开了的。

代码如下:

请求头信息原始头信息

Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8Accept-Encoding gzip, deflateAccept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3Connection keep-aliveCookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.1326850415.887.3.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3Awww.nowamagic.net; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401Host www.nowamagic.netUser-Agent Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0

下面介绍一些解决方案:

1. 使用自带的zlib库

如果服务器已经装了zlib库,用下面的代码可以轻易解决乱码问题。

代码如下:

$data = file_get_contents("compress.zlib://".$url);

2. 使用CURL代替file_get_contents

代码如下:

function curl_get($url, $gzip=false){ $curl = curl_init($url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10); if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里 $content = curl_exec($curl); curl_close($curl); return $content;}

3. 使用gzip解压函数

代码如下:

function gzdecode($data) {  $len = strlen($data);  if ($len < 18 || strcmp(substr($data,0,2),"\x1f\x8b")) {    return null;  // Not GZIP format (See RFC 1952)  }  $method = ord(substr($data,2,1));  // Compression method  $flags  = ord(substr($data,3,1));  // Flags  if ($flags & 31 != $flags) {    // Reserved bits are set -- NOT ALLOWED by RFC 1952    return null;  }  // NOTE: $mtime may be negative (PHP integer limitations)  $mtime = unpack("V", substr($data,4,4));  $mtime = $mtime[1];  $xfl   = substr($data,8,1);  $os    = substr($data,8,1);  $headerlen = 10;  $extralen  = 0;  $extra     = "";  if ($flags & 4) {    // 2-byte length prefixed EXTRA data in header    if ($len - $headerlen - 2 < 8) {      return false;    // Invalid format    }    $extralen = unpack("v",substr($data,8,2));    $extralen = $extralen[1];    if ($len - $headerlen - 2 - $extralen < 8) {      return false;    // Invalid format    }    $extra = substr($data,10,$extralen);    $headerlen += 2 + $extralen;  }  $filenamelen = 0;  $filename = "";  if ($flags & 8) {    // C-style string file NAME data in header    if ($len - $headerlen - 1 < 8) {      return false;    // Invalid format    }    $filenamelen = strpos(substr($data,8+$extralen),chr(0));    if ($filenamelen === false || $len - $headerlen - $filenamelen - 1 < 8) {      return false;    // Invalid format    }    $filename = substr($data,$headerlen,$filenamelen);    $headerlen += $filenamelen + 1;  }  $commentlen = 0;  $comment = "";  if ($flags & 16) {    // C-style string COMMENT data in header    if ($len - $headerlen - 1 < 8) {      return false;    // Invalid format    }    $commentlen = strpos(substr($data,8+$extralen+$filenamelen),chr(0));    if ($commentlen === false || $len - $headerlen - $commentlen - 1 < 8) {      return false;    // Invalid header format    }    $comment = substr($data,$headerlen,$commentlen);    $headerlen += $commentlen + 1;  }  $headercrc = "";  if ($flags & 1) {    // 2-bytes (lowest order) of CRC32 on header present    if ($len - $headerlen - 2 < 8) {      return false;    // Invalid format    }    $calccrc = crc32(substr($data,0,$headerlen)) & 0xffff;    $headercrc = unpack("v", substr($data,$headerlen,2));    $headercrc = $headercrc[1];    if ($headercrc != $calccrc) {      return false;    // Bad header CRC    }    $headerlen += 2;  }  // GZIP FOOTER - These be negative due to PHP's limitations  $datacrc = unpack("V",substr($data,-8,4));  $datacrc = $datacrc[1];  $isize = unpack("V",substr($data,-4));  $isize = $isize[1];  // Perform the decompression:  $bodylen = $len-$headerlen-8;  if ($bodylen < 1) {    // This should never happen - IMPLEMENTATION BUG!    return null;  }  $body = substr($data,$headerlen,$bodylen);  $data = "";  if ($bodylen > 0) {    switch ($method) {      case 8:        // Currently the only supported compression method:        $data = gzinflate($body);        break;      default:        // Unknown compression method        return false;    }  } else {    // I'm not sure if zero-byte body content is allowed.    // Allow it for now...  Do nothing...  }  // Verifiy decompressed size and CRC32:  // NOTE: This may fail with large data sizes depending on how  //       PHP's integer limitations affect strlen() since $isize  //       may be negative for large sizes.  if ($isize != strlen($data) || crc32($data) != $datacrc) {    // Bad format!  Length or CRC doesn't match!    return false;  }  return $data;}

使用:

代码如下:

$html=file_get_contents('https://www.jb51.net/');$html=gzdecode($html);

就介绍这三个方法,应该能解决大部分gzip引起的抓取乱码问题了。

以上是"如何解决php gzip css乱码问题"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

乱码 问题 代码 内容 信息 函数 方法 篇文章 页面 网页 学习 帮助 原始 三个 下编 两个 关键 办法 功能 博客 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 如何在网页上面显示服务器时间 监理怎么样与工业网络技术结合 用ef怎么建立数据库 珠海社交软件开发常见问题 服务器管理器架设网站 企业网的组建及网络安全研究 php获取当前服务器时间 网络安全与信息化委员会会议记录 医院信息系统软件开发流程 茅箭区互联网软件开发 网络安全教育听后感600 云服务器可以相互连接吗 中央网络安全与信息化提出了 昌平区数据网络技术咨询 网络安全技术输入密码 软件开发外包费用大概多少 简述蛋白质互作数据库 软件开发qq怎么群发 普陀区咨询软件开发厂家活动方案 网络安全 三高一弱 数据库中如何定义数组 四川瑞豆互联网科技公司 2018网络安全教育视频 附加数据库提示数据库已存在 个人软件开发棋牌游戏搭建 龙曦科技发力互联网 未来教育三级网络技术手机版 电动汽车软件开发技术 激光扫描软件开发 用asp做数据库前台
0