社区

学习

工具库

AI工具

休闲

简体中文

首页 > web前端 > html教程 > 获取网页源码问题_html/css_WEB-ITnose

获取网页源码问题_html/css_WEB-ITnose

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-06-21 09:42:42

原创

1582 人浏览过

gzip 解密

问题：
我用shiffer抓包，抓到一个http包。前面的http还好是明文。但是数据部分却是经过GZIP加密的。网上有相应的加密解密函数。但是我从包里面截取的信息传入函数解密总是不对。不知道是什么原因？
希望知道网页解密的大侠给一点思路。

回复讨论(解决方案)

这个。。。。

这个。。。。
我是良民

结尾是0\r\n\r\n的话，可能是chunked，你去了解一下chunked的数据结构

一般是
长度1\r\n + 数据块1\r\n + 长度2\r\n + 数据块2\r\n + ... + 0\r\n\r\n
长度就是对应数据块不包括结尾\r\n部分的字节数（16进制），注意每块的长度不一定相同
把所有数据块切出来，拼接就是完整的文件

rfc2616标准有这方面的详细说明

例如网易首页 http://www.163.com
如果你发送gzip过去返回的就是 gzip+chunked
如果你发送*过去返回的就是html+chunked

再举个例子吧

\x04 \r\n abcd \r\n \x10 \r\n efghijklmnopqrst \r\n 0 \r\n\r\n

最后解chunked得到的就是：
abcdefghijklmnopqrst

再举个例子吧

\x04\r\nabcd\r\n\x10\r\nefghijklmnopqrst\r\n0\r\n\r\n

最后解chunked得到的就是：
abcdefghijklmnopqrst
我得到一个数据包，看那个格式应该是gzip。但是全是16进制。那么我该怎么还原这个网页呢？总是失败。谢谢你了。

怎么还原当然需要编程语言里面的解压模块，不然就是自己研究gzip算法来解了，我没这个本事

gzip开头是 1F 8B 08，如果你的数据开头是这个就直接解压，解压错误的话应该是未接收完整
可以通过header里面的content-length判断是否完整

如果结尾是 30 0D 0A 0D 0A 那就是chunked按上面我说的先解出数据部分，再判断是否一个gzip
chunked数据因为不定长，所以header没有长度说明，而是靠结尾判断是否完整

怎么还原当然需要编程语言里面的解压模块，不然就是自己研究gzip算法来解了，我没这个本事

gzip开头是 1F 8B 08，如果你的数据开头是这个就直接解压，解压错误的话应该是未接收完整
可以通过header里面的content-length判断是否完整

如果结尾是 30 0D 0A 0D 0A 那就是chunked按上面我说的先解出数据部分，再判断是否一个……
谢谢你啦。我研究研究一下。

相关标签：

获取网页源码问题

上一篇：如何处理点击后的这个虚线框_html/css_WEB-ITnose 下一篇：如何去掉导航栏中的小实心圆圈_html/css_WEB-ITnose

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

javascript - 爬取网页Jquery选择器first-child的问题

来自于 1970-01-01 08:00:00

0

0

0

javascript - nodejs抓取网站的翻页判断和言语判断问题.

来自于 1970-01-01 08:00:00

0

0

0

TP5 快速开发企业站的课程中加上‘防止用户非法访问和重复登陆’的验证后页面无法打开把老师的源码考过来也是这个问题请问该如何解决

来自于 1970-01-01 08:00:00

0

0

0

python - beautifulsoup获取网页内容的问题

来自于 1970-01-01 08:00:00

0

0

0

Python 爬虫遇到的问题（手淘问大家）

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1436580
php入门教程之一周学会PHP

4295934
JAVA 初级入门视频教程

2660715
小甲鱼零基础入门学习Python视频教程

516346
PHP 零基础入门教程

876978

最新下载

更多>

网站特效

网站源码

网站素材

前端模板