java实现http/https抓包拦截_easy-http-proxy-程序员宅基地

技术标签: java对https抓包  http/https代理服务器开发  手写一个http代理服务器  java入门学习  https握手过程  java https代理服务器  

最近在调试一个项目时常常需要对接口进行抓包查看,接口位于微信的公众号内,目前每次调试时都是用的 fiddler进行抓包查看的。但每次打开fiddler去查看对应的接口并找到对应的参数感觉还是有点复杂,正好今天是周末,打算自己来研究下它的原理并自己通过java来写一个(之所以知道java可以实现这个功能是因为著名的web安全检测工具 burpsuite 就是用java写的)

 

分析

在使用fiddler或burpsuite时其抓包的原理都是通过代理服务器来实现的。fiddler或burpsuite通过自己创建一个代理服务器对需要拦截的socket请求进行一次中转,其过程有点像中间人的方式,从而可以实现对请求和响应的拦截和修改。

知道了原理后,那么通过JAVA编写一个用于转发socket的程序就可以实现请求的拦截了.

为了开发的方便与高效,这里采用netty框架来显示代理服务器的开发

本文需要的依赖包为:

<!-- https://mvnrepository.com/artifact/io.netty/netty-all -->
<dependency>
   <groupId>io.netty</groupId>
   <artifactId>netty-all</artifactId>
   <version>4.1.42.Final</version>
</dependency>

http请求代理

微信公众号内的接口目前全都是https的,直接开发https代理程序有一定难度,所以笔者决定在实现https的接口抓包之前还是先来搞定http的抓包拦截功能

在开发之前先梳理下思图:这里以谷歌浏览器访问百度网站为例,先画下其访问流程图

http请求无代理

对于http请求无代理的情况其过程很简单,客户端向服务器发起请求,服务端响应此请求即可

http请求有代理

由于http请求太过简单,其所有的数据传输也都是明文传输了。其最大的安全性是很容易受到中间人攻击(MITM)。与MITM类比,那么此处的http代理服务器也就是中间人了。作为中间人服务器,它对于客户端的请求可以进行拦截、查看、过滤、转发、篡改等,由代理服务器处理完毕后再决定是否转发给目标服务器。同时对于目标服务器的响应也由中间的代理服务器先进行处理一遍,再决定怎样传回给客户端。

如果用netty来实现http的代理服务器其主要代码如下:

public class HttpProxyHandler extends ChannelInboundHandlerAdapter implements IProxyHandler {
    private Logger logger = LoggerFactory.getLogger(HttpProxyHandler.class);

    @Override
    public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
        logger.debug("[HttpProxyHandler]");
        if (msg instanceof HttpRequest) {
            HttpRequest httpRequest = (HttpRequest) msg;
            //获取客户端请求
            ClientRequest clientRequest = ProxyRequestUtil.getClientRequest(ctx.channel());
            if (clientRequest == null) {
                //从本次请求中获取
                Attribute<ClientRequest> clientRequestAttribute = ctx.channel().attr(CLIENTREQUEST_ATTRIBUTE_KEY);
                clientRequest = ProxyRequestUtil.getClientReuqest(httpRequest);
                //将clientRequest保存到channel中
                clientRequestAttribute.setIfAbsent(clientRequest);
            }
            //如果是connect代理请求,返回成功以代表代理成功
            if (sendSuccessResponseIfConnectMethod(ctx, httpRequest.method().name())) {
                logger.debug("[HttpProxyHandler][channelRead] sendSuccessResponseConnect");
                ctx.channel().pipeline().remove("httpRequestDecoder");
                ctx.channel().pipeline().remove("httpResponseEncoder");
                ctx.channel().pipeline().remove("httpAggregator");
                ReferenceCountUtil.release(msg);
                return;
            }
            if (clientRequest.isHttps()) {
                //https请求不在此处转发
                super.channelRead(ctx, msg);
                return;
            }
            sendToServer(clientRequest, ctx, msg);
            return;
        }
        super.channelRead(ctx, msg);
    }

    /**
     * 如果是connect请求的话,返回连接建立成功
     *
     * @param ctx        ChannelHandlerContext
     * @param methodName 请求类型名
     * @return 是否为connect请求
     */
    private boolean sendSuccessResponseIfConnectMethod(ChannelHandlerContext ctx, String methodName) {
        if (Constans.CONNECT_METHOD_NAME.equalsIgnoreCase(methodName)) {
            //代理建立成功
            //HTTP代理建立连接
            HttpResponse response = new DefaultFullHttpResponse(HttpVersion.HTTP_1_1, Constans.CONNECT_SUCCESS);
            ctx.writeAndFlush(response);
            return true;
        }
        return false;
    }


    @Override
    public void sendToServer(ClientRequest clientRequest, ChannelHandlerContext ctx, Object msg) {
        Bootstrap bootstrap = new Bootstrap();
        bootstrap.group(ctx.channel().eventLoop())
                // 注册线程池
                .channel(ctx.channel().getClass())
                // 使用NioSocketChannel来作为连接用的channel类
                .handler(new ChannelInitializer<Channel>() {
                    @Override
                    protected void initChannel(Channel ch) throws Exception {
                        //添加接收远程server的handler
                        ch.pipeline().addLast(new HttpRequestEncoder());
                        ch.pipeline().addLast(new HttpResponseDecoder());
                        ch.pipeline().addLast(new HttpObjectAggregator(6553600));
                        //代理handler,负责给客户端响应结果
                        ch.pipeline().addLast(new HttpProxyResponseHandler(ctx.channel()));
                    }
                });

        //连接远程server
        ChannelFuture cf = bootstrap.connect(clientRequest.getHost(), clientRequest.getPort());
        cf.addListener(new ChannelFutureListener() {
            @Override
            public void operationComplete(ChannelFuture future) throws Exception {
                if (future.isSuccess()) {
                    //连接成功
                    future.channel().writeAndFlush(msg);
                    logger.debug("[operationComplete] connect remote server success!");
                } else {
                    //连接失败
                    logger.error("[operationComplete] 连接远程server失败了");
                    ctx.channel().close();
                }
            }
        });
    }

    @Override
    public void sendToClient(ClientRequest clientRequest, ChannelHandlerContext ctx, Object msg) {

    }
}

上面的代码为转发部分的处理代码,其具体完整实现可以查看文末的github地址

对于http请求响应的处理代码为:

public class HttpProxyResponseHandler extends ChannelInboundHandlerAdapter {
    private Logger logger = LoggerFactory.getLogger(HttpProxyResponseHandler.class);
    private Channel clientChannel;

    public HttpProxyResponseHandler(Channel clientChannel) {
        this.clientChannel = clientChannel;
    }

    @Override
    public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
        if (msg instanceof FullHttpResponse) {
            FullHttpResponse response = (FullHttpResponse) msg;
            logger.debug("[channelRead][FullHttpResponse] 接收到远程的数据1 content:{}", response.content().toString(Charset.defaultCharset()));
        } else if (msg instanceof DefaultHttpResponse) {
            DefaultHttpResponse response = (DefaultHttpResponse) msg;
            logger.debug("[channelRead][FullHttpResponse] 接收到远程的数据 content:{}", response.toString());
        } else if (msg instanceof DefaultHttpContent) {
            DefaultHttpContent httpContent = (DefaultHttpContent) msg;
            logger.debug("[channelRead][DefaultHttpContent] 接收到远程的数据 content:{}", httpContent.content().toString(Charset.defaultCharset()));
        } else {
            logger.debug("[channelRead] 接收到远程的数据 " + msg.toString());
        }
        //发送给客户端
        clientChannel.writeAndFlush(msg);
    }
}

https请求拦截

https的请求相对于http的请求流程稍微复杂一点,目前的浏览器主要采用tls1.2版本和tls1.3版本,在开发https的代理之前,先看一下https采用tls1.2的握手过程是怎么样的

https tls1.2无代理

其过程可以通过wireshark抓包进行分析

通过tls and ip.addr=[目录ip]对https通信过程中的数据进行过滤

以下为我分析的https中使用的tls1.2版本客户端与服务端的握手过程简要分析,其中参数了一些大牛的文章

这其中的知识点比较多,如感兴趣可以仔细看下上面我在梳理过程中所画的时序图,如想深入研究可以进入上方的链接进行深入学习。

我的理解后,其主要就是这样的:CA保证了通信双方的身份的真实性,基于公私钥交换确保了通信过程中的安全性

对https请求进行代理分析

回到本文主题,那么想要对https请求进行代理应该如何实现呢?

在了解了https的通信过程后,那么我们有两种办法可以对https的请求进行代理:

  1. 获取到所要代理网站https证书颁发机构的私钥,也就是ca根证书的私钥,然后自己再重新颁发一个新的证书返回给被代理的客户端
  2. 自己生成一个ca证书,然后导入到将要被代理的客户端中,让其信任,随后再针对将要代理的请求动态生成https证书

通过分析后我们可以知道,想要获取到ca根证书的私钥是不太可能的,据说ca根证书都是离线存储的,一般人拿不到的(一个https证书一年收费上千块不是开玩笑的),ca的代理机构的证书也是这个道理。

那么通过上面的再次分析后通过方案1来进行请求代理的可行性还高一些,其代理过程可以简单如下图:

在分析过后并自己画一个流程图后对于https的代理实现流程清晰多了,其实目前市面上的许多支持https的代理软件都是采用的这种方式来实现的,无论是常见的抓包利器fidder还是大名鼎鼎的安全测试工具BurpSuite都是基于此种方式来做的实现

https代理基于netty的实现

在有了上面的分析后,其实想要自己去实现一个https的代理服务器还是有一定难度的,https握手的细节实现就足以让人费事费力了。但在同样大名鼎鼎的netty框架面前这些都是小事儿!netty中的SslContext类帮我们完成了这些细节的实现,我们只管如何调用它遍可完成对https的握手了,框架就是框架,强大哇!

由于时间关系,对于其实现的具体代码这里不做详细分析了,我已把代码提交到github上了.

开源项目easyHttpProxy

其具体的实现可以参考源码:https://github.com/puhaiyang/easyHttpProxy

为了使用的方便,我也将此项目上传到了maven公网,其maven为:

<dependency>
  <groupId>com.github.puhaiyang</groupId>
  <artifactId>easy-http-proxy</artifactId>
  <version>0.0.1</version>
</dependency>

使用时添加依赖包后,调用

EasyHttpProxyServer.getInstace().start(6667);

即可,其中6667为代理服务器监听的端口号,目前已支持了http/https并针对其他请求直接进行转发.

如果不想自己生成证书,记得将jar包中的ca.crt、ca.key、ca_private.der拷贝的项目的运行根目录下,即classes path下,要不然https代理时会找不到ca根证书会出错。

同时,记得将ca.crt导入到根证书

具体步骤可见此截图:

欢迎留言评论,共同学习共同进步!

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/puhaiyang/article/details/102649498

智能推荐

SUMA++ 环境搭建记录Nvidia3090-程序员宅基地

文章浏览阅读868次。SUMA++ 环境搭建记录Nvidia3090_suma++

IDEA 15:DeBug(调试)模式的使用,你应该学会找代码报错的地方_idea debug模式前端反馈502-程序员宅基地

文章浏览阅读3.1k次,点赞2次,收藏2次。eclipse 换 IDEA用了一段时候,除了稍微有些卡,但是感觉不错,至少debug模式很强大!这里分享一下我的工作经验吧:tomat左边是正常的启动,右边这个好像 瓢虫的就是debug了,1、启动项目现在 假如我的新增方法有问题,我在新增的方法中2、打断点,(右边红点)然后我填写玩信息,点击新增:就会3、进入d_idea debug模式前端反馈502

Gitlab版本控制_gitlab限制下载-程序员宅基地

文章浏览阅读1.3k次。1.Gitlab基本概述1.1 什么是gitlabGitlab是一个开源分布式的版本控制系统。 Ruby语言开发完成。 Gitlab主要实现的功能  1.管理项目源代码。  2.对源代码进行版本控制。  3.对代码进行超找与复用。1.2 Gitlab与Github区别1.相同点: 两者都是提供代码托管服务,在很大程度上GitLab是仿照GitHub来做的。2.不同点: github创建私有仓库收费、gitlab创建私有仓库免费。 PS: 从安全方面来看,公司不希望员工获取到全部的代码,_gitlab限制下载

斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升_为什么flashattention会火-程序员宅基地

文章浏览阅读280次。如今,随着长文档查询、编写故事等新用例的需要,大语言模型的上下文以前比过去变长了许多——GPT-4的上下文长度是32k,MosaicML的MPT上下文长度是65k,Anthropic的Claude上下文长度是100k。当这个数字很大(比如 ≥80)时,这种调度是有效的,因为在这种情况下,可以有效地使用GPU上几乎所有的计算资源。在长序列的情况下(通常意味着更小批或更少的头),为了更好地利用GPU上的多处理器,研究人员在序列长度的维度上另外进行了并行化,使得该机制获得了显著加速。_为什么flashattention会火

tensorflow下实现DenseNet对数据集cifar-10的图像分类_densnet可以做图片10 分类吗-程序员宅基地

文章浏览阅读1.4w次,点赞7次,收藏54次。DenseNet论文地址:https://arxiv.org/pdf/1608.06993.pdfResNet传送门:ResNet-cifar10SegNet传送门:semantic segmentation SegNetInception v3传送门:inception v3 这篇文章为2017CVPR的论文,DenseNet描述了一个全新的卷积层与卷积层的连接方式。与in..._densnet可以做图片10 分类吗

【测试杂谈】测试用例的巧妙与自我修养-程序员宅基地

文章浏览阅读1k次,点赞30次,收藏18次。定义:指测试用例执行过程中覆盖的分支(如if语句、switch语句等)占总分支数的比例。计算公式:语句覆盖率 = (执行的代码语句数 / 总代码语句数) × 100%。计算公式:路径覆盖率 = (被执行的路径数 / 总的可执行路径数) × 100%计算公式:分支覆盖率 = (执行的分支数 / 总分支数) × 100%。定义:指测试用例执行过程中覆盖的代码语句占总代码语句的比例。定义:指测试用例执行过程中覆盖的代码路径占总代码路径的比例。

随便推点

mysql+excel:数据分析----餐饮业日销售情况分析仪_餐饮数据库设计图表-程序员宅基地

文章浏览阅读1.5k次。这篇文章的学习来源于网上,将csv文件导入mysql workbench进行数据处理加工,然后通过ODBC驱动程序(网上老师用的是sql server导入,这个方法在导入时就可以仅创建链接以及加载到数据模型)将mysql workbench中加工好的数据表导入excel中,并使用power queryj将数据表添加到数据模型中以及使用power pivot制作分析仪。_餐饮数据库设计图表

JavaScript-程序员宅基地

文章浏览阅读829次,点赞13次,收藏29次。感觉JavaScript里面还有很多基础的细节没搞明白,开个坑专门存一下。

Mpeg-2的同步及时间恢复_mpeg2 ts流时钟恢复-程序员宅基地

文章浏览阅读553次。一、引言Mpeg-2用于视音频同步以及系统时钟恢复的时间标签分别在ES,PES和TS这3个层次中。在ES层,与同步有关的主要是视频缓冲验证VBV(Video Buffer Verifier),用以防止解码器的缓冲器出现上溢或者下溢;在PES层,主要是在PES头信息里出现的显示时间标签PTS(Presentation Time Stamp)和解码时间标签DTS(Decoding Time Stamp);在TS层中,TS头信息包含了节目时钟参考PCR(Program Clock Refe_mpeg2 ts流时钟恢复

python discuz搜索api_Discuz + Sphinx 全文搜索实现-程序员宅基地

文章浏览阅读207次。这篇文章主要介绍用sphinx(csft)做discuz论坛的全文搜索,操作系统为linux,如果需要windows下的可直接参考:http://www.coreseek.cn/sphinx + mmseg安装,这里的sphinx指的是csft,详见:http://www.coreseek.cn/安装 mmseg :# wget -c http://www.coreseek.cn/uploads/..._discuz sphinx

小B的询问 莫队分块-程序员宅基地

文章浏览阅读84次。小B的询问 莫队分块 题目描述小B有一个序列,包含N个1~K之间的整数。他一共有M个询问,每个询问给定一个区间[L..R],求Sigma(c(i)^2)的值,其中i的值从1到K,其中c(i)表示数字i在[L..R]中的重复次数。小B请你帮助他回答询问。输入输出格式输入格式:第一行,三个整数N、M、K。第二行,N个整数,表示小B的序列。..._小b的询问

三角定位法java代码_GitHub - megagao/IndoorPos: 这是一个采用蓝牙4.0--iBeacon技术的室内定位服务端程序。...-程序员宅基地

文章浏览阅读1.3k次。IndoorPos这是一个采用iBeacon技术的室内定位服务端程序,里面包含了三种定位算法,三边定位算法、加权三边定位算法和三角形加权质心定位算法。程序采用Spring框架,简化了JDBC和RMI的样板式代码,并配置了Druid数据库连接池,同时,为了满足高并发的需求,采用了NIO框架Netty,更好地支持大量终端同时定位。程序已经Maven化。一、室内定位系统简介由于卫星信号到达地面时较弱、不..._蓝牙beacon 定位算法 java

推荐文章

热门文章

相关标签