技术标签: jvm jdk java # JVM 编程语言 class
一切的一切都是从javac开始的。从那一刻开始,java文件就从我们肉眼可分辨的文本文件,变成了冷冰冰的二进制文件。
变成了二进制文件是不是意味着我们无法再深入的去了解java class文件了呢?答案是否定的。
机器可以读,人为什么不能读?只要我们掌握java class文件的密码表,我们可以把二进制转成十六进制,将十六进制和我们的密码表进行对比,就可以轻松的解密了。
下面,让我们开始这个激动人心的过程吧。
为了深入理解java class的含义,我们首先需要定义一个class类:
public class JavaClassUsage {
private int age=18;
public void inc(int number){
this.age=this.age+ number;
}
}
很简单的类,我想不会有比它更简单的类了。
在上面的类中,我们定义了一个age字段和一个inc的方法。
接下来我们使用javac来进行编译。
IDEA有没有?直接打开编译后的class文件,你会看到什么?
没错,是反编译过来的java代码。但是这次我们需要深入了解的是class文件,于是我们可以选择 view->Show Bytecode:
当然,还是少不了最质朴的javap命令:
javap -verbose JavaClassUsage
对比会发现,其实javap展示的更清晰一些,我们暂时选用javap的结果。
编译的class文件有点长,我一度有点不想都列出来,但是又一想只有对才能讲述得更清楚,还是贴在下面:
public class com.flydean.JavaClassUsage
minor version: 0
major version: 58
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #2.#3 // java/lang/Object."<init>":()V
#2 = Class #4 // java/lang/Object
#3 = NameAndType #5:#6 // "<init>":()V
#4 = Utf8 java/lang/Object
#5 = Utf8 <init>
#6 = Utf8 ()V
#7 = Fieldref #8.#9 // com/flydean/JavaClassUsage.age:I
#8 = Class #10 // com/flydean/JavaClassUsage
#9 = NameAndType #11:#12 // age:I
#10 = Utf8 com/flydean/JavaClassUsage
#11 = Utf8 age
#12 = Utf8 I
#13 = Utf8 Code
#14 = Utf8 LineNumberTable
#15 = Utf8 LocalVariableTable
#16 = Utf8 this
#17 = Utf8 Lcom/flydean/JavaClassUsage;
#18 = Utf8 inc
#19 = Utf8 (I)V
#20 = Utf8 number
#21 = Utf8 SourceFile
#22 = Utf8 JavaClassUsage.java
{
public com.flydean.JavaClassUsage();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=2, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: bipush 18
7: putfield #7 // Field age:I
10: return
LineNumberTable:
line 7: 0
line 9: 4
LocalVariableTable:
Start Length Slot Name Signature
0 11 0 this Lcom/flydean/JavaClassUsage;
public void inc(int);
descriptor: (I)V
flags: ACC_PUBLIC
Code:
stack=3, locals=2, args_size=2
0: aload_0
1: aload_0
2: getfield #7 // Field age:I
5: iload_1
6: iadd
7: putfield #7 // Field age:I
10: return
LineNumberTable:
line 12: 0
line 13: 10
LocalVariableTable:
Start Length Slot Name Signature
0 11 0 this Lcom/flydean/JavaClassUsage;
0 11 1 number I
}
SourceFile: "JavaClassUsage.java"
慢着,上面javap的结果好像并不是二进制文件!
对的,javap是对二进制文件进行了解析,方便程序员阅读。如果你真的想直面最最底层的机器代码,就直接用支持16进制的文本编译器把编译好的class文件打开吧。
你准备好了吗?
来吧,展示吧!
上图左边是16进制的class文件代码,右边是对16进制文件的适当解析。大家可以隐约的看到一点点熟悉的内容。
是的,没错,你会读机器语言了!
如果你要了解class文件的结构,你需要这个密码本。
如果你想解析class文件,你需要这个密码本。
学好这个密码本,走遍天下都…没啥用!
下面就是密码本,也就是classFile的结构。
ClassFile {
u4 magic;
u2 minor_version;
u2 major_version;
u2 constant_pool_count;
cp_info constant_pool[constant_pool_count-1];
u2 access_flags;
u2 this_class;
u2 super_class;
u2 interfaces_count;
u2 interfaces[interfaces_count];
u2 fields_count;
field_info fields[fields_count];
u2 methods_count;
method_info methods[methods_count];
u2 attributes_count;
attribute_info attributes[attributes_count];
}
其中u2,u4表示的是无符号的两个字节,无符号的4个字节。
java class文件就是按照上面的格式排列下来的,按照这个格式,我们可以自己实现一个反编译器(大家有兴趣的话,可以自行研究)。
我们对比着上面的二进制文件一个一个的来理解。
首先,class文件的前4个字节叫做magic word。
看一下十六进制的第一行的前4个字节:
CA FE BA BE 00 00 00 3A 00 17 0A 00 02 00 03 07
0xCAFEBABE就是magic word。所有的java class文件都是以这4个字节开头的。
来一杯咖啡吧,baby!
多么有诗意的画面。
这两个version要连着讲,一个是主版本号,一个是次版本号。
00 00 00 3A
对比一下上面的表格,我们的主版本号是3A=58,也就是我们使用的是JDK14版本。
接下来是常量池。
首先是两个字节的constant_pool_count。对比一下,constant_pool_count的值是:
00 17
换算成十进制就是23。也就是说常量池的大小是23-1=22。
这里有两点要注意,第一点,常量池数组的index是从1开始到constant_pool_count-1结束。
第二点,常量池数组的第0位是作为一个保留位,表示“不引用任何常量池项目”,为某些特殊的情况下使用。
接下来是不定长度的cp_info:constant_pool[constant_pool_count-1]常量池数组。
常量池数组中存了些什么东西呢?
字符串常量,类和接口名字,字段名,和其他一些在class中引用的常量。
具体的constant_pool中存储的常量类型有下面几种:
每个常量都是以一个tag开头的。用来告诉JVM,这个到底是一个什么常量。
好了,我们对比着来看一下。在constant_pool_count之后,我们再取一部分16进制数据:
上面我们讲到了17是常量池的个数,接下来就是常量数组。
0A 00 02 00 03
首先第一个字节是常量的tag, 0A=10,对比一下上面的表格,10表示的是CONSTANT_Methodref方法引用。
CONSTANT_Methodref又是一个结构体,我们再看一下方法引用的定义:
CONSTANT_Methodref_info {
u1 tag;
u2 class_index;
u2 name_and_type_index;
}
从上面的定义我们可以看出,CONSTANT_Methodref是由三部分组成的,第一部分是一个字节的tag,也就是上面的0A。
第二部分是2个字节的class_index,表示的是类在常量池中的index。
第三部分是2个字节的name_and_type_index,表示的是方法的名字和类型在常量池中的index。
先看class_index,0002=2。
常量池的第一个元素我们已经找到了就是CONSTANT_Methodref,第二个元素就是跟在CONSTANT_Methodref后面的部分,我们看下是什么:
07 00 04
一样的解析步骤,07=7,查表,表示的是CONSTANT_Class。
我们再看下CONSTANT_Class的定义:
CONSTANT_Class_info {
u1 tag;
u2 name_index;
}
可以看到CONSTANT_Class占用3个字节,第一个字节是tag,后面两个字节是name在常量池中的索引。
00 04 = 4, 表示name在常量池中的索引是4。
然后我们就这样一路找下去,就得到了所有常量池中常量的信息。
这样找起来,眼睛都花了,有没有什么简单的办法呢?
当然有,就是上面的javap -version, 我们再回顾一下输出结果中的常量池部分:
Constant pool:
#1 = Methodref #2.#3 // java/lang/Object."<init>":()V
#2 = Class #4 // java/lang/Object
#3 = NameAndType #5:#6 // "<init>":()V
#4 = Utf8 java/lang/Object
#5 = Utf8 <init>
#6 = Utf8 ()V
#7 = Fieldref #8.#9 // com/flydean/JavaClassUsage.age:I
#8 = Class #10 // com/flydean/JavaClassUsage
#9 = NameAndType #11:#12 // age:I
#10 = Utf8 com/flydean/JavaClassUsage
#11 = Utf8 age
#12 = Utf8 I
#13 = Utf8 Code
#14 = Utf8 LineNumberTable
#15 = Utf8 LocalVariableTable
#16 = Utf8 this
#17 = Utf8 Lcom/flydean/JavaClassUsage;
#18 = Utf8 inc
#19 = Utf8 (I)V
#20 = Utf8 number
#21 = Utf8 SourceFile
#22 = Utf8 JavaClassUsage.java
以第一行为例,直接告诉你常量池中第一个index的类型是Methodref,它的classref是index=2,它的NameAndType是index=3。
并且直接在后面展示出了具体的值。
且慢,在常量池中我好像看到了一些不一样的东西,这些I,L是什么东西?
这些叫做字段描述符:
上图是他们的各项含义。除了8大基础类型,还有2个引用类型,分别是对象的实例,和数组。
常量池后面就是access_flags:访问描述符,表示的是这个class或者接口的访问权限。
先上密码表:
再找一下我们16进制的access_flag:
没错,就是00 21。 参照上面的表格,好像没有21,但是别怕:
21是ACC_PUBLIC和ACC_SUPER的并集。表示它有两个access权限。
接下来是this class和super class的名字,他们都是对常量池的引用。
00 08 00 02
this class的常量池index=8, super class的常量池index=2。
看一下2和8都代表什么:
#2 = Class #4 // java/lang/Object
#8 = Class #10 // com/flydean/JavaClassUsage
没错,JavaClassUsage的父类是Object。
大家知道为什么java只能单继承了吗?因为class文件里面只有一个u2的位置,放不下了!
接下来就是接口的数目和接口的具体信息数组了。
00 00
我们没有实现任何接口,所以interfaces_count=0,这时候也就没有interfaces[]了。
然后是字段数目和字段具体的数组信息。
这里的字段包括类变量和实例变量。
每个字段信息也是一个结构体:
field_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
字段的access_flag跟class的有点不一样:
这里我们就不具体对比解释了,感兴趣的小伙伴可以自行体验。
接下来是方法信息。
method结构体:
method_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
method访问权限标记:
attributes被用在ClassFile, field_info, method_info和Code_attribute这些结构体中。
先看下attributes结构体的定义:
attribute_info {
u2 attribute_name_index;
u4 attribute_length;
u1 info[attribute_length];
}
都有哪些attributes, 这些attributes都用在什么地方呢?
其中有六个属性对于Java虚拟机正确解释类文件至关重要,他们是:
ConstantValue,Code,StackMapTable,BootstrapMethods,NestHost和NestMembers。
九个属性对于Java虚拟机正确解释类文件不是至关重要的,但是对于通过Java SE Platform的类库正确解释类文件是至关重要的,他们是:
Exceptions,InnerClasses,EnclosingMethod,Synthetic,Signature,SourceFile,LineNumberTable,LocalVariableTable,LocalVariableTypeTable。
其他13个属性,不是那么重要,但是包含有关类文件的元数据。
最后留给大家一个问题,java class中常量池的大小constant_pool_count是2个字节,两个字节可以表示2的16次方个常量。很明显已经够大了。
但是,万一我们写了超过2个字节大小的常量怎么办?欢迎大家留言给我讨论。
本文链接:http://www.flydean.com/jvm-class-file-structure/
最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!
欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!
文章浏览阅读5.8k次。在大数据的发展当中,大数据技术生态的组件,也在不断地拓展开来,而其中的Hive组件,作为Hadoop的数据仓库工具,可以实现对Hadoop集群当中的大规模数据进行相应的数据处理。今天我们的大数据入门分享,就主要来讲讲,Hive应用场景。关于Hive,首先需要明确的一点就是,Hive并非数据库,Hive所提供的数据存储、查询和分析功能,本质上来说,并非传统数据库所提供的存储、查询、分析功能。Hive..._hive应用场景
文章浏览阅读496次。Zblog是由Zblog开发团队开发的一款小巧而强大的基于Asp和PHP平台的开源程序,但是插件市场上的Zblog采集插件,没有一款能打的,要么就是没有SEO文章内容处理,要么就是功能单一。很少有适合SEO站长的Zblog采集。人们都知道Zblog采集接口都是对Zblog采集不熟悉的人做的,很多人采取模拟登陆的方法进行发布文章,也有很多人直接操作数据库发布文章,然而这些都或多或少的产生各种问题,发布速度慢、文章内容未经严格过滤,导致安全性问题、不能发Tag、不能自动创建分类等。但是使用Zblog采._zblog 网页采集插件
文章浏览阅读2.4k次,点赞2次,收藏2次。restUI页面提交1.1 添加上传jar包1.2 提交任务job1.3 查看提交的任务2. 命令行提交./flink-1.9.3/bin/flink run -c com.qu.wc.StreamWordCount -p 2 FlinkTutorial-1.0-SNAPSHOT.jar3. 命令行查看正在运行的job./flink-1.9.3/bin/flink list4. 命令行查看所有job./flink-1.9.3/bin/flink list --all._flink定时运行job
文章浏览阅读1k次,点赞2次,收藏6次。这个项目是基于STM32的LED闪烁项目,主要目的是让学习者熟悉STM32的基本操作和编程方法。在这个项目中,我们将使用STM32作为控制器,通过对GPIO口的控制实现LED灯的闪烁。这个STM32 LED闪烁的项目是一个非常简单的入门项目,但它可以帮助学习者熟悉STM32的编程方法和GPIO口的使用。在这个项目中,我们通过对GPIO口的控制实现了LED灯的闪烁。LED闪烁是STM32入门课程的基础操作之一,它旨在教学生如何使用STM32开发板控制LED灯的闪烁。_嵌入式stm32闪烁led实验总结
文章浏览阅读63次。本文介绍了安装和部署Debezium的详细步骤,并演示了如何将Debezium服务托管到systemctl以进行方便的管理。本文将详细介绍如何安装和部署Debezium,并将其服务托管到systemctl。解压缩后,将得到一个名为"debezium"的目录,其中包含Debezium的二进制文件和其他必要的资源。注意替换"ExecStart"中的"/path/to/debezium"为实际的Debezium目录路径。接下来,需要下载Debezium的压缩包,并将其解压到所需的目录。
文章浏览阅读4.4k次。需求:在诗词曲文项目中,诗词整篇朗读的时候,文章没有读完会因为屏幕熄灭停止朗读。要求:在文章没有朗读完毕之前屏幕常亮,读完以后屏幕常亮关闭;1.权限配置:设置电源管理的权限。
文章浏览阅读2.3k次。目标检测简介、评估标准、经典算法_目标检测
文章浏览阅读6.3k次,点赞4次,收藏9次。实训时需要安装SQL server2008 R所以我上网上找了一个.exe 的安装包链接:https://pan.baidu.com/s/1_FkhB8XJy3Js_rFADhdtmA提取码:ztki注:解压后1.04G安装时Microsoft需下载.NET,更新安装后会自动安装如下:点击第一个傻瓜式安装,唯一注意的是在修改路径的时候如下不可修改:到安装实例的时候就可以修改啦数据..._sqlserver 127 0 01 无法连接
文章浏览阅读7.4k次。1. Object.keys(item); 获取到了key之后就可以遍历的时候直接使用这个进行遍历所有的key跟valuevar infoItem={ name:'xiaowu', age:'18',}//的出来的keys就是[name,age]var keys=Object.keys(infoItem);2. 通常用于以下实力中 <div *ngFor="let item of keys"> <div>{{item}}.._js 遍历对象的key
文章浏览阅读2.2w次,点赞51次,收藏310次。粒子群算法求解路径规划路径规划问题描述 给定环境信息,如果该环境内有障碍物,寻求起始点到目标点的最短路径, 并且路径不能与障碍物相交,如图 1.1.1 所示。1.2 粒子群算法求解1.2.1 求解思路 粒子群优化算法(PSO),粒子群中的每一个粒子都代表一个问题的可能解, 通过粒子个体的简单行为,群体内的信息交互实现问题求解的智能性。 在路径规划中,我们将每一条路径规划为一个粒子,每个粒子群群有 n 个粒 子,即有 n 条路径,同时,每个粒子又有 m 个染色体,即中间过渡点的_粒子群算法路径规划
文章浏览阅读353次。所谓稳健的评估指标,是指在评估的过程中数据的轻微变化并不会显著的影响一个统计指标。而不稳健的评估指标则相反,在对交易系统进行回测时,参数值的轻微变化会带来不稳健指标的大幅变化。对于不稳健的评估指标,任何对数据有影响的因素都会对测试结果产生过大的影响,这很容易导致数据过拟合。_rar 海龟
文章浏览阅读607次,点赞2次,收藏7次。–基于STM32F103ZET6的UART通讯实现一、什么是IAP,为什么要IAPIAP即为In Application Programming(在应用中编程),一般情况下,以STM32F10x系列芯片为主控制器的设备在出厂时就已经使用J-Link仿真器将应用代码烧录了,如果在设备使用过程中需要进行应用代码的更换、升级等操作的话,则可能需要将设备返回原厂并拆解出来再使用J-Link重新烧录代码,这就增加了很多不必要的麻烦。站在用户的角度来说,就是能让用户自己来更换设备里边的代码程序而厂家这边只需要提供给_value line devices connectivity line devices