本文深入探讨jvm字节码中的字段描述符和方法描述符。我们将详细解释它们的结构、编码规则以及在JVM中的作用,并通过示例展示如何为不同类型的字段和方法构建描述符。特别强调标准描述符不包含泛型类型信息,并简要介绍泛型签名作为补充。
引言:JVM描述符的重要性
在Java虚拟机(jvm)的世界中,为了准确识别和定位类、字段和方法,jvm定义了一套标准化的命名和类型编码规则,即“描述符”(descriptors)。这些描述符在类文件格式中扮演着核心角色,是jvm进行类加载、链接和执行的基础。理解这些描述符的结构和编码规则,对于深入理解jvm的工作原理、进行字节码编程或分析以及排查某些底层问题至关重要。
本文将聚焦于两种主要的描述符类型:字段描述符和方法描述符,并简要提及用于处理泛型信息的泛型签名。
一、字段描述符 (Field Descriptors)
字段描述符用于表示一个字段(包括实例变量和静态变量)的类型。无论是基本类型、引用类型还是数组类型,都有其特定的编码方式。
编码规则:
-
基本类型:
-
引用类型:
-
数组类型:
- 以一个或多个 [ 字符开头,表示数组的维度,后跟数组元素的类型描述符。
- 示例:
- int[] 的字段描述符是 [I
- String[][] 的字段描述符是 [[Ljava/lang/String;
- double[][][] 的字段描述符是 [[[D
示例:
一个 int 类型的实例变量的字段描述符是 I。 一个 Object 类型的实例变量的字段描述符是 Ljava/lang/Object;。 一个多维 double 数组 double d[][][] 的字段描述符是 [[[D。
二、方法描述符 (Method Descriptors)
方法描述符用于表示一个方法的参数类型序列和返回类型。它遵循特定的结构,将所有参数类型和返回类型串联起来。
结构:
方法描述符的通用形式为:
( ParameterDescriptor* ) ReturnDescriptor
- ParameterDescriptor*:表示零个或多个参数的描述符。每个参数的描述符与字段描述符的格式相同,它们按顺序连接,中间没有任何分隔符。
- ReturnDescriptor:表示方法的返回类型描述符。这与字段描述符的格式也相同,但多了一个特殊值 V 用于表示 void 返回类型。
返回类型描述符:
- V:表示方法没有返回值(即 void)。
- 其他:与字段描述符相同,表示返回的具体类型(基本类型、引用类型或数组类型)。
示例分析:
假设我们有一个Java方法声明如下:
void callthismethod(java.lang.String a, some.location.ArrayMap<String, Task<String>> aa)
我们将逐步构建其方法描述符:
-
第一个参数: java.lang.String
- 其描述符为 Ljava/lang/String;
-
第二个参数: some.location.ArrayMap
> - 在标准方法描述符中,泛型类型参数(如
>)会被擦除。因此,我们只关注其原始类型 some.location.ArrayMap。 - 假设其完整限定名为 some.location.ArrayMap,则其描述符为 Lsome/location/ArrayMap;
- 在标准方法描述符中,泛型类型参数(如
-
返回类型: void
- 其描述符为 V
将这些部分按照方法描述符的结构组合起来:
- 参数部分:(Ljava/lang/String;Lsome/location/ArrayMap;)
- 返回部分:V
因此,完整的方法描述符是:
(Ljava/lang/String;Lsome/location/ArrayMap;)V
重要提示:泛型类型擦除
需要特别注意的是,标准的方法描述符和字段描述符不编码泛型类型参数。这意味着在JVM的字节码层面,List
三、泛型签名 (Generic Signatures) 简介
尽管标准描述符不包含泛型信息,但在某些场景下(如Java反射API、调试器以及编译器处理泛型时),这些泛型信息是必需的。为此,JVM引入了“泛型签名”(Generic Signatures)的概念。
泛型签名是一种更复杂的描述符,它能够编码类的类型参数、泛型接口的实现、泛型字段的类型以及泛型方法的参数和返回类型。它们通常存储在类文件的 Signature 属性中。
示例:
对于上面提到的方法:
void callthismethod(java.lang.String a, some.location.ArrayMap<String, Task<String>> aa)
假设 Task 的完整限定名也是 some.location.Task,其泛型签名可能如下所示:
(Ljava/lang/String;Lsome/location/ArrayMap<Ljava/lang/String;Lsome/location/Task<Ljava/lang/String;>;>;)V
可以看到,泛型签名比普通方法描述符包含了更多的类型参数信息。然而,重要的是要理解,泛型签名主要用于反射和调试等高级用途,而不用于JVM在运行时进行方法分派或链接。JVM在执行时依然依赖于类型擦除后的标准方法描述符。
注意事项与总结
- 区分用途: 字段描述符用于字段类型,方法描述符用于方法签名(参数和返回),而泛型签名则用于保留泛型类型信息以供反射等高级功能使用。
- 内部形式: 在引用类型的描述符中,类名使用内部形式,即包分隔符为 / 而非 .。例如,java.lang.String 在描述符中表示为 Ljava/lang/String;。
- 泛型擦除: 标准的字段和方法描述符不包含泛型类型信息,这是Java类型擦除机制在字节码层面的体现。
- 完整性: 在构建描述符时,确保所有引用类型都使用其完整的限定名,以避免歧义。
理解JVM描述符是深入Java虚拟机工作原理的关键一步。它们是JVM字节码的基础构建块,对于任何希望进行字节码分析、操作或理解Java语言深层机制的开发者来说,都是不可或缺的知识。