Java 바이트코드의 세계로 여행을 떠나시나요? 이 기사에서는 시작하기 위해 알아야 할 모든 것을 다룹니다.
1995년, Java 프로그래밍 창시자인 Sun Microsystems는 언어로 과감한 주장을 펼쳤습니다. 그들은 Java를 사용하면 "한 번만 작성하면 어디에서나 실행할 수 있다"고 말했습니다. 이는 컴파일된 바이너리가 모든 시스템 아키텍처에서 실행될 수 있다는 것을 의미하며, 이는 C가 할 수 없는 일이며 오늘날까지도 Java 작성의 핵심 테넌트로 남아 있습니다.
이러한 크로스 플랫폼 기능을 달성하기 위해 Java는 다음을 사용합니다. 컴파일할 때 독특한 접근 방식을 사용합니다. 소스 코드에서 기계어 코드(각 시스템 아키텍처에 따라 다름)로 직접 이동하는 대신 Java는 프로그램을 바이트코드라는 중간 형식으로 컴파일합니다. 바이트코드는 특정 기계어에 얽매이지 않고 특정 하드웨어 아키텍처에 종속되지 않는 명령어 세트입니다. 이러한 추상화는 Java 이식성의 핵심입니다.
Java 바이트코드 명령을 해석하고 실행하는 프로그램을 JVM(Java Virtual Machine)이라고 합니다. JVM은 각 바이트코드 명령어를 실행 중인 특정 시스템 아키텍처의 기본 기계어 코드로 변환합니다. 종종 "JIT(Just-In-Time)" 컴파일이라고도 하는 이 프로세스를 통해 Java 바이트코드가 특정 플랫폼에서 최대한 효율적으로 실행될 수 있습니다.
바이트코드는 하지만 JVM에만 유용한 것은 아닙니다. Java 클래스의 바이트코드는 리버스 엔지니어링, 성능 최적화, 보안 연구 및 기타 정적 분석 기능에 유용하기 때문에 JDK에는 여러분과 제가 이를 검사하는 데 도움이 되는 유틸리티가 함께 제공됩니다.
예를 살펴보려면 바이트코드의 경우 `boolean` 기본 유형을 각각 unbox 및 box하는 `java.lang.Boolean`, `booleanValue` 및 `valueOf(boolean)`의 다음 두 가지 메소드를 고려하십시오.
public boolean booleanValue() { return value; } public static Boolean valueOf(boolean b) { return (b ? TRUE : FALSE); }
` 사용 JDK와 함께 제공되는 javap` 명령을 사용하면 각각에 대한 바이트코드를 볼 수 있습니다. 다음과 같이 `-c` 명령과 클래스의 정규화된 이름을 사용하여 `javap`을 실행하면 됩니다.
javap -c java.lang.Boolean
결과는 `에 있는 모든 공개 메소드에 대한 바이트코드입니다. java.lang.Boolean`. 여기서는 `booleanValue` 및 `valueOf(boolean)`에 대한 바이트코드만 복사했습니다.
public boolean booleanValue(); code: 0: aload_0 1: getfield #7 // Field value:Z 4: ireturn public static java.lang.Boolean valueOf(boolean); Code: 0: iload_0 1: ifeq 10 4: getstatic #27 // Field TRUE:Ljava/lang/Boolean; 7: goto 13 10: getstatic #31 // Field FALSE:Ljava/lang/Boolean; 13: areturn
얼핏 보면 완전히 새로운 언어를 배울 수 있습니다. 그러나 각 명령어의 기능과 Java가 스택과 함께 작동한다는 사실을 배우면 금방 이해가 됩니다.
`booleanValue`에 대한 3개의 바이트코드 명령을 예로 들어 보겠습니다.
`aload_n`은 로컬 변수에 대한 참조를 스택에 배치하는 것을 의미합니다. 클래스 인스턴스에서 `aload_0`은 `this`를 참조합니다.
`getfield`는 `this`(스택의 하위 항목)에서 멤버 변수를 읽고 해당 항목을 배치하는 것을 의미합니다. 스택의 값
`#7`은 상수 풀의 참조 인덱스를 나타냅니다.
`// 필드 값:Z`는 `#7`이 가리키는 것은 `boolean` 유형의 `value`라는 필드(Z)
`ireturn`은 기본 값을 팝한다는 의미입니다. 스택에서 꺼내서 반환
간단히 말하면 이 세 가지 명령어는 인스턴스의 `value` 필드를 조회하여 반환합니다.
두 번째 예로, 다음 메소드인 `valueOf(boolean)`:
`iload_n`은 기본 지역 변수를 스택에 배치하는 것을 의미합니다. `iload_0`은 첫 번째 메소드 매개변수를 참조합니다(첫 번째 메소드 매개변수는 기본 매개변수이므로)
`ifeq n`은 스택에서 값을 팝하고 그것이 true인지 확인하는 것을 의미합니다. 그렇다면 다음 줄로 진행하고, 그렇지 않으면 `n` 줄로 점프합니다.
`getstatic #n`은 정적 멤버를 스택으로 읽는다는 의미입니다
`#27`은 상수 풀에 있는 정적 멤버의 인덱스를 나타냅니다.
`// 필드 TRUE:Ljava/lang/Boolean`은 `#27`이 무엇을 참조하는지 알려줍니다. , `Boolean
`goto n` 유형의 `TRUE`라는 정적 멤버는 이제 바이트코드에서 `n` 줄로 점프한다는 의미입니다
`areturn`은 스택에서 참조를 꺼내서 반환한다는 의미입니다
즉, 이 지침에서는 true인 경우 첫 번째 메서드 매개변수를 가져오라고 말합니다. , 그런 다음 `Boolean.TRUE`를 반환합니다. 그렇지 않으면 `Boolean.FALSE`를 반환합니다.
이 기능은 리버스 엔지니어링, 성능 최적화 및 보안 연구에 도움이 될 수 있다고 앞서 언급했습니다. 이제 이에 대해 확장해 보겠습니다.
타사 라이브러리나 비공개 소스 구성 요소로 작업할 때 바이트코드 분석은 강력한 도구가 됩니다. 바이트코드를 디컴파일하면 이러한 라이브러리의 내부 작동 방식을 엿볼 수 있어 통합, 문제 해결 및 호환성 보장에 도움이 됩니다.
독점 또는 비공개 소스 Java 코드가 있는 상황에서는 바이트코드를 읽는 것이 유일한 방법일 수 있습니다. 그 기능을 이해하는 방법. 바이트코드 분석을 사용하면 비공개 소스 애플리케이션의 동작을 리버스 엔지니어링하고 이해하여 상호 운용성 또는 사용자 정의를 촉진할 수 있습니다.
실제 사례를 통해 저는 최근 타사 패키지 탱글 분석 도구를 Ci 시스템에 통합하려고 했습니다. 불행하게도 공급업체는 비공개 소스였으며 독점 UI를 통해 라이브러리에 액세스하는 방법에 대한 문서만 가지고 있었습니다. 바이트코드를 분석함으로써 기본 분석 엔진의 예상되는 입력과 출력을 리버스 엔지니어링할 수 있었습니다.
위 내용은 재미와 이익을 위해 Java 바이트코드를 읽는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!