이직준비/CS

JVM의 메모리 구조

hyun-1200 2022. 7. 28. 21:50
자바 가상 기계 java virtual machine
  • JVM java OS 구애받지 않고, 재사용을 가능하게 해주고, 메모리관리, Garbage collection 수행하여 한정된 메모리를 효율적으로 사용해서 최고의 성능을 낸다.
  • 스택 기반이다.

 

자바 프로그램 실행 과정

  1. 프로그램이 실행되면 JVM OS로부터 프로그램이 필요로 하는 메모리를 할당받는다. (JVM 메모리를 용도에 따라 여러 영역으로 나누어 관리한다.
  2. 자바컴파일러 (javac) 자바 소스코드 (.java) 읽어들여 자바 바이트코드 (.class) 변환시킨다. (  .java -> .class )  
  3. Class Loader 통해 class파일을 JVM으로 로딩한다.
  4. 로딩된 파일들은 Execution engine 통해 해석된다.
  5. 해석된 바이트코드는 Runtime Data Areas 배치되어 실질적인 수행이 이루어진다.

이러한 과정 속에서 JVM 필요에 따라 Thread Synchronization GC같은 관리작업을 수행한다.

 

 

1.   Class Loader :

JVM내로 클래스 (.class)파일을 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이. Runtime 시에 동적으로 클래스를 로드한다. jar파일 저장된 클래스들을 JVM위에 탑재하고 사용하지 않는 클래스들은 메모리에서 삭제한다. (컴파일러 역할) 자바는 런타임에 참조한다. , 클래스를 처음으로 참조할때, 해당 클래스를 로드하고 링크한다. 

 

2.  Execution Engine (실행엔진) :

클래스를 실행시키는 엔진이다. 클래스 로더가 JVM내의 런타임 데이터 영역에 바이트 코드를 배치시키고, 이것은 실행엔진에 의해 실행된다. 자바 바이트코드는 기계가 바로 수행할 있는 언어보다는 비교적 인간이 보기 편한 형태로 기술된 것이다. 그래서 실행엔진은 이와 같은 바이트코드를 실제로 JVM내부에서 기계가 실행할 있는 형태로 변경한다. 두가지 방식을 사용하게 된다.

  • Interpreter 인터프리터  : 실행엔진은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다. 한줄 수행하기 때문에 느리다.
  • JIT (Just -In-Time) : 인터프리터의 단점을 보완하기 위한 컴파일러. 인터프리터 방식으로 실행하다가 적절한 시점에 바이트코드 전체를 컴파일하여 네이티브 코드로 변경하고, 이후에는 더이상 인터프리팅 하지 않고 네이티브 코드로 직접 실행하는 방식이다. 네이티브 코드는 캐시에 보관하기 때문에 컴파일된 코드는 빠르게 수행하게 된다. 다만, JIT컴파일러가 컴파일하는 과정은 바이트코드를 인터프리팅하는 것보다 훨씬 오래걸리므로 한번만 실행되는 코드라면 컴파일하지않고 인터프리팅하는것이 유리하다. 따라서 JIT컴파일러를 사용하는 JVM들은 해당 메서드가 얼마나 자주 수행되는지 체크하고, 일정 정도를 넘을 때에만 컴파일을 수행한다. 
  • GC  (Garbage collector) : GC 수행하는 모듈(Thread) 있다.  더이상 참조되지 않는 메모리 가비지를 청소해주는 JVM 실행엔진의 요소이다. JVM new 같은 연산에 의해 새롭게 생성된 객체들 중에서 더이상 참조되지 않는 객체를 정리해준다. 가비지컬렉터는 주로 Heap영역을 탐색하며 메모리를 정리해준다.   

 

 

3.  Runtime Data Area :

프로그램을 수행하기 위해 OS에서 할당받은 메모리 공간 

  • PC Register : Thread 시작될 생성되며,  스레드마다 PC Register 하나씩 존재한다. Thread 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분으로 현재 수행 중인 JVM 명령의 주소를 갖는다.
  • JVM 스택 영역 : 프로그램 실행과정에서 임시로 할당되었다가 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다. 각종 형태의 변수나 임시데이터, 스레드나 메소드의 정보를 저장한다. 메소드 호출 시마다 각각의 스택프레임 ( 메서드만을 위한 공간) 생성된다. 메서드 수행이 끝나면 프레임 별로 삭제를 한다. 메소드 안에 사용되는 값들을 저장하고, 호출된 메소드의 매개변수, 지역변수, 리턴 연산시 일어나는 값들을 임시로 저장한다.
  • Native Method Stack :  자바 프로그램이 컴파일되어 생성되는 바이트 코드가 아닌 실제 실행할 있는 기계어로 작성된 프로그램을 실행시키는 영역이다. JAVA 아닌 다른 언어로 작성된 코드를 위한 공간이다. JAVA Native Interface 통해 바이트코드로 전환하여 저장하게 된다. 일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역이다. 부분을 통해 C code 실행시켜 Kernel 접근할 있다. 
  • Method Area(=Class area = Static area) : 클래스 정보를 처음 메모리 공간에 올릴 초기화되는 대상을 저장하기 위한 메모리 공간. 올라가게 되는 메소드의 바이트 코드는 프로그램의 흐름을 구성하는 바이트 코드이다. 자바프로그램은 main 메소드의 호출에서부터 계속된 메소드의 호출로 흐름을 이어가기 때문이다. 대부분 인스턴스의 생성도 메소드 내에서 명령하고 호출한다. 사실상 컴파일 바이트코드의 대부분이 메소드 바이트코드이기 때문에 거의 모든 바이트코드가 올라간다고 봐도 상관없다. 
  • Heap : 객체를 저장하는 가상 메모리 공간이다. new연산자로 생성된 객체와 배열을 저장한다. 가비지 컬렉터는 영역을 청소하면서 메모리를 확보한다.
    • Yong 영역 : 새롭게 생성한 객체들이 위치한다. 대부분의 객체는 금방 접근불가능한 상태가 되기때문에, 많은 객체가 Yong영역에 생성되었다가 사라진다. -> Yong영역에 대한 Minor GC 
    • Old 영역 : Yong영역에서 계속 사용되어 살아남은 객체가 복사되는 영역이다. Yong영역보다  크게 할당되며,  적은 GC 발생한다. -> Old영역에 대한 Major GC 

Yong영역에 대한 Minor GC 과정        

 

1) 새로운 객체가 Eden 영역에 생성됨

2) Eden 영역에 GC 동작하고, 중에서 살아남은 객체가 Survivor0으로 이동함

3) 2번의 동작이 반복되어 Survivor0 꽉차게

4) Survivor0 영역에 GC 동작하고, 살아남은 객체들은 Survivor1으로 이동하고 Survivor0 비우게

     (2개의 Survivor 영역 1개는 반드시 비어있어야 )

5) 위의 동작들이 반복되어 특정 횟수만큼 살아남은 객체는 Old 영역으로 이동함

 

Old영역에 대한 Major GC 과정 

1) 그리고 Old 영역이 가득차서 Survivor 영역에서 Old 영역으로 Promotion 불가능할 Old 영역에 대한 GC(Major GC) 실행됩니다.

2) Old영역에 있는 모든 객체들을 검사하여 참조되지 않은 객체들을 한꺼번에 삭제한다. 시간이 오래걸리고 실행 프로세스가 정지된다. 이것을 ‘stop-the-world’라고 하는데 Major GC 발생하면 GC 실행하는 스레드를 제외한 나머지 스레드는 모두 작업을 멈춘다. GC작업을 완료한 이후에야 중단했던 작업을 다시 시작한다.